Onderzoek: Backup en Recovery in Nederland
Meer gegevensopslag voor hetzelfde budget Verouderde technieken amper vervangen voor nieuwe
Copyright Webwereld 2010
Inhoud: 1. Inleiding...................................................................................................................................... 2 2. Samenvatting .............................................................................................................................. 2 3. Storageomgevingen..................................................................................................................... 3 3.1 Gebruik van storageomgevingen in Nederland .......................................................................... 3 4. Het belang van Backup en Recovery ........................................................................................... 4 5. Bekendheid met Backup en Recovery en bijbehorende technieken .............................................. 5 5.1. Bekendheid met specifieke technieken ..................................................................................... 5 5.2. Reeds gebruikte backuptechnieken: nog veel 1-op-1 kopieën.................................................... 7 6. Datagroei en budgetten voor storage bij Nederlandse organisaties ............................................... 8 7. Gegevens blijven binnen ............................................................................................................. 9 8. Conclusie .................................................................................................................................. 10 9. Onderzoeksverantwoording....................................................................................................... 10
1. Inleiding Organisaties kampen al jaren met een explosieve groei aan gegevens. Internationaal hebben zij elk jaar gemiddeld 20 tot 40 procent méér opslagcapaciteit voor de productieomgeving nodig dan het jaar ervoor, zo heeft Forrester berekend1. Daar komt bovenop dat backups noodzakelijk zijn: vanwege de bedrijfscontinuïteit en soms ook vanwege wet- en regelgeving. Het gevolg is dat de vraag naar opslag nóg harder groeit. Sterker, hier gaat het gemiddeld genomen om een veelvoud van de productiecapaciteit: voor iedere 100 terabyte capaciteit in de productieomgeving, is 700 terabyte nodig voor het maken van de backups. Binnen vijf jaar zal deze 800 TB benodigde opslag gegroeid naar 2.599 TB, meer dan het drievoudige. Dat terwijl de budgetten voor storage bij veel organisaties niet of nauwelijks stijgen, en het maken van backups als cruciaal wordt beschouwd bij het veiligstellen van de bedrijfscontinuïteit.
2. Samenvatting Nederlandse organisaties lopen sterk mee met de internationale trend, zo laat onderzoek van Webwereld onder 700 organisaties zien. Gemiddeld kennen Nederlandse organisaties een gegevensgroei van grofweg 20 procent. Dat terwijl 54 procent van de organisaties geen extra budget ter beschikking heeft gesteld, en nog eens 13 procent slechts 5 procent budget of minder bij heeft getrokken. Meer dan driekwart (76 procent) van de ondervraagden maakt dagelijks backups van al zijn gegevens, terwijl nog eens 15 procent in ieder geval de bedrijfskritische gegevens met grote regelmaat veiligstelt. Daar is goede reden voor: 88 procent van alle organisaties geeft de bedrijfscontinuïteit als reden voor het backupregime. Voor meer dan eenderde van de ondervraagden (37 procent) geldt dat de Nederlandse wetgeving hiertoe verplicht. Nieuwere technieken hebben moeite om te aarden in de Nederlandse markt voor backup en recovery. Hoewel datadeduplicatie de wind mee lijkt te hebben, is er minder bekendheid rond technieken als automated tiering, RAID6 en thin provisioning. De verouderde 1-op-1-kopie is nog volop in zwang, waardoor er voor nieuwere technieken nog een wereld te winnen valt.
1
Forrester: Controlling Storage Cost Amid High Growth, 3 februari 2010
Als het gaat om het afnemen van Storage-as-a-Service (StaaS) zijn Nederlandse organisaties uiterst sceptisch. Voor maar liefst 54 procent van de ondervraagden is online opslag geen optie. Vertrouwen speelt daarbij een grote rol: men wil de data simpelweg binnen de muren van het bedrijf houden. StaaS heeft zelfs bij de overige IT-managers het tij tegen: van de groep die aangeeft interesse te hebben in StaaS, heeft de helft nog geen concrete plannen om ermee aan de slag te gaan.
3. Storageomgevingen Voor dit onderzoek is gekeken naar welke storage-omgevingen in Nederland zoal worden gebruikt. Daarvoor zijn de volgende technieken meegenomen: Direct Attached Storage (DAS): Eenvoudige vorm van storage waarbij harde schijven direct aan een server worden gekoppeld. Tapes: Magnetische tapes die al 50 jaar worden gebruikt in de ICT om gegevens voor lange termijn op te slaan. Trage toegangstijd, maar per megabyte goedkoper dan conventionele harde schijven. NAS: Network-Attached Storage, een opslagmedium dat op het netwerk aangesloten is (en dus niet direct op een server). SAN: Storage Area Network. Een architectuur die dient als koppeling tussen servers (initiator) en opslagapparaten (target) (denk hierbij aan disk arrays, tape libraries and optical jukeboxes). Dit gebeurt via de in servers ingebouwde controllers op zo'n manier dat het voor het besturingssysteem lijkt alsof het opslagapparaat direct is aangesloten. Fibre Channel SAN: Een vorm van SAN waarbij gebruik wordt gemaakt van Fibre Channelprotocollen- en switches. Is een apart Fibre Channel (FC) netwerk voor nodig iSCSI-SAN: Een SAN gebaseerd op het iSCSI-protocol voor gegevensoverdracht. iSCSI is een manier om commando's van het aloude storage-protocol SCSI door te geven via reguliere internetverbindingen (met het internetprotocol: IP). Fibre Channel over Ethernet (FCoE) SAN: Een techniek om Fibre Channel-protocollen te transporteren over ethernet-netwerken. Voordeel hiervan is dat een gewoon, goedkoper Ethernetnetwerk naast een FC-omgeving kan draaien, dus zonder dat er een kostbaar FC-netwerk nodig is. ATA over Ethernet: Een SAN-protocol dat vooral gebruikt wordt om relatief goedkope SANnetwerken op te zetten.
3.1 Gebruik van storageomgevingen in Nederland Traditionele storage is in Nederland nog volop in zwang. Het verouderde Direct Attached Storage (DAS - wat neerkomt op gewone harde schijven gekoppeld aan conventionele servers) wordt veruit het meest gebruikt, samen met tape-opslag. Zoals te verwachten valt, geldt dat DAS bij kleine organisaties met minder dan vijftig werknemers gemeengoed is. Maar ook grotere organisaties werken in Nederland nog steeds met deze langzame, niet erg schaalbare vorm van storage.
Hoe ziet uw storage omgeving er uit? (meerdere antwoorden mogelijk) Servers met Direct Attached Storage (conventionele harde schijven)
47%
Tapes
41%
NAS
36%
Fibre Channel SAN
25%
ISCSI-SAN
15%
Fibre Channel over Ethernet (FcoE) SAN
ATA over Ethernet (AoE) SAN
Anders, namelijk:
10%
8%
13%
Fig. 1 Geavanceerde storageomgevingen als NAS, Fibre Channel en SANs worden meer gebruikt door ITorganisaties dan niet-IT-organisaties. Opvallend is verder dat het relatief dure Fibre Channel SAN relatief vaak door kleine organisaties met minder dan honderd werknemers worden ingezet. Zelfs bij organisaties met minder dan vijftig werknemers draait veel Fibre Channel. Toch blijft FC het populairst onder organisaties met tussen de duizend en vijfduizend werknemers.
4. Het belang van Backup en Recovery Backup en recovery wordt gezien als een belangrijk onderdeel van de organisatie. Voor 58% van de ondervraagden is een gedegen backup en recovery cruciaal voor de bedrijfsvoering, 38% bestempelt het als belangrijk. Het beeld dat er serieus wordt omgesprongen met het thema, blijkt uit de respons op de stelling 'Backup en Recovery is een noodzakelijk kwaad dat de business niet helpt groeien en is daarom niet meer dan een kostenpost'. Slechts 20 procent van de respondenten is het hiermee eens, terwijl 55 procent het oneens of geheel oneens is met deze stelling. Backup en recovery wordt vooral gezien als verzekering voor de bedrijfscontinuïteit (fig. 2). Maar liefst 88 procent geeft dit op als een van de redenen om backups van gegevens te blijven maken. Ondanks dat hebben weinig organisaties regelmatig ook echt met dataverlies te maken: slechts 12 procent is het eens met de stelling “We hebben met regelmaat te kampen met dataverlies, waardoor backups noodzakelijk zijn.” Backup en recovery is voor de meesten dus vooral een verzekering voor iets dat niet regelmatig voorkomt.
Welke redenen spelen een rol bij het maken van backups van bedrijfsgegevens? 88% Verzekering van bedrijf scontinuiteit
87%
89%
41% Het ordelijk beheren van de datagroei binnen het bedrijf
45%
37%
37%
Wetgeving
Allen
34%
ICT-branche 40%
buiten ICT-branche
Fig. 2 Opvallend is dat 37 procent van de organisaties aangeeft wettelijk verplicht te zijn om gegevens veilig te stellen. Daarbij zijn het net iets vaker organisaties buiten de IT-branche die hiermee te maken hebben.
5. Bekendheid met Backup en Recovery en bijbehorende technieken Het concept Backup en Recovery is iets waar men binnen organisaties zeer bewust mee bezig is. Op de vraag 'Bent u bekend met het onderwerp Backup en Recovery?' antwoordt maar liefst 69 procent van de ondervraagden dat ze Zeer Bekend zijn met het onderwerp. Slechts 3 procent zegt helemaal geen of nauwelijks kennis van het onderwerp te hebben. Hierbij maakt het niet uit of een ondervraagde werkzaam is bij een IT-bedrijf of bij een niet-IT-bedrijf; de percentages zijn in beide categorieën precies gelijk. Als het gaat om de factoren die van belang zijn, is schaalbaarheid het populairst onder de ondervraagden. 63 procent is het eens met de stelling “Voor de storage omgeving is schaalbaarheid het belangrijkste aspect”.
5.1. Bekendheid met specifieke technieken Dat betekent niet dat de nieuwere technieken op het gebied van dataopslag gesneden koek zijn voor alle ondervraagden. Dat is niet verwonderlijk, omdat Backup en Recovery en storage in het algemeen constant worden aangevuld met nieuwe technieken.
Voor dit onderzoek heeft Webwereld de volgende technieken meegenomen: Datacompressie: het opslaan of verwerken van digitale gegevens met minder bits dan de oorspronkelijke dataset. Dit gebeurt door compressie-schema's die bijvoorbeeld 'lege plekken' in data weglaten, van doublures slechts één exemplaar meenemen (met verwijzingen naar de overige doublures zodat die decompressie weer aangemaakt worden) of die bepaalde gegevens (zoals tussenliggende video-frames) kunnen extrapoleren op basis van wel opgeslagen data. Op deze manier worden gegevens die niet van direct belang zijn (maar wel moeten worden veiliggesteld voor recovery- of archiveringsdoeleinden) opgeslagen, zonder dat ze hun volledige opslagruimte claimen in de storageomgeving. 1-op-1 kopieën: Het principe van 'kopieëren-plakken', dus gegevens worden geheel ongewijzigd op een ander medium gezet. Snapshots/Clones: Een snapshot is een momentopname van een compleet bestandssysteem, met daarin de te backuppen data. Een snapshot is enkel te lezen (read-only). Een kloon is een snapshot die wel aangepast kan worden (read/write). Klonen kunnen gelijke stukken van de data met elkaar delen, waardoor die maar één keer opgeslagen hoeft te worden. Stukken die worden gewijzigd, worden (eventueel voor elke kloon an sich) weer apart opgeslagen. Door het gebruik van klonen ontstaat er een plaatsbesparende manier van opslag; vele kopieën van veel overeenkomende data hoeft immers maar één keer opgeslagen te worden. Datadeduplicatie: Een relatief nieuwe vorm van datacompressie. In plaats van dat identieke gegevens op twee of meerdere plaatsen worden behouden, worden de gegevens slechts op één plek echt behouden. In de plaats van de andere gegevens komen dan verwijzingen te staan naar deze bron. Steeds meer ict-leveranciers, zowel storage- als softwareleveranciers, bieden opslagmogelijkheden met deze techniek. RAID 6: RAID is de benaming voor een set methodieken voor fysieke data-opslag op harde schijven waarbij de gegevens over meer schijven verdeeld worden. Die schijven vormen dan één opslaggeheel. Op deze manier wordt onder andere aan beveiliging tegen gegevensverlies gedaan. RAID 6 is een geavanceerde vorm van het al veel gebruikte RAID 5. Waar in RAID 5 één schijf in een array mag falen zonder dat er gegevens verloren gaan, biedt RAID 6 dezelfde functionaliteit maar dan met de voorziening voor databescherming als er twee schijven tegelijkertijd falen. Thin Provisioning: Optimalisatietechniek voor gebruikte storage. Alle vrije ruimte wordt zo optimaal mogelijk benut op Just-in-Time-basis: opslagruimte wordt pas gebruikt als het echt nodig is. Normaliter wordt opslagruimte vaak vantevoren 'gereserveerd' (provisioned) zodat (server)applicaties er van op aan kunnen, dat die (benodigde) ruimte er daadwerkelijk is. Daarnaast verminderd reguliere provisioning het risico van fragmentatie verminderd. Fragmentatie ontstaat wanneer data op verschillende plekken op (eventueel ook verschillende) harde schijven wordt opgeslagen. Dat gebeurt doordat tussenliggende lege plekken niet altijd groot genoeg zijn voor de te bewaren data. Automated Tiering: Het automatisch promoveren of degraderen van gegevens naar een andere laag (tier) in de opslagomgeving; bijvoorbeeld een sneller maar duurder storage-apparaat. Die indeling naar een hogere of lagere tier gebeurt automatisch naargelang de behoefte aan de data. Dit gebeurt op basis van ingestelde regels (policies). Gegevens die bijvoorbeeld weinig worden aangeroepen, worden door het systeem automatisch op storage gezet die is bedoeld voor langetermijnopslag, maar die (vanwege de relatief lagere snelheid) minder geschikt is voor directe toegang door gebruikers.
Interesse voor backuptechnieken (in %) Is interessant
Ken ik niet
Is niet interessant
72
Datacompressie
6
60
1-op-1 kopieën
7
33
Snapshots/Clones
64
16
Datadeduplicatie
63
19
44
RAID 6
Thin Provisioning
19
Automated Tiering
19
22
23 56 61
20 18 33 25 19
Fig. 3 Het is duidelijk te merken dat datadeduplicatie als technologie de laatste jaren veel aandacht heeft gehad in de uitingen van leveranciers. De meerderheid (63 procent) vindt deze technologie interessant, en slechts 19 procent kende het principe niet. Maar andere technieken waarnaar werden gevraagd (RAID 6, thin provisioning en automated tiering) zijn een stuk minder bekend. Vooral automated tiering is onbekend, aangezien 61 procent zelfs nog nooit van de technologie gehoord heeft. Dat geldt voor zowel de IT-branche (57 procent onbekendheid) als in sterkere mate daarbuiten (65 procent). Daarbij moet aangetekend worden dat automated tiering (of automated tiered storage) een relatief nieuwe techniek is die pas aan het begin van 2010 in de publiciteit is gekomen2. Wat dat betreft zijn de ontwikkelingen rond thin provisioning opmerkelijker. In 2007 voorspelde Gartner nog dat thin provisioning voor een revolutie zal zorgen binnen de storagemarkt3. De techniek is ook al sinds 2002 beschikbaar, maar blijft in 2010 onbekend bij 56 procent van de ondervraagden. Het lijkt daarmee dat deze technologie grotendeels aan de Nederlandse markt voorbij gaat. Het meest vertrouwd zijn de Nederlandse organisaties met datacompressie. Deze techniek is bij 98 procent bekend: 72 procent vindt het interessant, en 22 procent vindt het niet interessant. Het maken van snapshots en clones begint gemeengoed in de markt te worden, waarbij slechts 20 procent geen nut ziet in deze techniek en 16 procent de techniek niet kent.
5.2. Reeds gebruikte backuptechnieken: nog veel 1-op-1 kopieën Zoals in fig.1 al te zien is, wordt de 1-op-1 kopie nog altijd gezien als een valide manier om gegevens veilig te stellen. Analisten en adviseurs waarschuwen hiervoor, want ondanks dat deze techniek zeer eenvoudig is daarmee goedkoop lijkt, is het niet bepaald efficiënt. Feitelijk komt het gebruik van 1-op-1 kopieën neer op een simpele kopieer-plak handeling, zonder dat een besparing gemaakt wordt op schijfruimte. De systeembronnen hebben hieronder te lijden4.
2 3 4
Computerworld.nl: Effectieve opslag met Automated Data Tiering, 14 maart 2010 Gartner: Thin Provisioning Is Revolutionizing Storage Management 30 juli 2007 Forrester: Controlling Storage Cost Amid High Growth 3 februari 2010
Gebruik van backuptechnieken (in %) (basis: bekend met techniek) Wordt reeds geïmplementeerd
69
Datacompressie
36
55
Datadeduplicatie
Automated Tiering
26
64
Snapshots/Clones
Thin Provisioning
31
74
1-op-1 kopieën
RAID 6
Wordt op korte termijn geïmplementeerd
37 33 31
45 63 67 69
Fig. 4 Van de backuptechnieken die wel opslagcapaciteit besparen, worden datacompressie (softwarematig of met behulp van een appliance) en het maken van snapshots en clones het meest ingezet in Nederland. Deduplicatie is aan een flinke opmars bezig. Meer dan de helft van de ondervraagden die de techniek interessant vindt, heeft het al in zijn backupomgeving draaien. RAID 6, thin provisioning en automated tiering moeten veelal nog worden geïmplementeerd door ondervraagden die hebben aangegeven de techniek interessant te vinden.
6. Datagroei en budgetten voor storage bij Nederlandse organisaties Nederland volgt het internationale voorbeeld als het gaat om de gegevensgroei en de relatie met budgetten. Gemiddeld hebben de ondervraagde organisaties een datagroei gezien van 20 procent ten opzichte van vorig jaar. Bij 69 procent van de ondervraagde organisaties is de databehoefte met meer dan 5 procent gestegen vergeleken met een jaar eerder. In een derde van die gevallen gaat het om een groei van meer dan 30 procent. Bij 3 procent van de organisaties zijn de gegevens zelfs meer dan verdubbeld.
Behoefte aan gegevensopslag en budget voor gegevensopslag t.o.v. een jaar geleden (in %) Behoefte aan gegevensopslag Budgetstijging voor gegevensopslag
(Percentages over alle respondenten) 54
31 26
19
13
13
13
13 9 5
6 2
Niet gestegen/ Gelijk gebleven
1-5 % gestegen
6-10 % gestegen
11-30 % gestegen
31-50 % gestegen
50-100 % gestegen
3 1
Meer dan 100 % gestegen
Fig. 4 Daartegenover staat dat de budgetten een veel minder sterke stijging doormaken. Gemiddeld zijn de budgetten met minder dan 10 procent (9 procent) gestegen. In 54 procent van de gevallen is het budget zelfs helemaal niet gestegen. In slechts 1 procent van de gevallen is het budget verdubbeld of meer; eenderde van het aantal bij wie de vraag naar gegevens meer dan is verdubbeld.
7. Gegevens blijven binnen Waar Nederlandse organisaties voorlopig niet aan willen, is het afnemen van storage als dienst in de vorm van Storage-as-a-Service (STaaS). Meer dan de helft van de ondervraagden (54 procent) zegt geen behoefte aan een dergelijke oplossing te hebben, waarbij de gegevens worden ondergebracht bij een externe dienstverlener. 12 procent van de respondenten geeft aan dat ze hier om juridische redenen niet aan kunnen beginnen, terwijl 42 procent hun gegevens binnen het eigen bedrijf willen houden. Daar komt bij dat 15 procent aangeeft de mogelijkheid niet bij voorbaat af te schieten, maar ook niet concreet bezig is met het uitbesteden van de storage en backup en recovery. 10 procent van de organisaties doet dit al wel, maar wil dit niet verder uitbreiden. Slechts 6 procent neemt STaaS af en wil het op korte termijn uitbreiden. De overige 5 procent kijkt ernaar om dit jaar nog op STaaS over te gaan (2 procent) of wil dit in 2011 of 2012 doen (3 procent). Minder dan de helft van de organisaties (40 procent) is van mening dat leveranciers voldoende garanties kunnen bieden om van STaaS een succes te maken.
De trend is daarmee ongeveer gelijk met de Verenigde Staten, waar begin dit jaar 13 procent van de organisaties backup als dienst afneemt5. Vergeleken met de rest van Europa lijken Nederlandse organisaties huiveriger te zijn voor dit model: in heel Europa ligt de gemiddelde implementatiegraad al op 23 procent, zo becijfert Forrester.
8. Conclusie De Nederlandse markt voor Backup en Recovery vertoont grotendeels dezelfde spagaat die internationaal ook geldt. Enerzijds wordt het maken van backups als iets noodzakelijks gezien. Het is een verzekering voor de bedrijfscontinuïteit, en in veel gevallen zijn organisaties bij wet verplicht om hun gegevens veilig te stellen. Anderzijds blijken organisaties op dit gebied erg conservatief. Nieuwe technieken hebben moeite om voet aan de grond te krijgen bij klanten, terwijl verouderde technieken nog steeds veel worden gebruikt. Dat klanten 'schaalbaarheid' het belangrijkste aspect noemen van een storage-omgeving, vloekt op het eerste gezicht met het feit dat de meesten nog altijd gebruik maken van DAS-opslag en tapes, maar misschien is een nog duidelijker signaal dat de budgetten voor dit aspect van de ICT amper stijgen. De makkelijkste oplossing waarnaar gegrepen wordt is 'meer capaciteit kopen', maar analisten waarschuwen ervoor dat dit risico's met zich meebrengt. Zo nemen de storage-apparaten letterlijk meer (kostbare) plek in in het datacenter, en hebben ze ook stroom en koeling nodig waardoor de datacenteropstelling weer verandert. Daarnaast kost een wilgroei aan storagesystemen meer beheerwerk. In het geval van vervanging door een systeem met meer opslagruimte kost de migratie tijd en dus geld, en kan het nieuwe apparaat ook meer stroom en koeling vereisen. Bovendien is dat een 'uitstelstrategie'; het fundamentele probleem van de datagroei is niet aangepakt. Opvallend is dat deduplicatie een grote vlucht heeft genomen. Dit kan wijzen op goede marketing van de leveranciers, maar het kan ook betekenen dat de capaciteit wel degelijk een probleem aan het worden is bij organisaties. 49 procent van de ondervraagden geeft aan datagroei te zien als een 'belangrijke uitdaging' binnen hun organisatie, waardoor constante innovatie noodzakelijk is. Waar klanten vooral naar op zoek lijken te zijn, is zekerheid: zekerheid dat gegevens niet verloren kunnen gaan, maar ook de zekerheid dat deze gegevens niet buiten het bedrijf terecht komen. De huiverigheid tegenover STaaS is hieraan toe te schrijven. Net als de onwil om grote investeringen te doen in nieuwe technieken.
9. Onderzoeksverantwoording Doelgroep: management en beslissers rondom ICT oplossingen Steekproefkader: contactbestanden IDG Nederland Methode: online vragenlijst, uitnodiging via e-mail en RSS Veldwerkperiode: oktober 2010 Netto steekproef = 2400 Netto response (29,2%) N = 700 (322 ICT-branche, 378 andere branche) Vragenlijst: 23 vragen
5
Forrester: Business Users Are Not Ready For Cloud Storage, 22 januari 2010