NETAPP-WHITEPAPER
De NetApp-gids voor storage-efficiency Larry Freeman, NetApp, Inc. Juli 2011 | WP-7022-0711
EFFICIENCYTECHNIEKEN GEBRUIKEN VOOR END-TO-END VERMINDERING VAN STORAGECAPACITEIT
Inhoudsopgave 1
ZAKELIJK OVERZICHT ..................................................................................................... 3
2
OVERZICHT VAN STORAGE-EFFICIENCY...................................................................... 4
3
METING VAN DE STORAGE-EFFICIENCY ...................................................................... 5
4
EFFICIENCY (OF INEFFICIËNTIE) BEGINT MET HET MAKEN VAN DATA .................. 7
5
THIN-PROVISIONING......................................................................................................... 8
6
VIRTUELE KLONEN MAKEN ............................................................................................ 9
7
DATAREPLICATIE EN BACKUP..................................................................................... 10
8
DEDUPLICATIE ................................................................................................................ 11
9
DATACOMPRESSIE......................................................................................................... 12
10 EFFICIËNT GEBRUIK VAN DRIVES MET EEN HOGE CAPACITEIT ............................ 13 11 DE EFFICIENCY VAN STORAGE VAN DERDEN VERBETEREN ................................. 14 12 CONCLUSIE ..................................................................................................................... 15 CASESTUDY 1: FLEXCLONE ......................................................................................................................... 16 CASESTUDY 2: DEDUPLICATIE .................................................................................................................... 16 CASESTUDY 3: VERBETERDE BENUTTING ................................................................................................ 16
2
De NetApp-gids voor storage-efficiency
1
ZAKELIJK OVERZICHT
Er bestaan verschillende factoren die de manier beïnvloeden waarop bedrijven tegenwoordig hun aankoopbeslissingen nemen. Door de wereldwijde economische onzekerheid van het huidige post-recessie tijdperk moesten datacentermanagers hun budgetten herzien en onnodige uitgaven voor IT schrappen. Tegelijkertijd blijft de milieuproblematiek een zorg voor locatiemanagers die zich bezighouden met de kosten en beschikbaarheid van energie, koeling en ruimte voor de huidige groeiende IT-infrastructuur. Terwijl IT-managers blijven kampen met dit soort problemen, blijft de hoeveelheid data toenemen. Volgens sommige schattingen initieert het maken van een typisch bedrijfsbestand een reeks activiteiten waarin dat bestand tot meer dan 1000 keer wordt gekopieerd zolang het bestaat. Als het bestand een afbeelding is van een populaire artiest of een videoclip van de uitzonderlijke prestaties van een sporter, dan worden mogelijk razendsnel tienduizenden kopieën verspreid over de hele wereld. Welke weerslag heeft dit op de storage in datacenters bij ondernemingen? Hebben uw gebruikers afbeeldingen en video's gedownload en zijn ze die volledig vergeten? Weigeren uw gebruikers om oude bestanden te wissen omdat ze "misschien ooit nog eens nodig kunnen zijn"? Verwijdert u als systeembeheerder niet graag datavolumes omdat niemand weet wie de eigenaar van die data is en waarvoor ze worden gebruikt? Als u een positief antwoord kunt geven op één van deze vragen, dan bent u niet alleen. De meeste systeembeheerders worstelen vandaag met de voortdurende toename van data in het datacenter. Spijtig genoeg bestaat er geen handige prullenbak waar u uw dataafval in kwijt kunt. Er bestaan verschillende manieren om het probleem van dataproliferatie tegen te gaan. Eerst moet u vragen aan al uw accountants, engineers, managers, technici en executives om onmiddellijk hun oude data te wissen die ze niet langer gebruiken. Makkelijker gezegd dan gedaan. U zou ook een mechanisme kunnen invoeren om automatisch verouderde bestanden te zoeken, te classificeren en te verplaatsen naar een archiefsysteem op schijf. Op deze manier wordt ruimte vrijgemaakt op uw primaire storagesystemen, maar al deze data blijven wel nog ergens aanwezig en nemen nog steeds een enorme hoeveelheid ruimte in op diskdrives. U zou ten slotte uw voordeel kunnen doen met bestaande technieken voor storage-efficiency om de groei van uw data te beheren. Zo kunt u verouderde storagesystemen verwijderen, de aanschaf van nieuwe storagesystemen uitstellen of kleinere storagesystemen aanschaffen. Het gedrag van uw gebruikers of de snelheid van de datagroei vallen buiten uw controle, maar u kunt de efficiency van de storagesystemen die deze data opslaan wel bepalen. Dit artikel licht toe hoe NetApp maximale storage-efficiency mogelijk maakt zodat u al uw data kunt opslaan en een snelle datatoename kunt verwerken, zonder dat dit ten koste gaat van uw personeel of uw budget.
3
De NetApp-gids voor storage-efficiency
2
OVERZICHT VAN STORAGE-EFFICIENCY
Storage-efficiency betekent eenvoudig gesteld dat u de maximale datahoeveelheid kunt opslaan in de kleinst mogelijke ruimte, tegen de laagst mogelijke kosten. NetApp Snapshot™technologie is in 1992 geïntroduceerd en was waarschijnlijk de eerste wijdverspreide functie voor storage-efficiency die beschikbaar was voor op schijven gebaseerde bedrijfsstoragesystemen. Met Snapshotkopieën konden systeembeheerders veel point-intime kopieën maken van hun volledige datavolumes, terwijl slechts een fractie was vereist van de ruimte die voor een normale backup van deze volumes nodig zou zijn. Snapshotkopieën verstoorden echter de normale bedrijfsactiviteiten. Systeembeheerders konden nu vaker dan ooit tevoren backups van hun volumes maken. Elke minuut, elk uur, elke dag, wanneer dan ook. Backups waren immers gewoon virtuele kopieën die heel weinig schijfruimte in beslag namen. Tegenwoordig is de NetApp Snapshottechnologie uitgegroeid tot een uitgebreid pakket virtuele tools. Hiermee kunnen systeembeheerders doeltreffend de provisioning van hun primaire storage uitvoeren, kloonkopieën voor tests/ontwikkeling beheren, point-in-time backups verkleinen en deze over LAN's en WAN's repliceren, en de algemene storagebehoeften reduceren door redundante datablokken te elimineren.
4
De NetApp-gids voor storage-efficiency
3
METING VAN DE STORAGE-EFFICIENCY
Maar hoe meet u storage-efficiency precies? Geloof het of niet, dit is bij NetApp jarenlang onderwerp van gesprek geweest. Eén opvatting is dat efficiency iets is dat geld of tijd bespaart. In de context van storage wordt er absoluut geld bespaard door kleinere systemen het werk van de grotere te laten doen, maar dat is niet zo zeker voor de tijdscomponent van storage-efficiency. Tijd voor provisioning? Tijd voor backup/restore? Tijd voor het lezen/schrijven van productiedata? Tijd voor het in gebruik nemen van applicaties? Eens zijn we misschien in staat een waarde aan tijd toe te kennen en dan de tijdsefficiency te meten, maar in deze whitepaper bespreken we storage-efficiency in de context van het reduceren van de storagecapaciteitsvereisten en het besparen van geld door het gebruik van kleinere storagesystemen. Capaciteitsoptimalisatie is een goede manier om te beschrijven wat NetApp met storagecapaciteit doet. Als we het over optimalisatie hebben, is het handig storagecapaciteit in 5 categorieën onder te verdelen: 1. Ruwe capaciteit: dit is de volledig adresseerbare capaciteit van het storagesysteem voordat dit is ingesteld. 2. Systeemreservecapaciteit: dit is de capaciteit die nodig is bij het instellen voor zaken als systeemoverhead, RAID-pariteit en reservedrives. Deze capaciteit is niet beschikbaar voor gebruikersdata. 3. Opslagcapaciteit: als de instellingen zijn voltooid, is dit de totaal geschatte capaciteit die zou kunnen worden gebruikt voor het opslaan van gebruikersdata. 4. Opgeslagen capaciteit: zodra de gebruikersdata zijn weggeschreven, is dit de datahoeveelheid die momenteel op het systeem is opgeslagen. 5. Capaciteit beschikbaar voor opslag: dit is de geschatte hoeveelheid extra gebruikersdata die op het systeem kan worden opgeslagen voordat het systeem vol is. Hieronder staat een grafisch model dat elk van de bovengenoemde categorieën laat zien:
(In vergelijking met ruwe capaciteit)
Afbeelding 1) Het storage-efficiencymodel.
In het bovenstaande model kunt u zien dat de opslagcapaciteitsbalk ten opzichte van de ruwe-capaciteitsbalk naar rechts uitsteekt. Hier wordt capaciteitsoptimalisatie gefactoreerd. Door functies zoals deduplicatie, compressie, virtuele klonen en Snapshotkopieën lijkt het storagesysteem groter te zijn dan het eigenlijk is. Opslagcapaciteit is daarom een schatting van de effectieve datahoeveelheid die zou kunnen worden opgeslagen als efficiency's zijn ingeschakeld. Als u de efficiency's inschakelt, beweegt de opslagcapaciteitsbalk naar rechts; als u de efficiency's uitschakelt, beweegt de opslagcapaciteitsbalk weer naar links. 5
De NetApp-gids voor storage-efficiency
Opslagcapaciteit lijkt op de actieradius-indicatie die tegenwoordig veel in auto's wordt gebruikt. Als u de tank vult, kan het display aangeven dat u 500 kilometer kunt rijden voordat de brandstoftank leeg is. Dat cijfer is een schatting gebaseerd op de gemiddelde rijomstandigheden voor die auto. Als u ofwel snel of rustig rijdt, kunt u uiteindelijk meer of minder dan 500 kilometer rijden voordat de tank leeg is. Terwijl u rijdt, werkt de boordcomputer aan de hand van uw rijgewoonten de gegevens steeds bij, zodat die steeds accurater worden als u nul kilometer nadert. Op dezelfde wijze is opslagcapaciteit een schatting van de datahoeveelheid die het storagesysteem zou kunnen bevatten, gebaseerd op het gemiddelde gebruik van efficiency's. Terwijl data op het systeem worden opgeslagen, worden berekeningen bijgewerkt gebaseerd op de efficiency's die daadwerkelijk in gebruik zijn en hun effect op de data. Als meer en meer data worden opgeslagen, wordt de schatting van de opslagcapaciteit steeds accurater. Een haalbaar doel voor systeembeheerders is ervoor te zorgen dat alle storagesystemen met een efficiency van 100% of meer werken, zoals te zien is in het bovenstaande grafische model. 100% efficiency is haalbaar, zelfs met een bescheiden implementatie van storageefficiencytechnieken van NetApp, die in de rest van deze whitepaper worden beschreven.
6
De NetApp-gids voor storage-efficiency
4
EFFICIENCY (OF INEFFICIËNTIE) BEGINT MET HET MAKEN VAN DATA
Het is bijna onmogelijk om te voorspellen hoe lang een bestand zal worden vastgehouden op de schijf. Alle data ontstaan op primaire storage. Of het nu gaat om een databaserecord, een gebruikersbestand, een broncodebestand voor software of een e-mailbijlage, data verbruiken fysieke ruimte op een diskdrive ergens in uw primaire storage-omgeving. Het maken van data op primaire storage start vanouds een reeks gebeurtenissen die tot storage-inefficiënties leiden. Een van de eerste problemen voor een beheerder is de allocatie van quota. Hoeveel fysieke storageruimte moet worden toegewezen voor elke specifieke gebruiker of applicatie? Systeembeheerders weten dat een te groot datavolume (of LUN) veel neveneffecten kan hebben en passen daarom vaak overprovisioning toe op hun quota en applicaties. Bijvoorbeeld: als een applicatie in hun ogen één terabyte nodig heeft, kunnen ze beslissen om 2 TB te alloceren om toekomstige groei te accommoderen of ter correctie van een verkeerde berekening van de storageruimte die werkelijk wordt verbruikt door de applicatie. Maar wat gebeurt er als de applicatie niet groeit zoals verwacht, of als de verkeerde berekening te krap uitvalt? Het resultaat is verspilling van ruimte, omdat deze ruimte niet kan worden gebruikt door een andere applicatie. Bij sommige schattingen blijft gemiddeld 60% primaire schijfstorage ongebruikt door dit soort overprovisioning. Dit patroon van gissen en de resulterende inefficiënties beperkt zich niet alleen tot primaire storage. De inefficiënties spreiden zich uit naar alle lagen van de storage: replicaties, backupkopieën en archiefkopieën kunnen allemaal met hetzelfde probleem kampen als primaire storage: onjuist gebruik.
7
De NetApp-gids voor storage-efficiency
5
THIN-PROVISIONING
NetApp streeft ernaar om het probleem van overprovisioning op te lossen met een techniek die thin-provisioning wordt genoemd. Met de NetApp FlexVolTM-technologie kunnen gebruikers flexibele volumes en LUN's maken die een bepaalde grootte lijken te hebben maar in werkelijkheid fysiek veel kleiner zijn. De FlexVol-technologie levert aanzienlijke verbeteringen in storageprovisioning, gebruik en omvangsbepaling. De omvang van datavolumes kan snel en dynamisch worden aangepast naargelang de vereisten van applicaties veranderen. De uiteindelijke impact van FlexVol is een drastische vermindering van fysiek gealloceerde storage. Voordelen zijn onder andere budgetbesparingen en verwante besparingen in ruimte, energie, warmte en koeling voor datacenters.
Afbeelding 2) Met thin-provisioning is “just-in-time”-provisioning van volumes en LUN's mogelijk.
8
De NetApp-gids voor storage-efficiency
6
VIRTUELE KLONEN MAKEN
Systeembeheerders moeten vaak heel wat primaire storageruimte alloceren voor belangrijke testactiviteiten van bedrijven, zoals testen voor het oplossen van bugs, platform- en upgradecontroles, meervoudige simulaties op basis van grote datasets en softwarestaging van externe kantoren. Bovendien kampen organisaties die vertrouwen op grootschalige simulaties voor uitgebreide tests, analyses en modellering vaak met hoge kosten voor de provisioning van extra primaire storage. Om dit probleem aan te pakken, heeft NetApp zijn toevlucht genomen tot Snapshottechnologie in de vorm van onze FlexCloneTM-functie. Hierbij wordt een techniek gebruikt die soms wordt aangeduid met "schrijfbare" Snapshotkopieën. FlexClone realiseert storage-efficiency voor applicaties waarin tijdelijke, beschrijfbare kopieën van datavolumes zijn vereist. De FlexClone-technologie maakt meervoudige, directe datasetklonen met minimale storageoverhead mogelijk. Dit wordt bereikt door een virtuele kopie te maken van de primaire dataset en alleen de datawijzigingen tussen het oorspronkelijke volume en een kloon op te slaan. Alle ongewijzigde data blijven op de primaire storage staan en worden gebruikt door zowel de primaire applicatie als de secundaire kloonkopie. Er kunnen meerdere kloonkopieën worden gemaakt van één primaire dataset. Op deze manier kunnen gebruikers meervoudige simulaties uitvoeren en de kenmerken van elke dataset vergelijken na de simulaties.
Afbeelding 3) FlexClone gebruiken om kopieën te maken voor virtuele tests en ontwikkeling.
9
De NetApp-gids voor storage-efficiency
7
DATAREPLICATIE EN BACKUP
Bedrijven wereldwijd moeten snel data kunnen beschermen en terughalen in het geval van natuurrampen, menselijke fouten en defecten in technologie en applicaties. Data moeten ook vaak op ruimtebesparende wijze kunnen worden uitgewisseld met externe locaties. Zonder een efficiënte strategie voor dataprotectie en -distributie ontstaan vertragingen die miljoenen kunnen kosten. SnapMirror® is uitzonderlijk krachtig, eenvoudig te gebruiken en te beheren en levert de oplossing voor disasterrecovery en datadistributie die hedendaagse multinationals vereisen. Door data op hoge snelheid over een LAN of een WAN te repliceren, biedt de SnapMirrorsoftware de hoogst mogelijke databeschikbaarheid en snelste recovery voor cruciale applicaties. De SnapMirror-software mirrort data naar een of meer NetApp-storagesystemen en houdt de gemirrorde data voortdurend actueel en beschikbaar voor disasterrecovery. De SnapMirror-software is gebaseerd op een storagebesparend ontwerp. Eerst wordt een basismirror uitgevoerd tussen het bronsysteem van SnapMirror en het doelsysteem van SnapMirror. Vervolgens worden met door de gebruiker bepaalde intervallen Snapshotkopieën gemaakt van het bronsysteem en alleen de nieuwe en gewijzigde blokken worden incrementeel via het netwerk naar het doelsysteem verzonden. Wanneer de data op het doelsysteem worden ontvangen, worden de gewijzigde blokken samengevoegd met de bestaande datablokken, met als resultaat een volledige mirrorkopie van het bronsysteem. Door alleen de gewijzigde data te repliceren sinds de laatste Snapshotkopie, vermindert SnapMirror aanzienlijk de bandbreedtevereisten voor het netwerk. Datacompressie en deduplicatie, die later wordt beschreven in deze whitepaper, maakt nog verdere ruimtebeperking mogelijk op het primaire systeem, het secundaire systeem en tijdens de data-overdracht tussen de twee systemen. Dit leidt tot lagere infrastructuurkosten voor datareplicatie en disasterrecovery. SnapVault® beschermt data op eendere wijze op het blokniveau, waarbij alleen de datablokken worden gekopieerd die zijn gewijzigd sinds de laatste backup, geen volledige bestanden. Dit betekent dat u veelvuldiger backups kunt maken gedurende de dag. De storagecapaciteitsvereisten worden verminderd, omdat er geen redundante data worden verplaatst of opgeslagen.
Afbeelding 4) SnapVault en SnapMirror voor ruimtebesparende backup en disasterrecovery.
10
De NetApp-gids voor storage-efficiency
8
DEDUPLICATIE
Herinnert u zich nog deze bekende scène uit De tovenaarsleerling? De assistent van een tovenaar spreekt, nadat hij zijn meester dit heeft zien doen (maar niet aandachtig genoeg) een toverformule uit op een bezem om zijn water op te halen. Nadat het water is opgehaald, vergeet de assistent de spreuk om de bezem te stoppen, waardoor zijn reservoir overstroomt en niet meer te stoppen is. De leerling valt de bezem wanhopig aan met een bijl. Natuurlijk (of 'bovennatuurlijk') komen de helften tot leven en blijven ze zich vermenigvuldigen. Water, overal water. Net als alle hoop verloren lijkt te zijn, komt de meester aan en stopt de bezem. In dit verhaal leerde de leerling de volledige impact kennen van vermenigvuldiging, en hij was machteloos om het te stoppen. Systeembeheerders voelen zich soms net zo hulpeloos als ze zien hoe hun datavolume steeds maar toeneemt. Zoals vermeld in het begin van het artikel, is redundantie een hoofdoorzaak van dataproliferatie. Nadat de data zijn gemaakt, lijken ze zich wel sneller te vermenigvuldigen dan u, de leerling, kunt bijhouden. NetApp-deduplicatie is de magische oplossing om de verspreiding van redundante data te stoppen. Het gemiddelde UNIX®- of Windows®-schijfvolume van een onderneming bevat duizenden en zelfs miljoenen dubbele data-objecten. Deze objecten worden gewijzigd, verspreid, naar backups gekopieerd en gearchiveerd, waardoor dubbele data-objecten zich met alarmerende snelheid verveelvoudigen. Het resultaat is een inefficiënt gebruik van de storageresources. Deduplicatie van NetApp helpt deze inefficiëntie te vermijden.
Afbeelding 5) NetApp-deduplicatie verwijdert redundante data
Deduplicatie van NetApp deelt nieuw opgeslagen data-objecten op in kleine blokken. Elk blok met data heeft een digitale 'handtekening' die wordt vergeleken met alle andere handtekeningen in het datavolume. Als twee blokken exact overeenkomen, dan wordt het gedupliceerd blok verwijderd en wordt de schijfruimte opnieuw benut. Deduplicatie kan worden geïmplementeerd in een grote verscheidenheid aan applicaties en bestandstypen, zoals databackups, data-archivering en ongestructureerde datavolumes. Door deduplicatie toe te passen, kunnen klanten tot 95% van hun storageruimte terugwinnen!
11
De NetApp-gids voor storage-efficiency
9
DATACOMPRESSIE
Datacompressie-algoritmen zijn tientallen jaren gebruikt in tape-apparaten en sinds kort ook in Virtual Tape Libraries. Datacompressie is effectief voor de vermindering van datacapaciteit, maar vermindert de prestaties van de software of vereist het gebruik van dure hardwarecomponenten. Om deze redenen is het nooit op grote schaal gebruikt op primaire storagesystemen. NetApp-datacompressie levert een optimale balans door geteste en bewezen softwarecompressie te gebruiken. De data die in het storagesysteem worden gezet, worden omgevormd in 32.000 compressiegroepen. Elke groep wordt apart getest op comprimeerbaarheid. Als een groep comprimeerbaar wordt geacht, wordt deze in gecomprimeerde indeling opgeslagen, anders mag de groep de oorspronkelijke vorm behouden. Door data selectief, naar behoefte te comprimeren, biedt NetApp-datacompressie aanzienlijke besparingen zonder grote vermindering van de prestaties.
Afbeelding 6) Alle storage-efficiencyfuncties van NetApp, inclusies datacompressie, werken zowel met blok- als met bestandsdata.
12
De NetApp-gids voor storage-efficiency
10 EFFICIËNT GEBRUIK VAN DRIVES MET EEN HOGE CAPACITEIT SATA-diskdrives met een hoge capaciteit hebben onbetwist de laagste kosten per GB. Ze brengen echter twee problemen met zich mee, waardoor ze nooit voor bedrijfsapplicaties zijn gebruikt. Ten eerste hebben SATA-drives de reputatie minder betrouwbaar te zijn dan 15.000 RPM Fiber Channel- of SAS-drives. Ten tweede zijn SATA-drives langzamer dan 15.000 RPM drives, vanwege het lagere toerental en de lagere toegangssnelheid van de actuator. NetApp pakt deze problematiek aan door SATA-drives te combineren met twee belangrijke technologieën: RAID-DP en Flash Cache. RAID-DP levert extra apparaatprotectie door dubbele drivefouten toe te staan zonder dataverlies en zonder een grote prestatievermindering. Flash Cache zet automatisch "actieve" data over naar een virtuele storagelaag. De afhankelijkheid van de drivesnelheid wordt daarbij verminderd, doordat de veelgebruikte data in een snelle solid-state geheugencache worden gezet. Door SATA-drives te combineren met RAID-DP en Flash Cache, introduceert NetApp een nieuw paradigma op de markt: drives met een hoge dichtheid die worden gebruikt voor hoogwaardige applicaties. Dit resulteert in lagere kosten per GB en besparingen op energie, ruimte en koeling.
Afbeelding 7) NetApp Flash Cache zet automatisch "actieve" data over naar zeer snelle cache.
13
De NetApp-gids voor storage-efficiency
11 DE EFFICIENCY VAN STORAGE VAN DERDEN VERBETEREN Wanneer systeembeheerders storage-efficiency op hun NetApp-systemen implementeren en de waarde ervan herkennen, is een veelgehoord commentaar: "Ik wilde dat ik deze efficiency ook op mijn storage van derden kon toepassen." Het V-serie gatewaysysteem van NetApp maakt juist dat mogelijk. Het is de eerste en enige storagevirtualiseringsoplossing die netwerkprotocollen voor blok- en bestandsstorage (FC, FCoE, iSCSI, CIFS, NFS) in één gemeenschappelijke architectuur verenigt. Met de systemen uit de V-serie kan uw volledige storage-infrastructuur worden gevirtualiseerd via één interface. Storagesystemen van HDS, HP, EMC, 3PAR, Fujitsu, IBM en anderen worden ondersteund achter de controller uit de Vserie. Met een systeem uit de V-serie kunt u de volledige efficiencymogelijkheden uit dit artikel op uw systemen van derden toepassen.
Afbeelding 8) V-serie gebruiken met storage van derden.
14
De NetApp-gids voor storage-efficiency
12 CONCLUSIE Dataproliferatie is een onontkoombaar feit. De verspreiding van data inperken is bijna onmogelijk. Een correctie van de inefficiëntie bij provisioning, het beheer van storage-allocatie voor tests en ontwikkeling, databackups en datareplicatie, en het wegwerken van redundante data liggen met de huidige efficiencytools voor storage nu binnen het bereik van systeembeheerders. NetApp biedt veel producten en functies die ruimte-efficiënte storage mogelijk maken, waardoor er minder storage hoeft te worden aangeschaft: •
Snapshot: point-in-time weergaven van het bestandssysteem
•
Thin-provisioning: "just in time"-storage voor efficiënte provisioning
•
FlexClone: beschrijfbare kopieën voor tests en ontwikkeling
•
SnapMirror/SnapVault: efficiënte datareplicatie en backup met gebruik van Snapshottechnologie
•
NetApp-deduplicatie: algemene deduplicatie voor het verwijderen van redundante dataobjecten
•
NetApp-datacompressie: softwarematige datacompressie zonder een grote prestatievermindering
•
SATA/RAID-DP/Flash Cache: gebruik van storage met hoge dichtheid voor hoogwaardige applicaties
•
V-serie: ruimte-efficiency van NetApp toegepast op storage van derden
Zoals werd aangetoond in de volgende gebruikers-casestudy's, kan de implementatie van storage-efficiency met NetApp een aanzienlijke weerslag hebben op uw basisuitgaven voor aankoop van storage en de lopende kosten voor datastoragemanagement.
15
De NetApp-gids voor storage-efficiency
CASESTUDY 1: FLEXCLONE Een vooraanstaande leverancier van trainingstools en cursusmanagementsystemen geeft tweemaal per jaar een upgrade uit van de online leerapplicaties. Om de klanten in staat te stellen hun aanpassing van deze applicaties te testen, heeft het bedrijf een gedeelde test- en ontwikkelingsinfrastructuur opgesteld op basis van de NetApp-storagesystemen. Test- en ontwikkelingsengineers gebruiken deze omgevingen om de applicatiecode en de storageomgeving van NetApp te updaten, configuraties te testen en beveiligingspatches en fixes uit te geven. Ontwikkelaars gebruiken NetApp FlexClone om werkkopieën te maken van de preproductiedata. Deze gekloonde kopieën nemen bijna geen enkele extra storageruimte in beslag. Met de NetApp Snapshottechnologie kunnen ontwikkelaars point-in-time kopieën maken van de data. "De eenvoud van het opstellen van een test- en ontwikkelingssysteem, vooral met de FlexClone-technologie, is niet te vergelijken met wat we daarvoor deden", verklaart deze klant. "Het duurde vroeger 36 uur om een werkkopie te maken van de database van onze grootste klant. Met FlexClone duurt het nu minder dan een uur, een vermindering van meer dan 97%."
CASESTUDY 2: DEDUPLICATIE Een groot multimediabedrijf is ook al lang klant van NetApp. Dit bedrijf heeft 3 SQL-servers met een totale capaciteit van 2 TB, naast andere applicaties. Deze databases worden als cruciale elementen gezien en bevatten factureringsinformatie van klanten. Vanuit het hoofddatacenter wordt van de drie SQL-databases elke nacht een backup gemaakt naar een NetAppstoragesysteem op een tweede locatie. Op deze locatie wordt van de drie databases opnieuw een backup gemaakt naar een derde locatie voor disasterrecovery (DR) en archivering. Dit bedrijf wilde alle tapebackups elimineren en wilde in plaats daarvan disk-to-disk backup en disasterrecovery van NetApp te gebruiken. Door de grootte van de databases en de vereiste om 16 backupkopieën te allen tijde online te houden, waren ze ook geïnteresseerd in het verminderen van de benodigde schijfruimte. Uit proof-of-concept testen met NetApp-deduplicatie bleek dat een besparing van 40% tot 50% in volumeruimte consequent mogelijk zou zijn als deduplicatie na de tweede nachtelijke backup zou plaatsvinden. Nadat het concept was bewezen, werd een geautomatiseerd script ontwikkeld. Alle databasebackups werden in paren opgeslagen op NetApp-volumes. Na de tweede nachtelijke databasebackup wordt deduplicatie uitgevoerd op het volume en een controle uitgevoerd om de nieuwe (verminderde) vereiste volumeruimte te bepalen. De omvang van het volume wordt vervolgens automatisch aangepast met FlexVol. Dit proces gaat door tot er 8 volumes zijn gemaakt, met een totaal van 16 databasekopieën. Hierna wordt bij daaropvolgende backups, het eerste volume gewist en een 17e volume gemaakt, enzovoorts. Het resultaat van deze implementatie was een volledig geautomatiseerd backupproces en een vermindering van de benodigde schijfruimte met 40%, wat de benodigde capaciteit terugbracht van 32 TB naar 19 TB.
CASESTUDY 3: VERBETERDE BENUTTING NetApp is niet alleen een producent maar ook een consument van haar storagesystemen. Onlangs ondernam de IT-groep van NetApp een project om de benutting van storage te verbeteren. Dit project omvatte een migratie van oude, inefficiënt gebruikte storagesystemen naar nieuwe, beter schaalbare systemen met gebruik van technieken voor datavirtualisatie. Deze consolidatie bracht aanzienlijke resultaten op: •
Het gemiddelde gebruik van de storagecapaciteit nam toe van 40% tot 60% per volume.
•
De storagevoetafdruk werd verminderd van 24,83 racks tot 5,48 racks.
•
Vijftig storagesystemen werden teruggebracht tot tien storagesystemen.
•
Het directe energieverbruik werd verlaagd met 41.184 kWh per maand.
• De jaarlijkse elektriciteitskosten werden teruggeschroefd met $ 59.305. "Wij willen niet alleen marktleidende datamanagementtechnologieën aan onze klanten leveren om het energieverbruik van hun datacenter te verlagen; we willen ook ons eigen energieverbruik verlagen met energie-efficiëntere technologie", aldus de Director of Facilities van NetApp. NetApp stond voor verschillende uitdagingen, zoals toenemende beperkingen wat betreft ruimte, koeling en energie. Door servers en storage te consolideren, werd het energieverbruik vanaf de bron teruggedrongen." 16
De NetApp-gids voor storage-efficiency