VIRTUALISATIE DOOR BRAM DONS
FalconStor VTL Virtual Appliance for VMware
Dataprotectie in VMware Version 3 infrastructuur 52 STORAGE MAGAZINE · 1 · FEBRUARI 2008
De toepassing van serverconsolidatie neemt nog steeds in populariteit toe. Echter, naast alle voordelen die virtualisatie heeft te bieden, is er een aantal bijkomende zaken die, bij toepassing van gevirtualiseerde servers, vaak niet worden onderkend, zoals de availability, business continuity en disaster recovery. FalconStor komt met een aantal oplossingen voor VMware’s Version 3 Infrastructure. De ontwikkeling van dataprotectie en recovery heeft tot dusver geen gelijke tred kunnen houden met die van servervirtualisatie. Dit maakt het vooral voor kleine ondernemingen moeilijk om op een kosteneffectieve en efficiënte manier dataprotectie te implementeren voor een gevirtualiseerde serveromgeving. VMware’s Version 3 Infrastructure (VI3) ondersteunt wel sommige van deze voorzieningen via haar baseline High Availability (HA) en Distributed Resource Scheduler (DRS)-opties voor server failover en load balancing van clustersystemen. De combinatie met de basisvoorziening voor business continuity (BC)/ disaster recovery (DR) van VMware biedt echter alleen bescherming in de vorm van een crashconsistente herstart van de servers. Om een VMware-omgeving naar een hoger betrouwbaarheidsniveau te tillen, is een aantal software-ondernemingen begonnen om hiervoor opslagvirtualisatie en geavanceerde ‘application-aware’ oplossingen voor dataprotectie te ontwikkelen. Application-ware dataprotectie is een
voorziening die meehelpt om de VI3-technologie geschikt te maken voor de highend mission-critical enterprise omgeving. Een dergelijke oplossing richt zich op het bieden van dataconsistentie door het toepassen van applicatie-integratie agents en APIs voor de bekende databases zoals Oracle, Microsoft SQL en Exchange. Voor bedrijven in het midden- en kleinbedrijf is, vanwege de hoge aanschafkosten, deze protectietechnologie echter niet haalbaar. Dit marktsegment zou bijvoorbeeld wel van Continuous Data Protection (CDP) kunnen profiteren als deze technologie eenvoudig zou zijn toe te passen en tevens betaalbaar zou zijn.
Opkomst Virtual Appliances Een belangrijke nieuwe trend in de ITwereld is de opkomst van eenvoudig te gebruiken en redelijk geprijsde Virtual Appliances (VAs). VAs bezitten alle kenmerken van een revolutionaire benadering, namelijk het ontwikkelen van zakelijke applicaties en deze snel toepasbaar maken. VAs zijn van te voren klaarge-
maakte software stacks die een operating system en applicatie ondersteunende software bevatten. Gebruikers kunnen deze VAs meestal eenvoudig downloaden van de leveranciers websites en kunnen zelf worden geïnstalleerd. Een van de eerste leveranciers die gevirtualiseerde servers voor de MKB-markt ondersteunt is de firma FalconStor.
Virtual Appliance for VMware infrastructure FalconStor bracht eind vorig jaar het product FalconStor’s Virtual Tape Library (VTL) for VMware Infrastructure op de markt. Zoals gezegd, het is een van te voren geïnstalleerde, geconfigureerde, en ‘ready-to-run’ softwareapplicatie. Het pakket brengt de nieuwe VTL-technologie en data de-duplicatiefunctionaliteit in de
VA’S ZIJN REVOLUTIONAIR
VMware-omgeving onder. De VTL Virtual Appliance ondersteunt een snelle backup, data de-duplicatie, enterprise-brede replicatie en integratie met een tape back-upvoorziening. Dit alles is mogelijk zonder enige aanpassing aan de bestaande VMware-omgeving. De ingebouwde data de-duplicatievoorziening elimineert automatisch, voor de gebruikers transparant, redundant aanwezige data tijdens de back-up en minimaliseert het netwerkverkeer dat plaatsvindt bij de offsite replicatie. De VTL ondersteunt een ‘one-
Virtual Tape Library
Tape automation
VTL appliance
Application servers
= Primary disk
= Secondary disk
Figuur 1: VTL Appliance for VMware infrastructure
to-one’ en ‘many-to-one’ offsite-replicatie voor DR-oplossingen. Het product Continuous Data Protection (CDP) Virtual Appliance for VMware Virtual Infrastructure is een ander product voor dataprotectie voor de VMware-omgeving. Het is een op disk gebaseerde oplossing die een totale beveiliging en continu beschikbaarheid biedt en volledig geïntegreerd is met de ESX-server.
Replicatie VTL Virtual Appliance for VMware Infrastructure biedt een multi-streaming, multi-session, back-upfaciliteit. Dat betekent dat de appliance met meerdere back-upservers kan worden verbonden en gelijktijdig meerdere back-ups kan uitvoeren. De VTL Virtual Appliance heeft een geïntegreerde data de-duplication engine die op blocken scant waarvan al eerder een backup is gemaakt. De eenmalige opslag van een data block bespaart dan ook op de totale hoeveelheid benodigde diskruimte en maakt, weliswaar afhankelijk van de ratio duplicate data, volgende back-ups veel sneller. Na de-duplicatie wordt de unieke data gecomprimeerd waardoor nog meer op diskruimte wordt bespaard. FalconStor geeft als voorbeeld dat met deduplicatie bij een verhouding van 15:1 de Appliance en een datacompressie verhouding van 2:1 uiteindelijk een totale reductie van 30:1 kan worden gehaald, alhoewel dit natuurlijk afhankelijk blijft van de ratio duplicate data. Het de-duplicatieproces werkt volledig automatisch en transparant in de achtergrond, zonder dat het van invloed is op de back-upsnelheid. De Appliance voorziet in een geautomatiseerde data export naar tape waarmee virtuele tape cartridges in de achtergrond rechtstreeks naar de fysieke tape-apparatuur
kan worden geëxporteerd. Dit proces is uiteraard vele malen sneller dan rechtstreeks kopiëren van tape naar de backupserver. Het product van FalconStor ondersteunt remote replicatie voor disaster recovery via een bestaande WAN-verbinding. Tijdens het replicatieproces worden alleen unieke data blocken naar de remote site gerepliceerd waardoor, bij een 20:1 de-duplicatieverhouding, de hoeveelheid netwerkverkeer tot wel 95 procent kan worden teruggedrongen. De Appliance ondersteunt one-to-one en many-to-one replicatieconfiguraties zodat de volledige tape-infrastructuur op één gecentraliseerde datasite kan worden geconsolideerd. Replicatie met encryptie is optioneel. Omdat identieke data vaak op meerdere sites aanwezig is, biedt VTL de mogelijkheid tot globale de-duplicatie om daarmee het totale onderlinge server backupnetwerkverkeer en de DR-kosten verder
terug te dringen. De Appliance voert de de-duplicatie uit door te controleren of hetzelfde data block al bestaat binnen de gehele data center zodat alleen unieke data hoeft te worden gerepliceerd. Gebruikers van datacenters kunnen het product gebruiken om voor archiverings of compliance-doeleinden data naar fysieke tape te migreren. De VTL Virtual Appliance ondersteunt bij een volledige back-up tot 0.8 TB waarbij de grootte van de de-dupe depository 2 TB mag bedragen. De retention periode is 150 dagen, gebaseerd op een 2-procents dagelijkse back-up. De equivalente opslagcapaciteit, op basis van een 20:1 de-dupe verhouding, bedraagt 40 TB en het totaal aantal virtuele beschikbare libaries/drives/cartridges is respectievelijk 4/16/1024.
Installatie De VTL Appliance kan in verschillende configuraties worden toegepast. Een basis-
(Advertentie)
STORAGE MAGAZINE · 1 · FEBRUARI 2008
Back-up server
53
configuratie bestaat uit een VTL Appliance die alle, zowel virtuele als fysieke, tapes beheert waarmee, via de tape back-upsoftware data naar fysieke tape wordt getransporteerd. Bij de meer geavanceerde configuratie vindt de back-up naar de virtuele tape plaats, waarbij de VTL het beheer regelt van het diskopslagsysteem en de export naar de fysieke tape library. De geautomatiseerde configuratie voor Tape Caching biedt daarnaast nog een transparante snelle toegang tot de data, ongeacht of deze zich op tape of disk bevindt.
drives getoond. Het aantal drives bepaalt tevens het aantal gelijktijdige back-upjobs die kunnen worden gedraaid. Backupsoftwarelicenties kunnen invloed hebben op het aantal tape drives dat voor een client beschikbaar is. Dit aantal kan, zolang de back-upsoftware dit ondersteunt, hoger zijn dan de standaardhoeveelheid voor de betreffende tape library. Vervolgens kan er voor de opties ‘Automated Tape Caching’, ‘Auto Archive’ of ‘Auto Replication’, niet beide, worden gekozen. Auto Archive schrijft data naar de fysieke
FALCONSTOR ONDERSTEUNT REMOTE REPLICATIE VOOR DISASTER RECOVERY
Praktijktest
54 STORAGE MAGAZINE · 1 · FEBRUARI 2008
Bij wijze van proef wordt de VTL Virtual Appliance op een VMware Workstation 6.0.2 for Windows geïnstalleerd en wordt tegelijk een kloon aangemaakt om replicatie te kunnen testen. Tevens wordt de CDP Virtual Appliance for VMware geïnstalleerd. De eerste stap bestaat uit de creatie van een virtual tape library via de ‘configuration wizard’. Bij de keuze voor een bepaald type virtual drive wordt automatisch het aantal beschikbare virtuele
tape op het moment dat een virtuele tape naar een Import/Export (IE)-slot van een virtual library verhuist. Voor Auto Archive moet de fysieke tape library barcodes ondersteunen omdat VTL probeert naar een fysieke tape te exporteren en het daarbij een overeenkomstige barcode in de fysieke library moet kunnen vinden. Optioneel kan er bij de export van data voor worden gekozen om deze te versleutelen. Bij de keuze voor ‘Auto Replication’ wordt de data
FalconStor VTL + SIR High-speed back-up via VTL interface
naar een andere VTL-server gerepliceerd. Dit gebeurt op het moment dat een virtual tape naar een IE-slot uit de tape library, het slot waarin de fysieke tape zich bevindt, wordt verplaatst. Na de configuratie van de tape library wordt de mogelijkheid van tape-uitbreiding ingesteld. Wanneer voor ‘Tape Capacity On Demand’ wordt gekozen, dan biedt dit de mogelijkheid om te starten met een kleine hoeveelheid tape-opslagcapaciteit en deze naderhand automatisch additionele ruimte te laten toevoegen wanneer daar behoefte aan is. Dit kan aanzienlijke diskruimte besparen, zonder dat het van invloed is op de diskprestaties. Wanneer er niet voor deze optie wordt gekozen, dan alloceert VTL voor elke virtuele tape alle beschikbare ruimte van de geëmuleerde tape. Bij gebruik van Single Instance Repository (SIR) wordt door FalconStor de optie van Tape Capacity On Demand aanbevolen. Tevens kan de initiële, maximale, en incrementele grootte van de virtuele tape worden gespecificeerd. Daarna worden de virtuele tapes met behulp van de wizard gecreëerd. In de instelling ‘custom’ geven gebruikers aan welke fysieke tape devices zij willen gebruiken en hoeveel ruimte op ieder device. De instelling ‘Express’ creëert automatisch de opslagbron op basis van de beschikbare devices. Vervolgens kun-
Global de-duplication
Linux OS VTL Virtual Appliance
VMDK WAN Datacenter
VMware ESX server iSCSI
Tape library
Back-up servers De-duplication and compressionn without impacting back-up window
Figuur 2: VTL Virtual Appliance oplossing (bron FalconStor)
Direct tape export
nen de gebruikers specificeren welk fysiek device wordt gebruikt voor de creatie van de virtuele tapes. Bij ‘Auto Archive’ worden de overeenkomstige fysieke tapes geselecteerd en bij ‘Auto Replication’ wordt de target server geselecteerd.
Encryptie en compressie Gebruikers kunnen gebruikmaken van opties voor encryptie en/of compressie. Voor elk van deze opties is wel een aparte licentiecode nodig. De optionele dataencryptie is gebaseerd op AES. De mate van diskcompressie varieert en is zoals gewoonlijk afhankelijk van het type te comprimeren data. Bepaalde bestandstypen, zoals onder meer zip, pdf, gif en rar, zijn al gecomprimeerd en bij deze files vindt natuurlijk geen compressiewinst te behalen. FalconStor geeft een haalbare compressiefactor op van 2:1. VTL ondersteunt hard- en softwarecompressie. De hardware wordt ondersteund door middel van een Network StorCompress Host Bus Adapter. De software gebruikt een LempelZiv-Oberhumer (LZO) algoritme die op de VTL-server draait. Bij compressie door de back-upapplicatie kan compressie door VTL niet worden gebruikt. Na de configuratie van de virtuele tape libraries, tapes en fysieke libraries/drives kunnen SAN clients worden toegevoegd. VTL ondersteunt drie type clients: Fibre
Figuur 4: De Virtual Drive Library Wizard
Figuur 5: De FalconStor VTL Console
Channel, iSCSI en SCSI. SAN clients kunnen op twee manieren aan een virtuele tape library worden toegevoegd, via Open Access of Secured Access. Bij Open Access wordt toegang uitsluitend via zoning geregeld. Secured Access voegt SAN clients toe via specifieke FC clients die een specifieke back-upserver vertegenwoordigen.
CDP Virtual Appliance for VMware Continuous Data Protection (CDP) Virtual Appliance is een op disk gebaseerde oplossing voor dataprotectie die volledig met de ESX-server is geïntegreerd. CDP biedt continue en periodieke protectie van fysieke servers en VM disks via mirroring, snapshot en met behulp van database agents. FalconStor DiskSafe draait
shots kunnen direct worden gemount met Raw Disk Mapping (RDM) voor backup, testen of direct herstel van bestanden, folders, volumes of complete VMs. Naast de bescherming van locale fysieke sites en virtuele servers, biedt CDP dataprotectie voor remote sites via remote replicatie. Als een locale site uitvalt, dan is de data daarmee vanaf een CDP Virtual Appliance remote site in een ESX-Server te laden. Hierna kunnen diensten direct worden gestart. De hoeveelheid netwerkverkeer wordt door FalconStor’s MicroScan technologie geminimaliseerd door te transporteren data block vooraf te analyseren. Hierdoor hoeven alleen veranderde sectoren binnen een disk block te worden verstuurd.
ENCRYPTIE EN COMPRESSIE ZIJN TOEGEVOEGDE OPTIES
op de applicatieserver en houdt de veranderingen op block-niveau bij van zowel systeem- als datadisks. Het spiegelt in realtime de data naar de CDP Virtual Appliance en neemt op gezette tijden snapshots. CDP gebruikt op disk dataprotectie die de problemen oplost zoals die zich voordoen met de traditionele dagelijkse tape back-up en op tape gebaseerde herstelmethoden. Bij uitval van de locale site, kan het systeem namelijk onmiddellijk van de remote site worden hersteld waarbij geen tijdrovende Virtual Machine Disk (VMDK)-conversie nodig is. Gespiegelde disks op de CDP Virtual Appliance kunnen direct via iSCSI op de virtual machine worden geladen. CDP ondersteunt 16 host-verbindingen, beschermd maximaal 128 host LUNs, 255 delta TimeMark snapshots per host-LUN met 100 procent gegarandeerde transactionele integriteit, het iSCSI-protocol en de integratie met een Hypertrac Backup Accelerator. Replicatie is optioneel. Snap-
Datareplicatie Replicatie beschermt de informatie op een virtuele tape door een kopie daarvan op dezelfde of op andere servers te bewaren. Op van te voren instelde tijden, wanneer een tape niet in gebruik is, wordt veranderde data van de primaire virtuele tape naar de replicabron op de target VTLserver verzonden. De target VTL-server bevindt zich meestal op een remote locatie. Onder normale omstandigheden hebben back-upclients geen toegang tot de replicabron, de remote server. Alleen in geval van een catastrofe kan de systeembeheerder de replicabron als primaire virtuele tape promoveren. VTL ondersteunt twee soorten replicatie, remote en lokaal. Beide kunnen met opties voor compressie en/of encryptie worden uitgebreid. Replicatie tussen SIR-clusters is via Fibre Channel of iSCSI mogelijk. Elke cluster kan één, twee, of vier SIR-nodes bevatten, waarbij replicatie in een one-to-one of in een many-to-one configuratie mogelijk is.
STORAGE MAGAZINE · 1 · FEBRUARI 2008
Figuur 3: Onder VMware geïnstalleerde VTL en CDP Appliances
55
56 STORAGE MAGAZINE · 1 · FEBRUARI 2008
De SIR data de-duplicatie oplossing biedt een naadloze integratie met VTL om de opslag van redundante data te voorkomen, zonder dat dit invloed heeft op de back-upwindow. Volgens FalconStor kan daarmee een 30:1 reductie van back-up data worden gehaald. Het de-duplicationproces scant virtual tape cartridges, analyseert de data en bepaalt vervolgens welke data uniek is of al eerder naar de SIR repository is geschreven. Op die manier wordt alleen unieke data opgeslagen. De originele virtual tape wordt vervangen door een virtual index tape (VIT) die pointers bevat naar het SIR-opslagsysteem waardoor aanzienlijke opslagruimte kan worden bespaard. De SIR-server is een aparte appliance die direct met de VTL is verbonden en kan als single node of multi-node cluster, dus twee of vier actieve SIR-servers, fungeren. De VTL/SIR-oplossing bevat een mirroringfaciliteit voor protectie tegen uitval van het locale opslagsysteem. Daarnaast wordt replicatie ondersteund waarbij de verbonden SIR ook de repository en metadata repliceert. In feite wordt hierdoor globale data de-duplicatie ondersteund.
TESTVERSIE De VTL Virtual Appliance for VMware Infrastructure valt voor geïnteresseerden te testen. De software is gratis te downloaden via de website: http://www.falconstor.com/en/forms/?pn=CDPforVMwareTrial
Automated Tape Caching De Automated Tape Caching optie fungeert als cache voor de fysieke tape library waarmee het een transparante toegang tot data biedt, ongeacht de locatie. Daarmee lijken tape zich altijd binnen een virtual library te bevinden en is altijd zichtbaar voor de back-upapplicatie, ongeacht of de data zich nu wel of niet op disk of tape bevindt. Op basis van policies is automatisch te laten signaleren wan-
neer data naar fysieke tape moet worden gemigreerd, op basis van bijvoorbeeld het aantal dagen dat de data op disk is opgeslagen of de hoeveelheid gebruikte diskruimte. Daarbij kan ook worden aangegeven dat de gebruikte diskruimte van de gemigreerde data van de disk kan worden verwijderd. Automated Tape Caching is alleen te gebruiken als niet van Auto Archive/Replication op de VTL wordt toegepast.
Failover
ZOWEL DATA ALS COMPLETE SYSTEMEN KUNNEN WORDEN BESCHERMD
VTL Failover biedt een HA-oplossing voor het totale opslagnetwerk dat beschermt tegen uitval van een storage device data path en VTL-servers. Voor de failoveroplossing zijn twee, onafhankelijk van elkaar draaiende, VTL-servers nodig. De primaire VTL-server wordt bewaakt door
P2V Instant recovery
V2V Instant recovery
CDP Provide System & Data from DiskSafe Mirror via Raw Disk Mapping
APP
OS
APP
OS
VMDK
OS
VMDK
CDP Virtual appliance
VMware Converter
RDM
Virtual machine Virtual machine VMDK
VMware ESX server
Serverless back-up via HyperTrac HyperTrac
12:00
10:00
VMware ESX server
11:00
DiskSafe DB agent
12:00
12:00 Back-up
VTL/Tape library
Back-up server Gigabit switch
Mirror path
Recovery path
DiskSafe + DB agent
Figuur 6: De CDP-oplossing voor VMware op een locale site (bron FalconStor)
Local disk
Mirror disk
Snapshot disk
Direct access to both virtual and physical tapes Back-up server VTL appliance
Physical library
Policy based migration to phisical tapes Virtual
Virtual
Physical
Tapes
Tape Stubs
Tapes
Figuur 7: Automated Tape Caching (bron FalconStor)
de secondaire en vice versa. De termen ‘primair’ en ‘secondair’ zijn puur vanuit het gezichtspunt van de client, aangezien beide servers zodanig zijn geconfigureerd dat ze elkaar bewaken. Dit staat bekend als ‘mutual’ of ‘active-active’ failover. Elke server gedraagt zich daarbij als een primaire server voor haar eigen clients en de secondaire server voor de andere clients. Elke server bedient zijn eigen clients, alleen ingeval van uitval worden deze door de andere server overgenomen. Een serveruitval kan optreden als gevolg van een storage device path fout door kabelproblemen of uitval van een switch of router. Door een redundant toegangspad te creëren, kan dit risico aanmerkelijk worden verminderd. VTL detecteert automatisch of er een alternatief pad bestaat, ingeval er een uitvalt, schakelt VTL automatisch op de andere over. De optie VTL Failover biedt daarmee een hoge beschikbaarheid voor VTL-operaties door de downtime te elimineren ingeval een VTLserver, als gevolg van het falen van hardware of software, uitvalt. De door FalconStor gehanteerde term ‘eliminatie van downtime’ is ietwat overtrokken want bij een failover en recovery-operatie treedt er altijd nog een drie minuten durende, voor gebruikers merkbare, vertraging op. Afhankelijk van de toegepaste back-upapplicatie moeten gebruikers na de failover/ failback nog bepaalde acties onderne-
men. Dit varieert per toegepaste backupapplicatie, zoals BakBone NetVault, CommVault Galaxy, CA ARCserver, HP OpenView Storage Data Protector, IBM Tivoli Storage Manager en LEGATO Networker. Bij Veritas BackupExec en Veritas NetBackup, kan dit bijvoorbeeld de herstart van de back-upserver betekenen, het opnieuw opstarten van jobs, het handmatig mounten van tapes en een herstart van de tape engine of de back-upservices.
FalconStor’s CDP Virtual Appliance voor VMware is, voor gebruikers uit het MKB, een bruikbaar en gedegen op disk gebaseerd product voor dataprotectie. Maar het is niet voor iedere omgeving de beste keus. Gebruikers die storage array’s moeten beveiligen, of meer dan zestien hosts hebben, kunnen beter uitkijken naar FalconStor’s grotere broer IPStor. Omdat de CDP-technologie I/O-intensief is, moeten de servers genoeg geheugencapaciteit en I/O-bandbreedte bezitten om deze technologie in een virtuele VMware-omgeving te kunnen toepassen. Ondanks de beperkingen zijn de geboden voordelen van de Virtual Appliance aanmerkelijk. Gebruikers uit het MKB kunnen niet alleen hun data afdoende beschermen, maar ook complete, zowel fysieke als virtuele, systemen. In geval van een catastrofe zijn diensten en de zakelijke continuïteit in een tijdsbestek van vijf tot tien minuten te herstellen. Zo is een bestand of database in één, een VM in twee, mailbox in drie, SAN storage en fysieke servers in vijf en services van een DR-site in dertig minuten te herstellen. Ten slotte een indicatie van de prijzen van de appliance kits. Voor de virtual appliances is enkel de software nodig die 8.000 dollar kost. Voor het repliceren tussen verschillende sites is echter een replication-optie noodzakelijk. Deze optie kost 1.000 dollar. De CDP-VA en VTR-VA kosten allebei 8.000 dollar. I
BRAM DONS IS ONAFHANKELIJK IT-ANALIST;
[email protected]
(Advertentie)
STORAGE MAGAZINE · 1 · FEBRUARI 2008
Conclusies
57