Virtualisatie DOOR Bram Dons
vAppHA brengt high availability naar virtualisatie
Neverfail fixt het falen van vSphere 32 STORAGE MAGAZINE · 4 · december 2010
Hoewel virtualisatie inmiddels algemeen toepassing vindt, kan het wel even duren voordat je een bedrijf vindt dat ook zijn kritieke applicaties in de virtuele omgeving heeft draaien. Wie dat durft is echt een stoere jongen, want wat stabiliteit en doorlopende beschikbaarheid betreft laat virtualisatie nogal eens te wensen over. Het bedrijf Neverfail belooft nu high availability voor VMwareomgevingen met zijn nieuwe product vAppHA. Zijn daarmee echt alle zwakheden verholpen?
van Microsoft, zoals Exchange en SQL Server, meestal nog op een fysiek platform geïnstalleerd staan. Waarom is dat zo, welke zaken spelen daarbij een rol en welke eisen stellen gebruikers voordat ze bereid zijn om missiekritieke applicaties naar een virtuele VMwareomgeving over te zetten? De firma Neverfail denkt met zijn product Neverfail vAppHA een bijdrage te kunnen leveren aan continuous availability in een enterpriseomgeving. In het vervolg van dit artikel zien we op welke manier dit product aan deze eisen zou kunnen voldoen.
Continuïteit
De meeste IT-beheerders beginnen hun ontwikkeling tot storageprofessional met de invoering van serverconsolidatie, waarbij ze niet-kritieke applicaties van standalone- naar gevirtualiseerde servers overzetten. Naarmate hun ervaring en vertrouwen toenemen, overwegen gebruikers om de geavanceerde virtualisatiefuncties in te schakelen voor de meer kritieke applicaties. In de VMwareomgeving bestaat deze stap uit het gebruik van VMwares opties VMotion, High Availability (HA) en Fault Tolerance (FT). VMwaregebruikers geven immers aan dat nummer
een op de lijst van redenen om vSphere in te zetten, is: ‘de toepassing van virtualisatie om de zakelijke continuïteit te verbeteren’. Hun perceptie is dat vSpheres HA- en FTfeatures eenvoudig zijn te configureren en elke virtuele omgeving out of the box zullen beschermen. Toch is het zo dat veel andere gebruikers nog terughoudend zijn met de virtualisatie van missiekritieke applicaties, want ze maken zich terecht ernstige zorgen over de beschikbaarheid van dit soort applicaties in een enterpriseomgeving. Om die reden blijven bijvoorbeeld de tier 1-applicaties
IT-ondernemingen gaan vaak uit winkelen
De afgelopen jaren is er een reeks van producten ontwikkeld om de beschikbaarheid van applicaties te verbeteren. De behoefte om applicaties na een probleem zo snel mogelijk weer online te brengen bestond altijd al, maar onze 24 uurseconomie dwingt leveranciers nu om applicaties continu beschikbaar te houden: continuous availability. Recente ontwikkelingen als replicatie, clustering, deduplicatie enzovoort maken het mogelijk om over te gaan van een conventionele datagecentreerde naar een businessgecentreerde recoveryoplossing (zie figuur 1). De datagecentreerde oplossingen, in deze categorie, bijvoorbeeld voor back-up-en-restore en disaster recovery, vallen ergens binnen het bereik van de traditionele data to tape (D2T) tot en met de modernere continuous data protection (CDP) en disk-to-disk disaster recovery (D2D). Echter, dit soort oplossingen houdt zich uitsluitend bezig met het herstel van data. Er bestaat geen enkele binding met de
vAppHA controleert of
Figuur 1: De evolutie van continuous availability (bron: Neverfail)
applicatie om voor elkaar te krijgen dat deze weer zo snel mogelijk online komt. De meeste clusteroplossingen, of ze nu active-passive, active-active of multinode zijn, bieden een voorziening voor fault tolerance en high availability. Deze zorgt ervoor dat resources waarvan de applicatie afhankelijk is, weer beschikbaar komen als een van de hardwarecomponenten toch uitvalt. De meeste clusteroplossingen kennen echter een aantal beperkingen, waarvan het gebruik van een shared storage architecture niet de minste is (zie verder). Want als de shared storage uitvalt, dan is er geen enkele clusternode die de applicatie weer online kan brengen. In het klimaat van de hedendaagse hoogcompetitieve zakelijke omgeving kunnen de traditionele data- of op beschikbaarheid gecentreerde oplossingen niet voldoen aan de nog altijd toenemende RTO- en RPO-eisen, afgezien nog van de regelgeving en wettelijke bepalingen hieromtrent. Kortom: continuous availability moet de downtime voor de gebruikers en de zakelijke processen volledig kunnen elimineren.
Protectieniveaus VMware is de afgelopen jaren doorlopend bezig geweest om de continuous availability van VM’s en de daarbinnen draaiende applicaties te verbeteren. Met de komst van de laatste versie ondersteunt het vSphereplatform de beschikbaarheid van VM’s met een drietal kerninfrastructurele voorzieningen, die de serviceniveaus van applicaties enorm hebben verbeterd. Allereerst was er VMotion, waarmee de livemigratie van actieve VM’s tussen fysieke ESX-hosts mogelijk werd. Vervolgens zagen we de introductie van HA, dat de applicaties tegen de uitval van de hosthardware en tegen het crashen van het OS beschermde door de getroffen VM’s naar
een andere host over te zetten. Als laatste werd FT toegevoegd, dat voorziet in een fouttolerante lockstepoplossing voor VM’s die op gescheiden hostservers draaien. De afgelopen jaren zijn er veel vorderingen gemaakt bij de virtualisatie van tier 2- en 3-applicaties. Toch blijft men veel kritieke applicaties nog toepassen op traditionele fysieke platforms, ondanks de hogere kosten en complexiteit die dat met zich meebrengt. Ondervraagde gebruikers geven als belangrijkste reden voor het niet overzetten: het gebrek aan een algehele bescherming voor tier 1-applicaties binnen een virtuele vSphereomgeving, met name het gebrek aan application awareness.
Waarom falen applicaties? Voordat we nader ingaan op het gebruik van vAppHA ter verbetering van de applicatiebeschikbaarheid, is het nuttig om je af te vragen waarom applicaties eigenlijk uitvallen. Talrijke onderzoeken tonen steeds weer aan dat een aantal zaken verantwoordelijk zijn voor de uitval of vertraging van de applicatielaag: de applicatiesoftware
kan een bepaalde service laten crashen, programthreads kunnen de prestaties doen afnemen en fouten van beheerders kunnen het gehele systeem doen uitvallen. Het is duidelijk dat de bewaking en de bescherming van services op de applicatielaag de hoogste prioriteit moeten hebben bij de keuze van een availabilityoptie om de kritieke tier 1-applicaties te beschermen.
vAppHA Het Application Management Framework (AMF) van Neverfail, dat al langer op de markt is, biedt een rijke verzameling aan beheertools voor applicatiemonitoring en availability. Dit trok destijds de aandacht van VMware, dat een dergelijke beheeromgeving voor vCenter Server niet bezat. We zien overigens steeds vaker dat IT-ondernemingen niet meer de moeite nemen of de tijd hebben om bepaalde technologieën nog zelf te ontwikkelen, en daarom maar gaan winkelen. VMware verkreeg een licentie om Neverfail te gebruiken ter verbetering van zijn eigen product vCenter Server Heartbeat.
(Advertentie)
STORAGE MAGAZINE · 4 · november 2010
vSphere zijn werk doet
33
Onderbroken service wordt meteen weer opgestart
Figuur 2: De vAppHA Management Client
34 STORAGE MAGAZINE · 4 · december 2010
AMF biedt immers een verzameling algemene tools waarmee het gehele applicatiesysteem is te bewaken om te garanderen dat applicaties blijven werken binnen het bereik van een aanvaardbare responstijd en resourceconsumptie. AMF kent ook een aantal applicatiespecifieke plug-ins voor tier 1-toepassingen, ze bevatten speciale voorgeconfigureerde regels om de beschikbaarheid van de kritieke applicaties te beheren. Deze regels omschrijven de programma- en dataconfiguraties die nodig zijn voor het bewaken van de applicaties en geven de verzekering dat het uitgebreide ecosysteem in een gezonde staat verkeert. Gebruikers- of legacyapplicaties kunnen ook worden beheerd met een simpele, binnen AMF eenvoudig te gebruiken GUI. AMF kent zelf twee fundamentele componenten: rule definition en self-tuning. De rule definition bepaalt wanneer er automatisch correctieve acties geïnitieerd moeten worden; wanneer het gehele ecosysteem gezond of ongezond is; en welke prestatieniveaus gewenst, toegestaan of ontoelaatbaar zijn. Daarnaast bewaakt dit component de status van specifieke applicaties om de oorzaak van een probleem te kunnen identificeren. De geïnstalleerde plugins hebben als doel om specifieke applicaties te ondersteunen en bevatten daarvoor alle benodigde onderdelen. Ze dienen om
applicaties te starten en te stoppen, te bewaken en te voorzien van allerlei noodzakelijke rules, zodat men er zeker van kan zijn dat een applicatie voor gebruikers beschikbaar blijft wanneer zich een probleem voordoet. De applicatieplug-ins bevatten vooraf gedefinieerde regels die de gebruiker zelf nog kan uitbreiden. Self-tuning detecteert nieuwe services automatisch en configureert de bescherming ervan in real time, zonder tussenkomst van de beheerder. Al deze voorzieningen van AMF hebben zich in de praktijk bewezen bij van vele duizenden Neverfailgebruikers die dit product inzetten ter bescherming van hun tier 1-applicaties. Het was dan ook logisch dat beheerders van virtuele omgevingen uitkeken naar de komst van dergelijke applicatiebescherming voor het vSphereplatform.
Partnerschap Neverfail sloot vorig jaar een partnerschap met VMware om Neverfails technologie te gaan toepassen voor het beheer en de bewaking van de failovervoorziening in vCenter Server. Daartoe heeft Neverfail zijn AMF-framework en -plug-ins in de vSphereomgeving geïntegreerd en het product vAppHA genoemd. Doel is om de bestaande availabilityvoorzieningen van vSphere, waaronder HA, FT en VMotion, te complementeren met een applicatiebe-
Plug-ins houden specifieke applicaties in de lucht
wuste voorziening voor de bescherming van kritieke tier 1-applicaties. vAppHA werkt samen met vSphere om, bij detectie van een uitval of applicatiefout, de betreffende applicatieservices over te zetten naar andere servers en daarmee te voorkomen dat de gehele applicatie uitvalt.
Werking vAppHA met vSphere Binnen een vSphere-HA-FT-cluster wordt vAppHA toegepast als een verzameling services binnen actieve VM guests, het maakt zo onderdeel uit van een kritieke applicatie. Daarin vervult vAppHA drie taken: de controle van de HA-FT-configuratie, de bewaking van het applicatie-ecosysteem en het herstel van een applicatieservice. In een dergelijke geïntegreerde beschikbaarheidoplossing is vSphere verantwoordelijk voor de bescherming van de serverhardware tegen uitval. Om er zeker van te zijn dat deze voorziening ook werkt, moet vAppHA controleren of HA of FT is geconfigureerd ter bescherming van de VM’s. Dit gebeurt via API calls naar vCenter Server. Detecteert vAppHA een inconsistentie in de instellingen, dan wordt daarvan melding gemaakt bij de beheerder die erop wordt geattendeerd dat de applicatiebescherming niet meer actief is. Na de configuratie bewaakt vAppHA continu het applicatie-ecosysteem met een combinatie van instrumentatie en realtimetaken, zoals gedefinieerd in de applicatieplug-ins. vAppHA ziet toe op alle zaken met betrekking tot het applicatie-ecosysteem, waaronder de beschikbaarheid van services, inclusief het verbruik van de sys-
Gebruikers kunnen geen regels creëren, wel
STORAGE MAGAZINE · 4 · november 2010
tweaken
Figuur 3: Het venster ‘Configure alerts’
teembronnen per applicatiecomponent, en de timing van de onderlinge communicatie tussen de componenten. Al deze parameters worden continu geëvalueerd en vergeleken met de gedefinieerde drempelwaarden. Bij overschrijving daarvan wordt direct via e-mail of console een herstelwaarschuwing uitgegeven. Wanneer de applicatieservice wordt hersteld, worden de gestelde regels binnen de applicatieplug-in geëvalueerd. In veel gevallen wordt alleen een waarschuwing uitgegeven, bijvoorbeeld wanneer er niet genoeg diskruimte meer is. Spelen er ernstigere zaken, dan kan vAppHA trachten dit binnen de VM te herstellen. Bij uitval van een applicatieservice, bijvoorbeeld, kunnen de regels van de plug-in voorschrijven dat de service automatisch wordt herstart. Wanneer een lokaal herstel veelvuldig of totaal mislukt, dan zal vAppHA de vCenter Server op drie manieren instrueren om de applicatie te herstellen. De eerste methode is het migreren van de guest naar een andere clusterhost met VMotion, de tweede is het herstarten van het OS op de VM guest en de derde is een combinatie van deze twee handelingen. De juiste actie wordt vastgesteld op basis van de precieze foutmodus die vAppHA heeft gedetecteerd; de gebruiker kan dit via de GUI-menuoptie instellen.
Installatie vAppHA vAppHA wordt geïnstalleerd als een VM binnen VMwares vSphere 4.0-omgeving. De clusteromgeving moet bestaan uit minimaal twee ESX 4.0-hostservers die toegang
hebben tot shared storage, bijvoorbeeld iSCSI, en een aparte server waarop VMwares applicatie vCenter Management Server draait. Als guest OS worden aanbevolen Windows Server 2003 en 2008, x86 of x64, in de Standard- of Enterprise-editie met SP1 of SP2. Wie kiest voor Windows Server 2008 moet de R2-variant nemen. Minimaal is 1 GB aan RAM nodig en 2 GB aan diskruimte. Verder vraagt vAppHA om een enkel statisch IP-adres voor het beheer. Voor de evaluatie configureer ik een vSphereomgeving op basis van twee ESX Servers waarop HA en FT zijn geactiveerd. Als shared storage dient een Netgear ReadyNAS 3100-systeem waarop een aantal iSCSI-volumes is gecreëerd. Op de ESX Server komt Windows 2008 x64 Enterprise te staan, uitgerust met SQL Server 2008 R2
x64. De installatie van Neverfail vAppHA begint met het downloaden van de trialversie. Nadat het installatiescherm is getoond, pakt het programma zichzelf automatisch uit. De laatste stap van de installatie is het configureren van de toegang tot vCenter Server en het invoeren van de hostnaam of het IP-adres van VMotion. Vervolgens loggen we via Windows Remote Desktop Connection in op de VM en starten we de Neverfail vAppHA Management Client. Daarna verschijnt het scherm van Management Client, met daarop diverse tabbladen die we in het kort zullen doornemen.
Management Client De tab ‘Applications’ toont de huidige status van de beschermde applicaties; de toepassingen worden vandaaruit gestart,
(Advertentie)
35
Gaarne hier nog een streamer aanleveren
Figuur 4: Het tabblad ‘Event log’
36 STORAGE MAGAZINE · 4 · december 2010
gestopt en geconfigureerd. De lijst ‘Application log’ bevat informatie over het gedrag van alle beschermde applicaties en geeft een overzicht van events als task status changes, rule triggering, task outputs en application warnings. Via een filter kan het aantal getoonde events worden beperkt. Het tabblad ‘Services’ toont de door plugins of door de gebruiker gespecificeerde services, samen met de services die daarvoor benodigd en daarvan afhankelijk zijn. Een service kan de status ‘Running’ of ‘Automatic’ hebben of geregistreerd zijn als ‘Unprotected’. In geval van een event of fout kunnen drie opeenvolgende taken worden toegekend uit de volgende lijst: recover service, log warning, restart application, restart VM en VMotion. Services kunnen worden toegevoegd, verwijderd en in volgorde veranderd. Taken kunnen op het tabblad ‘Tasks’ worden gedefinieerd en geïmplementeerd, zowel via een plug-in als door de gebruiker. Het kunnen ook ingebouwde, door Neverfail vAppHA zelf gedefinieerde taken zijn. Op het tabblad ‘Rules’ kunnen regels worden geactiveerd. Deze rules worden door plug-ins geïmplementeerd en kunnen niet door gebruikers worden gecreëerd. Wel
kunnen de specifieke opties voor elke regel worden ingesteld en kan er worden gekozen voor de uitvoering van bepaalde taken wanneer er een fout optreedt. Via het tabblad ‘Plugins’ kunnen plug-ins ter ondersteuning van specifieke applicaties worden geïnstalleerd. Deze bevatten alle componenten om een bepaalde toepassing te beschermen. Plug-ins dienen om applicaties te starten of stoppen en om ze te monitoren. Tevens bevatten ze alle regels die nodig zijn om te verzekeren dat een applicatie beschikbaar blijft voor gebruikers indien zich een probleem voordoet. Op de tab ‘Event log’ worden voorgedefinieerde alerts weergegeven om de beheerder te waarschuwen via e-mail.
mark Factory van Quest Software (een trialversie is te downloaden vanaf www. questsoftware.nl). Met Remote Desktop Connection log ik in op de VM waarop Windows 2008, SQL Server en Benchmark Factory draaien. Vervolgens gooi ik de service van de SQL Server eruit. Dit wordt onmiddellijk door vAppHA opgepikt; hij start de uitgevallen service gelijk weer op. Na slechts een korte onderbreking zien we dat de SQL Server weer draait. Dezelfde procedure herhaal ik voor de andere services, te weten de browser van SQL Server, de VMwaretools en de remote desktop services. Ook daar worden de uitgevallen services gelijk weer opgestart door vAppHA (zie figuur 4).
Trial
SPOF’s
De trialversie van Neverfail vAppHA bevat slechts enkele services, waaronder SQL Server en zijn browser, de VMwaretools en remote desktop services (zie figuur 2). In de eerste test zien we of vAppHA in staat is om de SQL Server opnieuw op te starten nadat we deze hebben stopgezet via het tabblad ‘Windows services’ van de Windows Server. Om een praktijksituatie na te bootsen draaien we een TPC-C-databasebenchmark met de testapplicatie Bench-
Vaak gaan beheerders ervan uit dat het inschakelen van de VMwareopties VMotion, HA en FT leidt tot een gevirtualiseerde omgeving met een hoge beschikbaarheid. (Zie voor een beschrijving van HA en FT mijn Op zoek naar de heilige graal in Storage Magazine 1-2010.) Na het voorgaande kun je inderdaad de indruk hebben opgedaan dat het gebruik van Neverfail vAppHA in combinatie met voorgenoemde VMwareopties een uptime van zo goed als 100 procent garandeert voor de beschermde kritieke applicaties. Maar niets is minder waar, want VMware kent nog twee serieuze SPOF-plekken binnen de vSphereomgeving. Zo maakt vSpheres clusterfilesystem gebruik van een gedeeld opslagsysteem oftewel shared storage. Een uitval van het
Als het opslagsysteem uitvalt, lopen alle VM’s in de soep
STORAGE MAGAZINE · 4 · november 2010
opslagsysteem leidt ertoe dat alle VM’s die gebruikmaken van VMotion eveneens uitvallen. Naast VMotion maken ook HA en de Distributed Resource Scheduler (DRS) gebruik van shared storage. Een mogelijke oplossing voor dit SPOF-probleem is om het storagesysteem synchroon te spiegelen naar een ander storagesysteem. Dit kan softwarematig of met behulp van een mirroring- of replicatiefunctie direct vanuit het storagesubsysteem. De meeste arrays voor enterprisestorage ondersteunen tegenwoordig wel iets dergelijks.
Wankele servers vSphere speelt een essentiële rol bij het beheer van VMwares virtuele infrastructuur. Talrijke componenten van de virtuele infrastructuur, van VMotion tot en met DRS, zijn afhankelijk van de beschikbaarheid van vCenter. Dit komt omdat op de vCenter Server alle metadata van de VMwareclusteromgeving is opgeslagen in de centrale database. VMotion maakt het weliswaar mogelijk om een VM snel van de ene naar de andere fysieke host over te zetten, er draait nog steeds op elk moment maar één instantiatie van de VM – die als VM-bestand is opgeslagen binnen een shared SAN – en deze vormt per definitie een SPOF. Fouten in de VM kun je daarom ook niet oplossen door hem met VMotion te moven naar een andere ESX Server. Ook het centrale beheer, de bewaking en de beveiliging op hogere niveaus zijn afhankelijk van de beschikbaarheid van vCenter. Zodoende vormt vSphere hét centrale besturingspunt binnen VMwares infrastructuur en introduceert daarmee een SPOF. Het is dus zaak om vSphere continu beschikbaar te houden en te beschermen tegen uitval van de server- en netwerkhardware, -applicaties en -data. De beschikbaarheid van vSphere heeft dan ook de hoogste prioriteit als je te allen tijden de maximale RoI wil halen op je virtuele infrastructuur. Naast andere clusteroplossingen heeft Neverfail het softwareproduct Neverfail for VMware vCenter ontwikkeld, dat thans via VMware leverbaar is in VMwares vCenter Server Heartbeat. Dit programma biedt een oplossing voor de continue beschikbaarheid van de op vCenter gebaseerde virtuele infrastructuur (zie ook mijn Hartmonitor voor virtuele omgevingen in LAN Magazine 8-2009).
Epiloog Menig beheerder die zich met virtualisatie bezighoudt, zal zich wel eens afvragen: ‘Houdt het dan nooit een keer op?’ We dachten met virtualisatie alle problemen in
37
Figuur 5: VMware vCenter Server Heartbeat (bron: VMware)
IT-land in één keer te hebben opgelost: flexibiliteit, complexiteit, beveiliging, beschikbaarheid, beheerbaarheid en kostenbesparing. Helaas, met virtualisatie zijn er weer allerlei nieuwe problemen geïntroduceerd, die aan de ontwikkelaars vooraf niet bekend waren. In andere gevallen zijn de risico’s die virtualisatie met zich meebrengt, te laag ingeschat. Nu zien we plotsklaps dat de nieuwe techniek wel degelijk een negatieve invloed kan hebben op de beschikbaarheid van applicaties. Dat is ook niet zo verwonderlijk als we alleen al kijken naar de talrijke producten die dienen ter aanvulling of verbetering van de gevirtualiseerde omgeving. Het is duidelijk dat de virtuele architectuur nog lang niet perfect is. De vraag is wanneer virtualisatie een volwassen applicatieomgeving wordt, die geschikt is voor de enterprisemarkt. Een product als vAppHA maakt gebruikers in ieder geval bewust van de risico’s. Tegelijkertijd kan het een eerste aanzet zijn om
tier 1-applicaties voorzichtig te gaan toepassen in de gevirtualiseerde enterpriseomgeving. Op het beveiligingsgebied is er in ieder geval wel goed nieuws: VMware heeft zojuist bekendgemaakt dat vSphere 4.0 de certificeringniveau van EAL4+ heeft ontvangen volgens de Common Criteria (zie www.commoncriteriaportal.org). p
Bram Dons is onafhankelijk IT-analist bij IT-Trendwatch (
[email protected])