VSPHERE: HOE IS UW DISASTER RECOVERY GEREGELD?
VIKTOR VAN DEN BERG SENIOR CONSULTANT, PQR
EVEN VOORSTELLEN... Viktor van den Berg • Senior Consultant @ PQR • Voormalig Dutch VMUG Leader • Blogger via www.viktorious.nl • TwiJer @viktoriousss PQR • System Integrator • VMware Premier Partner – – – – – –
Business ConLnuity Cloud IaaS Desktop VirtualizaLon Infrastructure VirtualizaLon Management VirtualizaLon of Business CriLcal ApplicaLons
• www.pqr.com
AGENDA vSphere -‐ Hoe is uw Disaster Recovery geregeld? • BC – Een stappenplan • DR: Stretched Cluster & Site Recovery Manager – vSphere Metro Storage Cluster nader bekeken – VMware Site Recovery Manager nader bekeken • Disaster Recovery: vMSC of SRM…wat kies jij? • Vragen?
AGENDA
BUSINESS CONTINUITY EN DISASTER RECOVERY • Business ConLnuity: Business Con*nuity beschrij2 het geheel aan processen en procedures die binnen een organisa*e ingezet kunnen worden wanneer een (grote) calamiteit uitbreekt. • Disaster Recovery: De vereiste stappen die ten *jde van een (grote) calamiteit worden ondernomen zodat resources, personeel & business processen binnen de daarvoor gestelde *jd de normale opera*e kunnen hervaCen. • IT ondersteunt de organisaLe en is belangrijk onderdeel van BC/DR!
WAT ZIJN JULLIE BC/DR PLANNEN? • Geen uitwijk, geen plannen; • Geen uitwijk, maar wel plannen; • Uitwijk: HandmaLg; • Uitwijk: Stretched Cluster; • Uitwijk: Site Recovery Manager.
VSPHERE: HOE IS UW DISASTER RECOVERY GEREGELD?
BUSINESS CONTINUITY – EEN STAPPENPLAN
Business ConLnuity
Business ConInuity Policy
Business Impact Analyse
Recovery Strategie
Ontwerp en implemenaIe DR plan
Testen van het plan
Onderhoud het DR plan
BUSINESS CONTINUITY 1. Business ConLnuity Policy • Welke eisen stelt de organisaLe aan BC? • Welke regelgeving is van belang? 2. Business Impact Analyse • Inventariseer kriLsche processen daarbijhorende IT services • Bescherming tegen welke calamiteit? • Bepaal RPO en RTO
BUSINESS CONTINUITY
BUSINESS CONTINUITY 1. Business ConLnuity Policy • Welke eisen stelt de organisaLe aan BC? • Welke regelgeving is van belang? 2. Business Impact Analyse • Inventariseer kriLsche processen en IT services • Bescherming tegen welke calamiteit? • Bepaal RPO en RTO
BUSINESS CONTINUITY 1. Business ConLnuity Policy • Welke eisen stelt de organisaLe aan BC? • Welke regelgeving is van belang? 2. Business Impact Analyse • Inventariseer kriLsche processen en IT services • Bescherming tegen welke calamiteit? • Bepaal RPO en RTO
BUSINESS CONTINUITY 3. Recovery Strategie • Wat voor een uitwijklokaLe kies je? • Op welke manier maak je data en applicaLes beschikbaar? 4. Ontwerp een DR plan als onderdeel van je BC strategie • Definieer duidelijke stappen voor organisaLe & IT • Definieer duidelijke rollen
BUSINESS CONTINUITY 5. Test het DR plan! • Leg de resultaten vast • …en verbeter het plan waar nodig 6. Onderhoud het DR plan • Wijzigingen in de organisaLe kunnen leiden tot wijzigingen in het plan.
Business ConLnuity
Business ConInuity Policy
Business Impact Analyse
Recovery Strategie
Ontwerp een DR plan
Test uitwijk
Onderhoud BCP
VSPHERE: HOE IS UW DISASTER RECOVERY GEREGELD?
STRETCHED CLUSTER & SITE RECOVERY MANAGER
TWIN DATACENTER Datacenter A
Datacenter B
Disaster Avoidance & Recovery met meerdere sites: • vSphere Metro Storage Cluster (vMSC) • VMware Site Recovery Manager • Andere oplossing
VMSC VERSUS SRM Datacenter A
Datacenter B
vSphere Metro Storage Cluster • Lokaal data center over 2 lokaLes • Cross-‐site automaLc load balancing • Disaster Avoidance/Recovery
Datacenter A
Datacenter B
Site Recovery Manager • Twee gescheiden datacenter • Disaster Avoidance/Recovery
VMSC O.B.V. NETAPP FABRIC METROCLUSTER
* Figuur uit de VMware whitepaper: VMware vSphere Metro Storage Cluster Case Study
VMSC O.B.V. NETAPP FABRIC METROCLUSTER Enkele kenmerken • Uniform configuraLon • Een volume is acLef gekoppeld aan één controller • Streched (storage) LAN met minimale latency – vMoLon – Storage Let op de vSphere CompaLbility Guide!
VMSC – COMPATIBILITY GUIDE VMware CompaLbility Guide • FC, iSCSI of NFS Metro Cluster Storage • Ondersteund wordt: – EMC vPlex (let op FC komt 2x voor!) – Fujitsu – HDS VSP – HP LenHand / LenHand Networks – IBM N-‐Series – NetApp
hMp://www.vmware.com/resources/compaIbility/search.php?deviceCategory=san
VMSC ARCHITECTUUR -‐ VSPHERE HA HA regelt het “stappenplan” in het geval van een disaster, dit is een automaLsche akLe. • Uitval van een volledige site – Stel de admission control policy correct in – Opstart volgorde wordt bepaald door de restart priority binnen HA • Datacenter parLLe – Das.isolaLonaddress – Heartbeat datastores vSpher • Uitval van storage e 5 Upd ate 1 – All Paths Down (APD) vSpher e 5.1 – Permanent Device Loss (PDL)
VMSC – ARCHITECTUUR: VSPHERE HA All Paths Down (APD) vSphe re 5 U • Tijdelijk of voor alLjd? pdate vSphe 1 re 5.1 • I/O’s blijven in de wacht • Kan de hostd service doen bevriezen • Misc.APDHandlingEnable = 1 • Misc.APDTimeout = 140 Permanent Device Loss (PDL) • Device komt niet meer terug • HA moet in akLe komen: – Disk.terminateVMonPDLdefault = True – Das.maskCleanShutdownEnabled = True
VMSC ARCHITECTUUR -‐ DRS VMware Distributed Resource Scheduler • Verdeelt de load over de ESXi hosts • Gebruikt vMoLon Aanvullende eisen m.b.t. DRS • Site Affinity implementeren – Gebruik “should rules”! • Nieuwe VM? Toevoegen aan een site! Storage DRS Binnen vMSC?
VMSC – HA IN ACTIE
VSPHERE: HOE IS UW DISASTER RECOVERY GEREGELD?
SRM NADER BEKEKEN
VMWARE SRM Site A (Primary) VMware vCenter Server
Site Recovery Manager
VMware vSphere
Servers
Site B (Recovery) VMware vCenter Server
Site Recovery Manager
VMware vSphere
Servers
VMware Site Recovery Manager • vSphere Add On • Array Based ReplicaLe • vSphere ReplicaLe • GeautomaLseerd runbook • GeautomaLseerd testen (non-‐disrupLve) • GeautomaLseerde failover • GeautomaLseerde failback
VMWARE SRM – MOGELIJKE SCENARIO’S Active-Passive Production
Active-Active
Traditioneel scenario Dedicated resources
Shared
Production
Production
Recovery
Bi-Directional
Recovery
Gebruik uitwijk voor OTA
Production
Productie op beide lokaties Elkaars recovery
Veel naar één RoBo / DRaaS
VMWARE SRM -‐ REPLICATIE
vCenter Server
Site Recovery Manager
Replicatie is de basis van SRM! vSphere
Storage
vSphere Replication • Onderdeel van SRM • Replicatie op VM niveau Storage Array-Based Replication (third party) • Replicatie wordt door storage geregeld • Replicatie is op LUN niveau • SRA wordt geleverd door vendor
REPLICATIE OPTIES TijdsIp
vSphere ReplicaIon
Array Based ReplicaIon
ReplicaLe Provider
VMware
Storage Vendor
Kosten
‘GraLs’ bij SRM
ReplicaLe licenLe
Wat?
Per VM
Per LUN
Wie?
vSphere Admin
Storage Admin
Performance
15 min RPO, max 500 VMs
Synchroon, grote volumes
Beperkingen
Geen fysieke servers / RDMs, geen FT, geen linked clones, geen automaLsche fallback
Wel fysieke servers / RDMs, wel FT, wel linked clones, wel automaLsche fallback
VMWARE SRM -‐ ARCHITECTUUR Protected Site
Recovery Site
vSphere Client
vSphere Client
SRM Plug-‐In
SRM Plug-‐In
vCenter Server
SRM Server
vCenter Server
SRM Server
SRA
SRA ESX
ESX
ESX
ReplicaLon Sonware VMFS
VMFS
Storage
ESX
ESX ReplicaLon Sonware
ReplicaIon VMFS
VMFS
Storage
VMWARE SRM -‐ CONFIGURATIE Te configureren onderdelen: • Twee vCenter Servers • Twee SRM Servers • ConfiguraLe SRA • Inventory mappings • ProtecLon Groups • Runbook
VMWARE SRM -‐ RUNBOOK
VMWARE SRM – MOGELIJKE AKTIES Failover test DR/Planned MigraLon
Isolated Test Network
Replication Storage Array Replication
Replication
VMWARE SRM – MOGELIJKE AKTIES Reprotect Recovery Site
Protected Site
Replication
VMWARE SRM -‐ AUDIT § § § §
Duidelijk vast gelegd proces Status van de stappen Failover test resultaat wordt vast gelegd Recovery resultaat wordt vast gelegd
VSPHERE: HOE IS UW DISASTER RESCOVERY GEREGELD?
DISASTER RECOVERY: VMSC OF SRM…WAT KIES JIJ?
SAMENVATTING Wat is aan bod gekomen… • BC – Een stappenplan • DR: Stretched Cluster & Site Recovery Manager – vSphere Metro Storage Cluster nader bekeken – VMware Site Recovery Manager nader bekeken Disaster Recovery: vMSC of SRM…wat kies jij?
TWIN DATACENTER De twee oplossingen vergeleken: • Focus vSphere Metro Storage Cluster (vMSC): – Verbeterde beschikbaarheid o.b.v. HA/DRS – Naadloze Disaster Avoidance – Service en data mobility – Geen extra vSphere licenLe, wel storage licenLe • Focus Site Recovery Manager – Verbeterde beschikbaarheid o.b.v. SRM – Herhaalbare, gecontroleerde Disaster Recovery – Test disaster recovery – SRM LicenLe, replicaLe licenLes
VMSC VERSUS TijdsIp
vSphere Metro Storage Cluster Site Recovery Manager
Disaster Avoidance
75%
50%
Site Balancing
100%
25%
25-‐50%
100%
75%
50%
Disaster Recovery Resource Usage
MEER INFORMATIE... Interessante whitepapers: • VMware vSphere Metro Storage Cluster Case Study • Stretched Clusters and VMware vCenter Site Recovery Manager • What’s New in VMware vSphere®5.1 – Storage De informaLe staat a.s. maandag op mijn blog • hJp://www.viktorious.nl
VSPHERE: HOE IS UW DISASTER RECOVERY GEREGELD?
VRAGEN?
[email protected] / @VIKTORIOUSSS / VIKTORIOUS.NL