Disaster Recovery ve virtuálním prostředí a napříč technologiemi Petr Hanzlík
[email protected]
Disaster Recovery napříč technologiemi
Disaster Recovery – základní popis Co je důležité nezanedbat pro hladký proces Disaster Recovery Disaster Recovery ve „fyzickém“ a virtuálním prostředí Jak řeší Disaster Recovery jednotliví technologičtí výrobci
Disaster Recovery – základní popis
Data protection Popis Disaster Recovery a popis typových řešení Backup T-0 Days
Outage T-1 Hrs
Mins
Secs
Recovery Point - RPO
Tape backups
Asynchronous replication Snapshot technologies
Synchronous replication
Return to Service T-2 Secs
Mins
Hrs
Days
Recovery Time - RTO
Clustering Instant Recovery Restore Bare Metal
Disk Restore Tape Restore 4
Disaster Recovery - pojmy Bar Metal Recovery/Restore – uvedení systému do původního stavu procesem obnovy Instant Recovery – okamžitá obnova, kde proces obnovy spočívá v rychlém startu aplikace, operačního systému či diskového úložiště , nejlépe rovnou ze záloh či replikací Synchronní replikace – replikace dat s potvrzením zápisu dat na zdroji i cíli replikace Asynchronní replikace - replikace dat se zpožděním, tedy bez potvrzení zápisu dat na zdroji i cíli Snapshot technologie – vytváření snímků dat, aplikací, virtuálních strojů či celých diskových oblastí SLA (OLA) – service-level či operation-level agreement – definice služby, její zajištění a dostupnost
Disaster Recovery – příprava I Definice SLA (OLA) – z pohledu Disaster Recovery jde především o definovanou dostupnost jednotlivých částí infrastruktury.
Infrastruktura – analýza prostředí , nástroje Informace o produkčním prostředí - rvtools, get-hyperVreport Informace o LAN a SAN - Brocade SAN a NET health, SolarWinds Požadované RTO-RPO
Disaster Recovery – příprava I Definice SLA (OLA) – z pohledu Disaster Recovery jde především o definovanou dostupnost jednotlivých částí infrastruktury.
Infrastruktura – analýza prostředí , nástroje Informace o produkčním prostředí - rvtools, get-hyperVreport Informace o LAN a SAN - Brocade SAN a NET health, SolarWinds Požadované RTO-RPO
Infrastruktura – výkonová měření prostředí Disková úložiště, Flash storage, NAS - iometer, vdbench, hpreaddata, prostředky diskových úložišť Disková úložiště pro backup – měření výkonu dedisbench a nástroje deduplikačních systémů, např. diskperf nebo nbperfchk Pásková úložiště – měření výkonu přímo nástrojem IBM IDT, HP LTT,
Disaster Recovery – příprava II Definice SLA (OLA) – z pohledu Disaster Recovery jde především o definovanou dostupnost jednotlivých částí infrastruktury.
Infrastruktura – virtuální prostředí a výkon Thin, Thick provisioning – proč SAN/NAS/LAN obnova Snapshot – lepší snapshot diskového systému než služby snapshotu Hypervisoru Členění LUNů pro virtualizaci Deduplikace zevnitř ??? Hyper-V – Media agent/Media server na Hypervisoru RDM ve virtuálu – důvod spolupráce snapshotů diskových úložišť Technologie Instant Recovery virtuálního prostředí. Při použití je třeba deklarovat výkon deduplikačního úložiště.
Disaster Recovery – příprava III Infrastruktura Stavíme na zelené louce
Snapshot
Replication
Primary Data
Replication
Snapshot
Snapshot Snapshot
Snapshot
Snapshot
Snapshot
Snapshot
Snapshot
Replica Snapshot Snapshot Snapshot Filer/Array
Filer/Array
Filer/Array
Production Data Center
Filer/Array
DR Domain
Disaster Recovery – příprava IV Infrastruktura – replikace diskových úložišť HW nebo replikace na bázi software řešení SW ?
SW Nezávislost na HW Granularita obnovy aplikací či filesystému Při obnově z replikace i z originálu možná konverze Thin – Thick v případě virtuálního prostředí. Automatizace celého procesu od zálohy až po Instant Recovery či verifikaci (SureBackup, SureReplika) Replikace nejen dat na diskovém poli (NAS, lokální disky, …) Deduplikace a optimize deduplikace Granularita replikací.
Možnost synchronní repliky výjimečně (kombinace se specializovaným SW – Storage Foundation VVR) Replikace snapshotů, větší utilizace
HW Optimalizovaná replikace diskového storage – možnost deduplikace Obnova celé oblasti (LUN, volume) rychlejší Thin provisioning úložiště při replikaci Archivace – NDMP záloha na pásku či SnapMirror to Tape Možnost výběru synchronní /asynchronní replikace Rychlejší snapshot a RPO Možnosti více technologií – SnapClone, SnapMirror, SnapVault, SnapLock,
Replikace zůstává v ReadOnly stavu Pro plný provoz nutno rozbít replikaci. Replikace vždy na blokové úrovni. Pro aplikaci a DB nutno spolupráci s API, VSS atd.
Výkon RTO - RPO dobrý, jen replikace se nám rozpadla
Disaster Recovery – pro Vše existuje řešení Bar Metal Recovery/Restore Konverze do virtuálního prostředí SnapShot – Replikace na úrovni storage Replikace na úrovni SW Migrace V2V Replikace virtuálního prostředí Instant Recovery Cloud řešení
Disaster Recovery – Bar Metal Recovery NetBackup CommVault
Disaster Recovery – Bar Metal Recovery EMC NetWorker
HP Data Protector
Disaster Recovery – BMR Princip spočívá ve vytvoření ISO image souboru a jeho následném bootu, u některých SW je podpora i PXE boot přímo ze sítě (NetBackup) . Z ISO image lze vytvořit i CD/DVD nebo ISO image podsunout virtuálnímu prostředí. Propracovanost, stabilita a jednotnost BMR je známa u řešení Symantec Netbackup a CommVault Simpana. Určitých vylepšení dosáhlo řešení NetWorker a HP Data Protector. Veeam používá nástroje třetí strany pro migraci fyzického železa do virtuálního prostředí
Disaster Recovery – BMR
Disaster Recovery – konverze do virtuálního prostředí - NetBackup
Disaster Recovery – konverze do virtuálního prostředí - CommVault
Disaster Recovery – konverze do virtuálního prostředí – HP Data Protector
Disaster Recovery – konverze do virtuálního prostředí – Backup Exec
Disaster Recovery – konverze Konverze do prostředí Hyper-V a Vmware, Xen, KVM se provádí na základě instalovaného BMR prostředí Všechny systémy podporují konverzi do Vmware prostředí CommVault a BackupExec 2015 podporují konverzi do prostředí Hyper-V a mix mezi virtuálním prostředí, Netbackup uvolní Hyper-V koncem roku. HP Data Protector či NetWorker nemají přímou konverzi, ale je možno podsunout vytvořené ISO pomocí BMR přímo do Hypervisoru – omezení výběru, nutná konfigurace, limity
Konverze do virtuální podoby je hračka, poradíme tak aby dopadla dobře
Disaster Recovery – Snapshot/Replikace řízené NetBackupem - HW řešení NetBackup client
SLP
Master server
Policy
Media server
OpenStorage API 1
Create snapshot
Copy 2 snapshot
3
Copy snapshot
4
Export snapshot
NBUPlugin
Storage Server/DFM Server Snapshot
Primary Data
Replicate
Snapshot
Snapshot
Replicate
Snapshot
1
Snapshot
Filer/Array
2
Snapshot
Filer/Array
3
Snapshot Snapshot Snapshot
Filer/Array
4 Duplicate
Replikace virtuálních serverů NetBackupem – SW způsob
Source domain *
Duplication to a remote master Image
Client
Master/ media
OST-based storage
Target domain * Image
Standard duplication
Image
OST-based Master/ storage media 23
Replikace virtuálních serverů a akcelerací
Live Sync replikace pro virtuální servery Workflow
1
2
DASH Copy nebo HW replikace 3 1
záloha pomocí VSA ochrání požadované stroje, které mají být replikovány
3
NEBO je spuštěna operace DASH Copy, která replikuje změny oproti předchozímu stavu do další lokace
2
Jakmile je dokončen proces ochrany, je spuštěna replikace změněných bloků přímo do „stand-by“ virtuálních strojů
4
Následně jsou změněné bloky zapsány do cílových „stand-by“ virtuálních strojů
Disaster Recovery – Snapshot/Replikace řízené Veeamem
Disaster Recovery – replikace Rozhodnutí zda HW či SW řešení nebo kombinace Replikaci je třeba považovat za Disaster Recovery řešení, nikoliv za HA – High Availability Replikovat nelze jen virtuální stroje, ale replikaci je možno provádět na úrovni souborů, databází či celých diskových oblastí . Replikujeme i vlastní zálohovací systém
Ideální je ověřit, že replikace v DR lokalitě jsou konzistentní a správné
Disaster Recovery – NetBackup Instant Recovery
Commvault – Instant Recovery Obnova VM z image záloh Obnova celého stroje ze stream záloh Live mount VM (Vmware) • Ukázka
Live recovery Live browsing
Obnova VM z HW snapshotů (IntelliSnap) Snapshoty na primárním úložišti Replikované snapshoty v DR lokalitě • Netapp, EMC, Hitachi
Disaster Recovery – EMC Instant Access
Disaster Recovery – Instant Recovery Veeam
Disaster Recovery – Instant Recovery Výhodné pro okamžité nastartování jednotek strojů Počítat s potřebou výkonu čtení VMDK image z backup úložiště. Detaily u jednotlivých technologií výrobců
Instant Recovery – rychlý start je záchrana
Vrchní prchni
Cloud řešení a migrace V2V Cloud disaster recovery (Azure, Amazon, RackSpace, Oracle, OpenStack, Vmware vCloud Director) Cloud dev&test Cloud backup and recovery bundle Cloud replication Cloud gateway (podpora pro HW appliance)
DR v Cloud prostředí Technologie pro konverze VMs (V2C) VMware do Hyper-V Hyper-V do Vmware Hyper-V nebo Vmware do Amazon Hyper-V nebo Vmware do Azure
DR v Cloud prostředí
Cloud solution sets
• Sada přípravených workflow
Děkuji za pozornost