Archivace s jistotou Aleš Koreček, BRS SE EMC
© Copyright 2013 EMC Corporation. All rights reserved.
1
Archivace jako doplněk zálohy Záloha
Archiv
Kopie informace
Primární informace
Používá se pro obnovu produkce
Dostupná pro opětovné využití
Zvyšuje dostupnost dat
Zvyšuje provozní efektivitu
Typicky krátkodobá
Typicky dlouhodobý
Data jsou přepisována pravidelně
Data jsou uchována pro analýzy nebo compliance
© Copyright 2013 EMC Corporation. All rights reserved.
2
Archiv © Copyright 2013 EMC Corporation. All rights reserved.
3
Obvyklí podezřelí Veřejná a státní správa, zdravotnictví – všude
Banky, pojišťovny, telekomunikace
– smlouvy, pojišťovací a škodní protokoly – ostatní (zaměstnanecká agenda, ekonomika, výroční zprávy)
Výroba, prodej
– ISO, EDI, – ostatní (zaměstnanecká agenda, ekonomika, výroční zprávy)
Ostatní
– všude, kde hrozí potenciální postih či škoda
© Copyright 2013 EMC Corporation. All rights reserved.
4
Co je (hlavně) za archivací Organizace
– směrnice – oprávnění – metodiky
Aplikace
– univerzální datová sběrnice – časová razítka, el. podpis
Infrastruktura
– HSM – garantovaný archiv
© Copyright 2013 EMC Corporation. All rights reserved.
5
Druhy archivace Provozní odlehčení primárního úložiště zmenšení objemu zálohy rozšíření zálohovacího okna
Compliance legislativní požadavky interní směrnice oborové normy
© Copyright 2013 EMC Corporation. All rights reserved.
6
Compliance archiv Pravidla, principy
© Copyright 2013 EMC Corporation. All rights reserved.
7
Legislativa Zákony o archivnictví a spisové službě
– stanovuje povinnost a způsob vedení spisové služby
Zákon o elektronických úkonech a autorizované konverzi dokumentů
– upravuje el. úkony státu a samosprávy vůči fyzickým a právnickým osobám, autorizovanou konverzi dokumentů
© Copyright 2013 EMC Corporation. All rights reserved.
8
Legislativa (pokračování) Národní standard pro elektronické systémy spisové služby – definuje sjednocující parametry a základní podmínky pro výkon el. spisové služby
Další standardy – – – – –
MOREQ2 SOX zákon o zdravotních službách zákon o krizovém řízení – krizový zákon zákon o integrovaném záchranném systému – zákon o ochraně osobních údajů
© Copyright 2013 EMC Corporation. All rights reserved.
9
Co se vlastně archivuje? Různý původ obsahu – – – –
spisová služba emaily agendové systémy kancelářské balíky
Různé typy obsahu – – – –
textové soubory (txt, doc, ppt, xls, ods, odp, ...) speciální archivní soubory (pdf/A, pdf/S, archivační balíček podle OAIS, ...) obrazky (tiff, jpeg, png, bmp, ...) speciální formáty (CAD/CAM aplikace, mapové podklady GIS, ...)
Různé stupně oprávnění – – – –
vlastník recenzent administrátor a další
© Copyright 2013 EMC Corporation. All rights reserved.
10
Požadavky na compliance archivaci Prokazatelnost Dohledatelnost Konzistence Autenticita Spolehlivost Auditovatelnost
© Copyright 2013 EMC Corporation. All rights reserved.
11
Provozní archivace
© Copyright 2013 EMC Corporation. All rights reserved.
12
Předmět archivace Blokové úložiště – – – –
Databáze MS Exchange MS SharePoint Vlastní aplikace
Souborové úložiště
– Souborové systémy – Emailové systémy – Vlastní aplikace
© Copyright 2013 EMC Corporation. All rights reserved.
13
Požadavky na provozní archivaci a zálohu Univerzalita Transparentnost
Private Clouds
Public Clouds
Integrace Dostupnost Multitenancy Škálovatelnost Cena © Copyright 2013 EMC Corporation. All rights reserved.
14
Portfolio archivních úložišť EMC Centera
Atmos
© Copyright 2013 EMC Corporation. All rights reserved.
Data Domain
Isilon
VNX
15
EMC Centera Základní přehled
© Copyright 2013 EMC Corporation. All rights reserved.
16
EMC Centera — řešení pro archiv Zajištění autenticity obsahu
– Interní úložiště — chyby obsahu/dat jsou automaticky detekovány a odstraněny – Síťový provoz — chyby síťového přenosu jsou automaticky detekovány a přenos je opakován
Autenticita obsahu
Snadná správa
– Správci mohou zvládnou násobně větší objem dat
Snadná správa
Nízké TCO
Spolupracuje s jakoukoliv aplikací a platformou – Centralizace archivu z mnoha zdrojů dat – Sdílení jediného úložiště mnoha aplikací pro tisíce uživatelů
Umožňuje dosažení shody se zákonnými normami a podnikovými směrnicemi © Copyright 2013 EMC Corporation. All rights reserved.
17
Centera: nízké TCO
Bez složité správy komplexní SAN nebo LAN infrstruktury
Bez správy souborových systémů
Bez konfigurací LUN/RAID Group
Ochrana investic — podpora různých generací HW Jeden adresovatelný prostor — speciální nástroje pro obsah Nepřetržité ověřování obsahu a struktury © Copyright 2013 EMC Corporation. All rights reserved.
18
Redundant Array of Independent Nodes (RAIN) Centera node – – – – – – –
Čtyř node
16-node 2 cubes/ cube cabinet
Storage nodes/access nodes 2.8 GHz P4 processor 1024 MB DDR RAM 4x 1 TB nebo 2 TB SATA-II 2x 1 Gbit network-interfaces 1x 1 Gbit pro vnější LAN (copper/optical) Node může být v jedné ze 3 rolí ▪ ▪ ▪
Access node Storage node Access/storage node
Síť Centery – – –
Dual 24-port cube switches Připojení Gigabit Ethernet pro další cubes Redundantní připojení pro každý node
Vysoká škálovatelnost – –
Masivní paralelní výkon Přidání úložiště: výkon, paměť, bandwidth
Více cubes v jednom cluster
© Copyright 2013 EMC Corporation. All rights reserved.
19
Základní konfigurace Hardware Základní systém (4TB, 8TB nebo 12TB nody) – Minimum počet nodů = 4 – Max počet nodů v kabinetě = 32 – Max kabinetů v klastru = 4
Rozšiřování po 2 nodech
Software CentraStar – SW instalovaný na každém nodu Volitelné add on moduly –
– –
Compliance: — Governance (GE) — Compliance Edition Plus (CE+) — Advanced Retention Management (ARM) Replication Centera Virtual Archive (CVA)
© Copyright 2013 EMC Corporation. All rights reserved.
20
Generační srovnání G4LPII vs. G2
Gen 2 Node
Gen 3 Node
Gen 4 Node
Gen 4 LPII Node
1 TB per node
1.2 TB per node
2 TB per node
8 TB per node
800% více úložiště
125 Watts per TB
15.7 Watts per TB
87% méně energie
88%
117 Watts per TB
117 Watts per TB
48 nodes = 48 TB
40 nodes = 48 TB
24 nodes = 48 TB
6 nodes = 48 TB
32 TB per rack
38 TB per rack
64 TB per rack
256 TB per rack
© Copyright 2013 EMC Corporation. All rights reserved.
méně nodů 88% menší footprint
21
Centera pracuje s objekty Objekt má metadata
datum
jméno
<My_Archiving_Application> <MagazineCover name=“Time” photo=“Annan” date=“Sep 4, 2000”/>
My_Archiving_Application >
fotografie
• Aplikace vytváří metadata přidružená k jednomu nebo více objektům • Objekty jsou uloženy nezávisle na adresářových informacích
© Copyright 2013 EMC Corporation. All rights reserved.
22
Centera nepotřebuje zálohu Centera
– Snižuje příležitost poškození dat (přístup nebo autenticitu) chybou – V případě chyby umožní rychlé odhalení a odstranění
Jakým způsobem
– Pevný obsah chrání data před přepsáním aplikací – Autenticita obsahu, nezávislé kopie, self-monitoring, selfhealing ▪ ▪ ▪ ▪
Detekce a „uzdravení“ vadných bloků disku Regenerace obsahu při ztrátě celého disku Detekce a „uzdravení“ chyb filesystémů Regenerace obsahu při ztrátě celého filesystému
Omezená konfigurace
– Lidská chyba nemá dopad na archiv samotný ▪
© Copyright 2013 EMC Corporation. All rights reserved.
Neexistuje možnost aktivní správy disků nebo FS
23
Model chyby a samoopravení Chyba
Detekce
Náprava
Chyba nodu Chyba celého disku • Chyba databáze • Chyba bloku Chyba filesystému
Přítomnost nodu Přítomnost disku • Zdraví databáze • Read/write chyby Poškrábání disku
Regenerace nodu Regenerace disku • Regenerace databáze • Regenerace blobu • Regenerace FS
• Chyba sítě • Chyba SW
© Copyright 2013 EMC Corporation. All rights reserved.
Bloby Metadata Bloky
• Připojení • SW heartbeats
Obnova dat • Zpráva do EMC
24
Jak Centera pracuje Content Address Aplikace vytvoří objekt
10001010
10111011
Content Address algorithm
Digital fingerprint
Content Address algorithm
Locationindependent
LAN
CA
Globally unique
Centera spočítá CA a odešle ji jzpět
CA
Aplikační server pošle objekt Aplikace uloží CA jako referenci
© Copyright 2013 EMC Corporation. All rights reserved.
25
Ochrana dat MIRORRING
Cube-switch Dual, self-managed
Network switch
Cube-switch
Storage nodes • • • • • • • • • • Storage nodes
private LAN
Access/storage nodes • • Access/storage nodes
Redundant power © Copyright 2013 EMC Corporation. All rights reserved.
26
Storage nodes • • • • • • • • • • Storage nodes
Ochrana dat PARITY
Cube-switch Dual, self-managed
Network switch
Cube-switch
private LAN
Access/storage nodes • • Access/storage nodes Redundant power © Copyright 2013 EMC Corporation. All rights reserved.
27
Ochrana dat
SAMOZOTAVENÍ
Storage nodes • • • • • • • • • • Storage nodes Cube-switch Dual, self-managed
Network switch
Cube-switch
private LAN
Access/storage nodes • • Access/storage nodes
Redundant power © Copyright 2013 EMC Corporation. All rights reserved.
28
Škálovatelnost Automatické rozpoznání HW Automatické zapojení Různé typy HW
Upper cube
Root switches
Lower cube
Různé generace
4-node Centera
IP Address
Rack 1
© Copyright 2013 EMC Corporation. All rights reserved.
Rack 2
29
Virtual pools – multitenancy Logická separace dat Single Instancing Oddělená správa Různé politiky
Pool 1
Aplikační Pool 1 Pool 2 Pool 3
Aplikační Pool 2 Aplikační Pool 3
Default Pool
Default Pool Blob CDF
© Copyright 2013 EMC Corporation. All rights reserved.
30
Replikace vybraných objektů Pool 1
Pool 2
Pool 3
Zdroj
© Copyright 2013 EMC Corporation. All rights reserved.
Cíl
31
Topologie replikace Asynchronní přeš IP Neomezená vzdálenost Jednosměrná, obousměrná, řetěz nebo hvězda Možnost pauzování replikace LAN
LAN Router
Router
Bez nutnosti externí správy Není třeba duplikovat optické disky nebo worm pásky Ta samá CA existuje v obou klastrech
Application server
© Copyright 2013 EMC Corporation. All rights reserved.
Application server
32
© Copyright 2013 EMC Corporation. All rights reserved.
33
Compliance – základní vlastnosti Basic – – –
Objektové úložiště Bez vlastností pro vynucení retence Bez pokročilého mazání
Governance Edition (GE) – –
Obsahuje vlastnosti pro vynucení retence Vlastnost Privilege delete option pro mazání obsahu pod retencí
Compliance Edition Plus (CE+) – –
Omezené vlastnosti GE Specifická SEC
Advanced Retention (ARM) – – – –
© Copyright 2013 EMC Corporation. All rights reserved.
Dostupná pouze pro verze GE nebo CE+ Event Based Retention (EBR) Litigation Hold (LH) MIN/MAX Governor per Pool
34
Pokročilé vlastnosti compliance C0
C1
fixed retention
povolen výmaz
fixed retention
C2
C3
event not specified
fixed retention event not specified
povolen výmaz
event-based retention
event-based retention
povolen výmaz
fixed retention event not specified
event-based retention
povolen výmaz
Čas
C-Clip vytvořen
© Copyright 2013 EMC Corporation. All rights reserved.
Událost
Nastavení litigation hold
Odstranění litigation hold
35