Bankovní institut vysoká škola Praha Katedra matematiky, statistiky a informačních technologií
Systémy pro zálohování dat Bakalářská práce
Autor:
Pavel Novák Informační technologie, Manaţer projektů informačních systémů
Vedoucí práce:
Praha
Ing. Bohuslav Růžička, CSc.
Duben, 2013
Prohlášení: Prohlašuji, ţe jsem bakalářskou práci zpracoval samostatně a v seznamu uvedl veškerou pouţitou literaturu. Svým podpisem stvrzuji, ţe odevzdaná elektronická podoba práce je identická s její tištěnou verzí, a jsem seznámen se skutečností, ţe se práce bude archivovat v knihovně BIVŠ a dále bude zpřístupněna třetím osobám prostřednictvím interní databáze elektronických vysokoškolských prací.
V Praze, dne 30.4.2013
……………….………….. Podpis autora
Poděkování: Děkuji Ing. Bohuslavu Růţičkovi, CSc. za podporu a odborné vedení během mé práce.
Anotace Bakalářská práce je zaměřena na problematiku zálohování dat v obecném pojetí. Práce představí základní systémy pouţívané pro uchovávání dat vybírané s ohledem na rozdílné potřeby uţivatelů. Jsou zde vymezeny technologie pro zálohování dat, typy záloh, druhy zálohovacích médií a pouţívaný software.V poslední části práce si přiblíţíme rizika spojená s ukládáním a zálohováním dat a praktickou ukázku řešení záloh ve firmě Vodafone Czech Republic a.s.
Klíčová slova: konkrétní řešení, potřeby uţivatelů, rizika, systémy pro zálohování dat, technologie pro zálohování, typy záloh
Annotation The bachelor thesis is focused on the issue of backing up data in general terms and is supposed to introduce basic systems usually used for storing data, which were chosen with regard to the different needs of users. There are described technologies for data backup, backup types, types of backup media and software that is used. Last part of the thesis is devoted to the risks associated with the storage and data backup solutions and supplemented with the white paper describing solution in Vodafone Czech Republic.
Key words: Backup systems, backup technologies, backup types, riska, users requirements, specific solution
Obsah Úvod ........................................................................................................................................... 6 1
2
Zálohování dat ................................................................................................................... 7 1.1
Definice zálohy ........................................................................................................... 7
1.2
Důvody zálohování dat ............................................................................................... 8
1.3
Zálohovací software ................................................................................................... 9
Technologie pro zálohování dat ..................................................................................... 12 2.1 2.1.1
Pevný disk ..................................................................................................................................... 12
2.1.2
Pole pevných disků RAID (Redundant Array of Independent Disk) ............................................. 12
2.1.3
Optické disky ................................................................................................................................. 17
2.2
3
Média pro ukládání dat ............................................................................................. 12
Hardwarové řešení zálohovacích systemů ................................................................ 21
2.2.1
NAS (Network Attached Storage) ................................................................................................. 21
2.2.2
SAN (Storage Area Networks) ...................................................................................................... 22
2.2.3
DAS (Direct Attached Storage) ..................................................................................................... 24
Typy záloh........................................................................................................................ 26 3.1
Plná záloha (Full BackUp) ....................................................................................... 26
3.2
Přírůstková záloha (Incremental BackUp) ............................................................... 26
3.3
Rozdílová záloha (Differencial BackUp) ................................................................. 27
3.4
Soubory a jejich zálohování ..................................................................................... 28
3.5
Databáze a jejich zálohování .................................................................................... 30
3.6
Clone......................................................................................................................... 33
3.7
Snapshots .................................................................................................................. 35
3.8
Thin provisioning (TP) ............................................................................................. 36
4
Rizika spojená s ukládáním a zálohováním dat ........................................................... 37
5
Konkrétní řešení záloh ................................................................................................... 41 5.1
Domácnosti ............................................................................................................... 41
5.2
Malé a střední firmy ................................................................................................. 42
5.3
Řešení záloh oddělení CNO firmy Vodafone CZ ..................................................... 43
6
Závěr ................................................................................................................................ 54
7
Seznam použité literatury .............................................................................................. 55
8
Seznam obrázků .............................................................................................................. 59
9
Seznam tabulek ............................................................................................................... 60
5
Úvod Tato práce se zabývá problematikou zálohování dat a okolnostmi se zálohováním spojenými. V dnešní moderní době patří tvorba dat k součásti ţivota snad kaţdého z nás a rozhodně by nerad kdokoli o tato data přišel. Proto je zálohování neoddělitelnou součástí naší práce s daty, ať uţ se jedná o důleţité pracovní dokumenty, rodinné fotografie, tabulky, videa, či důleţité firemní soubory. Hlavním důvodem pravidelného zálohování a archivace dat je především obava ze ztráty námi vytvořených cenných informací. V mnoha případech bývá tato ztráta totiţ nevratná. Bakalářská práce představí základní systémy pouţívané pro bezpečné uchovávání dat vybírané s ohledem na rozdílné potřeby zálohovatelů. Práce popisuje postupy při zálohování, technologie pro zálohování dat, typy záloh, druhy zálohovacích médií a pouţívaný software. Během zálohování mohou nastat situace, které rozhodně nejsou vítány. Představíme si rizika spojená s ukládáním a zálohováním dat. Jako praktickou ukázku řešení záloh jsem vybral politiku, stanovenou metodologii, zodpovědnosti a pravidla zálohování, archivace a Offsite Storage pro produkční systémy spravované oddělením CNO (Core Network Operation) ve firmě Vodafone CZ.
6
1 Zálohování dat Neţ se pustíme do samotné definice zálohy a následných důvodů vytváření záloh, představíme si a rozlišíme pojmy zálohování a archivace. Tyto dva pojmy si spojuje mnoho uţivatelů do jednoho, coţ není úplně správně. V čem je tedy rozdíl? zálohování – vytváření bezpečnostní kopie aktuálních dat archivace – přesun nevyuţívaných dat na archivační média a uvolnění diskové kapacity. Z výše uvedeného se dá odvodit, ţe rozdíl je v pohledu na bezpečnost. Zatímco pro zálohování je bezpečnost primární, u archivace jde především o přesun nevyuţívaných dat na separátní datové úloţiště, kde se po určitou dobu uchovávají [22].
1.1 Definice zálohy Zálohou se rozumí ukládání aktuálních dat na zálohovací medium, které má minimální nejlépe však nulový vztah s primárním úloţištěm. V procesu zálohování se snaţíme vytvořit co moţná nejniţší závislost mezi primárními daty a zálohou, tedy přesouváme data na média, která jsou nezávislá na technickém stavu našeho systému a hardwarových komponent. Uloţení dat na takováto média je dlouhodobé, můţe být však v podstatě trvalé. Záleţí samozřejmě ovšem na kvalitě média případně na době, po kterou jsou data uloţená na médiu ještě plně čitelná [4]. Záloha nebo záložní kopie (anglicky backup) je kopie dat uloţená na jiném datovém nosiči (nebo i místě). Záloţní data jsou vyuţívána v případě ztráty, poškození nebo jiné potřeby práce s daty uloţenými v minulosti. Zálohování probíhá nepravidelně (např. v domácnostech) nebo pravidelně podle rozvrhu (např. ve firmách). Při zálohování většího mnoţství dat se obvykle pouţívá specializovaný program,který celý proces zálohování usnadňuje,například i v systému Microsoft Windows je součástí instalace.Pro zálohování většího mnoţství dat je moţné pouţít také specializovaná zařízení (hardware), která pracují poloautomaticky nebo plně automaticky. Pro vysvětlení, archiv moc nepouţívám, zatímco ze zálohy potřebuji obnovit co nejrychleji. Proces zálohování dat klade velký důraz na rychlou obnovu dat oproti archivaci.
7
V poslední době je vyuţíváno komplexních zálohovacích systémů, které umoţňují efektivně zálohovat mnoho počítačů propojených počítačovou sítí nebo naopak na mnoho počítačů propojených v síti data zálohovat (tzv. úloţný cluster) [6]. Zálohování můţe probíhat v těchto základních reţimech: Online – Proces tvorby zálohy počítače za jeho běţného chodu. Offline – Zálohování je prováděno mimo běţný provoz počítače.
1.2 Důvody zálohování dat Hlavním důvodem pravidelného zálohování a archivace dat je především obava ze tráty námi vytvořených cenných informací. V mnoha případech bývá tato ztráta totiţ nevratná. Dalším důvodem bývá omezená kapacita aktuálního datového úloţiště, se kterým během práce operujeme a krátkodobé uloţení dat. K uloţeným informacím se bude potřeba vrátit po měsících i dokonce letech zpět a pro tuto potřebu je nutná poměrně velká kapacita úloţiště. Příčiny ztráty dat jsou různé a můţeme je rozdělit do následujících kategorií. Jednou z primárních příčin jsou chyby uživatelů neboli selhání lidského faktoru. Mezi chyby uţivatelů patří například nechtěné vymazání souborů, nesprávně ukončený program nebo ztráta média během fyzického přemisťování. Mezi další časté příčiny patří hardwarové chyby případně úplné selhání hardwaru především pak pevného disku. Obnova dat následně stojí nemalé finanční prostředky a kladný výsledek není zaručen. Stejně tak dochází k systémovým chybám například k poškození operačního systému a tím ke ztrátě dat pokud je vše v jednom oddíle. Jednoduchým řešením je pouţití odděleného externího harddisku pro průběţné ukládání dat. Ke ztrátě dat mohou přispět také viry (proto není doporučováno spoléhat se pouze na antivirové programy) nebo přírodní katastrofy a živelné pohromy. Abychom předcházeli ztrátě cenných informací, je nezbytné ukládat záloţní kopie fyzicky na jiné místo, neţ jsou uloţena originální data. Méně častým důvodem můţe být dočasný výpadek napájení, který způsobí ztrátu rozpracované neuloţené práce v případě, ţe nemáme aktivní záloţní zdroj [26] [8]. Obrázek 1. zobrazuje procentuální podíl příčin ztráty dat. Statistické údaje poskytla společnost Kroll Ontrack, zabývající se obnovou dat a výsledek zveřejnil časopis Chip. Z analýzy je patrné, ţe nejčastější příčinou ztráty dat je chyba uţivatelů a hardwarová či systémová chyba.
8
Obrázek 1 - grafické znázornění příčiny ztráty dat1
1.3 Zálohovací software Výběr vhodného zálohovacího softwaru, bychom měli rozdělit na potřeby domácností a na potřeby firem. Na trhu je k dispozici velké mnoţství softwaru, který se pouţívá na zálohování dat, ať uţ v domácím prostředí nebo ve velkých sítích. V domácím prostředí patří mezi základní zálohovací metodu, která můţe být účinná a postačující, kopírování. Není to však metoda zrovna nejpohodlnější. Mnoho operačních systémů disponuje vlastními integrovanými zálohovacími programy. Software určený pro zálohovací akce se dá rozdělit do několika skupin. Jednou ze skupin jsou programy slouţící pro provedení zálohy systému, oddílu či disků. Jinou skupinou jsou programy spíše specializované například na provádění záloh konkrétního nastavení, například nastavení internetového prohlíţeče nebo emailového klienta (soubory s příponou .pst). Příklady zálohování v operačním systému Windows [16] [8]. Jednoduchý nástroj lze nalézt: Windows XP Start Příslušenství Systémové nástroje Zálohování Windows 7 Start Ovládací panely Zálohování a obnovení
1
Zdroj: [autor, upraveno na základě SCHREIBER, Manuel. Absolutní bezpečí pro Vaše data. Chip [online].
2009, č. 7. [cit. 2012-10-01] Dostupné z: http://earchiv.chip.cz/cs/earchiv/vydani/r-2009/chip-07-2009/absolutnibezpeci.html]
9
Obrázek 2 - Zálohování a obnovení Windows 72
Ukládání dat v OS Windows lze nastavit na DVD, USB flash disk, harddisk, externí disk či do úloţiště přístupného přes síť (cloud) Mezi další zálohovací programy patří:
Norton Backup NB patří mezi uţivatelsky přívětivé zálohovací prostředky se slušnou výkonností a spolehlivostí, který obsahuje kromě jiného také patentovanou technologii Error Correction (chybová korekce), umoţňující obnovování souborů i ze zálohových setů, které jsou na poškozených diskových nosičích a technologii FastPatch (rychlý přístup), který právě dává zálohovacím operacím jak spolehlivost tak především rychlost. Jedná se spíše o domácí SW [5].
2
Zdroj: [autor]
10
Central Point Backup (CEBA) SW Central Point Backup dodala na náš trh firma Central Point Software, která je u nás velice dobře známá díky produktu PC TOOLS. Tento SW je dodáván jako integrovaný komplet s kvalitním manaţerem souborů, servisní rutinou „scheduler“ a v neposlední řeadě také zálohovacím programem Hard Disk Backup. Tuto část kompletu lze získat i samostatně pod názvem Central Point Backup. CPB má mnoho pozitiv a je moţné jej zařadit díky jeho vlastnostem na špičku této programové kategorie například po bok jiţ zmiňovanému Norton Backupu, ve srovnání s kterým dokonce nabízí i nové funkce jako jsou ovládání kazetopáskových jednotek a zálohovací kalendář. Tejně jako NB nabízí pouţití chybové korekce Error Correction a vyuţití technologie zálohování pomocí kanálu DMA (rychlý přístup k paměti), coţ je to samé jako u NB technika FastPatch [5]. CEBA systém vyuţívají spíše firmy. Mezi zdarma šířené zálohovací programy, které jsou nebo nedávno byly volně dostupné na webových serverech, vyhledatelné většinou v kategorii „zálohování“ patří například Syncback, Lupazal Cobian Backup, Backup Manager, BackupMe, zipBackup, SVN Autocommit, MozBackup a mnoho dalších [8].
11
2 Technologie pro zálohování dat 2.1 Média pro ukládání dat 2.1.1 Pevný disk Pevný disk (zkratka HDD, anglicky hard disk drive s velikostmi od desítek GB aţ po několik set GB aţ TB) je zařízení, které se pouţívá v počítačích a ve spotřební elektronice slouţí k dočasnému nebo trvalému uchovávání většího mnoţství dat pomocí magnetické indukce. První pevné disky se objevily v roce 1956, nejprve pro sálové počítače. Pevný disk je sloţen z kovových disků tloušťky asi 1 mm potaţené z obou stran citlivou vrstvičkou magnetické látky, chráněné na povrchu tenkou vrstvičkou skla. Vlastní záznam či čtení dat probíhá naprincipu magnetického záznamu jako u disket. Oproti disketě kde je pouze jeden kotouček je u pevného disku více kotoučků nad sebou. Rychlost otáčení je také mnohem vyšší. U starších disků 3600 ot. /min. u nových disků 7200 ot. /min. Hlavičky, které zapisují data, se nedotýkají povrchu jako u disket, ale vznáší se nad povrchem v nepatrnévzdálenosti. Tím je povrch chráněn před opotřebením [6]. K základnímu dělení pevných disků, k pouţívanému rozhraní a dalším kritériím pro výběr pevného disku odborníci z webového portálu czc.cz [21] uvádějí: „Základní dělení pevných disků podle velikosti je 1.8, 2.5 a 3.5 palců.Disky formátu 1.8" a 2.5" jsou prioritně určeny pro použití v noteboocích. Pevné disky o velikosti 3.5" jsou nejčastěji využívané v klasických stolních počítačích nebo v dnes velice populárních multimediálních centrech, popřípadě v settop-boxech. Dalším důležitým aspektem při výběru pevného disku je výběr správného rozhraní. V dnešní době se nejčastěji využívá rozhraní IDE (PATA)a SATA II či SATA III, kdy IDE je na ústupu a není ze strany výrobců již podporováno. Dalším kritériem pro výběr pevného disku je samotná architektura disku. V nabídce jsou dva druhy pevných disků, a to disky mechanické a disky bez mechanických částí s označením SSD.“ Mezi nejznámější výrobce patří zejména Seagate, Western Digital, Samsung nebo Hitachi.
2.1.2 Pole pevných disků RAID (Redundant Array of Independent Disk) RAID (Redundant Array of Independent Disks (vícenásobné diskové pole nezávislých disků). RAID je metoda, při které jde především o zvýšení bezpečnosti vyuţitím levných disků při uchovávání dat, přesněji aby porucha některého disku nezničila uloţená data. Nejedná se tedy přímo o metodu zálohování. Pokud bychom mluvili o záloze, tak pouze ve 12
smyslu záloh on-line a u všech RAID řešení se běţně pouţívá skutečná záloha na záznamová média (například pásky). Nicméně bych se o RAID metodě v této práci rád zmínil. Data se u RAID metody ukládají specifickým způsobem na více nezávislých disků, aby byla zachována v případě selhání některého z nich. Výjimkou je RAID 0, kde má typ zapojení přidanou hodnotu pouze v podobě zvýšení rychlosti zápisu a čtení. Metoda RAID nabízí několik úrovní zabezpečení podle zvoleného typu pouţívajícího různé stupně redundance [29] [25]. RAID 0 – striping (proužkování)– je systém navrţený s cílem zvýšit rychlost ukládání dat. Pouţívají se minimálně dva disky, kdy se data ukládají na jeden nebo druhý disk (stripování), aby se zvýšil výkon. Doba po níţ jeden disk zapisuje se vyuţívá pro přestavení hlaviček druhého disku. (nastavení na novou zapisovací stopu). Toto řešení však neobsahuje redundantní informace a ztráta pouze jednoho disku způsobuje ztrátu všech dat. Dílčí systémy jsou pouze spojené do logického celku a součet všech členů tak vytváří kapacitu daného celku.Jedná se o zapojení pro zvýšení rychlosti zápisu a čtení, ale o záloze zde nelze hovořit [29] [25]. RAID 1 – mirroring (zrcadlení) – toto řešení bylo navrţeno pro bezpečnost dat tak, aby nedošlo při poškození disku k jejich ztrátě.Výsledkem je zapojení dvou disků způsobem, ţe oba současně zapisují stejné informace.Při poruše kteréhokoli z nich lze z fungujícího disku vytvořit ve velmi krátké době provozní kopii uloţených dat. Jedná se tedy o provozní kopii, nikoli zálohu. Toto řešení je z důvodu zápisu na vice disků najednou pomalejší ale zároveň poměrně bezpečné. Řešení poskytuje výraznou ochranu dat proti ztrátě způsobené poruchou hardware, je však nutná dvojnásobná disková kapacita, coţ není zrovna bezvýznamná nevýhoda [29] [25].
13
Ukázka zapojení RAID 0 a RAID 1.
Obrázek 3 - RAID 03
Obrázek 4 – RAID 14
RAID 0+1 – Jedná se o dvě disková pole typu RAID 0. Data jsou zrcadlena do dvou diskových polí, v kaţdém z nich probíhá stripping. RAID 1+0 – Data se zapisují do dvou svazků stripováním (RAID 0) a v kaţdém svazku se zrcadlí.Typ RAID 1+0 je dobře vyuţitelný pro vytíţené databázové aplikace.(Nepočítají se paritní data, čímţ se zvyšuje rychlost.) RAID 0+1 a RAID 1+0 nabízejí velmi rychlé zápisy ale na dva shodné systémy. Z tohoto řešení tedy vyplývá nutnost vice disků, coţ zvyšuje náklady. Oba typy zapojení zrychlují provoz a zároveň vytváří provozní kopii [29] [25].
3
Zdroj: RAID (Redundant Array of Inexpensive/Independent Disks): Wikipedie, Otevřená encyklopedie [online].
[cit. 2013-01-08]. Dostupné z: http://cs.wikipedia.org/wiki/RAID 4
Zdroj: RAID (Redundant Array of Inexpensive/Independent Disks): Wikipedie, Otevřená encyklopedie [online].
[cit. 2013-01-08]. Dostupné z: http://cs.wikipedia.org/wiki/RAID
14
Ukázka zapojení RAID 0+1 a RAID 1+0.
Obrázek 5 - RAID 0+15
Obrázek 6 - RAID 1+0
RAID 3 a RAID 4 – vyuţívají řešení, kde bloky dat jsou zapsány na skupinu disků, z nichţ jeden slouţí pro zápis parity (rovnost, rovnocennost, porovnatelnost hodnot) RAID 3 – Pouţívá se N+1 stejných disků. Data jsou ukládána na N disků a na poslední disk je uloţena parita těchto dat (ukládáno po bitech). Výpadek kteréhokoli disku neznamená ztrátu dat, při výpadku libovolného jiného disku je moţno z ostatních disků spolu s paritním diskem ztracená data zrekonstruovat.Paritní disk však můţe být úzké hrdlo a vytěţuje se při jakémkoli zápisu na ostatní disky, coţ znamená jeho intenzivnější opotřebovávání. RAID 4 – Rozdíl od od RAID 3 je ten, ţe disky jsou stripovány po blocích, ne po bitech a parita na paritním disku je opět ukládána po blocích [29] [25].
Obrázek 7 - RAID 36
5
Obrázek 8 - RAID 4
Obrázek 5 a 6: Zdroj: RAID (Redundant Array of Inexpensive/Independent Disks): Wikipedie, Otevřená
encyklopedie [online]. [cit. 2013-01-08]. Dostupné z: http://cs.wikipedia.org/wiki/RAID 6
Obrázek 7 a 8 Zdroj: RAID (Redundant Array of Inexpensive/Independent Disks): Wikipedie, Otevřená
encyklopedie [online]. [cit. 2013-01-08]. Dostupné z: http://cs.wikipedia.org/wiki/RAID
15
RAID 2 – Je sloţitější verze RAID 3. Do základního RAID 0 se přidává pole s dodatečnou ochranu dat pomocí ECC korekce (Error Checking and Correction). Vyžaduje však podporu ze strany pevných disků Komerčně se nijak nepouţívá RAID 5 – podobný RAIDu 3 a 4.Liší se však v tom, ţe parita je distribuována mezi všechny disky.V tomto případě lze vyuţít paralelního přístupu k datům, protoţe delší úsek dat je rozprostřen mezi více disků.V porovnání s RAID 3 je opotřebení disku menší, protoţe je zápis parity rozloţen.Bezpečnost zůstává stejná [29] [25]. RAID 6 – rozšíření principu parity RAID 5 o další paritní stream. RAID 6 pouţívádvě paritní hodnoty, zápis se provádí střídavě na jednotlivé disky, přičemţ na kaţdém z nich se parita vypočítává jiným způsobem. Výhodou tohoto systému je odolnost proti výpadku dvou disků v jeden okamţik [29] [25].
Obrázek 9 - RAID 57
Obrázek 10 - RAID 68
Dalšími typy jsou RAID7, RAID 50, 60 a 100. Těmi se detailně jiţ zabývat nebudeme.
7
Zdroj: RAID (Redundant Array of Inexpensive/Independent Disks): Wikipedie, Otevřená encyklopedie [online].
[cit. 2013-01-08]. Dostupné z: http://cs.wikipedia.org/wiki/RAID 8
Zdroj: RAID (Redundant Array of Inexpensive/Independent Disks): Wikipedie, Otevřená encyklopedie [online].
[cit. 2013-01-08]. Dostupné z: http://cs.wikipedia.org/wiki/RAID
16
Následující tabulka ukazuje znaky úrovní RAID.
Tabulka 1 - Znaky úrovní RAID9
2.1.3 Optické disky Zálohování na optické disky V případě zálohování na optické disky mluvíme o záznamu optickém, protoţe je zapisován a čten světelným paprskem laseru. Mezi nesporné výhody zálohování na optická média patří bezpochyby nízká cena, snadná dostupnost a v neposlední řadě moţnost rychlého vytvoření několika kopií a uloţení na více míst, coţ zásadně zvyšuje bezpečnost zálohovaných dat. Nevýhodou CD a DVD nosičů je nízká ţivotnost, ačkoli výrobci uvádějí ţivotnost několik desítek let. Realita je však jiná a obecně se doporučuje obnovovat zálohy na nová média v rozhodně kratším čase, abychom zamezili nečekané ztrátě dat v podobě nečitelného média. Tato média se mohou stát nečitelnými i v případě poškození média jako je poškrábání a jiné. Vypálení dat na disk zajišťuje vypalovací mechanika, která podporuje všechny druhy formátů CD a DVD a bývá součástí téměř kaţdého počítače. Součástí operačních systémů Windows je vypalovací software, který umoţňuje vypálit data na optické disky. V případě notebooku je
9
Zdroj: HORÁK, Jaroslav. Hardware : učebnice pro pokročilé. 4. aktualiz. vyd. Brno : Computer Press, 2007.
360 s. ISBN 978-80-251-1741-5.
17
vypalovací mechanika buď součástí samotného notebooku nebo se dá pouţít mechanika externí. Dále jsou uvedeny nejběţněji pouţívaná média slouţící jak k archivaci tak k zálohování. Ţivotnost záloh u uvedených médií závisí na podmínkách skladování, značce, kvalitě, atd [8].
CD-R, CD-RW Disky s označením CD-R umoţňují jednorázový zápis. Přepsat či vymazat a pouţít znovu pro vytvoření zálohy však média CD-R není moţné. Uţivatelé je často vyuţívají jako hudební nosiče. Disky typu RW (ReWritable) mají schopnost opakovaného zápisu. Předešlá data jsou smazána a přepsána daty novými. Maximální kapacita CD disků je 700 MB. Tato kapacita je pouţitelná například pro vyváření menších, například přírůstkových záloh [8].
DVD-R, DVD+R, DVD-RW DVD disky se staly postupem času nástupcem CD disků. Zásadní rozdíl je v kapacitě. Nabízí totiţ daleko větší kapacitu pro ukládání dat neţ nosiče CD. DVD nosiče se hojně vyuţívaly pro ukládání video souborů. Toto vyuţití je ale uţ poměrně zastaralé, protoţe v dnešní době DVD neslouţí pouze k ukládání videa, ale mají spíše všeobecný charakter. Dříve se označovalo DVD jako Digital Video Disk, v současnosti je přesnější označení Digital Versatile Disk neboli digitální všestranný, univerzální, disk. DVD-RW se vyrábí v kapacitě 4,7 GB a vyplatí se, pro jeho přepisovatelnost, rozhodně investice do kvalitnější značky [8].
DVD-RAM Disky DVD-RAM mají velikost aţ 9,4 GB a vyuţívá se především pro zálohování dat. Prodejci udávají špičkovou spolehlivost uloţených dat, vysokou ţivotnost a moţnost aţ 100000× provést přepsání [8].
Blu-Ray Média Blu-Ray se řadí k nejmladším z digitálních optických disků. Technologií poţívanou pro zápis na tato média je speciální modrý laser, dle kterého je tato technologie nazvána.Bluray disky se dělí na BD-R tedy slouţící pouze pro zápis a BD-RE, který slouţí k několikanásobnému přepsání.Tato média slouţí především pro ukládání video nahrávek [8].
18
Pásky Magnetické pásky patří mezi pevná média sestávající z magnetické vrstvy nanesené na plastické pásce. Do této kategorie nespadají pouze pásky slouţící k zálohování dat, ale v podstatě pásky ve všech běţně pouţívaných audio a videokazetách. Neţ se však pustíme do podrobnějšího popisu páskových mechanik, přiblíţíme si stručněhistorii těchto médií. První vyuţívání magnetických pásek se odehrávalo v Německu 1926 pro záznam zvuků. Ten vycházel z vynálezu magnetického záznamu na drát. Tento Vynález pouţíval prášek oxidu ţelezitého nanesený na dlouhém prouţku papíru. Německá společnost AEG, vyrábějící záznamová zařízení, později tento objev zdokonalila spolu se společností BASF, která k nim vyráběla pásky. Firma AEG začala pouţívat celuloidový pásek místo snadno se trhajícího papíru. Na celuloidový pásek se přes tenkou mezeru kruhového magnetu zaznamenávaly zvukové kmitočty. Takto vznikl první magnetofonový pásek, který měl šířku 6,5 mm a navíjel se na cívku [18] [2]. Nyní se zaměříme na vyuţití magnetických pásek pro uchovávání dat. Pásky byly jedním ze základů počítačového průmyslu a páska byla prvně pouţita pro uloţení dat v roce 1951 na počítači UNIVAC I. Vyuţívání pásek však zdaleka není minulostí a jsou i v současné době stále hojně vyuţívány. Zápis se provádí pomocí páskových mechanik. Proč jsou stále hojně vyuţívány? Je to především kvůli výhodám jako jsou cena, snadné zavádění, spolehlivost, dlouhá ţivotnost, moţnost uchovávání velkého mnoţství dat, nízké provozní náklady a automatizace výměny pomocí robotických páskových mechanik. I kdyţ uběhlo mnoho vody od prvního pouţití této technologie, je neustále předmětem zlepšování a zdokonalování. Pásky jsou vhodné jak pro zálohování tak archivaci a to právě z důvodu dlouhé ţivotnosti. Nevýhodou pásek je sekvenční uloţení dat. To znamená, ţe pokud chceme z pásky obnovit konkrétní soubor, musíme počkat, neţ se páska přetočí na místo, kde je soubor zapsán. Jedná se o relativně pomalou přístupovou metodu. Pásková jednotka pouţívá přesně řízené motory k přetáčení pásky z jednoho kotouče na druhý. Hlava přehrávače se dotýká pásky a umoţňuje tak zápis nebo čtení záznamu. V další části této kapitoly si představíme základní formáty magnetických pásek, které se v dnešní době pouţívají. K nejběţnějším formátům pásek patří LTO (Linear Tape Open), DLT (Digital Linear Tape) aAIT (Advanced Intelligent Tape), které se pouţívají v malých a středních podnicích. Výhodou je velká kapacita. Levné jsou i obsluţné mechaniky [18] [2]. 19
Drábek ve své práci [2] uvádí: „Tyto pásky nabízejí kapacitu od 300 GB do 1600 GB na jednu kazetu. Přenosová rychlost dat je od 27 80 MB/s po 240 MB/s u LTO, od 36 MB/s po 72 MB/s u DLT a od 24 MB/s po 78 MB/s u AIT. Velké podniky využívají formáty T10000 a T9840 pro zálohování i archivaci. Obslužné mechaniky pro tyto formáty již ale stojí více než půl milionu korun. Pásky formátu T10000 disponují kapacitou 500 GB až 1000 GB. Jejich přenosová rychlost je mezi 120 MB/s a 240 MB/s. Magnetické pásky typu T9840 se vyrábějí v objemech 75 GB až 150 GB. Přenosová rychlost dat je pak od 30 MB/s po 60 MB/s.“ Pro zálohování středního a většího systému jsou nezbytné páskové knihovny. Jedná se o zařízení, která obsahují několik slotů pro uloţení pásek. Automatizovaná pásková knihovna umoţní zálohovat data nepřetrţitě 24 hodin denně. Páskové mechaniky pouţívají hardwarovou kompresi dat. S pouţitím páskové knihovny můţeme tedy zálohovat ohromné mnoţství dat. Mluvíme o desítkách tisíc TB [18] [2].
Obrázek 11 - Páskové knihovny10
10
Zdroj: DRÁBEK, Jan. Návrh a realizace řešení zálohování dat ve firmě HP: Exstream. Praha, 2010.
Bakalářská práce. Vysoká škola ekonomická v Praze. Vedoucí práce Ing. David Klimánek, Ph.D
20
2.2 Hardwarové řešení zálohovacích systemů 2.2.1 NAS (Network Attached Storage) NAS (Network Attached Storage – „datové úloţiště na síti“) – tímto termínem označujeme datové úloţiště připojené k místní síti (LAN) a představuje kompletní úloţní systém. NAS je sloţen z jednoho či více pevný disků, které se mohou slučovat do větších datových struktur. Jednodušeji řečeno se jedná o specializované servery určené pro připojení úloţných zařízení jako jsou páskové jednotky nebo diskové soubory RAID k síti. Jedná se o levnější řešení s vyuţitím spíše pro standardní uţivatele (domácnosti a malé firmy) s jednoduchou implementací i managementem. NAS můţe být vyuţit i jako levný a jednoduchý load-balancing nebo jednoduchý web server poskytující úloţiště. Jedná se například o ideální uţivatelské úloţiště velkého mnoţství multimediálních dat. NAS servery primárně podporují NFS (Network File Systems) a CIFS (Common Inetrnet File System). Mezi další podporované protokoly patří například FTP (File Transfer Protocol) nebo SCP (Secure CoPy). NAS server se k síti připojí pomocí Ethernet. Podporuje tedy různé protokoly pro přenos a různé operační systémy [1] [15] [19].
21
Na obrázku vidíme NAS řešení.
Obrázek 12 - NAS11
2.2.2 SAN (Storage Area Networks) Jedná se o síť nezávislou na podnikovém intranetu určenou k propojení úloţných zařízení. SAN je optimalizovaná na ukládání, sběr a výběr bloků a pouţívá technologie Fibre channel nebo řešení orientovaná na IP (iFCP, FCIP, iSCSI). Typickým SAN řešením je síť obsahující minimálně dva servery, které mají přístup k sadě disků skrze propojení s minimálně jedním Fibre Channel switchem. Pro větší bezpečnost se vyuţívají obyčejně switche dva [1] [15].
11
Zdroj: DAS, SAN, NAS: apexmicrosystems.com [online]. [cit. 2012-09-15]. Dostupné z:
http://www.apexmicrosystems.com/?page_id=518
22
Na obrázku vidíme malé SAN cluster řešení.
Obrázek 13 - SAN12
SAN umoţňuje geografické rozdělení úloţných systémů skrze Fiber Channel konektivitu. Toto je velmi taktické/zajímavé řešení z pohledu disaster recovery pro organizace s MAN sití (Metropolitan area networks). Sítě SAN vhodně doplňují investice do virtualizace serverů, protoţe mnoho funkcí virtualizace serverů vyţaduje právě úloţiště SAN. Na rozdíl od řešení NAS prezentuje SAN celou síť, která propojuje veškerá zařízení určená k ukládání dat a servery. Výhody SAN jsou výkonnost, spolehlivost, moţnost řízení a především mohou nekonečně růst, coţ je ideální do podnikových sítí, které mohou růst velmi
12
Zdroj: DAS, SAN, NAS: apexmicrosystems.com [online]. [cit. 2012-09-15]. Dostupné z:
http://www.apexmicrosystems.com/?page_id=518
23
rychle. Nevýhodou SAN řešení je však cena. Nepatří zrovna mezi levné záleţitosti a to kvůli technologii Fibre Channel, na níţ stojí [1] [15]. SAN nenahrazují NAS. Obě řešení se mohou vzájemně doplňovat. Následující tabulka tato řešení porovnává.
Tabulka 2 - Porovnání NAS a SAN řešení13
2.2.3 DAS (Direct Attached Storage) Jedná se o úloţná zařízení, která jsou přímo připojená k serveru, přesněji se jedná o připojení jednoho nebo více disků k serveru nebo serverům, případně samostatnému počítačipro ukládání dat. DAS poskytuje celou škálu moţností řízení dat. Řešení můţe být tak jednoduché jako třeba druhý přidaný hard drive ve stolním počítači. Tento přidaný externí HDD se pak připojuje na server. Pouţívaným rozhraním u DAS řešení je EIDE (známé spíše pod označením ATA), USB, případně spolehlivější SCSI. Tato varianta často vyuţívá diskové pole podle specifikací RAID [14] [15].
13
Zdroj: DAS, SAN, NAS: Varianty řešení ukládání a zálohování dat: systemonline.cz [online]. [cit.
2012-09-15]. Dostupné z: http://www.systemonline.cz/clanky/das-san-nas.htm
24
Na obrázku vidíme DAS řešení.
Obrázek 14 - DAS14
14
Zdroj: DAS, SAN, NAS: apexmicrosystems.com [online]. [cit. 2012-09-15]. Dostupné z:
http://www.apexmicrosystems.com/?page_id=518
25
3 Typy záloh V této části práce si představíme typy záloh, s jakými se můţeme v praxi setkat. Ukáţeme si, jak se dají zálohovat soubory a jak databáze.
3.1 Plná záloha (Full BackUp) Mluvíme-li o plném zálohování, mluvíme o nejzákladnějším typu zálohování, které hraje roli ve všech zálohovacích rutinách. Předmětem zálohy jsou všechny zadané soubory bez ohledu na to, zdali byly od posledního zálohování aktualizovány či nikoli. Při plném zálohování je ignorován archivní stav a jsou plně uloţeny všechny soubory definované ve vstupním seznamu. Úvodní plnou zálohou ať uţ disku, adresáře nebo agendy by mělo začít kaţdé zálohovací schéma, které zajistí obnovitelnost výchozího stavu [5].
3.2 Přírůstková záloha (Incremental BackUp) Jedná se o metodu částečného zálohování, která umísťuje aktualizovaná data jako přírůstky zálohových setů. Přírůstková záloha zpracovává pouze ty soubory, které byly v době od posledního plného nebo přírůstkového zálohování aktualizovány. Přírůstková zálohovací rutina by měla automaticky samostatně rozhodovat, které soubory budou v daném běhu zálohovány. Jaký soubor byl aktualizován a má být předmětem zálohování zajistí nastavení archivačního označení na hodnotu ZAPNUTO. Na konci zálohování jsou pak archivní bity všech vyznačených souborů nastaveny na VYPNUTO. Stoprocentní ochranu dat však zajistí kombinace přírůstkového zálohování, které de-facto zaznamenává jen nejposlednější stavy aktualizovaných souborů, s metodou plné zálohy. Pro zajištění ochrany dat je třeba mezi plnými zálohami vţdy pravidelně provádět přírůstkové zálohování. V případě selhání disku se obnova provádí z poslední plné zálohy plus všech navazujících přírůstků od této plné zálohy. Tato metoda patří mezi nejrychlejší, protoţe se při ní zaznamenávají pouze nejposlednější aktualizace nebo to, co bylo nově vytvořeno [5].
26
3.3 Rozdílová záloha (Differencial BackUp) Jedná se rovněţ o metodu částečného zálohování, které však ukládá všechny ty soubory, které byly aktualizovány v době od posledního plného zálohování, čímţ se liší od přírůstkového zálohování, které zálohuje jen nejposlednější změny. Přiblíţíme si, jaký je technický rozdíl mezi rozdílovým a přírůstkovým zálohováním. Metody se liší ve způsobu zpracování archivačního označení po zkompletování zálohového setu jednodušeji po dokončení zálohy. Přírůstkové zálohování nastaví archivní bity zpracovaných souborů na VYPNUTO zatímco po rozdílovém zálohování zůstávají nastaveny na ZAPNUTO, coţ zajistí, ţe budou dané soubory při následujícím zálohování opět předmětem operace a to i v případě, ţe nebyly v mezidobí aktualizovány. V případě této metody není nutné v období mezi dvěma plnými zálohami udrţovat všechny rozdílové sety, ale stačí vţdy jen ten poslední. Je to proto, ţe rozdílové zálohování zaznamenává všechny změny od posledního plného zálohování. V případě poškození disku stačí k obnově dat poslední plná záloha a poslední rozdílový set. V návaznosti na poslední tři kapitoly bych se ještě rád zmínil o zálohovacím cyklu. Z předešlého výkladu je zřejmé, ţe většina zálohovacích rutin kombinuje plné zálohování s řadou částečných záloh. Zálohovací proces je tedy vhodné organizovat jako určitý cyklus, ve kterém se organizovaně střídá plné zálohování s částečným. Například rozdílové v průběhu týdne a plné vţdy na konci týdne. Pro evidenci zálohových setů celého zálohovacího cyklu můţeme vést katalog [5].
27
Evidenční struktura katalogové evidence je znázorněna na následujícím obrázku.
Obrázek 15 - Evidenční struktura katalogové evidence15
3.4 Soubory a jejich zálohování Zálohování souborů se týká více standardních uţivatelů neţ velkých firem, kde se zálohují spíše celé databáze (viz níţe) a file systémy. Soubory v domácím prostředí mohou být například fotografie, hudba, filmy, textové dokumenty, atd. Na zálohu myslí většina uţivatelů aţ tehdy, kdyţ uţ je pozdě. Pokud však pravidelně zálohujete, nemusí tomu tak být. Pokud myslíte na zálohování souborů, vyplatí se přemýšlet jiţ rovnou na vytvoření obrazu celého disku. Po obnově pak budete mít zpět nejen soubory, ale také celý operační systém. Dobré zálohovací programy umí jak zálohovat samotné soubory, tak vytvářet zálohu celého systému do jednoho obrazu. Velmi bezpečné je ukládání záloh na externí disky, které nejsou v počítači. Skvěle se k tomu hodí například domácí úloţiště, které máte v síti, tzv. NAS (Network Attached Storage). Při zálohování souborů je důleţité nastavení záloh. Pokud na počítači pracuje uţivatel na denní frekvenci i s vytvářením dokumentů, určitě se vyplatí denní záloha. Pokud je frekvence práce s počítačem niţší a ukládání dat méně časté, stačí frekvence týdenní či dokonce
15
Zdroj: LEIXNER, Miroslav. PC - zálohování a archivace dat. V Praze: Grada, 1993. Nestůjte za dveřmi.
ISBN 80-854-2473-8.
28
měsíční. Některé programy dokonce nabízí moţnost vytváření zálohy při vypínání nebo startování počítače. Při prvním zálohování by měl uţivatel vytvořit zálohu plnou a následně rozdílovou nebo přírůstkovou [26]. Přidáme si pár dobrých rad, jak preventivně svoje soubory chránit. Instalujeme pouze software, který potřebujeme Vyhneme se neprověřeným programům Pravidelně aplikujeme aktualizace operačního systému Pravidelně aplikujeme aktualizace antivirového programu Počítač nevypínáme vytaţením ze zásuvky Nevystavujeme počítač negativním vnějším vlivům (teploty) A hlavně pravidelně zálohujeme
29
Jak by měla vypadat optimální strategie zálohování vidíme na následujícím obrázku.
Obrázek 16 - Optimální strategie zálohování16
3.5 Databáze a jejich zálohování Definice databáze: V práci [35] autor uvádí: „Databáze je sdílená kolekce logicky souvisejících dati s popisem své datové struktury, organizovaná pro optimální manipulaci s perzistentními daty a získávání informací pro potřeby informačního systému. Jinými slovy: Databáze je větší seskupení dat (informací), která logicky souvisejí a lze je nějakým způsobem zpracovávat, vyhodnocovat a analyzovat.“
16
Zdroj: SCHREIBER, Manuel. Absolutní bezpečí pro Vaše data. Chip [online]. 2009, č. 7. [cit. 2012-10-01]
Dostupné z: http://earchiv.chip.cz/cs/earchiv/vydani/r-2009/chip-07-2009/absolutni-bezpeci.html
30
Oracle Nyní si řekneme něco o zálohování databáze Oracle. Zálohování a následná obnova dat patří mezi nejdůleţitější aspekty práce DBA administrátorů. Pokud se administrátorovi podaří ztratit firemní data, můţe si být jist, ţe ztratí práci. Jaké strategie pro zálohování Oracle databází jsou k dispozici? Jsou to následující metody. Export/Import – Exporty jsou logické databázové zálohy, přesněji je to extract logických definicí a dat z databáze do souboru. Off-line záloha (chladná) – v tomto případě se vypne celá databáze a zazálohují se všechna data, logy a kontrolní soubory. Tato záloha probíhá v off-line reţimu a databáze je pro uţivatele v daný moment nedostupná. On-line záloha (horká) – v tomto případě je databáze dostupná, ale běţí v ARCHIVELOG modu. V této situaci se nastaví tablespaces do backup modu a zazálohují se soubory, stejně jako kontrolní soubory a soubory archivního redo logu, coţ je soubor, který obsahuje změny provedené v databázi potvrzenými transakcemi. Tato záloha probíhá v on-line reţimu a databáze je pro uţivatele v daný moment dostupná. RMAN zálohování – RMAN (Recovery Manager) je pomocný program poskytovaný firmou Oracle, jeţ je určený speciálně pro zálohování a obnovu databázových dat Oracle databází. RMAN je dodáván s databázovými servery a nepotřebuje separátní instalaci. Je uloţen v RACLE_HOME/bin adresáři. Ve skutečnosti je RMAN aplikace, která převádí příkazy do PL/SQL rozhranní. Volání PL/SQL je pevně směřováno do jádra Oraclu a nevyţaduje otevření databáze. RMAN umí zálohovat off-line i on-line. Co neumí je přímé zapisování na pásky, ale pokud se vyuţije nástroj třetí strany (Veritas, Omiback), můţe se RMAN zaintegrovat do tohoto nástroje a vyuţít se pro správu záloh v páskových knihovnách.S RMANem se dá pracovat jak z příkazové řádky tak z aplikace Oracle Enterprise Manager [20].
31
Na obrázku je vidět jednoduchá ukázka RMAN zálohování.
Obrázek 17 - Ukázka RMAN zálohování17
SQL server Další ukázka popisu databázového zálohování se bude týkat plné databázové zálohy na SQL server. Na SQL serveru se dají k vytvoření plné zálohy pouţít nástroje Server Management Studio, Transact-SQL nebo PowerShell. My si ukáţeme postup s vyuţitím Transact-SQL. Pro vytvoření plné databázové zálohy se pouţije příkaz BACKUP DATABASE, ve kterém je třeba specifikovat jméno zálohované databáze a zálohovací zařízení, kam se záloha bude ukládat. Základní syntaxe vypadá následovně: BACKUP DATABASE database S určením TO backup_device [ ,...n ], coţ je specifikace zařízení určeného pro zálohovací operace, ať uţ fyzického zařízení nebo logického, pokud je definováno. Pro specifikaci fyzického zařízení se mohou pouţít moţnosti DISK nebo TYPE. ({ DISK | TAPE } =physical_backup_device_name) Dále s určením [ WITH with_options [ ,...o ] ], coţ je nepovinné. Specifikují se zde doplňující informace a moţnosti jako je komprese, název zálohy a popis, případně formát [13].
17
Zdroj: Oracle database: Backup and Recovery FAQ. orafaq.com [online]. [cit. 2013-02-09]. Dostupné z:
http://www.orafaq.com/wiki/Oracle_database_Backup_and_Recovery_FAQ
32
Na obrázku je vidět příklad Transact-SQL zálohování na zařízení DISK.
Obrázek 18 - Příklad Transact-SQL zálohování na zařízení DISK18
3.6 Clone Clone patří mezi snadno pouţitelné zálohovací utility. Dá se vyuţít ke konfiguraci pravidelného a automatického zálohování kritických dat z osobních počítačů. Stačí jedna konfigurace
a
není
třeba
se
dále
starat.
Výhodou Clonu můţe být fakt, ţe nevyuţívá ţádnou kompresi. K obnovení dat není nutný ţádný externí program, zálohované soubory jsou jednoduše překopírované do předem určeného adresáře. Případná obnova dat se provádí prostým zkopírováním informací a dat z daného adresáře . Zálohování prostřednictvím clonu můţe probíhat také na CD-RW či DVD-RW disky či síťový server. Není zde určitě omezení na zálohování pouze na pevné disky. Výhodou jsou filtry, které můţete při zálohování vyuţívat. Tyto filtry které vám pomohou najít a uloţit dokumenty, které jsou pro vás důleţité [12].
18
Zdroj: Create a Full Database Backup (SQL Server). Msdn.microsoft.com [online]. [cit. 2013-02-09].
Dostupné z: http://msdn.microsoft.com/en-us/library/ms187510.aspx
33
Ukázka clonu v praxi:
Obrázek 19 - Ukázka clonu19
Nyní si přiblížíme využití v praxi, postupy a software. Soubory sice můţeme chránit pravidelnou zálohou, ale neochrání však operační systém. Pokud dojde k poškození Windows, je nutná nova instalace. To však nestačí. Dále budete muset nainstalovat také všechny aplikace a provést nastavení. Řešením je v tomto případě Clonezilla. Jedná se o zálohovací nástroj, který se dal sehnat například na bootovacím CD SysClone, který byl k nalezení na Chip DVD. Postup je takový, ţe obraz z Chip DVD vypálíte na prázdné CD, třeba pomoci nástroje ImgBurn, a z něj nabootujete CLONE - SOFTWARE Mezi výhodné a přínosné cloning aplikace patří DriveImage XML a to díky své přednosti, ţe není třeba provést restart počítače, aby cloning proces započal. Znamená to, ţe můţete při započetí cloning procesu normálně s počítačem dále pracovat.
DriveImage XML nabízí
jednoduché cloning operace disk na disk, kopírování disku do image nebo kopírování individuálních partitions [12] [30].
19
Zdroj: Clone v3. Newtonsoftware.co.uk [online]. [cit. 2013-02-12]. Dostupné z:
http://newtonsoftware.co.uk/clone/
34
3.7 Snapshots V práci [28] autor uvádí: „Snapshot je standardní termín pro schopnost zaznamenat stav paměťového zařízení k danému okamžiku, určená pro rychlou obnovu dat. Snapshot je kopií dat k určitému času (Point-in-time-copy). Vetšinou je Snapshot po vytvoření okamžitě k dispozici pro použití v jiných aplikacích, jako je zálohování, testování či analýza dat. Originální data jsou i nadále k dispozici aplikaci bez přerušení provozu, pouze s minimálním pozastavením datového toku. Díky snapshotům je možné rychle obnovit například omylem smazaná data bez nutnosti použití obnovy pomocí zálohovacího software. To je obzvláště přínosné, pokud úložiště umožňuje vytvořit velké množství snapshotů v krátkých časových intervalech. Vytváření snapshotů s sebou nese nároky jak na výkon, tak na kapacitu datového úložiště v závislosti na použité metodě tvorby snapshotů.“ Způsobů, jak vytvořit snapshot, je hned několik. Kaţdý z nich má své výhody a samozřejmě i nevýhody. Pravděpodobně nejvíce pouţívaným postupem v praxi je Copy-on-write (kopie při zápisu), kdy je snapshot vytvořen v pro něj vyhrazeném prostoru, zkopírováním metadat s definicí umístění bloků originálních dat. Pokud chceme některá data přepsat, jsou bloky určené k přepsání zkopírovány do prostoru vyhrazeném pro snapshoty a aţ následně se provede přepis dat. Metoda snapshotů „kopie při zápisu“ se dá shrnout do následujícího postupu: 1. Vytvoří se logická kopie dat 2. Pokud chceme data přepsat, jsou bloky určené k přepsání zkopírovány do prostoru vyhrazeném pro snapshoty a aţ následně přepsány 3. Čtení ze snapshotu je přesměrováno na originální data, pokud ještě nebyla změněna. 4. Čtení ze snapshotu dat, která jiţ v originální lokaci byla změněna, je provedeno ze snapshot. Jak jsem jiţ na začátku uvedl, kaţdý snapshot má i svoje nevýhody. Copy-on-write snapshot se vyznačuje vysokým nárokem na výkon zařízení které snapshot vytváří. Důvodem je nezbytnost provedení dvou operací při změně originálních dat. Nejprve se totiţ data kopírují do určeného prostoru a následně se provádí změna dat. Další metodou vytváření snapshotů je metoda Split-Mirror. Jedná se o metodu známou jako Clone, o které jsme si jiţ v této práci psali. Mezi významné výhody této metody patří fyzické oddělení kopie dat, coţ znamená, ţe při vytvoření snapshotu nedochází k zatěţování disků s
35
originálními daty. Nevýhoda nás napadne z řešení tohoto snapshotu a to jsou vysoké nároky na kapacitu. Přesněji je potřeba mít dvojnásobnou kapacitu úloţiště. Třetí metodou, o které bych se rád zmínil, je metoda Redirect-on-Write (přesměrování při zápisu). Při vytváření snapshotu dochází k zmrazení originálních dat a při novém zápisu dochází k přesměrování těchto zápisů do volného diskového prostoru. Tím je vliv snapshotu na originální data minimální. Při vytváření snapshotu je důleţitá konzistence dat. Ta se zajistí kraťoučkým pozastavením IO operací během vytváření snapshotu. Na běh aplikace má krátkodobé pozastavení IO operací zanedbatelný vliv [28].
3.8 Thin provisioning (TP) Virtualizace úložišť Thin Provisioning je metoda, která optimalizuje vyuţití volného prostoru v sítích SAN (Storage Area Networks), v rozsáhlých centralizovaných storage systémech a storage virtualizačních systémech. TP funguje tak, ţe flexibilně přiděluje prostor diskového úloţiště mezi více serverů. Kaţdý server (uţivatel) vyuţívá v daný čas to minimum diskového prostoru, které právě potřebuje [31] [32] [33].
36
4 Rizika spojená s ukládáním a zálohováním dat V této kapitole si rozlišíme tři základní termíny spojené s rizikem ukládání a zálohování dat. Ztráta dat Ke ztrátě dat můţe dojít například nemoţností číst zálohovací média (DVD, flash disk, atd.), na kterých máme data.Můţe přestat fungovat částečně nebo úplně harddisk a podobně. Čím můžeme snížit dopady takovéto nepříjemné situace? 1) Pokud se nosič dat chová nestandardně, nezobrazuje všechny nebo některé soubory, určitě se snaţíme zabránit dalšímu zápisu na tento nosič. Ukládání nových dat na poškozený nosič můţe způsobit částečné nebo kompletní přepsání hledaných souborů a tím jejich obnovu výrazně zkomplikovat. 2) Disky ať uţ externí nebo interní, které vykazují zjevné známky mechanického poškození nebo se projevují nestandardními zvuky, nepřipojujeme a nespouštíme. 3) Nepokoušíme se otevřít tělo poškozeného média. 4) Vyhneme se formátování nosiče 5) Nespouštíme utility CHKDSK nebo SCANDISK. 6) Nespouštíme defragmentaci ani antivirovou kontrolu. Ukvapené a laické snahy mohou zbytečně komplikovat obnovu dat, případně ji úplně znemožnit. Vyvarujme se tedy získání nedostupných souborů bez potřebných znalostí a zkušeností. U této podkapitoly je nutné zmínit ţivotnost médií. Tu si musí bezpodmínečně kaţdý uţivatel hlídat a dbát na skutečnost, ţe u kaţdého typu nosiče se můţe zásadně lišit [23].
37
Níţe uvedená tabulka ukazuje ţivotnost některých médií.
Tabulka 3 – Životnost médií20
Zničení dat Zničení dat a ztráta dat se mohou jevit jako stejné termíny. Přesto bychom je měli trochu odlišit. Na rozdíl od výše uvedené ztráty dat, nastává zničení dat během přírodních katastrof, povodní, poţárů, a podobně. Zde bych zmínil termín geo-redundance, coţ je výraz pro geografickou redundanci tedy uloţení dat na oddělené na sobě nezávislé lokality. Jedná se o uloţení kopie zálohy na úplně jinou adresu. Toto řešení se pouţívá jako prevence proti zničení dat právě při poţárech a podobných událostech [10] [34].
20
Zdroj: Ţivotnost CD DVD a dalších digitálních médií. Oko.yin.cz [online]. [cit. 2013-02-27]. Dostupné z:
http://oko.yin.cz/2/zivotnost-cd-dvd-a-dalsich-digitalnich-medii/
38
Zcizení dat Organizace se často snaţí zabezpečit své IT prostředí proti negativním vlivům zvenčí. Ne vţdy si uvědomují, ţe velkou hrozbou pro firemní data jsou i samotní zaměstnanci. Existuje několik situací, kdy mohou zaměstnanci firemní data zcizit. Například si data odebere zaměstnanec, se kterým byl rozvázán pracovní poměr. Firemní údaje mu mohou poslouţit pro další činnost a jednání.Jednou z variant, jak předejít moţnému úniku citlivých údajů ze společnosti, je provedení bezpečnostního auditu nezávislou externí organizací. Jako preventivní opatření proti opakování případů zcizení dat zaměstnancem, můţe společnost například vyuţít sluţeb bezpečnostních specialistů neboprovést preventivní kroky v podobě zavedení postupů dle platných norem (například ČSN ISO IEC 17799) [24]. V roce 2012 zveřejnila síť poradenských společností KMPG výsledky svého průzkumu CEE Data Theft Survey 2012. I podle tohoto průzkumu se většina oslovených společností soustředí především na ochranu před externími útoky. Jako prostředky ochrany před vnějším světem vyuţívají firmy na prvním místě hardwarové firewally a antivirový software, jako další ochranou jsou omezená přístupová práva a e-mailové filtry. Výsledkem průzkumu však je, ţe riziko krádeţe firemních dat poroste hlavně ze strany zaměstnanců. V těchto případech není zapotřebí ţádného hackování. K útoku zevnitř firmy stačí flash disk nebo mobil. Důvody jsou různé. KPMG ve zprávě pro média uvádí [17]: „Někteří z nich totiž mohou ukradená firemní data dovést k lukrativní pracovní pozici u konkurence“. Druhým největším moţným původcem či iniciátorem krádeţe dat je podle KPMG konkurence. Nejméně se oslovené firmy obávají krádeţe dat ze strany zákazníků a dodavatelů [17]. Tato situace je šancí pro dodavatele bezpečnostních řešení. Na závěr této kapitoly si představíme ukázku SW, který tuto problematiku řeší. Jedná se o AreaGuard Neo [11].
39
Následující obrázek ukazuje klíčové vlastnosti AreaGuard Neo pro bezpečnost firemních dat.
Obrázek 20 - Klíčové vlastnosti AreaGuard Neo pro bezpečnost firemních dat21
21
Zdroj: AreaGuard Neo. Areaguard.cz [online]. [cit. 2013-01-17]. Dostupné z: http://www.areaguard.cz/k-
cemu-je-a-co-je-areaguard-neo?utm_source=google&utm_medium=cpc&utm_campaign=unikdat&utm_content=ztrata-dat&gclid=CMvggOPxg7YCFchY3godhT0Anw
40
5 Konkrétní řešení záloh 5.1 Domácnosti Předpokládejme, ţe v případě domácností nebude vyuţíván příliš sofistikovaný zálohovací software, ale spíše software, se kterým dokáţe pracovat většina členů domácnosti a tomu odpovídající média. Takovým typickým médiem jsou například vnější paměti, mezi které patří: paměť s pevným diskem (hard disk) paměť s optickým diskem (CD, DVD, Blue Ray) Ty jsme si jiţ zmínili výše. Dále jsou to: Mezi další vnější paměti patří: paměť s pružným diskem (disketa 3,5”) – 1,44 MB Jedná se o paměť pracující s výměnným paměťovým médiem – disketa. Záznam a čtení se provádí naprincipu magnetického záznamu. Tato metoda umoţňuje data libovolně zapisovat, přepisovat, mazat ačíst. Disketa se v mechanice roztočí rychlosti 360 ot. /min. V dnešní době téměř nevyuţívaná USB Flash disk (usb disk) – od 512 MB po 64 GB USB Flash disk je čistě elektronická součástka bez jakýchkoli pohyblivých dílů. USB flash disk se připojuje do usb portu na zádní stráně počítače. Kapacita USB Flash disku se pohybuje od 512 MB do 4096 MB.Data jsou libovolně mazat a zapisovat. paměťová karta (card) – od 512 MB po 32 GB Paměťové karty jsou dalším zařízením na dlouhodobé uloţení dat, nezávisle na napájení. Paměťové kartymají uplatnění u digitálních fotoaparátů, kamer a mobilních telefonů [6]. Tři základní pravidla, která by měli domácí uţivatelé dodrţovat jsou: ukládat data stále na stejná místa nastavit zálohování manuální i automatické pouţívat zálohovací program V případě domácností je nejlépe na zálohování nemyslet a nechat systém pracovat za vás. Jako ukázku zálohovacího software pro domácí prostředí uvedu aplikaci NTI Backup NOW!, 41
která je ke staţení na internetu. Jedná se o zálohovací program pro pouţití s přepisovacími mechanikami CD-R nebo CD-RW. Práce s aplikaci NTI Backup NOW! je velmi intuitivní a jednoduchá a pokud se uţivateli podaří aplikaci na začátku správně nastavit, je další chod v podstatě bez nutnosti hlídání [4] [6].
Obrázek 21 - Zabezpečení dat22
5.2 Malé a střední firmy V této kapitole si zmíníme metody zálohování, které jsou vhodné spíše pro malé a střední firmy neţ pro domácí prostředí. Ve firemním prostředí je zálohování na denním pořádku a nutností. Jako první bych zmínil vyuţití menších síti LAN (Local Area Network), ve kterých patří mezi poměrně vyuţívaný způsob zálohování dat zálohování na síťová úloţiště, označované jako
22
Zdroj: SCHREIBER, Manuel. Bible zálohování. Chip [online]. 2009, č. 12. [cit. 2012-10-01]
Dostupné z: http://earchiv.chip.cz/cs/earchiv/vydani/r-2009/chip-12-2009/bible-zalohy.html
42
metoda NAS (Network Attached Storage). Pracovníci firem (uţivatelé) ukládají svá data do sdílených úloţišť na síťových discích nebo serveru. Zodpovědnou osobou za správu dat je obvykle správce sítě, který má na starost i odpovídající zálohování. Určitě nesmíme opominout zálohování na pásky, které je stále často aplikováno především ve větších organizacích. Zálohy na pásku se uskutečňují páskovými mechanikami nebo prostřednictvím zálohovacích knihoven. Další moţností zálohování firemních dat je zálohování na FTP server (File Transfer Protocol) . Tento způsob zálohování umoţňuje ukládat data na zcela oddělené místo od zdrojových dat, coţ je varianta velmi bezpečného uloţení. Mezi nevýhody této metody můţeme uvést moţnost odposlouchávání třetí osobou, jelikoţ není přenos dat v základu nějak elektronicky zabezpečen. Některé zálohovací programy, které zálohování dat na FTP server umoţňují, nabízejí moţnost nastavení typ šifrování před odesláním na vzdálený server. Přenos můţe být také negativně ovlivněn rychlostí připojení k internetu, kdy rychlost přímo úměrně ovlivňuje i rychlost přenosu souborů. Při nízkorychlostním připojením k internet můţe být přenos dat zoufale pomalý [7] [8].
5.3 Řešení záloh oddělení CNO firmy Vodafone CZ V této sekci si představíme politiku, stanovenou metologii, zodpovědnosti a pravidla zálohování, archivace a Offsite Storage pro produkční systémy spravované oddělením CNO (Core Network Operation) ve firmě Vodafone CZ.
System Backup policy Politika zálohování je stanovována ještě před uvedením daných systémů do produkčních provozních prostředí a je sestavována systémovými administrátory na základě daných doporučení a pravidel a je schvalována vedením oddělení CNO. Procedura zálohování obsahuje následující informace: Název systému Backup typ Úroveň/stupeň zálohování Frekvence a časování Typ médií a štítkování Duplication (zdvojování) 43
Retenční dobu (jak dlouho uchovávat data) Úloţiště dat Testing Nezbytnou podmínkou převzetí kaţdého nového systému CNO teamem od ostatních oddělení je existující Backup/Restore procedura. Procedura musí být ověřena funkčními testy, které jsou součástí akceptačních testů. Po schválení politiky zálohování je zodpovědnou osobou pro zajišťování zálohovacích procesů daný CNO inţenýr.
Základní pravidla a doporučení Nyní se dostáváme k samotným základním pravidlům a doporučením, které se ve VF CZ aplikují. Typ zálohy CNO aplikuje různé typy záloh podle poţadavků na zálohy jednotlivých systémů a to z pohledu podniku, zákonného i oddělení technology. Jsou jimi: celková systémová záloha (full system backup), přírůstková systémová záloha (incremental system backup), backup statických dat (například záloha konfigurace aplikací nebo záloha aplikačního softwaru), backup dynamických dat (například záloha databáze či billingových souborů) Rozhodnutí jaký typ pouţijeme záleţí i na business hodnotě daných dat a poţadovaném čase obnovení. Frekvence a časování Běţným postupem je spouštění zálohování mimo standardní pracovní hodiny. Vyhodnotí se celkový čas běhu a následně se stanoví časové okno pro zpracování zálohy s dostatečnou rezervou, aby se zálohování nepřekrývalo, to znamená aby se nespouštěly jednotlivé běhy do sebe. Metody zálohování Metody zálohování jsou vybírány s ohledem na skutečnost, kolik dat má být uloţeno a s ohledem na rychlost, s jakou mají být data ze zálohy obnovena v případě problémů. 44
Ve společnosti Vodafone cz jsou preferované následující metody: Backup napřenosná média (například DLT/DDS/DAT pásky, CD-R’s, DVD-Rs, MO (Magneto optical disky), atd.) Backup na takzvané robotic tape library (robotické páskové knihovny) s vyuţitím Central Backup (CEBA) řešení Media labelling Média labelling je výraz pro unikátní označování medií. Kaţdá záloha musí mít unikátní identifikátor – takzvaný Label. Štítek určuje jaký backup je na daném médiu a obsahuje následující informace: Název systému Typ zálohy Backup set (jako například datum, den v týdnu, sekvenční číslo) Formáty užívané ve Vodafone: MxSPnDDMMYY M ~ název síťového prvku (například síťové prvky MSC=M, HLR=H, SCP=S, BSC=B) X ~ sériové číslo síťového prvku SP ~ sub-modul síťového prvku N ~ sériové číslo sub-modulu síťového prvku DDMMYY ~ den/měsíc/rok zálohy DDMMYY/SN_<system_name>_
DDMMYY ~ den/měsíc/rok zálohy a číslo setu (set number) Životnost médií Ţivotnost přenosných médií (DLT pásky, MO disky, atd.) je ve Vodafone CZ nastavena na 4 roky. Detaily jsou znázorněné v níţe uvedené tabulce. Z tohoto důvodu musí mít kaţdé médium speciální label s uvedeným dnem/měsícem/rokem první zapsané zálohy. U médií s ukončenou dobou ţivotnosti zajišťuje CNO odpovědný pracovník jejich bezpečnou likvidaci externí firmou.
45
Nastavení ţivotnosti přenosných médií ve Vodafone CZ. Životnost média daná
Doporučená max. počet záloh
výrobcem
doba využívání média ve VF
DDS II Digital
DDS3
Data Storage
10–20 let
100 full backups
4 roky
100000 cycles
4 roky
DDS4 DAT 72
Digital
DLT tape II
Linear Tape
30 let
Exabyte VXA tape Linear TapeOpen
1000000 cycles
SDLT tape II
LTO (Ultrium)
30 let
15–30 let
500 full backups
200–360 full backups
4 roky
4 roky
Flash memory (USB,
10 let
10 000 cycles
4 roky
PCMCIA) 3-5 let
EXT-HDD
Tabulka 4 - Nastavení životnosti přenosných médií ve Vodafone CZ23
23
Zdroj: VODAFONE CZECH REPUBLIC. Local CNO Backup Management Procedure. Praha, 2011
46
Backup storage (úložiště dat) Všechna zálohovací média jsou umístěna na bezpečném místě a přístup k nim mají pouze autorizované osoby z oddělení CNO. Ve Vodafone CZ používáme následující typy úložišť: on-site (média jsou uloţena na stejné adrese/místě jako zálohovaný systém) off-site (média jsou uloţena na jiné lokalitě) Zde bych opět zmínil termín geo-redundance, coţ je výraz, který jsme si vysvětlili v předešlých kapitolách této práce.Poslední záloha je vţdy uloţena off-site. Řízení bezpečného přístupu. K zamezení neautorizovaného přístupu do trezoru CNO jsou jednou ročně prováděny následující akce: Změna přístupových kódů Revize a odsouhlasení seznamu autorizovaných uţivatelů manaţerem CNO Zabezpečená distribuce nových kódů autorizovaným uţivatelům Duplikování dat Vodafone provádí duplikaci zálohovaných dat pro případ, ţe by došlo k poškození uloţených dat nebo problémům při obnově ze zálohy. Duplikace (zdvojení) znamená, ţe ta samá data jsou ukládána dvakrát vţdy na dvě různá média (většinou i na různá místa/adresy) Vodafone CZ pouţívá CEBA replikaci mezi lokalitami A a B (lokality nepojmenovávám z důvodu neprozrazení důvěrných informací firmy). Retence Retenční dobou rozumíme dobu, po jakou zálohovaná data uchováváme.Důvody pro obnovu mohou být různé návrat k poslední funkční sw verzi/konfiguracizpětné sledování uţivatelských/systémových aktivit, reproces billingových záznamů/transakcíatd. Doporučené retenční doby zálohování jsou uvedeny dále v textu. Backup testing Po kaţdé jednotlivé ukončené backup proceduře provede zodpovědný CNO inţenýr následující kontroly a testy: Úplnost zálohy – Zdali jsou veškerá poţadovaná data úspěšně uloţena na zálohovacím médiu a kontrola zdali nejsou v logu procesu záloh chyby nebo upozornění.
47
Celistvost (integrita) a konzistence záloh – Zdali média obsahují celistvá, korektní a čitelná data, která byla určena k zálohování. Tyto testy jsou zajištěny automaticky pro to určenou aplikací nebo scriptem, které zaznamenávají veškeré aktivity a v případě výskytu incidentu vygenerují alarm. Logy jsou ukládány pro poslední dvě zálohy. Testy obnovy dat Mimo výše uvedených testů se provádí kompletní testy obnovy ze zálohy pro ujištění se, ţe je celá restore procedura plně funkční. Pouţíváme několik metod restore testů. Záleţí na dané situaci a míře poškození, která je daná v testovacím scénáři. Obnova jednotlivých souborů Obnova celého disku Obnova file systému Obnova pouze klíčových dat Veškeré testy se opakují jednou ročně a logy jsou opět ukládány a obsahují informace jako jsou jméno testera a datum a čas. Fault management Zásadní rozdíly a chyby jak během testů tak později i během produkčního ostrého zálohování jsou logovány do Trouble Ticketing systému (Remedy system) a řešeny dle aktuálně platných incident a problem management procedur. Manipulace se zálohovanými daty. Se zálohovanými daty a médii můţe manipulovat pouze autorizovaný CNO Engineer a data ze zálohy jsou vyuţívána pouze pro obnovu ztracených dat a troubleshooting. Veškeré poţadavky na obnovu dat ze zálohovacích médií musí být schváleny CNO managerem a zalogovány do odpovídajícího systému.
Požadavky Nyní se dostáváme ke specifikacím Vodafone poţadavků a implementaci konkrétního řešení. Klasifikace dat Následující tabulka ukazuje definice business priorit pro zálohování dat v prostředích Vodafone CZ. 48
Definice business priorit pro zálohování dat ve Vodafone CZ. Úroveň
popis
1
Jejich ztráta má fatální dopad na hlavní sluţby a způsobuje rozsáhlé
Kritická
finanční ztráty, které mohou silně ovlivnit stabilitu celé firmy. Patří sem
data
veškeré SOX in-scope systémy.
2 Kritická
Jejich ztráta má významný dopad na sluţby a způsobuje nezanedbatelné
data
finanční ztráty.
3 Business Jejich ztráta můţe způsobit sníţení počtu zákazníků. Important 4 Obvykle data interních systémů. Nesouvisí s poskytováním sluţeb Business
zákazníkům.
podpora
Tabulka 5 - Definice business priorit pro zálohování dat ve Vodafone CZ.24
Na kaţdou výše uvedenou úroveň můţe být aplikována kaţdá z typů záloh.Můţe se tedy stát, ţe jeden systém můţe mít několik typů záloh přes všechny úrovně.
24
Zdroj: VODAFONE CZECH REPUBLIC. Local CNO Backup Management Procedure. Praha, 2011
49
Poţadavky u jednotlivých úrovní.
Tabulka 6 - Požadavky u jednotlivých úrovní25
Konkrétní řešení záloh firmy Vodafone Tato sekce ukazuje jiţ Konkrétní řešení záloh firmy Vodafone, kterým je CEBA (Central Backup) systém. CEBA nabízí několik funkcí, které pomohou administrátorům jednoduššeji a profesionálněji splnit poţadavky dané na politiku a strategii zálohování.
25
Zdroj: VODAFONE CZECH REPUBLIC. Local CNO Backup Management Procedure. Praha, 2011
50
Architektura
CEBA PLATFORM SETUP
Obrázek 22 - CEBA PLATFORM SETUP26
CEBA řešení je rozloţeno do dvou lokalit – datová centra v lokalitě A a lokalitě B. Kaţdá instalace se skládá z: Server s datovými poli Tape library (s odnímatelnou sekcí) CEBA A slouţí jako hlavní server a CEBA B jen jako storage node, coţ znamená, ţe B storage node není plně provozuschopný bez serveru v lokalitě A. V případě výpadku CEBA v lokalitě A začne CEBA B slouţit jako master, ale podmínkou je manuální instalace potřebného software serverových modulů, po čemţ budeme mít opět přístup k zálohovaným datům. Toto řešení je z důvodu finanční úspory na licencích.
26
Zdroj: VODAFONE CZECH REPUBLIC. Local CNO Backup Management Procedure. Praha, 2011
51
Dostupné funkce CEBA systému Automatické zálohování – v případě integrace do CEBA systému jiţ nejsou potřebné manuální zásahy. Preferovaná politika: denní přírůstková záloha + týdenní plná záloha. Integrované moţnosti CEBA: Server–Client setup – předpokladem je instalace client sw module na zálohovaném serveru. Zálohy potom mohou být kontrolovány buď serverem automaticky nebo klientem (manuálně nebo scriptem). FTP/SCP file transfer – FTP/SCP přenos souborů do CEBA úloţiště, které je denně zálohováno do tape library. Tato metoda se vyuţívá pro klienty, kteří nepodporují metodu Server–Client setup.Přesněji dodavatel nedovolí instalaci klienta. Data se nakopírují na pole CEBA a CEBA pole se zálohuje na pásky do knihovny. Automatický testing během zálohování – jsou zajišťovány sebekontrolní mechanismy, testy integrity (čitelnost pásky) a kontroly úplnosti. Automatická duplikace – záloha z primárního CEBA nodu můţe být replikován do sekundárního nodu v jiné lokalitě. Implicitní CEBA nastavení je automatická replikace záloh úrovně 1 kaţdý den, úrovně 2 kaţdý týden (full backup). Automatická retence záloh – je konfigurovatelná pro kaţdého backup klienta. Současné implicitní nastaveni jsou 3 měsíce. Automatický test obnovy – CEBA poskytuje automatický restore: obsah zálohy je obnoven do /dev/null kde probíhají kontroly čitelnosti a celistvosti uloţených dat. Rychlá obnova – kaţdá záloha je indexována pro jeden týden zpět, coţ znamená, ţe určitý specifický file, hledaný v záloze posledního týdnu, je jednodušše a velmi rychle obnovitelný. V případě ţe se jedná o potřebu restoru starší zálohy, je nutné obnovit kompletní file systém a z něj vybrat konkrétní soubor.
Full system restore (Disaster Recovery) Obnova kompletního systému CEBA neposkytuje plně automatický disaster recovery! Při kompletním systémovém kolapsu je pro obnovu potřeba provést postupně několik manuálních kroků. Umístění nového HW – nový HW musí mít stejné nebo velmi podobné atributy jako poškozený HW – CPU architektura, diskové ovladače, počet disků/partitions. Velikost disku/partition můţe být samozřejmě větší.
52
Operační systém a CEBA klient package instalace. Toto musí být provedeno na dodatečném/odlišném disku, neţ na tom který je předmětem obnovy. Tento krok se dá vynechat pokud je k dispozici “Live” CD s CEBA klientem, ze kterého se dá provést nabootování. CEBA klienta musíme mít, abych se jím mohl připojit na centrální CEBA server. V našem případě na server v lokalitě A. Rozdělení disku na sekce (partitioning) a vytvoření file systemu, aby byly disky ve stejném stavu jako ty původní Obnova file systému na novém HW z CEBA řešení. CEBA uloţená data samozřejmě neztratí a teď máme, díky předchozím krokům, k datům přístup. Provede se přesun na nový HW. Nabootování nového HW z čerstvě obnovené partition/sekce. Obnovou kompletního systému pomocí CEBA řešení bych kapitolu záloh ve firmě Vodafone CZ uzavřel [9] [10].
53
6 Závěr Cílem této práce bylo prostudovat problematiku zálohování a obnovy dat, popsat je čtenáři a zvolit vhodnou praktickou ukázku konkrétního řešení záloh ve velké organizaci. Volba způsobu zálohování dat, metody a celkového přístupu vyţaduje komplexní uchopení dané problematiky. V teoretické části jsem věnoval pozornost zodpovězení základních a nejdůleţitějších otázek zálohování a souvisejících aspektů ve čtyřech kapitolách, ve kterých postupně vysvětluji pojem zálohování dat, důvody a potřebný software. V následující kapitole představuji technologie pro zálohování dat, média a hardwarové řešení zálohovacích systémů. V posledních dvou kapitolách jsem čtenáře obeznámil s osmi základními typy záloh a přiblíţil jsem rizika spojená s ukládáním a zálohováním dat jak v domácím tak firemním prostředí v podobě ztráty, zničení nebo zcizení dat. Praktickou část jsem zahájil obecnějším pojetím konkrétních řešení datových záloh odděleně v domácnostech a menších firmách. Další zajímavou a zároveň poslední částí práce je praktická ukázka řešení záloh oddělení CNO (Core Network Operation) firmy Vodafone Czech Republic a.s. Ukázka představila politiku, stanovenou metologii, zodpovědnosti a pravidla zálohování a archivace v jedné z dceřiných společností nadnárodní organizace, která je druhý největší mobilní operátor na světě s 333 milióny zákazníků v 28 zemích pěti kontinentů. K výběru praktické ukázky přispěla skutečnost, ţe v dané firmě pracuji jako systémový administrátor. Tato práce byla vypracována především jako rešeršní. Čtenáři přinesla přehled základních technik zálohování dat a vysvětlila obecný význam zálohování stejně jako vysvětlila proč bychom měli zálohovat, kdo, co, kdy, kam, na co a jaký software zvolit. Praktickou ukázkou konkrétního systému zálohy má čtenář moţnost ucelit si obrázek komplexního řešení celého zálohovacího procesu firemního charakteru. V oblasti zálohování lze uplatnit mnoho strategií a postupů. Je to vţdy individuální poţadavek kaţdého uţivatele, který rozhodne, jakou cestou se dát. Není moţné přesně stanovit optimální postup zálohování, který by vyhovoval všem bez rozdílu a byl by obecně platným. Je to otázka poţadavků a moţností daného zadavatele. Co by mělo ale pro všechny uţivatele společně platit je na zálohy nezapomínat a provádět je pravidelně, aby o svá cenná data jednoho dne nepřišli.
54
7 Seznam použité literatury [1]
DORIAN Cougias. The Backup book: disaster recovery from desktop to data center. 3. ed. Lecanto, FL: Schaser-Vartan Books, 2003. ISBN 09-729-0390-9.
[2] DRÁBEK, Jan. Návrh a realizace řešení zálohování dat ve firmě HP: Exstream. Praha, 2010. Bakalářská práce. Vysoká škola ekonomická v Praze. Vedoucí práce Ing. David Klimánek, Ph.D [3] HORÁK, Jaroslav. Hardware : učebnice pro pokročilé. 4. aktualiz. vyd. Brno : Computer Press, 2007. 360 s. ISBN 978-80-251-1741-5. [4] KŘÍŢ, Libor. Komprimační a archivační programy. Vyd. 1. Praha: Computer Press, 2002, x, 115 s. Utility. ISBN 80-722-6757-4. [5] LEIXNER, Miroslav. PC - zálohování a archivace dat. V Praze: Grada, 1993. Nestůjte za dveřmi. ISBN 80-854-2473-8. [6] NOVÁK, Pavel. Hardware - "Vnější paměti". Praha, 2012. Semestrální práce. Bankovní Institut Vysoká škola. Vedoucí práce Ing. Vladimír Beneš. [7] PECINOVSKÝ, Josef. Archivace a komprimace dat. Praha : Grada, 2003. 116 s. ISBN 80-247-0659-8. [8] ŠAFRÁNKOVÁ, Jana. Zálohování dat v domácím prostředí. Pardubice, 2010. Bakalářská práce. Univerzita Pardubice. Vedoucí práce Ing. Martin Novák. [9] VODAFONE CZECH REPUBLIC. Backup management procedure and CEBA newsflash 2011. Praha, 2011. [10] VODAFONE CZECH REPUBLIC. Local CNO Backup Management Procedure. Praha, 2011
55
Internetové zdroje
[11] AreaGuard Neo. Areaguard.cz [online]. [cit. 2013-01-17]. Dostupné z: http://www.areaguard.cz/k-cemu-je-a-co-je-areaguardneo?utm_source=google&utm_medium=cpc&utm_campaign=unikdat&utm_content=ztrata-dat&gclid=CMvggOPxg7YCFchY3godhT0Anw [12] Clone v3. Newtonsoftware.co.uk [online]. [cit. 2013-02-12]. Dostupné z: http://newtonsoftware.co.uk/clone/ [13] Create a Full Database Backup (SQL Server). Msdn.microsoft.com [online]. [cit. 201302-09]. Dostupné z: http://msdn.microsoft.com/en-us/library/ms187510.aspx [14] DAS, SAN, NAS: apexmicrosystems.com [online]. [cit. 2012-09-15]. Dostupné z: http://www.apexmicrosystems.com/?page_id=518 [15] DAS, SAN, NAS: Varianty řešení ukládání a zálohování dat: systemonline.cz [online]. [cit. 2012-09-15]. Dostupné z: http://www.systemonline.cz/clanky/das-san-nas.htm [16] FRÖHLICH, Julia. Windows 7: Důstojný nástupce Windows XP?. Chip [online]. 2009, č. 5. [cit. 2012-12-09] ISSN 1210-0684. Dostupné z: http://earchiv.chip.cz/cs/earchiv/vydani/r-2009/chip-07-2009/absolutni-bezpeci.html [17] KPMG: Riziko krádeţe firemních dat poroste, i ze strany zaměstnanců. Channelworld.cz [online]. [cit. 2013-01-17]. Dostupné z: http://channelworld.cz/smb/kpmg-rizikokradeze-firemnich-dat-poroste-i-ze-strany-zamestnancu-6606 [18] Magnetická páska: Wikipedie, Otevřená encyklopedie [online]. [cit. 2013-01-19]. Dostupné z: http://cs.wikipedia.org/wiki/Magnetick%C3%A1_p%C3%A1ska [19] Network Attached Storage: tech-faq.com [online]. [cit. 2012-09-15]. Dostupné z: http://www.tech-faq.com/network-attached-storage.html [20] Oracle database: Backup and Recovery FAQ. orafaq.com [online]. [cit. 2013-02-09]. Dostupné z: http://www.orafaq.com/wiki/Oracle_database_Backup_and_Recovery_FAQ [21] Pevne-disky [online]. [cit. 2012-10-14]. Dostupné z: http://www.czc.cz/pevnedisky/produkty?gclid=CLz95r7OgbYCFcVb3goddH8AcA#q-c-0f_2025538=sIntern%C3%AD&q-c-1-producer=sf8k5lmotpqf559c8c7ta2em4u9
56
[22] PTÁK, Václav. Zálohování, archivace. VP Computers [online]. [cit. 2013-01-12]. Dostupné z: http://www.vpcomputers.eu/bckp.htm [23] Pravidla-pri-ztrate-dat. Zachrana-harddisku.cz [online]. [cit. 2013-02-22]. Dostupné z: http://www.zachrana-harddisku.cz/cz/pravidla-pri-ztrate-dat.asp [24] Proti krádeţi dat by si firmy měly sestavit preventivní plán. Podnikatel.cz [online]. [cit. 2013-02-22]. Dostupné z: http://www.podnikatel.cz/clanky/proti-kradezi-dat-preventivniplan/ [25] RAID (Redundant Array of Inexpensive/Independent Disks): Wikipedie, Otevřená encyklopedie [online]. [cit. 2013-01-08]. Dostupné z: http://cs.wikipedia.org/wiki/RAID [26] SCHREIBER, Manuel. Absolutní bezpečí pro Vaše data. Chip [online]. 2009, č. 7. [cit. 2012-10-01] Dostupné z: http://earchiv.chip.cz/cs/earchiv/vydani/r-2009/chip-072009/absolutni-bezpeci.html [27] SCHREIBER, Manuel. Bible zálohování. Chip [online]. 2009, č. 12. [cit. 2012-10-01] Dostupné z: http://earchiv.chip.cz/cs/earchiv/vydani/r-2009/chip-12-2009/biblezalohy.html [28] Snapshoty - způsob jak posunout zálohování a obnovu dále. Netguru.cz [online]. [cit. 2013-02-18]. Dostupné z: http://www.netguru.cz/odborne-clanky/snapshoty-zpsob-jakposunout-zalohovani-a-obnovu-dale.html [29] Storage-slovnik. Www.storage.cz [online]. [cit. 2012-11-14]. Dostupné z: http://www.storage.cz/materialy/storage-slovnik [30] The Best Disk Cloning App for Windows. Lifehacker.com [online]. [cit. 2013-02-12]. Dostupné z: http://lifehacker.com/5839753/the-best-disk-cloning-app-for-windows [31] Thin provisioning. Infortrend.com [online]. [cit. 2013-02-18]. Dostupné z: http://www.infortrend.com/global/Solutions/Softwares/thin_provision [32] Thin provisioning. Oldanygroup.cz [online]. [cit. 2013-02-18]. Dostupné z: http://www.oldanygroup.cz/index-stranek-115/thin-provisioning/ [33] Thin provisioning (TP). Searchstorage.techtarget.com [online]. [cit. 2013-02-18]. Dostupné z: http://searchstorage.techtarget.com/definition/thin-provisioning [34] Záchrana dat. Tdp-ontrack.cz [online]. [cit. 2013-02-22]. Dostupné z: http://www.tdpontrack.cz/clanky/2006/zniceni-dat-muze-firmu-polozit 57
[35] ZAVADIL, Jaroslav. Databáze v OpenOffice.org BASE. In: [online]. [cit. 2013-02-25]. Dostupné z: http://dum.rvp.cz/materialy/stahnout.html?s=iflagysk [36] Ţivotnost CD DVD a dalších digitálních médií. Oko.yin.cz [online]. [cit. 2013-02-27]. Dostupné z: http://oko.yin.cz/2/zivotnost-cd-dvd-a-dalsich-digitalnich-medii/
58
8 Seznam obrázků OBRÁZEK 1 - GRAFICKÉ ZNÁZORNĚNÍ PŘÍČINY ZTRÁTY DAT ............................................................... 9 OBRÁZEK 2 - ZÁLOHOVÁNÍ A OBNOVENÍ WINDOWS 7 .......................................................................... 10 OBRÁZEK 3 - RAID 0 ........................................................................................................................................ 14 OBRÁZEK 4 – RAID 1 ....................................................................................................................................... 14 OBRÁZEK 5 - RAID 0+1 .................................................................................................................................... 15 OBRÁZEK 6 - RAID 1+0 .................................................................................................................................... 15 OBRÁZEK 7 - RAID 3 ........................................................................................................................................ 15 OBRÁZEK 8 - RAID 4 ........................................................................................................................................ 15 OBRÁZEK 9 - RAID 5 ………………… ............................................................................................................ 16 OBRÁZEK 10 - RAID 6 …………. ..................................................................................................................... 16 OBRÁZEK 11 - PÁSKOVÉ KNIHOVNY ........................................................................................................... 20 OBRÁZEK 12 - NAS ............................................................................................................................................ 22 OBRÁZEK 13 - SAN ............................................................................................................................................ 23 OBRÁZEK 14 - DAS ............................................................................................................................................ 25 OBRÁZEK 15 - EVIDENČNÍ STRUKTURA KATALOGOVÉ EVIDENCE .................................................... 28 OBRÁZEK 16 - OPTIMÁLNÍ STRATEGIE ZÁLOHOVÁNÍ ............................................................................ 30 OBRÁZEK 17 - UKÁZKA RMAN ZÁLOHOVÁNÍ ........................................................................................... 32 OBRÁZEK 18 - PŘÍKLAD TRANSACT-SQL ZÁLOHOVÁNÍ NA ZAŘÍZENÍ DISK .................................... 33 OBRÁZEK 19 - UKÁZKA CLONU .................................................................................................................... 34 OBRÁZEK 20 - KLÍČOVÉ VLASTNOSTI AREAGUARD NEO PRO BEZPEČNOST FIREMNÍCH DAT ... 40 OBRÁZEK 21 - ZABEZPEČENÍ DAT ................................................................................................................ 42 OBRÁZEK 22 - CEBA PLATFORM SETUP ...................................................................................................... 51
59
9 Seznam tabulek TABULKA 1 - ZNAKY ÚROVNÍ RAID............................................................................................................. 17 TABULKA 2 - POROVNÁNÍ NAS A SAN ŘEŠENÍ.......................................................................................... 24 TABULKA 3 – ŢIVOTNOST MÉDIÍ .................................................................................................................. 38 TABULKA 4 - NASTAVENÍ ŢIVOTNOSTI PŘENOSNÝCH MÉDIÍ VE VODAFONE CZ ........................... 46 TABULKA 5 - DEFINICE BUSINESS PRIORIT PRO ZÁLOHOVÁNÍ DAT VE VODAFONE CZ. .............. 49 TABULKA 6 - POŢADAVKY U JEDNOTLIVÝCH ÚROVNÍ.......................................................................... 50
60