VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY
FAKULTA PODNIKATELSKÁ ÚSTAV INFORMATIKY FACULTY OF BUSINESS AND MANAGEMENT INSTITUTE OF INFORMATICS
ZÁLOHOVÁNÍ DAT A DATOVÁ ÚLOŽIŠTĚ DATA BACKUP AND DATA STORAGES
BAKALÁŘSKÁ PRÁCE BACHELOR'S THESIS
AUTOR PRÁCE
MICHAL FIŠERA
AUTHOR
VEDOUCÍ PRÁCE SUPERVISOR
BRNO 2015
Ing. JIŘÍ KŘÍŽ, Ph.D.
Abstrakt Téma této bakalářské práce je zálohování dat a datové úložiště. V bakalářské práci je zahrnut historický vývoj zálohování dat a popis současných technologií. Zároveň součástí práce je analýza současného stavu a návrh řešení pro firmu zabývající se programováním a nízkonákladovým tiskem.
Abstract Theme of the thesis is data backup and data storage. In thesis is summarized history of data backup and described present technology. Another part of this thesis is analysis of current state and proposals for solutions for the company engaged in programming and low-cost printing.
Klíčová slova Zálohování, archivace, data, datové úložiště, obnova, cloud
Keywords Backup, archive, data, data storage, restore, cloud
Bibliografická citace FIŠERA, M. Zálohování dat a datová úložiště. Brno: Vysoké učení technické v Brně, Fakulta podnikatelská, 2015. 51 str. Vedoucí bakalářské práce Ing. Jiří Kříž, Ph.D.
Čestné prohlášení Prohlašuji, že předložená bakalářská práce je původní a zpracoval jsem ji samostatně. Prohlašuji, že citace použitých pramenů je úplná, že jsem ve své práci neporušil autorská práva (ve smyslu Zákona č. 121/2000 Sb., o právu autorském a o právech souvisejících s právem autorským). V Brně dne 26. května 2015
……………………………
Poděkování Chtěl bych poděkovat zástupcům společnosti AREAL SYSTEMS s.r.o., kteří mi poskytli potřebné informace k vypracování bakalářské práce. Zároveň chci poděkovat svému vedoucímu bakalářské práce Ing. Jiřímu Křížovi, Ph.D.
Obsah ÚVOD ...................................................................................................................................... 10 CÍLE PRÁCE, METODY A POSTUPY ZPRACOVÁNÍ ...................................................... 11 1.
Teoretická východiska práce............................................................................................ 12 1.1
Zálohování a archivace .............................................................................................. 12
1.1.1
Historie a typy záznamových médií ................................................................... 12
1.1.2
Metody zálohování ............................................................................................. 18
1.1.3
Způsoby zálohování ........................................................................................... 21
1.2 Duplikace a deduplikace dat .......................................................................................... 22 2 Analýza současného stavu .................................................................................................... 23 2.1 Popis podniku ................................................................................................................. 23 2.2 Počítačová síť a vybavení .............................................................................................. 25 2.2.1 Počítače a tiskárny .................................................................................................. 25 2.2.2 Server, switch a síťová infrastruktura ..................................................................... 27 2.2.3 Poskytovatel internetového připojení a telefony ..................................................... 28 2.2.4 Softwarové vybavení............................................................................................... 29 2.3 Aktuální stav zálohování ................................................................................................ 29 3 Návrh řešení .......................................................................................................................... 31 3.1 Požadavky firmy ............................................................................................................ 31
3.2 Nový hardware na zálohování........................................................................................ 31 3.2.1 Konfigurace RAID .................................................................................................. 31 3.2.2 Alternativní úložiště ................................................................................................ 33 3.2.3 Archivace ................................................................................................................ 35 3.2.4 Zálohování do cloudu.............................................................................................. 36 3.3 Nastavení zálohování a monitoring................................................................................ 37 3.3.1 Plán zálohování ....................................................................................................... 37 3.3.2 Automatické zálohování ......................................................................................... 38 3.3.3 Monitorování systému............................................................................................. 40 3.4 Firemní IT prostředí ....................................................................................................... 42 3.5 Zálohování dat uživatelů ................................................................................................ 44 4 Zhodnocení navrhovaného řešení ......................................................................................... 44 4.1 Investice do navrhovaného řešení .................................................................................. 44 4.2 Přínosy navrhovaného řešení ......................................................................................... 44 ZÁVĚR .................................................................................................................................... 45 SEZNAM POUŽITÉ LITERATURY ..................................................................................... 46 SEZNAM OBRÁZKŮ ............................................................................................................. 50 SEZNAM TABULEK.............................................................................................................. 51
ÚVOD
Říká se, že „Uživatelé se dělí na dvě skupiny – na ty, kteří pravidelně zálohují, a ty, kteří ještě o svá data nepřišli.“ V dnešní době je na zálohování dat dáván větší důraz. Je to dáno zejména tím, že většina současného obchodu vyžaduje zapojení informačních technologií. S postupným vývojem technologií se náklady na zálohy sice zmenšují, ale zároveň roste objem dat, který je třeba zálohovat. S příchodem nových operačních systémů a hardware výrobci implementují zálohovací funkce tak, aby byla vyžadována co nejmenší spolupráce s uživatelem. Jedná se například o vytváření bodu obnovení pro operační systém, zapnutí automatického uložení rozpracovaného dokumentu nebo tabulkového procesoru nebo automatické zálohování fotografií při připojení k bezdrátové síti. Bohužel tyto zálohovací funkce jsou jen okrajové a nelze se na ně plně spoléhat. Při nákupu nového hardware se spoléháme na funkčnost výrobku. Pokud se jedná o záznamové médium, tak otázku zálohování nemáme potřebu řešit, do doby, než se vyskytne problém. V soukromé a podnikatelské sféře je otázka zálohování stále často odsouvána stranou. Osvěta této problematiky se sice zlepšuje, ale stále se setkáváme s řešením problému, až když nastane. Proto je vždy třeba na tvorbu zálohy myslet již při zavádění nových systémů do podniku. Ztrátě dat se nedá kompletně zabránit, ale existují způsoby, jak toto riziko co nejvíce eliminovat.
10
CÍLE PRÁCE, METODY A POSTUPY ZPRACOVÁNÍ
Cílem práce je vytvoření návrhu řešení zálohování dat pro zefektivnění práce s uloženými daty a zajištění jejich vyšší bezpečnosti. Součástí bakalářské práce bude také popsání historického vývoje datových úložišť, popis základních postupů zálohování dat a analýza současné situace ve firmě AREAL SYSTEMS s.r.o. zabývající se programováním a nízkonákladovým tiskem. Ta ve výsledku poskytne informace, zda je ve firmě současný systém zálohování dostatečný a zda nehrozí znatelné škody při výpadku některého z hardwarových komponentů. V návaznosti na získání poznatků z analýzy a teoretické části bude vytvořen návrh řešení, který zlepší práci s uloženými daty a zajistí vyšší bezpečnost dat. Důraz bude kladen na finanční možnosti firmy a jednoduchost řešení.
11
1. Teoretická východiska práce V této kapitole je stručně popsán vývoj záznamových médií, popis jednotlivých typů, základních pojmů a základní postupy pro zálohování dat.
1.1
Zálohování a archivace Zálohování – proces, jehož výsledkem je záloha. Ta se ukládá na jiné úložné
místo nebo datové médium a slouží k obnově dat při nahodilé události, jako je například selhání hardware, porucha dat, omylem smazané soubory a jiné. Produkční data zůstávají na původním místě. (1, str. 1) Archivace – je vytvoření datové kopie, která slouží k dlouhodobému uchovávání. Produkční data se mohou po vytvoření archivní kopie smazat, aby se uvolnilo místo na původním úložném prostoru. (2) 1.1.1 Historie a typy záznamových médií Zálohování, v obecném celku, provází lidskou civilizaci již od jejího počátku. Předávání informací z generace na generaci, uchovávání historických pramenů v papírové podobě, vytesání příběhů do kamene a různá architektonická díla jsou příkladem, kdy se dají zpětně získat údaje z historie (3). Z pohledu informačních technologií se data zálohovaly a zálohují na určité typy záznamových médií:
Děrné štítky se začaly používat již v 18. století ve Francii, kde byl zaznamenán postup pro tkalcovské stavy. Uložená data na děrných štítkách pro ovládání počítačů se začaly používat v roce 1950 a jejich běžné využívání trvalo až do 90. let 20. století. (4, str. 1). Informace na děrném štítku byla udávána dírkou na určité pozici. Nejčastěji se používaly štítky o kapacitě 80 znaků a byly vyráběny z tenkého kartonu.
12
Děrné pásky fungují na podobném principu jako děrné štítky. Největší míru využívání zaznamenaly během 60. let 20. století, kde byly používány jako záznamové medium. Byly vyráběny z papíru. Přístupová doba k datům byla pomalá a pásky měly malou kapacitu. (4, str. 1)
Obrázek 1- Děrná páska (zdroj: http://www.computerhistory.org/revolution/memory-storage/8/326/1022)
Magnetické pásky postupně nahradily děrné pásky vzhledem k jejich nevýhodám. Oproti děrným páskům nabízí mnohonásobnou kapacitu a možnost znovu použití. Obecně se dá říci, že na magnetickou pásku lze uložit tisíce děrných pásek. Zprvu se magnetické pásky navíjely na cívky, postupem času byly vytvořené kazety o různých velikostech a kapacitách. (4, str. 1) V současné době lze na magnetické pásky uložit data v řádech terabytů. Do vývoje magnetických pásek se stále investuje. To má za následek rychlejší přístupovou dobu k datům a stále větší kapacity.(5) Mezi nejznámější zastupitele magnetických pásek patří LTO (Linear Tape-Open), DDS (Digital Data Storage), AIT (Advanced Intelligent Tape) a DLT (Digital Linear Tape). I přes sekvenční zápis/čtení na magnetickou pásku a tím spojenou pomalejší přístupovou dobu k datům, se stále magnetické pásky používají pro zálohování a archivaci dat. Je to dáno jednak jejich postupným vývojem, nižší náchylností na skladovací podmínky a nižší cenou pásek oproti jiným zálohovacím nosičům.
13
Obrázek 2- Nejnovější řada magnetické pásky LTO 6 od firmy HP. (zdroj :http://h30094.www3.hp.com/product/sku/10468840)
Pevné disky (HDD – Hard Disk Drive) představují pro současnou dobu nejrozšířenější datové médium sloužící pro uchovávání dat. První komerční disk představila firma IBM v roce 1956 společně s počítačovým systémem RAMAC 305. Disk měl kapacitu 5 MB a v přepočtu byla cena za 1 megabyte 10 000$ (6). V současné době se průměrná cena za 1 megabyte pohybuje kolem 0,00003$ (7). Právě kvůli ceně za uložený megabyte se disky dříve nepoužívaly pro zálohování. S postupným vývojem technologií cena disků začala klesat a rostla jejich kapacita. Od 90. let se staly běžnou součástí zálohovacích systémů a užívají se do současnosti.
Diskety, neboli také pružné disky (floppy disk), dostaly své jméno podle prvních typů disket, které se mohly ohýbat, aniž by došlo k poškození dat. První disketa byla představena v roce 1969, měla kapacitu 80kB a byla určena pouze ke čtení. Její velikost byla 8 palců (203,2 mm). V roce 1973 byla představena disketa o kapacitě 256kB a bylo možné na ní zapisovat. (8) Postupným vývojem se velikosti disket zmenšovaly a jejich kapacita se zvětšovala. Mezi nejrozšířenější velikosti pak patřily diskety s 5,25 palců (133,3 mm) a 3,5 palců (88,9 mm). Zprvu se diskety používaly jako přenášeč dat mezi jednotlivými počítači. Díky nízké pořizovací ceně disket a mechanik našly diskety uplatnění také v oblasti zálohování a to zejména v domácím prostředí. Jejich nevýhodou byla však nízká kapacita.
Optické disky měly eliminovat některé neduhy pružných disků. V roce 1979 firmy Sony a Philips představily kompaktní disk (Compact Disc - CD). Zprvu byly kompaktní disky užívány hlavně v hudebním průmyslu. Postupně s vývojem technologií se rozšířily i do firemního a domácího prostředí, kde se optické disky
14
začaly používat také pro zálohování dat. To bylo způsobeno uvedením formátu CDR (Compact Disc – Recordable) a vypalovací mechaniky. Postupně se vypalovací mechaniky dostaly na takovou cenovou úroveň, že byly často součástí při pořízení nového počítače. Kapacita byla běžně 650MB a 700MB. Později byly představeny disky, které umožňovaly přepisování – CD-RW (Compact Disc – ReWritable). Disky, které bylo možné pouze číst, byly označovány jako CD-ROM (Compact Disc – Read only memory). Později byly představeny formáty DVD (Digital Vertices Disc), Blue-Ray a další minoritní formáty jako například UMD (Universal Media Disc). DVD a Blue-Ray fungují na podobném principu, jako kompaktní disky, a to tak, že laserem je zahřátá záznamová vrstva disku a tím se změní její optické vlastnosti. Jednotlivé formáty (DVD, Blue-Ray) se liší odlišnou vlnovou délkou laseru, který zápis vykonává. Je ale stále zachována zpětná kompatibilita pro čtení. Udávaná doba archivace dat se různí podle specifik výrobce a technologie výroby záznamové vrstvy. (9, str. 13) Běžné optické disky mají záznamovou vrstvu z organické sloučeniny. Existují firmy, které se specializují na výrobu archivních optických disků, jako je například firma Northern Star, která pomocí speciálního anorganického složení DVD-R disku garantuje životnost a čitelnost disku na 160 let. (10)
Magneticko-optické disky byly představeny v roce 1985 a běžně se prodávaly ve velikostech podobné disketám - 5,25 palců (133,3 mm) a 3,5 palců (88,9 mm). (11) Ke čtení magneticko-optických disků je třeba speciální mechanika s laserem. Oproti pružným diskům přinášely výhody ve větší kapacitě (v dané době až 9,2GB ) a měly vyšší odolnost vůči magnetickému poli. Principem fungování magneticko-optických disků je, že jejich povrch nelze za normálních okolností zmagnetizovat. Zápis je umožněn až poté, co se část disku zahřeje pomocí laseru na teplotu v rozmezí 160180 °C a zapisovací hlava s cívkou, která vytváří magnetické pole, na rozehřátém místě zmagnetizuje část povrchu disku. Čtení dat je postaveno na tom, že zmagnetizované a nezmagnetizované části disku mají odlišnou odrazivost. Data zapsaná na magneticko-optické disky měly uváděnou dobu archivace kolem 30 let. Díky tomu také byly rozšířené k archivaci dat. (4, str. 2) Představitelem magneticko-optických disků je formát MiniDisc od firmy Sony. Rozšíření tohoto formátu bylo způsobeno proniknutím do audio průmyslu, kdy Sony
15
vyráběla Hi-Fi systémy a přenosné přehrávače s MiniDisc mechanikou. Tyto přehrávače nabízely, oproti kazetovým, kvalitnější produkci hudby. Zároveň formát MiniDisc umožňoval zvolit si skladbu podobným způsobem, jako u CD. Firma Sony ukončila výrobu veškerých modelů formátu MiniDisc a příslušenství k roku 2014. (11)
Obrázek 3- 1GB MiniDisc disk od firmy Sony (zdroj: http://en.wikipedia.org/wiki/Hi-MD)
Flash disky a paměťové karty jsou postaveny na základech paměti typu flash. Jedná se o paměť, která je elektronicky programovatelná a data uchovává i po odpojení od napájení (tzv. energeticky nevolatilní). Název flash byl přiřazen podle vědců z firmy Toshiba, kteří tento typ paměti vyvinuli. Proces mazání paměti jim připomínal blesk z fotoaparátu (flash of a camera). (12) Flash paměť se využívá zejména v USB flash discích a paměťových kartách. Ty v současnosti dosahují kapacity až 512 GB. Hlavní využití flash disků zprvu bylo přenášení dat mezi koncovými uzly, jako jsou počítače, televize, multimediální zařízení. Paměťové karty jsou nejčastěji využívány jako záznamové úložiště pro přenosné a záznamové zařízení, jako jsou například mobilní telefony, fotoaparáty či kamery. Nevýhodou tohoto typu paměti jsou vyšší výrobní náklady na paměťové moduly vůči jiným záznamovým médiím a omezená životnost buněk, do kterých se data zapisují. Po určitém počtu zápisu (v řádech tisíců zápisů do jedné buňky) je daná buňka nepoužitelná pro uložení informace. (4, str. 2)
16
SSD disky (Solid State Disk) podle svého jména eliminují prvotní nevýhodu pevných disků – nemají pohyblivé součástky, které se mechanicky opotřebovávají a které postupně zvyšují riziko selhání. SSD disky jsou nejčastěji postaveny z pamětí typu flash. Oproti dříve zmíněným USB diskům a paměťovým kartám obsahují řadič a rozhraní (nejčastěji SATA, IDE a SCSI) (4, str. 2). V současné době nabízí SSD rychlejší přístupovou dobu k datům a jejich zápis oproti pevným diskům. Na pomalejším zápisu a čtení disku se podílí zejména přesun zapisovacích hlaviček a rychlost otáček ploten. Zároveň neexistující pohyblivé součástky mají vliv na energetickou náročnost SSD, která je nižší, než u pevných disků. Nevýhodou jsou vysoké výrobní náklady, kdy za srovnatelnou nákupní cenu lze pořídit pevný disk o násobně větší kapacitě. Protože SSD disky fungují na stejném principu jako flash paměti, paměťové buňky mají také omezený počet zápisů. Díky různým technologiím (např. TRIM, MLC, TLC) se životnost disků neustále prodlužuje, takže lze SSD diskem plně nahradit pevný disk. (13)
Obrázek 4- Vnitřní komponenty SSD disku (zdroj: http://notebook.cz/clanky/technologie/2014/technologie-ssd-tlc-vs-mlc)
Cloud nepatří do kategorie úložného média jako takového, protože jsou data nejčastěji uložena na pevných discích a je poskytována třetí stranou jako služba poskytující virtuální úložiště pro data. Cloud zařazuji do této kapitoly, protože emuluje fyzické úložiště a s rostoucí dostupností internetu a rychlejší přenosovou rychlostí získává stále větší význam. Zároveň je to dáno tím, že koncoví uživatelé si nemusí pořizovat nové zařízení a ke svým datům mají přístup z různých zařízení. Při výběru poskytovatele je třeba pečlivě volit takovou službu, která má dostatečně nastavené zabezpečení dat (zálohování, ochrana dat před zcizením a jiné).
17
1.1.2 Metody zálohování 1.1.2.1 Typy záloh Základní typy záloh můžeme rozdělit následovně:
Záloha plná – při tomto procesu se vytvoří záloha se všemi soubory a adresáři, které byly vybrány pro zálohování. Oproti ostatním typům je nezávislá na jiných zálohách a proces obnovy dat je tedy kompletní. Nevýhodou je její náročnost z hlediska kapacity úložiště a zároveň je pomalejší než zbylé typy. (14)
Záloha přírůstková (inkrementální) – po vytvoření plné zálohy se poté zálohují pouze soubory, které byly vytvořené nebo změněné. Další zálohy se vytváří na základě změněných a vytvořených souborů oproti předchozí přírůstkové záloze. Hlavní výhodou je nízká náročnost na kapacitu úložiště a rychlost vytvoření zálohy. Hlavní nevýhodou je závislost jednotlivých přírůstkových záloh na předchozích přírůstkových zálohách. V případě, že je poškozena záloha, která byla vytvořena před následovnou zálohou, není možné data obnovit. (15)
Rozdílová záloha (Diferenciální) – je také závislá na plné záloze a zálohují se rozdíly pouze vůči plné záloze. Oproti přírůstkové záloze však nejsou jednotlivé rozdílové zálohy navzájem závislé. Vytváření záloh je oproti plné záloze rychlé. (14)
1.1.2.2 RAID RAID (Redundant Array of Inexpensive Disks – vícenásobné diskové pole laciných disků) je technologie, která umožňuje rozdělit zátěž kladenou na výkon a kapacitu diskových jednotek a zároveň snižuje riziko ztráty dat. V současnosti se akronym RAID vykládá jako Redundant Array of Independent Disks – vícenásobné diskové pole nezávislých disků. V určitých typech RAID disky jsou na sobě nezávislé, ale v roce 1987, kdy byla tato technologie poprvé popsána, se jednalo o levnější alternativu k technologii SLED (Single Large Expensive Disk – jediný velmi nákladný disk). Technologii RAID nelze brát jako systém pro zálohování, ale značně snižuje riziko
18
ztráty dat. Je vhodné propojit RAID s dalším stupněm zálohování, jelikož RAID technologie neřeší selhání hardware jako celku. (16, str. 513) V současnosti se běžně používají tyto typy RAID:
RAID 0 je také označován jako dělení (stripping). Ve skutečnosti se nejedná konkrétně o RAID v pravém slova smyslu. Principem fungování je, že data ukládají na dva a více disků a ty pro aplikace vystupují jako jedna disková jednotka. Výhoda tohoto řešení spočívá v rozložení zátěže a následné rychlosti čtení a zápisu dat. Hlavní nevýhoda je závislost jednotlivých disků navzájem. V případě selhání jednoho disku je velká pravděpodobnost ztráty dat, jelikož jednotlivé části dat jsou uloženy na různých discích. (17, str. 273)
Obrázek 5- Zapojení disků do RAID 0 (zdroj: autor dle 16)
RAID 1 se často označuje jako zrcadlení (mirroring). K fungování typu RAID 2 jsou potřeba minimálně 2 disky. Principem je současný zápis dat na všechny disky. Z hlediska rizika ztráty dat se v této konfiguraci riziko snižuje, protože v případě selhání jednoho disku, jsou data uložena na zbývajících. Nevýhodou tohoto řešení je pomalejší zápis, protože probíhá na obou discích současně. Čtení dat je rychlejší, oproti jednomu disku, protože lze přistupovat k oběma diskům současně. (16, str. 514)
19
Obrázek 6- Zapojení disků do RAID 1 (zdroj: autor dle 16)
RAID 5 vyžaduje minimálně 3 disky. Využívá se zejména tam, kde je třeba vyšší výkon a velká redundance. Principem RAID 5 je vyhrazení diskové jednotky (paritní disk), na které se uloží samo opravný kód. Jednotlivé kódy se ukládají na disky střídavě. V případě selhání jednoho disku je možné data obnovit. (16, str. 515)
RAID 6 funguje na podobném principu jako RAID 5, ale na paritní disky se ukládají 2 samoopravné kódy, které jsou vypočítány různým způsobem. Rychlost čtení dat je podobná RAID 5, ale zápis je pomalejší kvůli výpočtu dvou samoopravných kódů. Toto řešení vyžaduje užití minimálně 4 disků a je odolné vůči výpadku dvou disků. (18)
Obrázek 7- Zapojení disků do RAID 5 (zdroj: autor dle 18)
Různé variace typů RAID – využívá jednotlivé vlastnosti typů a zmenšuje jejich nevýhody za cenu vyšších pořizovacích nákladů (potřeba více disků). Příkladem je
20
RAID 1+0, kdy nabízí výhody v rychlosti RAID 0, ale zároveň i odolnost vůči chybám v případě RAID 1. K této konfiguraci je třeba minimálně 4 disků. (16, str. 516)
Obrázek 8- Zapojení disků do RAID 1+0 (zdroj: autor dle 16)
1.1.3 Způsoby zálohování Pro správné zálohování neexistuje jednoznačné řešení. Vše se musí přizpůsobit pro lokální potřeby. Mezi nejčastější varianty, které se aplikují, jsou způsoby:
D2D (Disk to Disk) je základní dvoustupňové schéma, kdy se zálohy ukládají na zálohovací server a ty se poté replikují (vytváření identické kopie) na jiný diskový prostor. Jako druhotný úložný prostor může být jiný server s diskovým polem. (14)
D2T (Disk to Tape) je použití zálohovací metody, kdy se data ze zdroje zálohují rovnou na pásky. Tento způsob se používal dříve, v dnešní době nesplňuje požadavky na rychlost zálohování. Problém spočíval v tom, že tento způsob neumožňuje zaručit minimální datový tok, který je třeba pro zálohovací software. (14) Jako alternativa k této metodě jsou virtuální knihovny. Virtuální je označení z toho důvodu, že záloha se ukládá na disky, ale pro software diskové pole vystupuje jako klasická pásková knihovna. (19)
D2D2T (Disk to Disk to Tape) kombinuje výhody předchozích metod a snižuje riziko ztráty dat. Jedná se o metodu, kdy zálohovací server replikuje zálohy na jiný úložný prostor, například druhý zálohovací server, a z něho se provede replikace na pásky. Případná obnova dat je velmi rychlá, protože záloha může být provedena
21
z druhého zálohovacího serveru s pevnými disky. Tato metoda je nejčastěji používána ve velkých podnicích a v podnicích se silnou technologickou infrastrukturou. (14)
D2D2C (Disk to Disk to Cloud) je metoda často využívána v malých podnicích. Důvodem je nízká pořizovací cena zálohovacího zařízení. Princip je podobný jako u metody D2D2T, akorát je pásková mechanika nahrazena cloudovou službou. Do této metody lze zařadit i zálohování na externí/síťové úložné zařízení. (14)
1.2 Duplikace a deduplikace dat Při tvorbě jednotlivých záloh vznikají duplicity souborů, které jsou identické a obsazují kapacitu disku. Tato situace může vzniknout například v případě, kdy jednotliví uživatelé sdílí mezi sebou soubor, který si pak uloží do vlastního adresáře. Díky tomu roste celkový objem zálohovacích dat. Ke snížení objemu lze použít proces, který se nazývá deduplikace. Na základě kontrolního součtu souboru lze určit, zda se jedná o identický soubor. Zálohovací program či datové úložiště poté provede zálohu pouze jednou. (4, str 3.)
22
2 Analýza současného stavu V této kapitole popisuji prostředí, současný stav zálohování a obecné informace o firmě AREAL SYSTEMS s.r.o.
2.1 Popis podniku Firma AREAL SYSTEMS s.r.o. byla založena 15. ledna 2007 zapsáním do obchodního rejstříku Krajského soudu v Brně. Počet stálých zaměstnanců se pohybuje kolem 5 lidí a firma najímá externisty v závislosti na ročním období. Vzhledem k oblasti podnikání má vhodně umístěnou provozovnu, která je v areálu Ekonomicko-správní fakulty Masarykovy univerzity v Brně. Zároveň má firma pobočku v nově postavené budově AZ Tower v Brně. Firma AREAL SYSTEMS s.r.o. je tvořena dvěma odděleními, které poskytují služby v oblasti velkoplošného tisku, nízkonákladového tisku a programování. Mezi nabízené služby oddělení nízkonákladového tisku patří:
Digitální tisk a kopírování – tato technologie je vhodná zejména na tisk letáků, vizitek, menších plakátů, brožur, výročních zpráv, navštívenek, malonákladových periodik, kalendářů, publikací, etiket, materiálů pro konference, sborníků, bookletů na CD/DVD nebo diplomových a bakalářských prací. Zároveň firma nabízí možnost tisku na reklamní předměty, jako jsou například trička nebo hrnky a kancelářské potřeby.
Ofsetový tisk - do hlavního sortimentu výroby patří: dopisní papíry, samopropisovací formuláře, dopisní obálky, etikety (papírové, samolepící papírové, alu), pohledy, přání, prospekty, katalogy, knihy, kalendáře, obalová technika (papírové obaly krabice a krabičky). Mezi běžné zakázky se řadí: tisk letáků, tisk plakátů, tisk hlavičkových papírů a desek s chlopní, tisk časopisů, tisk brožur a katalogů.
Skenování a OCR - skenování je realizováno na vysokorychlostních scannerech. Toto řešení je vhodné pro archivaci vysokého množství obrazových dat nebo jako
23
příprava pro zpracování technologií OCR (počítačový převod naskenovaného textu do editovatelné podoby).
Velkoplošný tisk – tato technologie je vhodná pro tisk fotografií, vývěsek, plakátů, brožur,
slevových
akcí,
malonákladových
periodik,
kalendářů,
publikací,
fotografických etiket, propagačních a prezentačních materiálů velkých formátů.
Dokončovací práce a knihařské zpracování – mezi základní práce patří řezání, vazba, zakulacování rohů, vrtání papíru (děrování průměr 3 - 8 mm), laminování, bigování (lom) a perforace. Oddělení poskytující programovací služby nabízí tyto činnosti:
Webová řešení – konzultace a návrh řešení webové prezentace na míru podle požadavků zákazníka
Správa obsahu webu – nabídka správy a udržování aktuálnosti obsahu webové prezentace.
Zakázkový vývoj software – konzultace a vytvoření aplikace podle požadavků zákazníka.
Flash animace a hry – kromě běžných aplikací firma nabízí tvorbu her pro počítače a mobily, případně animací, jako jsou například prezentace na CD, spořiče obrazovky nebo instalovatelné Adobe Air aplikace.
Multimediální CD a DVD - tvorba rozsáhlých databází informací s fulltextovým nebo parametrickým vyhledáváním, příprava multimediálních CD s videem nebo spouštěcí autorun aplikace pro otevření souborů (dokumentů, instalačních souborů aj.).
Design a DTP tiskovin - řešení dle požadavků zákazníka na tvorbu kvalitních přehledných a sladěných prezentací.
Optimalizace pro vyhledávače - nabídka komplexního řešení na SEO optimalizaci pro vyhledávače, která zajistí lepší pozici ve vyhledávači na základě vyhledávaných výrazů
Internetový marketing a zvyšování návštěvnosti – nabídka služby, která zajistí zvýšení návštěvnosti a propagaci webové prezentace.
24
Psaní textů pro web – nabídka tzv. copywritingu, který znamená tvorbu obsahu webové prezentace psaným a strukturovaným textem.
Testování, analýzy a výzkumy uživatelů – testování reakcí lidí na konkrétní webovou prezentaci a provedení analýzy výsledů.
Audity přístupnosti a analýza použitelnosti webu – zjištění slabých a nepřístupných míst webové prezentace a návrh řešení.
2.2 Počítačová síť a vybavení 2.2.1 Počítače a tiskárny Firma má 5 stálých počítačů, jedná se o 3 desktopové stroje s konfigurací určenou pro běh kancelářských aplikací a 2 tzv. all-in-one stroje iMac od firmy Apple, které slouží pro obsluhu grafických programů. Většina zaměstnanců oddělení programování si do firmy přináší vlastní počítače, zejména notebooky, kterými se připojují do sítě pomocí UTP kabelu. Mezi speciální vybavení firmy patří tiskárny vzhledem k zaměření na nízkonákladový a velkoplošný tisk. Profesionální tiskárny mají vlastní obslužný počítač, který zprostředkuje komplexní tisk pomocí RIP (Raster Image Processor) software, který zajišťuje výstup elektronických dat na tiskových zařízeních. Tiskárny s externím RIP software v této firmě jsou Konica Minolta Bizhub C6000 a Konica Minolta Bizhub C6501.
Obrázek 9- Konica Minolta Bizhub C6501 (zdroj: http://www.konicaminolta.eu/en/business-solutions/products/production-printing/discontinuedproducts/colour/bizhub-pro-c6501/key-features.html)
25
Součástí firemní počítačové sítě je také plotter Xerox 7142CAD, který je připojen přes konektor RJ-45. Tento plotter slouží k tisku velkoformátových předloh, jako jsou například prezentace, výkresy, mapy aj.
Obrázek 10- Xerox 7142CAD (zdroj: http://www.xerox.cz/produkcni-tiskovestroje/produkty/velkoformatova_zarizeni/barevna_reseni_interier/xerox-7142-cad.html)
Mezi zbývající vybavení, z hlediska koncových zařízení a které jsou připojeny do firemní sítě, patří kopírovací stroj Atico MP C3500, vysokorychlostní tiskárna s vnitřním tiskovým systémem Konica Minolta Bizhub 552, síťová tiskárna Develop INEO + 253 a platební terminál od Raiffeisenbank a.s. Na pobočce firmy, která je připojena do firemní sítě pomocí SSH tunelu, se nachází iMac od firmy Apple, model z roku 2010 a tiskárna Develop INEO + 253, která je připojena k počítači.
Obrázek 11- Apple iMac mid 2010 (zdroj: http://www.everymac.com/systems/apple/imac/specs/imac-core-i3-3.06-21-inch-aluminum-mid-2010specs.html)
26
2.2.2 Server, switch a síťová infrastruktura Centrem počítačové sítě je server od firmy Hewlett-Packard, který je volně umístěný v prostoru firmy. Jedná se o model HP ProLiant DL160 G5 v konfiguraci:
Procesor: 2x 64 bitový Intel® Xeon® Processor E5405 (12M Cache, 2.00 GHz, 1333 MHz FSB), 4 jádra
Operační paměť: 2 GB DDR2 667MHz
Pevné disky: 2x Seagate 160 GB SATA 7200 ot./min, 1x Seagate 1TB SATA 7200 ot./min
Obrázek 12- Server HP ProLiant DL160 G5 (zdroj: http://www.weirdstuff.com/cgi-bin/item/392693)
O rozvod sítě se stará volně položený 48 portový switch Cisco Catalysyst 3560. Jedná se o profesionální L3 switch, tedy přepínač na síťové vrstvě. Nabízí využití až 1 Gbit/s Ethernet rozhraní a napájení portů pomocí PoE technologie (Power over Ethernet). Mezi jeho další možnosti patří pokročilá správa zabezpečení a konfigurace QoS (Quality of Service).
Obrázek 13- Switch Cisco Catalyst 3560 (zdroj: http://www.suntech.cz/produkt/103743-cisco-ws-c3560-48ps-s-48x10-100-4xsfp-poe/)
27
Pasivní síťové prvky tvoří UTP kabel kategorie CAT5 a podomítkové zásuvky. Kabely jsou vedeny po stěnách v plastových lištách a jsou zakončené v podomítkových zásuvkách. Některé kabely vedou volně po zemi doprostřed místnosti. Jelikož je počet zásuvek, zejména v místech u tiskáren, nedostatečný, jako kompenzace je použit pomocný 8 portový switch D-LINK 1008D.
2.2.3 Poskytovatel internetového připojení a telefony Firma má přístup k internetu prostřednictvím firmy H-data, spol. s r.o., která provozuje nabídku internetu prostřednictvím internetové domény Wosa.cz s rychlostí 8 Mbit/s pro download a 2 Mbit/s upload vyhrazené linky. I přes přímou viditelnost na přístupový bod (Access point) je stabilita, podle zaměstnanců, na kolísavé úrovni, kdy při nepříznivém počasí, jako je například déšť, dochází k výpadkům internetového spojení. Internetové připojení je zprostředkováno pomocí routeru TP-LINK TLWR841ND, který slouží zároveň jako přístupový bod pro interní bezdrátovou síť. U něj byly zaznamenány problémy uživatelů přístrojů od firmy Apple, kdy dochází k odpojení od bezdrátové sítě v neurčitých intervalech.
Obrázek 14- Router TP-LINK TL-WR841ND (zdroj: http://www.tp-link.com/lk/products/details/?model=TL-WR841ND)
Kromě hovorů uskutečňovaných přes firemní mobilní telefony, se telefonické hovory uskutečňují přes 5 VoIP telefonů Siemens Gigaset C455, které zprostředkovávají komunikaci pomocí pevné linky. Ta je poskytována firmou RIO Media a.s.
28
2.2.4 Softwarové vybavení Vzhledem k nabízeným službám je potřeba mít zastoupení všech operačních systémů. Na 2 stolních počítačích je operační systém Microsoft Windows XP SP3, na jedné pracovní stanici je Linux ve verzi Debian 7 a na zmíněných zařízení iMac od firmy Apple je OS X ve verzi Yosemite 10.10. Na serveru je nakonfigurován Microsoft Windows Server 2008 R2, na kterém je spuštěn webový server IIS ve verzi 7 od firmy Microsoft. Na webovém serveru jsou spuštěny PHP aplikace. Tyto aplikace slouží jako intranetové stránky a objednávková agenda. Server není veřejně dostupný z internetu, ale je možné se k němu připojit pomocí SSH tunelu. Toto propojení využívá počítač na pobočce v budově AZ Tower v Brně. Server zároveň slouží jako souborový server, na kterém si zaměstnanci sdílejí soubory a ukládají rozpracované projekty. Konfigurace disků je následující:
Systémový disk C:\ ve velikosti 160 GB - disk vyhrazený pro operační systém a podpůrné programy
Datový disk D:\ ve velikosti 1 TB – disk vyhrazený pro umístění souborů na síťovém sdíleném disku
Aplikační disk E:\ ve velikosti 160 GB – disk vyhrazený pro spuštěné aplikace webového serveru, jako je například objednávková agenda
2.3 Aktuální stav zálohování Firma poskytuje řešení webové prezentace na míru. Součástí tohoto řešení je nabídka umístění a správu webových prezentací na internetu. Tato služba je pro firmu klíčová a její nepřetržitou funkčnost je třeba dostatečně zajistit. K tomu firma využívá služby hostingové firmy Profitux. Veškeré zálohování je v plné kompetenci hostingové firmy a je pravidelně kontrolováno. V případě výpadku má firma potřebné záložní řešení, aby zajistila nepřetržitou funkčnost. Současné řešení zálohování vnitřní sítě není dostatečně nastaveno. Na serveru není nakonfigurován plán zálohování a v případě selhání jednotlivých komponentů není možnost obnovy ztracených dat.
29
Během analýzy současného stavu pro tuto bakalářskou práci nastala událost, kdy selhal pevný disk serveru. Při běhu systému se uvolnila hlavička, která zajišťuje čtení a zápis dat na plotnách. Vzhledem k tomu, že nešlo o systémový disk, server opakovaně zapisoval na poškozený disk, který se neodpojil od napájení. Diskové plotny byly mechanicky poškozeny zapisovací hlavičkou a obnova dat disku byla shledána jako nemožná. Data uložená na disku nebyla pro firmu kritická, ale byly zde důležité soubory, které by usnadnili práci zaměstnancům v budoucnu. Vzhledem k zaměření na programátorskou činnost jsou jednotlivé části práce na projektech rozděleny mezi zaměstnance. Ti, ve většině případů, práci vykonávají na vlastních zařízeních a po dokončení odesílají hotové části. Zodpovědnost za zálohování je tedy na zaměstnancích. V případě ztráty dat může dojít ke zpoždění předání hotového projektu. Server není napojen na záložní zdroj, takže v případě výpadku napájení dojde k jeho úplnému vypnutí. To může způsobit poškození pevných disků nebo při přepětí může dojít k poškození některého z komponentů serveru. Ve firmě je k dispozici záložní zdroj APC Back-UPS ES 700, ale není nakonfigurován pro zálohování napájení serveru. Záložní zdroj obsahuje 4 chráněné a zálohované zásuvky a 4 chráněné zásuvky proti přepětí.
Obrázek 15- Záložní zdroj APC Back-UPS ES 700 (zdroj: http://www.apc.com/resource/include/techspec_index.cfm?base_sku=be700-fr)
30
3 Návrh řešení V této kapitole popíši návrh řešení na zálohování a celkový návrh na zlepšení IT prostředí ve firmě. Řešení je navrhováno v souladu s poznatky, které jsem popisoval v teoretické části práce.
3.1 Požadavky firmy Vzhledem k nedávné situaci, kdy pevný disk v serveru selhal a firma tím přišla o data, je jejím požadavkem minimalizovat riziko, že stejná situace nastane i v budoucnosti. Jak již bylo zmíněno, firma na serveru měla důležitá data, ale nebyla vyhodnocena jako kritická, která by ohrozila činnost firmy. Pro pořízení vybavení, které by zlepšilo zálohovací proceduru, firma stanovila limit nepřesahující 80 000 Kč bez DPH.
3.2 Nový hardware na zálohování Pro zřízení základního zálohování je třeba zakoupit potřebné komponenty. Vzhledem k omezenému rozpočtu je třeba volit hardware tak, aby poskytoval přijatelné řešení na základní zálohování.
3.2.1 Konfigurace RAID Stávající server HP ProLiant DL160 G5 patří mezi starší modely, ale stále nabízí dostatečný výkon na požadavky firmy. Vzhledem k modulárnosti pevných disků navrhuji pro základní zálohování dokoupení pevných disků a jejich nastavení do RAID. Současná konfigurace disků je 2x Seagate 160 GB SATA 7200 ot./min, 1x Seagate 1TB SATA 7200 ot./min. Pro úsporu financí je možné využití stávajících disků, přičemž je třeba dokoupit další 2 disky o velikosti 160 GB a 2 disky o velikosti 1TB. Při této variantě je třeba počítat s vyšší pravděpodobností selhání, než při nákupu nových disků, které osobně doporučuji. Z důvodu bezproblémového chodu je třeba zajistit, aby disky, zapojené do RAID byly o stejných parametrech – kapacita, rychlost čtení, zápisu a otáček. Mezi běžné postupy při konfiguraci RAID patří osazení diskového pole disky od různých výrobců. Je to dáno tím, že existuje možnost výskytu vadné série od konkrétního výrobce. Nevýhodou tohoto řešení je případné snížení výkonu diskového
31
pole, které bude závislé na výkonu nejpomalejšího disku. U disků se stejnými parametry, ale od různých výrobců, se rychlost čtení a zápisu může lišit. Tento rozdíl je dán odlišným typem výroby a konstrukcí disků. Při pořízení disků je možné zvolit variantu disku s Hot plug funkcí a bez ní. Hot plug, případně se užívá také název Hot swap, je funkcionalita, která umožňuje výměnu disků (a jiných komponent) bez nutnosti vypnutí zařízení a tedy přerušení provozu. V našem případě je tato funkcionalita zbytečná, protože server je využíván pouze v pracovní době a spuštěné aplikace nejsou ovlivnitelné vypínáním serveru.
Obrázek 16 - HP 1TB 7200 ot./m. SATA pevný disk (zdroj: http://h30094.www3.hp.com/product.aspx?sku=3839320&pagemode=ca)
3.2.1.1 Varianta pořízení nových disků V případě, že by firma byla ochotná investovat do pořízení nových pevných disků, tak konfiguraci navrhuji dle tabulky:
Logická jednotka Logical disk 0 Logical disk 1 Logical disk 2
Počet fyzických disků 2 3 2
Model disku
RAID konfigurace
Typ uložených dat
1 5 1
operační systém uživatelská data aplikační server
HP 574021-B21 SATA 160GB 7200 ot./m HP 454146-B21 SATA 1TB 7200 ot./m hot plug HP 658071-B21 SATA 500GB 7200 ot./m Tabulka 1 – návrh zapojení disků do RAID (zdroj: autor)
1TB verze disku byla zvolena s funkcí Hot plug z důvodu špatné dostupnosti verze bez Hot plug na českém trhu. U disků s menší kapacitou lze zvolit i verzi s Hot plug, ale jak bylo zmíněno výše, v tomto případě není potřebná.
32
3.2.1.2 Varianta užití stávajících disků V případě, že by firma chtěla ušetřit na pořizovacích nákladech, lze použít stávající disky, ovšem je zde třeba počítat s vyšším rizikem selhání pevného disku, jelikož stávající disky jsou v provozu několik let. Nové disky je třeba pečlivě zvolit se stejnými parametry. Při této variantě navrhuji zakoupení 2 nových disků o kapacitě 500GB pro běh aplikačního serveru v konfiguraci RAID 1. Dále pak zakoupení 2 nových disků o kapacitě 1TB, které by se nakonfigurovaly společně se stávajícím 1TB diskem do konfigurace RAID 5 a sloužily by pro uložení uživatelských dat. Stávající 160GB disky lze užít pro běh operačního systému v konfiguraci RAID 1. Osobně však tuto variantu nedoporučuji vzhledem k dříve zmíněným skutečnostem.
3.2.2 Alternativní úložiště Jak již bylo zmíněno v teoretické části této bakalářské práce, spoléhat se pouze na RAID nelze, protože neřeší selhání hardware jako celku. Existuje zde možnost kritického selhání celého zařízení a v případě, že zálohování není prováděno na jiné úložiště, je s tím spojeno riziko kompletní ztráty dat. Ideálním řešením je zprovoznění záložního serveru, který přebere funkci hlavního serveru v případě jeho selhání. Vzhledem k velikosti firmy a vyčleněnému rozpočtu varianta s pořízením nového serveru nepřichází v úvahu. Jako levnější alternativa se pro zálohování systému nabízí použití NAS systému (Network Attached Storage). Současné NAS systémy nabízí více funkcí, než jen prostředek, kam ukládat data. Součástí NAS systémů bývá pokročilý operační systém (různé distribuce Linuxu a FreeBSD), které lze nakonfigurovat například pro funkci webového, emailového, případně DLNA (Digital Living Network Alliance – umožňuje sdílení multimediálních souborů) serveru. NAS lze zároveň používat jako síťový disk, který ale v našem případě nemá podstatné využití. Je to z důvodu, že firma má plně funkční server, který je vhodnější na tuto funkci.
33
Obrázek 17- Schéma návrhu IT technologií ve firmě (zdroj: autor)
NAS systémy obsahují pozice, do kterých lze připojit pevný disk. Jednotlivé NAS systémy se liší zejména tím, kolik nabízí volných pozic a různé úrovně jejich konfigurace v RAID. Další rozdíl je například počet síťových rozhraní, jejich rychlost a možnosti konfigurace. Konkrétní příklad pro firmu může být NAS systém Synology DiskStation DS414. Jedná se o systém určený pro malé a střední podniky. Výhodou tohoto systému je možnost osazení 4 pevných disků a to v režimech RAID 0/1/5/6/10. Zároveň poskytuje dostatečně vysoký výkon při zachování malé spotřeby (nejmenší udávaná hodnota je 39,35 W). Jedná se o dražší systém, ale jeho předností je možnost širšího využití do budoucna. Tím mám na mysli například podporu IP kamer a přístup k nim z mobilních zařízení.
34
Obrázek 18- Synology DiskStation DS414 (zdroj: https://www.synology.com/cs-cz/products/DS414#overview)
3.2.3 Archivace V nejhorších scénářích může nastat situace, kdy i přes pečlivé zálohování dat může dojít k jejich kompletní ztrátě, například při požáru budovy. V závislosti na plánu zálohování, krátkodobé zálohy se většinou přepisují. Z tohoto důvodu je vhodné v pravidelných intervalech vytvářet dlouhodobé kopie, které jsou uloženy na jiném, bezpečném místě. Pro snížení pořizovacích nákladů lze použít pro archivaci externí pevné disky, ale u nich není garantována životnost, to znamená, že médium nemusí být po určité době k přečtení. Mezi volitelné řešení bych zahrnul, s ohledem na požadavky dlouhodobého uchování, archivaci na médium, které má garantovanou životnost pro uchování dat. Příkladem a vhodným řešením pro firmu je Tandberg RDX mechanika s 2 TB RDX cartridge. Ta sice obsahuje 2,5 palcový pevný SATA disk, ale ten je uložen v pouzdře, které zmírňuje následky případného pádu. Udávaná životnost archivovaných dat je více než 10 let a odolnost proti poškození při pádu z 1 metru. (20) Data by měla být uložena na suchém a dobře větraném místě. Pro větší bezpečnost, přístup k datům by měly mít jen oprávněné osoby.
35
Obrázek 19 - Tandberg mechanika s RDX cartridge (zdroj: http://www.tandbergdata.com/us/index.cfm/products/removable-disk/rdx-quikstor/)
3.2.4 Zálohování do cloudu Ke snížení pořizovacích nákladů na hardware pro zálohování lze využít služby, které nabízí zálohování do cloudu. Vzhledem k aktuálnímu stavu a skutečnostem poskytovaného internetového připojení je třeba při volbě zálohování do cloudu zároveň zajistit stabilní připojení k internetu. Základní výhody a nevýhody obou řešení jsem shrnul do následující tabulky: Faktory Pořizovací náklady Dostupnost dat Rychlost Kontrola dat Bezpečnost dat Komfort přístupu Zálohování
Lokální řešení Vysoké Nezávislé na připojení k internetu Velmi vysoká rychlost pro přístup k datům Data jsou uchovávána v rámci firmy Závislá na nastavených procesech firmy Omezené možnosti přistupu z různých zařízení V rámci možnosti firmy a jejího hardware
Zálohování do cloudu Nízké, paušální platby Závislost na dostupnosti služby a internetu Nižší rychlost oproti lokálnímu řešení Data jsou spravována třetí stranou Vyšší pravděpodobnost napadení služby cílenými útoky Připojení z mobilů, tabletů, internetového prohlížeče Většinou vysoce redundantní
Tabulka 2 – porovnání lokálního a cloudového zálohování pro firmu (zdroj: autor)
Příkladem cloudového řešení pro firemní účely je Microsoft Azure, který nabízí širokou škálu produktů a v závislosti zaměření firmy lze zvolit vhodný produkt. Podle potřeby je možné vybírat z několika variant zálohování a v kolika kopiích budou data uložena. Na výběr je počet datacenter a jejich geografické umístění. Cena za 1TB dat v místním datacentru o 3 kopiích v současnosti vychází na 17,9 EUR. ( 21 )
36
3.3 Nastavení zálohování a monitoring 3.3.1 Plán zálohování Pro správnou funkci záloh je třeba vytvořit plán zálohování, který si nastavuje firma dle vlastních potřeb. Zálohy můžeme rozdělit na krátkodobé a dlouhodobé. V případě, že uživatel náhodně smaže soubor na síťovém disku, lze tento soubor zpětně obnovit z krátkodobých záloh. Ty lze mít nastavené jako přírůstkové vůči úplné záloze a jednotlivé zálohy jsou uchovávány v krátkodobém horizontu (rámec dnů až týdnů, podle dostupné kapacity). Po uplynutí dané doby se pak zálohy přepisují. Dlouhodobé úplné zálohy jsou náročnější z hlediska kapacity disků a na výkonu serveru. U těchto záloh je vhodnější nastavit plán po delších intervalech (rámec týdnů až měsíců), vše na základě potřeb podniku. Zároveň čas provedení úplné zálohy je lepší naplánovat na dobu, kdy nebude server využíván. Tyto zálohy většinou slouží k obnově dat při selhání některého ze zařízení. Mezi specifickou zálohu patří tzv. disaster recovery záloha, která slouží k obnově dat po nahodilé události, která znemožní přístup k veškerým datům v technologické místnosti. Tyto zálohy je vhodné mít uložené v jiné bezpečné lokalitě (např. byt jednatelů, bankovní bezpečnostní schránka). V závislosti na zabezpečení firemních prostor je vhodné veškeré zálohy šifrovat kvůli možnému zcizení firemních dat. Zálohy, které budou umístěny na externím záznamovém zařízení, důrazně doporučuji zašifrovat silným heslem a bezpečným algoritmem. Po každé provedené záloze je vhodné otestovat, zda jsou data uložena v pořádku a při zálohování nedošlo k jejich poškození. V případě obnovy se tímto dá vyhnout situaci, kdy zálohovaná data jsou k dispozici, ale nejdou přečíst. (22, kapitola 30) V našem konkrétním případě doporučuji následující plán zálohování:
Typ zálohy Přírůstková Úplná Recovery disaster
Interval zálohování Každý den od 23.00 Každá první sobota v měsíci Jednou za půl roku
Místo uložení záloh Server / Replikace na NAS Server / Replikace na NAS Externí disk / RDX cartridge
Tabulka 3 – plán zálohování pro firmu (zdroj: autor)
37
Doba uchování zálohy Měsíční obměna 2 měsíce 1 rok
3.3.2 Automatické zálohování Pro jednodušší a bezpečnější správu je vhodné nastavit automatické zálohování. Při správném nastavení je pak vyloučena možnost, že se pravidelná záloha vynechá.
3.3.2.1 Nativní Microsoft řešení V operačním systému Microsoft Windows Server 2008 je integrován jednoduchý nástroj pro zálohování dat uložených na serveru. Zálohy se nastavují vytvořením plánu zálohování. V něm je možné udělat zálohu celého serveru, včetně bodu obnovení, případně vybrat adresáře a disky, které se mají zálohovat. Grafické rozhraní nenabízí mnoho nastavení a umožňuje vytvoření jediného plánu zálohování.
Obrázek 20- Grafické prostředí programu Zálohování serveru (zdroj: autor)
Pro širší nastavení zálohování je třeba používat skriptů a plánovače úloh. Nativní program má výhodu v propracované integraci a uživatel se nemusí spoléhat na programy třetích stran. Nevýhodou je složitější nastavování pomocí příkazu wbadmin.exe. Na cílovém místě záloh se vytvoří adresář, ve kterém je záloha uložena a tu lze pomocí nástroje Zálohování serveru obnovit. Tento nástroj je vhodný pro tvorbu krátkodobých záloh. (23, str. 196) Pomocí příkazů funguje také program robocopy.exe, který slouží k hromadnému kopírování souborů a adresářů. S pomocí plánovače úloh lze nastavit kopírování souborů
38
na jiné úložiště v pravidelné časy. Jeho nevýhodou je nemožnost kopírování otevřených souborů. Tento program je vhodný na replikaci záloh na jiné úložiště. Pro mnou navrhované řešení je to ze serveru na NAS systém.
Pomocí Plánovače úloh a příkazu se provede kopírování v přednastavenou hodinu. robocopy.exe
/MIR
Příkaz /MIR provede kompletní zrcadlení záloh, včetně stromové struktury adresářů. Tato úloha by měla být spuštěna až po provedení denní zálohy.
Obrázek 21- Naplánovaná úloha pro kopírování záloh pomocí robocopy (zdroj: autor)
3.3.2.2 Využití aplikace třetí strany Jak již bylo zmíněno, nativní aplikace buď neobsahují potřebné funkce, nebo se musí konfigurovat pomocí příkazového řádku. To může přinést komplikace, kdy se opomine určitá část zálohování nebo může být napsána chybná syntaxe. Pro přehlednější a rychlejší obsluhu je možné zvolit aplikaci třetí strany.
39
Pro navrhované řešení shledávám vhodnou aplikaci Iperius Backup od firmy Enter Srl. Ta nabízí základní verzi zdarma a v případě potřeby dalších funkcí je možné dokoupit licenci. Dodatečné funkce jsou například nahrávání záloh přes FTP, zálohy databází SQL, zálohování otevřených/uzamčených souborů a jiné. Základní verze však nabízí dostatek funkcí a je pro naše řešení dostatečná. Iperius Backup nabízí přehledné grafické rozhraní, kde je možné zvolit typ zálohy, v jakém časovém období se má zálohování spustit, počet kopií a jiné. Iperius Backup navrhuji používat pro vytváření denních a plných záloh.
Obrázek 22- Aplikace Iperius Backup se spuštěnou úlohou (zdroj: autor)
3.3.3 Monitorování systému Vědět o problému dříve, než nastane, je vždy lepší, než problém řešit až když se stane. K tomuto účelu je vhodný monitoring systému. Součástí operačních systému Microsoft Windows Server je prohlížeč událostí. Z těch lze vyvodit některé případné hrozby, ale většinou je nutné je manuálně kontrolovat (24). Alternativou jsou specializované sledovací systémy, které včas upozorní na nahodilou událost. Mezi ně lze zařadit například IBM Tivoli monitoring. Firma HP nabízí monitorovací řešení HP Insight Control pro své servery. U obou řešení je třeba
40
zakoupit licence. Vzhledem k jejich ceně se ale vyplatí nasazení až ve středně velkých a velkých podnicích. Jako vhodná alternativa pro naše prostředí je monitorovací systém PRTG od firmy PAESSLER. Tento software nabízí rozšířené monitorování systému spolu se zasíláním upozornění na email. V základní verzi je poskytován zdarma. Základní verze PRTG nabízí současný běh 100 senzorů, které mohou kontrolovat systém. Nastavení senzorů si správci serverů nastavují sami a v případě nutnosti použití více senzorů pak lze, v rámci licence, dokoupit další. Pro účely firmy prozatím stačí 100 senzorů. Mezi základní nastavení, které doporučuji provést, je monitorování vytíženosti procesoru, operační paměti a zejména stav a zdraví disků. Zdraví disků je vyhodnocováno pomocí S.M.A.R.T. (Self Monitoring, Analysis and Reporting Technology), což je vnitřní technologie, která monitoruje stav na základě sbírání údajů při práci s diskem. S.M.A.R.T. nepředpoví selhání disků ve všech případech. Pokud nastane okamžitá nahodilá událost, nemusí na ní technologie zareagovat. Ta je určená spíše k monitorování chyb, které se projeví během delšího časového rozpětí. (25)
Obrázek 23- prostředí aplikace PRTG (zdroj: autor)
41
3.4 Firemní IT prostředí Na základě analýzy současného stavu byly zjištěny některé nedostatky v umístění aktivních a pasivních prvků. Volné položení serveru snižuje jeho životnost vzhledem k nesprávné cirkulaci vzduchu. Switch je volně položen na parapetu u oken. V obou případech hrozí poškození komponent nahodilou událostí, jako je například zakopnutí, polití kapalinou nebo pád předmětu. Zároveň je zde riziko odcizení části komponent (např. disků), celého zařízení nebo neodborné manipulace. Pro zlepšení situace navrhuji umístění veškerých aktivních prvků do skříně rack, která bude uzamykatelná a tím i omezí riziko neoprávněné manipulace. Zároveň umístění do racku poskytne dostatečnou vzduchovou cirkulaci a zpřehlední technologickou strukturu, která umožní mít veškeré aktivní prvky na jednom místě. Vzhledem k velikosti serveru, je třeba zvolit dostatečně velký rack o vhodné hloubce. Racky s možností připevnění na stěnu v tomto ohledu nevyhovují a tak je třeba volit ze stojících, popř. pojízdných rack skříní. Vhodný rack pro naše prostředí je například 19" rack od firmy Signal s počtem 24U pozic a hloubkou 800mm. U je jednotka míry používaná v informačních technologiích k popisu výšky zařízení. Počet U pozic racku je dostatečný pro všechna zařízení ve firmě. Skříň nabízí větrací otvory, kam je možné připevnit přídavné ventilátory zajišťující zvýšenou cirkulaci vzduchu. Vzhledem k menšímu počtu aktivních prvků však prozatím není třeba ventilátory dokupovat. Rack disponuje skleněnými uzamykatelnými dveřmi.
Obrázek 24 - SIGNAL 19 "Rack skříň 24U 600x800mm (zdroj: http://www.dipolnet.cz/signal_19_rack_skrin_24u_600x800mm_stojici__R912012.htm)
42
Co se týče pasivních síťových prvků, kategorie CAT5 kabelů je pro současnou situaci dostatečná. Vedení kabelů po zemi však zvyšuje riziko zranění osob, zničení počítačů a tiskáren v případě zakopnutí. Zároveň s tím souvisí výpadek koncového bodu. Dále navrhuji přidání síťových zásuvek RJ45 k zařízením, která v současnosti používají zmíněný swtich D-LINK 1008D. Centrální prvek pro síťovou kabeláž bude switch Cisco Catalyst 3560. To bude mít za následek snadnější správu sítě, řešení případných kolizí a zároveň eliminování prvku, který může selhat. Zařízení a data na něm uložená lze poškodit i při náhlém přerušení dodávky elektrického proudu. Částečnou kompenzací může být záložní zdroj UPS. Ve firmě je k dispozici záložní zdroj APC Back-UPS ES 700, avšak ten je určen spíše pro pracovní stanice, než server. Důvodem je kapacita baterií a na výstupu této UPS občas zařízení špatně vyhodnocuje podpětí nebo výpadek proudu. Jako krajní řešení ji lze použít jako záložní zdroj pro budoucí NAS server. Pro servery a citlivější elektroniku jsou vhodnější tzv. Smart-UPS, které obsahují line-interaktivní technologii, která neduhem levnějších UPS nedisponuje a zároveň regulují napěťový výstup bez poklesů či silných špiček. Příkladem je APC Smart-UPS C 1500VA 2U RM LCD, která je vhodná pro serverové řešení a nabízí dostatečný výkon 900 W a při 100% zátěži baterie vydrží 7 minut. Zároveň ji lze vmontovat do racku, kde obsadí 2U pozice.
Obrázek 25- APC Smart-UPS 1500VA LCD RM 2U 230V (zdroj: http://www.apc.com/products/resource/include/techspec_index.cfm?base_sku=SMT1500RMI2U)
43
3.5 Zálohování dat uživatelů Jak již bylo zmíněno, uživatelé většinu práce na projektech vykonávají na vlastních zařízeních. V těchto případech si za zálohy zodpovídá sám uživatel. Kvůli snížení rizika ztráty práce na části projektu a s tím související oddálení termínu předání hotového projektu doporučuji nastavit pravidlo, které pracovníkům určí zálohovací prostor na serveru, kam po skončení denní práce rozpracovaný projekt uloží. Tato činnost může být prováděna automaticky pomocí sofistikovaných programů, jako je například Cloud Station od firmy Synology. Spolu s nákupem NAS Synology DiskStation DS414 je možné využít dodávaný software pro zálohou počítačů s operačním systémem Windows a uživatelů Apple Mac. Následné NAS zálohy lze replikovat na server.
4 Zhodnocení navrhovaného řešení 4.1 Investice do navrhovaného řešení Na základě doporučeného návrhu řešení je v následující tabulce rozpis jednotlivých investic pro zvýšení bezpečnosti dat. Ceny jsou započítány z aktuálních cen spolehlivých internetových obchodů (Alza.cz, CZC.cz, Ab-com.cz, Patro.cz): Název 2x HP 574021-B21 SATA 160GB 7200 ot./m 3x HP 454146-B21 SATA 1TB 7200 ot./m hot plug 2x HP 658071-B21 SATA 500GB 7200 ot./m Synology DS414 Disc Station Tandberg RDX externí mechanika + 2TB Cartridge SIGNAL 19 "Rack skříň APC Smart-UPS 1500VA LCD RM 2U 230V
Cena celkem bez DPH 3 786 Kč 21 990 Kč 9 552 Kč 9 083 Kč 8 096 Kč 8 080 Kč 15 290 Kč
Cena celkem bez DPH
75 877 Kč
Tabulka 4 – celkový rozpočet navrhovaného řešení (zdroj: autor)
4.2 Přínosy navrhovaného řešení Navrhované řešení bylo přizpůsobeno finančnímu limitu, které si firma stanovila pro vytvoření základního zálohovacího procesu. V porovnání se současným stavem lze
44
říci, že aplikováním navrhovaných činností firma značně sníží riziko ztráty dat. Zároveň navrhované řešení zjednoduší práci na firemní síti. Vzhledem k tomu, že měsíční obrat firmy je několikanásobně vyšší, než vyhrazená částka pro zlepšení procesu zálohování ve firmě, navrhované řešení je pro firmu výhodné oproti vynaloženým nákladům na případný ušlý zisk a nákladům na obnovu dat.
ZÁVĚR Vzhledem k nedávné události, která byla zmíněna v analýze současného stavu, firma zjistila, jak důležité je mít správně nastavené zálohovací procedury. Během analýzy byly nalezeny nedostatky v současných procesech zálohování. Po seznámení se s požadavky firmy jsem navrhl takové řešení, které nepřesáhlo stanovenou částku vyčleněnou do zlepšení procesu zálohování. Vzhledem k tomu, že firma nemá vlastní IT oddělení, bylo navrhnuto takové řešení, aby i pokročilý uživatel dokázal nastavit veškeré procesy. Zároveň se s implementováním navrhovaného řešení zvýší rychlost přístupu k požadovaným datům a zvětší se kapacita úložného prostoru.
45
SEZNAM POUŽITÉ LITERATURY (1)
BRADÁČ, Richard. Zálohování a obnova dat – část 1. Technická příloha
časopisu LOGIN. 2008, 4., č.2. str. 1-4.
(2)
VEŠKRNA, Josef. Zálohování a archivace dat. Systemonline.cz [online]. C2001-
2015 [cit. 2015-01-12]. Dostupné z WWW: http://www.systemonline.cz/clanky/zalohovani-a-archivacedat.htm
(3)
JUNEK, Pavel. Zálohování a archivace dat v podnikovém prostředí – 3. díl,
Historie a současnost zálohování a archivace: Zalohovani.net [online]. c2014 [cit. 2015-01-12]. Dostupné z WWW: http://www.zalohovani.net/zalohovani-a-archivace-dat-vpodnikovem-prostredi-3-dil-historie-a-soucasnost-zalohovani-a-archivace/
(4)
BRADÁČ, Richard. Zálohování a obnova dat – část 2. Technická příloha
časopisu LOGIN. 2009, 4., č.1. str. 1-4.
(5)
WHAT IS LTO TECHNOLOGY?. Lto.org [online]. c 1999 - 2015
[cit. 2015-04-03]. Dostupné z WWW: http://www.lto.org/technology/what-is-lto-technology/
(6)
FARRANCE, Rex. Timeline: 50 Years of Hard Drives. PCWorld.com [online].
c1998-2015 [cit 2015-04-03]. Dostupné z WWW: http://www.pcworld.com/article/127105/article.html
(7)
Average Cost Of Hard Drive Storage. Statisticbrain.com [online]. c2015
[cit. 2015-04-03]. Dostupné z WWW: http://www.statisticbrain.com/average-cost-of-hard-drivestorage/
46
(8)
YURIN, Maxim. History Of Backup. Backuphistory.com [online]. c2003-2014
[cit. 2015-04-03]. Dostupné z WWW: http://www.backuphistory.com/
(9)
PECINOVSKÝ, Josef a Jan PECINOVSKÝ. Nero 7: kompletní průvodce
vypalováním CD a DVD. 1. vyd. Praha: Grada, 2006, 269 s. Průvodce. ISBN 8024713454. ( 10 ) Výsledky testů odolných DVD médií Data Tresor Disc. Cdr.cz [online]. c19982015 [cit. 2015-04-05]. Dostupné z WWW: http://cdr.cz/clanek/test-dvd-data-tresor-disc
( 11 ) HONG, Brandon Seong-Shin. The Sony MiniDisc. Minidisc.org [online]. [cit. 2015-04-06]. Dostupné z WWW: http://www.minidisc.org/index.php
( 12 ) PREIMESBERGER, Chris. Data Storage: NAND Flash Memory: 25 Years of Invention, Development. Eweek.com [online]. c2015 [cit. 2015-04-06]. Dostupné z WWW: http://www.eweek.com/c/a/Data-Storage/NAND-FlashMemory-25-Years-of-Invention-Development-684048
( 13 ) ALLYN-FEUER, Ari. Little, big, and green: a biography of the solid-state disk. Arstechnica.com [online]. c2015 [cit. 2015-04-06]. Dostupné z WWW: http://arstechnica.com/gadgets/2009/11/biography-solid-statedisk/ ( 14 ) JUNEK, Pavel. Zálohování a archivace dat v podnikovém prostředí – 5. díl, Typy záloh a jejich rotační schémata Zalohovani.net [online]. c2014 [cit. 2015-04-08]. Dostupné z WWW: http://www.zalohovani.net/zalohovani-a-archivace-dat-vpodnikovem-prostredi-5-dil-typy-zaloh-a-jejich-rotacni-schemata/
47
( 15 ) Inkrementální - přírůstková záloha. Acronis.cz [online]. c2015 [cit. 2015-04-08]. Dostupné z WWW: http://www.acronis.cz/kb/inkrementalni-zaloha/ ( 16 ) GILFILLAN, Ian. Myslíme v jazyce MySQL 4. Vyd. 1. Praha: Grada, 2003, 750 s. ISBN 80-247-0661-X. ( 17 ) SCHNEIDER, Robert D. MySQL: oficiální průvodce tvorbou, správou a laděním databází. 1. vyd. Praha: Grada, 2006, 372 s. ISBN 80-247-1516-3 ( 18 ) DOČEKAL, Michal. Správa linuxového serveru: RAID teoreticky. Linuxexpres.cz [online]. c2014 [cit. 2015-04-09]. Dostupné z WWW: http://www.linuxexpres.cz/praxe/sprava-linuxoveho-serveruraid-teoreticky ( 19 ) Zálohování dat. Xanadu.cz [online]. c2015 [cit. 2015-04-09]. Dostupné z WWW: http://www.xanadu.cz/cs/it-produkty/serverovareseni/zalohovani-a-archivace/ ( 20 ) HP RDX Removable Disk Backup Systém. Hp.com [online]. c2015 [cit. 2015-04-10]. Dostupné
z
WWW:
http://www8.hp.com/us/en/products/disk-backup/product-
detail.html?oid=3741006 ( 21 ) Ceny za Úložiště Azure. Microsoft.com [online]. c2015 [cit. 2015-04-10]. Dostupné z WWW: http://azure.microsoft.com/cs-cz/pricing/details/storage/
( 22 ) MORIMOTO, Rand a Guy YARDENI. Windows server 2008 R2 unleashed. Indianapolis, Ind.: Sams, c2010, xvi, 1653 p. ISBN 067233092x. [cit. 2015-04-10] ( 23 ) CAFOUREK, Bohdan. Správa Windows Serveru 2008: průvodce pokročilého správce. 1. vyd. Praha: Grada, 2009, 288 s. Profesionál. ISBN 978-80-247-2124-8. [cit. 2015-04-10]
48
( 24 ) Podrobná příručka pro sledování výkonu a spolehlivosti v systému Windows Server 2008. Microsoft.com [online]. c2015 [cit. 2015-04-10]. Dostupné z WWW: https://technet.microsoft.com/cs-cz/library/cc771692%28v= ws.10%29.aspx ( 25 ) DOČEKAL, Michal. Správa linuxového serveru: S.M.A.R.T. a zdraví pevných disků. Linuxexpres.cz [online]. c2014 [cit. 2015-04-10]. Dostupné z WWW: http://www.linuxexpres.cz/praxe/sprava-linuxoveho-serverusmart-a-zdravi-pevnych-disku
49
SEZNAM OBRÁZKŮ Obrázek 1- Děrná páska .................................................................................................. 13 Obrázek 2- Nejnovější řada magnetické pásky LTO 6 od firmy HP. ............................. 14 Obrázek 3- 1GB MiniDisc disk od firmy Sony .............................................................. 16 Obrázek 4- Vnitřní komponenty SSD disku ................................................................... 17 Obrázek 5- Zapojení disků do RAID 0 (zdroj: autor dle 16) .......................................... 19 Obrázek 6- Zapojení disků do RAID 1 (zdroj: autor dle 16) .......................................... 20 Obrázek 7- Zapojení disků do RAID 5 (zdroj: autor dle 18) .......................................... 20 Obrázek 8- Zapojení disků do RAID 1+0 (zdroj: autor dle 16) ...................................... 21 Obrázek 9- Konica Minolta Bizhub C6501 .................................................................... 25 Obrázek 10- Xerox 7142CAD ........................................................................................ 26 Obrázek 11- Apple iMac mid 2010................................................................................. 26 Obrázek 12- Server HP ProLiant DL160 G5 .................................................................. 27 Obrázek 13- Switch Cisco Catalyst 3560 ....................................................................... 27 Obrázek 14- Router TP-LINK TL-WR841ND ............................................................... 28 Obrázek 15- Záložní zdroj APC Back-UPS ES 700 ....................................................... 30 Obrázek 16 - HP 1TB 7200 ot./m. SATA pevný disk .................................................... 32 Obrázek 17- Schéma návrhu IT technologií ve firmě ..................................................... 34 Obrázek 18- Synology DiskStation DS414 .................................................................... 35 Obrázek 19 - Tandberg mechanika s RDX cartridge ...................................................... 36 Obrázek 20- Grafické prostředí programu Zálohování serveru ...................................... 38 Obrázek 21- Naplánovaná úloha pro kopírování záloh pomocí robocopy ..................... 39 Obrázek 22- Aplikace Iperius Backup se spuštěnou úlohou........................................... 40 Obrázek 23- prostředí aplikace PRTG (zdroj: autor) ...................................................... 41 Obrázek 24 - SIGNAL 19 "Rack skříň 24U 600x800mm .............................................. 42 Obrázek 25- APC Smart-UPS 1500VA LCD RM 2U 230V .......................................... 43
50
SEZNAM TABULEK Tabulka 1 – návrh zapojení disků do RAID (zdroj: autor)………………………………32 Tabulka 2 - porovnání lokálního a cloudového zálohování pro firmu……………………36 Tabulka 3 – plán zálohování pro firmu…………………………………………………..37 Tabulka 4 – celkový rozpočet navrhovaného řešení……………………………………..44
51