Paměťové sítě Cíl kapitoly Cílem této kapitoly je obezn{mít se se z{kladními pojmy a principy paměťových sítí, setn{mit se s vytv{řením těchto sítí a pracemi na těchto sítích Klíčové pojmy: Blokově orientované diskové operace, DAS, FC, konsolidace, NAS, SAN, souborově orientované diskové operace, virtualisace
Úvod Po několika desetiletích decentralizace ukl{d{ní dat se nyní IT obrací opět k centr{lnímu uložení dat. Toto umožňuje spojení zdrojů a celý centralizovaný systém se lépe řídí, sleduje a chr{ní. Konzolidace dat pro přenosy n{m umožňuje se dívat na komunikaci mezi počítači i přenosy dat jako na přenos dat. Virtualizace n{m umožňuje rozdělit fyzické prostředky na několik zd{nlivě nez{vislých jednotek. Toto mimo jiné umožňuje využívat data různými OS současně. Centralizace dat ale neznamen{, že data jsou ukl{d{na do jednoho místa fyzicky (tedy lze využívat i vzd{lených prostor jako jedno úložiště dat). K odlišení sítí LAN a paměťových sítí vedou jak rozdíly při komunikaci tak i rozdílné požadavky. Komunikace v sítích LAN je d{na metodou „best effort“, kdežto komunikace v paměťových sítích netoleruje ztr{ty LAN počít{ s variabilním zpožděním Při použití modelu TCP/IP doch{zí při typickém provozu v sítích LAN k přetěžov{ní procesorů serverů LAN jsou sítě s možností rozšíření na WAN, kdežto paměťové sítě jsou isolované sítě
Diskové operace Diskovými operacemi rozumíme způsob přenosu dat pro ukl{d{ní v pamětech. Rozlišujeme Souborově orientované diskové operace - např. systémy File I/O u OS WIN, UNIX, Novell Blokově (diskově) orientované diskové operace - Block I/O – datab{ze Používané protokoly jsou SCSI - blokově orientovaný protokol a optimalizovaný pro přenos dat
FC - Fiber Channel protokol – je založen na SCSI a proto je také blokově orientovaný. ISCSI je protokol který umožňuje využít diskové prostory přes LAN blokově orientovaným aplikacím
Nyní se používají zejména diskové prostory, které jsou blokově orientované. Představitelem je SAN (viz d{le). NAS (viz. d{le) resp. NAS Gateway se použív{ pro převod souborově orientovaného přístupu na blokově orientovaný, tedy jsou využív{ny v LAN operačními systémy se souborově orientovanými přístupy. . Paměťové sítě jsou využív{ny také pro z{lohov{ní. Tyto operace využívají nové technologie, které nahrazují klasické sběrnice a switche jako jsou například Direct Matrix – DMX. Systémy DMX jsou plně kompatibilní se současnými softwareovými produkty.
Typy paměťových sítí Paměťové sítě umožňují distribuované i koncentrované zapojení pamětí (medií) do sítí. Vznik sítí je důsledek zvyšov{ní významu software a služeb počítačových sítí. Rozlišujeme SAN – storage area network – využív{ FC NAS – Network Attached Storage – umožňuje ukl{d{ní dat přímo přes IP sítě Storage Grid – úložné gridy, které jsou souč{stí konceptu grid computing. DAS – Direct Attache Storage – lok{lní úložný systém – který je starší, dnes již téměř nepoužívaný systém. Každé diskové pole mělo svůj jednoúčelový jednoduchý server pro komunikaci na LAN. LAN
Ethernet
zdvojený file server
NAS
DAS FC switch SAN
Podrobný popis jednotlivých typů paměťových sítí je v n{sledující kapitole. Kontrolní ot{zky: - Které sítě podporují blokově orientované diskové operace? - Které sítě podporují souborově orientované diskové operace? - Vyjmenujte hlavní důvody pro zavedení paměťových sítí. - Vyjmenujte druhy pamě%tových sítí.
Popisy paměťových sítí Cíl kapitoly: Pochopení činnosti jednotlivých typů paměťových sítí, se zaměřením na jejich rozdíly
SAN SAN – storage area network – norma RFC 3347 - je síť, kter{ spojuje paměťov{ zařízení (disky, p{sky, CD) a připojuje je ke všem typům výpočetních zařízení. Storage area network je dedikovan{ datov{ síť (oddělen{ od LAN, WAN, atd), kter{ slouží pro připojení externích paměťových zařízení k serverům (diskov{ pole, p{skové knihovny a jin{ z{lohovací zařízení). SAN vznikla hlavně kvůli narůstajícím potřeb{m na zabezpečení, konsolidace dat, fyzickému oddělení úložišť, sdílení zdrojů dat a možnosti n{hradních cest k datům. Prov{dí vysokorychlostní, chybově tolerantní přístup k datům pro různé klienty, servery a hostující počítače. N{sledující definice sítě SAN poměrně dobře objasňuje použití těchto sítí: “SAN je vysokorychlostní síť pro speci{lní účely, kter{ propojuje paměťov{ zařízení různých druhů a asociované servery za účelem využití velkým počtem uživatelů.“ Přes časté použív{ní sítí SAN, tento systém je st{le relativně slabý systém, nezajišťující v dostatečné míře interoperabilitu mezi výrobci. Jeden z hlavních znaků SAN, jak už bylo uvedeno, je charakter přenosu dat. SAN je blokový systém, tedy nikoli souborový, na který jsme zvyklí při ukl{d{ní dat. Pro vlastní ukl{d{ní m{ SAN svůj souborový systém – SAN wide File systém – který funguje bez ohledu na serverovou platformu a koncov{ zařízení. SAN umožňuje propojovat jednotliv{ pole do rozs{hlých SAN celků. Připojení SAN a vlastnísíť je vytv{řena pomocí switchů (fabric switch), směrovačů a storage routerů. Tato zařízení jsou propojena pomocí Fiber Channel – protokol pro optick{ vl{kna – o rychlosti 10Gb/s. Dnešní technologie připojov{ní SAN sítí je pomocí switchů, směrovačů a storage routerů jsou vhodn{ zejména pro rozs{hl{ pole. Pro menší dosahy lze použít i SCSI, který se napojuje přes FC-SCSI bridge. Fabric switch v sítích SAN musí vyhovovat alespoň těmto parametrům Každý switch a každý jeho port musí mít svou adresu a zaručit alespoň 200MB/s Počet portů až 256
Možnost zapojení switchů do kask{d Cut through nebo store and forward Pro bezpečnost možnost vytv{ření zón (pro různé OS), oddělení uživatelských skupin o Hard zóny – oddělené zóny, a mezi nimi neexistuje ž{dn{ komunikace – nepoužív{ se o Soft zóny – všechny zóny jdou přes jeden (dvojitý) switch a port – oddělení pomocí adres o Maskov{ní – na úrovni datových polí – vytv{ření LUN – logických disků, kterým se přiřazují pro mapov{ní vlastní adresy.
Výhody sítí SAN konsolidace dat - Propojení SAN je pomocí Fiber Channel a SAN tvoří samostatnou síť nez{vislou na podnikovém Intranetu. Tím je umožněna konsolidace dat. Díky nez{vislosti této sítě, úloha a ani administr{tor neví, odkud se moment{lně data berou akam jsou přesně ukl{d{na. Efektivní využití diskové kapacity – Díky software pracují všechna paměťov{ zařízení jako jeden celek.. V nejvyšším stupni lze vytvořit virtu{lní datovou oblast. Koncept virtualizace spočív{ v zach{zení se svazky podle vlastního uv{žení, aby bylo optimalizov{no uložení dat. Dynamické přidělov{ní datového prostoru - Lze bez jakéhokoli z{sahu přid{vat a ubírat disky. Po přid{ní disků software přerozdělí data, aby bylo uložení opět optimalizov{no. Navenek se celý prostor zobrazuje jako jeden disk (včetně p{skových jednotek). Heterogenní konektivita - různé OS – připojení přes FC switch umožňuje pole připojovat k různým OS - - zónování - oddělení oblastí pro různé OS. Některé OS (NT) jsou agresivní a snaží se zapisovat do všech volných polí Sdílení dat - umožňuje read pro všechny servery i když 1 server zapisuje (pomocí cache) -
Masivní šk{lovatelnost – až 16mil zařízení, kask{dy switchů.
Schema sítě SAN
FC 10km
Pro přenos na rozs{hlých IP sítích se použív{
převodníků FC/ATM iSCSI umožňující propojení WAN a SAN založených na protokolu FC, využívající protokolu IP. SCSI je protokol point-to-point R{mce SCSI lze zabalit do paketů protokolu IP a přen{šet ve WAN. Pro 1Gbitový ethernet jsou pomalejší než FC, ale pro 10Gb/s ethernet mohou být rychlejší než FC se svými 4Gb/s. FCIP – FC over IP – je nejrozšířenější a umožňuje pouzdření FC do IP pro přenos v sítích WAN. Rychlost 4Gb/s. FCE – FC extension – pro propojení isolovaných sítí s využití WDM
ethernet Server1
disk1
server2
server3
FC
backup
switch
server
disk2
disk3 FC-SCSI Bridge
p{sky
Stavební prvky (tato kapitolka je jen doplňující, není povinn{) SAN se skl{d{ ze tří složek
Transportní infrastruktury – nejčastěji FC o File servery o DB servery o BackUp servery o Aplikační servery o FC switche o FC-SCSI Bridge o GBIC – konvertory na různé technologie Úložných systémů – disky o RAID o JBOD o P{skové knihovny o SCSI zařízení Software pro o Management o Backup
Kontrolní ot{zky: - Objasněte pojem dedikovaný. - Zopakujte si vlastnosti protokolu Fiber Channel – FC. - Co je to konsolidace dat? - Čím se dosahuje efektivního využití diskové kapacity? - Proč je vhodné dynamicky měnit rozdělení a počty disků?
NAS NAS – Network Attached Storage – připojení pamětí k sítím LAN. Tento způsob je méně častý, ale jednodušší. Navíc je jeho instalace a konfigurace jednoduch{. Každé diskové pole (nebo p{skové jednotky), ze kterého se NAS skl{d{ m{ svůj server pro komunikaci v ethernetové síti. Vzhledem k napojení na ethernetovskou síť jsou data zasíl{na ve formě souborů (pomocí paketů). Tyto komunikační servery mohou být nastavov{ny přímé z datové sítě, a proto servery nepotřebují kl{vesníce a monitory. Proto jsou servery nazýv{ny NAS-gate, to znamen{ br{ny do jiné sítě. Tyto servery
umožňují spojovat a sdílet datab{ze od různých OS a tedy na různých aplikačních serverech. Hlavní vlastnosti sítí NAS jsou: o NAS i datov{ síť tvoří jednu síť LAN o Paměťov{ síť je dostupn{ on-line přes LAN o Nižší n{klady, diskové pole je efektivně využito o SAN přebírají zodpovědnost za soubory od serverů a případně počítačů. o Omezení výkonnosti celé sítě LAN o Rychlost NAS je omezena sítí LAN, obvykle 100Mb ethernetem o Zvýšení výkonu je možné připojením na 1Gb/s Ethernet – 1GE nebo na 10GE o Přístup v sítích NAS je pomocí iSCSI přes IP po paketech o Snapshot – rychl{ kopie dat ze sítě LAN a potom přesun na velkokapacitní medium o NAS užív{ protokoly založené na souborových protokolech. o Komunikace přes LAN, kde jsou též n{stroje pro spr{vu a centralizovaný managment (pro windows jsou to protokoly SMB/CIFS (Server Message Block Common Internet File System), d{le NFS (zejména u UNIXů), FTP, http apod.) o NAS může vytv{řet clustery (NAS-gate a pole disků) o ethernet
server1
server2
server3
NAS-gate SCSI/FC
NAS
NAS jsou specifick{ zařízení, kter{ propojují souborový server (NAS-gate) a aplikační server. Připojení jednotky NAS velmi ulehčí hlavním serverům v síti, ale zatěžuje ethernetovskou síť. Kontrolní ot{zky: - Jaký je hlavní rozdíl mezi SAN a NAS? - Co je to NAS-gate? - Jaké jsou nevýhody NAS oproti SAN? - Lze jeden NAS používat pro více OS? Proč?
Storage grid (8) Se skl{dají z inteligentních jednotek, které jsou navz{jem propojeny vysokorychlostní sítí. Jedn{ se tedy o paměťový cluster řízený Scheduler-em, tj. DRM – Distributed Resource Manager. Ten zn{ použitelné zdroje a přiděluje je jednotlivým úloh{m. Tyto jednotky obsahující též procesor a operační paměť, mohou řešit samostatně úlohy. Jednotlivé jednotky pracují paralelně a tedy prohled{v{ní se děje na všech pamětech současně. Tím je potlačen bottle neck sítě a jednotky mohou být kdekoli na světě. Kapacita není přidělena ani aplikacím, ani serverům či stanicím. Kapacita je volně rozšiřiteln{ a přiděluje se dynamicky. Inteligentní jednotky spolupracují mezi sebou a řídí chod ve svých č{stech gridu, není tedy zapotřebí ani centr{lní ani lok{lní řadič. Počít{ se, že se stane běžnou souč{stí computing gridů. V r. 2004 je nasazen v neworské bance.
DAS Direct Attached Storage – diskové pole se připojuje přímo k serverům jako externí úložiště. DAS zařízení jsou obvykle vybavena RAID řadiči. Celkově se tv{ří jako lok{lní pevný disk. Připojení je velmi často pomocí SCSI. DAS může vytv{řet spolu se servery clustery. Spr{va DAS je pomocí webového rozhraní. . ethernet Server1
server2
server3
disk2
disk3
scsi Disk1
Kontrolní ot{zky - Lze podle obr{zku diskové pole –Disk1 využívat přímo serverem 2? - Proč se u paměťových sítí často použív{ protokol SCSI?
Spr{va paměťových sítí (2) SAM - Storage Area Managment. Hlavním úkolem spr{vy paměťových sítí je skoubit dohromady spr{vu sítě LAN (resp. WAN) a paměťové sítě. Problémem zůst{v{ uzavřenost SAN, neboť neexistuje dokonal{ standardizace a každý výrobce
m{ své odlišnosti. Proto každý výrobce s hardwarem prod{v{ i svůj software. Krok k otevřenosti je u Fiber Channel zavedením Internet SCSI – iSCSI a 10Gb ethernetu. Produkty pro paměťové sítě musí obsahovat: Virtualizaci úložného systému, kter{ umožňuje zobrazovat samostatné diskové subjekty jako jediný prostor. Umožňuje přidělovat jednotlivým serverům úložný prostor, (obvykle při využití okolo 95%.- jinak využití prostoru je okolo 60%). Replikace dat – replikace dat na více míst na fyzické úrovni (nutno odlišit od replikace datab{zových architektur na aplikační úrovni). Tyto repliky prov{dí se zpožděním, aby bylo možno se vr{tit případně k původním datům CLONE – data se průběžně kopírují na kopii – kopie jsou během procesu nepřístupné nebo alespoň určeny jen pro čtení. Je možno z nich prov{dět back-up. Po rozpojení vazby jsou kopie přístupné pro servery. Mají velkou spotřebu diskového prostoru. Úklid trv{ několik minut. SNAPSHOT – neboli virtu{lní kopie. P{skové z{lohov{ní – patří vlastně k replikaci dat Spr{va úložných sítí a prostředků – fyzick{ a výkonov{ spr{va na fyzické úrovni – fibre channel (koncov{ zařízení, přepínače) Kontrolní ot{zky: - Co je to CLONE? - Proč je použív{n SNAPSHOT? - Co je to Fibre Channel?
Shrnutí Tato kapitola měla za účel sezn{mit studenty se z{kladní problematikou paměťových sítí. Tyto sítě jsou s rozvoje pročítačových gridů a cloud computingu st{le důležitější a jejich použití je bezpodmínečně nutné. Rozvoj těchto sítí je tedy velmi rychlý a cel{ kapitola si vyžaduje studium novinek v této oblasti. Proto obsahem této kapitoly jsou jen z{klaadní fakta, o kterých se předpokl{d{, že nebudou ve své podstatě rychle měněna.