AC Privátní Cloud Popis funkcí 1. Základní stavební jednotka - x86 server Základní stavební jednotkou systému jsou 2U x86 servery, které slouží zároveň pro ukládání dat (storage cluster) i jako HW vrstva pro serverovou virtualizaci na VMware vSphere. 10 Gbit konektivita - směrem uživatelům i mezi servery clusteru SSD akcelerátor v PCIe slotu Využití části jader CPU jako řadičových čipů a částí pro provoz aplikací. Až 24 fyzických jader (48 s hyperthreadingem). Využití RAM jako diskové cache a zároveň pro virtuální stroje. Až 768 GB RAM na jeden nod. Až 25 SSD/SAS/NL-SAS disků na jeden server Jednotlivé nody (servery) lze nakonfigurovat přesně podle požadavků aplikací a v případě změny v budoucnu je jejich rozšíření jednoduchou a levnou záležitostí. Systém se skládá minimálně ze tří serverů a lze jej škálovat do celkového počtu v řádu desítek jednotek. Už základní konfigurace 3 serverů nabízí zajímavé výkony a kapacity. Hlavní parametry jsou shrnuty v následující tabulce: Kategorie
1 server
Základní konfigurace 3 serverů
Procesor
až 2x 12-ti jádrový Xeon řady E5-2690
až 6x 12-ti jádrový Xeon řady E5-2690
RAM
24 slotů, až 768 GB
72 slotů, až 2,3 TB
Konektivita
10 Gbit IP/iSCSI, 2x-6x 10 Gbit SFP+
10 Gbit IP/iSCSI, 6x-18x 10 Gbit SFP+
Disková kapacita
25x2,5'' pozice nebo 12x 3,5'' pozice
75x2,5'' pozice nebo 36x3,5'' pozice
Diskový výkon
až 20.000 IOPS a latence <1ms
až 60.000 IOPS a latence <1ms
Typy disků - 2,5''
300-1200 GB SAS 10k nebo 1 TB 7,2k
Typy disků - 3,5''
300-600 GB SAS 15k nebo 1-4TB SATA 7,2k
Typy disků - SSD
200-800 GB SLC PCIe nebo 200-800 GB eMLC SAS
Jednou z výrazných výhod konceptu „nekupujme disková pole a SAN infrastrukturu a postavme vše na x86 serverech” je cena. Mezi diskovými poli různých řad a různých výrobců jsou velké technické rozdíly, protože každý výrobce si vyvíjí svůj vlastní systém = náklady na vývoj jsou následně zohledněny poměrně vysokou cenou výsledného produktu. Naproti tomu rozdíly mezi x86 servery u velkých výrobců (IBM, DELL, HP, Fujitsu) jsou zanedbatelné (komponenty jsou standardizované) a při výběru dodavatele hraje roli spíše cena než drobné nuance v technickém provedení. Díky vysoké konkurenci mezi výrobci je tak možné HW pořídit za zlomek ceny při srovnání s infrastrukturou SERVER-SAN-DISKOVÉ POLE. Toto je obecný trend na dnešním IT trhu a čím dál tím více odborníků hovoří o ”softwarově definované storage“.
2. Výkon 2.1. 10 Gbit konektivita Jednotlivé servery jsou propojeny 10 Gbit konektivou dvojicí redundantních IP switchů. Ty slouží jak pro komunikaci v rámci clusteru, tak i pro komunikaci se zbytkem infrastruktury (připojení do LAN). 2.2. Přístup na všechny disky v systému Storage vrstva AC Privátního Cloudu zajišťuje, aby virtuální servery vždy využívaly výkon všech disků v clusteru bez ohledu na nastavené virtuální svazky. Toto se týká zápisových i čtecích operací. Rozložení dat přes všechny disky v systému
2.3. SSD akcelerace Do každého serveru v clusteru lze zakomponovat SSD akcelerátor v kapacitách 200 GB, 400 GB i větší. SSD akcelerátor je umístěn v PCIe slotu a je tudíž přístupný procesoru přímo po sběrnici tzn. nedochází ke snížení výkonu a zvýšení latencí průchodem přes řadič. Tento systém dokáže razantním způsobem zvýšit výkon celého diskového subsystému za velmi nízkou cenu.
Akcelerátor s relativně malou kapacitou tak dokáže až 10x zvýšit výkon (řádově desítky tisíc IOPS) a až 100x snížit latence
Akcelerovat je možné čtecí i zápisové operace. Při akceleraci zápisových operací je nutné umístit SSD akcelerátor do alespoň dvou serverů, aby bylo zajištěno jejich zrcadlení a zamezilo se ztrátě dat a výpadku provozu v případě selhání HW.
(řádově mikrosekundy). Abychom se na
SSD akceleraci lze nasadit na základě požadavků aplikací. Existují následující možné scénáře:
na desítkách ale na stovkách disků. To by
podobný výkon dostali s klasickými točícími se disky, bylo by nutné postavit storage ne samozřejmě bylo velmi nákladné. Na druhou stranu postavit celý storage pouze na SSD
1. Akcelerace vytipovaných virtuálních strojů - zejména se jedná o náročné informační systémy, databáze (Oracle, SQL) a v některých případech také o poštovní server. Tato varianta je zaměřená nejcíleněji na konkrétní nejvytíženější aplikace a SSD výkon je pro tyto aplikace rezervován.
discích je také velmi drahé a výkon v řádů stovek tisíc IOPS je pro řadu společností zbytečný. Chytrá SSD akcelerace představuje velmi zajímavý kompromis
2. Akcelerace všech VM serverů - akcelerovat storage výkon mohu také na úrovni celého serveru. Smysl dává především umístit všechny virtuální stroje vyžadující velký diskový výkon na jeden ze serverů clusteru a tento server následně akcelerovat. Dojde tak k velmi efektivnímu využití SSD technologie. 3. Akcelerace všech serverů v clusteru se sdílením SSD disků - pokud není žádané či potřebné vybírat, které aplikace je nutné akcelerovat, je možné nasadit SSD akceleraci do všech serverů AC Privátního Cloudu. Obsah SSD je pak zrcadlen/sdílen mezi všemi servery a aplikace jsou akcelerovány bez ohledu na to, na kterém fyzickém serveru běží. Data uložená v SSD discích jsou navíc navázána na konkrétní virtuální stroj - pokud je přemigrován (manuálně nebo automaticky s DRS), akcelerovaný obsah se přesune spolu s ním.
PCIe SSD akcelerátor
jak spojit relativně nízkou pořizovací cenu s využitelným výkonem v řádu desítek tisíc IOPS.
3. Vysoká bezpečnost 3.1. Zabezpečení v rámci clusteru - ZERO DOWNTIME Servery AC Privátního Cloudu mezi sebou na storage úrovni komunikují a pracují s daty tak, aby bylo zajištěno, že v jednu chvíli jsou konkrétní data uložena na minimálně dvou serverech. Díky tomu je zabezpečeno, že v případě fyzického selhání jednoho ze serverů v clusteru nedojde k žádné ztrátě dat. Systém tuto funkci navíc zajišťuje transparentně vzhledem k aplikacím - ty vůbec nepoznají, že se něco stalo a pokračují v provozu bez jakéhokoliv výpadku.
Na úrovni virtuálních strojů je vysoká dostupnost zajištěna prostřednictvím VMware HA clusteru, popřípadě Fault Tolerant funkcí. V případě výpadku tedy virtuální stroje automaticky přepadnou na další servery v clusteru.
Konektivita mezi servery clusteru je vždy umožněna minimálně dvojicí 10 Gbit IP prvků. Zapojení je vždy redundantní, aby v případě výpadku jednoho switche nedošlo k přerušení provozu ani ztrátě konektivity. Korektní stav
Co se děje při výpadku serveru? • Nedojde ke ztrátě dat - data byla redundantně uložena zároveň na více serverech. • Systém zajistí automatický failover storage části - Vmware prostředí vůbec nezjistí, že došlo k výpadku a pokračuje bez výpadku v provozu. • Na úrovni VMware dojde k přepadnutí virtuálních strojů ze selhaného serveru na další servery v clusteru.
Výpadek jednoho prvku
Celý systém má navíc globální spare kapacitu. V případě výpadku jednoho ze serverů v clusteru pak dojde k automatické resynchronizaci = data se bez zásahu administrátora dostanou do zrcadleného stavu a systém bude opět odolný proti výpadku.
Resynchronizace dat = opět plné zrcadlo
A když je server opět zprovozněn? Po opravě HW se systém dostane do původního stavu - VM jsou přesunuty zpět na původní server a data se rozstripují mezi všechny servery v clusteru. Celkově je tedy systém odolný proti výpadku kterékoliv komponenty clusteru (no single point of failure). Kromě zajištění provozu v případě selhání hardware tato funkce usnadňuje správu celého systému - při řízeném výpadku (odstávce) pak lze udělat údržbu za plného provozu. Jakékoliv rozšiřování systému, migrace a podobné činnosti se také provádějí za plného provozu a s minimálním omezením výkonu.
Návrat do korektního stavu po výpadku
4. Rozšiřitelnost/škálovatelnost U klasického scénáře (SERVER-SAN-POLE) je finančně výhodnější při nákupu celý systém předimenzovat tak, aby dostačoval po celou dobu plánované životnosti. Cena rozšíření je totiž výrazně vyšší než při pořízení nového systému - při rozšíření musíte koupit HW od předchozího výrobce a neexistuje konkurenční boj mezi výrobci. Navíc rozšiřování diskového pole (dokupování disků) je výrazně dražší než dokupování (technicky totožných) disků do serveru.
Rozšíření doplněním komponent (HDD, RAM, SSD akcelerace)
Pro srovnání: 600 GB SAS HDD - diskové pole IBM V7000 Storwize = 29.380 Kč v ceníkové ceně 600GB SAS HDD - HP DL380p server = 9.850 Kč v ceníkové ceně
AC Privátní Cloud je nezávislý na výrobci HW. Díky tomu je cena HW při pořízení a při rozšiřování řešení cenově srovnatelná = není třeba systém při pořízení předimenzovat (obtížně se odhadují nároky za rok natož za tři roky) a uspoří se značná část nákladů.
AC Privátní Cloud je škálovatelný do desítek až stovek serverů, to je na storage řádově od desítek do stovek disků (základní konfigurace má k dispozici 75 pozic pro disky). Systém bývá navíc dimenzován tak, aby ho bylo možné jednoduše rozšířit bez nutnosti pořízení nového serveru - je v něm dostatek volných pozic pro disky, dostatek PCIe slotů, volné RAM sloty apod. A jak už bylo zmíněno výše, dokupovaní komponent do serveru je výrazně levnější než dokupování komponent do diskového pole.
Rozšíření doplněním dalších serverů (roste výpočetní i storage výkon)
5. Zálohování a Disaster Recovery S rostoucím významem IT jde ruku v ruce i požadavek na zajištění dostupnosti dat a zachování provozu i v případě výpadku produkční lokality (většinou z důvodu pohromy - výpadek proudu, zaplavení, požár, krádež apod.). Současně je potřeba data společnosti zálohovat a chránit před chybou uživatele nebo aplikace. AC Privátní Cloud obě tyto důležité funkce obsahuje. 5.1. Lokální záloha Pro běžný provoz, tedy časté zálohy a hlavně rychlé obnovy je vhodné umístit zálohovací zařízení přímo na LAN síti ve stejné lokalitě. I když je vhodné umístit zálohovací zařízení do jiné místnosti nebo budovy v rámci lokality, není to podmínkou. 5.2. Replikace dat off-site a zajištění DR Kromě lokální zálohy je však nutné data zabezpečit i pro případ výpadku celé hlavní lokality. Nabízejí se dvě varianty: • Zbytek společnosti nepotřebuje v případě výpadku hlavní lokality okamžitý přístup k aplikacím. V tomto případě stačí off-site umístit pouze úložiště pro data a provoz bude obnoven v hlavní lokalitě po odstranění havárie (řádově dny až týdny). • Zbytek společnosti musí být schopen fungovat i bez hlavní lokality. V tomto případě je kromě datového úložiště nutné v off-site lokalitě zajistit také serverové prostředí pro běh aplikací. Může se jednat například o rezervovaný výkon v hostingovém centru AC nebo starší infrastrukturu klienta, která už nestačila pro běh produkčního prostředí.
Hlavní vlastnosti jsou: • Blokový přístup - zálohují se pouze změněné bloky a ne celé změněné soubory. Z toho plyne výrazně nižší zatížení sítě i výrazně vyšší rychlost zálohování • Zálohování na úrovni virtuálních strojů jsou zálohovány celé virtuální stroje včetně operačního systému - díky tomu lze data i celé virtuální stroje jednoduše obnovit i na jiný HW. • Krátké intervaly mezi zálohami (RPO) - systém umožňuje zálohovat ne jednou denně, ale až v 15-ti minutových intervalech. Typické nastavení je záloha jednou denně. • Instantní obnova (RTO) - data není potřeba obnovovat - jsou přímo přístupná ze zálohovacího úložiště. Je tak možné přímo spustit virtuální stroje a použít backup úložiště jako záložní diskové pole.
V případě, že je pro některé aplikace nebo celé prostředí požadovaná lepší úroveň ochrany (lepší RTO a RPO), je možné doplnit integrované funkce o další SW, který tyto parametry naplní.
www.autocont.cz www.autocont.sk