Bankovní institut vysoká škola Praha Katedra informačních technologií a elektronického obchodování
Srovnání hardwarových platforem pro serverové aplikace EO a bankovnictví Bakalářská práce
Autor:
Marek Novák Informační technologie, správce informačních systémů
Vedoucí práce:
Praha
Ing. Vít Fábera, Ph.D.
Leden 2010
Prohlášení: Prohlašuji, ţe jsem bakalářskou práci zpracoval samostatně a s pouţitím uvedené literatury.
V Praze dne 24. dubna 2010
Marek Novák
Poděkování: Tímto bych rád poděkoval vedoucímu své bakalářské práce panu Ing. Vítu Fáberovi, Ph.D. za cenné rady, připomínky a odborné vedení celé práce.
Anotace Tato bakalářská práce na téma „Srovnání hardwarových platforem pro serverové aplikace EO a bankovnictví“ se zabývá servery z pohledu hardware. Popisuje základní poţadavky na servery. Je zde navrţena metoda jak porovnat hardware serverů. Porovnání se provádí i na konkrétní konfiguraci. Závěrečná část práce věnuje pozornost konsolidaci serverů pomocí virtualizace. Jak lze tímto způsobem sníţit náklady na provoz, ukazuje praktický příklad.
Annotation This baccalaureate work on subject "Comparison of Hardware Platforms for Servers Application in E-Commerce and E-banking" deals with hardware of servers and describes basic requirements for it. It designes, furthermore, the comparison method for hardware of servers, which is executed for specific configuration. Its final part deals with consolidation of servers by virtualization. Possibility how to reduce in this way the operational costs is given in practical example.
ÚVOD ................................................................................................................................... 7 1 OBECNÉ POŢADAVKY NA SERVER ........................................................................ 8 1.1 Propustnost .................................................................................................................... 8 1.2 Moţnost zvyšování výkonu ........................................................................................... 8 1.3 Vysoká spolehlivost ....................................................................................................... 8 1.3.1 SLA........................................................................................................................... 9 1.4 Diagnostika ................................................................................................................... 10 1.5 Paměti ........................................................................................................................... 10 1.6 Umístění serveru .......................................................................................................... 11 1.6.1 Datové centrum ...................................................................................................... 12 1.6.1.1 „Energetické centrum“ .................................................................................... 12 1.6.1.2 UPS + baterie ................................................................................................... 13 1.6.1.3 Motorgenerátor ................................................................................................ 13 1.6.1.4 Stejnosměrné systémy ..................................................................................... 13 1.6.1.5 Trafostanice, přívody VN ................................................................................ 13 1.6.1.6 Chlazení ........................................................................................................... 13 1.6.1.7 Infrastruktura (fyzická infrastruktura) ............................................................. 14 1.6.1.8 Zabezpečení ..................................................................................................... 14 1.6.1.8.1 Poţární bezpečnost ................................................................................... 14 1.6.1.8.2 Fyzická bezpečnost ................................................................................... 14 1.6.1.8.3 Bezpečnost IT ........................................................................................... 15 1.6.1.9 Monitoring ....................................................................................................... 15 1.7 Ostatní poţadavky ....................................................................................................... 15 2 TRENDY V OBLASTI SERVEROVÝCH SYSTÉMŮ .............................................. 16 2.1 Specializace .................................................................................................................. 16 2.2 Konsolidace serverů .................................................................................................... 16 2.2.1 Fyzická konsolidace a konsolidace provozu aplikací, Green IT ............................ 16 2.2.2 Konsolidace úloţiště (storage) ............................................................................... 17 2.3 Rozdělování a sdílení zátěţe ....................................................................................... 20 3 ROZDĚLENÍ SERVERŮ DLE PROVEDENÍ ............................................................ 21 3.1 Rackové servery ........................................................................................................... 21 3.2 Tower servery .............................................................................................................. 22 3.3 Blade servery ................................................................................................................ 23 4 VÝKON SERVERŮ ....................................................................................................... 25 4.1 Co má vliv na výkon? .................................................................................................. 25 5 PŘÍKLADY KONFIGURACE SERVERŮ A JEJICH POROVNÁNÍ .................... 30
5
5.1 Server Dell PowerEdge T710 ...................................................................................... 31 5.2 Server HP ProLiant ML350 G6 ................................................................................. 32 5.3 Porovnání serverů Dell PowerEdge T710 a HP ProLiant ML350 G6 .................... 33 6 ZKUŠENOSTI Z PROVOZU DATOVÉHO CENTRA ............................................. 36 6.1 Popis datového centra ................................................................................................. 36 6.1.2 Napájení.................................................................................................................. 36 6.1.3 Chlazení .................................................................................................................. 37 6.1.4 Fyzická infrastruktura ............................................................................................. 37 6.1.5 Poţární bezpečnost ................................................................................................. 37 6.1.6 Fyzická bezpečnost ................................................................................................. 38 6.1.7 Bezpečnost IT ......................................................................................................... 38 6.1.8 Monitoring .............................................................................................................. 38 6.2 Virtualizace .................................................................................................................. 38 6.2.1 Pouţitý hardware .................................................................................................... 39 6.2.2 Výběr virtualizační platformy ................................................................................ 39 6.3 Přínosy provedené virtualizace .................................................................................. 40 6.3.1 Popis provedené virtualizace .................................................................................. 40 6.3.2 Sníţení nákladů na napájení a chlazení .................................................................. 42 6.3.2.1 Měření spotřeby ............................................................................................... 42 6.3.2.2 Výsledky měření spotřeby ............................................................................... 45 6.3.3 Celkové náklady na vlastnictví serveru (TCO) ...................................................... 45 6.4 Ţivotnost hardware serveru ....................................................................................... 48 ZÁVĚR ............................................................................................................................... 49 POUŢITÁ LITERATURA ............................................................................................... 50
6
Úvod Servery jsou základní sloţkou infrastruktury dnešních informačních systémů. Jsou základem pro úloţiště (storage), řešení síťové komunikace i bezpečnostních prvků informačních systémů. Server je centrální prvek, na který jsou připojeny jednotlivé stanice, poskytuje stanicím sluţby (bezpečnostní, mailové, datové, databázové, aplikační, hostingové). Pojmem server neoznačujeme jen samotný počítač, ale celek, jehoţ součástí jsou serverové operační systémy, serverové sluţby, programy a architektonické uspořádání (architektura klient-server). V této práci se pokusím popsat základní poţadavky na hardware serverů, provést rozdělení serverů dle jejich pouţití, nalézt současné trendy v oblasti hardware serverů a najít konkrétní konfigurace pro dané aplikace. První část práce bude věnována obecným poţadavkům na hardware serverů. Definujeme zde, co by měl server splňovat. Následně vybereme konkrétní konfigurace serverů pro jejich porovnání. Srovnání bude provedeno hodnocením, jak konkrétní konfigurace serveru splňuje jednotlivé nalezené obecné poţadavky. V závěru bych se zaměřil na praktické zkušenosti s provozem hardware serverů. Uvedu zde konkrétní problémy, s kterými se lze při provozování datového centra setkat. Vzhledem k tomu, ţe máme jiţ nějakou praktickou zkušenost s virtualizací, zmíním se o tom, jaké nám přinesla výhody a co je problematické. Teoretická tvrzení lze nejlépe ověřit měřením v praxi. Změříme tedy, jaké úspory přinesla virtualizace na spotřebě elektřiny. Uvedený příklad konsolidace serverů pomocí virtualizační technologie by měl dát odpověď na otázku: kdy je vhodné vyměnit server za nový? Cílem práce je: definovat poţadavky na server, porovnat konkrétní konfigurace serverů z hlediska plnění těchto poţadavků a doporučit, kdy je vhodné pořídit nový hardware pro server.
7
1 Obecné poţadavky na server Před tím, neţ se pokusíme srovnat konkrétní servery, je třeba definovat, jaké poţadavky jsou na ně kladeny a co by měl server pro bankovní aplikace a EO splňovat.
1.1 Propustnost Server na rozdíl od stolního PC poskytuje své sluţby po síti a mnoha uţivatelům současně. Poţadujeme od něj tedy vysokou propustnost síťové karty, kterých se často pouţívá i více. Dále je důleţitá propustnost diskového systému. Pro zvýšení propustnosti se pouţívají rychlejší sběrnice např. PCI-X 64 bitů/aţ 133 MHz na rozdíl od stolního PC, které má PCI 32 bitů/33MHz.
1.2 Moţnost zvyšování výkonu Od serveru je poţadována co nejdelší ţivotnost a tak je důleţitá moţnost jeho rozšiřitelnosti. Snadná rozšiřitelnost se poţaduje ve všech směrech. U serverových základních desek je tedy většinou integrován řadič disků SAS nebo RAID, grafická karta, dvě síťové karty. Tím je dosaţena i vyšší spolehlivost, protoţe spolupráci integrovaných komponent testoval výrobce základní desky. Z hlediska rozšiřitelnosti má integrace základních komponent význam v tom, ţe není obsazen ani jeden rozšiřující slot a přitom základní deska umoţní postavit plně vyhovující server. Rozšiřující sloty jsou tak volné pro moţnost dalšího rozšiřování konfigurace a navyšování výkonu.
1.3 Vysoká spolehlivost Od serveru je poţadována minimální doba odstávky (vysoká spolehlivost). S ohledem na tento poţadavek jsou servery stavěny ze „serverových komponent“. Jako parametr spolehlivosti je u těchto komponent uváděno číslo MTBF (Mean Time Between Failures), které udává střední dobu v hodinách, po kterou by mělo zařízení bezchybně pracovat v předem daných podmínkách (teplota, zátěţ). Jedná se o statistický údaj vypočtený statistickou interpolací při urychlených testech. Čím je číslo u hodnoty MTBF větší, tím je daná komponenta spolehlivější. Například u pevných disků pro servery je MTBF víc neţ 1 milión hodin. Z důvodu zajištění vysoké spolehlivosti se snaţíme server monitorovat
8
diagnostickými nástroji a na případnou závadu přijít ještě před tím, neţ k ní dojde (tzv. predikční diagnostika). Spolehlivost serveru lze zajistit, kromě výběru vhodných komponent, také na aplikační úrovni. Příkladem je platforma VMware vSphere 4, která obsahuje nástroje pro automatizaci poskytování smluv úrovní sluţeb (SLA, viz následující kapitola) a zajišťuje dostupnost, zabezpečení i přizpůsobitelnost.
1.3.1 SLA Se spolehlivostí serverů souvisí pojem SLA. SLA (service-level agreement) představuje dohodu o úrovni dodávaných sluţeb. „Jedná se zpravidla o sluţby, které přímo podporují primární poslání dané firmy či organizace. Typickými zákaznicky orientovanými sluţbami jsou např. podpora aplikací pro bankovní sektor, on-line obchodování přes internet, sluţby poskytované občanům veřejnou správou prostřednictvím internetových portálů a podobně. S tímto vývojem je také stále důleţitější, aby firma či organizace porozuměla nejen rozdílu mezi definovanými rozsahy a podmínkami nabízených SLA, ale současně si zajistila takové sluţby, které bude potřebovat pro zajištění svého bezproblémového chodu. Součástí takto určených sluţeb pak uţ není jen definice SLA, ale i způsob měření metrik, nastavení parametrů a poskytování reportů o splnění či překročení SLA pro danou sluţbu.“5) Tato dohoda můţe mít různý rozsah. Někdy se jedná jen o několik stran, ale stává se, ţe SLA je definováno i na stovkách listů. Ţádané SLA se uvádí jako povolený výpadek sluţby v procentech. Máme-li poţadováno, ţe sluţba musí mít dostupnost 99 % v reţimu 7x24, znamená to dostupnost sluţby 24 hodin denně po sedm dní v týdnu, přičemţ výpadek nemůţe být delší neţ 3,65 dne za rok. To představuje maximální délku výpadku za měsíc cca 7 hodin. Z hlediska hardware serveru se dá takový poţadavek pokrýt pomocí garantované servisní podpory na místě u zákazníka 7x24 s reakcí do 2 hodin a odstraněním závady do 4 hodin. Velký rozdíl bude, pokud máme SLA 99,9 %. To představuje moţnost neplánovaného výpadku cca 9 hodin během celého roku. Abychom z hlediska hardware serveru takový poţadavek zajistili, nebude jiţ stačit jen garantovaná servisní smlouva. Řešením bude např. pouţití více serverů (clusteru), místo jednoho. Nejjednodušším případem vyuţití více serverů pro navýšení SLA je pouţít dva stejně nakonfigurované. Jeden bude zapojen v běţném provozu a druhý slouţí jako „studená záloha“. Výpadek 5)
KONEČEK, Rudolf. Computerworld [online]. 2009 [cit. 2010-01-13]. SLA začíná sledovat i aplikace a obchodní procesy. Dostupné z WWW:
.
9
provozního serveru lze pak jednoduše a poměrně rychle nahradit připojením záloţního zařízení. Rychlost nahrazení provozního serveru však bude záleţet na obsluze, jak rychle dokáţe na závadu zareagovat a přepojit na zálohu. To je hlavní nevýhodou tohoto řešení a proto se v praxi moc nepouţívá. Další metodou zajištění vysoké dostupnosti je „horká záloha“. Tento způsob se často pouţívá u firewallů, přepínačů a směrovačů. Dvě nebo více zařízení se připojí do sítě současně, ale práci vykonává jen jedno z nich. Při poruše hlavního zařízení se automaticky přestěhují společné adresy na záloţní stroj. Při přechodu na zálohu tak uţivatelé prakticky nepocítí ţádný výpadek. Metody, pomocí nichţ se rozhoduje o přechodu na záloţní zařízení, jsou různé. Jedná se např. o testování síťových rozhraní primárního zařízení (viditelnost, ping), testování dostupnosti jiných zařízení v síti anebo propracované testovací systémy, které kontrolují nejen dostupnost sítě, ale i další parametry systému (např. běţící programy, teplotu CPU, volnou paměť atd.) V případě aplikačního serveru je vhodnější pouţít rozkládání zátěţe (Load Balancing), dva shodné stroje připojené přes rozdělovač zátěţe. Většina systémů pro rozdělování zátěţe umoţňuje připojit do clusteru větší mnoţství serverů. Pokud dojde na jednom k závadě, sluţba zůstane dostupná pomocí dalšího serveru a je tak čas na opravu poškozeného. U databázového serveru lze pouţít téţ dva fyzické stroje a vyuţít moţnosti replikace dat, kterou systémy řízení databází poskytují. Z uvedeného je zřejmé, ţe mezi poţadavkem SLA 99 % a SLA 99,9 % je velký rozdíl. To se promítne především do ceny sluţby.
1.4 Diagnostika Pro diagnostiku se u serverů běţně pouţívá nezávislý mikroprocesor BMC. Pomocí diagnostiky se sledují parametry jako např. teplota v různých místech, otáčky všech ventilátorů, jednotlivá napájecí napětí. Naměřené hodnoty je BMC schopen zapsat do systémového logu. Diagnostikou lze předejít závadě a odstávce serveru.
1.5 Paměti U serverů se pouţívají větší kapacity operační paměti, neţ u běţných PC. S větší kapacitou paměti roste moţnost vzniku chyb způsobených náhodnou změnou bitu z 1 na 0 nebo obráceně. Takto vzniklá chyba by mohla změnit instrukce v kódu programu a tím způsobit "pád" serveru, nebo třeba chybu v důleţitém finančním výpočtu. Servery proto většinou pouţívají paměti ECC (Error Checking and Correcting). U ECC pamětí se k detekci chyb nejčastěji pouţívá Hammingův kód. Tímto kódem je moţno, podle počtu paritních bitů, 10
opravit určité mnoţství chyb. Např. pouţijeme-li 20 bitů (15+5), je moţno tímto kódem opravit jednu a detekovat dvě chyby. V angličtině se tyto kódy označují zkratkou SEC/DED ("single error correction, double error detection"). U sálových počítačů byl typický rozšířený Hammingův kód (72,64), tj. 8 bitů redundantních. Dalším způsobem jak zajistit spolehlivost čtení a zápisu dat u pamětí je pouţití tzv. registrovaných (Registered) pamětí. Tyto paměti mají zabudovány dodatečné registry (I/O buffery) mezi sběrnicí základní desky a modulem paměti. Toto řešení zvyšuje spolehlivost přenosu dat, ale zároveň dochází ke zpomalení komunikace. V dnešní době jsou většinou všechny registrované paměti zároveň ECC. Hlavní předností ECC není jen oprava chyb, ale především moţnost logování těchto chyb. Logování chyb můţe upozornit na závaţný problém s hardware a výměnou vadných komponent pak lze předejít selhání celého systému.
1.6 Umístění serveru Speciální desky určené pro servery vyţadují také vhodnou skříň. Je to skříň se zdrojem a několika pozicemi pro pevné disky (napevno montované nebo hot-swap, tedy vyměnitelné za chodu systému). Jak výkonné procesory, tak výkonné pevné disky jsou nepříjemným zdrojem tepla. Pro odvod tepla jsou serverové skříně vybaveny důkladným chlazením (minimálně 4 ventilátory). Přitom všechny ventilátory jsou měřené diagnostikou serveru. Pozice pro pevné disky jsou v provedení hot-swap, tedy vyměnitelné za chodu. Kromě toho moţnost vytaţení nebo zasunutí disku za chodu klade velké nároky na síťový zdroj, protoţe odběr proudu se tímto okamţikem skokově změní i o několik ampér a přitom napětí pro ostatní komponenty musí zůstat konstantní, jinak hrozí nebezpečí porušení integrity dat. Pouţívají se tedy speciální zdroje pro servery, které se navíc montují redundantně. Samostatnou skříň vyţaduje také „diskové pole“. Pod tímto pojmem nemáme na mysli jakýkoliv počítač, který má za provozu vyměnitelné disky (Hot-Swap) uspořádané do RAIDu*, ale inteligentní samostatné zařízení. Diskové pole spravuje větší mnoţství disků pomocí různých technologií (SCSI, SATA, SAS, FibreChanel). Servery se k němu *
RAID (Redundant Array of Independent Disks). Toto řešení vzniklo z důvodu zvýšení výkonu více paralelně pracujících disků. Problém byl v tom, ţe se zvýšením výkonu naroste s počtem disků také celková poruchovost systému. Z toho důvodu bylo nutno přidat redundantní disky, na které se podle určitého matematického algoritmu zapisují data určená pro rekonstrukci, pro případ výpadku některých disků. Podrobnějšímu popisu pouţívaných RAIDů se ve své práci věnuje kolega(Petr Zoul) a tak zde toto téma nebude dále rozebíráno.
11
připojují na blokové úrovni příkazů SCSI, pomocí vnějšího připojení diskového pole přes SCSI, iSCSI, FibreChanel nebo SAS).
V prostředí velkých podniků je diskové pole
jediným způsobem, jak spolehlivě a bezpečně zajistit ukládání dat. Problematice datových úloţišť bude věnována ještě kapitola 3.2.2. Celou skříň serveru je pak potřeba umístit do vhodného prostředí s klimatizací a zálohovaným zdrojem elektrické energie – „Datového centra“.
1.6.1 Datové centrum Datové centrum je prostor vybavený technologiemi pro zabezpečení poţadované dostupnosti IS/IT. Jednotlivé funkční celky datového centra jsou znázorněny na následujícím obrázku. Obr.1: členění datového centra
zdroj: http://www.i-development.cz/images/DATAC_komplex_big.png
1.6.1.1 „Energetické centrum“ Energetické centrum zajišťuje napájení všech celků a technologií instalovaných v datovém centru. Design energetického centra určuje výslednou třídu dostupnosti celého datového centra. Zvolená třída - úroveň dostupnosti, je rozhodující pro návrh struktury a funkčnosti energetického centra.
12
1.6.1.2 UPS + baterie Pro UPS a baterie se v projektech datových center vyhrazuje samostatná místnosti, či více místností. Místnost vyhrazená pro baterie musí obsahovat prvky řízeného prostředí – teplota, odvětrávání, vlhkost.
1.6.1.3 Motorgenerátor Motorgenerátor je standardně umísťován ve strojovně budovy. Dle poţadavků akustické studie, nebo na přání zákazníka, je motorgenerátor instalován s kapotou. Pokud je vyţadováno umístění vně budovy, je motorgenerátor umísťován ve venkovním provedení. Většinou se jedná o montáţ v kontejneru, která umoţňuje různé stupně odhlučnění.
1.6.1.4 Stejnosměrné systémy Stejnosměrné systémy jsou v datových centrech instalovány pro zajištění napájení instalovaných zařízení, která nejsou napájena standardními napájecími zdroji, ale pro svou činnost potřebují stejnosměrné napětí, zpravidla 48V. Tyto stejnosměrné napájecí systémy nejsou zálohovány pomocí UPS, pouze pomocí motorgenerátoru.
1.6.1.5 Trafostanice, přívody VN V rámci platných norem a zvyklostí jsou trafostanice určené pro napájení datových center stavěny s oddělenými prostory pro jednotlivé transformátory a VN části. Pro kabelové rozvody jsou určené vyhrazené samostatné kabelové ţlaby.
1.6.1.6 Chlazení Technologie chlazení je v systému datového centra stejně kritická, jako technologie napájení. Zvolená cílová teplotní hustota (kW/rack) je určující na topologii technologie chlazení. Samotná technologie chlazení je pak členěna do těchto základních celků: jednotky chlazení určené pro chlazení IT infrastruktury venkovní chladící jednotky v některých případech i zásobníky chladu – nádrţe.
13
Díky vysoké energetické náročnosti chlazení (30% aţ 40% z celkové spotřeby elektrické energie instalovaných IT technologií) se v praxi napájení technologie chlazení nezálohuje pomocí UPS, ale pouze pomocí motorgenerátoru. V některých instalacích, kde provozovatel poţaduje vysokou dostupnost provozované IT technologie, se pomocí UPS zálohují čerpadla a ventilátory vnitřních chladících jednotek, coţ v případě výpadku napájení a přechodu na napájení z motorgenerátoru zajistí dostatečné chlazení IT technologií do okamţiku obnovení plného provozu chladících technologií.
1.6.1.7 Infrastruktura (fyzická infrastruktura) Pro bezproblémový provoz IT technologií v datovém centru je důleţitá fyzická infrastruktura. Do této kategorie řadíme následující technické prostředky: zdvojená podlaha oddělené kabelové ţlaby pro vedení napájení a datových vedení rackové skříně, apod.
1.6.1.8 Zabezpečení Zabezpečení datového centra lze rozdělit následovně: Poţární bezpečnost Fyzická bezpečnost Bezpečnost IT 1.6.1.8.1 Poţární bezpečnost Vnitřní prostory datového centra a technologické místnosti jsou rozčleněny do samostatných poţárních úseků, abychom maximálně předešli materiálním škodám v případě poţáru. Pro prostory datových sálů je pouţívána technologie zhášecího plynu, nebo vodní mlhy. 1.6.1.8.2 Fyzická bezpečnost Pro zajištění fyzické bezpečnosti musí zdi, stropy a dveře poskytovat dostatečnou ochranu proti cizímu vniknutí, či proti vnějšímu poţáru. V datovém centru musí být instalován
14
systém kontroly vstupu a pohybu osob. Projekt datového centra by měl obsahovat kamerový systém s moţností nahrávání. 1.6.1.8.3 Bezpečnost IT Zabezpečení IT infrastruktury je důleţitým článkem v projektu datového centra. Samotná definice zabezpečení IT je určena druhem provozované IT infrastruktury a zákazníkům poskytovaných sluţeb.
1.6.1.9 Monitoring Monitoring všech technologických celků je nedílnou součástí projektu datového centra. Pomocí instalovaných čidel a snímačů dostává obsluha všechny potřebné informace o provozních stavech. Výstupy z monitorovacích systémů slouţí jako vstupy pro systém řízení budovy (BMS – Building Management system). Výstupy z monitoringu téţ slouţí jako parametry pro měření parametrů SLA uzavíraných se zákazníky.“7)
1.7 Ostatní poţadavky Pro provoz serveru je velmi důleţité zajištění technické podpory a servisu a to jak záručního tak i pozáručního. Zajištění pozáručního servisu bývá finančně velmi náročné a je proto třeba se o podmínky pozáručního servisu zajímat jiţ při nákupu serveru. Dodatečné smlouvy na pozáruční technickou podporu a servis mohou vyjít dráţ, neţ nákup nového serveru.
7)
I-Development [online]. 2010 [cit. 2010-03-16]. Komplexní design datového centra. Dostupné z WWW: .
15
2 Trendy v oblasti serverových systémů 2.1 Specializace Servery se dnes vyvíjejí se stále větší specializací na poskytování konkrétních sluţeb. Důvodem specializace je potřeba zvolit pro danou sluţbu výkonově vyhovující zařízení za co nejniţší cenu. Příkladem jsou WEB servery, video servery nebo jednoduché souborové servery.
2.2 Konsolidace serverů Konsolidací serverů je myšleno sloučení poskytovaných sluţeb do jednoho systému. Tento problém vznikl na konci minulého století, kdy došlo k velkému rozvoji informačních technologií, ale tento rozvoj byl realizován pomocí nákupu mnoha malých serverů. Jednalo se vlastně o server provozovaný na PC a jeho sluţeb se vyuţívalo jen k řešení určité problematiky. Další problematika se řešila nákupem dalšího takového stroje. Tento postup přinesl řadu problémů. Správa velkého mnoţství roztroušených serverů byla personálně náročná, servery nebyly optimálně vytíţeny (např. většinu času server nic nedělal, ale ve špičce jeho výkon nedostačoval). Vývoj serverů jde dnes dvěma základními směry. Na jedné straně se vyvíjejí výkonné servery disponující vysokou dostupností, redundancí, diagnostickými mechanismy a moţností servisu za chodu bez výpadku serveru. Na druhé straně jsou vyvíjeny jednoduché a levné servery, které opravovat ani nelze a jejich závada se řeší výměnou celého zařízení. Vhodným výběrem serveru lze dosáhnout optimální konsolidované prostředí.
2.2.1 Fyzická konsolidace a konsolidace provozu aplikací, Green IT Na dnešních výkonných strojích je moţno provozovat tzv. virtuální servery. Ty mohou být s různým operačním systémem a lze na nich provozovat zcela rozdílné aplikace. Takto konsolidované prostředí má mnoho výhod. Pouţití moderního a výkonného hardware zajistí spolehlivost. Jednotlivým virtuálním strojům lze přidělit tolik prostředků, kolik je účelné. Správa takovýchto serverů se podstatně zjednodušuje. Dalším přínosem uvedených metod je úspora energie a celkových provozních nákladů. „Virtualizace a konsolidace jsou klíčové pro úsporu energie v datových centrech, kde „rozpínání IT“ představuje obrovský problém. „Rozpínáním“ máme na mysli to, ţe správci IT instalují více systémů pro lepší 16
výkon, redundanci a dostupnost, ale bez ohledu na efektivnost z hlediska spotřeby energie nebo chlazení. Jedním ze způsobů, jak tuto neefektivitu vyřešit, je virtualizace, která odděluje software od hardwaru, na němţ běţí, takţe na jediném počítači můţe fungovat několik operačních systémů a více aplikací. Virtualizace serverů můţe znamenat lepší vyuţití kaţdého serveru a sniţuje počet nasazených počítačů – takţe se vyuţívá méně elektrické energie k provozu a chlazení, zatímco jsou potřeby podnikání ošetřeny stejně dobře jako dříve. Virtualizace a konsolidace serverů a zdrojů datových úloţišť uţ zaznamenala četné úspěchy. V Severní Americe kupříkladu pomohla jedné veřejné sluţbě sníţit mnoţství jejich serverů z tisíce na 80 a mnoţství uloţených dat z 270 terabajtů na 140 terabajtů. To sníţilo mnoţství vyuţitého prostoru, elektrické energie a nároků na chlazení o 70–80 %.“4) Obr.2: Motivace pro Green IT
zdroj: Computerworld, Fišer M., Role ICT v trvale udrţitelném ţivotním prostředí
2.2.2 Konsolidace úloţiště (storage) Pod pojmem konsolidace úloţiště se rozumí, ţe systém pro ukládání dat můţe být vyuţíván různými servery. Základem konsolidovaného systému ukládání dat je jeho vyčlenění do samostatné sítě, převaţuje architektura „Storage Area Network“, na které jsou umístěna zařízení pro ukládání dat (disková pole, páskové knihovny) a ta poskytuje svoje sluţby okolním serverům. Zařízení pro ukládání dat v konsolidovaném systému mají 4)
FIŠER, M. Role ICT v trvale udrţitelném ţivotním prostředí . Computerworld. 2008, Zvláštní neprodejná příloha, s. 2-3.
17
opět velmi vyspělé, výkonné a spolehlivé technologie, které jsou schopny nepřetrţitého provozu jako konsolidované servery. I zde se uplatňují techniky virtualizace, řízení paralelního přístupu, dynamického sdílení zdrojů, techniky replikace a ostatních operací s daty bez účasti serverů, a samozřejmě techniky managementu (správy) storage subsystému. „Klasická technologie disků svázaných s jedním serverem přináší mnoho limitů. Jako např.: Kapacita disků svázaná s jedním serverem bývá vyuţitá jen z několika desítek %. Servery se nakupují totiţ kapacitně značně předimenzované s ohledem na budoucí moţné potřeby Výkony, rychlosti a hlavně spolehlivosti takovýchto řešení jsou i o několik řádů horší neţ pouţití profesionálního diskového pole jako centrálního úloţného prostředku firmy A sloţitý management prostředí - kaţdý server, kaţdé
diskové pole se řídí
odděleně a navíc povětšinou jinými prostředky. To pak klade zbytečné nároky na obsluhu. Obr. 3: Příklad stavu před konsolidací storage
zdroj: http://www.storage.cz/images/stories/NewDSGN_LG/beforesan.gif
Trendem dnešní doby je centralizovaný a konsolidovaný diskový prostor s řadou nezanedbatelných výhod: společný konsolidovaný diskový prostor lze lépe rozdělovat a přerozdělovat, podle momentálních kapacitních a výkonových potřeb, jednotlivým serverům a aplikacím
18
jednoduchá rozšiřitelnost kapacity zamezuje plýtvání zdroji a vyuţitelnost instalované kapacity bývá podstatně lepší neţli v klasickém modelu lokálních disků namísto mnoha malých jednoduchých lokálních diskových polí zde zpravidla vystupuje celkově výkonnější, spolehlivější a otevřený systém s plnou redundancí všech komponent, s duálními přístupovými cestami k serverům, s moţností on-line expanze a migrace RAIDů a s konektivitou k serverům s různou architekturou a s různými operačními systémy jednoduší centralizovaná správa šetří personální náklady, kdyţ jediný člověk zvládá zpravidla obsluhovat aţ čtyřnásobek svěřené kapacity Centrální diskový systém s potřebnými výkonovými a kapacitními parametry nejlépe postihuje dynamické poţadavky dnešních výpočetních systémů. Obr. 4: Konsolidace úloţných prostředků - vybudování Storage Area Network (SAN)
zdroj: http://www.storage.cz/images/stories/NewDSGN_LG/aftersan.gif
Některé úlohy jsou bez diskového pole - co by centrálního storage prvku - neřešitelné. Příkladem mohou být funkcionality pro migrace virtuálních strojů v rámci VMware (vMotion, StorageVmotion, HA a další...)“3)
3)
DRAŢIL, Jiří. 3S.CZ [online]. 2010 [cit. 2010-03-19]. Co je to diskové pole?. Dostupné z WWW: .
19
2.3 Rozdělování a sdílení zátěţe Ani ten nejvýkonnější server nemusí v některých případech výkonem a spolehlivostí vyhovovat a tak se pouţívají prostředky pro řízení a distribuci zátěţe mezi servery nebo pro paralelní zpracování úloh na více serverech. Jedná se většinou o pokročilá clusterová řešení s monitoringem chodu systému a moţností přenesení chodu na jiný servery v případě výpadku serveru či nějaké jeho sluţby. Dále jsou pouţívány rozdělovače zátěţe (load balancing), pomocí nichţ se vytvoří farma serverů.
20
3 Rozdělení serverů dle provedení Podle provedení skříně můţeme servery rozdělit do třech kategorií: Rackové* servery Tower** servery Blade*** servery
3.1 Rackové servery Obr. 5: Dell R410 QC E5520 2.26GHz
zdroj: http://www.itlevne.cz/katalog/snimek/429794182_s.jpg
Toto provedení je určeno k montáţi do racku a umísťuje se většinou do klimatizované serverovny. Je vhodný především pro datová centra, kde je v provozu mnoho serverů. Velikost těchto serverů je udávána jako xU. Server o velikosti 1U (jeden unit) má výšku cca 4,5 cm.
*
Rack – regál, stojan Tower - věţ *** Blade – ţiletka, čepel **
21
3.2 Tower servery Obr. 6: FUJITSU Primergy TX200S5 Xeon
zdroj: http://www.itlevne.cz/katalog/snimek/443398273_s.jpg
Tower provedení je moţno umístit např. i v kanceláři. Je vhodné pro menší firmy, které nemají samostatné prostory pro servery. Skříň má dostatek prostoru i pro více disků, které pak lze zapojit do RAIDu.
22
3.3 Blade servery Obr. 7: Blade HP BLc7000
zdroj: http://www.itlevne.cz/katalog/snimek/320244045_s.jpg
„Zřejmě nejvýznamnější vlastností blade serverů je vysoká hustota výpočetního výkonu, kterou přináší malá fyzická velikost jednotlivých serverů. Nejeden uţivatel si pod pojmem server představí velkou skříň připojenou nepřehlednou změtí kabelů do sítě. Není divu, vţdyť servery mainframe existují jiţ přes čtyřicet let a nutně vedou ke vzniku podobné představy. Blade servery jsou na světě podstatně kratší dobu neţ servery mainframe, ale rychle si získávají popularitu. Vytvoření platformy blade umoţnilo umístit server doslova do krabičky o velikosti menší neţ 16 x 24 cm o tloušťce menší neţ 3 cm. U první generace blade serverů byla snaha zejména o co největší miniaturizaci všech komponent a zároveň o udrţení přijatelné hodnoty ztrátového tepla (všichni velcí výrobci chladí své blade servery vzduchem, protoţe vodní a další alternativní typy chlazení zatím nejsou povaţovány za bezpečné v případě jejich selhání). Bohuţel snaha o miniaturizaci vedla u této generace k nízkému výkonu. Často byly pouţívány starší nebo dokonce nízkonapěťové procesory pro notebooky, rozšiřitelnost byla takřka nulová a ani většina ostatních základních charakteristik nebyla příliš oslnivá. Technologický vývoj ale dokázal najít řešení všech problémů a druhá generace blade serverů uţ dokázala tento problém překonat. Blade servery dosáhly plného výkonu; srovnatelného s dvouprocesorovými servery o velikosti 1U a s čtyřprocesorovými servery o velikosti 2U. To vše při významném sníţení vyuţitého
23
prostoru. Ve většině případů reálného nasazení je uváděna úspora prostoru při vyuţití blade serverů oproti 1U a 2U serverům více neţ 50 %. “2) „Blade servery nachází nejlepší vyuţití v řešeních, kde existuje poţadavek na nasazení více serverů najednou, např. pro terminálové a výpočetní farmy, kompletní řešení serverové infrastruktury firmy, dynamický web hosting, zpracování audio a video materiálů, v telekomunikačním prostředí atd. Taková řešení pak dosahují maximální finanční úspory a zároveň vznikne vysoce spolehlivé řešení, které má jediný centrální box správy. V případě serverových farem je typické, ţe jsou všechny servery stejného typu a většinou mají i stejnou konfiguraci, ale bladové řešení se hodí i tam, kde je kaţdý server jiný – lze vedle sebe nasadit čtyřprocesorový databázový server, několik aplikačních serverů a webových serverů. Kaţdý z nich můţe mít jinou procesorovou architekturu, jinou konfiguraci i jiný způsob přístupu k datům. Samozřejmě ideální situací pro BladeCenter je zároveň řešení zákazníků, jenţ potřebují umístit maximální mnoţství serverů ve fyzicky omezených prostorech. Blade řešení ocení i ti, kteří potřebují svou serverovou infrastrukturu jednoduše a rychle rozšiřovat. Po nainstalování šasi BladeCenter je totiţ fyzická instalace kaţdého blade serveru otázkou sekund, protoţe server není třeba sloţitě připevňovat šrouby ani připojovat ţádné kabely. Server se připojí pomocí dvojice speciálních konektorů přímo na interní sběrnici BladeCenter.“9)
2)
BENEŠ, Vladimír. SERVEROVÁ KONSOLIDACE. [cit. 2010-01-10]. Dostupný z WWW:
.
9)
IBM [online]. 2010 [cit. 2010-03-23]. IBM BladeCenter. Dostupné z WWW: .
24
4 Výkon serverů Podle výkonu lze servery rozdělit do třech kategorií. Pro malé podniky jsou určeny servery s nejlepším poměrem cena/výkon. U této skupiny bývá vynechána redundance některých komponent, ale konstrukce serveru umoţňuje v případě potřeby tyto komponenty doplnit. Pro náročnější uţivatele jsou určeny servery s více procesory a se zdvojenými důleţitými komponentami. Tato kategorie je jiţ vhodná pro konsolidaci serverů, např. pomocí virtualizace. Nejvýkonnější kategorií jsou pak stroje vyvíjené největšími firmami (HP, IBM, SUN). U těchto systémů výrobce vyvíjí vlastní procesory a mají i svou architekturu. Vše je důkladně testováno. Vlastní vývoj je však velice nákladný a to se pak odráţí v ceně těchto systémů. Příkladem nejvýkonnějších serverů s RISC/EPIC procesory dodávaných v současné době společnostmi IBM, HP a Sun jsou: IBM Power 750 Express se 4 čipy, 32 jádry a čtyřmi vlákny na jádro, procesory POWER7 3,3 GHz Sun SPARC Enterprise T5440 se 4 čipy, 32 jádry a osmi vlákny na jádro, procesory SPARC64 VII 2,53 GHz HP Integrity rx7640 s 8 čipy, 16 jádry a jedním vláknem na jádro, procesory Itanium 1,6 GHz
4.1 Co má vliv na výkon? „Výkon serveru je ovlivňován prakticky všemi komponenty: Architekturou Výkonností procesoru (procesorů): druhý nejvýznamnější prvek, ovlivňující výkon. Jeho výkon závisí na kvalitě instrukční sady (ve vztahu k architektuře serveru a pouţití, pro které bude procesor určen) a kvalitě její implementace. Důleţité je, zda jsou pouţity a jak jsou realizovány moderní postupy (u procesorů, kde má jejich existence smysl) vyvinuté původně pro procesory RISC – vykonávání instrukcí mimo pořadí, předvídání skoků, vyšší počet registrů, přejmenování registrů, současné vykonávání více instrukcí a zřetězené vykonávání instrukcí. U běţných procesorů nejvíce uváděný údaj – hodinová frekvence (tj. kmitočet, který taktuje a synchronizuje činnost procesoru) nemá na výkonnost zdaleka tak významný vliv 25
jako kvalitní návrh architektury. Porovnání frekvencí má smysl pouze u zcela shodně navrţených procesorů. Rozdílné procesory jsou totiţ schopny vykonat za jeden hodinový cyklus různý počet instrukcí. Typicky původní procesory CISC potřebovaly pro vykonání jedné instrukce několik taktů a moderní RISC procesory (superskalární) jsou schopny dokončit v jednom taktu několik instrukcí. Naopak zvyšování hodinové frekvence přináší mnohé komplikace. S vyšší frekvencí rostou nároky na kvalitu výroby a pouţitou technologii (čímţ se výroba prodraţuje), roste příkon procesoru a tím se zvyšují nároky na chlazení. Velikost operační paměti: mnoţství instalované operační paměti přímo ovlivňuje velikost dat programů, které v ní mohou být v daném okamţiku přítomny a limituje mnoţství vstupně/výstupních vyrovnávacích pamětí. Čím více při práci s rozsáhlými
datovými
strukturami
zpracovávané
objemy
dat
přesahují
instalovanou operační paměť, tím více roste počet přístupů k pomalým vnějším pamětem a sniţuje se tím v konkrétní aplikaci výkon systému. V tomto případě platí i opak uvedeného: pouţijeme-li značné mnoţství operační paměti a systém, který s takovouto pamětí je schopen pracovat, můţeme do operační paměti umístit celou databázi a dosáhnout velmi výrazného nárůstu výkonu. Rychlost operační paměti: současné procesory dokáţí zpracovat větší objemy instrukcí a dat, neţ které je schopna operační paměť dodat. Se zrychlováním paměti se tudíţ sniţují prostoje – počet čekacích stavů procesoru. Propustnost interních sběrnic: obdobně jako rychlost operační paměti. Největší vliv má rychlost systémové sběrnice (tj. sběrnice, na kterou je připojen procesor, operační paměť, řadič vstupně/výstupní sběrnice a většinou vyrovnávací paměť druhé úrovně) Velikostí a rychlostí vyrovnávací paměti procesoru: jak je uvedeno v předchozích dvou bodech, procesor je při přístupu k operační paměti limitován její rychlostí a propustností systémové sběrnice. Pokud by tedy kaţdou instrukci dostával přímo z operační paměti a pracoval by pouze s daty v operační paměti a s periferiemi, nemělo by smysl zvyšování rychlosti procesoru nad rychlost sběrnice. Aby k této situaci nedocházelo, pouţívají se vyrovnávací paměti procesoru – tzv. Cache paměti. Pro jejich výrobu jsou pouţity draţší a rychlejší součástky neţ pro výrobu operační paměti a jsou vloţeny mezi operační paměť a procesor. Procesor potom
26
nepřistupuje přímo k operační paměti, ale přesuny dat jsou realizovány přes vyrovnávací paměť. Řadič Cache paměti se potom stará o synchronizaci obsahu operační paměti s Cache pamětí a načítá do ní instrukce i data. Dnešní počítače pouţívají v podstatě pět úrovní pamětí. První a nejrychlejší je tvořena pracovními registry přímo na procesoru. Druhou v pořadí je vyrovnávací paměť první úrovně (Level 1 cache). Třetím stupněm je vyrovnávací paměť druhé úrovně (Level 2 cache). Operační paměť je aţ na na čtvrtém místě struktury, protoţe je z pohledu procesoru velmi pomalá. Posledním stupněm je „virtuální paměť“*, která rozšiřuje celkovou paměť počítače aţ na pevné disky. Rychlost periferních zařízení: instrukce a data, která se nevejdou do operační paměti, jsou, pokud to procesor a operační systém umoţní, odkládána na pevnou paměť – na disk serveru. Jeho vliv na výkon se téţ projeví při načítání programů a dat do operační paměti a to především u diskových a databázových serverů. Operační systém: vysoký výkon hardware nemusí mnoho znamenat, pokud jej není schopen operační systém efektivně vyuţít (má velkou reţii, není schopen přidělovat celou instalovanou operační paměť nebo rozvrhnout zátěţ jednotlivých procesorů. Stanovit obecná kritéria pro hodnocení výkonu serveru je vzhledem k značnému mnoţství architektur a zcela odlišnému charakteru zpracování úloh nemoţné. V praxi se proto pouţívají specializované testy a parametry, které nám dávají představu o výkonu serveru při nasazení v určitých aplikacích.“1) Průmyslové standardy výkonu počítačů byly nastaveny jiţ v sedmdesátých letech minulého století, kdy byl v Algolu napsán první Whetstone Benchmark (srovnávací test). Dnes je k otestování výkonu k dispozici mnoho speciálních programů (např.
SiSoft Sandra).
Výstupem těchto programů jsou testy Dhrystone (testuje počet provedených operací s celými čísly za sekundu v milionech, jednotkou je MIPS) a Whetstone (je milion provedených operací za sekundu, při operacích s plovoucí desetinnou čárkou, jednotkou je MFLOPS).
*
Virtuální paměť je způsobem správy operační paměti počítače, který se pouţívá jiţ od 60. let 20. století. Správa virtuální paměti překládá všechny adresy na virtuální pomocí segmentace nebo stránkování. Segmenty a stránky jsou ukládány na fyzickou paměť (RAM) a do odkládacího prostoru (pevný disk). 1) BENEŠ, Vladimír. Technická infrastruktura a síťové technologie. Praha : Bankovní institut, a.s, 2005. 213 s. ISBN :80-7265-063-7.
27
Testováním výkonu se zabývají také nezávislé společnosti a výsledky testů zveřejňují na internetu. Příkladem takovéhoto testu serverových procesorů je test výkonu SPECint: Obr. 8: porovnání procesorů testem dle SPECint
zdroj: http://www.intel.com/performance/server/xeon/server.htm?iid=perf_server_lhn+dp_server
Test SPEC CPU2006 testuje výkon pomocí dvanácti úloh zaměřených na operace s celými čísly a 17 úloh na operace s pohyblivou desetinou čárkou. V grafu je výsledek „SPEED“ testu, coţ je čas potřebný k dokončení úlohy s operacemi v řádu celých čísel. Otestuje se tedy výkon procesoru, pamětí a základní desky. Ostatní komponenty se v testu neprojeví. Coţ je obecný problém Benchmark testů. Benchmark testovací programy dokáţí otestovat např. i rychlost disků nebo síťovou kartu, ale vţdy se jedná o test, který simuluje zátěţ určitého druhu. O celkovém výkonu serveru lépe vypovídají testy společnosti TPC (Transaction processing performance council). Společnost TPC, jakoţto nezisková organizace, má za cíl určit metody testování serverů a vydávat objektivní informace o výsledcích těchto testů. TPC se skládá z členských organizací, které dohromady tvoří radu společnosti. V radě má kaţdý člen jeden hlas k prosazování svých zájmů. Členství je placené (řádově 300 000 Kč ročně). Členy jsou všichni významní výrobci IT (Dell, Sun, Oracle, Sybase, Intel, AMD, Microsoft, HP). Kaţdý provedený test je navíc kontrolován nezávislým auditorem. Na základě výsledků testů, zveřejněných touto společností se dá velmi snadno provést srovnání jednotlivých serverů.
28
Příklad testu TPC-C je uveden v následujícím obrázku: Obr. 9: Test TPC-C dle výkonu
zdroj:http://www.tpc.org/tpcc/results/tpcc_price_perf_results.asp?print=true&resulttype=&version=5¤ cyID=1
V testech TPC se měří výkon a cena na jednotku výkonu. Test TPC-C „byl vytvořen v roce 1992 a výsledek je udáván v tpmC – transakcích za minutu. Filozofie testu vychází z modelu velkoobchodní firmy, která má několik regionálních poboček. Kaţdá pobočka zásobuje 10 zástupců, z nichţ kaţdý dodává zboţí pro 3 000 zákazníků. Databáze firmy obsahuje 9 tabulek: Pobočka, Okrsek, Zákazník, Nové objednávky, Objednávky, Řádky objednávek, Sklad, Poloţky na skladě a Historie. Při testu je simulováno víceuţivatelské komplexní transakční zatíţení systému včetně celoobrazovkového terminálového vstupu a výstupu. Je předepsáno procentuální zastoupení transakcí konkrétního typu (zaloţeni nové objednávky, platba, zjištění stavu objednávky, dodávka, skladová operace) a maximální přípustný čas pro ukončení 90 % z nich. Hodnota tpmC udává maximální počet zpracovaných nových objednávek (tj. jen transakcí jednoho typu, jichţ je v testovacím mixu maximálně 45 %; počítají se jak dokončené, tak i zamítnuté transakce), při nichţ systém splňuje po zadanou dobu stanovené odezvy, podělený dobou trvání testu v minutách.“1)
1)
BENEŠ, Vladimír. Technická infrastruktura a síťové technologie. Praha : Bankovní institut, a.s, 2005. 213
s. ISBN :80-7265-063-7.
29
5 Příklady konfigurace serverů a jejich porovnání V předchozích kapitolách jsou popsány poţadavky na hardware serverů. V této kapitole vybereme konkrétní konfiguraci serverů a budeme zkoumat jak vyhovuje uvedeným poţadavkům. Pro zjednodušení hodnocení shrneme obecné poţadavky do následujících bodů a u kaţdého si poznamenáme, co lze sledovat. procesory – porovnání výkonu dle zveřejněných testů, architektura, spotřeba energie, počet patic na základní desce podpora virtualizace (konsolidace) – HW podpora hypervisorů* různých virtualizačních platforem podporované operační systémy – typy a verze operačních systémů propustnost sítě – typ, počet portů, přenosová rychlost rozšiřitelnost – počet a druh volných slotů, max. velikost interního úloţiště dat spolehlivost – pamětí, pevné disky, redundantní a hot-plug komponenty diagnostika – informační displeje, BMC, SW nástroje úspora energie – účinnost zdrojů, celková spotřeba skříň – druh, rozměry, hmotnost, povrchová úprava hodnocení v testech TPC – výkon systému dle jednotlivých testů, cena za jednotku výkonu záruka – délka standardní záruky, moţnosti rozšíření Pro příklad porovnání serverů si zvolíme následující případ: máme za úkol vybrat server s minimálně 200 tpmC , podporou virtualizační platformy Vmware, za co nejvýhodnější cenu. Vyjdeme z poţadavku na minimálně 200 tpmC a nejvýhodnější ceny. K prvotnímu výběru vhodných serverů pouţijeme hodnocení nejlepších deseti systémů dle ceny za 1tpmC, které je zveřejněno na stránkách společnosti TPC. (http://www.tpc.org/tpcc/results/tpcc_price_perf_results.asp?resulttype=all&version=5&cu rrencyID=1). *
Hypervisor je specielní operační systém vyvinutý pro virtualizaci. Řídí a rozděluje HW prostředky serveru.
30
Z výše uvedeného nám nejlépe vyhovují servery Dell PowerEdge T710 a HP ProLiant ML350 G6. Shrneme, co o nich říkají jejich výrobci, porovnáme je.
5.1 Server Dell PowerEdge T710 Obr. 10: server Dell PowerEdge T710
zdroj: http://www1.euro.dell.com/cz/cs/domacnosti/servers/server-poweredge-t710/pd.aspx?refid=serverpoweredge-t710&s=pad&cs=RC1077928
Popis serveru od výrobce: „Server DellTM PowerEdgeTM T710 nabízí vyuţitelnost inspirovanou zákazníky a vynikající společné vlastnosti systému i diskových obrazů. Server PowerEdge T710 se vyznačuje přehledným a logickým rozloţením komponent a umístěním napájecího zdroje s cílem zajistit rychlou instalaci a zjednodušené nasazení. Protoţe lze server Dell PowerEdge T710 osadit aţ 16 pevnými disky a aţ 144 GB paměti, je ideální pro vysokokapacitní výpočetní provoz. Design inspirovaný zákazníky nabízí výjimečné systémové společné vlastnosti, přehledné a logické rozloţení komponent a umístění napájecího zdroje s cílem zajistit rychlou instalaci a zjednodušené nasazení. Server Dell PowerEdge T710 nabízí interaktivní LCD zajišťující monitorování stavu systému, výstrahy a řízení základní
31
konfigurace správy z čelní strany serveru. Vestavěný měřič napájení střídavým proudem a okolní teploty lze sledovat na LCD bez nutnosti pouţít softwarové nástroje.“8)
5.2 Server HP ProLiant ML350 G6 Obr. 11: Server HP ProLiant ML350 G6
zdroj: http://h10010.www1.hp.com/wwpc/cz/cs/sm/WF05a/15351-15351-241434-241477-2414773884315.html?jumpid=reg_R1002_CZCS
Popis serveru od výrobce: „Přizpůsobitelný a spolehlivý základní prostředek vaší firmy. HP ProLiant ML350 G6 je server DP s nejlepším poměrem cena/výkon – nabízí vynikající výkon, rozšiřitelnost a dostupnost. Jedná se o server nové generace s větší paměťovou kapacitou a více moţnostmi rozšíření pevných disků. Nabízí nejnovější procesory Intel® Xeon® s technologií QPI, nejlepší dostupnost ve své třídě a nepřekonatelnou flexibilitu. Tento systém je ideální pro rozvíjející se firmy a obzvláště vhodný pro potřeby vzdálených poboček. Nejlepší systémová architektura současnosti s moţností růstu. Ať jiţ firma podporuje data a transakce pro 5, nebo 500 uţivatelů, server ProLiant ML350 G6 můţe být díky novým funkcím dostupnosti neustále online. Vynikající výkon podnikové třídy za dostupnou cenu. Server ProLiant ML350 G6 vyuţívá nejnovější 2- a 4jádrové procesory s architekturou Intel QPI, sériové vstupy a výstupy a paměť DDR3 za cenu, která nepřesáhne váš rozpočet. 8)
Obchod Technická podpora [online]. 2010 [cit. 2010-01-13]. Server Dell PowerEdge T710. Dostupné z
WWW: .
32
Kompletní řada nástrojů pro usnadnění správy systému. Stejně jako důvěryhodný obchodní partner je i server HP ProLiant ML350 G6 vţdy dostupný a práce s ním je snadná. Server HP ProLiant ML350 G6, nástroj Onboard Administrator a sada softwaru ProLiant Essentials ICE činí z instalace a správy serveru velmi snadný úkol. Přizpůsobí se novým podnikovým příleţitostem. Inteligentní firmy vědí, ţe technologie jsou jedním z nejlepších způsobů získání konkurenční výhody. Server ProLiant ML350 G6 poskytuje infrastruktuře firmy potřebné předpoklady pro získání této výhody.“6)
5.3 Porovnání serverů Dell PowerEdge T710 a HP ProLiant ML350 G6 Citace „manaţerských, reklamních“ informací od výrobce je sice nudná, ale je zde uvedena záměrně, aby bylo zřejmé, ţe z popisu výrobce se servery porovnají těţko. Popis je celkem nepřehledný a kaţdý výrobce v něm udává a vychvaluje jiné parametry. Porovnání provedeme pomocí tabulky, která obsahuje vybrané poţadavky na server, a k těmto poţadavkům jsou přiřazeny technické parametry jednotlivých serverů, které by je měli zajistit.
6
HP [online]. 2010 [cit. 2010-01-13]. Řada serverů HP ProLiant ML350 G6. Dostupné z WWW:
.
33
tabulka 1: porovnání serverů typ serveru
Dell PowerEdge T710
HP ProLiant ML350 G6
procesory
až dva čtyř nebo dvoujádrové procesory Intel® Xeon® řady 5500
jeden procesor Intel® Xeon® řady 5500 se dvěma nebo čtyřmi jádry
podpora virtualizace (konsolidace)
vestavěný hypervisor (volitelný), Microsoft® HyperVTM, VMware® ESXi v4.0 nebo VMware® ESXi v3.5
na úrovni OS
podporované operační systémy
Microsoft® Windows® Small Business Server 2008 Microsoft® Windows® Essential Business Server 2008 Microsoft Windows® Server 2008 SP2, x86/x64 (systém x64 obsahuje technologii Hyper-VTM ) Microsoft Windows® Server 2008 R2, x64 (obsahuje technologii Hyper-VTM v2) Microsoft® Windows® HPC Server 2008 Novell® SUSE® Linux Enterprise Server Red Hat® Enterprise Linux
Microsoft® Windows® Server; Microsoft® Windows® Server Hyper-V; Red Hat Enterprise Linux (RHEL); SUSE Linux Enterprise Server (SLES); NetWare; VMware; HP Citrix Essentials for XenServer
propustnost sítě
dvě vestavěné dvouportové síťové karty Broadcom® NetXtreme IITM 5709c Gigabit Ethernet
vestavěný serverový gigabitový adaptér NC326i PCI Express se dvěma porty
rozšiřitelnost
6 slotů PCIe G2, 1 slot PCIe x16, 4 sloty PCIe x8 a 1 slot PCIe x4 (všechny G2), maximální kapacita interního úložiště až 8TB2 disky SATA nebo SAS
6 rozšiřujících slotů; 1 PCI-Express x16 Gen2 (x8); 1 PCI-Express x8 Gen2 (x8); 4 PCI-Express x8 Gen2 (x4); Volitelná rozšiřující karta PCI-X poskytuje 2 další sloty PCI-X 64 bitů/100 MHz využitím jednoho slotu PCI Express, řadič HP Smart Array P410i, 256 MB (RAID 0/1/1+0/5/5+0)
spolehlivost
paměť ECC DDR3; pevné disky připojitelné za provozu; volitelné redundantní napájecí zdroje připojitelné za provozu; duální vestavěné síťové karty s podporou funkce failover a vyrovnávání zatížení (celkově 4 porty); volitelný řadič rozšiřujících karet PERC6/i s cache zálohovanou baterií; redundantní chlazení připojitelné za provozu; šasi přístupné bez nástrojů; podpora clusterů fibre channel a SAS
DDR3 registrované (RDIMM) a bez vyrovnávací paměti (UDIMM), zdroje připojitelné za provozu a redundantní, přístup do skříně a k součástem bez použití nástrojů; Demontáž základní desky bez použití nástrojů
diagnostika
software Dell| OpenManage s konzolí Dell Management Console, řadič iDRAC6, volitelně iDRAC6 Enterprise
Nástroj HP Systems Insight Manager; SmartStart; Záložní paměť ROM; Aktualizace firmwaru systému; ROMPaq; ProLiant RBSU (instalační nástroj uložený v paměti ROM); Automatické obnovení serveru 2 (ASR2); Dynamická oprava sektorů (s řadičem Smart Array); Sledování parametrů jednotek (s řadičem Smart Array); Upozornění před chybou (zahrnuje procesory, paměť a pevné disky SAS)
úspora energie
účinnost zdroje, ani jiné technologie pro úsporu energie výrobce neuvádí
zdroje napájení mají až 92% účinnost
skříň
šasiT710 – věžový server nebo server montovatelný do racku s výškou 5U Výška: 46,63 cm (18,4 palce) Délka: 73,18 cm (28,9 palce) (celková, včetně čelního krytu) Šířka: 21,79 cm (8,6 palce) Hmotnost (max. konfigurace): 35,3 kg (78,0 liber)
5U tower nebo rack
hodnocení v testech TPC
server se umístil mezi prvními deseti podle parametru cena/výkon s tpmC=239,392 a cena/tpmC=0,5 USD
server se umístil mezi prvními deseti podle parametru cena/výkon s tpmC=239,002 a cena/tpmC=0,54 USD
záruka
3 roky
záruka 3 roky na náhradní díly, 3 roky na práci, 3 roky na opravy u zákazníka
zdroj: vlastní, data převzata z údajů výrobce
34
Z uvedené tabulky se jiţ srovnání provádí lépe. Lze sestrojit další tabulku, v které se jednotlivé parametry ohodnotí body od 1 do 5 (1 - nejhorší, 5 nejlepší ohodnocení splnění daného parametru). Konfigurace testované pomocí TPC-C testu a stručný popis tohoto testu je v příloze č. 1.
tabulka 2: bodové hodnocení
typ serveru procesory podpora virtualizace (konsolidace) podporované operační systémy propustnost sítě rozšiřitelnost spolehlivost diagnostika úspora energie skříň hodnocení v testech TPC záruka celkem zdroj: vlastní
Dell PowerEdge T710
HP ProLiant ML350 G6
3
2
4
2
3
3
4 3 3 3 3 3
3 3 3 3 4 3
4
4
3 36
3 33
Dle tabulky č. 2 lze jiţ servery přehledně srovnat. Bodové hodnocení bylo však provedeno jen mým subjektivním posouzením. Bez znalosti konkrétního případu uţití serveru je takovéto hodnocení velmi obecné a nepřesné. V praxi se však rozhoduje o hardware serveru aţ ve fázi implementace informačního systému. Podklady z předchozích fází vývoje by tedy měly dát dostatek informací, jak výběr uvedeným způsobem nejlépe ohodnotit a vybrat tak nejvhodnější server.
35
6 Zkušenosti z provozu datového centra Dříve neţ budou popisovány některé praktické zkušenosti z provozu datového centra, je potřeba uvést alespoň stručný popis tohoto centra.
6.1 Popis datového centra Jedná se o datové centrum s cca 150 fyzickými servery. U většiny z nich je poţadována dostupnost 99 % v reţimu 7x24. Původně bylo postaveno pro minipočítače SMEP (SM 52/11 a SM 52/12). V době nástupu PC centrum téměř zaniklo. Kaţdý chtěl mít PC na svém stole a provozovat si na něm své aplikace. K zániku nedošlo jen díky provozu několika serverů s operačními systémy Unix a Novell, které ale vyuţívaly v podstatě hardware běţných PC . Nebyla tak potřeba klimatizace, ani speciální napájení. Do dnešního stavu se potom centrum přebudovávalo náročnými rekonstrukcemi za provozu. Tento stav přinesl mnoho problémů, z nichţ některé přetrvávají dodnes. V kapitole 2.6.1 byla uvedena struktura datového centra a sluţby, které by mělo poskytovat. Při popisu se tedy bude vycházet z této struktury.
6.1.2 Napájení Vzhledem k tomu, ţe datacentrum je umístěno ve staré zástavbě, napájení samostatným transformátorem není moţné, vyuţívá se společný transformátor pro celý objekt. Kabel od trafostanice je veden samostatně a je zálohován motorgenerátorem. V součastné době je vyuţíván maximální moţný odebíraný výkon z tohoto zdroje. Není tedy ţádná další moţnost navýšení odběru a rozšiřování datacentra musí být prováděno s ohledem na tuto skutečnost. Všechna IT zařízení jsou napájena z UPS. Většina má redundantní zdroje a v tomto případě je kaţdá větev napájena z jiné UPS. Zkoušelo se i napájet jednu větev z UPS a druhou jen zálohovanou motorgenerátorem, ale tento způsob se neosvědčil. Při výpadku elektrické energie došlo k odběrovým špičkám a větev napájená z UPS toto nesnesla a vypadl jistič. Datacentrum nemá zdroj stejnosměrného napájení 48V. Poţadavek na toto napájení jiţ vznikl, ale zatím se jedná jen o jedno zařízení. V budoucnu se bude řešit nákupem průmyslových spínaných zdrojů k jednotlivým spotřebičům.
36
Podle standardu TUI (The Uptime Institute)* by se dalo datové centrum zařadit do třídy TIER III. Jak sloţité je při provozování datového centra udrţet jeho dostupnost a neopomenout ţádné kritické místo (označované jako SPOF - single point of failure) lze ukázat na následující praktické zkušenosti. Při nahlášeném přerušení dodávky elektrické energie došlo k dvouhodinovému výpadku celé infrastruktury. Dodávka energie byla po jejím přerušení nahrazena motorgenerátorem. Po hodině provozu však motorgenerátor přestal pracovat. Důvod byl velmi prostý. Jednalo se o vadné čidlo mnoţství paliva. Toto signalizovalo chybně nedostatek paliva a řídící jednotka motorgenerátor zastavila. Tuto závadu nemohlo odhalit ani pravidelné zkoušení motorgenerátoru, protoţe při něm nikdy nedošlo ke sníţení zásoby paliva o tolik, aby se závada projevila.
6.1.3 Chlazení Při rekonstrukcích byla nahrazena původní vzduchotechnika, která zajišťovala chlazení minipočítačů SMEP. Bohuţel projektant navrhl jako chladící zařízení větší mnoţství kancelářských klimatizačních jednotek. Toto řešení je naprosto nevhodné. Často se řeší výpadky jednotlivých klimatizací a účinnost bude také velmi špatná. Nejnověji vytvořené oddíly datacentra jsou však jiţ osazeny moderní klimatizační jednotkou, určenou pro chlazení datacenter.
6.1.4 Fyzická infrastruktura Datové centrum je vybaveno zdvojenou podlahou, ţlaby pro vedení kabelů, rackovými stojany, regály pro uloţení tower serverů.
6.1.5 Poţární bezpečnost Datové centrum je rozděleno na úseky. Vznik poţáru je monitorován systémem EPS** s čidly umístěnými na stropě a pod zvýšenou podlahou. Dále je instalováno stabilní hasicí zařízení aerosolové FIRE JACK. *
TUI (The Uptime Institute) je instituce, která vyvinula metodiku, jak měřit dostupnost datových center. Jedná se o průmyslový standard. Datacentra klasifikuje do čtyř tříd. Tyto třídy se značí TIER I - TIER IV. I. Základní - basic II. Redundantní prvky – redundant components III. Servisovatelné za provozu – concurrently maintainable IV. Odolné vůči poruše – fault tolerant
37
6.1.6 Fyzická bezpečnost Fyzickou bezpečnost zajišťuje systém elektronické kontroly vstupu. Na oknech jsou instalovány bezpečnostní fólie. Všechny dveře mají bezpečnostní certifikát NBÚ.* Veškeré prostory chrání EZS** a sleduje kamerový systémem s moţností nahrávání.
6.1.7 Bezpečnost IT Zabezpečení IT struktury je upraveno pro jednotlivé informační systémy. Na úrovni technologie datového centra je instalováno zařízení pro komunikaci přes IPsec.****
6.1.8 Monitoring Pro dohled není instalován ţádný komplexní monitorovací systém. Vyuţívá se nástrojů, které poskytují jednotlivé instalované technologie. Jedná se např. o vzdálený dohled nad UPS nebo hasicí zařízení FIRE JACK. Kaţdý úsek centra je osazen čidlem, pro vzdálené monitorování teploty. K monitorování vlastních serverů jsou instalovány nástroje: Fujitsu Siemens Server View - dohledový software firmy Fujitsu Technology Solutions HP Open View - řada nástrojů společnosti HP Software Nagios - je open source systém dohledového centra
6.2 Virtualizace K vyuţití virtualizace nás donutila nemoţnost zvyšovat celkový odběr elektrické energie a stále nové poţadavky na sluţby poskytované datovým centrem. Dalším důvodem bylo sníţit počet fyzických serverů a zbavit se tak zastaralé a nespolehlivé techniky. Stáří některých serverů je i více neţ 10 let. Problematicky se na ně zajišťuje technická podpora, a pokud se seţene, je poměrně drahá. Na druhou stranu uţivatelé sluţby těchto serverů nadále poţadují a někdy je nelze ani na novější verze operačních systémů převést.
**
EPS – elektronická poţární signalizace Národní bezpečnostní úřad ** EZS – elektronický zabezpečovací systém **** IPsec (IP security) přidává k protokolu IP bezpečnostní funkce, které ověřují a šifrují kaţdý IP paket *
38
6.2.1 Pouţitý hardware Výběrovým řízením bylo rozhodnuto o nákupu serverů HP ProLiant DL380 G5. Jedná se o nejlépe prodávaný server na světě. Základní parametry zakoupeného stroje: Procesor 2x Intel Xeon, 5160, 3GHz Paměť RAM "PC2-5300" 667/533MHz DIMM, "on-line spare memory" - rozšířená ochrana paměti, 20GB Interní disková kapacita Hot Plug Serial Attached SAS, 8x72 GB na řadiči Smart Array P400 Controller - 512MMB paměti, podpora RAID 0/1/5/6 dvojitá síťová karta NC373i Multifunction Gigabit Network Adapters with TCP/IP Offload Engine dvojitý hot plug napájecí zdroj 800W Server má integrované virtualizační technologie VMware a XenServer.
6.2.2 Výběr virtualizační platformy Výběr virtualizační platformy VMware byl proveden na základě metody analytické společnosti Burton Group (parametry metodiky jsou uvedeny v příloze č.2). Následující graf porovnává hypervisory tří nejznámějších platforem. Ukazuje, ţe jiţ verze VMware 3.5 plní na 100% nutné poţadavky metodiky. Obr. 12: Splněná kritéria podle metodiky Burton Group
zdroj: http://connect.zive.cz/files/clanky/1162/graf.png
39
6.3 Přínosy provedené virtualizace Podle odborníků ze společnosti ALWIL Trade přináší pouţití systémů VMware následují výhody: „Sníţení nákladů na hardware, napájení a chlazení zásluhou provozu více operačních systémů na jednom fyzickém serveru. Niţší reţijní náklady na správu díky omezení obsazeného prostoru v datovém centru. Zaručení vysoké úrovně výkonu pro aplikace nejnáročnější na systémové prostředky. Konsolidace hardwarových prostředků a moţnost spolehnout se na nejčastěji nasazovanou a bezpečnou platformu pro virtualizaci serverů ověřenou v produkčním nasazení.“11) Podíváme se tedy na konkrétní případ provedené virtualizace a pokusíme se shrnout jaké výhody opravdu přinesla.
6.3.1 Popis provedené virtualizace Zkoumání podrobíme dva ESXi servery jejichţ hardware konfigurace je uvedena výše. Nejpřehlednější formou bude sestavení tabulek s popisem jednotlivých fyzických serverů pro kaţdý ESXi.
11)
Alwil [online]. 2010 [cit. 2010-03-28]. VMware ESX a VMware ESXi. Dostupné z WWW: .
40
tabulka 3: virtualizované servery Na HP Proliant DL380 G5, VMware ESXi1 bylo převedeno operační typ serveru poskytované sluţby systém
stáří technická (roků) podpora
Fujitsu-Siemens PRIMERGY TX300
doménový kontrolér, DNS server, časová synchronizace počítačů
MS Windows 2000 server
7
ano
HP Proliant ML330
NAP server Eurodac
MS Windows 2000 server
8
ne
HW na platformě PC
kořenový DNS Server replikace změn v MS Exchange Server 5.0 Časový normál
MS Windows NT
12
ne
HW na platformě PC
aktualizace poštovních adres mezi různými verzemi MS Exchange (5.0 a 2000)
MS Windows NT
12
ne
HP Proliant DL360
aplikační server
MS Windows 2000 server
7
ano
zdroj: vlastní
tabulka 4: virtualizované servery Na HP Proliant DL380 G5, VMware ESXi2 bylo převedeno operační typ serveru poskytované sluţby systém
stáří technická (roků) podpora
Fujitsu-Siemens PRIMERGY TX300
server fulltextové farmy
MS Windows 2000 server
7
ano
Fujitsu-Siemens PRIMERGY TX300
server fulltextové farmy
MS Windows 2000 server
7
ano
Fujitsu-Siemens PRIMERGY TX300
server fulltextové farmy
MS Windows 2000 server
7
ano
Fujitsu-Siemens PRIMERGY TX300
server fulltextové farmy
MS Windows 2000 server
7
ano
HP Proliant DL360
aplikační server
MS Windows 2000 server
7
ano
HP Proliant DL360
aplikační server
MS Windows 2000 server
7
ano
zdroj: vlastní
41
6.3.2 Sníţení nákladů na napájení a chlazení Odborníci uvádějí, ţe "náklady za energii pro datová centra a za jejich chlazení jsou obvykle vyšší neţ náklady na pořízení samotných IT zařízení, která jsou v těchto centrech umístěna. Je to způsobeno skutečností, ţe dnešní IT systémy – včetně serverů, směrovačů a zařízení NAS – obsahují na kaţdém čipu mnoho tranzistorů a na stejné nebo menší ploše mají více čipů náročných na dodávku elektrické energie."13) Náklady na napájení a chlazení spolu úzce souvisí. Většina elektrické energie, dodaná do datového centra, se zde přemění na teplo. Sníţením spotřeby dojde tedy také ke sníţení nároku na chlazení. Pro výpočet úspor na chlazení budeme vycházet z faktu, ţe na chlazení se v datových centrech spotřebuje 40% z celkové spotřeby. Postačí tedy zjistit úsporu na napájení a zbytek dopočítat. Pojďme tedy prakticky měřit.
6.3.2.1 Měření spotřeby V našem datovém centru ţádné průběţné měření spotřeby neprobíhá. Za dodávku elektřiny jsou zodpovědní pracovníci správy budov. O problémy s dodávkou energie se tak začneme zajímat aţ v případě jejího nedostatku. Jedná se o dost závaţný problém, který se vyskytuje u spousty dalších společností. K měření spotřeby tak nebyl k dispozici lepší měřicí přístroj neţ „zásuvkový“ wattmetr. Není u něj zaručena ţádná třída přesnosti a tak se absolutní naměřené hodnoty mohou odlišovat od skutečnosti. Pro srovnání by tato chyba nemusela znamenat velký problém, protoţe vše bylo měřeno stejným přístrojem a tak bude chyba stále stejná. Dalším důvodem pro pouţití „zásuvkového“ wattmetru byla snadnost jeho připojení. Měření probíhalo za provozu a nesmělo způsobit výpadek serveru. Přepojení na měřící okruh umoţnil duální napájecí zdroj serveru. Větve zdroje se přepojily postupně. Měření probíhalo po dobu deseti hodin při zatíţení serveru běţným provozem. Výsledná naměřená hodnota je pak průměrem za uvedenou dobu. Naměřené hodnoty zobrazují následující tabulky:
13)
Computerworld [online]. 2008 [cit. 2010-04-10]. Sniţte náklady za energii pro datová centra. Dostupné z WWW: .
42
tabulka 5: naměřená spotřeba server HP Proliant DL380 G5, VMware ESXi1 Fujitsu-Siemens PRIMERGY TX300 HP Proliant ML330
spotřeba W
poznámka
280 měřen byl jiný, doposud pouţívaný stroj stejného typu ve spotřebě je zahrnut i CRT monitor počítač jiţ nebyl v době měření k dispozici, měření provedeno na obdobném stroji počítač jiţ nebyl v době měření k dispozici, měření provedeno na obdobném stroji měřen byl jiný, doposud pouţívaný stroj stejného typu
287 254
HW na platformě PC
186
HW na platformě PC
186
HP Proliant DL360
220
celková spotřeba virtualizovaných strojů
1133
pokles spotřeby po virtualizaci
853
zdroj: vlastní
tabulka 6: naměřená spotřeba server HP Proliant DL380 G5, VMware ESXi2
spotřeba W
poznámka
287
Fujitsu-Siemens PRIMERGY TX300
285
měřen byl jiný, doposud pouţívaný stroj stejného typu
Fujitsu-Siemens PRIMERGY TX300
285
měřen byl jiný, doposud pouţívaný stroj stejného typu
Fujitsu-Siemens PRIMERGY TX300
285
měřen byl jiný, doposud pouţívaný stroj stejného typu
Fujitsu-Siemens PRIMERGY TX300
285
měřen byl jiný, doposud pouţívaný stroj stejného typu
HP Proliant DL360
220
měřen byl jiný, doposud pouţívaný stroj stejného typu
HP Proliant DL360
220
měřen byl jiný, doposud pouţívaný stroj stejného typu
celková spotřeba virtualizovaných strojů
1580
pokles spotřeby po virtualizaci
1293
zdroj: vlastní
43
Zatíţení serveru ESXi1 během měření ukazují následující grafy: Obr. 13: Vytíţení procesorů
zdroj: vlastní, konzole VMware vSphere Client
Obr. 14: Vytíţení disků
zdroj: vlastní, konzole VMware vSphere Client
Grafy zobrazují poměrně nízké vytíţení serveru, coţ dokazuje, ţe vyuţití původních fyzických serverů bylo neefektivní. 44
6.3.2.2 Výsledky měření spotřeby K vyčíslení úspor na spotřebě je nutno zvolit tarif, který bude k výpočtu pouţit. Distributoři elektřiny nezveřejňují tarify pro velkoodběratele, ke kterým budou velká datová centra jistě patřit. Zvolíme tedy pro příklad výpočtů tarif „Aktiv klasik 24 c03d společnosti PRE“12) určený podnikatelům. Cena pro letošní rok v uvedeném tarifu činí 3,32523 Kč/kWh. Zároveň přičteme, jiţ uvedeným způsobem, cenu za úsporu na chlazení. Ve výpočtech se předpokládá nepřetrţitý provoz serverů.
tabulka 6: úspora na elektřině celková úspora W uspořeno za rok kWh uvaţovaný tarif Kč/kWh uspořeno za rok včetně chlazení kWh celková úspora ročně
2146 18798,96 3,32523 26318,544 87 515 Kč
zdroj: vlastní
Zjištěná roční úspora dokazuje, ţe energetické náklady na provoz datového centra jsou velmi významnou poloţkou a dá se zde hodně ušetřit. Cena za spotřebovanou elektřinu však není to jediné, na čem provedená virtualizace přinesla úspory. Neméně nákladná je technická podpora. Pojďme se podívat jaké úspory přineslo popisované řešení zde.
6.3.3 Celkové náklady na vlastnictví serveru (TCO) Do celkových nákladů na vlastnictví TCO (Total Cost of Ownership) serveru spadá: pořizovací cena náklady na správu a údrţbu náklady na opravy cena spotřebované energie 12)
PRE [online]. 2010 [cit. 2010-04-04]. 12) Ceník elektřiny pro podnikatele. Dostupné z WWW: .
45
V této kapitole se budeme věnovat především bodu „náklady na opravy“. Opravy jsou v našem datovém centru zajištěny pomocí servisní smlouvy k jednotlivým zařízením. V tabulkách č. 3 a 4 je u jednotlivých serverů uvedeno, zda byla placena technická podpora. Vyjdeme tedy z ceny za tuto podporu a spočítáme, co se ušetřilo v této oblasti. V následující tabulce jsou uvedeny ceny technické podpory za rok 2009 u virtualizovaných serverů:
tabulka 7: cena za technickou podporu Na HP Proliant DL380 G5, VMware ESXi1 bylo převedeno typ serveru cena technické podpory za rok Fujitsu-Siemens PRIMERGY TX300 33 000 Kč HP Proliant ML330 0 Kč HW na platformě PC 0 Kč HW na platformě PC 0 Kč HP Proliant DL360 10 774 Kč Na HP Proliant DL380 G5, VMware ESXi2 bylo převedeno typ serveru technická podpora Fujitsu-Siemens PRIMERGY TX300 33 000 Kč Fujitsu-Siemens PRIMERGY TX300 33 000 Kč Fujitsu-Siemens PRIMERGY TX300 33 000 Kč Fujitsu-Siemens PRIMERGY TX300 33 000 Kč HP Proliant DL360 10 774 Kč HP Proliant DL360 10 774 Kč celková cena technické podpory
197 322 Kč
zdroj: vlastní
K vyčíslení a porovnání TCO potřebujeme ještě pořizovací cenu ESXi serverů, která je známa a náklady na správu a údrţbu. Náklady na správu a údrţbu se v našem případě nijak nemění. Je sice uváděno, ţe správa serverů ve virtualizovaném prostředí je snadnější, ale vzhledem k tomu, ţe s virtualizací teprve začínáme, usnadnění v této oblasti zatím nenastalo. Je třeba zaškolit obsluhu pro nové technologie, přepracovat dokumentaci apod. Nyní provedeme výpočet celkového TCO za rok.
46
tabulka 8: celkové náklady na vlastnictví za rok typ serveru HP Proliant DL380 G5, VMware ESXi1 Fujitsu-Siemens PRIMERGY TX300 HP Proliant ML330 HW na platformě PC HW na platformě PC HP Proliant DL360
TCO za rok 139 889 Kč 41 360 Kč 7 399 Kč 5 418 Kč 5 418 Kč 17 182 Kč
typ serveru HP Proliant DL380 G5, VMware ESXi2 Fujitsu-Siemens PRIMERGY TX300 Fujitsu-Siemens PRIMERGY TX300 Fujitsu-Siemens PRIMERGY TX300 Fujitsu-Siemens PRIMERGY TX300 HP Proliant DL360 HP Proliant DL360
TCO za rok 140 093 Kč 41 302 Kč 41 302 Kč 41 302 Kč 41 302 Kč 17 182 Kč 17 182 Kč
celkové TCO na virtualizované servery celkové TCO na ESXi servery
276 349 Kč 279 982 Kč
zdroj: vlastní
Výpočet TCO za rok u ESXi serverů zahrnuje jejich nákupní cenu a spotřebovanou energii. U převedených serverů nebyla nákupní cena jiţ známa a tak není ve výpočtech zahrnuta. Vzhledem ke stáří serverů se však dá vliv jejich ceny zanedbat. V uvedeném případě lze z výsledných nákladů na vlastnictví konstatovat, ţe nákup nových serverů se zaplatí jiţ po roce jejich provozu. Záruční doba u uvedených ESXi serverů je tři roky. Srovnání nákladů na tři roky provozu uvádí následující tabulka:
tabulka 8: celkové náklady na vlastnictví za tři roky servery ESXi staré virtualizované celková úspora
TCO za 3 roky 313 014 Kč 839 946 Kč 526 932 Kč
zdroj: vlastní
47
Předpokládaná celková úspora po třech letech provozu uvedeného řešení činí 526 932 Kč, coţ je (vzhledem k malému počtu serverů v příkladu) významná částka.
6.4 Ţivotnost hardware serveru Z popsaného příkladu je patrné, ţe hardware serveru vydrţí pracovat poměrně dlouho. Z provozu byly odstaveny servery pracující nepřetrţitě 12 let. Pokud však budeme ţivotnost serveru chápat jako efektivní a spolehlivou dobu provozu, dojdeme k mnohem kratší době. Na základě provedených výpočtů a měření jsme dokázali, ţe nákup nové virtualizační technologie se vrátil po roce jejího provozu. Po dobu tří let je zajištěn servis v rámci záruky. Konec záruční doby bude znamenat vyřešit zajištění technické podpory. Cena za roční servisní podporu bývá běţně třetinou pořizovací ceny serveru. Dá se předpokládat, ţe po třech letech budou k dispozici mnohem výkonnější servery. Nebude tedy pravděpodobně nemoţné nahradit dva zde popsané ESXi jedním fyzickým strojem. Ţivotností hardware v uvedeném příkladu je tedy délka záruční doby. Tím jsme se dopracovali k odpovědi na otázku: kdy je vhodné vyměnit server za nový?
48
Závěr Téma „Srovnání hardwarových platforem pro serverové aplikace EO a bankovnictví“ jsem si vybral z důvodu, ţe problematika hardware mi byla z nabízených témat nejbliţší. Původní profesí jsem mechanik-elektronik a před dvaceti lety jsem začal pracovat v oboru IT jako technik minipočítačů SMEP. V této době byla znalost elektrotechniky pro údrţbu a opravy minipočítačů dostatečnou kvalifikací. Opravy byly prováděny na úrovni obvodů základních desek počítačů a ke všemu byla dokonalá dokumentace výrobce. Toto období však netrvalo dlouho a s přechodem na PC jiţ nebylo takovýmto způsobem co opravovat. Vše se v případě závady měnilo za nové. Z technika se ze mne tedy stal „Správce informačních a komunikačních technologií“ a podobné funkce. Jednoduše řečeno, starám se o udrţení funkčnosti sluţeb serverů v našem datovém centru. Z pohledu mé profese byla také vypracována tato bakalářská práce. V úvodní části jsem vyhledal v dostupné literatuře základní informace o tom co server vlastně je, jaké jsou na něj kladeny poţadavky a jaké technologie se pro splnění těchto poţadavků pouţívají. Jedním z cílů práce bylo srovnání hardware serverů. Popsal jsem tedy vlastní metodu, jak by se toto srovnání dalo provádět. Je zde uveden pouze vzorový příklad srovnání dvou serverů, na základě vybraných parametrů, ale uvedenou metodu lze modifikovat a pouţít ji v konkrétních případech. V poslední kapitole se věnuji některým problémům z praktického provozu datového centra, abych dospěl k dalšímu cíli této práce: doporučit, kdy je vhodné pořídit nový hardware pro server. Vypracováním bakalářské práce jsem získal nové vědomosti a doufám, ţe některé mé zde popsané zkušenosti, také někomu pomohou. Závěrem bych chtěl konstatovat, ţe jsem splnil cíle bakalářské práce, kterými bylo definovat poţadavky na server, porovnat konkrétní konfigurace serverů z hlediska plnění těchto poţadavků a doporučit, kdy je vhodné pořídit nový hardware pro server.
49
Pouţitá literatura 1) BENEŠ, Vladimír. Technická infrastruktura a síťové technologie. Praha : Bankovní institut, a.s, 2005. 213 s. ISBN :80-7265-063-7. 2) BENEŠ, Vladimír. SERVEROVÁ KONSOLIDACE. [cit. 2010-01-10]. Dostupný z WWW: . 3) DRAŢIL, Jiří. 3S.CZ [online]. 2010 [cit. 2010-03-19]. Co je to diskové pole?. Dostupné z WWW: . 4) FIŠER, M. Role ICT v trvale udrţitelném ţivotním prostředí . Computerworld. 2008, Zvláštní neprodejná příloha, s. 2-3. 5) KONEČEK, Rudolf. Computerworld [online]. 2009 [cit. 2010-01-13]. SLA začíná sledovat i aplikace a obchodní procesy. Dostupné z WWW: . 6) HP [online]. 2010 [cit. 2010-01-13]. Řada serverů HP ProLiant ML350 G6. Dostupné z WWW: . 7) I-Development [online]. 2010 [cit. 2010-03-16]. Komplexní design datového centra. Dostupné z WWW: . 8) Obchod Technická podpora [online]. 2010 [cit. 2010-01-13]. Server Dell PowerEdge T710. Dostupné z WWW: . 9) IBM [online]. 2010 [cit. 2010-03-23]. IBM BladeCenter. Dostupné z WWW: . 10) Connect [online]. 2009 [cit. 2010-03-26]. Tři z nejsilnějších - srovnání serverové virtualizace VMware vs. Citrix vs. Microsoft. Dostupné z WWW: . 11) Alwil [online]. 2010 [cit. 2010-03-28]. VMware ESX a VMware ESXi. Dostupné z WWW: . 12) PRE [online]. 2010 [cit. 2010-04-04]. 12) Ceník elektřiny pro podnikatele. Dostupné z WWW: . 13) Computerworld [online]. 2008 [cit. 2010-04-10]. Sniţte náklady za energii pro datová centra. Dostupné z WWW:
50
Příloha č. 1 Stručný popis TPC-C testu
Příloha č. 2 Parametry metodiky hodnocení datových center společnosti Burton Group Výpočetní výkon Nutné: o + podpora poměru 1:1 mezi virtuálními procesory (vCPU) a fyzickými procesory (pCPU) Preferované: o + podpora vCPU a pCPU poměru 4:1 Volitelné: o + podpora vCPU a pCPU poměru 8:1 pro provoz desktopových operačních systémů Správa paměti Nutné: o + Podpora hardwarové asistence paměťové virtualizace INTEL Extended Page Tables (EPT) nebo AMD Rapid Virtualization Indexing (RVI), coţ je velmi důleţité pro výkon vícevláknových enterprise aplikací Preferované: o + Přetíţení paměti (Memory Overcommitement), coţ zvyšuje efektivitu vyuţití fyzické paměti pomocí deduplikace paměťových stránek a tím zajišťuje i větší konsolidační poměr. o + Podpora Large Memory Pages jak na úrovni virtuálního serveru, tak i hypervisoru. Tato technologie výrazně zvyšuje výkon databázových systémů ve virtuálním prostředí. Volitelné: o + Deduplikaci fyzických paměťových stránek (Memory Page Sharing). Diskový subsystém Nutné: o + Podpora Fibre Channel a iSCSI diskových polí o + Oficiální podpora enterprise zálohovacích systémů Preferované: o + Nástroje pro tvorbu aplikačně konzistentních snapshotů o + Automatické vylaďování řízení diskových I/O Bufferů a Cache o + Fibre Channel over Ethernet (FCoE) o + Active/Active Multipathing Volitelné: o + Obousměrné ověřování k iSCSI targetům protokolem CHAP o + Podpora NFS pro sdílený diskový prostor o + Podpora NPIV o + Manuální ladění řízení diskových I/O Bufferů a Cache o + API pro propojení hypervisoru s diskovými subsystémy různých výrobců Networking Nutné: o + Teaming a loadbalancing síťových karet o + Podpora VLAN a VLAN trunkingu (802.1Q) Preferované: o + Podpora promiskuitního reţimu o + Detekce ztráty síťového spojení o + Bezpečnostní funkce na úrovni MAC adres o + Centralizovanou správu virtuálních switchů o + Integrace firmwaru třetích stran do virtuálních switchů o + Automatické vylaďování řízení síťových I/O Bufferů a Cache Vysoká dostupnost Nutné: o + Automatizovaný rozprostřený restart (failover) virtuálních serverů na zbylé fyzické servery v clusteru o + Moţnost nastavení priorit restartu jednotlivým virtuálním serverům o + Škálovatelnost clusteru minimálně na osm serverů Preferované: o + Detekce výpadku operačního systému uvnitř virtuálního serveru o + Detekce částečného výpadku fyzického uzlu clusteru o + Redundantní heartbeat síť Volitelné: o + Integrace s HA softwarem třetích stran (Symantec, SteelEye)
Paravirtualizace Nutné: o + Paravirtualizované ovladače pro virtuální servery Windows 2003/2008 Preferované: o + Paravirtualizovaná jádra a ovladače pro linuxové virtuální servery Volitelné: o + Paravirtualizované ovladače pro virtuální servery Windows 2000/XP/Vista o + Paravirtualizované ovladače pro virtuální servery Sun Solaris 10 o + Univerzální paravirtualizované ovladače podporované více Hypervisory Správa virtuální infrastruktury Nutné: o + Klientský program nebo webové rozhraní pro management o + Podpora SNMP trapů pro systémové a definované události o + Integrace s enterprise management systémy o + Podpora vysoké dostupnosti management serveru Preferované: o + Podpora ovládání z příkazové řádky (CLI) a skriptování o + Podpora OVF virtuálních appliancí a standardní CIM správy o + Formát virtuálních disků kompatibilní napříč hypervisory o + Podpora správy minimálně 10.000 virtuálních serverů pomocí centrálního management serveru Volitelné: o + Podpora dynamického load balancingu virtuálních serverů nad servery fyzickými Správa napájení Preferované: o + Podpora hardwarové optimalizace spotřeby (vypínaní/zapínaní jader procesorů, přetaktování procesorů – Intel Nehelem Turbo Boost, apod.) Volitelné: o + Podpora automatizovaného vypínání/zapínání fyzických serverů v rámci jednoho clusteru Licencování Preferované: o + Licencování na fyzický server Volitelné: o + Licencování na patice fyzických procesorů o + Licencování na procesorová jádra o + Licencování na počet běţících virtuálních serverů Podpora Nutné: o + Minimálně tří letá podpora o + Rozšíření podpory o minimálně jeden rok o + Veřejně publikované road mapy Preferované: o + Minimálně šest měsíců přechod mezi jednotlivými verzemi