Datová centra z pohledu univerzity • David Antoš Ústav výpočetní techniky Masarykova univerzita
[email protected]
Úvod A data center or datacenter (or datacentre), also called a server farm, is a facility used to house computer systems and associated components, such as telecommunications and storage systems. – http://en.wikipedia.org/wiki/Data_center •
ovšem na datovém centru univerzity není nic zvláštního. . . má servery, datová úložiště, klimatizaci . . . dokud se nezačneme bavit o jeho službách a uživatelích
Ústav výpočetní techniky (ÚVT) •
ústav Masarykovy univerzity
•
výzkum, vývoj a provoz systémů v oblastech − − − − − − − − −
•
služby datových a hlasových sítí celouniverzitní počítačové studovny ekonomicko-správní a exekutivní informační systémy podpora náročných výpočtů a velkokapacitních datových úložišť knihovní systémy a elektronické informační zdroje počítačová bezpečnost archiv obrazových dat nemocnic v Brně archiv českého webu ...
spolupráce s Fakultou informatiky
Superpočítačové centrum Brno (SCB) •
součást ÚVT
•
integrovaná v infrastruktuře MetaCentra (CESNET) − většina znalostí o provozu infrastruktury MetaCentra je v SCB − celé MetaCentrum ? cca 1500 výpočetních jader v clusterech . Brno, Plzeň, České Budějovice, Praha ? zapojeno v mezinárodních aktivitách . EGEE, EGI, EUAsiaGrid, EPIKH, . . . ? poskytuje výpočetní výkon a prostor pro data pro akademické pracovníky ? provádí výzkum a vývoj v gridovém počítání
Standardní praxe univerzitního zacházení s IT •
souvisí s modelem financování
•
zdroje vysoké školy − za studenty ? hradí běžnou výuku a provoz souvisejících systémů − z grantů ? umožňuje nákupy speciální techniky . včetně výpočetní
•
nepříjemný aspekt pro výstavbu IT podpory: výzkum nelze plánovat − riziko neúspěchu přebírá „někdo bohatý“: grantová agentura
Důsledky modelu financování na univerzitě I •
skupiny s potřebou výpočetního výkonu si jej často pořizují samy − nevhodné umístění ? syndrom racku v koutě laboratoře − amatérská správa ? princip obětování doktorského studenta − neefektivní vzhledem k skutečnému průběhu výpočetních potřeb ? neumožňuje sdílení zátěže ? situace se začíná zlepšovat
•
totéž platí pro data − od skříně s CD-R po diskové pole pod stolem − občas jsou požadavky grantových agentur nesmyslné ? např. data se nesmějí uchovávat mimo budovu
Důsledky modelu financování na univerzitě II •
zdroje financí na pořízení a provoz jsou oddělené − peníze na provoz se „někde vezmou“ − „na fakultě přece máme zásuvky“
•
výzkumníci v oborech s horšími možnostmi financování pracují se zoufalým zabezpečením, např. − data ukládaná na přenosných discích − data na jednom PC bez zálohy
Náročnost provozu centralizovaných služeb •
i přesto náročnost provozu narůstá Rok
Příkon sálů ÚVT (v kW)
1998
110
2004
200
2009
330
•
zahrnuje služby pro MU a PoP CESNETu pro Brno
•
prostor pro zařízení s nízkou spotřebou
Úskalí průzkumu požadavků •
zkušenosti z průzkumu pro projekt CEITEC, část vědy o živé přírodě
•
realita povědomí o IT potřebách při průzkumu požadavků − „nic nepotřebujeme“ − „nic nepotřebujeme, jen nám z tohoto přístroje vypadnou 2 TB dat denně“ − „celé zpracování se dělá na strojích, co dodají s přístrojem, občas to chceme přepočítat, na to budou potřeba nějaké počítače?“
•
výsledný odhad objemu dat vytvořených CEITECem: 5 PB − vlastní v projektu plánovaná kapacita je méně než pětinová
Datové centrum a jeho služby •
datovým centrem rozumíme provozování a rozvoj stávajících činností ÚVT pro univerzitu a budování gridové a superpočítačové části národní infrastruktury v projektu CERIT
•
datové centrum na univerzitě má smysl pouze podpořené masivním programem školení uživatelů − zejména těch, kteří si myslí, že (téměř) nic nepotřebují
•
ÚVT zahájilo projekt „Vzdělávání akademických pracovníků v oblasti eInfrastruktur“ − přehledová a specializovaná školení uživatelů z univerzity o většině oblastí pokrytých ÚVT − s cílem minimalizovat duplikování centrálně poskytovaných služeb lokálními skupinami
CERIT I •
připravovaný projekt OP VaVpI jako součást národní infrastruktury pro vědu a výzkum
•
ÚVT, Fakulta informatiky MU, Jihomoravský kraj a komerční partneři
•
prostředí pro spolupráci fakulty s výzkumnými odděleními firem a superpočítačové vybavení − rozšíření budovy – snadná fyzická dostupnost
•
uživatelé: výzkum a vývoj (CzechGlobe, CEITEC, . . . )
CERIT II •
přidělování prostředků „interním grantovým výborem“
•
data cca 16 PB raw, 6400 jader v SMP nebo ekvivalent v jiné než clusterové architektuře, 3000 jader v HDC
•
virtualizované výpočetní zdroje umožňují uživatelské prostředí na míru v gridové části − podobné prostředí připravujeme v MetaCentru
•
doplněno nezbytným programem školení a podpory uživatelů
Shrnutí •
lidé z průmyslu obvykle utrpí „kulturní šok“
•
systém financování výzkumu a vývoje vede na značný individualismus v zajišťování IT podpory
•
obvykle neexistují standardní politiky pro zacházení s daty − řešitel grantu má (a musí mít) značnou autonomii
•
v prostředí univerzity lze řešit jedině systémem školení a vzdělávání
•
a dostupného a spolehlivého prostředí pro ukládání dat a výpočty
•
. . . plánovaného v projektu CERIT
Projekt „Vzdělávání akademických pracovníků v oblasti eInfrastruktur“ je spolufinancován Evropským sociálním fondem a státním rozpočtem České republiky.