Zajimavy od slidu 21 Výpočetní ý č í gridy, id 2008
Edited by Foxit Reader Copyright(C) by Foxit Software Company,2005-2008 For Evaluation Only.
Z různých materiálů sestavil L. Pešička
Obsah
Motivace gridu Projekty distrib. počítání Architektura gridových služeb OGSA,, OGSI,, Globus Toolkit EGEE Grid M t Metacentrum t
Motivace – p proč g gridy? y
Reálné využití výpočetních zdrojů - cluster
výkonný cluster
cena pořízení náklady provozní infrastruktury (energie, klimatizace) náklady na správu
Edited by Foxit Reader Copyright(C) by Foxit Software Company,2005-2008 For Evaluation Only.
periody intenzivního využití x idle nárazová potřeba výkonu CPU
Reálné využití výpočetních zdrojů - pracovní stanice
pracovní stanice
mimopracovní doba oběd ě čekání na interakci uživatele (např. word) “screen screen savers” savers
Edited by Foxit Reader Copyright(C) by Foxit Software Company,2005-2008 For Evaluation Only.
pořizovaná konfigurace (delší období) výkon potřebný pro běžnou agendu idle time
Pronájem potřebného výkonu
od koho – spřátelené organizace (omezený počet) často potřebují výkon ve stejné době
organizace stejného charakteru, podobné termíny..
administrativa
přístupová konta (security policy) metody přístupu, vytížení sítě, přenos velkých souborů monitorování p průběhu výpočtu ýp
Edited by Foxit Reader Copyright(C) by Foxit Software Company,2005-2008 For Evaluation Only.
zapůjčení strojového času clusteru
Využití CPU pracovních stanic
Příjem dávky Zpracování Odeslání výsledků ý Seti@home, World Community Grid vnitrofiremní použití – např. i Intel
data, výpočty, výsledky neopustí firmu
Edited by Foxit Reader Copyright(C) by Foxit Software Company,2005-2008 For Evaluation Only.
Služba na pracovních stanicích, v době nečinnosti CPU provádí výpočet dané úlohy
Sdružení výpočetních prostředků – virtuální organizace (VO)
úloha do fronty resource broker b k rozhodne h d o vhodném h d é CE pro danou úlohu řeší otázku bezpečnosti bezpečnosti, přístupových práv větší množství organizací
Edited by Foxit Reader Copyright(C) by Foxit Software Company,2005-2008 For Evaluation Only.
začlenění (výpočetních) prostředků do zdrojů sdílených v rámci VO definování politiky přístupu k prostředkům
Oblíbené projekty distribuovaného počítání p
Distribuované počítání
SETI@HOME
BOINC – Berkeley Open Infrastructure for Network Computing
http://www.boinc.cz/
World Community Grid
http://www.worldcommunitygrid.org/
United Devices client OR Boinc
Edited by Foxit Reader Copyright(C) by Foxit Software Company,2005-2008 For Evaluation Only.
http://setiweb.ssl.berkeley.edu/ h // i b l b k l d / původně SETI@home/Classic od 15.12.05 15 12 05 SETI@home/BOINC
World Community Grid
wcg_boinc_5.10.30_windows_intelx86.exe (9 408 KB) použit k instalaci (3.12.2007) (3 12 2007)
Linux (x86) Apple Mac (PowerPC, x86) United Devices for Windows (Vista (Vista, XP XP, 2000 2000,..))
SETI: a g global desktop pg grid
SETI@home
3.8M users in 226 countries 1200 CPU years/day 38 TF sustained (Japanese Earth Simulator is 32 TF sustained) Highly g y heterogeneous: g >77 different processor types
G id Gridy
What is Grid? ●
●
They are geographically distributed and connected by a wide-area wide area network They can be accessed ondemand by a set of users
Grid Internet
Edited by Foxit Reader Copyright(C) by Foxit Software Company,2005-2008 For Evaluation Only.
●
A Grid is a collection of computers, storages, special devices,, services that can dynamically join and leave the Grid They are heterogeneous in every aspect
Definice gridu
Výpočetní grid je hardwarová a softwarová infrastruktura, kt á poskytuje která k t j spolehlivý, l hli ý standardizovaný, t d di ý všudypřítomný a levný přístup ke špičkovým výpočetním službám. službám
Edited by Foxit Reader Copyright(C) by Foxit Software Company,2005-2008 For Evaluation Only.
I. Foster, C. Kesselman:
Analogie – rozvod elektřiny
původně každá budova vlastní generátor elektřiny
cca 1910, 1910 d drahé, hé neefektivní f kti í
zavedení elektráren a rozvodné sítě
podobný vývoj ve využití výpočetních prostředků
Edited by Foxit Reader Copyright(C) by Foxit Software Company,2005-2008 For Evaluation Only.
Vlastnosti Gridu
Edited by Foxit Reader Copyright(C) by Foxit Software Company,2005-2008 For Evaluation Only.
koordinuje zdroje nepodléhající centralizované správě používá standardní, otevřené, obecné protokoly a rozhraní h í poskytuje netriviální kvalitu i kvantitu služeb (víc než j d tli é čá jednotlivé části ti zvlášť) lášť) Geografická vzdálenost nehraje roli
Vlastnosti Gridu
různé druhy zdrojů
různý hw participujících zařízení různé druhy interakcí různé uživatelské skupiny a aplikace dynamičnost
zdroje a uživatelé přibývají-ubývají-mění se
Edited by Foxit Reader Copyright(C) by Foxit Software Company,2005-2008 For Evaluation Only.
CPU, disk. CPU di k prostor, t přenosová ř á kapacita k it sítí ítí speciální hw (senzory, mikroskopy..)
Typy gridů
Výpočetní
Datové
sdílení velkého množství dat, dat replikované datové katalogy
Informační (znalostní) Celosvětové Interní v rámci organizace
V pracovní době – po pracovní době - víkendy
Edited by Foxit Reader Copyright(C) by Foxit Software Company,2005-2008 For Evaluation Only.
spouštění ště í aplikací lik í na distribuovaných di t ib ý h zdrojích d jí h
Gridy - historie
Cca od 90tých let 20.století .. Distribuovaná á výpočetní ý č í infrastruktura pro vědecké ě éa inženýrské výpočty V t ář Vytvářeny virtuální i t ál í organizace i (VO)
Správa a monitorování distribuovaných zdrojů Bezpečnost Důvěra Ochrana soukromí
Virtuální organizace
Skutečné organizace
Sdílení zdrojů – podmíněné
M h participovat Mohou ti i t v jedné j d é nebo b více í virtuálních i t ál í h org. Podmínky udané vlastníkem zdroje Kdy, kde a co je možné se zdrojem dělat
Nový účastník
K jakým zdrojům je možné přistupovat
Např. i dle publikací s odkazem na VO
Charakteristika zdrojů Definice politiky, která řídí přístup ke zdrojům
Standardy
OGSA (Open Grid Service Architecture)
OGSI (Open Grid Service Infrastructure)
Formální a technická specifikace Nahrazena WSRF a WS-Management g
Globus Toolkit
Referenční implementace OGSI
Edited by Foxit Reader Copyright(C) by Foxit Software Company,2005-2008 For Evaluation Only.
D fi j gridové Definuje id é služby, l žb žádné žád é ttechnické h i ké d detailní t il í specifikace ifik
OGSI
Gridová G id á služba l žb – webová b á služba, l žb která kt á splňuje lň j množinu specifikací (rozhraní a chování), které definují jak klient komunikuje s touto službou definují, Založena na WSDL
Edited by Foxit Reader Copyright(C) by Foxit Software Company,2005-2008 For Evaluation Only.
OGSI definuje mechanismy pro vytváření, správu a výměnu informací mezi entitami – gridové služby
Webová služba
Umístění – entita aplikačního serveru Rozhraníí webové é služby ž – popsané é WSDL
St t l Stateless
Nepamatuje si stav mezi jednotlivými voláními
Non transient
Klienti se připojují ke stejné instanci
Edited by Foxit Reader Copyright(C) by Foxit Software Company,2005-2008 For Evaluation Only.
Množina vykonatelných operací
Gridová služba
Grid Service Factory
Klient vykonává operace na stejné instanci GS J d instance Jedna i t – většinou ětši využívána ží á jjedním d í kli klientem t Service data elements - popisují stav služby
State info information mation – aktuální akt ální stav sta služby, sl žb výsledky ýsledk operací ope ací Service metadata – info o službe, např. náklady
Edited by Foxit Reader Copyright(C) by Foxit Software Company,2005-2008 For Evaluation Only.
Z d Zodpovědná ěd á za vytváření t ář í a rušení š í objektů bj ktů
GS
Factory: Vytvořit y instanci,, Zrušit instanci
GS – jednoznačná jména
Odlišení různých instancí GSH (Grid Service Handler) – pojmenování, á í URI
GSR (Grid Service Reference)
Popisuje vše potřebné pro vyvolání služby Ve formě WSDL dokumentu
Edited by Foxit Reader Copyright(C) by Foxit Software Company,2005-2008 For Evaluation Only.
http://localhost:8080/ogsa/services/samples/counter/basic/ h //l lh / / / l / /b / CounterFactoryService/hash-31889293-1079702176271
Globus Toolkit 3->4
Grid Service Middleware Implementace základních á í služeb ž založených ž ý na OGSI
Další D lší služby l žb – jazyk j k C (pouze ( na Unixech) U i h) GRAM (Globus Resource Allocation Manager) GridFTP G idFTP (File (Fil Transfer T f Protocol, P t l similar i il to t FTP) MDS3 (Monitoring and Discovery Service) GSI GS (Grid (G id Security S i Infrastructure) f )
Edited by Foxit Reader Copyright(C) by Foxit Software Company,2005-2008 For Evaluation Only.
Java
GridFTP (z http://www-unix.mcs.anl.gov/~liming/primer/)
A high-performance, hi h f secure d data t ttransfer f service optimized for high-bandwidth wide-area networks
Basic Transfer One control channel, several parallel data channels
FTP with extensions Uses basic Grid security (control and data channels) Multiple data channels for parallel transfers Partial file transfers Third-party (direct server-to-server) transfers
Third-party Transfer
Control channels to each server, several parallel data channels between servers
OGF recommendation GFD.20
GlobusWORLD 2006
Globus Primer
39
WSRF (Web Service Resource Framework)
Edited by Foxit Reader Copyright(C) by Foxit Software Company,2005-2008 For Evaluation Only.
WSRF
jak vytvořit z bezestavových webových služeb služby stavové
OGSI – řešeno přidání SDE ke každé gridové g ido é službě sl žbě WSRF – specifikuje resource, které jsou od služby odděleny a obsahují j info dříve uložené v SDE každý resource – identifikován klíčem
Edited by Foxit Reader Copyright(C) by Foxit Software Company,2005-2008 For Evaluation Only.
společný standard pro webové a gridové služby využívá ží á middleware Globus Toolkit 4
WSRF
klient se nepřipojuje ke specifické službě, ale k obecné službě s předem daným klíčem zdroje v GT4 se pomocí factory nevytvářejí instance služeb, ale pouze instance zdrojů (resource) instance služby – vytvořena při startu kontejneru a dále již pracuje se zdroji každý zdroj – unikátní klíč EPR (endpointReference)
dvojice služba - klíč
Implementace služby v GT4
SDE
Více SDE
Více SDE
Volání služby - vytvoření
ogsi-create-service http://127 0 0 1:8080/ogsa/services/progtutorial/core/first/Math http://127.0.0.1:8080/ogsa/services/progtutorial/core/first/Math FactoryService
Service successfully created: Handle: http://127.0.0.1:8080/ogsa/services/progtutorial/core/first/Math p // / g / /p g / / / FactoryService/hash-24981262-1078167170769 Termination Time: infinity
Volání služby - klient
java -classpath ./build/classes/:$CLASSPATH \ org globus progtutorial clients MathService Client \ org.globus.progtutorial.clients.MathService.Client http://127.0.0.1:8080/ogsa/services/progtutorial/core/first/Math FactoryService/hash-24981262-1078167170769 5
Added 5 Current value: 5
Zrušení instance
ogsi-destroy-service http://127 0 0 1:8080/ogsa/services/progtutorial/core/first/Math http://127.0.0.1:8080/ogsa/services/progtutorial/core/first/Math FactoryService/hash-24981262-1078167170769
EGEE grid
Edited by Foxit Reader Copyright(C) by Foxit Software Company,2005-2008 For Evaluation Only.
Funkce prvků je podobná u všech gridů P j Pojmenování á í specifické ifi ké pro EGEE Cílem vývoj a integrace gridového prostředí > 70 0 institucíí z Evropy, Rusko, k USA S
EGEE Grid
The first EGEE infrastructure - Largest functioning Grid of the world: more than 100 sites, sites over 10,000 10 000 CPUs CPUs, 4 PB 5,000 jobs simultaneously
EGEE komponenty
Resource Broker (RB) Compute Element (CE) Working Node (WN) Storage g Element (SE) ( ) User Interface (UI) R li Catalog Replica C t l (RC) Replica p Location Server (RLS) ( )
Students Terminals enter Grid
enter Grid enter Grid
enter Grid
CE SE
UI UI - PKI X.509 certificate keys - JDL files
RB GILDA RLS
UI – User Interface
připojení klienta ke gridovému systému vytvořit novou úlohu (jdl) monitorování á í stavu úlohy ú přístup k uživatelským datům
CE – computing element
přijme úlohu pro danou množinu homogenních uzlů
1 PC, PC cluster, l t ...
detailní informace o výkonu a instalovaném sw l kál í dávkový lokální dá k ý systém té
PBS, LSF, NQE, Condor
SE – Storage Element
datové úložiště vzdálený á ý přístup ří k datům ů repliky, přístup k nejbližší replice v gridu
každý soubor
registrovaný vlastní identifikace v gridu identifikace nezávislá na jménu a lokaci
RC, RLS
Informace o replikách souborů RC (Replica Catalog) RLS (Replica Location Server)
WN – Worker Node
provádí vlastní výpočet přístup ří k aplikačnímu č í sw
lokálně instalovaný dostupný přes sdílení
není k nim přímý přístup množina WNs je reprezentovaná CE
RB – Resource Broker
hlavní komponenta plánovač á č řídí distribuci zdrojů mezi výpočetní úlohy
jaké ké CE b bude d pro danou d úlohu úl h použito ž pošle zvolenému CE tzv. InputSandBox (JDL,..)
rozhoduje dle informací z IS (Information Service)
Životní cyklus úlohy v gridu
Submitted
Wait
úl h je úloha j vytvořena t ř uživatelem, ži t l popsána á .jdl jdl souborem b RB najde vhodný CE může také najít nejbližší repliku požadovaných dat
Ready
RB připraví úlohu k běhu Přidá potřebné administrativní informace Vše pošle CE
Životní cyklus úlohy v gridu
Scheduled
CE přijme řij úlohu úl h a předá ř dá ji lokálnímu l kál í dávkovému dá k é systému té
Running
úloha běží na dostupném WN uživatelská data zkopírována p RB -> WN může využívat data ze SE nově vytvářená data – na SE a registrována v RLS
Životní cyklus úlohy v gridu
Done
úloha úl h je j hotova h t výstup – OutputSandBox (stdout,stderr) kopírován zpět na resource broker
Aborted
úloha je zrušena uživatelem
Possible jjob states
JDL – Job Description Language
popis požadavků a závislostí úlohy textovýý soubor .jdl vyžadované a volitelné parametry
JDL - parametry
Type – “Job” JobType
E Executable t bl
aktuální VO
NodeNumber
co se bude vykonávat
VirtualOrganization
Normal, Interactive, MPICH
počet vyžadovaných uzlů (MPICH)
Requirements – další požadavky
JDL - parametry
Arguments StdInput, StdOutput, StdError
Environment E i t InputSandBox
definice I/O streamů, jména souborů
které kte é so soubory bo p pro o běh potřebujeme, potřeb jeme přenesen přeneseny do CE(WN) spolu s programem
OutputSandBox
co bude přeneseno z CE do UI po skončení úlohy
JDL – příklad – myjob.sh Executable StdOutput StdError InputSandbox OutputSandbox RetryCount Arguments
= = = = = = =
“/bin/bash”; “myjob.out”; “myjob.err”; {“myjob.sh”}; {“myjob.err”, “myjob.out”} 1; “myjob.sh 1 2 3”;
JDL příklad
úloha – spuštění myjob.sh výstup ý a chybovýý výstup ý – myjob.out, myjob.err skript bude poslán na cílový uzel jako součást InputSandBoxu
MPI Job [JobType = “MPICH"; Executable E ec table = "cpi" "cpi"; NodeNumber = 2; StdOutput = "test.out"; StdError = "test.err"; InputSandbox = {"cpi"}; OutputSandbox = {"test {"test.out","test.err"}; out" "test err"};
] The NodeNumber entry is the number of threads of MPI job The more processors you require the longer your job will q waiting g for free resources stayy in the queue
Genius Portal, GILDA
Genius Portal standardníí grafickýý UI pro přístup ří k EGEE gridu Gilda virtuální laboratoře pro předvedení vlastností gridu Gilda Testbed
RB, II, RLS, CE, SE INFN G Grid id Middl Middleware (kompatibilní (k tibil í s LCG)
Gilda Grid Demonstrator
https://gilda.ct.infn.it/grid-demo.html editace / prohlížení souboru VO Services – Job Services – Job Submission 09 Simple Hello World helloworld.jdl
Middleware
Přístup aplikací ke kapacitám gridu Management prostředků gridu
zdrojj gridu g
výpadek saturace
Použitá literatura, odkazy
http://www.ics.muni.cz/zpravodaj/articles/343.html
http://www.egee.hu/grid05/
MetaCentrum
http://meta.cesnet.cz EGEE MediGrid
CESNET, FN Motol, MN Ústí nad Labem
CoreGrid
Struktura Ukázky informací z meta.cesnet.cz