MTA Cloud – Use cases MTA Cloud workshop
Hernáth Szabolcs MTA WIGNER FK
IT felhasználás dimenziói • • • • • • •
Felhasználók száma / jellege Kapacitás mérete / jellege Számítási feladat / szoftverkörnyezet Adatok mérete / jellege Elérés / rendelkezésre állás IT támogatás feladatai / költsége (Fenntarthatóság)
Speciális eset: Big Data • O(10)+ PB strukturálatlan adat • MapReduce programozási feladatok: sok adat skálázható, elosztott transzformálása és kiértékelése
• Hadoop környezet: kapacitás + szolgáltatások + fejlesztőeszközök
1. Eset: „A magányos farkas(ok)” Felhasználók Kapacitás Alkalmazás
Adatok Elérhetőség IT támogatás
1-5 egyéni felhasználó Néhány PC, változó kihasználtsággal Néhány alkalmazás, adott környezet O(1-10) TB Ad hoc adatkezelés Változó jellegű, helyi hozzáférés Nincs, vagy minimális (változó kockázatok)
2. Eset: „Mókus örs” Felhasználók Kapacitás Alkalmazás Adatok
10-15 fő kis csoport Kis klaszter: O(10) node, közepes kihasználtsággal Több alkalmazás, homogén környezet, egyszerű szolgáltatások O(10-100) TB, homogén jelleg, Egyszerű adatkezelési szolgáltatások
Elérhetőség
Közepes rendelkezésre állás, gyors hozzáférés távoli elérhetőség
IT támogatás
Állandó rendszergazda feladatok, ad hoc jogosultságkezelés, jelentős biztonsági kockázatok
3. Eset: „A cég” Felhasználók
Kapacitás Alkalmazás Adatok Elérhetőség IT támogatás
O(100) felhasználó, több nagy és kis csoport szervezetben
O(100) node klaszter(ek), magas kihasználtság Sok alkalmazás, változó és inhomogén környezet, sok komplex szolgáltatás O(100-1000) TB, változó és komplex adatkezelési szolgáltatások Magas SLA, távoli elérhetőség, állandó adminisztráció és „sorbanállás” Komolyan szervezett IT csapat, komplex jogosultságkezelés, helpdesk
4. Eset: „A Birodalom” Felhasználók
O(10000) felhasználó, komplex szerveződésű közösségek
Kapacitás
O(100000) node elosztott infrastruktúrák (EGI grid, desktopgrid)
Alkalmazás
O(1000) alkalmazás, sok komplex, változó, inhomogén környezet, sok komplex szolgáltatás
Adatok
O(10-100) PB, dedikált atakezelési infrastruktúra, sok komplex szolgáltatás
Elérhetőség
Magas SLA, állandó távoli elérés, komplex adminisztráció, „sorbanállás”
IT támogatás
Több szervezet összehangolt munkája, komplex szolgáltatásrendszerek, kiemelt kockázatok
Skálázhatóság Ha egymillió kínai egy év alatt építi fel a Nagy Falat, akkor 365 millió kínai egy nap alatt teszi ugyanezt? A fenti modellek: • eltérő problémákkal küzdenek • korlátozottan fejlődőképesek • nehezen átjárhatók A hagyományos modellek rosszul skálázhatók. A felhő rugalmasan skálázható!
Miért jobb a cloud? Hagyományos eset
Probléma
Cloud megoldás
Alacsony kapacitás, változó rendelkezésre állás és kihasználtság
On-demand kapacitás + magas SLA
Közepes kapacitás, rendelkezésre állás és kihasználtság, járulékos feladatok
Skálázható kapacitás + magas SLA, járulékos feladatok automatizálása
Sok járulékos feladat, adminisztráció, sorbanállás
Járulékos ás adminisztratív feladatok automatizálása, ütemezhető kapacitás
Rengeteg járulékos feladat, Nagy elosztott rendszer bonyolult hozzáférés, sorbanállás
Járulékos ás adminisztratív feladatok automatizálása, egyszerű hozzáférés, ütemezhető kapacitás
Néhány PC
Kis autonóm klaszter
Nagy megosztott klaszter
Cloud felhasználói szerepkörök • • • •
Nem informatikus kutató (biológus, kémikus, stb.) Kutatókat támogató informatikus Rendszergazda Mit szeretne kapni egy nem informatikus kutató? 1. Általános SaaS szolgáltatásokat (pl. biológusok és kémikusok Autodock szolgáltatást) 2. Speciális, testre szabott SaaS szolgáltatást • Együttműködés informatikussal a szolgáltatás kifejlesztése érdekében • Saját maga fejleszti a szolgáltatást, ha van informatikai képzettsége
Cloud felhasználói szerepkörök • Intézeti informatikus: 1. Általános és speciális SaaS szolgáltatásokat fejleszt a nem informatikus kutatók számára 2. A fejlesztéshez PaaS platformot használ (pl. WSPGRADE/gUSE) 3. Annak érdekében, hogy a PaaS platform hatékonyan működjön, a felhőben felépíti a szükséges futtató infrastruktúrát (pl. klasztert). Ilyenkor az MTA Cloud IaaS szolgáltatását használja
Konkrét példa • Tfh egy biológus kutatócsoportnak több százezer molekulán kell elvégeznie a molekula dokkolási kísérletet. Több megoldási lehetőség van: 1. Hagyományos és korszerűtlen megoldás: PC beszerzés → Fejlesztés → Futtatás Időigény: • Több hetes PC beszerzés (helyi rendszergazda) • Több hónapos alkalmazásfejlesztés (informatikus) • Több hónapos futtatás PC-n (biológus)
Konkrét példa 2. Korszerű, ideális megoldás: cloud AutoDock SaaS szolgáltatás a dokkolási feladatokra – A kutató önállóan, informatikus segítsége nélkül dolgozhat – Időigény: 1. Pár perc hozzáférési idő 2. Zéró fejlesztési idő 3. Néhány napos futásidő (a cloud SaaS-t biztosító IaaS kapacitása skálázható)
Konkrét példa 3. (köztes) Megoldási lehetőség: nincs Autodock SaaS szolgáltatás, de van PaaS fejlesztő rendszer – Az informatikus fejleszti a dokkoló SaaS szolgáltatást – Ehhez felhasználja a PaaS fejlesztő rendszert (pl. WSPGRADE/gUSE). • Időigény: 1. Pár perces hozzáférési idő (informatikus) - IaaS 2. Több hetes fejlesztési idő (informatikus) - PaaS 3. Több napos futásidő a felhőben (biológus) - SaaS – Az így kifejlesztett SaaS szolgáltatást más MTA kutatók is használhatják
Melyik tevékenységeket hogyan támogatja a felhő? • Beszerzés, azaz a kívánt infrastruktúra felállítása (IaaS): – Virtuális gépek és lemezképek tárolása – Virtualis gép indítása (ld. demo)
• Alkalmazás fejlesztés (PaaS): – Pl. WS-PGRADE fejlesztő rendszer
• SaaS használat: – Pl. WS-PGRADE end-user módú konfigurálása
Q&A
Köszönöm a figyelmet! http://cloud.mta.hu