Enabling Grids for E E-sciencE sciencE
Bioinformatikai és orvosbiológiai Grid alkalmazások az Egyesült gy Királyságban y g
M. Kozlovszky MTA SZTAKI
[email protected]
www eu egee org www.eu-egee.org EGEE-II INFSO-RI-031688
EGEE and gLite are registered trademarks
NGS Grid infrastruktúra Enabling Grids for E-sciencE
National Grid Service (NGS) UK akadémiai kutatói g grid hálózat 4 főbb site • CCLRC Rutherford Appleton Laboratory • University of Manchester • University of Oxford • White Rose Grid (University of Leeds) További site-ok • University U i it off Bristol Bi t l • Cardiff University • Lancaster University Uni ersit • University of Westminster • University of Glasgow (ScotGrid) EGEE-II INFSO-RI-031688
2008. 11.19., Szeged
National Grid Service (NGS) Köztesréteg
Enabling Grids E-sciencE Enabling Grids forforE-sciencE
D t Data Management
DataSets info
User requests
I f Information ti Service
Site X
Indexin ng
queries
Author. &Authen &Authen.
Publication
Workload Management
Sit R Sites Resources
Computing Resources
Storage Resources
Dynamic evolution
L Logging, i reall time ti monitoring it i 3 EGEE-II EGEE-IIINFSO-RI-031688 INFSO-RI-031688
3
W-Grass Enabling Grids for E-sciencE
Westminster Grid Application Support Service University of Westminster, London, UK http // grass min ac k http://wgrass.wmin.ac.uk • Célja a nagy erőforrásigényű alkalmazások gridesítésének támogatása • Felhasználói igények és technológiai megoldások közelítése • Alkalmazások analízise • Tudásátadás, oktatás • Használt Grid infrastruktúrák: – Szerviz Grid-ek
Enabling Grids for e-Science (EGEE) N ti National lG Grid id S Service i (NGS) Open Science Grid (OSG) TeraGrid (TG)
– BOINC alapú l ú Desktop D kt Gridek G id k
•
NGS Portal (P-GRADE Portal alapú)
https://grid2-portal.cpc.wmin.ac.uk:8080/gridsphere/gridsphere
EGEE-II INFSO-RI-031688
2008. 11.19., Szeged
Referencia alkalmazások (szerviz grid-ek) Enabling Grids for E-sciencE
• • • • • • • •
Video Rendering – elosztott renderelő alkalmazás - Centre for Parallel p g, UoW Computing, In silico modelling Autodock-al - Department of Molecular & Applied Biosciences, UoW Traffic – Grides e-learning portal transport és logisztika oktatáshoz – „Logistics and Supply Chain Management” MSc tárgyhoz, UoW DASP - Digital Alias-free Signal Processing, optimális nemhomogén mintavételezési frekvencia számoláshoz számoláshoz- Centre for System Analysis Research Group, UoW CHARMM – Makromolekula szimulációk (energia minimalizáció & molekula dinamika) - Johns Hopkins University Patient readmission analysis with R - Health and Social Care Modelling Group, UoW GAMESS-UK - ab initio molekula elektromos struktúra elemző alkalmazás MultiBayes y - DNS szekvencia analizáló p program, g , School of Animal and Microbial Sciences, University of Reading
EGEE-II INFSO-RI-031688
2008. 11.19., Szeged
Referencia alkalmazások (DG) Enabling Grids for E-sciencE
• Protein Molekula Szimulátor - Department of Molecular & Applied pp Biosciences,, UoW • 3D Video Rendering – elosztott videó renderelő alkalmazás - Centre for Parallel Computing, UoW • Patient readmission analysis with R - DG verzió
EGEE-II INFSO-RI-031688
2008. 11.19., Szeged
Autodock alkalmazás Enabling Grids for E-sciencE
• Autodock alkalmazás – Dokkolási eseményekhez használható szoftver szimulációs eszközöket tartalmaz (in silico) – Kis molekulák, gyógyszer alkotóelemek receptorokhoz, vagy ismert 3D sszerkezethez 3 e e e e történő ö é ő kapcsolódásához apcso ódásá o – Felhasználási területek
Röntgen kristallográfia St ktú alapú Struktúra l ú gyógyszertervezés ó t é Kémiai mechanizmusok vizsgálata Fehérje-fehérje dokkolás …
– Szabad szoftver – Erősen számolásigényes feladat Ligand torzulás, dokkolási energia paraméterek, stb. 1 dokkoláshoz kb.: 100 iteráció (~5 millió ellenőrzéssel) Æ 50 CPU óra Bővebb információ autodock-ról: http://autodock.scripps.edu/ EGEE-II INFSO-RI-031688
2008. 11.19., Szeged
Autodock gridesítés Enabling Grids for E-sciencE
• • •
• •
Partner: Department of Molecular & Applied Biosciences at the University of Westminster Felhasznált megoldás – Script-ek, automatikus paraméter vizsgálat megvalósítással A két program gridesítése – AutoGrid futtatás – AutoDock futtatás
Megtakarítás – több ezer autodock szimuláció: hónapokban mérhető T ábbi információ: További i f á ió http://wgrass.wmin.ac.uk/index.php/W-Grass:autodock
EGEE-II INFSO-RI-031688
2008. 11.19., Szeged
Enabling Grids for E-sciencE
•
Charmm
CHARMM (Chemistry at HARvard Macromolecular Mechanics)
• Atom molekula dinamikai ((MD)) szimulátor – – – –
•
Érdekes molekulákhoz használják (fehérjék, aminosavak, stb.) Mozgásegyenletek megoldása a feladat (Newton törvények) Atomi koordinátákkal dolgozik Energia minimalizáció, molekula dinamika
Verziói vannak soros és párhuzamos futtatáshoz különböző számítógép platformokra futtatáshoz,
• Bővebb információ Charm-ról:http://www.charmm.org/ Charm-ról:http://www charmm org/ EGEE-II INFSO-RI-031688
2008. 11.19., Szeged
Charmm működés leírás Enabling Grids for E-sciencE
– Többfázisú egymásra épülő fázisok Felfűtés, egyenlősítés, futtatási fázis, analízis fázis
– A kapott adatokat később a Charmm analízis szoftvereivel lehet tovább elemezni – Nagy N molekulastruktúrák l k l t ktú ák az é érdekesek d k k A szimuláció néhány ns időtartományt kezel (max. ms tartomány) y van szükség g Általában ms feletti időtartományokra
EGEE-II INFSO-RI-031688
2008. 11.19., Szeged
Charmm alkalmazás gridesítése Enabling Grids for E-sciencE
• Partner: Johns Hopkins University • Téma: Molecular Dynamics Study of Water Penetration in Staphylococcal Nuclease • Gridesítés megoldása g – P-GRADE Portal felületen – Nagy erőforrásigény multi-grid használat (egyidejűleg) • National Grid Service (NGS) • TeraGrid (TG) • Open Science Grid (OSG).
• Megoldás g – Szekvenciális feladatok, munkafolyamat gráfba rendezve, többszörös párhuzamos futtatás EGEE-II INFSO-RI-031688
2008. 11.19., Szeged
R programcsomag Enabling Grids for E-sciencE
R = nyelv és programcsomag • Statisztikai feladatok (lineáris, nem lineáris modellezés,, idősoranalízis,, klaszterezés,, stb.), ), grafikai g feladatok • GNU projekt j • Hasonlít az S nyelvhez • Bővebb információ: – http://www.r-project.org/
EGEE-II INFSO-RI-031688
2008. 11.19., Szeged
Enabling Grids for E-sciencE
• • • • • • • • •
R környezet gridesítése
Népegészségügyi téma Szerviz és Desktop Grid verzió Partner: Health and Social Care Modelling Group Téma: – Patient P ti t readmission d i i analysis l i with ith R – Szerviz S i G Grid id / Desktop D kt Grid G id Input: Hospital Episode Statistics adatbázis (HES) Adatmennyiség: 7 év 04/1997 - 03/2004 (~80 ( 80 millió esemény) Statisztikai elemzése az adatbázisnak A pontossághoz: nx1000 iteráció Párhuzamos működés
EGEE-II INFSO-RI-031688
2008. 11.19., Szeged
Információk Enabling Grids for E-sciencE
•
További információk: http://wgrass.wmin.ac.uk/index.php/W-Grass:autodock http://wgrass.wmin.ac.uk/index.php/W Grass:autodock http://wgrass.wmin.ac.uk/index.php/W-Grass:charmm http://wgrass.wmin.ac.uk/index.php/W-Grass:r http://wgrass wmin ac uk/index php/Desktop Grid:Autodock http://wgrass.wmin.ac.uk/index.php/Desktop_Grid:Autodock http://wgrass.wmin.ac.uk/index.php/Desktop_Grid:r
– P-GRADE Portal honlap
http://portal.p-grade.hu htt // t l d h – LPDS honlap p p http://www.lpds.sztaki.hu
Köszönöm a figyelmet! Kérdések? EGEE-II INFSO-RI-031688
2008. 11.19., Szeged
Plusz slide-ok: MultiBayes Enabling Grids for E-sciencE
• Feladat: Phylogenetikai fa készítés • DNS szekvenciákból Monte Carlo Markov láncokat készít fajokra lebontva • Soros változata a p programnak: g binárist futtat,, dinamikus linkelést használ a program • Input file-ban megkapja g j a paramétereket • 3 output file-t készít az eredményekből (nagy file-ok) • A szolgáltatás g GEMLCA Grid szolgáltatásként g érhető el (tehát nem binárist használ)
EGEE-II INFSO-RI-031688
2008. 11.19., Szeged