JAARVERSLAG 2014 EEN NATIONALE ICT-INFRASTRUCTUUR VOOR WETENSCHAP EN BEDRIJFSLEVEN
INHOUDSOPGAVE WAT SURFSARA IN 2014 REALISEERDE 1 Samenwerken aan een sterke e-infrastructuur (inleiding) 2 De gebruiker voorblijven met High Performance Computing
3 6
Case 1 — Dissociatie van methaan als bron van waterstof
10
Case 2 — Hoe bereken je de kans op extreme zeespiegelstijging?
12
Case 3 — Computermodellen tonen vorming van nieuwe bloedvaten
14
3 Grootschalige data storage: veilig, vindbaar en toegankelijk
16
Case 4 — Meer inzicht in aardbevingen met behulp van seismische data
19
4 Kennis in beeld: visualisatie en onderzoek
21
Case 5 — Visualisatie als brug bij genetisch onderzoek
24
5 De speld in de hooiberg van big data
26
Case 6 — NewsReader: een miljoen artikelen per dag
29
Case 7 — Puzzelen met plantgenomen
31
6 Samenwerking verlegt grenzen
33
Case 8 — Onderzoek naar eiwitten met Grid-computing
36
7 Topsectoren: laagdrempelige toegang tot HPC voor bedrijven
38
Case 9 — Berekening van sneeuwverplaatsing en –ophoping voor efficiëntere dakconstructies 40 Case 10 — FlexMers werkt samen met SURFsara in ICT doorbraakproject
42
8 Naar een duurzame hogeronderwijssector
44
1
SAMENWERKEN AAN EEN STERKE E-INFRASTRUCTUUR
De Nederlandse e-infrastructuur voor hoger onderwijs en onderzoek behoort tot de wereldtop. Dat draagt ertoe bij dat Nederland hoog op de ranglijst van kenniseconomieën staat. SURFsara biedt onderzoekers laagdrempelige toegang tot hoogwaardige infrastructuren voor High Performance Computing, data analyse en storage. Belangrijke mijlpalen zijn de upgrade van de nationale supercomputer Cartesius en de start van de bouw van een nieuw, HPC datacenter voor de onderzoeks- en onderwijsgemeenschap. >
Ondertfjhskjfhhdskfhdjfskfhdjhfskf
3
SURFsara Jaarverslag 2014
Meerjarenplan SURF
Deze zogenoemde accelerators combineren de rekenkracht
Sinds 2013 maakt SURFsara deel uit van de SURF-organisatie.
van grafische kaarten (GPU’s) met die van CPU’s. Ten tweede
Daarbinnen werkt SURFsara nauw samen met de andere
is het systeem in november uitgebreid met de laatste
werkmaatschappijen binnen SURF: SURFmarket, SURFnet
generatie processors van Intel.
en (tot 1 januari 2015) SURFshare. In 2014 is het SURF Meerjarenplan 2015 – 2018 verschenen. Dit meerjarenplan
Door deze aanpassingen is Cartesius in november 2014 gestegen
onderscheidt een zestal innovatiethema’s, die nader invulling
naar de 45ste plaats in de TOP500. Dat is een redelijk resultaat
krijgen in een tiental programma’s. SURFsara fungeert als
binnen Europa, maar daarbij moet aangetekend worden dat veel
trekker van vier van deze programma’s en participeert als
van de omringende landen het beter doen. Dat geldt niet alleen
deelnemer in overige programma’s.
voor grotere landen als Duitsland, Frankrijk en Engeland, maar bijvoorbeeld ook voor Finland (37ste plaats) en Zwitserland
De samenwerking heeft in 2014 vele concrete resultaten
(6de plaats). Bovendien neemt de behoefte van de gebruikers
opgeleverd. Eén daarvan is Support4Research, een SURF-
ook sterk toe, waardoor sommige gebruikers uitwijken naar
breed programma dat hoogwaardige ICT-ondersteuning
andere landen. Daarom blijft het ook in de komende jaren
dichter bij de onderzoekers brengt. Met Support4Research
van groot belang dat Cartesius on demand meegroeit met
opent SURF een kanaal dat zich richt op de onderzoeks-
de eisen en wensen van de gebruikers.
ondersteuners bij de universiteiten. Het programma zorgt er SURF Meerjarenplan 2015 – 2018
voor dat belanghebbenden bij hogescholen en universiteiten
Naar een federatief datacenter
bij één loket terecht kunnen voor alle SURF-diensten.
In 2014 is gestart met de bouw van het nieuwe nationale HPCdatacenter. Begin 2014 hebben SURFsara en Telecity-Group
Een ander gezamenlijk initiatief is SURFdrive, de persoonlijke
hiervoor een overeenkomst getekend. Telecity ontwikkelt een
cloudopslagdienst die SURFsara samen met SURFnet aan-
datacenter op Amsterdam Science Park: hierin krijgt SURFsara
biedt aan alle SURF instellingen, niet alleen aan universiteiten
de beschikking over een nieuwe generatie state-of-the-art,
en hogescholen. Op 1 mei is deze nieuwe dienst live gegaan.
flexibel, kosteneffectief en duurzaam datacenter. De oplevering
SURFdrive is een veilig alternatief voor publieke clouddiensten
wordt midden 2016 verwacht.
zoals Dropbox, OneDrive, Google Cloud en iCloud. Eind 2014 waren zo’n veertig instellingen gekoppeld, waaronder vrijwel
Het nieuwe datacenter past uitstekend binnen de ambities
alle universiteiten en een aantal hogescholen.
van SURF. Het datacenter zal instrumenteel zijn bij het opzetten van communityclouds en kan uitgroeien tot een federatief
4
SURFsara Jaarverslag 2014
45ste plaats voor Cartesius
datacenter binnen de onderzoeks- en onderwijsgemeenschap.
De nationale supercomputer Cartesius is in 2014 aanzienlijk
SURFsara streeft naar een federatie van kleine en grote data-
sneller geworden. Allereerst is Cartesius begin 2014 voorzien
centers; het nieuwe datacenter op het Amsterdam Science
van GPGPU’s (General Purpose Graphics Processing Units).
Park zou daarin een centrale rol kunnen vervullen.
HPC Cloud zeer succesvol
Big Data Revolutie
Cartesius mag dan het vlaggenschip zijn van de HPC-dienst-
Voor de analyse van big data kunnen onderzoekers onder
verlening, de populairste dienst is HPC Cloud. HPC Cloud biedt
meer terecht op het Hadoop-cluster bij SURFsara. Ook dit
onderzoekers een laagdrempelige toegang tot hoogwaardige
cluster wordt voortdurend uitgebreid en aangepast om
rekenkracht. Met deze dienst kan een onderzoeker zijn pro-
nieuwe toepassingen mogelijk te maken.
gramma eenvoudig kopiëren naar de HPC Cloud en het dan tien, twintig of zelfs honderd keer opschalen. De combinatie
In 2014 verscheen verder de publicatie ‘De Revolutie van
van flexibiliteit en schaalbaarheid maakt HPC Cloud een
Big Data: een verkenning van de ingrijpende gevolgen’ van
populaire dienst.
Anwar Osseyran, directeur van SURFsara, in samenwerking met internetondernemer Willem Vemeend. De auteurs zien
LOFAR grootste dataleverancier
vooral grote mogelijkheden in de medische sector, waar
Ook in 2014 is het volume aan opgeslagen onderzoeksdata
big data-analyses sneller en beter inzicht kunnen opleveren
verder toegenomen van 12 petabyte (begin 2014) tot 21,7
in de effecten van geneeskundige behandelingen en de
petabyte. Een opvallende ontwikkeling is de sterke groei van
ontwikkeling van medicijnen.
LOFAR. In 2014 is LOFAR de Large Hadron Collider (de deel-
De Revolutie van
ken van de overvloed aan der computerwetenschap, maar ook binnen menig rheden ontdekken het ns heen. Op internet is een maar deze is verspreid open maar ook verborgen. Big Data de ware trends te ciaal belang daarbij is ook kbare interne- en externe t en winst. Wie daarin toekomst.
BIG DATA EEN VERKENNING VAN DE INGRIJPENDE GEVOLGEN
nteerd worden met nieuwe pro-actief op deze ontwikars van morgen.
g Data. Daarbij gaan we op schaduwkanten.
tjesversneller van CERN in Genève) als grootste dataleverancier
Innovatie en ontwikkeling
voorbij gestreefd. Bij de opslag van onderzoeksdata wordt
SURFsara investeert veel in research & development, in de
vooral gebruik gemaakt van het Grid, dat meegroeit met de
wetenschap dat innovatie van cruciaal belang is voor een
toegenomen eisen en wensen van de gebruikers.
hoogwaardige e-infrastructuur die kan concurreren met de
De data-explosie en de impact hiervan op onderwijs en
omringende landen. Die innovatie omvat o.a. de toepassing
onderzoek is enorm. Overheden en instellingen stellen steeds
van de nieuwste hard- en software, zoals accelerators in
hogere eisen op het gebied van het verzamelen, opslaan, ana-
Cartesius en het bijbehorende programmeermodel CUDA.
lyseren, bewaren, veilig toegankelijk maken en documenteren
Voor dit laatste is SURFsara erkend door NVIDIA als CUDA
van onderzoeksdata (data curation). SURFsara werkt samen
research center.
met andere partijen aan het ontwikkelen van modellen voor
ISBN 9789082199307
ANWAR OSSEYRAN & WILLEM VERMEEND
duurzaam databeheer. Eén van de stappen is de ontwikkeling
Dat de buitenwereld ook oog heeft voor de innovatieve rol
van een zogenoemde Trusted Digital Repository.
van SURFsara, bewijst de benoeming van SURFsara-directeur Anwar Osseyran tot hoogleraar Business Analytics and Com-
Een belangrijke ontwikkeling in dit verband is de aansluiting
puter Science aan de Faculteit Economie en Bedrijfskunde van
van SURFsara bij Research Data Netherlands (RDNL), een
de Universiteit van Amsterdam. Osseyran doet onderzoek naar
Steeds meer bedrijven en overheden ontdekken
samenwerkingsverband dat zich vooral richt op het duurzaam
de wisselwerking tussen technologie (big data en computer
het grote potentieel van de schat aan gegevens
opslaan en delen van onderzoeksdata. RDNL wil zorgen
science) en de kenniseconomie. Twee belangrijke aandachts-
voor één aanspreekpunt voor de gebruikers van deze data.
gebieden daarbinnen zijn Smart energy systems en eHealth.
9 789082 199307
om ons heen 5
SURFsara Jaarverslag 2014
2
DE GEBRUIKER VOORBLIJVEN MET HIGH PERFORMANCE COMPUTING
6
SURFsara Jaarverslag 2014
Onderzoek met behulp van High Performance Computing neemt een steeds grotere vlucht. In een groot aantal onderzoeksvelden is reken- en data-intensief onderzoek onontbeerlijk om een doorbraak te forceren. De uitdaging van SURFsara is om de toenemende eisen vanuit de Onderzoeksgemeenschap steeds voor te blijven. Daarbij spelen grafische processors een steeds belangrijkere rol. >
Vlaggenschip
en Pisa gingen SURFsara hierin al voor. Ten tweede is
Het vlaggenschip van de dienstverlening van SURFsara
SURFsara in 2014 ook een NVIDIA CUDA Research Center
is de nationale supercomputer Cartesius. In 2014 is het
(CRC) geworden. CUDA is een programmeermodel waarmee
systeem geupdatet door twee soorten uitbreidingen.
de accelerators in Cartesius geprogrameerd worden.
Allereerst is Cartesius begin 2014 voorzien van GPGPU’s
NVIDIA wil graag dat dit model in brede kring geadopteerd
(General Purpose Graphics Processing Units). Deze zoge-
wordt. De samenwerking zorgt ervoor dat SURFsara in
noemde accelerators combineren de rekenkracht van
een vroeg stadium beschikking krijgt over nieuwe systemen,
grafische kaarten (GPU’s) met die van CPU’s. Ten tweede
bijvoorbeeld voor testdoeleinden.
is het systeem in november uitgebreid met de laatste generatie processors van Intel. Het resultaat mag er zijn: Cartesius is in november 2014 gestegen naar de
45ste
plaats in de TOP500.
Workshops en gebruikersdagen Voor gebruikers is de toegang tot de nieuwe systemen niet altijd vanzelfsprekend; het vereist de nodige technische kennis om gebruik te maken van bijvoorbeeld Cartesius,
Het uitgangspunt van Cartesius is dat de groei gelijke
en dat geldt zeker voor de accelerators. SURFsara steekt
tred houdt met de vraag van de gebruikers. De uitbreiding
dan ook veel tijd in de ontsluiting van de infrastructuur,
kwam dan ook op een goed moment, want sinds de zomer
bijvoorbeeld met cursussen en gebruikersdagen. Het gaat
van 2014 kwamen de grenzen van het systeem in zicht.
in die cursussen vooral om het optimaliseren en parallelliseren
SURFsara werkt met een economische capaciteit die 80%
van software. Speciaal voor Lisa is een Xeon Phi-workshop
van de theoretische capaciteit bedraagt; op die manier is
gehouden in april.
ruimte voor onderhoud van het systeem en scheduling van de jobs. In de zomer van 2014 werd soms al een bezetting
On demand uitbreidingen
van 90% bereikt. Het systeem wordt intensief gebruikt en
Ook in 2015-16 zijn uitbreidingen voorzien voor Cartesius.
dat geldt ook voor de accelerators. In eerste instantie
De eerste hardware dateert uit 2013, een deel van deze
werden deze vooral gebruikt voor astronomisch onderzoek,
hardware moet in de komende periode worden vervangen.
maar ze blijken ook winst op te leveren in andere vakgebie-
Bovendien is de economische levensduur van de accelerators
den, bijvoorbeeld bij klimaatsimulaties.
korter dan van normale processors. Dit heeft onder meer te maken met de snelle ontwikkelingen op dit gebied.
Centers of Competence
De huidige plannen zijn gericht op vervanging van de
Ook het nationale rekencluster Lisa heeft in 2014 fors aan
nationale supercomputer in 2017.
rekenkracht gewonnen. Daarnaast is Lisa in 2014 uitgebreid met Intel Xeon Phi-processors, die geleverd werden door Dell. Het is de bedoeling dat SURFsara gaat fungeren als een Dell Center of Competence voor Intel Xeon Phi. Cambridge 7
SURFsara Jaarverslag 2014
VERDELING VERBRUIK CARTESIUS PER WETENSCHAPSGEBIED 2014
VERDELING VERBRUIK LISA OVER PARTNERS 2014
Computational Chemistry 41%
UvA verbruik 26%
Earth and Climate Science 21%
VU verbruik 42%
Computational Fluid Dynamics 16%
SURF verbruik 32%
Life Sciences – Bioinformatics 8%
Derden totaal 0%
Astronomy and Cosmology 8% Condensed Matter Physics 5% Life Sciences – Computational Biology 1% Other 0%
VERDELING VERBRUIK CARTESIUS PER INSTITUUT 2014
VERDELING LISA VERBRUIK LANDELIJK OVER INSTITUTEN 2014
RUG 20%
ASTRON 5%
FOM-AMOLF 6%
EU 8%
UU 18%
VU 2%
FOM-DIFFER 4%
UU 7%
UL 16%
LW 1%
FOM-IMM 7%
RUG 4%
TT 10%
RU 1%
CWI 4%
TT 3%
TUE 8%
TUD 22%
DECI 7%
RU 15%
UVA 7%
UL 11%
TUD 6%
VU 10%
Cartesius in 2014: •• Ruim 546 duizend jobs op thin of thick nodes, goed voor bijna 84 miljoen SBU. Een thin node is een standaard compute unit. •• Uitbreiding met 66 GPU nodes in juni 2014. Bijna 5 duizend jobs gedraaid, goed voor 3.8 miljoen SBU ofwel bijna 80.000 node uren in een half jaar.
8
SURFsara Jaarverslag 2014
Nieuw datacenter
De verwachting is echter dat participerende landen
Tijdens dit evenement stond de relatie tussen
Een belangrijke ontwikkeling is de komst van het
of gebruikers op termijn wel moeten gaan meebetalen
data-intensief onderzoek en een hoogwaardige ICT-
nieuwe nationale HPC-datacenter. Begin 2014 hebben
aan de kosten die dergelijke systemen met zich mee-
infrastructuur centraal. Een belangrijk aandachtspunt
SURFsara en TelecityGroup hiervoor een overeen-
brengen. Deze discussie wordt op dit moment ge-
hierbij is de duurzame financiële inbedding van deze
komst getekend. Telecity ontwikkelt een datacenter
voerd in de PRACE-council, waar SURFsara-directeur
infrastructuur. Zo zijn in januari 2014 zwaartekracht-
op Amsterdam Science Park: hierin krijgt SURFsara
Anwar Osseyran als Vice Chair nauw bij betrokken is.
voorstellen door NWO gehonoreerd; dit zijn meer-
de beschikking over een nieuwe generatie state-of-
jarige projecten met ongeveer 30 miljoen euro aan
the-art, flexibel, kosteneffectief en duurzaam data-
Horizon 2020
financiering (per project). Deze onderzoeksvoorstellen
center. De bouw is in 2014 gestart, de oplevering
In 2014 is een aantal projectaanvragen voorbereid
veronderstellen wel de beschikbaarheid van een hoog-
wordt midden 2016 verwacht. SURFsara is onder
in het kader van het nieuwe infrastructurele kader
waardige ICT-infrastructuur. Als de middelen voor het
meer scenario’s aan het uitwerken voor de verhuizing
programma van de Europese Unie: Horizon 2020.
beschikbaar stellen, vervanging en uitbreiding van
van Cartesius en de bijbehorende storage.
Een daarvan is gericht op de verbindingen
die infrastructuur onder druk staan, wordt het veel
(zogenoemde interconnect) tussen processors
moeilijker om dit soort voorstellen te ondersteunen.
Europese samenwerking
in omvangrijke HPC-systemen. (InfiniBand is een
SURFsara is nauw betrokken bij een aantal Europese
bekend voorbeeld van een interconnect.) SURFsara
Conferenties
projecten die Nederlandse gebruikers toegang
werkt samen met Bull in een proposal waar de mo-
SURFsara neemt regelmatig deel aan conferenties waar-
kunnen geven tot hoogwaardige HPC-systemen in
gelijkheden van een nieuwe generatie interconnect
op actuele kennis op het gebied van High-Performance
andere Europese landen. Via PRACE, het Partnership
verder worden onderzocht. SURFsara behartigt in
Computing wordt gedeeld. Zo heeft SURFsara presenta-
for Advanced Computing in Europe, kunnen onder-
deze samenwerking de positie van de gebruikers:
ties gehouden op de GPU Technology Conference in
zoekers toegang krijgen tot de zogenoemde Tier-
het gaat er steeds om in hoeverre innovaties ten
San José, Californië. Op deze conferentie komen de
0-systemen in Duitsland, Frankrijk, Italië en Spanje.
goede komen aan de eindgebruiker.
internationale GPU-experts samen; aangezien SURFsara steeds meer werkt met grafische processors (onder
Verschillende grootgebruikers van Cartesius zijn hierdoor succesvol geweest bij het indienen van
Snelheidsrecord voor sterrenkundigen
meer in Cartesius), is expertise op dit terrein voor ons
proposals. SURFsara ondersteunt deze gebruikers
De Wim Nieuwpoort-prijs 2013 van SURFsara ging
van groot belang.
bij het indienen van proposals en begeleidt ze bij
in 2014 naar drie astronomen van de Sterrewacht
het testen van hun applicaties op Cartesius en de
Leiden. Deze prijs wordt jaarlijks toegekend aan het
Een andere belangrijke conferentie in 2014 was
Europese Tier-0-systemen.
team wetenschappers dat optimaal gebruik weet
Supercomputing 14 (SC14), die in november in New
te maken van de nationale supercomputer Cartesius.
Orleans werd gehouden. SURFsara is een vaste deel-
Binnen Europa is er discussie ontstaan over de
De Leidse hoogleraar Simon Portegies Zwart
nemer van deze conferentie, die al meer dan vijfen-
financiële duurzaamheid van het PRACE-model.
en twee van zijn promovendi namen de prijs op
twintig jaar plaatsvindt. Dit jaar had SURFsara een
Op dit moment betalen de participerende landen
13 maart 2014 in ontvangst tijdens de SURFsara
stand samen met SURFnet en het Netherlands e-Science
buiten de jaarlijkse contributie geen bijdrage voor
Data & Computing Infrastructuredagen in het
Center (NLeSC), voor een gezamenlijke manifestatie
het gebruik van Tier-0-systemen in andere landen.
Bimhuis te Amsterdam.
onder de noemer “Dutch Research Consortium”.
9
SURFsara Jaarverslag 2014
CASE 1 DISSOCIATIE VAN METHAAN ALS BRON VAN WATERSTOF
Waterstof is een potentiële brandstof waarvan ongelimiteerde hoeveelheden beschikbaar zijn. Het probleem zit hem in de productie. Prof. dr. Geert-Jan Kroes, hoogleraar theoretische chemie aan de Universiteit Leiden, onderzoekt een cruciaal onderdeel van de productie: de dissociatie van methaan op metalen Oppervlakken. Voor dit onderzoek heeft Kroes 25 miljoen core-uren op Cartesius toegewezen gekregen.
goed beschrijven om nauwkeurige resultaten te krijgen”, zegt Kroes. “Een metaaloppervlak heeft veel gedelokaliseerde elektronen. We moeten een groot systeem modelleren om de krachten te berekenen die het oppervlak uitoefent op het molecuul. Daarvoor gebruikt men de dichtheidsfunctionaaltheorie (DFT), die efficiënt is qua rekentijd, maar niet erg nauw-
Geert-Jan Kroes doet onderzoek naar
wordt bepaald door de reactie waarbij
keurig. Wij willen in onze berekeningen
dissociatie van methaan op metalen
het methaan op het metaaloppervlak
werken met zogenoemde chemische
oppervlakken. Wat houdt dat precies
uiteenvalt in een CH3-groep en een
nauwkeurigheid, dat is een foutmarge
in? “Methaan is een molecuul met vijf
H-atoom. In ons onderzoek proberen
van maximaal 1 kilocalorie per mol.
atomen”, legt Kroes uit. “Er zijn verschil-
we die reactie zo goed mogelijk te
Maar met de DFT komen we niet
lende redenen waarom methaan inte-
modelleren met verschillende metaal
verder dan 4 à 5 kcal/mol. Daarom
ressant is. Het zit in aardgas, het is een
oppervlakken.”
werken wij semi-empirisch, we nemen
broeikasgas en je kunt het gebruiken
10
SURFsara Jaarverslag 2014
een dichtheidsfunctionaal met een
om waterstof te maken. De commer
Chemische nauwkeurigheid
aanpasbare parameter. We moeten
ciële manier om waterstof te maken
Het onderzoek vergt een substantieel
dan berekeningen doen waarmee
is met steam reforming. Je laat dan
deel van de jaarcapaciteit van Cartesius.
we proberen die parameter te fitten
methaan met water reageren over een
Wat maakt het rekenen zo complex?
aan experimenten.”
nikkel katalysator; bij die reactie komt
“We moeten de interactie tussen het
Een ander probleem is dat je bij dit
waterstof vrij. De snelheid bij die reactie
metaaloppervlak en het molecuul
type reactie werkt met een molecuul
dat qua massa in de buurt komt van de oppervlakteatomen, aldus Kroes: “Dat betekent dat het molecuul energie kan overdragen als het met het oppervlak botst. We moeten daarom een methode gebruiken waarin we de krachten die op het molecuul werken, uitrekenen terwijl we de bewegingsvergelijking oplossen. Je moet de krachten dus voor elke tijdstap afzonderlijk uitrekenen.” Cartesius Wat vindt Kroes van Cartesius? “Dat is een beetje een schot voor open doel. Cartesius is met een plek in de top-50 zeker geen slechte machine. Maar elke rekenaar zal zeggen: die machine moet veel groter. Het zou fantastisch zijn als Nederland een Tier-0-machine zou hebben, net als Italië. Dat is wel een groter land, maar aan de andere kant hebben wij een economie die het beter doet.”
11
SURFsara Jaarverslag 2014
Snaphots uit een AIMD-traject waarin methaan reageert, d.w.z. uiteenvalt in een CH3 fragment en een H-atoom (de bovenste 8 plaatjes) en een traject waarin het CH4 molecuul wordt terug verstrooid naar de gasfase (onderste 8 plaatjes)
CASE 2 HOE BEREKEN JE DE KANS OP EXTREME ZEESPIEGELSTIJGING?
De zeespiegel stijgt, maar hoeveel en waar is onderwerp van discussie. Het interdisciplinaire eSalsa-team wil voorspellingen doen die meer houvast geven in het bepalen van het risico van extreme stijgingen. Prof. dr. ir. Henk Dijkstra leidt dit samenwerkingsproject: “We zien dat het risico op een extreme zeespiegelstijging in het Noordzeegebied significant toeneemt.”
de zeespiegel heel snel, maar er zijn ook gebieden waar de zeespiegel daalt. Ook rond de Noordzee zien we de statistieken veranderen. Een extreme stijging die voorheen één keer in de vijf jaar voorkwam, komt nu één keer per jaar voor.” Grafische processoren Voor de berekeningen maakt het
Het eSalsa-project is begonnen in juli
en het effect dat ze hebben op de
project gebruik van de nationale
2012 als een samenwerking tussen
zeespiegelstijging.”
supercomputer Cartesius. “Ons
het Netherlands eScience Center, de
12
SURFsara Jaarverslag 2014
oceaanmodel is drie of vier keer zo
Vrije Universiteit Amsterdam en de
Regionale verschillen
snel geworden dankzij de grafische
Universiteit Utrecht. Het project onder-
Een belangrijke vraag was of de kans-
processors in Cartesius, de GPU’s,”
zoekt regionale extremen in de zeespie-
verdeling van de extreme zeespiegel
zegt Dijkstra. “We deden eerst
gel, aldus Dijkstra: “Die worden bepaald
stijging verandert. “We kijken naar de
simulaties waarbij één jaar oceaan-
door stromingen in de oceaan die we
return times”, zegt Dijkstra: “wat is de
simulatie ongeveer een dag duurde,
oceaanwervels noemen. Om de struc-
kans dat je in een bepaalde periode
we kunnen nu vier jaar in een dag
tuur van die wervels te berekenen, heb
zo’n extreme stijging tegenkomt? Dat
doen. We willen ongeveer honderd
je hoge resolutie oceaanmodellen
levert wereldwijd grote verschillen op.
jaar doorrekenen, dat kan nu in
nodig. Met die oceaanmodellen kunnen
Zeespiegelstijging is niet homogeen
25 dagen.”
we de veranderingen in de distributie
verdeeld over de aarde. In sommige
Dijkstra is al jaren kind aan huis bij
van die wervels in de oceaan bekijken
gebieden, zoals de Filippijnen, stijgt
SURFsara: “Ik kan daar niets dan lof
over hebben. We krijgen veel support,
den we regelmatig onze eSalsa-mee-
in alle opzichten. Het runnen van de
tings in het Collaboratorium. Het is
modellen levert zo nu en dan problemen
ook een soort symbiose: wij pionieren
op met compilers, met datatransfers,
en experimenteren met nieuwe tech-
met performance: dat wordt altijd snel
nologieën die bij SURFsara ontwikkeld
en keurig opgelost. We maken ook veel
worden en profiteren doordat we
gebruik van datastorage bij SURFsara,
nieuwe resultaten kunnen genereren.”
zo’n simulatie levert al gauw tussen de tien en honderd terabyte aan data op. We krijgen bij SURFsara online storage, zodat we gemakkelijk en snel de data kunnen analyseren. Collaboratorium Voor visualisaties maakt Dijkstra ook gebruik van het Collaboratorium bij SURFsara: “Ik heb hier in Utrecht een Tiled Panel Display van 16 schermen met een 10 Gb/sec lichtpad direct vanaf SURFsara. We hebben een webservice waarin we kunnen aangeven wat we willen visualiseren en dat werkt prima, maar het Collaboratorium bij SURFsara is natuurlijk veel mooier. Daarom hou-
13
SURFsara Jaarverslag 2014
Visualisatie van zeestromingen in het eSalsa project
Moesson in Trivandrum (Deelstaat Kerala-India)
CASE 3 COMPUTERMODELLEN TONEN VORMING VAN NIEUWE BLOEDVATEN
Hoe ontwikkelen nieuwe bloedvaten zich? Deze vraag is van groot belang bij wondherstel of bij ziektes zoals kanker. Veel onderzoekers concentreren zich daarbij op mutaties in het DNA, maar het is ook mogelijk om deze vraag op celniveau te beantwoorden. De groep van Prof. dr. Roeland Merks, senior onderzoeker bij het Centrum Wiskunde & Informatica (CWI), werkt daarbij met computermodellen die worden doorgerekend op het Nationaal Rekencluster Lisa.
celtype, de endotheelcel. Maar er zijn twee soorten endotheelcellen: tip-cellen en stalk-cellen. Uit experimenten blijkt dat die tip-cellen een centrale rol spelen bij angiogenese, maar het onderliggende mechanisme is niet precies bekend. We hebben een deel van de cellen in het model een andere kleur gegeven, en vervolgens gaan we van deze cellen het gedrag veranderen. We kunnen
Het onderzoek naar de vorming van
mutaties in het DNA en de signalen die
de tip-cellen zo veranderen dat ze aan
nieuwe bloedvaten heet angiogenese.
cellen afgeven. Wij hanteren een andere
de voorkant van een nieuw bloedvat
Roeland Merks, naast zijn werk voor
invalshoek: wat zijn de eigenschappen
komen te liggen. Een nieuwe zijtak
het CWI ook hoogleraar Multischaal
op celniveau die je moet aanpakken?
van het bloedvat ontstaat doordat
Mathematische Biologie aan de
Daarbij kan het gaan om de vorm van
een stalk-cel de tip-cel als het ware
Universiteit Leiden, geeft een toelich-
de cel, de adhesie tussen cellen of een
naar voren duwt. Dat heeft invloed
ting: “We willen weten hoe cellen in
aspect als contactinhibitie.”
op het netwerk dat tot stand komt.”
bouwen. We zien de vorming van een
Computermodellen
Biomedische werkelijkheid
bloedvat als collectief gedrag van cellen
Merks en zijn medewerkers onderzoe-
De uitkomsten van het model worden
en we willen de regels ontrafelen die
ken de vorming van bloedvaten met
getoetst aan biomedische werkelijkheid,
aan dat gedrag ten grondslag liggen.
computermodellen. “We zijn begonnen
waarbij Merks te rade gaat bij zijn colle-
De meeste onderzoekers concentreren
met een standaardmodel van angio
ga’s bij het AMC: “Die hadden al eerder
zich op de moleculaire schaal, op de
genese. Dat model bevat maar één
gekeken naar de verschillen in genex-
staat zijn om samen een bloedvat te
14
SURFsara Jaarverslag 2014
pressie tussen tip-cellen en stalk-cellen. Daarbij bleek dat één van de genen zorgt voor de productie van een stofje dat verantwoordelijk is voor de wederzijds aantrekkingskracht tussen de cellen. Dat stofje komt in de tip-cellen minder tot uitdrukking. We gaan dus heen en weer tussen de simulaties op Lisa en de biomedische werkelijkheid in de laboratoria.” Lisa Voor het doorrekenen en manipuleren van de computermodellen maken Merks en zijn medewerkers gebruik van het Nationaal Rekencluster
Simulatie van angiogenese
Lisa bij SURFsara. “Die samenwerking verloopt heel vloeiend”, zegt Merks. “Onze aio’s en postdocs hebben heel veel rekenwerk kunnen doen en problemen worden altijd snel opgelost. Voorlopig gaan we nog even door met het onderzoek: onze medewerkers zijn nog heel wat computeruurtjes aan het verstoken.”
Simulatie van het bloedvaten netwerk gegenereerd door mechanische Detail simulatie van angiogenese
15
SURFsara Jaarverslag 2014
cel-cel communicatie
3
GROOTSCHALIGE DATA STORAGE: VEILIG, VINDBAAR EN TOEGANKELIJK
16
SURFsara Jaarverslag 2014
De groei van onderzoeksdata neemt in de laatste jaren snel toe. De technologie groeit mee en grenzen aan de groei zijn voorlopig nog niet in zicht. Maar onderzoekers en instellingen stellen wel steeds meer vragen over het beheer, de veiligheid en de terugvindbaarheid van data. Hier liggen in de komende jaren de grote uitdagingen, en samen met de instellingen werkt SURFsara aan oplossingen op maat. >
De hoeveelheid opgeslagen data bij SURFsara is ook in 2014
SURFsara heeft een datastrategie ontwikkeld die zich richt
weer fors gegroeid. De sterkste groeiers zijn, net als in afge
op de langdurige opslag en ontsluiting van onderzoeksdata.
lopen jaren, de onderzoeksdata van de Large Hadron Collider
Belangrijke aspecten hierin zijn behoud en verbeteren van
(de deeltjesversneller van CERN in Genève) en de astrono
de kwaliteit van datasets en vergroten van de vindbaarheid
mische data van LOFAR: die data groeide met 5,8 petabyte
daarvan. Hiervoor gaat SURFsara een zogenoemde Trusted
naar 16,9 petabyte. Maar ook de data in het Centraal Archief
Digital Repository (TDR) ontwikkelen. Daarnaast ontwikkelt
nam toe met 1,9 petabyte naar 4,8 petabyte. In totaal is bij
SURFsara tools waarmee onderzoekers eenvoudig datasets
SURFsara eind 2014 21,7 petabyte opgeslagen, een groei op
kunnen uploaden of beschikbaar maken in de TDR.
jaarbasis van 55%. Research Data Netherlands Officiële toetreding van SURFsara aan Research Data Netherlands
Aanpassingen van de infrastructuur
Sinds september 2014 maakt SURFsara deel uit van Research
SURFsara past de infrastructuur voortdurend aan om klaar
Data Netherlands (RDNL). RDNL is een samenwerkingsver-
te zijn voor de toenemende stroom aan data. Zo is de trans-
band tussen – tot nu toe – 3TU.Datacentrum en DANS (Data
missiesnelheid sterk verbeterd door de toepassing van een
Archiving and Network Services), dat zich vooral richt op het
nieuw dual SAN-fabric met 16 Gb/sec fiber channel technolo-
duurzaam opslaan en delen van onderzoeksdata. RDNL wil
gie. Daarnaast zijn in 2014 de tape drives vervangen (T10KD
zorgen voor één aanspreekpunt voor de gebruikers van deze
van Oracle). De nieuwe tape drives maken het mogelijk om
data: de organisatie richt zich daarbij op de frontoffices van
per tape cartridge 8,5 terabyte aan data op te slaan. Met de
universiteiten en andere instellingen. Met haar expertise op het
inzet van de nieuwe generatie tape drives is de potentiële
gebied van nationale reken- en datadiensten vult SURFsara de
dataopslagcapaciteit toegenomen tot 170 petabyte: voldoen-
aandachtsgebieden van de beide partners aan: de technische
de ruimte voor groei dus.
wetenschappen bij 3TU en de sociale en geesteswetenschappen bij DANS.
Toegankelijke en veilige data Met de toename van het volume aan opgeslagen data groeien
In de komende periode wordt een gedeelde producten- en
ook de wensen en eisen van gebruikers die de data willen
dienstencatalogus ontwikkeld, zodat de onderzoeker via één
analyseren. SURFsara doet veel onderzoek en ontwikkeling
kanaal zijn diensten kan vinden. RDNL onderzoekt ook de
op dit gebied, onder meer naar schaalbare storage-infra
mogelijkheden van een supportmodel en een gezamenlijke
structuren. Met de komst van cloud storage zijn er nieuwe
trainingsportfolio. De samenwerking heeft ook gevolgen voor
storage architecturen en technologieën ontwikkeld (bij
certificering: zowel DANS als 3TU is een zogenoemde Trusted
voorbeeld CEPH, Riak en XtreemFS). SURFsara onderzoekt
Data Repository. SURFsara is hard op weg om dit keurmerk
deze technologieën op schaalbaarheid, betrouwbaarheid
(Data Seal of Approval) eveneens te verwerven. In 2015
en beschikbaarheid.
vinden de voorbereidingen hiervoor plaats, de uiteindelijke certificering wordt in 2016 verwacht.
17
SURFsara Jaarverslag 2014
Europese samenwerking
National Research Data Storage
Ook in Europees verband is veel aandacht voor verbetering
Veel research communities kampen met problemen rond
van het beheer en de toegankelijkheid van data. SURFsara
de storage van de eigen onderzoeksdata. Zij zien de
werkt in dat verband mee aan het Europese project EUDAT.
hoeveelheid (big) data snel groeien en zijn niet voorbereid
EUDAT richt zich op de ontwikkeling van een Collaborative
op de verwerking daarvan. Zij worstelen bovendien met
Data Infrastructure: een data-infrastructuur die het onder
vragen over verbetering van de kwaliteit van datasets en
zoekers gemakkelijker maakt om samen te werken en
over het delen en vindbaar maken van data. SURFsara
onderzoeksdata te beheren en te delen.
zit regelmatig met vertegenwoordigers van instellingen om de tafel om ze te adviseren over kansrijke strategieën
Binnen EUDAT worden verschillende diensten ontwikkeld:
op dit gebied. Sinds 2014 biedt SURFsara ook een speci-
een belangrijke dienst wordt gevormd door de persistent
fieke dienst aan: de National Research Data Storage.
identifiers (PID), een soort ISBN-code voor data. De belangstelling voor en het gebruik van deze PID’s nemen sterk toe.
De National Research Data Storage biedt instellingen een
Eind 2014 waren er 24 instellingen in Nederland aangesloten,
veilige en betrouwbare opslagmogelijkheid voor hun onder-
waaronder het Instituut voor Beeld en Geluid en het KNMI.
zoeksdata. De dienst is vergelijkbaar met het aanbod van
De dienstverlening is bovendien verbeterd door de intro-
Amazon Cloud, maar biedt de instellingen meer veiligheid
ductie van nieuwe hardware, die o.a. meer mogelijkheden
en zekerheid over de opslaglocatie en de wetgeving die van
tot replicatie (en dus meer veiligheid) biedt.
toepassing is. Begin 2015 heeft SURFsara de eerste klanten voor deze dienst kunnen verwelkomen.
Management van onderzoeksdata staat ook centraal in U2CONNECT. In dit samenwerkingsverband kijken (tot nu toe) acht universiteiten, DANS en SURFsara naar de inrichting van Research Data Management en de toepassing van EUDAT-diensten in het universitaire onderzoeksdomein.
18
SURFsara Jaarverslag 2014
CASE 4 MEER INZICHT IN AARDBEVINGEN MET BEHULP VAN SEISMISCHE DATA
Het KNMI in De Bilt is bekend van het weer, klimaat en seismologie. Maar het KNMI huisvest ook het Europese datacentrum voor seismologie: ORFEUS, Observatories and Research Facilities for European Seismology. In 2014 heeft KNMI/ORFEUS samengewerkt met SURFsara voor datareplicatie met behulp van de dienst B2SAFE. Daarmee zijn onderzoeksdata eenvoudiger te beheren en toegankelijk te maken binnen Europese, multidisciplinaire research-infrastructuren.
een specifiek programma voor: het European Plate Observing System (EPOS). Dataopslag en –verwerking is een cruciaal onderdeel van dit systeem, aldus Sleeman: “ORFEUS is begonnen als een gecentraliseerd data-archief. Maar vanwege de sterke groei in diversiteit en omvang van data en vanuit lange termijn beheersaspecten is recent gekozen voor een systeem van onderling gekoppelde data-archieven binnen
Aardbevingen associëren we in Neder-
en te organiseren en zowel data als
Europa. Dat gekoppelde systeem noe-
land vooral met de gaswinning in
services bij elkaar te brengen voor de
men we EIDA: het European Integrated
Groningen waar een uitgebreid netwerk
gemeenschappelijke gebruikersgroep.
Data Archive.”
van instrumenten continu de bodem
Eén van de belangrijkste onderdelen
beweging meet. Data van dit netwerk
is het ORFEUS datacentrum, dat we
B2SAFE
wordt continu verzameld en geana-
huisvesten bij het KNMI.”
In 2014 heeft KNMI/ORFEUS samen
lyseerd door het KNMI en opgeslagen
19
SURFsara Jaarverslag 2014
met SURFsara binnen het Europese
in het datacentrum van ORFEUS.
EPOS en EIDA
project EUDAT een nieuwe dienst
Dr. Reinoud Sleeman, seismoloog, leidt
Het verzamelen, toegankelijk maken
geïmplementeerd om data veilig te
het ORFEUS datacentrum: “ORFEUS is
en beheren van seismische data is een
repliceren: B2SAFE. Luca Trani, als
een Europese organisatie die al ruim 25
speerpunt binnen de Europese Unie.
onderzoeker verbonden aan KNMI/
jaar bestaat. Het doel ervan is de seis-
Het Europese subsidieprogramma
ORFEUS, legt uit: “We wilden deze
mologie binnen Europa te coördineren
Horizon 2020 omvat daar dan ook
dienst graag toevoegen aan onze
operatie om te zien wat het voor onze onderzoeksgemeenschap kan betekenen. We hebben daartoe het volledige ORFEUS-archief (ongeveer 30 terabyte) gerepliceerd naar de database van SURFsara. Maar die replicatie omvat meer dan een kopie: de dataset wordt tegelijkertijd voorzien van Persistent Identifiers (PID’s). Het gebruik van PID’s zal o.a. de beschikbaarheid van data op lange termijn verbeteren.” Rekenfaciliteiten Zowel Sleeman als Trani is positief over de samenwerking: “Alles is soepel verlopen. We zijn nu onderdeel van het gebruikersproject rond B2SAFE. We willen op deze basis verder werken en nagaan of we nieuwe diensten kunnen toevoegen. We zijn in het bijzonder geïnteresseerd in diensten om de data verder te ontsluiten. Maar we kijken ook naar de mogelijkheid om gebruik te maken van de reken-faciliteiten bij SURFsara. Het feit dat de gerepliceerde dataset zich heel dicht bij die faciliteiten bevindt, is een groot voordeel voor onze gebruikersgemeenschap.”
20
SURFsara Jaarverslag 2014
Seismologische observatie stations in Europa en nabije omgeving
4
KENNIS IN BEELD: VISUALISATIE EN ONDERZOEK
21
SURFsara Jaarverslag 2014
Visualisatie helpt onderzoekers te communiceren over data en om verbanden tussen data inzichtelijk te maken. SURFsara biedt daar verschillende faciliteiten voor aan. In het Collaboratorium kunnen onderzoekers samenwerken met behulp van beelden in een zeer hoge resolutie, of juist een combinatie maken van verschillende beelden. Onderzoekers die data op de eigen desktop willen visualiseren, kunnen gebruik maken van Remote Visualisation. >
Sinds 2012 is het Collaboratorium in gebruik. In deze ruimte
van ELvis, waarbij de te visualiseren data in het datacenter
kunnen onderzoekers met behulp van krachtige computer
van SURFsara staat. Op dit moment moeten ze voor het
systemen visualisaties opbouwen op schermen met een
gebruik nog software installeren, maar in de nabije toekomst
totale grootte van 5 x 1,5 meter en een zeer hoge resolutie
wil SURFsara toegang en gebruik via een webbrowser
van 7.680 x 2.160 pixels (16.6 megapixel). De infrastructuur
mogelijk maken.
hiervoor heeft in 2014 een upgrade ondergaan. Aan de achterkant is de performance van de servers verbeterd, aan de
Open dag
voorkant is de toegankelijkheid vergroot. Gebruikers kunnen
Op 4 oktober 2014 was de jaarlijkse Open Dag op Amsterdam
nu eenvoudig via een tablet toegang tot de systemen krijgen.
Science Park, waarbij het Collaboratorium was opengesteld voor het publiek. Op het Collaboratorium-scherm wisselden
Het gebruik neemt geleidelijk toe, de bezetting van het
kosmologisch onderzoek, biomedische simulaties, onderzoek
Collaboratorium zit nu rond de 65%. De ruimte wordt
met behulp van big data en simulaties van sociale en crimine-
vooral gebruikt voor projectvergaderingen met visualisatie-
le netwerken elkaar af. De Open Dag op het Science Park
toepassing, voor video-conferencing, werkoverleg, demon-
is een samenwerking van AMOLF, AUC, CWI, Netherlands
straties en trainingen. Voor onderzoekers is de afstand soms
eScience Center, Nikhef, SURFsara en UvA-FNWI.
nog een probleem. SURFsara ziet wel een mogelijke groei in
Visualisatie toepassingen in het Collaboratorium
de totstandkoming van meerdere collaboratoria in Nederland,
Tijdens de Open Dag is bovendien een mobiele 4K-opstelling
bijvoorbeeld bij universiteiten, en de koppeling daartussen.
gedemonstreerd, waarop visualisaties getoond werden in
Zo is er aan de Rijksuniversiteit Groningen een 3D-theater
een zeer hoge resolutie (Ultra HD, ook wel 4K genoemd).
waarmee zo’n koppeling tot stand gebracht zou kunnen
SURFsara stelt deze opstelling ook ter beschikking aan
worden. Op het programma staat een onderzoek naar soft-
onderzoekers die de opstelling willen testen of ermee
ware om samenwerken op afstand eenvoudiger te maken.
willen werken. De combinatie van Remote Visualisation en 4K brengt weer nieuwe visualisatiemogelijkheden binnen
ELvis
het bereik van de onderzoekers.
Afstand speelt geen rol bij de andere visualisatiedienst die
22
SURFsara Jaarverslag 2014
SURFsara aanbiedt: Remote Visualisation. Begin 2014 is het
Onderzoeksprojecten
cluster voor visualisatie op afstand vernieuwd: dat heet nu
De adviseurs van SURFsara ondersteunen regelmatig onder-
het ELvis-cluster. ELvis staat voor Extra Large Visualisation,
zoekers die gebruik willen maken van visualisatie. Zo is
en dat geeft al aan dat het cluster grootschalige visualisaties
SURFsara betrokken bij een project van de Vrije Universiteit
aankan. Verschillende universiteiten, onder andere die van
Amsterdam om complexe genetische datasets inzichtelijk te
Amsterdam (UvA), Twente en Delft maken daar gebruik van.
maken. In 2014 lag de nadruk vooral op de ontwikkeling van
Gebruikers kunnen vanaf hun eigen desktop gebruik maken
de juiste tools, de eerste resultaten worden in 2015 verwacht.
Een ander interessant onderzoeksproject is FutureBase, dat gericht is op strategische voorspellingen op basis van verschillende databronnen (van small data tot big data). Naast SURFsara nemen The Hague Centre for Strategic Studies (HCSS), de Universiteit Leiden, AGT International en de Koninklijke Bibliotheek deel aan dit project. Rondom twee veiligheidsgerelateerde thema’s worden verschillende datasets verzameld, geanalyseerd en gevisualiseerd. De volgende fase gaat zich richten op de inhoudelijke analyse. Daarnaast wordt er ook binnen Europese projecten aan visualisatie gewerkt, zoals binnen Fortissimo op het gebied van Remote Visualisation op het Cartesius Accelarator Island.
Wereldwijde oceaanstromingen en invloed op het klimaat https://www.youtube.com/watch?v=dSUImcuK-Ps
23
SURFsara Jaarverslag 2014
CASE 5 VISUALISATIE ALS BRUG BIJ GENETISCH ONDERZOEK
Genetisch onderzoek is een onderzoeksveld waarbij verschillende disciplines betrokken zijn: biologen, medici, genetici, neurowetenschappers en psychologen. Bovendien komen er steeds meer (big) data beschikbaar, die vaak lastig te interpreteren zijn. Dr. Niels Cornelisse, Assistant Professor aan het Center for Neurogenomics and Cognitive Research (CNCR) bij het VUmc, wil de verschillende disciplines beter met elkaar laten praten aan de hand van visualisaties.
Als je weet hoe dat werkt, krijg je meer inzicht in de verschillende pathways (biologische processen in de hersenen). Inzicht in genetische netwerken is ook van belang voor het begrijpen van ziektes. Veel ziektes hebben een genetische oorsprong. Maar de oude gedachten dat je voor elke ziekte een bepaald gen hebt, gaat niet op, zeker niet bij hersenziektes. Bij sommige ziektes zijn heel veel genen betrokken, die allemaal
24
SURFsara Jaarverslag 2014
Niels Cornelisse leidt een onderzoeks-
Genetische netwerken
groep op het gebied van Synaptic
Op dit moment is de onderzoeksgroep
Computation: “We richten ons vooral
van Cornelisse bezig met een methode
Statische analyse
op de synapsen, de contactpunten
om meer grip te krijgen op complexe
Om na te gaan welke genen een rol
tussen neuronen. Daar heeft de infor-
genetische netwerken. “We zijn geïn-
spelen bij bepaalde processen, moeten
matieoverdracht tussen neuronen
teresseerd in de moleculaire mechanis-
onderzoekers gebruik maken van sta-
plaats door middel van signaalstoffen,
men die een rol spelen bij signaal-
tistische methodes. Daarbij richt het
de neurotransmitters. Wij onderzoeken
overdracht tussen neuronen”, legt
onderzoek zich niet meer op individuele
de mechanismen die daarbij een rol
Cornelisse uit. “Die moleculen worden
genen, maar op clusters van genen,
spelen. Als die niet goed functioneren,
gecodeerd door genen. Er zijn zo’n
aldus Cornelisse: “Daar heb je er veel
kan dat leiden tot ziektes.”
2.000 eiwitten die in de synapsen tot
minder van en dat maakt de statistische
expressie komen. Het idee is dat die
tools veel krachtiger. Daartoe zetten we
eiwitten samenwerken in netwerken.
grote hoeveelheden genetische data op
een beetje zijn aangetast.”
één platform zodat we vragen waarover we nadenken, kunnen visualiseren. We kijken dan naar P-waardes, die aangeven hoe significant het is dat een bepaald gen is aangetast bij patiënten met een bepaalde ziekte. Hoe lager de P-waarde, hoe hoger de kans dat er een verband is. Voor de pre-processing maken we gebruik van het Genetic Cluster, onderdeel van het Nationale Rekencluster Lisa.” Brug tussen onderzoeksvelden Visualisaties helpen onderzoekers met verschillende achtergronden om te communiceren over bijvoorbeeld genetische oorzaken van ziektes. “Het werkt heel intuïtief”, zegt Cornelisse. “Je ziet bijvoorbeeld een bepaald cluster rood kleuren. Wij gaan dan verder onderzoeken welke genen daarin zitten en wat daarmee aan de hand is. Met deze visualisatie willen we een brug slaan tussen de biologen, die veel informatie hebben over de genen, en de psychologen en genetici die veel informatie hebben over de patiënten en hun genenprofiel. Die visualisatie helpt mensen uit verschillende disciplines om met elkaar te praten.”
25
SURFsara Jaarverslag 2014
5
DE SPELD IN DE HOOIBERG VAN BIG DATA
26
SURFsara Jaarverslag 2014
Big data is overal. Steeds meer wetenschappers willen onderzoek doen op basis van zeer omvangrijke dataverzamelingen. Voorbeelden zijn onderzoek naar tweets, onderzoek in webcrawls en DNA-analyses van grote aantallen proefpersonen. SURFsara biedt onderzoekers verschillende onderzoeksinfrastructuren aan: HPC Cloud, Hadoop en grid. In 2014 is veel energie gestopt in innovatie en uitbreiding van deze infrastructuren. Zo kunnen wetenschappers gericht op zoek naar de speld in de hooiberg van Big Data. >
HPC Cloud breidt uit
om zeer grote bestanden met tekst te analyseren, bijvoor-
Sinds 2012 kunnen onderzoekers gebruik maken van de HPC
beeld voor de analyse van tweets.
Cloud. HPC Cloud biedt onderzoekers een laagdrempelige toegang tot hoogwaardige rekenkracht. Met deze dienst
Norvig Web Data Science Award
kan een onderzoeker zijn programma eenvoudig kopiëren
In 2014 organiseerde SURFsara samen met Common Crawl
naar de HPC Cloud en het dan tien, twintig of honderd keer
voor de tweede keer de ‘Norvig Web Data Science Award’.
opschalen. De combinatie van flexibiliteit en schaalbaarheid
Deze wedstrijd laat studenten en wetenschappers ervaren
maakt HPC Cloud een populaire dienst, zo populair dat de
hoe het is te werken met grote datasets. Common Crawl
infrastructuur in 2014 tegen zijn grenzen aanliep.
stelt hiervoor een zogenoemde webcrawl van 2,8 miljard internetpagina’s beschikbaar. SURFsara stelt de onder-
In 2015 is een aantal uitbreidingen gepland, waardoor de
zoekers het Hadoop-cluster ter beschikking. De inzendingen
performance significant zal toenemen. Gepland is onder
werden beoordeeld door een internationale jury onder
meer de vervanging van spinning disk door snelle SSD’s
leiding van Peter Norvig, directeur Research bij Google.
(Solid State Disks): dit zorgt voor een grote verbetering van de I/O-performance. Daarnaast voegt SURFsara een zestal
De award is gewonnen door drie studenten van de master
nodes toe met GPU’s; ook de software wordt aangepast.
opleiding Computer Science aan de TU Delft: Feng Wang,
Hierdoor zal zowel het laden van de virtuele machines als
Hong Huang en Vincent Gong. In hun onderzoek hebben
de toegang tot de data versneld worden. Inmiddels maken
ze zich gericht op alle afbeeldingen in de webcrawl. De prijs
meer dan 200 onderzoekers gebruik van HPC Cloud, waar
is op 28 november uitgereikt bij SURFsara.
onder wetenschappers van de Universiteit van Amsterdam en van UNESCO IHE (wateronderzoek) in Delft.
Grid Ook de grid-infrastructuur wordt gebruikt voor data-analyse.
27
SURFsara Jaarverslag 2014
Yet Another Resource Negotiater
De hardware is in 2014 flink uitgebreid met 2.400 cores.
Het Hadoop-cluster is specifiek ontwikkeld voor de analyse
Een van de projecten die op het grid draait is het eEcology
van big data. Dit cluster is in de loop der jaren uitgebreid
project van het Netherlands eScience Center, onder aan-
en er is een ecosysteem van applicaties en tools omheen
sturing van professor Willem Bouten. Het grid wordt ook
ontstaan. In 2014 is SURFsara overgegaan op Hadoop 2.0
gebruikt door het ALS Centrum Nederland voor een zeer
met de benaming YARN: Yet Another Resource Negotiator.
omvangrijk genetisch onderzoek. In het zogenoemde
Daarmee is het cluster nu geschikt voor meerdere frame-
MinE-project wil de stichting een poging doen de genetische
works, zoals SPARK, dat real time data-analyse mogelijk
basis van de ziekte ALS te achterhalen. Hiertoe wil men het
maakt. Het nieuwe cluster zorgt voor een betere onder-
DNA van 15.000 ALS-patiënten analyseren en vergelijken
steuning van een aantal applicaties, zoals Elasticsearch en
met het DNA van 7.500 controlepersonen. Voor meer
HBase. Deze toepassingen maken het onder meer mogelijk
informatie, zie http://www.projectmine.com/nl/.
Sinds 2011 is het European Grid Initiative gehuisvest in het kantoorgebouw van SURF Science Park. EGI is een alliantie van 34 Europese landen en twee grote onderzoeksinstituten met als doel de samenwerking tussen de Europese grid-infrastructuren te coördineren. De focus binnen EGI is geleidelijk aan het verschuiven van technologie naar gebruikersgemeenschappen. De big data revolutie Big Data draagt een grote belofte in zich voor bedrijven en (wetenschappelijke) instellingen, maar het gebruik ervan valt in de praktijk tot nu toe tegen. Dat blijkt uit de publicatie ‘De Revolutie van Big Data: een verkenning van de ingrijpende gevolgen’ van Anwar Osseyran, directeur van SURFsara, in samenwerking met internetondernemer Willem Vemeend. De auteurs zien vooral grote mogelijkheden in de medische sector, waar big data-analyses sneller en beter inzicht kunnen opleveren in de effecten van geneeskundige behandelingen en de ontwikkeling van medicijnen. Op het terrein van het milieu en energiebeleid leidt de inzet van big data tot minder energiegebruik en een lagere CO2uitstoot. Osseyran en Vermeend constateren dat het gebruik van big data in Nederland nog in de kinderschoenen staat. Dat komt onder meer door een groot tekort aan big dataspecialisten. Maar de beide auteurs zien voldoende kennis in Nederland om een internationaal gezaghebbende big data-sector op te bouwen. Daarvoor moeten de Nederlandse onderwijs-instellingen zo snel mogelijk onderwijsprogramma’s op het gebied van big data ontwikkelen.
28
SURFsara Jaarverslag 2014
CASE 6 NEWSREADER: EEN MILJOEN ARTIKELEN PER DAG
Grote hoeveelheden nieuwsberichten automatisch terugbrengen tot de essentie: dat is de missie van NewsReader. NewsReader is een Europees project dat wordt uitgevoerd door een consortium van zes partijen onder leiding van de Vrije Universiteit Amsterdam. Projectcoördinator prof. dr. Piek Vossen: “Veel berichten gaan over dezelfde achterliggende feiten. Een automatische analyse kan die feiten in kaart brengen, maar ook de verschillen tussen de bronnen.”
the News kijken we hoe we die tech nologie optimaal kunnen laten draaien in een productieomgeving,” zegt Vossen. “Uitgangspunt is dat we in die omgeving zo veel mogelijk nieuws in één dag verwerken, zodat we weer klaar zijn voor de volgende dag.” Pipeline In 2013 is een pipeline ontwikkeld voor Newsreader waarbij elk nieuwsartikel
Het project NewsReader is begin 2013
elkaar aanvullen of van mening verschil-
vijftien verschillende programma’s
van start gegaan. In dit project wordt
len. En dat kan ook over een bepaalde
doorloopt. Daarbij gaat het deels om
de technologie ontwikkeld om nieuws-
periode, je kunt dan zien hoe de infor-
bestaande software, deels om proto
berichten automatisch te laten lezen,
matie van vandaag zich verhoudt tot
types die binnen verschillende univer
aldus Vossen: “De computer haalt eruit
die van vorige week.”
siteiten zijn ontwikkeld. Vossen: “We
wat er gebeurd is, wie erbij betrokken
29
SURFsara Jaarverslag 2014
hebben uitgezocht hoe snel dat werkt,
is, waar en wanneer. Elke werkdag
Can we Handle the News?
waar de problemen zitten en of we die
komen er ongeveer een miljoen artike-
NewsReader wordt aangevuld met een
programma’s ook parallel kunnen draai-
len bij uit zo’n 30.000 verschillende
tweede project, Can we Handle the
en. Dat hebben we gedaan op verschil-
bronnen. Veel van die berichten gaan
News, dat in 2014 in de prijzen viel bij
lende hardware-platforms, zowel High
over dezelfde feiten; een automatische
de jaarlijkse Enlighten Your Research-
Performance Computing als Hadoop.
analyse kan die feiten in kaart brengen,
wedstrijd. “In NewsReader staat de
In 2014 zijn we zover gekomen dat we
maar geeft ook aan waar de bronnen
technologie centraal, in Can we Handle
1,3 miljoen artikelen in een paar weken
kunnen verwerken. Ter vergelijking:
systeem te bouwen dat in staat is om
als we een miljoen artikelen willen
data op te leveren die aantoonbaar
verwerken op een standaard server
nuttig is voor de doelgroep. Een mo-
van de Vrije Universiteit, zouden we
gelijke toepassing is bedrijfsinformatie
daar vijf jaar over doen.”
bij overnames; denk aan afdelingen van banken en accountantskantoren
Hadoop
die zich richten op fusies en overnames.
De experts van SURFsara hebben actief
“Zij kunnen dan analyseren wat voor
meegewerkt om ervoor te zorgen dat
soort bedrijf het is, wie erachter zitten
de software kon worden omgezet naar
en wie erbij betrokken zijn,” zegt Vossen.
Hadoop. “Ze hebben ons fantastisch
“Wij moeten aantonen dat we rijke en
geholpen,” vertelt Vossen. “Toen al onze
kwalitatief hoogwaardige data kunnen
software moest worden omgezet naar
opleveren.”
Hadoop had ik er in eerste instantie een hard hoofd in. Maar dat hebben de mensen van SURFsara redelijk gemakkelijk van ons overgenomen, ze hadden snel door hoe alles in elkaar zit. Ik ben onder de indruk van de snelheidswinst die dat heeft opgeleverd.” Bedrijfsovernames Het uiteindelijke doel is om binnen
De Synerscoop tool geeft de relatie weer tussen personen en hun functie bij IT
NewsReader een zo goed mogelijk
bedrijven. De relaties zijn gelegd op basis van documenten of gebeurtenissen.
30
SURFsara Jaarverslag 2014
CASE 7 PUZZELEN MET PLANTGENOMEN
Hoe breng je een genoom in kaart van een plant waarvan je geen referentie hebt? Die puzzel probeert men op te lossen bij Plant Research International aan de Wageningen University & Research Centre. Kennis van het genoom kan onder meer helpen om planten resistent te maken tegen ziektekiemen. De benodigde berekeningen doen een groot beroep op het werkgeheugen, maar het Hadoopcluster maakt een alternatieve manier van rekenen mogelijk.
zoekers over verschillende platforms die ze kunnen inzetten. Warris: “De meer traditionele methoden leveren veel data van kleine stukjes DNA op, maar hoe kleiner de stukjes, hoe ingewikkelder de puzzel. We zijn dus op zoek naar sequencing-technieken die op grotere schaal het genoom in kaart kunnen brengen; zo werken we nu met optical mapping.” Die grotere eenheden zijn ook belangrijk omdat rekenen aan
Sven Warris is als post-doc researcher
strueren. We zijn nu bijvoorbeeld bezig
een plantengenoom veel complexer is
werkzaam bij Plant Research Interna-
met meloen en ui. We kijken niet alleen
dan rekenen aan het humane genoom,
tional. Een van de onderwerpen waar-
naar de plantgenomen, maar ook naar
aldus Warris: “In het menselijke genoom
mee hij zich bezighoudt is het bouwen
de genomen van ziekteverwekkers en
heb je twee kopieën van het chromo-
van nieuwe genomen, waarbij de nadruk
-bestrijders: bacteriën, schimmels,
soom, bij planten heb je soms wel acht
ligt op genomen van landbouwgewas-
insecten.”
kopieën die behoorlijk van elkaar ver-
sen. “Van sommige planten, zoals aard-
31
SURFsara Jaarverslag 2014
schillen.”
appel en tomaat, is het genoom aardig
Sequencing
bekend”, zegt Warris. “Maar van andere
Het DNA wordt in kaart gebracht met
Hadoop
planten weten we weinig tot niets, we
behulp van sequencing. Daarbij wordt
Voor de berekeningen maakt Warris
moeten dan eigenlijk vanaf nul begin-
het DNA verdeeld in stukjes, die
gebruik van het Hadoop-cluster bij
nen. Dat noemen we de novo assembly,
vervolgens ‘gelezen’ kunnen worden.
SURFsara. “Een van de problemen
waarbij we het genoom volledig recon-
In Wageningen beschikken de onder-
met de novo assembly is de hoeveel-
heid werkgeheugen die je nodig hebt”,
voor analyse van de langere eenheden
zegt Warris. “Wij gebruiken een compu-
die nodig zijn bij de novo assembly
ter met een werkgeheugen van twee
moet de software worden aangepast.
terabyte, maar daarmee lopen we wel
Daar zit nog veel ontwikkelwerk in.
tegen onze grenzen aan. Bovendien gaat het om zeer dure hardware. Met
Samenwerking
Hadoop werken we op een andere
Bij zijn onderzoek heeft Warris nauw
manier, we maken daarbij gebruik van
samengewerkt met SURFsara: “Dat
gedistribueerd geheugen dat heel snel
verloopt goed. Ik merk dat ze steeds
benaderd kan worden. Het netto effect
toegankelijker worden voor onderzoe-
is dat je veel meer relatief goedkope
kers die andere rekentaken vragen dan
rekencapaciteit tot je beschikking hebt.
ze bijvoorbeeld bij natuurkunde en
Maar daarvoor moet de software wel
astronomie zijn gewend. We hebben
worden aangepast. We hebben in de
binnen de bio-informatica veel kort-
eerste plaats gekeken of Hadoop een
lopende projecten en daar is SURFsara
toegevoegde waarde biedt voor het
nu goed op ingespeeld. Hun consultants
soort problemen waarmee wij te maken
denken met je mee en geven je alle
hebben.”
ruimte om te experimenteren.”
In de afgelopen periode is gebleken dat de bestaande software vooral geschikt is voor de analyse van relatief kleine eenheden DNA (voor de kenners: de HiSeq- en MiSeq-platforms). Maar
32
SURFsara Jaarverslag 2014
6
SAMENWERKING VERLEGT GRENZEN
33
SURFsara Jaarverslag 2014
Samenwerken met onderzoekers is de core business van SURFsara. Bij alle diensten die SURFsara aanbiedt, staat het nut voor de onderzoeker centraal. Vandaar dat SURFsara steeds vaker de samenwerking zoekt met onderzoekgemeenschappen om samen diensten te ontwikkelen zoals SURFdrive. Met een aantal gemeenschappen is de samenwerking bijzonder hecht, wat tot uiting komt in het aanstellen van een community manager, die fungeert als liaison tussen SURFsara en de onderzoekers. In 2014 zijn er twee communitymanagers van start gegaan: voor de Topsectoren en voor de Life Sciences. >
Life sciences
de infrastructuur krijgt die samenwerking vorm binnen
De onderzoekers op het gebied van life sciences en e-Bio-
ELIXER-NL (met de slogan ‘data for life’). Begin 2014
informatica vormen een hechte gemeenschap, waarmee
heeft staatssecretaris Sander Dekker (OCW) het verdrag
SURFsara nauwe contacten onderhoudt. Binnen de life
geratificeerd dat de samenwerking binnen ELIXER regelt.
sciences wordt gebruik gemaakt van vrijwel alle infrastructu-
Afgesproken is dat SURFsara een zogenoemde ‘node’ binnen
rele diensten die SURFsara aanbiedt, zoals High Performance
ELIXER gaat worden. Die ‘node’ wordt bijgebouwd bij de
Computing, grid, clouddiensten en Hadoop. Een groot deel
bestaande infrastructuur en biedt toegang tot meerdere
van de gebruikers heeft bovendien toegang tot het life scien-
diensten. Ook hierbij werkt SURFsara nauw samen met DTL.
ces grid, dat is toegesneden op de behoeften van de sector. Community cloud SURFsara houdt elk jaar een workshop over e-infrastructuur
Bij de SURF-doelgroep – universiteiten, hogescholen, mbo,
voor de life sciences. Ook in 2014 is deze workshop weer
academisch medisch centra – is veel vraag naar clouddien-
gehouden. Zo’n 70 belangstellenden woonden de sessies
sten. De SURF-werkmaatschappijen spelen daar op in met
bij over onder meer de nationale e-infrastructuur en de
communitycloud, public cloud of een combinatie hiervan
roadmap voor de ontwikkeling daarvan. Bij deze workshop
(mix & match-diensten). Zo kunnen we commerciële leve-
werkt SURFsara samen met het Dutch Tech Centre for Life
ranciers vragen om onder onze regie hun diensten binnen
Sciences (DTL). SURF is founding partner van dit centrum.
de SURF-communitycloud aan te bieden. Instellingen kunnen ook zelf een eigen oplossing beschikbaar stellen.
Academische ziekenhuizen Naast DTL is de Nederlandse Federatie van Universitair
Eind 2014 zijn verschillende communitycloudprojecten van
Medische Centra (NFU) een belangrijke samenwerkings
start gegaan. Samen met UMC’s onderzoekt SURF de moge-
partner van SURFsara. NFU vertegenwoordigt de acht
lijkheden van exchange in the cloud. Met de universiteiten
samenwerkende universitair medische centra in Nederland.
onderzoeken we of het mogelijk is gezamenlijk een web-
Deze federatie heeft het op zich genomen de onderzoeks-
service portfolio neer te zetten en met de hogescholen kijken
infrastructuur te harmoniseren en daarbij in kaart te brengen
we of we een gezamenlijke IAAS-dienst kunnen lanceren.
wat de medische centra gezamenlijk kunnen doen. Eén van de zaken waarop SURFsara zich richt, is de ontwikkeling van
Mede naar aanleiding van deze vraag hebben de SURF-werk-
een community cloud: een clouddienst die aansluit op de
maatschappijen een nieuwe community cloud-strategie opge-
wensen en behoeften van de academische medische centra.
steld. Samenwerking staat centraal in deze strategie. Daarom streven SURFsara en de andere werkmaatschappijen ernaar
34
SURFsara Jaarverslag 2014
ELIXIR
om instellingen met vergelijkbare wensen en eisen samen te
De onderzoekgemeenschap op het gebied van de life scien-
brengen. Deze activiteiten kunnen uitgroeien tot een sector-
ces werkt ook samen in Europees verband. Als het gaat om
cloud voor de community Onderzoek en Onderwijs.
SURFDRIVE SURFdrive is de persoonlijke cloudopslagdienst die SURFsara (samen met SURFnet) aanbiedt aan universiteiten en hogescholen. Op 1 mei is deze nieuwe dienst live gegaan. SURFdrive is een veilig
ALTIJD EN OVERAL TOEGANG TOT JE BESTANDEN
alternatief voor publieke clouddiensten zoals Dropbox, OneDrive, Google Cloud en iCloud. De functionele specificaties en de eisen op het gebied van veiligheid en compliance zijn samen met de hogeronderwijssector opgesteld. In de zomer van 2014 waren al tien universiteiten gekoppeld; eind 2014 benutten ruim 4.000 gebruikers de mogelijkheden van SURFdrive. Inmiddels hebben vrijwel alle universiteiten aangegeven mee te willen doen. Elke instelling vaardigt een ambassadeur af die aanvullende wensen van de eigen instelling in kaart brengt. Tijdens ambassadeursmeetings worden de ervaringen van gebruikers besproken, evenals de gewenste ontwikkeling van deze dienst. Hierdoor wordt SURFdrive sterk ervaren als een dienst van en voor de hogeronderwijsinstellingen.
SURFdrive is een initiatief van SURF en alle Nederlandse universiteiten.
SURFdrive, alleen delen met wie je wilt delen SURF0041 Flyer.indd 2
35
SURFsara Jaarverslag 2014
12-12-14 15:09
CASE 8 ONDERZOEK NAAR EIWITTEN MET GRID-COMPUTING
Het Europese WeNMR-project (www.wenmr.eu) richt zich op onderzoek naar de structuur en eigenschappen van eiwitten. De onderzoekers op dit terrein maken gebruik van Grid-computing, dat hen toegang geeft tot grootschalige rekencapaciteit. Coördinator van WeNMR is Prof. dr. Alexandre Bonvin, hoogleraar Computational Structural Biology aan de Universiteit Utrecht: “We bieden de gebruikers toegang tot Grid met een webserver die de complexiteit aan het oog onttrekt.”
ontwikkeld, waaronder de HADDOCK server, die de complexiteit voor de eindgebruiker aan het oog onttrekt. De gebruiker ziet alleen de interface van de webserver, waarin hij zijn data kan uploaden. Aan de achterkant worden dan allerlei berekeningen op het grid uitgevoerd.” Intermediair WeNMR fungeert als intermediair tussen
WeNMR staat voor Worldwide e-Infra-
Webserver
de eindgebruikers (de onderzoekers),
structure for NMR and Structural Bio-
Officieel is het WeNMR-project
en de grid-infrastructuur, stelt Bonvin:
logy. NMR (Nuclear Magnetic Reso-
afgerond, de EU-funding is vorig jaar
“We hebben zo’n 5.000 gebruikers
nance) is een van de methoden om de
beëindigd. Maar inmiddels is er een
wereldwijd die gebruik maken van onze
structuur van eiwitten te bepalen, aldus
omvangrijke virtual community van
webserver. We hebben op het moment
Bonvin: “We kunnen daarmee onder
onderzoekers ontstaan, die gebruik
in theorie de beschikking over zo’n
andere afstanden tussen atomen meten
maakt van een gezamenlijke infra
100.000 CPU cores, maar wij gebruiken
en dat vertalen we in een 3D-model.
structuur met behulp van Grid-
er maar een paar duizend tegelijk. Onze
Maar we gebruiken ook andere soorten
computing. Bonvin: “Wij hebben
jobs worden op 41 verschillende locaties
data, bijvoorbeeld over de interacties
ons gericht op eenvoudige toegang
in de wereld uitgevoerd, zo’n 60 tot 70%
tussen moleculen.”
tot Grid-computing voor onze eind
daarvan in Nederland (onder andere bij
gebruikers. In Utrecht hebben we
SURFsara).”
voor WeNMR meerdere webservers
36
SURFsara Jaarverslag 2014
Samenwerking Onze groep bij de Universiteit Utrecht heeft ook een cluster dat deel uitmaakt van de Nederlandse grid-infrastructuur. “Tot voor kort was het cluster in eigen beheer, maar sinds een paar weken staat er een cluster dat door SURFsara is geïnstalleerd”, zegt Bonvin. “Die hoeven we niet meer te beheren, dat is een groot pluspunt. Wij kunnen ons nu concentreren op de software en de wetenschap, we hoeven ons geen zorgen meer te maken over de hardware.” Bonvin is tot slot goed te spreken over de samenwerking met SURFsara: “Dat is altijd heel gemakkelijk geweest. In het verleden heb ik veel contact gehad in het kader van BiG Grid, daarop heb ik vanaf het begin rekencapaciteit gekregen voor het WeNMRproject (en ook de voorganger eNMR). Ik heb toen een aanvraag ingediend voor ondersteuning, maar de laatste jaren gaat dat eigenlijk automatisch omdat wij een grote community zijn. De ondersteuning vanuit SURFsara is altijd goed geregeld en de lijnen zijn kort.”
37
SURFsara Jaarverslag 2014
7
TOPSECTOREN: LAAGDREMPELIGE TOEGANG TOT HPC VOOR BEDRIJVEN
38
SURFsara Jaarverslag 2014
Topsectoren zijn groeisectoren voor de Nederlandse economie waarin innovatie onontbeerlijk is. Het Nederlandse topsectorenbeleid is erop gericht om bedrijven in dergelijke segmenten te ondersteunen, ook op ICT-gebied. SURFsara streeft ernaar hoogwaardige ICT-voorzieningen op een laagdrempelige manier te ontsluiten. Workshops, netwerken en pilots vergroten de toegankelijkheid. >
De inzet van High Performance Computing (HPC) stelt
HPC-exchange
Nederlandse bedrijven in staat om de time-to-market te
Bedrijven die gebruik willen maken van de mogelijkheden
verkorten. Modelvorming, simulatie en big data-analyse
van HPC weten vaak niet waar ze moeten beginnen. Dat is
dragen bij aan snellere en effectievere productontwikkeling.
het uitgangspunt van een nieuw project bij SURFsara met de
SURFsara ondersteunt deze ontwikkeling met een private
naam HPC-exchange. De HPC-exchange moet een centraal
sector programma, dat mkb, industrie en HPC bijeen brengt
punt worden voor kennisinstellingen en bedrijven die gebruik
in workshops en pilots. De spil in dit web wordt gevormd
willen maken van HPC: een kennis-hub waar ook diensten
door de communitymanager, die SURFsara specifiek voor
afgenomen kunnen worden. In 2014 zijn de mogelijkheden in
het private sector programma heeft aangesteld.
kaart gebracht. Daarbij is onder meer gekeken naar de wijze waarop SURFsara de dienstverlening kan aanbieden, bijvoor-
ICT-doorbraakprojecten
beeld via de HPC Cloud of als SaaS. Daarnaast wil SURFsara
Het kabinet heeft in het regeerakkoord afgesproken dat
de HPC-exchange gebruiken om de relaties met topsectoren
er publiek-private doorbraakprojecten met ICT komen.
als Water, Energie en Agrofood te versterken.
Het ministerie van Economische Zaken stelt middelen beschikbaar om de samenwerking tussen overheid, bedrijfs
Fortissimo
leven en onderzoeks- en kennisinstellingen op dit gebied
Ook in Europees verband is er veel aandacht voor de
te versterken. De projecten zijn gestart in 2013 en worden
mogelijkheden die HPC biedt om de concurrentiekracht van
afgerond door de oplossingen of resultaten te delen met
het bedrijfsleven te vergroten. In dat kader werkt SURFsara
overheden, bedrijven of instellingen. SURFsara draait als
mee aan het Europese project Fortissimo. Dat is een project
partner mee in twee van deze ICT-doorbraakprojecten:
waarin HPC-aanbieders samen met mkb-partners uit de
een project dat zich richt op het mkb en een project met
Europese maakindustrie gebruik maken van HPC. De eerste
als thema big data. Daarnaast heeft SURFsara deelgenomen
serie experimenten is afgerond, in 2015 beginnen we een
aan het jaarcongres Platform voor Informatiesamenleving
nieuwe serie met twee Nederlandse partners: Deltares en
(ECP).
de start-up Electric Ant lab. In dit kader heeft SURFsara deelgenomen aan het eerste Fortissimo Forum in Milaan.
Het mkb-programma heeft in 2014 een landelijke en een
Tijdens dit forum presenteren verschillende partijen de
aantal regionale bijeenkomsten georganiseerd in onder
oplossingen die tijdens de eerste serie experimenten zijn
meer Groningen, Arnhem, Eindhoven, Amsterdam en
ontwikkeld.
Den Haag. Tijdens de bijeenkomst konden de deelnemers
ontdekken wat rekenkracht voor hun bedrijf kan betekenen. Daarbij is onder andere ingegaan op de mogelijkheden van 3D-printing, HPC en big data. Juist voor het mkb leiden innovaties tot nieuwe kansen. 39
SURFsara Jaarverslag 2014
CASE 9 BEREKENING VAN SNEEUWVERPLAATSING EN –OPHOPING VOOR EFFICIËNTERE DAKCONSTRUCTIES
In Nederland is sneeuw geen punt, maar in Canada en Scandinavië kunnen sneeuwverplaatsing door de wind en sneeuwophoping ernstige schade toebrengen aan daken en gebouwen. Binkz is een Canadees bedrijf dat gespecialiseerd is in Computational Fluid Dynamics (CFD)-consulting. Eén van de diensten die Binkz aanbiedt, is een applicatie waarmee je sneeuwverplaatsing en –transport kunt berekenen. De uitkomsten kunnen gebruikt worden om daken te ontwerpen die zowel veilig als kostenefficiënt zijn.
waarbij sneeuw en lucht als een mengsel worden opgevat. “Deze benadering heeft zeer grote fouten tot gevolg als het gaat om sneeuwverplaatsing door de lucht op daken en rondom gebouwen”, legt Ziad uit. “In onze aanpak worden de sneeuw en de luchtstroming afzonderlijk behandeld. We berekenen de verbinding van sneeuw en lucht zonder gebruik te maken van empirische formules. Dit vermindert het aantal rekenfouten enorm
Binkz heeft een applicatie ontwikkeld
een betrouwbare manier om het
onder de naam snowFoam. Ziad
gewicht van de sneeuw te berekenen
Boutanios, hoofdingenieur bij Binkz,
en dat te vergelijken met de sterkte
De applicatie van Binkz is goed nieuws
legt uit hoe die werkt: “Onze applicatie
van een dak. Op deze manier kunnen ze
voor gebouwen met relatief platte
berekent de sneeuwverplaatsing en
zwakke plekken in een dak identificeren
daken, zoals supermarkten, waar sneeuw
–ophoping als gevolg van natuurlijke
die zouden kunnen bezwijken onder
gemakkelijk kan ophopen. Ingenieurs en
sneeuwval en herverdeling door de
een zware sneeuwlast.”
bouwkundigen die sneeuwproblemen willen vermijden, hebben de neiging
luchtstroming. De applicatie geeft ook
40
SURFsara Jaarverslag 2014
en leidt tot betrouwbare resultaten.”
inzicht in het gewicht en de dikte van
Betrouwbare aanpak
hun daken te degelijk te ontwerpen,
sneeuw op een dak, rondom gebouwen
De nieuwe applicatie verschilt van
wat leidt tot onnodige kosten. Met
en obstakels en zelfs over een land-
traditionele manieren om sneeuw-
snowFoam beschikken ze over een
schap. De applicatie biedt onze klanten
ophoping en –gewicht te berekenen,
kostenefficiënt gereedschap dat ze
helpt te bepalen hoe sterk hun dak
“De analyse van VORtech stelde
moet zijn.
ons in staat om de best mogelijke instellingen te kiezen, waardoor
Fortissimo
we de beste performance konden
Om de applicatie te testen in een
realiseren.”
High Performance Computing (HPC)omgeving, heeft Binkz samengewerkt
Cartesius and ELvis
met VORtech en SURFsara in een
Ziad was ook blij met de hulp van
Fortissimo-project. VORtech is een
SURFsara: “SURFsara heeft ons
Nederlands bedrijf dat grondige
experiment tot ontwikkeling laten
kennis over wiskundige modellering,
komen op de nationale supercomputer
simulatie en algoritmes combineert
Cartesius en gaf ons dagelijks onder-
met state-of-the-art methodes voor
steuning bij het draaien van de simula-
softwareontwikkeling. VORtech
ties en het bewerken van de resultaten.
zorgde voor een gedetailleerde
SURFsara gaf ons ook toegang tot het
analyse van de performance van de
ELvis-cluster voor remote visualisatie.
applicatie in de HPC-omgeving van
Hierdoor konden we de resultaten van
SURFsara, waar de applicatie parallel
de simulaties op afstand analyseren,
op tientallen processoren draaide.
zonder dat we steeds de tientallen
“Dit is nodig omdat snowFoam veel
gigabytes aan data hoefden te
rekenkracht vergt vanwege de zeer
downloaden die snowFoam voor
nauwkeurige behandeling van de
elke simulatie genereert.”
sneeuw en luchtstroming”, zegt Ziad.
41
SURFsara Jaarverslag 2014
Visualisatie van sneeuwverplaatsingen op een dak
CASE 10 FLEXMERS WERKT SAMEN MET SURFSARA IN ICT DOORBRAAKPROJECT
FlexMers is een bedrijf dat onderzoek doet naar zogenoemde target-binding oligonucleotide: RNA- of DNA-moleculen die zich binden aan een andere molecuul (het target). Targetbinding ligonucleotide spelen een rol in fundamenteel onderzoek en worden toegepast voor medische en industriële doeleinden. Omdat de selectie van deze binders zeer grote dataverzamelingen oplevert, heeft FlexMers gebruik gemaakt van het Nationale Rekencluster Lisa.
tot de detectie van toxines. Maar targetbinding oligonucleotide hebben ook nadelen, aldus Oostmeijer: “Ze zijn minder stabiel en kunnen gemakkelijk door het lichaam worden afgebroken. Wij hebben een methode ontwikkeld om deze binders te stabiliseren om ze een langere levensduur, een langere halveringstijd te geven. We noemen het ook geen target-binding oligonucleotide
Jelle Oostmeijer is als onderzoeker bij
volledige bibliotheek overheen en
maar Picons: een Picon is dus eigenlijk
FlexMers goed ingevoerd in de wondere
isoleren de stukjes DNA die aan een
een geoptimaliseerde oligonucleotide
wereld van target-binding oligonucleo-
target blijven plakken. Die stukjes
binder. Dat product willen we in de
tide. “FlexMers ontwikkelt binders tegen
DNA sequencen we. Dat levert een
toekomst aanbieden aan klanten die
bepaalde targets”, zegt hij. “Een binder
grote verzameling data op, daarbinnen
op zoek zijn naar een binder voor een
is een stukje DNA dat kan koppelen aan
moeten we bepalen welke de meest
bepaald target.”
bijvoorbeeld een eiwit, waardoor je de
voorkomende en dus de beste binder
functionaliteit van dat eiwit kunt blok-
is.”
In het afgelopen jaar heeft FlexMers
keren. Om een stukje DNA te vinden
42
SURFsara Jaarverslag 2014
ICT doorbraakproject
dat goed kan koppelen aan zo’n eiwit,
Ontwikkeling van medicijnen
samengewerkt met SURFsara binnen
maken we eerst een bibliotheek van
Omdat target-binding oligonucleotide
een ICT doorbraakproject. “We hebben
N20 bases die gerandomiseerd zijn.
veel verschillende moleculen kunnen
onderzoek gedaan naar de analyseme-
Daarmee doen we een selectie op een
binden zijn er legio toepassingen,
thode die we toepassen om die stukjes
bepaalde target. We spoelen daar de
variërend van gebruik als medicijn
DNA te vinden”, zegt Oostmeijer. “We
hadden zelf te weinig computer power om de hele set goed te analyseren. We hebben daarom een smartfilter ontwikkeld waarmee je een voorselectie maakt van veelbelovende data. Die kleinere dataset kunnen we dan intensief analyseren. Bij SURFsara hebben we onderzocht wat er gebeurt als je die smartfilter eruit haalt en de complete dataset op een HPC-platform analyseert. Daarnaast wilden we nagaan of onze software zo’n platform ook aankan.” Samenwerking Voor het onderzoek heeft FlexMers gebruik kunnen maken van het nationaal rekencluster Lisa. Oostmeijer is positief over de samenwerking met SURFsara: “Dat liep heel soepel. Als ik met een vraag zat, had ik de volgende dag alweer een antwoord.” De uitkomsten waren minder spectaculair: “We hebben kunnen constateren dat ons onderzoek met het smartfilter eigenlijk al voldoende was”, zegt Oostmeijer. “Bovendien bleek de software op een HPC-platform minder goed te werken.” Maar zoals ze in de wetenschap zeggen: negatieve onderzoeksuitslagen leveren ook informatie op.
43
SURFsara Jaarverslag 2014
Picons, geoptimaliseerde DNA binders
8
NAAR EEN DUURZAME HOGERONDERWIJSSECTOR
44
SURFsara Jaarverslag 2014
Groene ICT en duurzaamheid staan hoog op de agenda bij SURF. Het zijn belangrijke uitgangspunten in het SURF Meerjarenplan 2015-2018. SURFsara geeft invulling aan deze uitgangspunten aan de hand van drie speerpunten. Het eerste is de vergroening van ICT, bijvoorbeeld door de beperking van energieverbruik van onze diensten, zoals de supercomputer en de opslag van data. Een tweede speerpunt is vergroening door ICT, bijvoorbeeld met behulp van smart energy systems. En het derde is advisering van hogeronderwijsinstellingen om onderwijs, onderzoek en bedrijfsvoering groener te maken. >
GIDS
computer, onder meer door de toepassing van zuinige Intel
Het duurzaamheidsbeleid binnen SURF krijgt gestalte binnen
Xeon-chips en de nieuwste warmwater-koeltechnologie van
het programma GIDS: Groene ICT en Duurzaamheid SURF.
leverancier Bull. Ook bij de inrichting van het datacenter van
SURFsara is trekker van dit programma. GIDS richt zich vooral
SURFsara staat duurzaamheid centraal. Ten eerste draait het
op advisering van en kennisoverdracht naar universiteiten en
datacenter op groene stroom. De dataopslag is zo energie-
hogescholen. Dat heeft in 2014 een aantal concrete resultaten
efficiënt mogelijk ingericht: waar mogelijk slaan we data op
opgeleverd. Zo is het SURF Green ICT Maturity Model (SGIMM)
tape op. Ook bij de ontwikkeling van het nieuwe nationale
gepubliceerd. Met dit model kunnen ICT-afdelingen van onder-
datacenter van SURFsara, dat in 2016 operationeel zal zijn,
wijsinstellingen op een eenvoudige en snelle manier inzicht
is duurzaamheid een belangrijke randvoorwaarde.
krijgen in de invloed van ICT op duurzaamheid en krijgen ze handreikingen om zich te verbeteren. Een andere stap is de
CO2-neutrale kantooromgeving
ontwikkeling van een e-waste policy, die instellingen kan
SURFsara wil ook het bewustzijn voor duurzaamheid en groen
helpen ICT-gerelateerde afvalstoffen te verminderen.
gedrag bij de eigen medewerkers vergroten. Eind 2016 wil SURFsara een CO2-neutrale kantooromgeving hebben; bovendien
Symposium en andere evenementen
is het streven erop gericht de CO2-uitstoot elk jaar met 2% terug
Advisering en kennisoverdracht stonden ook centraal tijdens een
te brengen. Daarbij kijken we naar besparingen op brandstof
aantal evenementen die SURFsara (mede) heeft georganiseerd.
en warmte, elektriciteit, koeling, verkeer en afval. De eerste
Zo vond op 30 januari 2014 het vierde symposium Groene ICT
resultaten zijn al zichtbaar: zo is de CO2-uitstoot door zakelijk
en Duurzaamheid plaats, met als thema ‘Nieuwe energie in het
verkeer tussen 2011 en 2014 al met 17% teruggebracht.
hoger onderwijs’. Dit succesvolle symposium trok een record aantal deelnemers (160), die meer dan 30 inspirerende sessies
Smart energy systems
konden bijwonen. In juni vond voor het eerst de SustainaBul
Tot slot wil SURFsara ook een bijdrage leveren aan onderzoek
Experience plaats, een duurzaamheidsevent voor het hoger
naar duurzaamheid. Dit onderzoek krijgt onder meer gestalte
onderwijs waarop ‘vergroenen met ICT’ centraal stond.
in de benoeming van SURFsara-directeur Anwar Osseyran tot hoogleraar Business Analytics and Computer Science aan de
Vergroenen met ICT
45
SURFsara Jaarverslag 2014
Cartesius
Faculteit Economie en Bedrijfskunde van de Universiteit van
Ook bij de faciliteiten op het gebied van supercomputing en data
Amsterdam. Een van zijn aandachtsgebieden is smart energy
storage is duurzaamheid een belangrijk criterium. SURFsara is er
systems, en dan vooral de verduurzaming van energiecentrales,
dan ook trots op dat het Cartesius Accelerator Island, een nieuw
waar 65% meer dan de helft van de energiewaarde van brandstof
gedeelte van de nationale supercomputer Cartesius, op de vierde
verloren gaat. Gebruikmaking van big data en inzet van High
plaats is binnengekomen in de Green500. Deze lijst geeft een
Performance Computing kunnen daar een substantiële bijdrage
overzicht van de meest energie-efficiënte supercomputers ter
aan leveren door betere voorspelling van aanbod van duurzame
wereld. Maar ook voor het overige is Cartesius een groene super-
energie en van de verwachte energieafname.
COLOFON Tekst Hendrikx Van der Spek, Bussum Ontwerp Studio Koelewijn Brüggenwirth, Den Haag Fotografie CERN, Frank van Beek, Hans Hordijk, Richard Keijzer, Robert Lagendijk, Harry Meijer, Annemiek van der Kuil | PhotoA.nl, Nan Reunis, Roel Rozenburg, SURFsara © SURFsara 2015 SURFsara Science Park 140 1098 XG Amsterdam Postbus 94613 1090 GP Amsterdam
[email protected] www.surfsara.nl