JAARVERSLAG 2013 EEN NATIONALE ICT-INFRASTRUCTUUR VOOR WETENSCHAP EN BEDRIJFSLEVEN
INHOUDSOPGAVE WAT SURFSARA IN 2013 REALISEERDE 1 Het jaar in vogelvlucht
3
Computationele astrofysica – Simon Portegies Zwart Simulaties van complexe stromingen – Jens Harting
6 8
2 Innovatief onderzoek dankzij toegenomen rekenkracht
10
Genetisch onderzoek – Danielle Posthuma Preventieve tandheelkunde – Egija Zaura Nanofotonica – Spinelli en Van Lare Elektronenstructuur van materialen – Gilles de Wijs
14 16 18 20
3 Big Data legt de basis voor Big Science
22
Moleculaire epidemiologie – Bas Heijmans MOOC – introductie Grid-computing Tekstanalyse van tweets – Erik Tjong Kim Sang Information retrieval – Tom Kenter
26 28 30 32
4 In de wolken
34
Georeferencing – Jan Hartmann Taal- en cultuuranalyse – Marc Kemps-Snijders Cryo-electron tomografie – Max Maletta
39 41 43
5 Inzicht in complexe datasets dankzij visualisatie
45
Onderzoek naar wolkvorming – Harm Jonker
48
6 Snelle datacenternetwerken
50
7 Innoveren met HPC: kansen voor het bedrijfsleven
52
Dacolt – Ferry Tap Culgi – Jan-Willem Handgraaf
56 58
8 Groen en krachtig
60
Publicaties
64
1
HET JAAR IN VOGELVLUCHT
Hoogwaardig wetenschappelijk onderzoek doet een steeds groter beroep op grootschalige rekenkracht en dataopslag. SURFsara speelt hierop in door de wetenschap en het bedrijfsleven een compleet pakket aan diensten, expertise en ondersteuning te bieden op het gebied van High Performance Computing (HPC), Data, Visualisatie en Cloud Services. De nieuwe nationale supercomputer Cartesius vormt in dit verband een substantiële versterking van de nationale ICT-onderzoeksinfrastructuur. >
Ondertekening van de fusiedocumenten door de bestuursvoorzitters van stichting SURF en stichting 3
SURFSARA Jaarverslag 2013
SARA. Op de foto staand van links naar rechts Anwar Osseyran, Wim Liebrand, Edwin van der Zalm. Zittend van links naar rechts Sijbolt Noorda en Amandus Lundqvist.
Meer slagkracht door samenwerking binnen SURF
performance van de nieuwe supercomputer was medio 2013
Sinds de fusie tussen Stichting SURF en Stichting SARA begin
circa 270 TFlop/s, vier keer zo veel als de capaciteit van de
2013 is SURFsara onderdeel van de SURF-organisatie. Hierdoor
vorige supercomputer Huygens. Die capaciteitstoename sluit
zijn de nationale activiteiten van SURFsara en de bijbehorende
aan bij de voortdurend groeiende behoefte aan grootschalige
infrastructuur verankerd in de ICT-samenwerkingsorganisatie
rekenkracht binnen de onderzoeksgemeenschap. Ter verster-
van het Nederlandse hoger onderwijs en onderzoek. Dat brengt
king van de kenniseconomie vindt SURFsara het van groot
ons nog dichter bij onze belangrijkste gebruikers, de universi
belang dat onderzoek waarbij veel rekenkracht nodig is, ook
teiten en hogescholen. Een van de grootste voordelen is een
in Nederland kan worden uitgevoerd.
betere afstemming met de andere werkmaatschappijen van SURF, zodat we ons gezamenlijke aanbod beter kunnen laten
Met de komst van Cartesius is Nederland weer terug in de top-
aansluiten op de wensen en behoeften van de gebruikers. De
500 voor supercomputers: in november 2013 stond Cartesius
samenwerking stelt ons ook in staat om gezamenlijk diensten
op plaats 184 in de wereldranglijst (binnen Europa staat het
aan te bieden. Voor het veld, de universiteiten en hogescholen,
systeem op de 48ste plaats). Dat is weliswaar niet aan de top,
is deze samenwerking een logische stap.
maar de mogelijkheden zijn sterk toegenomen en onderzoekers maken intensief gebruik van het systeem. In 2014 zal Cartesius
SURFsara is binnen SURF de partij die zich sterk concentreert
door verdere uitbreidingen de grens van één PFlop/s doorbreken.
op de levering van geavanceerde diensten op het gebied van
De uitbreidingen verlopen volgens een duurzaam scenario van
computing, dataopslag en data-analyse, cloud en visualisatie.
on-demand groei, waarbij de capaciteit van het systeem gelijke
SURF richtte zich voorheen vooral op de innovatie en minder
tred houdt met de behoeften van de onderzoekers.
op de exploitatie van diensten. In 2013 heeft SURF een herstructureringsproject gestart, waarin de activiteiten van SURF
Nieuw datacenter
en haar werkmaatschappijen worden herijkt. Daarbij wordt de
Een belangrijke mijlpaal in 2013 was de overeenkomst met de
holding (de moedermaatschappij) in omvang teruggebracht
TelecityGroup. Dit bedrijf gaat op Amsterdam Science Park
en komen de innovatieprojecten en levering van diensten bij
een nieuw datacenter ontwikkelen, dat medio 2016 wordt op-
de werkmaatschappijen (SURFmarket, SURFnet, SURFsara en
geleverd. Binnen dit datacenter wordt een nationaal datacenter
SURFshare) te liggen. Op die manier sluit de dienstverlening
voor de nationale ICT-infrastructuur gehuisvest, dat specifiek
direct aan op de behoeften van de gebruikers.
ontworpen is om te voldoen aan de hoge eisen van HPC en duurzaamheid. SURFsara heeft in de afgelopen jaren verschillen-
4
SURFSARA Jaarverslag 2013
Terug in de top-500 met Cartesius
de scenario’s onderzocht, waaronder de mogelijkheid om zelf
In de zomer van 2013 is de nieuwe nationale supercomputer
een datacenter te bouwen. Maar uit het vooronderzoek is geble-
Cartesius officieel in gebruik genomen door staatssecretaris
ken dat meedoen met een grote partij economisch het meest
Dekker (OCW). De komst van Cartesius heeft geleid tot een
aantrekkelijk is. Aansluitend is een tender uitgeschreven, waaruit
aanzienlijke vergroting van de computing capaciteit; de peak
de aanbieding van TelecityGroup als beste naar voren kwam.
In het nieuwe datacenter krijgt SURFsara het exclusieve ge
Volumegroei onderzoeksdata
bruik van twee verdiepingen. In totaal kan SURFsara beschik-
SURFsara heeft in 2013 een sterke groei gezien van het volume
ken over meer dan 800 m2 datavloeroppervlak. SURFsara heeft
aan opgeslagen onderzoeksdata: dit is toegenomen van 7,5
er verder voor gekozen om het nationale datacenter flexibel
PetaByte naar ruim 12 PetaByte. De grootste datastromen zijn
op te zetten en de capaciteit on demand te kunnen uitbreiden.
afkomstig van de Large Hadron Collider (van CERN) en LOFAR,
Dit maakt het mogelijk de nieuwste ICT-ontwikkelingen en
maar ook de life sciences en de taalwetenschappen maken in
innovaties duurzaam en kosteneffectief toe te passen.
toenemende mate gebruik van de voorzieningen. De exponen tiële groei van het volume aan opgeslagen data stelt uitda
Technology transfer
gingen op verschillende terreinen. Daarbij gaat het om data
SURFsara zet zich al geruime tijd in voor technology transfer:
custody (data op een duurzame manier opslaan), maar ook
kennisoverdracht van kennisinstituten, zoals universiteiten en
om data curation (zorgen dat de data zuiver blijft) en data
hogescholen, naar het bedrijfsleven. Op de achtergrond speelt
stewardship (high-level beleid over de beste manier om data
daarbij het idee dat het geld dat de overheid investeert in ken-
te managen en te exploiteren). SURFsara werkt samen met
nis, op macro-economisch niveau kan worden terugverdiend.
andere partijen aan het ontwikkelen van modellen voor duur-
Bedrijven kunnen onder specifieke voorwaarden (in een pre-
zaam databeheer.
competitieve context) rekenkracht en andere HPC-faciliteiten van SURFsara afnemen. Met een nieuw programma van het
Community cloud
ministerie van Economische Zaken (EZ) kan SURFsara ook in
Cloud-omgevingen worden steeds belangrijker, ook bij het
de komende jaren bedrijven blijven ondersteunen bij kansrijke
hoger onderwijs en in de onderzoekswereld. In 2013 is de
innovatietrajecten.
zogenoemde Service Cloud van start gegaan, die onder zoekers in staat stelt bepaalde (web)services voor langere
SURFsara heeft in het kader van deze subsidie goede
tijd te laten draaien. Daarnaast zet SURFsara zich al geruime
afspraken gemaakt met het ministerie van EZ ter versterking
tijd in voor community clouds; de komst van SURFsara binnen
van het topsectorenbeleid en het ICT-doorbraakproject
SURF heeft dat in een stroomversnelling gebracht. In 2013 is
‘De Ambitieuze MKB-er innoveert met ICT’. Enerzijds helpen
een belangrijke stap gezet in de ontwikkeling van een federa-
deze programma’s bedrijven om hun concurrentiepositie
tieve cloud voor de onderwijs- en onderzoeksgemeenschap.
te versterken, anderzijds scheppen ze de mogelijkheid voor
In het voorjaar van 2014 komt de eerste dienst beschikbaar:
universiteiten en hogescholen om allianties met bedrijven
SURFdrive, een online dienst voor personal storage voor uni-
aan te gaan. SURFsara richt zich op twee speerpunten: de
versiteiten en hogescholen. Dat is een goed voorbeeld van de
inzet van HPC-technologie voor simulatie en modellering,
meerwaarde van de samenwerking tussen de twee werkmaat-
en het benutten van de mogelijkheden van Big Data.
schappijen: SURFnet en SURFsara, en de onderwijs- en onderzoeksinstellingen. Uiteindelijk heeft SURFsara een federatieve opzet van de gehele ICT-infrastructuur bij instellingen in het wetenschappelijk en hoger onderwijs voor ogen.
5
SURFSARA Jaarverslag 2013
CASE 1 CARTESIUS EN DE WITTE DWERGEN
Hoe komt het dat het oppervlak van een witte dwerg zo veel zware metalen bevat? Om deze vraag te beantwoorden, moest hoogleraar computationele astrofysica prof. dr. Simon Portegies Zwart met zijn promovendi het volledige zonnestelsel simuleren, met alle planeten en planetoïden. Het project is zowel een sterrenkundige als een computationele uitdaging: het leverde de onderzoekers de Wim Nieuwpoort Award 2013 op. Deze award wordt jaarlijks uitgereikt aan het team wetenschappers dat optimaal gebruik maakt van de nationale supercomputer bij SURFsara.
van enkele kilometers. In de tijd heb je aan de ene kant de levensduur van het zonnestelsel, 4,5 miljard jaar. Maar een ontmoeting tussen twee planetoïden speelt zich af op een tijdschaal van ongeveer 10 seconden. Daarmee loop je tegen de grenzen aan van wat een computer kan verwerken.”
COMPUTATIONELE ASTROFYSICA – SIMON PORTEGIES ZWART Twee doelstellingen Met dit onderzoek heeft de onderzoeksgroep van Portegies Zwart twee doelstellingen, een sterrenkundige en een Ons zonnestelsel bestaat uit een ster
door ze dicht bij elkaar komen, is die
computationele: “We kijken naar witte
(de zon), een klein aantal planeten en
zwaartekracht van belang.”
dwergen, sintels van sterren. Het blijkt
een paar honderdduizend brokstukken:
6
SURFSARA Jaarverslag 2013
dat de oppervlakte daarvan heel rijk is
de planetoïden. “Dat zijn brokken steen
Schaalprobleem
aan bepaalde zware metalen, zoals ijzer,
van een paar kilometer in doorsnee met
Onderzoekers die de interactie tussen
tin en lood. Die zouden eigenlijk al lang
een eigen baan om de zon”, zegt
planetoïden willen berekenen, worden
in die ster weggezonken moeten zijn.
Portegies Zwart (Universiteit Leiden).
geconfronteerd met een enorm schaal-
Een mogelijke verklaring is dat er sprake
“Door de zwaartekracht interageren
probleem, zowel in de ruimte als in de
is van een constante toestroom van
die brokstukken met elkaar. Planetoïden
tijd. “Je moet namelijk het gehele zon-
zware metalen vanuit de ruimte. Die
hebben een heel zwakke zwaartekracht,
nestelsel in je berekening betrekken”,
planetoïden zouden daar verantwoorde-
maar in de ruimte speelt die toch een
legt Portegies Zwart uit. “Tegelijkertijd
lijk voor kunnen zijn: of ze komen direct
rol. Vooral als ze banen hebben waar-
praat je bij botsingen over een schaal
in botsing met de ster, of ze komen met
elkaar in botsing en het gruis regent
is een van de prettigste instituten om
vervolgens op de ster. Dat onderzoeken
mee te werken. Het is een allround
we nu.”
High Performance Computing centrum. Juist datgene wat er omheen zit – de
De computationele doelstelling is dat
support – is heel belangrijk voor mij.
de onderzoekers dit zo efficiënt moge-
Alleen maar een snelle bak neerzetten
lijk willen uitrekenen met gebruikmaking
is niet voldoende.”
van de rekenkracht van een supercomputer. “We zijn in staat geweest om de code te schalen en heel efficiënt op Cartesius te draaien”, aldus Portegies Zwart. “Dat werkt inmiddels, dus nu kunnen we aan de slag met de sterrenkundige vragen. Dat is een langlopend onderzoek, we zijn op dit moment bezig met een berekening die al bijna een jaar
Prof. dr. Wim Nieuwpoort en prof. dr. Simon Portegies Zwart tijdens de uitreiking
loopt.”
van de Wim Nieuwpoort Award 2013.
Allround Portegies Zwart vindt SURFsara een fijn instituut om mee samen te werken: “Ze zijn snel, responsief en ze hebben expertise in huis over de apparatuur. Ik reken ook veel op grote supercom puters in het buitenland, maar SURFsara
7
SURFSARA Jaarverslag 2013
CASE 2 HET BLOED KRUIPT WAAR HET NIET GAAN KAN
Hoe kun je gezonde rode bloedlichamen scheiden van zieke? Hoe kun je de stroming van complexe vloeistoffen in zeer dunne buizen of haarvaten bevorderen? Alles wat met stroming te maken heeft, vormt het onderzoeksterrein van prof. dr. Jens Harting, universitair hoofddocent aan de Technische Universiteit Eindhoven. Voor zijn simulaties van stromingsmodellen en bloedcellen maakt hij gebruik van de supercomputer Cartesius bij SURFsara.
op de beweging en stroming van het bloed. Om de relevante parameters te kunnen bestuderen hebben we veel eenvoudige simulaties gedaan met één of enkele cellen. Nu willen we gaan werken met 3D-simulaties met duizenden cellen om complexe stromings
SIMULATIES VAN COMPLEXE STROMINGEN – JENS HARTING
processen te kunnen simuleren.” Cartesius Harting heeft in het afgelopen jaar voorbereidende simulaties doorgere-
8
SURFSARA Jaarverslag 2013
Bloed heeft een bijzondere samenstel-
Plastic zak
kend op Cartesius: zijn onderzoek vergt
ling, aldus Harting: “Het bestaat voor
Harting onderzoekt ook de eigenschap-
bijzonder veel rekenkracht. “Voor ons
45% uit rode bloedlichamen, de rest is
pen van individuele rode bloedlichamen:
nieuwe onderzoek vragen wij een sub-
voor het grootste deel bloedplasma.
“Een bloedlichaam is geen harde bol,
stantieel deel van de jaarlijkse capaciteit
Bloed is dan ook geen normale vloei-
je kunt het vergelijken met een gevulde
van Cartesius aan. Dat moet zijn vorm
stof, we noemen het een complex fluid.
plastic zak of een gelkussen: het is
nog krijgen en daarbij werken we nauw
Zo’n complex fluid heeft bijzondere
flexibel en je kunt het vervormen.
samen met medewerkers van SURFsara.
eigenschappen, bijvoorbeeld op het
Je kunt rode bloedlichamen nabootsen
Ze helpen bij de aanvraag, maar ze
gebied van de stromingssnelheid en
in een laboratorium en op die manier
helpen ook bij het optimaliseren van
de viscositeit. Die eigenschappen zijn
hun eigenschappen bestuderen. Maar
de code of het oplossen van technische
belangrijk als je onderzoek doet naar
wij werken met simulaties en proberen
problemen.”
de stroming van bloed door zeer
te begrijpen wat de invloed is van de
dunne haarvaten.”
eigenschappen van rode bloedlichamen
Toepassingen
bijvoorbeeld dicht bij het hart. Op die
Meer kennis over de stromingseigen-
manier kan medicatie heel gericht
schappen van bloed en rode bloed
worden toegediend.”
lichamen brengt allerlei toepassingen
Rode bloedlichaampjes kunnen worden beschreven als vaste bolvormige
dichterbij. “We proberen onder meer
lichamen die kunnen overlappen onder repulsieve interacties. Dit is op te
na te gaan of het mogelijk is om op
vatten als een versimpeld model voor celdeformatie waarmee we miljoenen
basis van deze eigenschappen zieke en gezonde bloedlichamen te sorteren
cellen op een supercomputer kunnen simuleren. Met dit model kunnen simulaties op een schaal ter grootte van millimeters worden uitgevoerd.
en te scheiden”, vertelt Harting. “Bij een gezond bloedlichaam heeft de viscositeit binnen de cel een bepaalde waarde. Maar als iemand malaria heeft, gaat de viscositeit omhoog en veranderen de eigenschappen van zo’n cel. Dat gegeven kun je gebruiken in een stromingsveld om zieke en gezonde cellen te sorteren. Een andere toepassing is de ontwikkeling van artificiële
Hoge resolutie 2D-simulaties van vesikels (blaasjes gevuld met vocht)
cellen die een rol kunnen hebben bij
als modellen voor rode bloedlichaampjes geven gedetailleerd inzicht in
het transporteren van medicijnen. Die kunstmatige cellen zouden gevuld kunnen worden met een medicijn, waardoor je ervoor kunt zorgen dat de concentratie van dat medicijn op bepaalde plaatsen heel hoog is,
9
SURFSARA Jaarverslag 2013
de hydrodynamische en mechanische interacties tussen individuele cellen. In dit voorbeeld zijn afbeeldingen opgenomen uit een simulatie van zes vesikels die door een nauwe doorgang worden geduwd. (Bron: arXiv:1403.3709).
2
INNOVATIEF ONDERZOEK DANKZIJ TOEGENOMEN REKENKRACHT
10
SURFSARA Jaarverslag 2013
De nieuwste technologie koppelen aan de vragen van onderzoekers binnen de academische gemeenschap en het bedrijfsleven. Dat is een van de belangrijkste uitdagingen waar SURFsara voor staat. Met de komst van de nieuwe nationale supercomputer Cartesius is de rekenkracht waarover onderzoekers kunnen beschikken, sterk toegenomen. De on-demand groei van Cartesius en het gebruik van energiezuinige componenten stelt SURFsara bovendien in staat om die rekenkracht zo groen mogelijk te realiseren. Daarmee kan Cartesius een hoge notering verwerven in de Green500, de wereldranglijst van de meest energie-efficiënte supercomputers. Daarnaast voorziet het nationale rekencluster Lisa in rekencapaciteit voor applicaties die niet direct een supercomputer nodig hebben. >
Ingebruikname Cartesius
Cartesius is de snelste supercomputer van Nederland; hij is
Hoewel Cartesius al enige weken daarvoor in gebruik
100.000 keer sneller dan een gemiddelde pc. Staatssecretaris
was bij ‘early birds’ vond de officiële inauguratie plaats op
Dekker onderstreepte het belang van het nieuwe systeem voor
14 juni 2013. Op die dag nam staatssecretaris Dekker (OCW)
de onderzoeksgemeenschap én het bedrijfsleven: “Cartesius
Cartesius officieel in gebruik door het geven van een symboli-
stelt onze wetenschappers in staat om tot belangrijke nieuwe
sche rekenopdracht. De nieuwe nationale supercomputer is in
wetenschappelijke inzichten te komen, en misschien wel door-
financieel opzicht mogelijk gemaakt door SURF, met bijdragen
braken te forceren. Maar dat niet alleen: bedrijven staan te
van de Nederlandse Organisatie voor Wetenschappelijk
popelen om die doorbraken te transformeren tot innovaties die
Onderzoek (NWO), het ministerie van Onderwijs, Cultuur
voor miljoenen omzet kunnen zorgen. De nieuwe supercomputer
en Wetenschap en het ministerie van Economische Zaken.
is dan ook van groot belang voor onze kenniseconomie.”
Drs. Sander Dekker, staatssecretaris OCW.
De ingebruikname van Cartesius vond plaats tijdens het symposium ‘Computing of the Future’ dat SURFsara voor die gelegenheid had georganiseerd. In de ochtend lieten onderzoekers zien welke bijdragen Cartesius kan leveren aan het verkrijgen van snelle en nieuwe onderzoeksresultaten. GEBRUIK CARTESIUS PER WETENSCHAPSGEBIED
In de middag lag de nadruk meer op de organisatorische en internationale context van de supercomputer. Ook de
Computational Chemistry 31,81%
technology transfer tussen wetenschap en bedrijfsleven
Computational Fluid Dynamics 18,24%
kreeg daarbij veel aandacht.
Earth and Climate Science 24,13% Life Sciences – Bioinformatics 6,2% Condensed Matter Physics 6,91%
Uitbreiding Cartesius met GPGPU’s Cartesius groeit geleidelijk naar de uiteindelijke capaciteit toe. Die groei gaat on demand, waarbij de wensen en eisen van de onderzoekers centraal staan. Eind 2013 is besloten
Astronomy and Cosmology 11,15%
om Cartesius uit te breiden met GPGPU’s (General-Purpose
Life Sciences – Computational Biology 1,28%
Graphics Processing Units). Deze zogenoemde accelerators
Other 0,28%
combineren de rekenkracht van grafische kaarten (GPU’s) met die van CPU’s. Vooral onderzoekers binnen de moleculaire dynamica, astrofysica en klimatologie kunnen profijt hebben van deze innovatieve processors. Rekenen op GPGPU’s zorgt voor aanzienlijke versnellingen en bespaart dus tijd en energie.
11
SURFSARA Jaarverslag 2013
In 2013 is geïnventariseerd hoeveel belangstelling er bin-
De totale peak performance van Cartesius wordt hiermee
nen de doelgroep was voor een uitbreiding met GPGPU’s
met ruim 200 TFlop/s uitgebreid tot ongeveer 470 TFlop/s.
en wat het belang daarvan voor de wetenschap was. Het
Dick Fens, directeur Bull Nederland, en
resultaat van deze inventarisatie heeft ertoe geleid om met
In de loop van 2014 zal Cartesius zijn uiteindelijke capaciteit
Bull, de leverancier van Cartesius, in gesprek te gaan over
van meer dan 1 PFlop/s bereiken. Ook die uitbreiding zal
deze uitbreiding. Eind 2013 is een tijdelijk testsysteem in
weer on demand en in nauw overleg met de onderzoeks
werking gesteld. In het voorjaar van 2014 worden de
gemeenschap plaatsvinden. Het precieze moment hangt
nieuwste NVIDIA-processors geïnstalleerd. De uitbreiding
mede af van het moment waarop de leverancier de beno
omvat 66 compute nodes met in totaal 132 GPGPU’s.
digde hardware kan leveren. Deze aanpak zorgt ervoor dat
SURFsara-directeur Anwar Osseyran.
SURFsara steeds over de nieuwste technologieën kan beschikken. Lisa: Center of competence Ook de overige systemen die deel uitmaken van de infra
GEBRUIK VAN HET DEEL VAN LISA DAT LANDELIJK BESCHIKBAAR IS VIA NWO
structuur van SURFsara worden voortdurend aangepast aan de veranderende behoeften van de onderzoeksgemeenschap.
Universiteit Leiden 20,77%
Dat geldt ook voor Lisa, het belangrijkste rekencluster van
TU Delft 18,99%
SURFsara. Lisa is een belangrijk instrument voor onderzoekers
Radboud Universiteit 16,80% Universiteit Twente 10,89% Rijksuniversiteit Groningen 9,16%
die omvangrijke berekeningen willen uitvoeren, maar die niet de specifieke eigenschappen van een supercomputer nodig hebben. Het nationaal rekencluster Lisa voorziet enerzijds in de
Universiteit Utrecht 7,99%
landelijke behoefte aan dergelijke rekencapaciteit, anderzijds
Technische Universiteit Eindhoven 5,37%
zijn er partijen die een aandeel hebben in het systeem: de
Vrije Universiteit Amsterdam 5,00% Erasmus Universiteit Rotterdam 4,84% Wageningen UR 0,19%
Universiteit van Amsterdam (UvA) en de Vrije Universiteit (VU). Dit heeft tot gevolg dat Lisa bestaat uit een groot aantal componenten die op verschillende momenten zijn geïnstalleerd. Eind 2013 heeft een aanzienlijk deel van deze componenten het einde van de onderhoudscyclus bereikt. In 2014 zal het cluster daarom een upgrade ondergaan, conform de eisen van de gebruikers.
12
SURFSARA Jaarverslag 2013
Ook bij Lisa worden innovatieve technologieën ingezet om
Deze cursussen, waarin de deelnemers de gelegenheid krijgen
de performance te vergroten. Daarbij gaat het om de inzet
echt de diepte in te gaan, trekken veel belangstellenden.
van Intel Xeon Phi-processors, die geleverd worden door Dell. De Xeon Phi is een zogenoemde many core processor:
Grensoverschrijdend onderzoek
waar de meer traditionele processors 10 of 12 cores (reken
Onderzoek kent geen grenzen: de nationale rekencentra in
kernen) bevatten, is dat bij de Xeon Phi ongeveer 60 cores.
Europa werken nauw samen. Die samenwerking krijgt onder
Ook dat is een manier (naast de GPGPU’s) om het draaien
meer gestalte binnen PRACE (Partnership for Advanced
van applicaties te versnellen. Het is de bedoeling dat
Computing in Europe). PRACE biedt toegang tot een
SURFsara een Center of competence wordt waar het gaat
HPC-infrastructuur van wereldklasse, waarin de Europese
om het gebruik van deze technologie.
Tier-0- en Tier-1-supercomputers zijn opgenomen. Dit stelt onderzoekers in staat om te rekenen op supercomputers
Infrastructuur toegankelijk maken
in andere Europese landen; ze kunnen dan terecht op die
De systemen kunnen steeds meer, maar vragen in sommige
supercomputer die het beste bij hun applicatie past. Elk
gevallen ook meer van de gebruikers. Hoewel SURFsara
deelnemend rekencentrum stelt rekentijd beschikbaar (5-10%)
ernaar streeft de toegang zo laagdrempelig mogelijk te
voor buitenlandse onderzoekers en wisselt die rekentijd uit
houden, zijn ondersteuning en opleidingen onontbeerlijk.
met andere centra. In 2013 hebben in dat kader verschillende
Ook de ondersteuning wordt zo veel mogelijk ingericht
buitenlandse onderzoekers gebruik gemaakt van Cartesius.
vanuit de wensen van de gebruikers. SURFsara kijkt onder
Daarnaast kunnen onderzoekers rekentijd aanvragen op de
meer naar de 25 meest gebruikte applicaties op een systeem
Europese Tier-0-supercomputers in het kader van PRACE.
en onderzoekt hoe deze applicaties zo goed en parallel mogelijk kunnen worden ingezet. Soms leggen onderzoekers
Ook in Europees verband ziet men het belang van de
zelf hun applicaties voor aan SURFsara om te laten onder
samenwerking tussen onderzoeksinstellingen en bedrijfsleven
zoeken welke verbeteringen mogelijk zijn. Daarnaast is er
als het gaat om innovatie. PRACE heeft hier een speciaal
uiteraard een helpdesk met ondersteuning voor het oplossen
programma voor geïntroduceerd: SHAPE. Dit programma
van reguliere problemen.
wil kleine en middelgrote ondernemingen (mkb) stimuleren meer gebruik te maken van HPC-toepassingen bij hun
SURFsara organiseert regelmatig cursussen om onderzoekers
productontwikkeling en voorziet deze ondernemingen van
te leren optimaal van de (nieuwe) systemen gebruik te maken.
de benodigde expertise. Een ander Europees programma
Zo organiseert SURFsara cursussen over parallellisatie. Ook
is Fortissimo, eveneens gericht op de inzet van High
is er in 2013 weer een HPC-cursus over Lisa gehouden, waar-
Performance Computing binnen het mkb. Meer over dit
bij gebruikers best practices kunnen uitwisselen. Dat stelt
programma leest u in het hoofdstuk over Innoveren met
hen in staat om te profiteren van ervaringen en toepassingen
HPC (zie pagina 52).
die andere gebruikers hebben bedacht of ontwikkeld. 13
SURFSARA Jaarverslag 2013
CASE 3 GENETISCHE OORZAKEN VAN PSYCHIATRISCHE ZIEKTES
Kennis over de relatie tussen genetische varianten en psychiatrische aandoeningen neemt snel toe. Met duizenden varianten die betrokken kunnen zijn bij één enkele aandoening blijkt die relatie echter veel complexer te zijn dan tot voor kort werd aangenomen. Met behulp van computationele analyse vergroten genetici hun inzicht in het relatieve belang van genetische varianten. Het onderzoeksteam van prof. dr. Danielle Posthuma, hoogleraar psychiatrische genetica aan de Vrije Universiteit Amsterdam (VU), maakt daarbij intensief gebruik van het rekencluster Lisa bij SURFsara.
Posthuma: “Onze grootste dataset is die voor schizofrenie, waarin gegevens van 70.000 patiënten en 110.000 controles (gezonde personen) zijn opgenomen. Van elke controle hebben we één miljoen genetische varianten gemeten. Voor de analyse hebben dan ook veel rekencapaciteit nodig. Bij SURFsara
GENETISCH ONDERZOEK – DANIELLE POSTHUMA
gebruiken we het rekencluster Lisa voor statistische analyses: we kijken per gemeten variant of die vaker in patiënten voorkomt dan in controles. Daarnaast doen we op Lisa ook ge-
“Sinds een paar jaar weten we dat
effect heeft. Iemand met een depressie
avanceerdere analyses, bijvoorbeeld
psychiatrische ziektes door heel veel
heeft ook niet alle genvarianten die we
naar de interactie tussen verschillende
varianten worden veroorzaakt”, zegt
associëren met depressie, maar mis-
genetische varianten en naar het effect
Posthuma. “Vroeger dachten we dat
schien een paar honderd. Dat maakt
van meerdere varianten uit hetzelfde
één gen verantwoordelijk was voor
het lastig om alle relevante genen in
biologische pathway.”
depressie, maar nu weten we dat het
kaart te brengen.” Uitbreiding van Lisa
er minstens duizend zijn, misschien wel
14
SURFSARA Jaarverslag 2013
achtduizend. Dat geldt voor alle aan-
Omvangrijke datasets
De samenwerking met SURFsara is
doeningen die we onderzocht hebben,
Voor het onderzoek werken de VU-
intensief, stelt Posthuma: “In 2006
zoals depressie, schizofrenie, autisme
onderzoekers samen in internationale
zijn we begonnen met rekenen op
en ADHD. Maar dat betekent ook dat
consortia. Binnen die consortia worden
projectbasis. Maar onze behoefte
elke individuele variant maar een klein
omvangrijke datasets gedeeld, aldus
aan rekenkracht werd al snel groter.
Op een gegeven moment hebben we
varianten die bij een psychiatrische
met subsidie van NWO een uitbreiding
aandoening betrokken zijn. Als we
op het Lisa-cluster kunnen financieren.
weten welke genen betrokken zijn bij
Sindsdien werken we structureel met
een aandoening, weten we nog niet
SURFsara samen. Maar we groeien qua
hoe dat werkt. Dat is de volgende
capaciteit uit ons jasje, de schaal waar-
uitdaging: we moeten de stap maken
op we onze analyses doen groeit sneller
van een statistisch verband naar een
dan de infrastructuur. We breiden Lisa
causaal verband.”
verder uit, we hebben inmiddels zelf een TeraByte-server aangekocht en zijn bezig met het aankopen van een high memory node. Onze investeringen in Lisa zijn nodig om de omvangrijke datasets in het geheugen te kunnen laden en te analyseren.” Van statistiek tot therapie Begin 2014 hebben de onderzoekers bij de VU opnieuw een forse subsidie van NWO ontvangen. “Ook in 2014 gaan we weer veel rekenen op Lisa”, zegt Posthuma. “Een van de doelen is nieuwe methodes te ontwikkelen om meer inzicht te krijgen in het relatieve belang van de duizenden genetische
15
SURFSARA Jaarverslag 2013
CASE 4 SHOTGUN SEQUENCING VOOR MEER INZICHT IN MONDGEZONDHEID
Bij tandheelkunde denkt de gemiddelde leek niet direct aan High Performance Computing. Maar schijn bedriegt: sinds 2006 maakt sequencing, waarbij bacteriën worden geïdentificeerd aan de hand van genetische informatie, deel uit van de gereedschapskist van de tandheelkundig onderzoeker. Dr. Egija Zaura, verbonden aan de afdeling preventieve tandheelkunde bij Academisch Centrum Tandheelkunde Amsterdam (ACTA), een samenwerkingsverband van UvA en VU, vertelt over de ontwikkelingen.
binnen het Human Microbiome Project (HMP), waarbij de bacteriële samenstelling op allerlei plekken in het menselijk lichaam in kaart wordt gebracht. Daarbinnen wordt veel open sourcemateriaal ontwikkeld. Wij maken gebruik van een zogenoemde pipeline (een hulpmiddel bij sequencing), die is
PREVENTIEVE TANDHEELKUNDE – EGIJA ZAURA
ontwikkeld binnen het HMP. Die pipeline is geïnstalleerd op het rekencluster Lisa bij SURFsara en stelt ons onder meer in staat om grafische analyses uit te voeren.”
Oorspronkelijk werkten de onderzoekers
een patiënt bevinden en in welke ver-
bij ACTA met eenvoudige in vitro model-
houdingen. Wij waren wereldwijd de
Metagenoom
len, maar die aanpak gaf onvoldoende
eerste om die techniek toe te passen op
Sinds 2011 heeft ACTA een eigen bio-
inzicht in de complexe interactie van
klinische monsters in de tandheelkunde.”
informaticus in dienst. Dat was nodig,
bacteriën in de mond. “We zijn toen
16
SURFSARA Jaarverslag 2013
want de hoeveelheid data neemt alleen
gaan onderzoeken welke tools daarvoor
Human Microbiome Project
beschikbaar zijn”, zegt Zaura. “In 2006
Omdat deze techniek zo veelbelovend
behulp van het 16S rRNA-gen, waarmee
kwam de techniek 454 pyrosequencing
was, wilde ACTA zelf analyses kunnen
je bacteriën kunt identificeren, doen
beschikbaar, die het mogelijk maakt mil-
uitvoeren, aldus Zaura: “In 2010 hebben
we tegenwoordig ook aan shotgun
joenen bacteriën parallel te sequencen.
we contact gelegd met SURFsara en
sequencing”, vertelt Zaura. “We halen
Op basis daarvan kun je vaststellen
zijn we gestart met analyses. We maken
een monster als het ware door de
welke bacteriën zich in de mond van
gebruik van kennis die ontwikkeld is
gehaktmolen en analyseren kleine
maar toe: “Behalve de analyse met
stukjes van alle aanwezige genen. Al die
Figure 3. Salivary microbiome data by Candida load.
stukjes worden gesequenced en dat levert een zogenoemd metagenoom op. Aan de hand daarvan kunnen we ook functies van bacteriën vaststellen. We onderzoeken bijvoorbeeld het verschil in eigenschappen van bacteriën uit een monster met cariës of parodontitis en bacteriën uit een gezonde mond.” Samenwerking Door de grote hoeveelheid data die shotgun sequencing oplevert, wordt dataverwerking (en dus rekenkracht) steeds belangrijker, maar ook dataopslag is cruciaal voor het onderzoek van ACTA. Naast het rekencluster Lisa maakt ACTA dan ook gebruik van dataopslagfaciliteiten bij SURFsara. Zaura: “De lijnen zijn heel kort en de mensen bij SURFsara denken goed met ons mee. Ook in de beginfase, toen we bezig waren met het opzetten van een plan van aanpak, hebben we veel ondersteuning gekregen. De medewerkers zijn erg behulpzaam en creatief in het vinden van oplossingen.”
17
SURFSARA Jaarverslag 2013
Kraneveld EA, Buijs MJ, Bonder MJ, Visser M, et al. (2012) The Relation between Oral Candida Load and Bacterial Microbiome Profiles in Dutch Older Adults. PLoS ONE 7(8): e42770. doi:10.1371/journal.pone.0042770 http://www.plosone.org/article/info:doi/10.1371/journal.pone.0042770
Salivary microbiome data is plotted as OTU-based Principal Component Analysis (PCA) plot by Candida load in A) all subjects (N = 82) and in B) dentate subjects only (N = 34). Samples are colored by Candida load: green - low, blue medium and red - high Candida load. Arrow indicates the main PC direction between low and high Candida load samples.
CASE 5 ZONNECELLEN VERBETEREN MET NANOSTRUCTUREN
De efficiency van zonnecellen verbeteren en tegelijkertijd de kosten beperken: dat is de missie van Piero Spinelli (postdoc) en Claire van Lare (PhD-student) bij AMOLF. Ze maken gebruik van hoge resolutie simulaties om het optimale patroon van nanodeeltjes op een zonnecel te berekenen.
Optimaal patroon Simulaties helpen om de optimale geometrie voor nanodeeltjes te vinden, stelt Spinelli: “We kunnen het formaat van de deeltjes veranderen of de manier
NANOFOTONICA – SPINELLI EN VAN LARE
waarop ze op de zonnecel worden aangebracht. Als we het beste patroon hebben vastgesteld, bouwen we de zonnecel.” De simulaties hebben een driedimensionale opbouw met alle
Spinelli en Van Lare werken allebei
Daarvoor hebben we simulaties nodig,
lagen die gebruikt worden in een echte
mee in het onderzoeksprogramma van
en voor simulaties gebruiken we het
zonnecel, zegt Van Lare: “We voegen
prof. dr. Albert Polman. Het onderzoeks-
rekencluster Lisa bij SURFsara.”
de nanodeeltjes toe en we simuleren
thema van deze groep is nanofotonica:
18
SURFSARA Jaarverslag 2013
wat er gebeurt als het licht in de cel
de beheersing, het begrip en de toepas-
Hoe vang je licht?
valt. We hebben het rekencluster Lisa
sing van licht op nanoschaal. “Ons werk
De uitdaging waarvoor Spinelli en Van
nodig voor deze omvangrijke simulaties,
bestaat enerzijds uit experimenten en
Lare staan is een manier te vinden om
want ze gaan de capaciteiten van onze
anderzijds uit theorievorming en simu
licht te vangen in een zonnecel. Van
eigen systemen te boven. Dat geldt
laties”, legt Spinelli uit. “We doen beide.
Lare: “Om kosten te besparen, maken
voor zowel de geheugenopslag als de
Bij AMOLF maken we gebruik van
we de cellen zo dun mogelijk. Maar als
rekenkracht.”
nanotechnieken om nanodeeltjes toe
je een zonnecel dun maakt, absorbeert
te voegen aan zonnecellen. Maar we
hij minder licht, omdat het licht er door-
Meer efficiency, lagere kosten
willen ook de fysica erachter begrijpen
heen gaat. Daarom voegen we nanodeel-
Volgens Spinelli zijn de resultaten tot nu
en meer leren over de manier waarop
tjes toe: zij verspreiden het licht en stel-
toe veelbelovend: “Door het optimale
we licht in zonnecellen kunnen vangen.
len ons in staat licht in de cel te vangen.”
patroon van nanodeeltjes te gebruiken,
kunnen we de efficiency van een zon necel met een paar procent verhogen, bijvoorbeeld van 20% to 22%. Dat lijkt misschien niet veel, maar in de wereld van de zonnecellen is dat heel wat.” Maar het gaat niet alleen om efficiency: “Ons onderzoek maakt het mogelijk zonnecellen te ontwikkelen die veel dunner zijn, omdat het licht erin wordt gevangen”, zegt Van Lare. “Die cellen bevatten minder materiaal en zijn daardoor goedkoper, terwijl de efficiency gelijk blijft.”
19
SURFSARA Jaarverslag 2013
CASE 6 VAN ELEKTRONENSTRUCTUUR TOT WATERSTOFCEL
Hoe kun je magnetische materialen inzetten bij de productie van waterstof? Hoe kun je waterstof opslaan zonder zware opslagtanks te gebruiken? Dit zijn twee vragen die de aandacht hebben van prof. dr. Robert de Groot en dr. ir. Gilles de Wijs van de onderzoeksgroep Electronic Structure of Materials (ESM) bij de Radboud Universiteit Nijmegen: “Werk je vanuit de kwantumtheorie en wil je materiaaleigenschappen zo nauwkeurig mogelijk doorrekenen, dan kom je bij ons terecht.” ELEKTRONENSTRUCTUUR VAN MATERIALEN – GILLES DE WIJS
De onderzoeksgroep ESM doet onder
dus open voor natuurkundige vragen
leiding van professor Rob de Groot veel
van andere onderzoeksgroepen. Vaak
materiaalonderzoek op het gebied van
gaat het om vragen die met energie
de elektronenstructuur. “Wij kijken wat
te maken hebben. Denk aan onderzoek
de eigenschappen van een materiaal
naar materialen die gebruikt worden
zijn en gaan na of we die eigenschap-
in zonnecellen of magneto-calorische
pen kunnen doorrekenen en begrijpen
materialen voor nieuwe generatie
vanuit de elektronenstructuur”, zegt
koelkasten.”
De Wijs. “Via de Stichting voor Funda-
20
SURFSARA Jaarverslag 2013
(a) Elektron-spindichtheid van het rutheniumoxide oppervlak [RuO2(112)] en (b) het oppervlak met een zuurstof erop geadsorbeerd. Grijze en zwarte bollen
menteel Onderzoek der Materie (FOM)
Magnetische eigenschappen
vervullen we de rol van nationaal
Een van de onderzoeksthema’s con
centrum, samen met onze zustergroep
centreert zich op materialen die op
het impulsmoment nodig om O2 in z’n magnetische
van de Universiteit Twente. We staan
zich niet magnetisch zijn, maar die
grondtoestand te maken.
representeren ruthenium en zuurstof respectievelijk. Het omkeren van de spins aan het oppervlak levert
aan één oppervlak magnetische eigen-
tanks, waarin waterstof onder een zeer
ons niet bezig hoeven te houden met
schappen (momenten) kunnen ontwik-
hoge druk wordt opgeslagen. De zware
het beheer van het systeem en toch
kelen. Zo’n materiaal kan fungeren als
tank is een nadeel, aldus De Wijs: “De
grootschalige rekenkracht ter beschik-
een anode bij de elektrolyse van water,
ideale oplossing zou zijn als je waterstof
king hebben.” De Wijs is ook te spreken
legt De Wijs uit: “Bij elektrolyse wordt
met een materiaal kunt laten reageren.
over de substantiële uitbreiding die het
water gesplitst in waterstof en zuurstof.
Je zoekt dan een materiaal waaraan het
Lisa-cluster in 2013 heeft ondergaan:
Die zuurstof heeft zelf een lokaal
waterstof ook weer makkelijk ontrokken
“Ik vind dat het systeem in de afgelopen
magnetisch moment: als je vloeibare
kan worden. Dergelijke materialen zijn
jaren steeds beter is geworden. Met de
zuurstof over een magneet giet, blijft
vaak te zwaar. Wij onderzoeken lichtere
huidige configuratie is de rekenkracht
het plakken. Dat magnetisch moment
materialen en hebben onder meer
sterk toegenomen.”
levert een extra potentiaalverschil op
doorgerekend of nanostructuren hier-
dat je moet overwinnen in de elektrolyse
voor een oplossing kunnen bieden.”
omdat je zuurstof niet in zijn grondtoestand kan vormen. Het materiaal dat
Grootverbruiker
Nano-cluster van waterstofopslag materiaal
we onderzoeken, zorgt voor een extra
De ESM-groep is een van de grote
lithiumboorhydride, (LiBH4)12. Dit materiaal kan
impulsmoment dat je nodig hebt om
rekenaars op het rekencluster Lisa.
waterstofgas (H2) geven in een reactie naar
zuurstof juist wel te vormen in zijn mag-
De meerjarige samenwerking met
andere nano-deeltjes.
netische grondtoestand. Dat hebben
SURFsara bevalt goed, zegt De Wijs:
we het afgelopen jaar doorgerekend
“We vinden het heel prettig dat er veel
op het rekencluster Lisa bij SURFsara.”
expertise aanwezig is. De medewerkers van SURFsara zorgen voor de beschik-
Grotere nano-clusters van lithiumboorhydride: (LiBH4)54 en (LiBH4)56. De cluster met 54 eenheden LiBH4 is gemaakt met een simulated annealling. De cluster van 56 eenheden is gemaakt uit een
Waterstofopslag
baarheid van het rekencluster en het
Bij gebruik van waterstof als brandstof
netwerk. Bij problemen wordt er altijd
is de opslag altijd een probleem. De
voor een goede oplossing gezorgd.
lijken al sterk op die van het bulk kristal, i.t.t. tot
industrie werkt met zware hogedruk-
Verder is een groot voordeel dat we
de kleinere clusters als (LiBH4)12.
21
SURFSARA Jaarverslag 2013
klein stukje genomen uit het bulk materiaal. De bindingseigenschappen van deze clusters
3
BIG DATA LEGT DE BASIS VOOR BIG SCIENCE
22
SURFSARA Jaarverslag 2013
In alle wetenschapsgebieden neemt de hoeveelheid opgeslagen data snel toe. Dat geldt al jaren voor de natuurwetenschappen, maar in toenemende mate ook voor de life sciences en de taalwetenschappen. Voor SURFsara betekent deze toe name een uitdaging op het gebied van beheer en toegankelijkheid van data. In 2013 zijn hierin forse stappen gezet; dat geldt ook voor de mogelijkheden voor analyse van complexe data met behulp van het Hadoop-rekencluster. >
SURFsara heeft in de afgelopen periode een sterke groei
opgevraagd. Deze analyse heeft inmiddels geresulteerd
gezien van het volume aan opgeslagen onderzoeksdata.
in de identificatie van meerdere pulsars.
Bedroeg de totale hoeveelheid begin 2013 ongeveer 7,5 PetaByte, begin 2014 stond de teller al op ruim 12 PetaByte (zie tabel). De grootste gebruikers zijn nog
NOBELPRIJS VOOR NAAMGEVER HIGGS-DEELTJE
steeds de Large Hadron Collider (van CERN bij Genève)
De Belgische theoreticus François Englert (80) en de
en LOFAR. Maar ook onderzoek in de life sciences levert
Schot Peter Higgs (84) hebben in 2013 de Nobelprijs
omvangrijke databestanden op (denk bijvoorbeeld aan
voor de Natuurkunde gewonnen. Zij ontvingen de
DNA sequencing).
prijs voor hun voorspelling (al in 1964) van het Higgsmechanisme en het bijbehorende Higgs-deeltje. Het bestaan van het deeltje werd op 4 juli 2012 bevestigd
ONTWIKKELING DATAOPSLAG SURFSARA (IN GIGABYTE):
door het Europees Centrum voor deeltjesonderzoek. Een deel van de relevante data wordt opgeslagen
1-1-2013 1-1-2014 Toename
Factor
bij en gedeeld via de Tier-1-faciliteit bij Nikhef en SURFsara.
LHC/ATLAS
3199
3930
731
1,23
LHC/LHCb
1399
1403
4
1,00
LOFAR
1735
5068
3333
2,92
Anderen
1133
1822
689
1,61
Nieuwe cartridges, meer capaciteit
Totaal
7466
12223
4757
1,64
Data werd tot voor kort opgeslagen op cartridges met een
De sterk groeiende dataopslag stelt eisen aan de hardware. capaciteit van 1 TeraByte per cartridge. Sinds 2013 zijn echter cartridges beschikbaar met een capaciteit van 5 TeraByte.
In 2013 was LOFAR de sterkste groeier. LOFAR is een
SURFsara is begonnen met de migratie naar deze nieuwe
astronomisch meetinstrument met een zeer groot aantal
technologie. In 2013 is onder meer alle data van LHC/ATLAS
antennes in de noordelijke provincies en het Duitse grens
gemigreerd; in totaal gaat het hierbij om 3,5 PetaByte aan
gebied. Deze antennes leveren een toenemende stroom
data.
aan onderzoeksdata. In 2013 heeft deze datastroom die van
23
SURFSARA Jaarverslag 2013
ATLAS, onderdeel van de Large Hadron Collider, gepasseerd.
In de komende jaren wordt niet alleen de resterende data
De datastroom vanuit LOFAR zal in 2014 naar verwachting
gemigreerd naar nieuwe cartridges, maar vervangt SURFsara
groter zijn dan de data die SURFsara van de Large Hadron
ook de tape drives. Dat maakt het mogelijk om de nieuwe
Collider opslaat. Bovendien is men in 2013 ook begonnen
cartridges te gebruiken met meer opslagcapaciteit: 8,5 in
met de analyse van LOFAR-data, zodat ook weer grote
plaats van 5 TeraByte. De combinatie van nieuwe cartridges
hoeveelheden (één PetaByte) opslagen data worden
met nieuwe tape drives zorgt er dus voor dat de totale
opslagcapaciteit bij SURFsara met een factor 8,5 zal
nemers uit onderzoek te doen naar een database met zes mil-
toenemen. In totaal beschikken de tape libraries van
jard webpagina’s (de zogenoemde Common Crawl-database).
SURFsara over 20.000 slots, wat de totaal beschikbare
De prijs ging naar een groep van drie onderzoekers van de
capaciteit op 170 PetaByte brengt.
Universiteit Twente. Hun onderzoek was gericht op woordpa-
Hadoop en Twitter
der van deze groep won een reis naar de SIGIR2013-conferentie
Voor de analyse van omvangrijke en complexe data heeft
in Dublin en heeft de resultaten gepresenteerd op de Hadoop
SURFsara in 2012 een Hadoop-rekencluster ingericht. Hadoop
Summit-conferentie in Amsterdam.
ren: woorden die vaak in combinatie voorkomen. De aanvoer-
stelt gebruikers in staat om grote hoeveelheden ongestruc tureerde data te analyseren. Het systeem is in 2012 geïnstal-
Toegankelijkheid van data: EUDAT
leerd, maar de grote belangstelling maakt voortdurende
Grootschalig onderzoek is bijna per definitie grensoverschrij-
uitbreiding noodzakelijk. Eind 2013 bestond het cluster uit
dend. De toenemende stroom onderzoeksdata in combinatie
900 cores en 900 TeraByte aan opslagcapaciteit. Ook in
met het grensoverschrijdende gebruik stelt hoge eisen aan
2014 is een aanzienlijke groei voorzien.
beheer en toegankelijkheid van data. SURFsara is in dat verband partner in het Europese project EUDAT. EUDAT richt
Hadoop wordt veel gebruikt, onder andere binnen de
zich op de ontwikkeling van een zogenoemde Collaborative
informatiewetenschappen en voor analyse van internetdata.
Data Infrastructure: een data-infrastructuur die het onder
Een goed voorbeeld is het project TwiNL, een samenwerkings-
zoekers gemakkelijker maakt om samen te werken en onder-
verband tussen de Radboud Universiteit Nijmegen, het
zoeksdata te beheren en te delen.
Netherlands eScience Center en SURFsara. Dit project is gericht op de analyse van grote hoeveelheden Nederlandse
SURFsara heeft ook in 2013 gewerkt aan de ontwikkeling
tweets. Gebruikers kunnen zoeken op woord, plaats, datum
van diensten die het beheer van data vereenvoudigen. Bij
en omgeving; de resultaten kunnen in grafieken worden
die ontwikkeling werkt SURFsara samen met onder meer
weergegeven. Zo is bijvoorbeeld te achterhalen waar en
het Max Planck Instituut (Nijmegen) en het KNMI (De Bilt).
wanneer het woord ‘griep’ voorkomt in Nederlandse tweets
Daarbij gaat het om zogenoemde data respository services:
en kan een griepepidemie in kaart worden gebracht.
het beheer van grootschalige datasets. Tot nu toe vindt dat
Met behulp van heatmaps kan een gebruiker zien op welke
beheer vaak plaats op het niveau van bitwise preservation:
plaatsen veel getwitterd is over een bepaald onderwerp.
het behoud van data. SURFsara richt zich er vooral op de
Voor meer informatie zie twiqs.nl.
datasets toegankelijk(er) te maken, zodat ze gemakkelijker vindbaar zijn en voorzien zijn van essentiële informatie. In de
24
SURFSARA Jaarverslag 2013
Hadoop speelde ook een hoofdrol bij de Norvig Award, die
afgelopen periode is onder meer gewerkt aan het toevoegen
op 18 maart 2013 is uitgereikt. Deze prijsvraag, genoemd naar
van persistent identifiers: een soort ISBN-code voor data,
Peter Norvig (directeur onderzoek bij Google), daagde deel-
die onlosmakelijk gekoppeld is en altijd blijft bestaan, ook
als de data wordt verplaatst. In 2014 wil SURFsara komen tot
Innovatie met NoSQL
een trusted digital repository, een gecertificeerd systeem met
De snelle ontwikkelingen op het gebied van Big Data vragen
een data seal of approval. Dat houdt in dat alle procedures
om voortdurende aandacht voor innovatie. Voor de opslag
voor databeheer duidelijk beschreven zijn volgens vaste
van Big Data heeft SURFsara vorig jaar een NoSQL-cluster
standaarden.
aangeschaft. Traditionele databases werken met SQL, een standaardtaal voor het management van databases.
Long tail data
Het bezwaar daarvan is dat een traditionele database schaalt
Veel wetenschappelijke data wordt voor een lange tijd
tot een bepaald niveau, maar in het geval van Big Data is
opgeslagen. Sommige onderzoekscommunities hebben
dat onvoldoende. SURFsara evalueert nu de mogelijkheden
daar afspraken over gemaakt, maar voor veel onderzoekers
van NoSQL en wil in 2014 onder meer HBase (de Hadoop-
(die vaak niet georganiseerd zijn in communities) is de
database) aanbieden op basis van deze technologie.
opslag en toegankelijkheid van die long tail data een probleem. Voor die doelgroep ontwikkelt SURFsara binnen
NoSQL en Hadoop staan ook op het programma van de
EUDAT een zogenoemde B2SHARE-service: een repository
meerdaagse Big Data-opleiding, die verschillende malen
service voor long tail data. In de B2SHARE-service kunnen
per jaar bij het IIR wordt gehouden. Twee medewerkers
metadata templates worden verwerkt voor verschillende
van SURFsara verzorgen hiervoor een opleidingsdag
soorten communities en wetenschapsdomeinen. Die tem-
waarin NoSQL en Hadoop centraal staan.
plates kunnen aangeven hoe de data gemaakt is, met welke instrumenten, wanneer en door wie. Dit verbetert de kwaliteit en herbruikbaarheid van onderzoeksdata en biedt onderzoekers de mogelijkheid om ook na tien jaar nog iets met die data te doen. European Grid Initiative Een andere Europese samenwerkingsvorm is het European Grid Initiative (EGI). EGI richt zich op de samenwerking en innovatie van de generieke grid-infrastructuur binnen Europa. De EGI-organisatie is gehuisvest in het gebouw SURF Science Park, waar ook SURFsara en het Netherlands eScience Center gevestigd zijn.
25
SURFSARA Jaarverslag 2013
CASE 7 VAN GENETISCHE CORRELATIE NAAR BEGRIP VAN ZIEKTEN
Het BIOS Consortium is een omvangrijk onderzoeksproject, gefinancierd door de Nederlandse Biobanking and Biomolecular Research Infrastructure. Het project richt zich op de mechanismen achter de relatie tussen genetische variatie en ziekte. Zes universitaire medische centra (in Groningen, Amsterdam, Rotterdam, Utrecht, Maastricht en Leiden) werken samen om meer grip te krijgen op dit complexe, maar veelbelovende onderzoeksterrein. SURFsara draagt bij aan dit project met rekenkracht, dataopslag en –transport en advies over de opzet van de database.
Biobank-onderzoek Nederland is sterk in biobank-onderzoek, onderzoek waarbij biologisch materiaal is afgestaan, stelt Heijmans: “In dit project hebben we zes biobanken bij elkaar gebracht en daaruit 4000 personen geselecteerd. De biobanken hebben van alle 4000 personen een
MOLECULAIRE EPIDEMIOLOGIE – BAS HEIJMANS
DNA- en een RNA-monster beschikbaar gesteld. Die monsters hebben we gebruikt om met chips de epigenetica in kaart te brengen en met sequencing de expressie van alle genen. Alle gege-
26
SURFSARA Jaarverslag 2013
Dr. Bas Heijmans, moleculair epidemio-
verschillende niveaus van biologische
vens zijn op dezelfde manier in het
loog en werkzaam bij het Leiden Uni
informatie. Eerst bekijken we of de
zelfde laboratorium van het Erasmus
versitair Medisch Centrum, is trekker van
genetische variant invloed heeft op de
Medisch Centrum in Rotterdam ver
dit project: “Genetische studies zijn heel
verpakking van het DNA, de epigenetica,
kregen, waardoor ze goed vergelijkbaar
succesvol. Overal in het genoom weten
die een belangrijke rol speelt in de gen-
zijn. Bijzonder aan dit project is boven-
we genetische varianten te vinden die
regulatie. Vervolgens gaan we na of de
dien dat de deelnemende instituten alle
correleren met ziekterisico’s. Maar vaak
variant de expressie van een gen of een
gegevens delen.”
liggen de varianten niet in maar buiten
heel netwerk van genen beïnvloedt. We
een gen en begrijpen we het moleculaire
denken dat de genexpressieverschillen
Ontsluiting
mechanisme achter de correlatie niet. In
uiteindelijk verklaren waarom dragers
Een grote uitdaging is het ontsluiten
dit project proberen we het effect van
van een genetische variant een ver-
van deze enorme hoeveelheid gege-
zo’n genetische variant te volgen door
hoogd ziekterisico hebben.”
vens, zegt Heijmans. “Alleen al de vraag:
hoe krijgen we alle data op een effi
het een centrale infrastructuur waarop
ciënte manier van ons laboratorium in
BIOS-onderzoekers kunnen inloggen,
Rotterdam naar SURFsara? We maken
ongeacht waar ze werken. De HPC
daarbij gebruik van lichtpaden. Ver
Cloud is ideaal gebleken voor de
volgens moeten deze gegevens worden
kwaliteitscontrole van onze data.”
georganiseerd in een database, inclusief alle metadata. Het project stelt hoge
Overgewicht
eisen aan veiligheid (denk aan privacy)
Uiteindelijk willen de onderzoekers
en alle gegevens moeten regelmatig
van elke genetische variant vaststellen
worden geback-upt. De infrastructuur
wat het effect is op het niveau van
van SURFsara stelt ons in staat de data
genexpressie. “Neem bijvoorbeeld
op een veilige manier te delen.”
overgewicht”, zegt Heijmans. “We kennen een aantal genvarianten die
HPC Cloud en Grid
daar verband mee houden. Op basis
Het BIOS Consortium maakt bij SURFsara
daarvan kunnen we zien of die varianten
gebruik van zowel de HPC Cloud-om-
de expressie veranderen van genen
geving als de Grid-infrastructuur. “Een
die met de vethuishouding van doen
groot voordeel van het Grid is dat je
hebben, of met eetlust. Zo kunnen we
enorm veel berekeningen parallel kunt
nagaan welke biologische processen
uitvoeren”, vindt Heijmans. “Het Grid
door zo’n genvariant verstoord zijn.”
hebben we benut bij het verwerken van onze enorme hoeveelheden genexpressiedata. Bij de HPC Cloud hebben we de beschikking over een eigen omgeving waar de software staat. Bovendien is
27
SURFSARA Jaarverslag 2013
CASE 8 ONLINE CURSUS GRID-COMPUTING
In 2013 heeft SURFsara een Massive Open Online Course (MOOC) over Grid-computing ontwikkeld en aangeboden. Cursisten leren tijdens deze cursus werken met het Grid, raken vertrouwd met de bijbehorende concepten en kunnen uiteindelijk een certificaat behalen. Zo’n 300 cursisten schreven zich tot nu toe in.
Dat heeft boeiende filmpjes opgeleverd met aansprekende Grid-toepassingen. Tot slot hebben we een aantal concepten uitgelegd aan de hand van animaties.”
MOOC – INTRODUCTIE OP GRID-COMPUTING Toegang tot het Grid De deelnemers krijgen daadwerkelijk toegang tot het Grid. “Dat is wel een stap, want je geeft cursisten die je niet SURFsara had een aantal redenen om
28
SURFSARA Jaarverslag 2013
wereld tot stand is gekomen. “Dat
kent toegang tot onze infrastructuur”,
te kiezen voor een MOOC, aldus project-
betekent dat we moesten pionieren”,
zegt Bot. “Het is voor ons een belangrijk
leider Jan Bot: “Het aanleren van Grid-
zegt Bot. “Eerst hebben we vastgesteld
uitgangspunt dat iedereen moet kunnen
computing is arbeidsintensief. We probe-
wat de studenten moeten weten van
meedoen. Cursisten kunnen een virtuele
ren een publiek te bereiken dat het lastig
het Grid. Het onderwijs is hands-on.
machine downloaden en op hun eigen
vindt om zich de concepten van het Grid
We leggen dus niet uit hoe het Grid
pc of laptop draaien. Maar ze kunnen
eigen te maken. Ook wilden we onder-
technisch werkt, maar laten juist zien
ook op het echte Grid rekenen.”
zoeken of een MOOC een interessant
hoe je zelf met het Grid aan de slag
De MOOC zelf draait op een platform
concept is dat SURFsara zou kunnen
gaat. Daarbij maken we gebruik van
van de Universiteit van Amsterdam.
gebruiken voor kennis overdracht over
best practices. Natuurlijk gaan we ook
de eigen e-Infrastructuur.”
in op de verschillende Grid-concepten:
10%-regel
hoe gebruik je storage, hoe gebruik je
De ervaringen van de deelnemers zijn
Hands-on
de rekencapaciteit. Verder hebben we
overwegend positief, stelt Bot: “Wij
De MOOC over Grid-computing is de
door heel Europa wetenschappers ge-
voldoen aan de 10%-regel bij MOOCs:
eerste MOOC die buiten de onderwijs-
vraagd om hun werk te presenteren.
10% van de belangstellenden die zich
aanmelden, ronden de cursus succesvol af. We zien wel een tweedeling: een deel van de cursisten is heel gemotiveerd, die willen Grid-computing toepassen in hun eigen onderzoek en het certificaat behalen. Daarnaast is er een brede groep die wil weten wat Gridcomputing op hoofdlijnen inhoudt. Die groep maakt niet alle opdrachten en vraagt ook geen certificaat aan.” Het MOOC-projectteam van SURFsara bestond uit Anatoli Danezi, Jeroen Schot, Tijs de Kler, Nico Kruithof en Jan Bot. Daarnaast werd een onderdeel verzorgd door dr. Silvia Delgado Olabarriaga van het Academisch Medisch Centrum (AMC). Bij de ontwikkeling van de MOOC is gebruik gemaakt van een subsidie via EGI-InSPIRE.
29
SURFSARA Jaarverslag 2013
CASE 9 TWEE MILJARD TWEETS ALS ONDERZOEKSMATERIAAL
Waarover gaat het als we twitteren? Welke woorden komen op welke locatie voor en in welke context? Sinds een jaar kan iedereen dat onderzoeken via de website twiqs.nl. Het Hadoop-cluster bij SURFsara zorgt voor rekenkracht en de benodigde opslagcapaciteit.
Sang. “Een van de onderzoekers probeert evenementen te voorspellen aan de hand van tweets. Daarmee zou je op termijn bijvoorbeeld een gewelddadig
TEKSTANALYSE VAN TWEETS – ERIK TJONG KIM SANG
treffen tussen voetbalsupporters kunnen voorspellen. Een ander voorbeeld is onderzoek naar autisme, waarbij je aan de hand van een analyse van tweets probeert vast te stellen of iemand
De initiatiefnemer van twiqs.nl is
is begonnen in 2010 en omvat nu
dr. Erik Tjong Kim Sang, onderzoeker
ongeveer twee miljard tweets. Per
aan het Meertens Instituut. Hij onder-
dag komen er tussen de anderhalf
Heatmaps
steunt onderzoekers die belangstelling
en twee miljoen Nederlandstalige
De website stelt onderzoekers in staat
hebben voor tweets: “Ze willen bijvoor-
tweets bij. “Je kunt dus ook onder
heatmaps te maken. Dit zijn grafische
beeld weten hoe vaak een bepaald
zoeken hoe taalgebruik zich ontwik-
voorstellingen die in beeld brengen
woord voorkomt. Dan wil je ook weten
kelt”, zegt Tjong Kim Sang. “Of hoe
waar in Nederland bepaalde woorden
hoeveel tweets er in Nederland worden
een bepaalde hype of discussie
worden gebruikt. Tjong Kim Sang:
gepost. De website geeft toegang tot
opkomt en weer verdwijnt.”
“Zo kun je op een kaart van Nederland laten zien op welke plaatsen bepaalde
een verzameling tweets, die taalweten-
30
SURFSARA Jaarverslag 2013
autisme heeft.”
schappers gebruiken om onder meer
Evenementen voorspellen
dialectwoorden voorkomen. Je ziet
de frequentie, gebruikslocatie en con-
Wie maakt er gebruik van de website
dan bijvoorbeeld dat Brabantse dia-
text van woorden te onderzoeken.”
twiqs.nl en voor welke doeleinden?
lectwoorden ook veel gebruikt worden
“Een vaste groep gebruikers zit in
in Amsterdamse tweets, misschien
1,5 miljoen tweets per dag
Nijmegen, bij de vakgroep Computa
door studenten die afkomstig zijn uit
Het opbouwen van de dataverzameling
tionele Taalkunde”, vertelt Tjong Kim
Brabant.” Ook is het mogelijk om
regionale discussies te volgen; denk aan de vele tweets over de aardbevingen in Groningen. Rekenkracht Sommige bewerkingen vergen veel rekenkracht, zeker als een onderzoeker het gebruik van bepaalde woorden over een langere periode (bijvoorbeeld een maand) wil onderzoeken. De web site twiqs.nl draait bij SURFsara op de HPC Cloud. Daar worden de tweets ook verzameld. De verzamelde tweets worden vervolgens gekopieerd naar het Hadoop-cluster voor het eigenlijke rekenwerk. “Het gaat om omvangrijke
Verspreiding van het Brabantse dialectwoord
Verspreiding van het woord ‘alweer’.
Verspreiding van het woord ‘weeral’.
berekeningen”, zegt Tjong Kim Sang.
‘hedde’ in januari 2013
Periode: 22-1-2013 – 22-2-2013
Periode: 22-1-2013 – 22-2-2013
(wordt vooral in Nederland gebruikt)
(wordt vooral in Vlaanderen gebruikt)
“Voor sommige heatmaps is vele uren rekenkracht nodig.”
31
SURFSARA Jaarverslag 2013
CASE 10 INFORMATION RETRIEVAL MET ZELFLERENDE ALGORITMES
Hoe selecteer je de gewenste informatie uit zeer omvangrijke tekstcorpora? Door algoritmes te ontwikkelen die zelf teksten kunnen analyseren en daaruit de relevante zoekcriteria destilleren. De TREC Challenge daagt onderzoekers uit hun creativiteit en expertise optimaal in te zetten.
woordcombinaties die tot de correcte classificatie leiden.” Voor de omvangrijke analyses die nodig zijn om de algoritmes te ontwikkelen,
INFORMATION RETRIEVAL – TOM KENTER
maakte Kenter gebruik van het Hadoopcluster bij SURFsara. Dat beviel uitstekend: “Ik ben bijzonder tevreden over de samenwerking en de ondersteuning. Mijn contactpersoon dacht voortdurend
Tom Kenter, promovendus aan het
informatie waaraan je niets hebt.
met me mee en kwam met goede sug-
Instituut voor Informatica (UvA),
Er moet dus meer gebeuren.”
gesties. Dus niets dan lof.”
Challenge 2013 (TREC staat voor
Machine learning
Wedstrijd
Text REtrieval Conference). “De taak
Kenter maakt gebruik van technieken
De TREC Challenge is opgezet als een
is een stroom documenten te moni
uit de artificiële intelligentie, in het
wedstrijd. “Je begint met een aantal
toren, bijvoorbeeld nieuwsberichten,
bijzonder op het gebied van machine
trainingsdocumenten waarvan je weet
tweets of facebook updates”, vertelt
learning: “Het gaat daarbij om zelf
dat ze aan de eisen voldoen”, zegt
Kenter. “We willen dan bijvoorbeeld
lerende algoritmes. We gaan uit van
Kenter. “Daarmee kun je je algoritme
documenten selecteren die relevant
documenten die aan de zoekopdracht
verfijnen. Uiteindelijk leveren alle deel-
zijn voor een persoon of bedrijf,
voldoen, waarin dus al goede voorbeel-
nemers hun resultaten in; dan toetst
zoals alle documenten die bepaalde
den zitten. We bieden documenten
de TREC-organisatie de verschillende
informatie over Barack Obama
met de correcte classificatielabels aan
inzendingen aan de hand van een nieu-
bevatten. Je kunt natuurlijk zoeken
het algoritme aan, en die abstraheert
we reeks documenten. Aan het slot kun
op naam, maar dan vind je veel
daaruit woorden, constructies en
je de uitkomsten vergelijken en zien
heeft deelgenomen aan de TREC
32
SURFSARA Jaarverslag 2013
welke aanpak de andere deelnemers hebben gehanteerd, vaak met totaal andere theoretische uitgangspunten en andere resultaten.” Business Risk Analysis Kenter ziet voldoende toepassingen voor de algoritmes (filters) die hij heeft ontwikkeld: “Dit soort filters is goed te gebruiken bij Business Risk Analysis. Ze stellen je in staat om bijvoorbeeld bepaalde bedrijven (leveranciers of financiële instellingen) te volgen. Dat gebeurt nu voor een groot deel handmatig door een groep professionele analisten die websites, fora en nieuwsberichten monitoren. Met zo’n filter zou je hun werk aanzienlijk kunnen verlichten door een goede voorselectie te maken.”
33
SURFSARA Jaarverslag 2013
4
IN DE WOLKEN
34
SURFSARA Jaarverslag 2013
Laagdrempelige toegang tot geavanceerde high performance computing resources is een belangrijk speerpunt binnen SURFsara. SURFsara biedt een brede waaier van systemen en diensten aan en zorgt bovendien voor ondersteuning op maat. Elk onderzoek stelt immers zijn eigen eisen. Vooral de cloudomgeving omvat steeds meer mogelijkheden, die ontwikkeld zijn in samenspraak met de eind gebruikers. En met succes: veel onderzoekers zijn met de HPC Cloud en de nieuwe Service Cloud ‘in de wolken’. >
Rekenkracht via de desktop
Service Cloud, ook wel ‘Cloud Light’ genoemd, die op 10 mei
De HPC Cloud, sinds 2012 beschikbaar onder de naam Calligo,
2013 is geïntroduceerd.
biedt onderzoekers op een eenvoudige manier toegang tot hoogwaardige rekenkracht. Onderzoekers zijn enthousiast
De Service Cloud is inmiddels volop in gebruik en beantwoordt
over de HPC Cloud, die flexibiliteit paart aan schaalbaarheid.
aan de wensen van de gebruikers. Een voorbeeld van een
Gebruikers kunnen zelf bepalen welk programma ze gebruiken
toepassing is de website twiqs.nl, waarin bezoekers op tref-
en in welke omgeving dat draait; de HPC Cloud stelt namelijk
woord kunnen zoeken in een omvangrijke verzameling van
geen beperkingen aan het besturingssysteem. Een onderzoe-
Nederlandse tweets. Een ander interessant voorbeeld is de
ker kan zijn programma eenvoudig kopiëren naar de Cloud en
database met historische landkaarten (http://mapserver.sara.
het dan tien, twintig of zelfs honderd keer opschalen. De ‘P’
nl/atlasderneederlanden/atlas/) van UvA-onderzoeker
in HPC staat daarmee niet alleen voor performance, maar ook
Jan Hartmann. De applicatie stelt bezoekers in staat oude
voor productivity: de HPC Cloud stelt onderzoekers in staat
landkaarten te koppelen met Google Maps, zodat ze de
hun productiviteit aanzienlijk te vergroten.
oude situatie kunnen ‘mappen’ op de huidige geografie.
SURFsara ondersteunt gebruikers en bekijkt samen met hen
Community clouds
wat de beste oplossing is voor hun onderzoeksvraag. Met
SURFsara zet zich al geruime tijd in voor de ontwikkeling
elke nieuwe gebruiker gaan de adviseurs in gesprek om vast
van community clouds. Daarbij ligt de focus op een cloud-
te stellen wat hij of zij precies wil. Dat resulteert in een advies
omgeving voor de community Onderzoek en Onderwijs.
over het meest geschikte platform: naast de HPC Cloud kan
SURFsara is samen met SURFnet in gesprek met verschillende
dat ook bijvoorbeeld het nationaal rekencluster Lisa, Hadoop,
Nederlandse universiteiten, die alle veel belangstelling voor
het Grid of de nationale supercomputer Cartesius zijn. Ieder
een dergelijke oplossing hebben. Die interesse is toegenomen
platform leent zich goed voor bepaalde soorten applicaties.
door recente discussies over veiligheid, onder meer door
Zo is de Cloud vooral geschikt voor gebruikers die hun eigen
de vele onthullingen over de Amerikaanse National Security
tools willen en kunnen installeren en die niet geholpen zijn
Agency. Daarbij richt SURFsara zich op een vorm van dienst-
met standaard systemen.
verlening die enerzijds is toegesneden op de behoefte van de instellingen en anderzijds voldoet aan hoge veiligheidseisen.
Service Cloud Onderzoekers willen vaak bepaalde services delen met anderen of permanent laten draaien. Daarmee kunnen ze collega’s of studenten toegang geven tot programma’s of data in de vorm van een webservice. Om deze dienstverlening mogelijk te maken, heeft SURFsara de Cloud uitgebreid met een aantal lichtere componenten. Het resultaat is de zogenoemde 35
SURFSARA Jaarverslag 2013
uitdrukking in de grote hoeveelheden data die relatief eenSURFdrive
voudig kunnen worden opgeslagen. Het Grid wordt onder
Het eerste project waarmee binnen de community clouds
meer gebruikt voor opslag van data van de Large Hadron
is gestart is SURFdrive: een dienst vergelijkbaar met
Collider van CERN bij Genève, en voor de astronomische
‘Dropbox’, maar dan uitsluitend voor en van de instellin-
data van LOFAR (zie hiervoor hoofdstuk 3).
gen. Eind 2012 zijn de eisen en wensen van de instellingen in kaart gebracht. Aansluitend hebben SURFsara en SURFnet het meest geschikte product geselecteerd
BiG Grid is nu onderdeel van de nationale
waarmee begin 2014 een pilot wordt opgezet. Op basis
e-Infrastructuur
daarvan wordt een keuze gemaakt en kan de gevraagde
Eind 2012 is het BiG Grid-project afgerond. De toegang
dienst geleverd worden. Via de dienst SURFconext kun-
tot de nationale e-Infrastructuur wordt echter gewoon
nen de instellingen op een eenvoudige manier toegang
voorgezet. Onderzoekers kunnen hiervoor terecht bij
krijgen tot SURFdrive.
SURFsara, die daarbij operationeel samenwerkt met Nikhef en CIT-RUG.
SURFdrive is vooral bedoeld voor data die gecreëerd is met kantoorsoftware, zoals MS Office en vergelijkbare pakketten, maar niet voor de (veel omvangrijkere) onder-
MOOC
zoeksdata. Ook op dat terrein lopen de universiteiten
Om gebruikers online te leren werken met het Grid heeft
echter tegen hun grenzen aan. SURFsara wil daarom voor
SURFsara samen met de Universiteit van Amsterdam (UvA)
onderzoeksdata eveneens een cloud-omgeving opzetten.
en European Grid Initiative (EGI) een Massive Online Open
Dit hoort bij de nieuwe benadering, waarbij de data steeds
Course (MOOC) over Grid ontwikkeld: zie mooc.uva.nl/portal.
meer centraal komen te staan. In 2014 wordt de imple-
SURFsara zorgt ook voor de begeleiding van de cursisten.
mentatie van de datacentrische strategie van het leveren
Tijdens de cursus krijgen de deelnemers toegang tot het Grid
van diensten afgerond. In die benadering wordt de data
en zien ze live hoe het werkt. Ook gebruikers (zoals onder-
als een service gezien en worden de platforms die gebruik
zoekers die betrokken zijn bij de experimenten van de LHC
maken van die data aan die service gekoppeld.
en LOFAR) vertellen op welke wijze ze van het Grid gebruik maken. Deze innovatieve manier van leren trekt veel belangstelling. Zie voor meer informatie de casus op pagina 28.
Grid groeit
36
SURFSARA Jaarverslag 2013
Het Grid is in de loop der jaren tot een robuuste service
Life Science Grid
geëvolueerd. Dat komt enerzijds tot uiting in de software,
Het Life Science Grid bestaat uit krachtige clusters die geza-
die inmiddels goed is ontwikkeld en steeds meer gebruiks
menlijk een computing en storage grid vormen, een virtueel
gemak biedt. Anderzijds komt die volwaardigheid tot
supercluster. De clusters bevinden zich op de locaties van de
deelnemende instellingen. Het Life Science Grid is in 2013
ICT-onderzoek en –innovatie). Ook nationale rekencentra
opnieuw uitgebreid. De aangesloten life sciences-instituten
in andere landen beschikken vrijwel zonder uitzondering
benutten in toenemende mate de meerwaarde van deze
over een eigen HPC-datacenter. Een high-performance
clusters, die in combinatie met de beschikbare lichtpaden
ICT-onderzoeksinfrastructuur stelt unieke eisen aan een
fungeren als toegangsportal tot (de systemen bij) SURFsara.
datacenter, die over het algemeen door commerciële
Zo kunnen deelnemers onder meer hun data bij SURFsara
commodity datacenters niet of niet kosteneffectief kunnen
opslaan. Vooral academische ziekenhuizen maken daar veel
worden geleverd. Een HPC-datacenter stelt hoge eisen
gebruik van.
vanwege de zware high-density computerracks, de zeer hoge energiedichtheid en faciliteiten voor (warm-)water-
SURF Outreach and Support (SOS)
koeling. Daarnaast is flexibiliteit in faciliteiten en operatie
De werkmaatschappijen van SURF, zoals SURFsara en
erg belangrijk om snel en effectief te kunnen inspelen op
SURFnet, bieden een breed palet aan diensten aan.
en gebruik te kunnen maken van de nieuwste ICT-ontwik-
Om onderzoekers een duidelijk geïntegreerd en afgestemd
kelingen en innovaties, en experimenten en pilots te kunnen
aanbod te presenteren is het SOS-team opgericht, wat staat
uitvoeren.
voor SURF Outreach and Support. Het Netherlands eScience Center maakt hier ook deel van uit. SURF Outreach and
In 2012 is een uitgebreide inventarisatie gedaan van de
Support heeft tot doel onderzoekers op een efficiëntere
eisen waaraan een nationaal datacenter moet voldoen.
manier in contact te brengen met de juiste adviseur.
Aansluitend is een Europese aanbesteding uitgeschreven,
De gedachten gaan uit naar een model waarbij gezamenlijk
die eind 2013 is afgerond. Die aanbesteding heeft geresul-
invulling wordt gegeven aan de zogenoemde outreach,
teerd in een overeenkomst met TelecityGroup. Dit bedrijf
waardoor onderzoekers een goed beeld krijgen wat SURF
ontwikkelt op Amsterdam Science Park en in de directe
doet en waarvoor je waar moet zijn. De diensten en onder-
nabijheid van het SURF Science Park-gebouw een nieuw
steuning worden door de SURF-werkmaatschappijen zelf
datacenter. Medio 2016 beschikt SURFsara hiermee over
aangeboden. Daarnaast wordt nagegaan of het mogelijk
een nieuwe generatie state-of-the-art, flexibel, kosten
is om een netwerk van experts bij de instellingen hierin
effectief en duurzaam datacenter. In dit nieuwe datacenter
een rol te laten spelen, bijvoorbeeld via een train-the-
zal de SURFsara nationale High Performance Computing
trainer-model.
(HPC)-infrastructuur worden gehuisvest, waaronder de nationale supercomputer Cartesius. Daarnaast is het
SURFsara-directeur Anwar Osseyran en Alexandra Schless, vice-president West-Europa TelecityGroup.
37
SURFSARA Jaarverslag 2013
HPC-datacenter
nationaal datacenter beschikbaar voor clouddiensten en
SURFsara werkt al geruime tijd aan de realisatie van
data van instellingen voor onderzoek en hoger onderwijs,
en nationaal High Performance Computing-datacenter.
maar ook voor precompetitief onderzoek van bedrijven.
De noodzaak hiertoe is al in 2008 beschreven in het
SURFsara krijgt het exclusieve gebruik van twee verdie-
rapport van ICTRegie (Nationaal regieorgaan voor
pingen in het toekomstige TelecityGroup-datacenter.
In totaal kan SURFsara beschikken over meer dan 800 m2
Enlighten Your Research 4
datavloeroppervlak. Het gehele datacenter wordt toon
In 2013 is voor de vierde keer de Enlighten Your Research-
aangevend op het gebied van duurzaamheid. Om het
wedstrijd gehouden. Deze wedstrijd daagt wetenschappers
energieverbruik en de CO2-uitstoot zoveel mogelijk te
uit om grootschalig onderzoek te verrichten, met een
beperken, worden innovatieve, maar bewezen betrouwbare
accent op het gebruik van grote hoeveelheden complexe
technologieën benut. Dit resulteert in een Energy Usage
data (Big Data). Ook in 2013 hebben de voorstellen duide-
Effectiveness (EUE) lager dan 1,25. De EUE is de maatstaf
lijk gemaakt dat onderzoek, rekenkracht, data en diensten
voor de energie-efficiëntie van IT-datacenters en geeft
niet los van elkaar te zien zijn.
de verhouding weer tussen het totale energiegebruik van het datacenter en het daadwerkelijke energieverbruik door
Op 7 november zijn de winnaars bekend gemaakt: biome-
de IT-apparatuur. SURFsara heeft er verder voor gekozen
disch ingenieur Mitra Almasian, bioloog Stephen Helms en
om het nationale datacenter flexibel op te zetten en de
taalkundige Piek Vossen. Mitra Almasian (AMC Amsterdam)
capaciteit on demand te kunnen uitbreiden. Dit maakt
wil met haar project A lightpath for Optical Coherence
het mogelijk de nieuwste ICT-ontwikkelingen en innovaties
Tomography imaging non-invasieve wetenschappelijke
snel en kosteneffectief in te zetten.
analyses beschikbaar maken voor onderzoekers en medici als onderdeel van medische diagnostiek. Met het project Using Big Data solutions to understand worm behavior gaat Stephen Helms van het FOM-instituut AMOLF gedrag van wormen onderzoeken om tot een beter begrip te komen van de manier waarop dieren navigeren. Piek Vossen, verbonden aan de Vrije Universiteit Amsterdam, gaat met Recording history in large news streams Big Data inzetten bij de analyse van grote hoeveelheden nieuwsberichten. De onderzoekers ontvangen elk 20.000 euro en twee jaar lang toegang tot Big Data-faciliteiten. Enlighten Your Research is een initiatief van SURF, SURFnet, SURFsara, het Netherlands eScience Center en NWO.
38
SURFSARA Jaarverslag 2013
CASE 11 ATLAS DER NEEDERLANDEN: OUDE KAARTEN DIGITAAL ONTSLUITEN
Oude landkaarten weergeven in relatie tot de actuele geografische situatie: dat is het uitgangspunt van het digitale project Atlas der Neederlanden. Het project was in eerste instantie gericht op de gelijknamige tentoonstelling in de Amsterdamse universiteits bibliotheek, maar groeit geleidelijk uit tot een digitale database van oude kaarten.
Tentoonstelling Het project was bedoeld voor de tentoonstelling over de Atlas der Neederlanden, die tot 9 februari 2014 in de Amsterdamse universiteitsbiblio-
GEOREFERENCING – JAN HARTMANN
theek te zien was. “We hebben er een publieke webservice van gemaakt die interessant is voor iedereen die beroepsmatig of als hobby met oude kaarten bezig is”, zegt Hartmann. “Daarom blijft
Dr. Jan Hartmann, GIS-specialist bij de
Georeferencing
de site ook na de tentoonstelling bestaan
afdeling Geografie van de Universiteit
Georeferencing is bij oude kaarten
en willen we kaarten blijven toevoegen.
van Amsterdam, is de initiatiefnemer:
gecompliceerd, aldus Hartmann:
We zijn in gesprek met erfgoedinstel-
“We zochten naar een mogelijkheid om
“In principe kan elke kaart eenduidig
lingen, bibliotheken en musea die oude
de bladgrenzen van oude kaarten snel
geprojecteerd worden op de wereldbol.
kaarten in hun bezit hebben, om ook
te kunnen reconstrueren. Daarvoor
Maar voor oudere kaarten is dat moei
hun cartografisch bezit op deze manier
maken we gebruik van de HPC Cloud bij
lijker, omdat de parameters daarvoor
te georefereren.”
SURFsara. Omdat de HPC Cloud-omge-
niet op voorhand bekend zijn. Je moet
ving zo veel ruimte en rekenkracht biedt,
dan vergelijkbare punten op de oude
Samenwerking
hebben we de scope van het project
en de nieuwe kaarten gaan zoeken.
Waarom de HPC Cloud? “De geografi-
verbreed tot de fysieke georeferentie van
Als je dat heel nauwkeurig wilt doen,
sche systemen waarmee wij werken
die kaarten. Dat stelde ons in staat om
moet je de oude kaart gaan vervormen
zijn nogal monolithisch”, zegt Hartmann.
de oude kaarten aan elkaar te ‘stitchen’
zodat hij op de nieuwe kaart past.
“Wij gebruiken de HPC Cloud vooral als
en vervolgens zo nauwkeurig mogelijk
Voor dit project voerde dat te ver.”
stand-alone virtuele service die geografi-
over de huidige kaart te leggen.”
39
SURFSARA Jaarverslag 2013
sche informatie kan aanbieden aan onze
eigen grote systemen.” Hartman is zeer te spreken over de samenwerking met SURFsara: “Het was fantastisch dat we hoogwaardige technologie op een gestandaardiseerde manier konden benaderen. We hebben veel nuttige adviezen gehad van de mensen die bij SURFsara de HPC Cloud-omgeving ondersteunen en beheren. De kennis is groot en de medewerkers zijn zeer behulpzaam.” De applicatie is te vinden op: http://mapserver.sara.nl/ atlasderneederlanden/atlas/
40
SURFSARA Jaarverslag 2013
CASE 12 NEDERLAB: ALLE NEDERLANDSE TEKSTEN DIGITAAL DOORZOEKBAAR
Marc Kemps-Snijders is hoofd technische ontwikkeling bij het Meertens Instituut. Daar is hij verantwoordelijk voor Nederlab, een grootschalig onderzoekscorpus voor geesteswetenschappelijk onderzoek. De teller staat nu op 37,5 miljoen documenten; in de eerste helft van 2014 gaat Nederlab live.
en dat vergelijken met de situatie in Nederland.” 20 miljard woorden De database is deels gevuld. Kemps-
TAAL- EN CULTUURANALYSE – MARC KEMPS-SNIJDERS
Snijders: “De basis van de software is gereed. We hebben de volledige Digitale Bibliotheek voor de Nederlandse Letteren (DBNL) opgenomen, evenals een deel van de kranten uit de Konink-
41
SURFSARA Jaarverslag 2013
De doelstellingen van Nederlab zijn
Onderzoek
lijke Bibliotheek (KB). De verwerking
ambitieus, aldus Kemps-Snijders:
Nederlab verkeert nu in de testfase.
van de Early Dutch Books Online (EDBO)
“Het doel is een diachroon corpus
De onderzoekers zijn bezig met het
is in voorbereiding. De omvang van het
samen te stellen van alle Nederlandse
formuleren van use cases vanuit hun
corpus is op dit moment 37,5 miljoen
teksten vanaf het jaar 800. Die teksten
eigen praktijk. Maar in de eerste helft
documenten met 1,3 miljard woorden
komen in een omgeving te staan die
van 2014 gaat het project live en is
en neemt nog fors toe. Alleen al de
het mogelijk maakt om enerzijds de
het beschikbaar voor alle onderzoekers.
KB-kranten bevatten 84 miljoen
data te doorzoeken en anderzijds
Zij kunnen dan analyses op de teksten
artikelen en 20 miljard woorden.”
verrijkingen toe te voegen. Denk aan
uitvoeren, zegt Kemps-Snijders:
toevoeging van woordsoorten, syntac
“Er is bijvoorbeeld een theorie dat
HPC Cloud
tische analyses, semantische labeling,
taalvernieuwing in Nederland geïn
Het Nederlab-project maakt gebruik
eigenlijk alles wat aan de taaltechno
spireerd werd vanuit de voormalige
van HPC Cloud, maar Kemps-Snijders is
logische kant beschikbaar is.”
koloniën, Suriname en Indonesië.
ook geïnteresseerd in de mogelijkheden
Je kunt dan de opkomst van bepaalde
van Hadoop voor de analyses: “Dat kan
termen in die gebieden in kaart brengen
een interessante optie zijn. Een groot
voordeel van de Cloud-omgeving is dat je snel de beschikking hebt over voldoende capaciteit. De samenwerking met SURFsara verloopt soepel, we worden goed geholpen en krijgen snel een antwoord op onze vragen.”
42
SURFSARA Jaarverslag 2013
CASE 13 TOMOGRAFIE ALS MIDDEL OM HET EFFECT VAN MEDICIJNEN OP DE CEL TE TRACEREN
Max Maletta werkt als postdoc-onderzoeker bij het Nederlands Kanker Instituut (NKI). Maletta is verbonden aan de onderzoeksgroep van professor Peter Peters. Deze onderzoeksgroep wil de macromoleculaire organisatie van cellen op nanoschaal in kaart brengen en beïnvloeden onder normale en pathogene condities. Maletta’s belangstelling gaat vooral uit naar tomografie, een afbeeldingstechniek die onderzoekers in staat stelt om een doorsnede van bijvoorbeeld een cel in beeld te brengen. Zijn onderzoek is erop gericht de software te verbeteren die bij tomografie gebruikt wordt.
Nanoscoop Voor dit onderzoek zijn hoge resolutie beelden nodig, die gemaakt worden met de beste microscoop in Nederland: de nanoscoop van het Netherlands Centre for Electron Nanoscopy (NeCEN) in Leiden. De beelden worden bewerkt met behulp van de HPC Cloud
CRYO-ELECTRON TOMOGRAFIE – MAX MALETTA
bij SURFsara. “In het begin moest ik wennen aan de HPC Cloud, maar de ondersteuning van SURFsara heeft me erg geholpen”, zegt Maletta. “We hebben veel overlegd via Skype, wat hielp
43
SURFSARA Jaarverslag 2013
Hoge resolutie tomografie (cryo-
Fixeer het ribosoom, dood de cel
bij het opzetten van het systeem. Het
electron tomografie) kan worden in-
In het onderzoek is gebruik gemaakt
is erg handig voor ons onderzoek dat
gezet om medicijnen te verbeteren.
van medicijnen die ingrijpen op het
je het systeem zelf kunt configureren,
Maletta: “Het uiteindelijke doel van
ribosoom. Maletta: “Het ribosoom
aangezien we nogal bijzondere software
het onderzoek is het verbeteren van
vertaalt de genetische informatie om
gebruiken. De resultaten zijn veelbelo-
medicijnen tegen kanker. Tomografie
proteïnen aan te maken. Sommige
vend en binnenkort wordt de paper
stelt ons in staat het effect van
medicijnen kunnen dit proces stopzet-
gepubliceerd.”
medicijnen op cellulair niveau waar
ten door het ribosoom in een bepaalde
te nemen. Op deze manier kunnen we
positie te fixeren, waardoor de (kanker)
de werking van een medicijn op de
cel wordt gedood. Tomografie stelt ons
macromoleculaire structuren binnen
in staat te zien of de medicijnen doen
de cel aantonen.”
wat we ervan verwachten.”
Superpositie van twee verschillende conformaties van ribosoom verkregen door cryo-electron tomografie. In paars het met antibiotica geblokkeerde ribosoom (mesh) en in cyaan het ongebonden ribosoom.
44
SURFSARA Jaarverslag 2013
5
INZICHT IN COMPLEXE DATASETS DANKZIJ VISUALISATIE
45
SURFSARA Jaarverslag 2013
Naarmate onderzoek complexer en data-intensiever wordt, groeit de behoefte om de uitkomsten inzichtelijk te maken. Daarbij kan het gaan om klimaatmodellen, simulatie van stroming of verbran ding, sterrenstelsels, maar ook om analyse van bijvoorbeeld criminele netwerken. Visualisatie is een geschikt hulpmiddel om meer grip te krijgen op patronen in en verbanden tussen data. SURFsara ondersteunt onderzoekers met het Collaboratorium, een geavanceerde ruimte voor visualisatie en samen werking, en met visualisatie op afstand. >
In 2012 is het Collaboratorium in gebruik genomen. De ruimte
Ook het bedrijfsleven toont interesse in de mogelijkheden
is ingericht met een video wall met 4x2 full HD-schermen met
van het Collaboratorium. Zo heeft Deltares belangstelling
multi-touch support, waarmee gebruikers de applicaties en
voor visualisatie als hulpmiddel bij beslisprocessen binnen
beelden op deze video wall kunnen besturen en manipuleren.
waterbouwkundige projecten. Andere geïnteresseerde
Het Collaboratorium wordt intensief gebruikt, niet alleen voor
bedrijven zijn Deloitte en het CBS. Ook de Big Data Tooling
wetenschappelijke visualisaties, maar ook voor presentaties en
Challenge, een activiteit gericht op bewustwording van het
videoconferencing. In 2013 is er geïnvesteerd in nieuwe hard-
belang van Big Data en de mogelijkheden daarvan, heeft
ware voor stereo-visualisatie en hebben SURFsara en het
contacten opgeleverd met bedrijven die een toegevoegde
Netherlands eScience Center (NLeSC) investeringen gedaan
waarde zien in visualisatie bij hun activiteiten op R&D-gebied.
en nieuwe technologie ontwikkeld om de gehele video wall als één desktop te kunnen gebruiken.
Visualisatie op afstand Veel onderzoekers willen graag gebruik maken van de moge-
Koninklijk bezoek
lijkheid om hun onderzoeksgegevens te visualiseren, maar
In maart 2013 heeft (toen nog) kroonprins Willem-Alexander
dan wel op hun eigen pc of laptop. Sinds 2010 ondersteunt
een bezoek gebracht aan het Collaboratorium. De kroonprins
SURFsara dat met de Remote Visualization Service: visualisa-
kreeg een korte introductie over Amsterdam Science Park en
tie op afstand. Voor deze dienst stelt SURFsara een gespecia-
de positie van SURFsara door directeur Anwar Osseyran.
liseerd cluster beschikbaar, uitgerust met krachtige grafische
Aansluitend gaven drie jonge onderzoekers uit de weten-
kaarten. Dit cluster heeft in 2013 een upgrade ondergaan en
schap, het bedrijfsleven en overheid een presentatie van hun
is daarbij voorzien van meer geheugen, snellere grafische
onderzoek. Deze presentaties lieten zien hoe simulaties en
kaarten en snellere netwerkverbindingen. De gebruikers van
data-visualisaties gebruikt worden om meer inzicht te geven
de Remote Visualization Service zijn onder meer actief op het
in Big Data. Het bezoek werd geïnitieerd door ECP, het
gebied van klimaatsimulaties, turbulentie (denk aan het men-
Platform voor de InformatieSamenleving.
gen van vloeistoffen) en de biomedische wetenschappen. Ze hebben gemeen dat ze met omvangrijke datasets werken die
Het Collaboratorium figureerde ook in een uitzending van het
zich niet meer lenen voor bewerking op de eigen pc of laptop.
VPRO-programma Labyrint. Daarin gaf prof. dr. Peter Sloot (Universiteit van Amsterdam, UvA) een presentatie van zijn
Het cluster waarmee onderzoekers visualisaties op afstand
onderzoek naar Dark Criminal Networks. SURFsara heeft
kunnen maken, stelt onderzoekers in staat parallel hun data
samen met de UvA software ontwikkeld om complexe netwer-
te visualiseren. Dat levert bij goed gebruik een hogere perfor-
ken te visualiseren en daarmee te interacteren. Deze vorm van
mance op, maar het vergt wel de nodige kennis bij de gebrui-
visualiseren van data draagt bij tot het verkrijgen van nieuwe
kers. Daarbij gaat het niet zo zeer om het parallelliseren van
inzichten.
de software, maar om het op de juiste manier structureren van de datasets. De visualisatiegroep van SURFsara biedt
46
SURFSARA Jaarverslag 2013
hiervoor ondersteuning, zodat visualisatie van deze
gekeken, onder andere naar de mogelijkheden die de
datasets laagdrempeliger wordt.
4K-technologie en de nieuwe Ultra HD-displays te bieden hebben.
Mini-symposium Netwerken en Visualisatie Eind mei 2013 organiseerde SURFsara een minisymposium
Innovatie via gaming
over netwerken en visualisatie met aandacht voor zowel
SURFsara onderzoekt voortdurend hoe nieuwe visualisatie-
historische als toekomstige ontwikkelingen. Dit symposium
technieken ingezet kunnen worden om wetenschappelijk
vond plaats ter gelegenheid van de pensionering van
onderzoek vooruit te helpen. Daarbij staan steeds vaker
Paul Wielinga. In de 40 jaar dat hij bij SURFsara heeft
ontwikkelingen in de gaming-industrie in de schijnwerpers.
gewerkt, was Paul direct betrokken bij een groot aantal
Zo heeft SURFsara in 2013 geëxperimenteerd met de zoge-
ontwikkelingen op het gebied van visualisatie en netwerk
noemde oculus rift, een virtual reality-bril ontwikkeld voor
technologie. Tijdens het symposium werd ook vooruit
de gaming-markt. De oculus rift geeft gamers het gevoel dat ze in een virtuele omgeving staan, net zoals dat vroeger in de SARA CAVE mogelijk was. Deze bril geeft onderzoekers de
Vogel het uit!
mogelijkheid om hun data driedimensionaal weer te geven en
Op 23 oktober is de Academische Jaarprijs 2013 uitgereikt
zo beter inzicht te krijgen in de structuur ervan, bijvoorbeeld
aan Vogel het uit! Dit is een project van het Instituut voor
van proteïnen of sterrenstelsels.
Biodiversiteit en Ecosysteemdynamica (IBED) van de Universiteit van Amsterdam. De Academische Jaarprijs
Een ander hulpmiddel uit de gaming-industrie is de leap
wordt jaarlijks uitgereikt aan de beste vertaling van
motion: een klein sensorblokje met infrarood leds en sensoren
wetenschappelijk onderzoek naar een breed publiek.
aan de bovenkant. De leap motion kan de vingertoppen van
Het winnende team, aangevoerd door onderzoekers
een gebruiker volgen, waardoor deze in de lucht kan acteren
Judy Shamoun-Baranes en Willem Bouten, gaat de prijs
met applicaties op het scherm. In de onderzoekswereld zou
van 100.000 euro gebruiken om een app, website plus
de leap motion gebruikt kunnen worden om data aan te
achterliggende infrastructuur te ontwikkelen. Deelnemers
wijzen of te manipuleren.
kunnen met de app direct hun veldwaarnemingen (zoals foto’s) via hun smartphone delen en zo een bijdrage
Een laatste visualisatie-innovatie is de inzet van zeer snelle
leveren aan het vogelonderzoek.
grafische processors (GPGPU’s) bij Cartesius. Deze accelerators worden in eerste instantie ingezet om de rekenkracht van
Vogel het uit! maakt gebruik van resultaten uit het
Cartesius te vergroten, maar SURFsara gaat onderzoeken of
eEcology project. Hierin werkt SURFsara samen met de
de GPGPU’s ook bruikbaar zijn bij het visualiseren van zeer
Universiteit van Amsterdam en het Netherlands eScience
omvangrijke datasets.
Center. Doel is de ontwikkeling van een e-Infrastructuur voor het verzamelen, visualiseren en analyseren van 47
SURFSARA Jaarverslag 2013
vogeldata.
CASE 14 WOLKVORMING: DE GROTE ONBEKENDE IN HET KLIMAATONDERZOEK
De opwarming van de aarde door de uitstoot van broeikasgassen brengt allerlei veranderingen met zich mee. Maar een van de belangrijkste processen, de vorming van wolken, blijft daarbij meestal onderbelicht. De onderzoeksgroep van prof. dr. Harm Jonker, Atmospheric Physics (TU Delft) wil daar verandering in brengen.
dus dat vergt veel rekenkracht, maar daarmee kunnen we het proces van wolkenvorming nauwkeurig volgen. Zo gaan we na wat het effect is op de wolkvorming als je de zeewater
ONDERZOEK NAAR WOLKVORMING – HARM JONKER
temperatuur met één graad verhoogt. Een van de belangrijkste factoren waar we naar kijken, is of de reflectie van het wolkendek in zo’n geval toe- of afneemt.”
Met de opwarming van de aarde veran-
omgekeerde scenario, minder lage
deren allerlei processen; zo komt er
wolken en dus versterking van de
Visualisatie
onder andere meer waterdamp in de
opwarming, is ook mogelijk. We weten
Visualisatie is heel belangrijk voor
atmosfeer. “Ook de bewolking wordt
nog niet goed hoe dat werkt.”
de onderzoeksgroep van Jonker:
beïnvloed, maar we weten niet precies
48
SURFSARA Jaarverslag 2013
“Ten eerste kunnen we de beelden
hoe de effecten eruit zien”, zegt Jonker.
Klimaatmodel
en de animaties heel goed gebruiken
“Wel weten we dat wolken bepalend
Een klimaatmodel kan geen rekening
om de resultaten van ons onderzoek
zijn voor de hoeveelheid straling die
houden met het type bewolking,
te communiceren. Ten tweede zien
de aarde bereikt en voor de straling
stelt Jonker: “Zo’n model rekent met
we in de visualisatie direct of we iets
die de dampkring weer kan verlaten.
roostercellen van ongeveer 50 km.
verkeerd hebben gedaan. Als we een
Het zou kunnen dat er in een warmer
Wij werken op een kleinere schaal,
randconditie niet goed hebben inge-
klimaat meer lage bewolking komt,
we kijken bijvoorbeeld naar een
steld of als ons numerieke schema
die de eigenschap heeft zonlicht goed
gebied van 50 km met roostercellen
niet helemaal klopt, dan is dat meteen
te reflecteren. Dat zou het effect van
van 50 meter. We rekenen in drie
zichtbaar. In die zin is een visualisatie
de opwarming verzachten. Maar het
dimensies en ook nog in de tijd,
onverbiddelijk. En ten derde gebruiken
we visualisatie ook nog als onderzoeks-
fantastisch om te werken met mensen
tool. Het inspireert ons bij het formule-
die altijd bereid zijn om te helpen
ren van hypotheses.”
bij het oplossen van problemen. Bovendien zijn ze zeer professioneel.
Visualisatie op afstand
Ik zeg wel eens: het is de enige
Jonker en zijn collega’s maken gebruik
helpdesk in Nederland die werkt
van de Remote Visualization Service
en waar je niet hoeft te wachten.”
van SURFsara. “Dat werkt voor ons heel goed”, zegt Jonker. “We doen onze berekeningen op de nationale supercomputer, want het gaat daarbij vaak om heel veel data. Het zou veel tijd kosten om die data over te brengen naar ons instituut; bovendien zijn er krachtige systemen nodig om de visualisaties op te bouwen. Remote visualisatie via SURFsara is veel effi ciënter, we laten de data daar waar de visualisatie ook wordt gemaakt. Alleen het beeld wordt aan ons door gegeven.” Helpdesk Jonker werkt al bijna twintig jaar samen met SURFsara: “Ik vind het nog steeds
49
SURFSARA Jaarverslag 2013
6
SNELLE DATACENTERNETWERKEN
50
SURFSARA Jaarverslag 2013
High Performance Computingsystemen stellen hoge eisen aan connectiviteit. De systemen bij SURFsara zijn extern gekoppeld aan de netwerkinfrastructuur van SURFnet, zodat onderzoekers, docenten en studenten eenvoudig en veilig toegang hebben tot onze diensten. Voor het leveren van deze diensten maakt SURFsara dan ook gebruik van een eigen interne datacenter-netwerkinfrastructuur. Deze datacenternetwerken verbinden de onderzoekswereld met snelle rekenfaciliteiten en grootschalige dataopslag. Daarom zijn deze netwerken voortdurend in ontwikkeling. Voor het data centernetwerk van het Grid is in 2013 een nieuw en innovatief netwerkconcept geïntroduceerd. >
Innovatief netwerkconcept
Tot slot zijn in 2013 ook de netwerkverbindingen tussen
Enlighten Your Research Global
Het Grid wordt gebruikt voor grootschalige dataopslag en
de datacenters in Amsterdam en Almere vervangen.
Naast de nationale Enlighten Your
data-analyse voor onder andere de Large Hadron Collider
De nieuwe verbindingen zijn toekomstvast, in de zin
Research-wedstrijd (zie hoofdstuk 4)
(van CERN bij Genève) en LOFAR. Deze data-intensieve
dat ze ruimte bieden aan een groter aantal kanalen,
hebben enkele internationaal samen-
instrumenten zorgen voor een constante toename van het
waardoor er komende jaren voldoende netwerkcapaciteit
werkende onderzoeksnetwerken,
dataverkeer. Om het datacenternetwerk op te schalen heeft
bij te schakelen is.
ESnet, Funet, Internet2, Janet en
SURFsara gekozen voor een bijzondere oplossing: QFabric
SURFnet, een internationale wedstrijd
van leverancier Juniper Networks.
uitgeschreven. De winnaars van
Lichtpaden in de Cloud De SURFsara HPC Cloud-omgeving wordt gekenmerkt
Enlighten Your Research Global zijn
Het access-netwerk, dat gebruikt wordt voor het Grid,
door het gebruik van een groot aantal uiteenlopende
Dean Williams (Lawrence Livermore
bestaat uit een groot aantal switches voor het regelen
verbindingen: internetverbindingen, VPN-verbindingen
National Laboratory), Stephen Helms
van het dataverkeer. Het nieuwe systeem werkt met
en lichtpaden. Al deze verbindingen hebben voor- en
(AMOLF), Henk Dijkstra (Universiteit
zogenoemde virtuele switches. Dat houdt in dat een
nadelen op het gebied van veiligheid, performance,
Utrecht) en David van Enckevort
groot aantal fysieke switches zich gedraagt als één
gebruikersgemak en beheer. SURFsara heeft in 2013
(UMC Groningen). Twee van de vier
virtuele switch, wat grote voordelen voor het beheer
onderzoek gedaan naar de mogelijkheden en het gebruik
winnende voorstellen zullen gebruik
oplevert. QFabric maakt het mogelijk om een flexibel
van lichtpaden binnen de HPC Cloud-omgeving. Lichtpaden
maken van de SURFsara-infrastruc-
en robuust netwerk op te zetten dat eenvoudig schaalbaar
zijn enerzijds complexer om tot stand te brengen dan
tuur: Henk Dijkstra maakt gebruik van
is. In 2012 zijn hiervoor de voorbereidingen getroffen
bijvoorbeeld internet- of VPN-verbindingen, maar geven
de nationale supercomputer Cartesius
en begin 2013 was het nieuwe datacenternetwerk
anderzijds een uitstekende performance. SURFsara wil
en David van Enckevort van de HPC
operationeel. SURFsara is de eerste organisatie in
de toegang tot lichtpaden laagdrempeliger maken voor
Cloud-omgeving.
Nederland die met deze innovatieve netwerktechnologie
de wetenschappers. Een tussenstap is om deze toegang
werkt.
gemakkelijker te maken voor de netwerkbeheerders. Daartoe heeft SURFsara onder meer alle beschikbare
Het nieuwe datacenternetwerk maakt snellere verwerkings
externe verbindingen van identifiers voorzienen gepubli-
tijden mogelijk. Eind 2013 heeft SURFsara de Grid frontend-
ceerd op internet. In de komende periode werkt SURFsara
storage aangesloten op verbindingen met een snelheid
verder aan de vergroting van de toegankelijkheid van
van 40 Gbit/s. Hierdoor kunnen grote hoeveelheden
lichtpaden door applicatie- en webinterfaces binnen de
gegevens tussen de systemen onderling veel sneller
cloud-omgeving aan te bieden.
worden verzonden.
51
SURFSARA Jaarverslag 2013
7
INNOVEREN MET HPC: KANSEN VOOR HET BEDRIJFSLEVEN
52
SURFSARA Jaarverslag 2013
Innovatie is niet alleen belangrijk voor universiteiten en onderzoeks instellingen, maar ook voor het bedrijfsleven. SURFsara speelt daarop in door bedrijven – onder voorwaarden – in staat te stellen gebruik te maken van de HPCinfrastructuur. Dankzij een nieuw programma ondersteund door het ministerie van Economische Zaken (EZ) kan SURFsara ook in de komende jaren bedrijven blijven ondersteunen bij kansrijke innovatietrajecten. >
Van 2011 tot eind 2013 heeft SURFsara veel initiatieven voor
bedrijven aan de slag gegaan met de ontwikkeling van innova-
het bedrijfsleven ontwikkeld binnen het programma Innovation
tieve oplossingen voor een probleem dat verband hield met
Infrastructure with Impact, met subsidie van het ministerie van
Big Data. Hierbij werkte SURFsara samen met onder meer
EZ. Dit programma richt zich op een hoger rendement van
Vancis, TNO, Netherlands eScience Center, KPMG, CBS en het
innovatie dankzij de inzet van ICT. Dat wordt enerzijds gereali-
Big Data Value Center Almere. De deelnemers werden in de
seerd door investeringen in de ICT-infrastructuur voor onder-
gelegenheid gesteld om kennis uit te wisselen en ervaring op
zoek, anderzijds door de samenwerking te zoeken met
te doen met Hadoop-technologie en omvangrijke datasets,
bedrijven die kunnen profiteren van High Performance
zoals de Common Crawl-database.
Computing. De focus lag in die periode op drie topsectoren: High Tech Systemen en Materialen, Life Sciences (plant, mens
Publiek-private samenwerking
en dier) en de Creatieve Sector.
Mede dankzij de interesse die in de genoemde workshops en evenementen is gewekt, werkt SURFsara samen met een groei-
Bij alle projecten die SURFsara samen met bedrijven uitvoert,
end aantal bedrijven binnen verschillende sectoren. Samen
gaat het om precompetitieve innovatie. De globale resultaten
werkingspartners zijn onder meer Tata Steel, Arcadis, Royal
van dergelijke projecten staan ook ter beschikking aan andere
Haskoning DHV, Deltares, ASML, Meteoconsult, TNO, KPMG,
geïnteresseerde partijen. Deze voorwaarde zorgt ervoor dat
Deloitte, Culgi en Dacolt. Een drietal voorbeelden van projecten:
de innovatieprojecten niet in strijd zijn met vigerende staats-
•• Tata Steel in IJmuiden levert staal van hoge kwaliteit. Dat
steunregels.
vraagt om optimalisatie van productieprocessen, waarbij onderzoek en simulatie een cruciale rol spelen. Een groep
Workshops en masterclasses De eerste uitdaging in dit traject is om bedrijven te bereiken en te overtuigen van de toegevoegde waarde van HPC.
onderzoekers van Tata Steel gebruikt hiervoor het rekencluster Lisa; •• Deltares, Arcadis en SURFsara voeren een gezamenlijke
Dat gebeurt onder meer in workshops en masterclasses,
pilot uit rondom de applicatie Delft3D. Dit is een simulatie
en in voorlichtingsbijeenkomsten op evenementen zoals de
van het gedrag van grondwater en sedimenten. In de pilot
week van de mkb’er en de Big Data-conferentie van TNO.
wordt onderzocht hoe deze applicatie als Clouddienst kan
Een ander voorbeeld is de masterclass die SURFsara samen
worden aangeboden aan ingenieurs- en adviesbureaus;
met Syntens heeft georganiseerd rond het thema Innovatie
•• Het Alain Turing Institute Almere (ATIA) heeft SURFsara
met rekenkracht. Deze masterclass resulteerde in contacten
benaderd om een rekeninfrastructuur te ontwikkelen voor
met een tiental geïnteresseerde partijen.
precompetitieve analyses met behulp van datamining. Met deze analyses wil het bedrijf meer inzicht krijgen in de
53
SURFSARA Jaarverslag 2013
Een ander initiatief is de Big Data Tooling Challenge, die in
effectiviteit van medicijnen voor de behandeling van HIV en
2013 van mei tot en met oktober is gehouden. Tijdens deze
andere ziektes. Schaalbaarheid, mogelijk gemaakt door de
challenge zijn multidisciplinaire teams vanuit verschillende
Cloud-infrastructuur, is in dit project van groot belang.
Fortissimo
drempels te identificeren en de verschillende nationale
Ook in internationaal verband werkt SURFsara samen om
funding opportunities en business modellen naast elkaar
innovatieprojecten in het bedrijfsleven te stimuleren. Een
te leggen. Verschillende partners van SURFsara uit het
goed voorbeeld is Fortissimo, een project uit het 7e kader
Nederlandse bedrijfsleven, zoals KPMG en Deltares, hebben
programma van de EU waarin 45 partners samenwerken.
tijdens de vierde editie van de IISW een presentatie gehou-
Fortissimo heeft als doel een soort marktplaats te ontwik
den en een indruk gegeven van het speelveld in Nederland.
kelen voor mkb-bedrijven binnen de maakindustrie, waarop verschillende ICT-bedrijven uit binnen- en buitenland diensten op het gebied van simulatie en modellering aanbieden.
Doorbraakovereenkomst Ook in het komende jaar zal SURFsara weer de samen-
SURFsara-directeur Anwar Osseyran, Erna Froon, Willem Vermeend en SURFnet-directeur Erwin Bleumink nadat een overeenkomst is ondertekend, waarin afspraken staan om de Nederlandse ICT-infrastructuur voor het hoger onderwijs en onderzoek te ontsluiten voor het mkb.
Fortissimo krijgt een concrete invulling aan de hand van
werking zoeken met partijen in het mkb die hoogwaardige
experimenten. Die experimenten zijn bedoeld om inzicht te
ICT willen inzetten om hun innovatiekansen te vergroten.
krijgen hoe die marktplaats eruit zou moeten zien en wat
Aanjagers van het doorbraakproject ‘De Ambitieuze MKB-er
voor diensten daar zinvol kunnen worden aangeboden.
innoveert met ICT’ Willem Vermeend en Erna Froon hebben
Inmiddels zijn 20 experimenten gedefinieerd, waarvan er twee
met SURFsara en SURFnet een overeenkomst ondertekend,
in Nederland draaien. Een voorbeeld is een experiment waarin
waarin afspraken staan om de Nederlandse ICT-infrastruc-
SURFsara samenwerkt met VORtech (een combinatie van
tuur voor het hoger onderwijs en onderzoek te ontsluiten
softwarehuis en ingenieursbureau) en Binkz (een Nederlands-
voor het mkb.
Canadees bedrijf dat zich onder meer bezighoudt met het ontwerp van gebouwen op vliegvelden). Binkz heeft een
De ICT-doorbraakprojecten zijn initiatieven waarin overheid
applicatie ontwikkeld waarmee voorspeld kan worden waar
en bedrijfsleven samenwerken. De marktpartijen pakken
sneeuw zich gaat ophopen op en rond gebouwen. Die appli-
innovatie met behulp van ICT grotendeels autonoom op,
catie wordt geschikt gemaakt voor de HPC Cloud-omgeving
maar lopen ook tegen barrières aan, bijvoorbeeld op het
van SURFsara.
gebied van wetgeving en kennisachterstand. In de projecten worden belemmeringen op ICT-gebied opgespoord en
Supercomputing Workshop
weggenomen.
Een andere internationale activiteit was de vierde International Industrial Supercomputing Workshop (IISW),
SURF heeft samen met het genoemde ICT-doorbraakproject
waarvan SURFsara in 2013 de gastheer was. Dit was een
een plan opgesteld om ervoor te zorgen dat meer mkb-
‘invitation only’ event voor nationale rekencentra die zich
ondernemers de mogelijkheden van de e-Infrastructuur
mede richten op industrie en mkb. Ongeveer 40 deelnemers
gaan ontdekken, ervaren en gebruiken. Het ministerie van
van nationale rekencentra wereldwijd hebben de workshop
Economische Zaken heeft 6 miljoen euro beschikbaar
benut om ervaringen en ontwikkelingen met elkaar te delen,
gesteld (voor de periode 2013-2016) om deze e-Infrastructuur op hoog niveau te houden.
54
SURFSARA Jaarverslag 2013
Big Data Value Center Almere SURFsara werkt met TNO, de Amsterdam Economic Board en de Economic Development Board Almere samen in het Big Data Value Center Almere. SURFsara is binnen deze samenwerking leading partner naast TNO. In december 2013 is de Letter of Intent getekend om in 2014 gezamenlijk te onderzoeken hoe het Big Data Value Center verder ontwikkeld kan worden. Het Big Data Value Center is een open innovatieplatform op het gebied van Big Data, dat onder meer veel bijeenkomsten voor mkb’ers organiseert. Met de ontwikkeling van nieuwe diensten, efficiëntere bedrijfsvoering en multidisciplinaire samenwerking geeft het Big Data Value Center een impuls aan regionale economische ontwikkelingen.
55
SURFSARA Jaarverslag 2013
CASE 15 DACOLT: MODELLERING VAN VERBRANDINGSPROCESSEN
Een verbrandingsmotor lijkt een uitontwikkeld product, dat alleen nog op details verbeterd kan worden. Niets is minder waar: de processen die zich in cilinders en verbrandingsovens afspelen, roepen nog steeds vragen op. Dacolt helpt producenten meer inzicht te krijgen in deze processen en op die manier schonere motoren te ontwikkelen. Daarbij maakt het bedrijf gebruik van de rekenkracht van de nationale supercomputer Cartesius.
processen die heel moeilijk rechtstreeks te onderzoeken zijn. Je kunt niet in zo’n cilinder kijken. Bovendien zijn de druk en de temperaturen erg hoog. Daarom werken we veel met modellen en simulaties.”
DACOLT – FERRY TAP Cartesius Sinds 2013 gebruikt Dacolt de rekenkracht op Cartesius bij SURFsara in het kader van PRACE (Partnership Dr. Ferry Tap, oprichter van Dacolt:
zelf, waardoor de motor schoner
for Advanced Computing in Europe).
“Wij maken studies van verbrandings-
wordt.”
“We doen onderzoek naar verbran-
processen aan de hand van computer
56
SURFSARA Jaarverslag 2013
dingsprocessen in gasturbines”, zegt
simulaties. Daarbij gaat het om
Dieselmotor
Tap. “Het onderzoek richt zich op
uiteenlopende apparaten, van ver
Over verbrandingsprocessen is nog
de manier waarop we turbulentie in
brandingsovens tot vliegtuigmotoren.
veel onbekend. Tap geeft als voor-
gassen gedetailleerd kunnen model-
Dat doen we in opdracht van grote
beeld de werking van een dieselmotor:
leren. Daarvoor hebben we reken
industriële bedrijven, die meer inzicht
“Die gaat uit zichzelf branden. De lucht
capaciteit van een supercomputer
willen hebben hoe zo’n verbrandings-
in de cilinder wordt samengeperst,
nodig.” De voordelen ervan heeft
proces precies verloopt. Naarmate
daar wordt brandstof in gespoten en
Tap inmiddels ervaren: “Een simulatie
we dit proces beter begrijpen, kunnen
het mengsel ontbrandt vervolgens
die bij ons drie maanden duurt,
we ook schonere en efficiëntere moto-
spontaan. Maar waarom dat op dat
kunnen we nu in een paar dagen
ren op de markt brengen. Liefst door
moment op die plek in de cilinder
draaien. Dat maakt het mogelijk
aanpassingen in de verbrandingskamer
gebeurt, weten we niet. Het gaat om
echt onderzoek te doen.”
Samenwerking De samenwerking met SURFsara verloopt prettig, vindt Tap: “We hebben goed contact, de medewerkers bij SURFsara zijn zeer behulpzaam. Ze investeren in de relatie en dat stellen we zeer op prijs.” Bij de samenwerking gelden speciale regels voor bedrijven; één daarvan is dat ze de resultaten van hun onderzoek beschikbaar stellen aan andere partijen. Dat is voor Tap geen probleem: “Het is voor ons als dienstverlener juist belangrijk om te publiceren. We willen graag laten zien wat we gedaan hebben.”
57
SURFSARA Jaarverslag 2013
CASE 16 PARAMETRISATIE VAN SIMULATIEALGORITMES
Culgi (Chemistry Unified Language Interface) is een spinoff van de Universiteit Leiden. Het bedrijf is actief op twee gebieden: ontwikkeling van simulatiesoftware en project matige ondersteuning van bedrijven. Om de stap van een geïdealiseerd naar een levensecht model te maken, wilde Culgi de parametrisatie van de moleculaire interacties groots aanpakken. SURFsara legde een brug naar een Iers rekencluster om dit mogelijk te maken.
verschillende moleculen of deeltjes in je systeem? Het meeste onderzoek op dat gebied beperkt zich tot sterk vereenvoudigde systemen met een klein aantal componenten. Maar in de industrie of de natuur gaat het vaak om duizenden componenten. Wij pro-
CULGI – JAN-WILLEM HANDGRAAF
beren de eigenschappen van mengsels op een thermodynamische manier te beschrijven. Daartoe moeten we tienduizenden moleculen doorrekenen
De simulatiesoftware van Culgi is in
aanwezige water. Wij hebben een simu-
principe domeinonafhankelijk, zegt
latiemethode ontwikkeld die laat zien
Jan-Willem Handgraaf, Chief Application
welke zepen effectief zijn in combinatie
Broncode
Scientist: “Maar in de praktijk werken
met bepaalde soorten olie. Zo’n simula-
In het kader van PRACE (Partnership
we vooral op vier vakgebieden: de
tie kan in principe in de plaats komen
for Advanced Computing in Europe)
chemische industrie, de olie-industrie,
van een veldtest die in de miljoenen
heeft Culgi vorig jaar via SURFsara
de farmaceutische industrie en de
dollars kan lopen.”
toegang gekregen tot het Fionn
elektronische industrie. Een voorbeeld:
58
SURFSARA Jaarverslag 2013
met een kwantummethode.”
Computing Cluster in Ierland. “We
bestaande olievelden kampen vaak met
Parametrisatie
hebben daarbij veel contact gehad
teruglopende opbrengsten of bevatten
In het afgelopen jaar heeft Culgi samen-
met SURFsara”, aldus Handgraaf. “Het
olie die moeilijk te winnen valt. Dan kun
gewerkt met SURFsara, vertelt Hand
is prettig om te maken te hebben met
je proberen om een zeep in het veld
graaf: “We wilden een slag maken op
mensen die weten waarover ze praten.
te injecteren zodat dat de olie loskomt
het gebied van de parametrisatie: hoe
We gebruiken een Amerikaans kwan-
uit het gesteente en mengt met het
beschrijf je de interactie tussen de
tumpakket, waarin we aanpassingen
in de broncode moesten doen. De code
ervaringen zijn positief. We hebben
moet dan weer gecompileerd worden.
wel een eigen rekencluster, maar dat
Als je daarbij hulp krijgt van mensen
bestaat uit honderd cores. Dat is goed
die verstand van zaken hebben, gaat
genoeg voor ons dagelijks gebruik,
het allemaal veel sneller.”
maar als we weer een onderzoek gaan doen dat veel rekenkracht vergt, klop-
Toekomst
pen we graag weer bij SURFsara aan.”
En de toekomst? “We hebben nu nog wat extra tijd gekregen om ook op de nationale supercomputer Cartesius
Toelichting bij een moleculaire databank: Van octaan en pyridine wordt middels
te rekenen”, zegt Handgraaf. “Onze
een kwantumberekening het fasegedrag van het mengsel bepaald.
59
SURFSARA Jaarverslag 2013
8
GROEN EN KRACHTIG
60
SURFSARA Jaarverslag 2013
De exponentiële groei van reken kracht en dataopslag stelt de ICTsector voor enorme uitdagingen. Eén daarvan is de opgave het energieverbruik binnen de perken te houden. Nieuwe technologieën, zoals zuinige processors en verbeteringen in de koeltechniek, maken het mogelijk dat een toe name in de rekenkracht gepaard gaat met meer duurzaamheid. SURFsara zet zich in om de eigen ICT-infrastructuur te vergroenen. Daarnaast loopt SURFsara voorop bij het ontwikkelen van oplossingen waarbij ICT ingezet kan worden om andere sectoren duurzamer te maken. >
Binnen SURF krijgt het duurzaamheidsbeleid voor een
waterkoeltechnologie van Bull. Dankzij deze combinatie staat
groot deel gestalte binnen de stuurgroep GIDS. GIDS is het
Cartesius niet alleen in de top-100 van krachtigste supercom-
coördinerend platform voor Groene ICT en Duurzaamheid
puters, maar ook in de top-100 van de Green 500, de wereld-
binnen SURF. Anwar Osseyran, directeur van SURFsara, is
ranglijst met de meest duurzame supercomputers. Ook de
voorzitter van deze stuurgroep. Uiteraard legt elk van de
manier waarop Cartesius meegroeit met de behoeften van
werkmaatschappijen zijn eigen accenten. Het beleid en de
onderzoekers voorkomt dat het milieu onnodig wordt belast.
maatregelen die binnen GIDS ontwikkeld worden, zijn gericht
Bij de ontwikkeling van het nieuwe nationale datacenter van
op de volgende drie basisdoelen:
SURFsara, dat in 2016 operationeel zal zijn, is duurzaamheid
1 Stimulering van energiebesparing in de ICT-sector
een van de belangrijkste randvoorwaarden.
(Greening of IT); 2 Inzetten van ICT voor de vergroening van andere sectoren (Greening by IT);
Bits to Energy of Energy to Bits
3 Bijdragen aan de groei van de groene economie in
In 2013 heeft SURFsara samen met SURFnet en het
Nederland (Green IT Economy).
toen nog geheten Agentschap NL onderzoek gedaan naar de relatie tussen energieverbruik en dataopslag.
Vergroenen van ICT
Op dat gebied zijn twee benaderingen mogelijk. In
SURFsara zet zich al geruime tijd in voor de vergroening van
de Bits to Energy-benadering wordt de dataopslag
de eigen ICT-infrastructuur. Op dat vlak worden veel initiatie-
verplaatst naar landen waar de energie duurzaam
ven genomen. Een voorbeeld is het beleid ten aanzien van
geproduceerd kan worden. De andere benadering
kantoorautomatisering: hier is al jaren een tendens gaande
(Energy to Bits) stelt voor de data dichtbij te houden
om apparatuur steeds energiezuiniger te maken. Dat gaat
en de (groene) energie daarnaartoe te brengen.
van desktop via thin client naar BYOD, Bring Your Own Device. Doelstelling is zo veel mogelijk gebruik te maken van cloud-
Uit het onderzoek blijkt dat de footprint van data
omgevingen en het gebruik van energieslurpende desktops
transport vaak onderschat wordt. Dataverwerking
terug te dringen. SURFsara geeft ook adviezen aan univer
blijkt over het algemeen het meest duurzaam als
siteiten en hogescholen om de eigen ICT duurzamer op te
productie en consumptie van data dicht bij elkaar
zetten.
plaatsvinden. Dat geldt met name voor hot data, data die veel geraadpleegd en verwerkt wordt. Het streven
Een belangrijke stap voorwaarts is de nieuwe supercomputer
is erop gericht de databewegingen te minimaliseren,
Cartesius die, dankzij de inzet van geavanceerde technologie,
maar de uiteindelijke afweging verschilt per geval.
nog groener is dan de vorige supercomputer (Huygens, die ook al energiezuinig was). Cartesius maakt gebruik van de nieuwe generatie Intel Xeon-chips en de allernieuwste warm61
SURFSARA Jaarverslag 2013
Green Software
en dat een betere afstemming tussen vraag en aanbod
Niet alleen hardware vergt energie, ook software is
helpt om overcapaciteit te reduceren. Inzet van duurzame
een punt van aandacht. Dit aspect staat centraal in
energie (wind- en zonne-energie) vermindert de CO2-
het Cluster Green Software, een regionaal technisch-
uitstoot mits alle energie die duurzaam geproduceerd
wetenschappelijk cluster in de Metropool Regio
wordt, ook daadwerkelijk wordt geconsumeerd. Op dit
Amsterdam (MRA). SURFsara neemt actief deel aan
moment kan een substantieel deel van die duurzame
dit project, samen met de Universiteit van Amsterdam,
energie niet ingezet worden omdat de energienetwerken
de Hogeschool van Amsterdam, Green IT Amsterdam
niet smart zijn. Smart grids kunnen helpen om vraag en
en de Software Improvement Group. Doel is het
aanbod beter op elkaar af te stemmen en de onvoorspel-
energieverbruik van software in (grote) systemen in
bare duurzame energiebronnen als wind en zon alsnog
kaart te brengen en na te gaan hoe dat energieverbruik
in te zetten.
kan worden teruggebracht. Verder wil het project tools identificeren en ontwikkelen waarmee gebruikers van
SURFsara wil graag bijdragen aan activiteiten om
grote systemen kunnen sturen op een (energie)kosten
Amsterdam Science Park als proeftuin in te richten om
model. In dit project wordt een toolkit doorontwikkeld
te onderzoeken welke rol smart grids kunnen spelen
om gebruikers van reken- en datacenters te stimuleren
bij het rationaliseren en vergroenen van de netwerken
energie te besparen. SURFsara heeft hierin het voortouw.
waarin energie geproduceerd en geconsumeerd wordt. Samen met het Centrum voor Energievraagstukken van
Vergroenen door ICT
de Universiteit van Amsterdam is SURFsara begonnen
ICT kan helpen om andere sectoren te vergroenen. Op dit
de mogelijkheden hiertoe te verkennen. Het idee is dat
gebied hanteert SURFsara twee speerpunten. Het eerste
zo’n proeftuin zou kunnen uitgroeien tot een Gemeen-
speerpunt is de inzet van ICT bij logistiek. Dat maakt het
schappelijk Energie Bedrijf Science Park (GESP).
mogelijk de operationele activiteiten van universiteiten en hogescholen groener te maken. Een voorbeeld hiervan is
Vergroening van de economie
de inzet van ICT bij de ontwikkeling van slimme gebouwen.
SURFsara vindt het belangrijk dat kennis die ontwikkeld
Een andere mogelijkheid is de vergroening van curricula,
wordt binnen de hoger onderwijs- en onderzoekgemeen-
bijvoorbeeld het minimaliseren van studentverplaatsingen
schap, uiteindelijk ook ten goede komt aan de markt.
door meer met e-learning te werken.
Daarom zet SURFsara zich al geruime tijd in voor technology transfer, ook op het gebied van duurzaamheid.
62
SURFSARA Jaarverslag 2013
Het tweede speerpunt is de inzet van smart grids
Eén van de thema’s daarbinnen is de eerder genoemde
om de productie en consumptie van energie beter op
ontwikkeling van ‘groene’ curricula. Daarbij gaat het
elkaar af te stemmen. Uitgangspunt daarbij is dat het
enerzijds om de leerinhoud (het beschikbaar stellen van
rendement van fossiele energiecentrales beperkt is
kennis over duurzaamheid en ‘green skills’), anderzijds
om de vorm waarin die leerinhoud wordt aangeboden: e-learning vergt om logistieke redenen minder CO2-uitstoot dan traditioneel onderwijs. E-learning is vooral kansrijk als het gaat om kennisdomeinen die sterk evolueren en waar ‘state-of-the-art’ kennis gedoceerd wordt. SURFsara stelt hiervoor de e-Infrastructuur beschikbaar.
From Smart to Wise Strategies In januari 2013 is voor de derde keer het symposium Groene ICT en Duurzame ontwikkeling in het hoger onderwijs georganiseerd in samenwerking met Agentschap NL (nu de Rijksdienst voor Ondernemend Nederland), het landelijk studentennetwerk Morgen, de Special Interest Group Groene ICT en Duurzaamheid en SURF. De ruim 140 aanwezigen konden onder leiding van dagvoorzitter Anwar Osseyran kiezen uit enkele tientallen presentaties. Tijdens de vierde editie van dit symposium in januari 2014 is een boek gepresenteerd met als titel Green ICT & Energy; From Smart to Wise Strategies. Dit boek geeft een state-of-the-art inzicht in succesvolle benaderingen van Green IT en Greening by IT. Anwar Osseyran is een van de redacteuren van deze bundel.
63
SURFSARA Jaarverslag 2013
PUBLICATIELIJST
Onderstaande publicaties zijn tot stand gekomen met behulp van de infrastructuur en ondersteuning bij SURFsara.
64
A.S. Afanasieva, et al.,
A. Afanasyeva, et al.,
Numerical simulation of synthesis of fullerenes by the arc discharge method
V. Alexandrov, et al.,
Proceedings of the International Conference on Computational Science, ICCS 2013
V. Alexandrov, et al.,
Computation at the Frontiers of Science, preface for ICCS 2013
E.P. Amber, et al.,
A.S. Aranko, et al.,
Modelling processes in the shock tube experiments with ignition of combustible gas mixtures
Structural insights into the mechanism of phosphoregulation of the retinoblastoma protein Structural basis for Protein Trans-Splicing by a Bacterial Intein-Like domain: Protein Ligation without Nucleophilic side-chains
C. Arasa, et al.,
C. Arnarez, et al.,
Molecular dynamics simulations of CO2 formation in interstellar ice Evidence for cardiolipin binding sites on the membrane-exposed surface of the cytochrome bc1
C. Arnarez, et al.,
Identification of cardiolipin binding sites on cytochrome c oxidase at the entrance of proton channels
H. Bachmann, et al.,
Availability of public goods shapes the evolution of competing metabolic strategies
L. Banci, et al.,
C. Batistakis, et al.,
Glassy boundary layers vs enhanced mobility in capped polymer films
C. Batistakis, et al.,
Molecular-Dynamics Simulations of Mechanical Reinforcement in Polymer Composites
I. Bertini, et al.,
K. Bessas
A. Bhaumik, et al.,
Molecular view of an electron transfer process essential for iron-sulfur protein biogenesis
Solution structure and dynamics of human S100A14 Analytics at the speed of light – Feasibility and challenges for real-time analytics of large datasets in hybrid clouds NMR crystallography on paramagnetic systems: solved and open issues
J.C. Bis, et al.,
C.E. Blanchet, et al.,
J.M. Boereboom, et al.,
M. Bokdam, et al.,
Field effect doping of graphene in metal|dielectric|graphene heterostructures: a model based upon first-principles calculations
M. Bonfanti, et al.,
7D Quantum Dynamics of H2 scattering on Cu(111)
W. Bouten, et al.,
L. Cerofolini, et al.,
E. Cilia, et al.,
SURFSARA Jaarverslag 2013
Common variants at 12q14 and 12q24 are associated with hippocampal volume Small-Angle X-Ray Scattering on Biological Macromolecules and Nanocomposites in Solution Towards a specific reaction parameter density functional for reactive scattering of H2 from Pd(111)
A flexible GPS tracking system for studying bird behaviour at multiple scales Examination of matrix metalloproteinase-1 (MMP-1) in solution: a preference for the pre-collagenolysis state Accurate Prediction of the Dynamical Changes within the Second PDZ Domain of PTP1e
65
T. Coenen
T. Coenen, et al.,
A. Cukkemane, et al.,
R. Dagil, et al.,
Searching for pulsars with LOFAR Pilot pulsar surveys with LOFAR Characterization of a cyclic nucleotide-activated K(+) channel and its lipid environment by using solid-state NMR spectroscopy Gentamicin binds to the megalin receptor as a competitive inhibitor using the common ligand binding motif of complement type repeats:
insight from the nmr structure of the 10th complement type repeat domain alone and in complex with gentamicin
H. Datta, et al.,
The Impact of Free-Trial Acquisition on Customer Usage, Retention, and Lifetime Value
H. Datta, et al.,
It’s in the way that you use it – The implications of brand usage for the performance of experience goods
H. Datta, et al.,
Usage Rates, Facebook Likes, and Online Piracy: Using Big Data to Manage Entertainment Products
M. Dijk, et al.,
A.M. Dokter, et al.,
Solvated protein-DNA docking using HADDOCK
N. Dölker, et al.,
T.H. Eckhardt
T. J. Eisenmayer, et al.,
C.D. Erdbrink, et al.,
Free-surface flow simulations for discharge-based operation of hydraulic structure gates
C.D. Erdbrink, et al.,
Controlling flow-induced vibrations of flood barrier gates with data-driven and finite-element modelling
C.D. Erdbrink, et al.,
Identifying Self-Excited Vibrations with Evolutionary Computing
C.D. Erdbrink, et al.,
Evolutionary Design of Numerical Methods: Generating Finite Difference and Integration Schemes by Differential Evolution
C.D. Erdbrink, et al.,
Reducing cross-flow vibrations of underflow gates: experiments and numerical studies
M. Fahlman, et al.,
Z. Farkas, et al.,
A. Fichtner, et al.,
The deep structure of the North Anatolian Faul zone
A. Fichtner, et al.,
Multi-scale full waveform
L. Fokkens, et al.,
The F. oxysporum phylome reveals different evolutionary trajectories of genes residing on lineage specific chromosomes
T.E. Galesloot, et al.,
Twilight ascents by common swifts, Apus apus, at dawn and dusk: acquisition of orientation cues? Structural determinants and mechanism of mammalian CRM1 allostery Lactococcus lactis systems biology. A characterization at different growth rates Proton displacements coupled to primary electron transfer in the Rhodobacter Sphaeroides reaction center
Photoelectron spectroscopy and modeling of interface properties related to organic photovoltaic cells Data Bridge: solving diverse Data Access in Scientific Applications
Associations of common variants in HFE and TMPRSS6 with iron parameters are independent of serum hepcidin in a general population:
a replication study
A. Goel
Metabolic shifts in microorganisms: the case of Lactococcus lactis
W. Gomulya, et al.,
A.A. Gupta, et al.,
Semiconducting single-walled carbon nanotubes on demand by polymer wrapping Structural insights into the interaction of human S100B and basic fibroblast growth factor (FGF2): Effects on FGFR1 receptor signaling
R. de Haan
R. Heimbuch, et al.,
Interfering Bloch waves in a 1D system
S. Hiltemann, et al.,
CGtag: complete genomics toolkit and annotation in a cloud-based Galaxy
S. Hiltemann
SURFSARA Jaarverslag 2013
Twiqs: Gratis tweets-analysetool van Nederlandse bodem
Galaxy Toolshed Hands On
S. Hiltemann, et al.,
D. A. Hoang, et al.,
Dynamics of droplet breakup in a T-junction
S.D. Hsu
A. Hürriyetoglu, et al.,
M.J. Jonker, et al.,
E. Karaca, et al.,
On the usefulness of ion-mobility mass spectrometry and SAXS data in scoring docking decoys
E. Karaca, et al.,
Advances in integrative modeling of biomolecular complexes
M.U. Kemp, et al.,
The influence of weather on altitude selection by nocturnal migrants in mid-latitudes
S. Klaubauf, et al,
Similar is not the same: Differences in the function of the (hemi-) cellulolytic regulator XlnR (Xlr1/Xyr1) in filamentous fungi
G.J. de Knegt, et al.,
J. Koning, et al.,
V. Korkhov, et al.,
NMR assignments of PI3-SH3 domain aided by protonless NMR spectroscopy Estimating the time between Twitter messages and future events Lifelong murine gene expression profiles in relation to chronological and biological aging in multiple organs
Rifampicin-induced transcriptome response in rifampicin-resistant Mycobacterium tuberculosis Isotope effects on the photodesorption processes of X2O (X=H,D) and HOD ice Exploring Workflow
N.V. Kovalevskaya, et al.,
V.V. Krzhizhanovskaya, et al.,
Distributed simulation of city inundation by coupled surface and subsurface porous flow for urban flood decision support system
V.V. Krzhizhanovskaya, et al.,
Computational Models in Flood Early Warning Systems
V.V. Krzhizhanovskaya, et al.,
Assessment of Flood Fatality Risks by Simulation of City Evacuation Coupled to the Inundation Dynamics with Surface and
Structural analysis of calmodulin binding to ion channels demonstrates the role of its plasticity in regulation
Subsurface Flows
Lagrangian statistics of turbulent channel flow at Reτ=950 calculated with direct numerical simulation and Langevin models
J.G.M. Kuerten, et al.,
T. Kukla, et al.,
B. de Kwaasteniet, et al.,
T. Lan Anh Tran, et al.,
C. Leyrat, et al.,
C. Liebrecht, et al.,
L. Lindell, et al.,
S. Madougou, et al.,
B. Manta, et al.,
Interoperability for Neuroimage Analysis on the SHIWA Platform Relation between structural and functional connectivity in major depressive disorder Magnetic properties of bcc-Fe(001)/C60 interfaces for organic spintronics Solution and crystallographic structures of the central region of the phosphoprotein from human metapneumovirus The perfect solution for detecting sarcasm in tweets #not Role of intrinsic molecular dipole in energy level alignment of Alq3 and NTCDA Characterizing workflow-based activity on a production e-infrastructure using provenance data Iron-Sulfur Cluster Binding by Mitochondrial Monothiol Glutaredoxin-1 of Trypanosoma brucei: Molecular Basis of Iron-Sulfur Cluster
Coordination and Relevance for Parasite Infectivity
A. Marashdeh, et al.,
Surface temperature effects on dissociative chemisorption of H2 on Cu(100)
A. Marashdeh, et al.,
Effect of Transition Metal Dopants on Initial Mass Transport in the Dehydrogenation of NaAlH4: Density Functional Theory Study
J.D. McLaren, et al.,
M.L. Mehtälä
66
iFUSE: integrated FUSion gene Explorer
SURFSARA Jaarverslag 2013
Stop early to travel fast: modelling risk-averse scheduling among nocturnally migrating birds Quaternary structure of human, Drosophila melanogaster and Caenorhabditis elegans MFE-2 in solution from synchrotron small-angle X-ray scattering
67
J.P.M. Melis, et al.,
Aging on a different scale – chronological versus pathology-related aging
J.P.M. Melis, et al.,
In vivo murine hepatic microRNA and mRNA expression
N.B. Melnikova, et al.,
Modeling Earthen Dikes Using Real-Time Sensor Data
N.B. Melnikova, et al.,
The IJkdijk levee breach experiment: accurate prediction of slope failure by the Virtual Dike finite element model confirmed by
sensor data analysis
N.B. Melnikova, et al.,
Slope instability of the earthen dike in Boston, UK: numerical simulation and sensor data analysis
J.B. van Meurs, et al.,
Common genetic loci influencing plasma homocysteine concentrations and their effect on risk of coronary artery disease
W.R. Michalek, et al.,
A hybrid stochastic-deconvolution model for LES of particle-laden flow
A. Mondal, et al.,
A.S. Mordvintsev, et al.,
C. Morris
E. van Mouw, et al.,
Thermal Lattice Expansion Effect on Reactive Scattering of H2 from Cu(111) at Ts = 925 K Simulation of City Evacuation Coupled to Flood Dynamics Towards a structural biology work bench A Model-based Information Security Risk Assessment Method for Science Gateways
H. Nemat, et al.,
Netherlands eScience Center
Direct numerical simulation of a turbulent flow with a supercritical fluid in a heated pipe
C. Neudecker, et al.,
Scalable and sustainable - OCR and document image analysis in the cloud
C. Neudecker, et al.,
A Service-Oriented Architecture for Collaborative Workflow Development and Experimentation
G. Nielsen, et al.,
E. Nowak, et al.,
S.D. Olabarriaga, et al.,
A. Pandit, et al.,
TwiNL: A deeper understanding of society
Kinase in Motion: Insights into the Dynamic Nature of p38α by High-Pressure NMR Spectroscopic Studies Structural analysis of monomeric retroviral reverse transcriptase in complex with an RNA/DNA hybrid Understanding workflows for distributed computing: nitty-gritty details Structure determination of a bio-inspired self-assembled light-harvesting antenna by solid-state NMR and molecular modeling
R.J. Papoular, et al.,
A. Patyshakuliyeva, et al.,
B.E. Pengel, et al.,
M. Perrin, et al.,
Large tunable image-charge effects in single-molecule junction
B. Peters, et al.,
Polyunsaturated fatty acid concentration predicts myelin integrity in early-phase psychosis
E. Porcu, et al.,
A.L. Pyayt, et al.,
An Approach for Real-time Levee Health Monitoring Using Signal Processing Methods
A.L. Pyayt, et al.,
Data-driven modelling for flood defence structure analysis
A.L. Pyayt, et al.,
Time-frequency Methods for Structural Health Monitoring
A.L. Pyayt, et al.,
Signal analysis and anomaly detection for flood early warning systems
A. Rienstra, et al.,
B.W. Righolt, et al.,
SURFSARA Jaarverslag 2013
Effects of structural and chemical disorders on the vis/UV spectra of carbonaceous interstellar grains Carbohydrate utilization and metabolism is highly differentiated in Agaricus bisporus Flood Early Warning System: Sensors and Internet
A meta-analysis of thyroid-related traits reveals novel loci and gender-specific differences in the regulation of thyroid function
Symptom validity testing in memory clinics: Hippocampal-memory associations and relevance for diagnosing mild cognitive impairment Numerical study of turbulentsubmerged bifurcated jets impingement and interaction with a free surface
68
J.P. Rodrigues, et al.,
A. Rosato, et al.,
D.M. Rösch, et al.,
D.M. Rösch
K. Rybka, et al.,
Defining the limits of homology modeling in information-driven protein docking Quality assessment of protein NMR structures An Empirical Analysis of Co-Movements in High- and Low-Frequency Metrics for Financial Market Efficiency The Impact of Arbitrage on Market Liquidity Disorder and order in unfolded and disordered peptides and proteins: A view derived from tripeptide conformational
analysis, II, Tripeptides with short side chains populating asx and β-type like turn conformations
N. Sahoo, et al.,
Heme impairs the ball-and-chain inactivation of potassium channels
K.B. Sai Sankar Gupta, et al.,
Bacteriopheophytin a in the active branch of the reaction center of rhodobacter sphaeroides is not disturbed by the protein
matrix as shown by 13C photo-CIDNP MAS NMR
Z.S. Saldi, et al.,
Effect of enhanced heat and mass transport and flow reversal during cool down on weld pool shapes in laser spot welding of steel
B. Sander, et al.,
Structural characterization of gephyrin by AFM and SAXS reveals a mixture of compact and extended states
E. Sanders, et al.,
Relating political party mentions on Twitter with polls and election results
M. Santcroos, et al.,
Exploring Flexible and Dynamic Enactment of Scientific Workflows using Pilot Abstractions
R. Sasidharan, et al.,
Root transcript profiling of two Rorippa (Brassicaceae) species reveals gene clusters associated with extreme submergence tolerance
B. van Schaik, et al.,
e-Bioscience Solutions and Challenges for Next Generation Sequencing Experiments
G. van der Schot, et al.,
L. Sementa, et al.,
Improving 3D structure prediction from chemical shift data Reactive scattering of H2 from Cu(100): comparison of dynamics calculations based on the specific reaction parameter approach to
density functional theory with experiment
S. Shahand, et al.,
A Data-Centric Science Gateway for Computational Neuroscience
E. Shumilina, et al.,
Competitive cobalt for zinc substitution in mammalian methionine sulfoxide reductase B1 overexpressed in E coli: structural and
functional insight
R. Silvers, et al.,
Detecting Intracellular Cysteine Redox States by in-Cell NMR Spectroscopy
M.E. Slooten, et al.,
D.F. Smith, et al.,
Tissue Sections and Beyond: Molecular Imaging of Truly Complex Surfaces by FT-ICR Mass Spectrometry
D.F. Smith, et al.,
Chemical Imaging by FT-ICR MS: From Buckyballs to High Performance Data Analysis
C.A. Söderberg, et al.,
J.H. Spaaks, et al.,
C. Staiger, et al.,
A.P. Stubbs
Field Hard x-ray photoemission and density functional theory study of the internal electric field in SrTiO3/LaAlO3 oxide heterostructures
The molecular basis of iron-induced oligomerization of frataxin and the role of the ferroxidation reaction in oligomerization Resolving structural errors in a spatially distributed hydrologic model using ensemble Kalman filter state updates Current composite-feature classification methods do not outperform simple single-genes classifiers in breast cancer prognosis TAG (Tumor Analysis in Galaxy): A Web Server Application for the Detection of Somatic Mutations in the Absence of
Associated Healthy Control
A.P. Stubbs
Control Free Tumour Analysis with Galaxy
K. Surdova, et al.,
SURFSARA Jaarverslag 2013
The conserved DNA-binding protein WhiA is involved in cell division in Bacillus subtilis
69
W. Sybesma, et al.,
M. Takacs, et al.,
I. Teles Alves, et al.,
Next-generation sequencing reveals novel rare fusion events with functional implication in prostate cancer
I. Teles Alves, et al.,
Gene fusions by chromothripsis of chromosome 5q in the VCaP prostate
E.F. Tjong Kim Sang, et al.,
M. den Toom, et al.,
Response of a Strongly Eddying Global Ocean to North Atlantic Freshwater Perturbations
M. den Toom, et al.,
Thermohaline feedbacks in ocean-climate models of varying complexity
H. Tops, et al.,
M. Trellet, et al.,
O. Valsson, et al.,
K.M. Varney, et al.,
A. Viegas, et al.,
Genome instability in Lactobacillus rhamnosus GG The asymmetric binding of PGC-1α to the ERRα and ERRγ nuclear receptor homodimers involves a similar recognition mechanism
Dealing with big data: The case of Twitter
Predicting time-to-event from Twitter messages A Unified Conformational Selection and Induced Fit Approach to Protein-Peptide Docking Rhodopsin absorption from first principles: Bypassing common pitfalls Turning Defense into Offense: Defensin Mimetics as Novel Antibiotics Targeting Lipid II Solution structure, dynamics and binding studies of a family 11 carbohydrate-binding module from Clostridium thermocellum (CtCBM11)
G.W. Vuister, et al.,
An overview of tools for the validation of protein NMR structures
F. Wegerich, et al.,
Mechanistic insights into the superoxide–cytochrome c reaction by lysine surface scanning
B. van de Weijer
G. van Wingen, et al.,
Ook op Blue Monday zijn we een vrolijk twittervolk Persistent and reversible consequences of combat stress on the mesofrontal circuit and cognition
P.K.J. Wong, et al.,
Crystalline CoFeB/graphite interfaces for carbon spintronics fabricated by solid phase epitaxy
T. van der Wouden
Zit je nu alweer te twitteren? Een nieuwe manier om partikels in kaart te brengen
S. Yuan, et al.,
M. Zhou, et al.,
Prevalence of transcription factors in ascomycete and basidiomycete fungi
M. Zhou, et al.,
A genomic survey of proteases in Aspergilli
M.M. Zwart, et al.,
SURFSARA Jaarverslag 2013
Electronic Properties of Disordered Graphene Antidot Lattices
Signatures predicting the (non-)genotoxic carcinogenic potential of chemicals
COLOFON Tekst Hendrikx Van der Spek, Bussum Ontwerp Studio Koelewijn Brüggenwirth, Den Haag Fotografie CERN, Frank van Beek, Hans Hordijk, Richard Keijzer, Robert Lagendijk, Harry Meijer, PhotoA, Nan Reunis, Roel Rozenburg, SURFsara © SURFsara 2014 SURFsara Science Park 140 1098 XG Amsterdam Postbus 94613 1090 GP Amsterdam
[email protected] www.surfsara.nl