Towards a national ICT infrastructure for research Naar een nationale ICT-infrastructuur voor onderzoek
SARA Jaar verslag A nnual 2011 Re po r t
SARA Jaar verslag A nnual 2011 Repor t
Contents / Inhoud
Cases
1 Working together to develop a more effective ICT research infrastructure / Samenwerken aan een betere onderzoeksinfrastructuur
Amandus Lundqvist on the cooperation between SURF, SARA and Vancis / Amandus Lundqvist over de samenwerking tussen SURF, SARA en Vancis
4
Wim Nieuwpoort Award 2011 goes to / gaat naar Prof. Dr. Hans de Raedt
18
Faster diagnosis for stroke patients / Sneller naar een diagnose bij een beroerte
20
10
LOFAR
26
2 High Performance Computing 3 Big Data
14
Intelligent search engines / Slimme zoekmachines
32
22
4 E-Science & Cloud Services
28
InfraWatch: keeping the Hollandse Brug in good condition / de gezondheid van de Hollandse Brug
34
5 Visualization / Visualisatie
36
Mantle dynamics: exploring the depths of the earth / Manteldynamica: een kijkje in de diepe aarde
40
6 Network Innovation & Support
44
DynaNets
42
7 Sustainability
52
Organization Chart / Organogram
56
Dynamic lightpaths facilitate DNA research / Dynamische lichtpaden vergemakkelijken DNA-onderzoek
48
Selection of publications / Selectie van publicaties 58
Neuro Image Analysis
50
Working together to develop a more effective ICT research infrastructure / Samenwerken aan een betere ICT-infrastructuur voor onderzoek
1
Collaboration has been the common thread throughout all SARA's activities in 2011. Our festive 40th anniversary also marked a celebration of increasingly intensive cooperation within the Dutch research community in the area of High Performance Computing and e-Science support. The relocation to our new home base at Science Park 140, consolidates the alliance between the European Grid Infrastructure (EGI), the Netherlands eScience Center (NLeSC), Vancis and SARA. Dr. Peter Michielse has been serving as SARA's new Deputy Director since November 2011. He will be jointly responsible for the further development of the organization's policy and strategies. Finally, SARA's intensive collaboration with Stichting SURF has helped the organization realize structural embedment of its various ICT services for the education and research segment.
Samenwerking is de rode draad in de activiteiten van SARA in 2011. Ons feestelijke 40-jarige jubileum was tevens een viering van de steeds intensievere samenwerking binnen de Nederlandse onderzoeksgemeenschap op het gebied van High Performance Computing en e-Science support. De verhuizing naar onze nieuwe basis op Science Park 140 markeert de samenwerking tussen European Grid Infrastructure (EGI), het Netherlands eScience Center (NLeSC), Vancis en SARA. Sinds november 2011 is dr. ir. Peter Michielse bij SARA werkzaam als adjunct-directeur. Hij zal mede verantwoordelijk zijn voor de verdere uitwerking van beleid en strategie. Tot slot maakt de intensieve samenwerking tussen de stichting SURF en de stichting SARA het mogelijk om een structurele bedding te geven aan alle ICT-diensten voor het onderwijs- en onderzoekssegment.
Anniversary
Jubileum
The anniversary was more than a celebration of SARA's success. Forty years of cooperation has helped build a tightly-knit community. This includes both founding fathers such as the University of Amsterdam and VU University Amsterdam and funding partners such as the Netherlands Organisation for Scientific Research (NWO) and SURF. The many researchers who make use of SARA's services also feel closely involved with the organization. In that sense, the anniversary marked a celebration for the entire Dutch research community.
Het jubileum was meer dan een feestje van SARA. Veertig jaar samenwerking heeft een hechte gemeenschap tot stand gebracht. Dat geldt voor founding fathers zoals de Universiteit van Amsterdam en de Vrije Universiteit, dat geldt ook voor funding partners zoals NWO en SURF. Ook de vele wetenschappers die gebruik maken van de diensten van SARA, voelen zich nauw bij de organisatie betrokken. In die zin is het jubileum een feest voor de gehele Nederlandse onderzoeksgemeenschap.
New building
Nieuw gebouw
40 years of SARA equals 40 years of dedication to developing a high-quality HPC infrastructure for the Dutch research community. The anniversary was celebrated at the end of 2011 at the Amsterdam Hermitage with a special event which was attended by 200 people. In the morning, SARA held a symposium featuring several prominent researchers. These special guests provided examples of the various ways in which Dutch HPC research infrastructure is contributing to new scientific insights. The symposium was followed by a festive celebration, with contributions from speakers from various sectors of the Dutch and international research and business communities.
Cooperation is also key to the new building commissioned by SARA in early 2011: the Matrix building at Science Park 140. SARA purchased the building in 2010, to serve as an office building for SARA and Vancis staff. SARA welcomed two new tenants over the course of 2011: EGI, the European Grid organization and the Netherlands eScience Center (NLeSC). Bringing these organizations together in a single building bundles extensive knowledge and experience in the area of infrastructure and support in a single location. SARA has been collaborating with EGI for some time now. The two organizations' close physical proximity has served to strengthen this cooperation. SARA also works in close collaboration with the NLeSC, an organization established in 2011.
40 jaar SARA betekent 40 jaar werken aan een hoogwaardige HPC- infrastructuur voor de Nederlandse onderzoeksgemeenschap. Het jubileum werd eind 2011 gevierd in de Amsterdamse Hermitage met 200 aanwezigen. In de ochtend organiseerde SARA een symposium met een aantal prominente wetenschappers. Zij maakten duidelijk hoe de Nederlandse HPC-onderzoeksinfrastructuur bijdraagt aan de totstandkoming van nieuwe wetenschappelijke inzichten. Het symposium werd gevolgd door een feestelijke viering met bijdragen van sprekers uit verschillende sectoren van onderzoek en bedrijfsleven uit binnen- en buitenland.
Samenwerking is ook het overkoepelende thema van het nieuwe gebouw dat SARA begin 2011 heeft betrokken: het Matrix-gebouw op Science Park 140. SARA heeft dit gebouw in 2010 als kantoorpand voor de eigen medewerkers van SARA en Vancis gekocht. In 2011 heeft SARA twee andere huurders verwelkomd: EGI, de Europese Grid-organisatie en het Nederlandse e-Science center (NLeSC). Door de huisvesting van deze organisaties in één gebouw, wordt heel veel kennis en ervaring op het gebied van infrastructuur en support gebundeld. Met EGI werkt SARA al geruime tijd samen, een samenwerking die nu eenvoudiger wordt door de fysieke nabijheid. Ook met het in 2011 opgerichte NLeSC werkt SARA nauw samen.
5
6
SURF and SARA
SURF en SARA
Plans to this end took concrete shape in 2011, following the realization of structural funding for the necessary ICT research infrastructure. This funding is based on a recommendation by ICTRegie specifying the structural financial means to be allocated to the new organization for its HPC infrastructure. These means have all been approved and allocated, with the exception of funding for the PRACE super node (a highly powerful European supercomputer). The boards of SURF and SARA have since set up a steering group charged with realizing their intended collaboration. If the integration effort goes according to plan, SARA will become a separate operating company – under the name SURFsara – administered by Stichting SURF.
In 2011 zijn die plannen in een stroomversnelling geraakt, onder meer doordat een basis is gelegd voor structurele financiering van de ICTinfrastructuur voor onderzoek. Die financiering is gebaseerd op het advies van ICTRegie, waarin de middelen gespecificeerd zijn die structureel beschikbaar worden gesteld aan de nieuwe organisatie voor de HPC-infrastructuur. Die middelen zijn goedgekeurd en gealloceerd, met uitzondering van de middelen die nodig waren voor realisatie van de PRACE-supernode (een zeer krachtige Europese supercomputer). Inmiddels hebben de besturen van de stichtingen SURF en SARA een stuurgroep ingesteld die deze voornemens tot samenwerking tussen SURF en SARA moet realiseren. Als de integratie doorgaat, zal SARA een aparte werkmaatschappij – genaamd SURFsara – worden onder Stichting SURF.
Technology transfer
Technology transfer
Plans for more intensive collaboration between SURF and SARA have been in the making for quite some time now. SURF is the parent organization responsible for facilitating cooperation between all academic and higher professional education institutions in the Netherlands. SURF coordinates the ICT infrastructure for the Education and Research segment. It would thus be a logical step for SARA to be included in this with its nation-wide activities.
Various scenarios for more intensive cooperation were discussed during the second half of 2011. These discussions also focused on the position of Vancis, SARA's subsidiary. For example, Vancis provides the data center for all SARA's services: SURF relies on this data center to ensure the continuity of SARA's services. Vancis' technology transfer platform is also a key factor in the decision to closely involve the organization in plans for the future. This platform can help SURF to market its solutions to a broader audience, including the education and research sector.
Al geruime tijd zijn er plannen voor een intensieve samenwerking tussen de stichtingen SURF en SARA. SURF is de samenwerkings organisatie van alle academische en hbo-instellingen in Nederland. SURF zorgt voor de coördinatie van de ICT-infrastructuur voor het segment Onderwijs en Onderzoek (O&O). In dat kader is het logisch dat SARA met haar nationale activiteiten daaronder valt.
In de tweede helft van 2011 zijn verschillende scenario's voor samenwerking besproken. Daarbij is ook de positie van Vancis, de dochter van de stichting SARA aan de orde gekomen. Zo levert Vancis het datacenter voor alle diensten van SARA: voor SURF is het dan ook heel belangrijk dat de continuïteit van dat datacenter voor SARAdiensten gegarandeerd is. Een andere reden om Vancis nadrukkelijk in de plannen te betrekken, is het technology transfer platform van Vancis. Oplossingen die bij SURF ontwikkeld worden, kunnen via die technology transfer een bredere markt bereiken, ook binnen de onderwijs- en onderzoekssector.
Science Park 140
As regards the clients serviced by SURF and SARA, the new collaboration will create a single point of contact for all universities, institutions and researchers (SURF) that can provide assistance on any questions relating to ICT infrastructure. The newly acquired structural financing will facilitate long-term planning. Collaboration between SARA, SURFnet, SURFdiensten, NLeSC and Vancis will stimulate innovation and facilitate the development of new services. The collaboration will also ensure that the existing ICT infrastructure is used as efficiently and effectively as possible. By joining forces, the partners will also be able to contribute more effectively to technology transfer in service of both researchers and the market and knowledge economy.
Voor de klanten van SURF en SARA betekent de samenwerking dat alle universiteiten, instellingen en wetenschappers straks één loket hebben (SURF) voor alle vragen die te maken hebben met de ICT-infrastructuur. Dankzij de structurele financiering wordt langetermijnplanning gemakkelijker. Samenwerking tussen SARA, SURFnet, SURFdiensten, NLeSC en Vancis zorgt voor meer innovatie en maakt het eenvoudiger om nieuwe diensten te ontwikkelen. De samenwerking zorgt er bovendien voor dat de bestaande ICT-infrastructuur zo efficiënt en effectief mogelijk gebruikt wordt. Gezamenlijk kunnen de samenwerkings partners ook beter bijdragen aan technology transfer, zowel voor wetenschap als voor de markt en de kenniseconomie.
Priority sectors
Die kenniseconomie staat centraal in het nieuwe topsectorenbeleid van de Nederlandse overheid. Nederland wil zijn concurrentiepositie verbeteren door uit te gaan van de kracht van negen topsectoren, van agrofood tot creatieve industrie. In elke sector streeft men naar samenwerking binnen de driehoek van ondernemen (het bedrijfsleven), onderzoek (de universiteiten) en overheid (de faciliterende partner). ICT is aangemerkt als horizontaal belang voor alle topsectoren.
This knowledge economy is central to the Dutch government's new priority sectors policy ('topsectoren'). The Netherlands is seeking to improve its competitive position by building on the strengths of nine designated priority sectors, ranging from agrofoods to the creative industry. Each sector is striving to build alliances within the trifecta of entrepreneurship (the business sector), research (universities) and government (the facilitating partner). ICT is of key interest across the board in all priority sectors. The priority sectors policy offers interesting perspectives for SARA. For example, SARA has spent the past few years developing the HPC Cloud. Our cloud services can be further enriched with specific applications for the priority sectors. The emphasis will be on applying simulation and modeling to improve product quality, and the analysis of Big Data. SARA has prepared a white paper outlining a global plan for the application of HPC in each priority sector. Working in collaboration with SURF, SARA has also submitted a proposal for the development of a stimulation program to the Ministry of Economic Affairs, Agriculture & Innovation. We expect the priority sectors policy to become one of the government's key target areas in 2012 and 2013.
Topsectoren
Voor SARA biedt het topsectorenbeleid interessante aanknopingspunten. Zo heeft SARA in de afgelopen jaren de HPC Cloud ontwikkeld. Onze clouddiensten kunnen verrijkt worden met specifieke applicaties voor de topsectoren, waarbij het vooral gaat om simulatie en modellering voor het verbeteren van de kwaliteit van producten, en om de analyse van Big Data. Inmiddels heeft SARA een white paper gemaakt met een globaal plan voor de inzet van HPC in elke topsector. Daarnaast heeft SARA samen met SURF een voorstel bij het ministerie van Economische Zaken, Landbouw en Innovatie ingediend voor het opzetten van een stimuleringsprogramma. We verwachten dat het topsectorenbeleid in 2012 en 2013 een belangrijk speerpunt gaat worden.
7
40th anniversary / 40-jarig jubileum
8
Morning Program – Symposium
10:00 Opening – Professor Emeritus Henk van der Vorst – Chair Welcome – Dr. Ir. Anwar Osseyran, Managing Director of SARA/Vancis 10:10 Dr. Arno Knobbe, Leiden Institute for Advanced Computer Science (LIACS) Modeling complex physical systems: a data-intensive approach 10:30 Dr. Frank J. Seinstra, VU University Amsterdam Welcome to the Jungle 10:50 Prof. Dr. Danielle Posthuma, VU University Amsterdam Genes, Diseases and Lisa - how an advanced ICT research infrastructure contributes to our health 11:10 Pitches for the Wim Nieuwpoort Award 2011 • Prof. Dr. De Raedt, University of Groningen Massively Parallel Quantum Dynamics Simulation • Dr. Verstappen, University of Groningen Numerical Simulation of turbulent Channel Flow • Prof. Dr. Pallante, University of Groningen Particle Physics on Supercomputers • Prof. Dr. Dijkstra (represented by Ir. Michael Kliphuis), Utrecht University Stability of the Atlantic Meridional Overturning Circulation (SAMOC) • Dr. Harting (represented by Florian Janoschek), Eindhoven University of Technology, Hybrid Lattice Boltzmann and Molecular Dynamics for Soft Matter and Microfluidics 11:40
Keynote Dr. Marc Teerlink MBA/MBI, Global Strategist IBM Center of Competence IBM's Watson - Deep Insight is more than just playing a game of Jeopardy!
12:25
Lunch
Afternoon Program – Celebration
13:30 Opening – Professor Emeritus Henk van der Vorst – Chair Welcome – Dr. Ir. Anwar Osseyran, Managing Director of SARA/Vancis 13:40 K eynote Larry Smarr Ph.D., Director of the California Institute for Telecommunications and Information Technology (Calit2) 21st Century e-Knowledge Requires a High Performance e-Infrastructure 14:30 Drs. Ir. Aloys Kregting MBA, Chief Information Officer Royal DSM NV High Performance Information 14:50 Prof. Dr. Emile Aarts, Vice President Philips Research Beyond Simulation New e-Science Perspectives on Industrial Innovation 15:15
anel discussion P H igh Performance Computing for the Topsectoren led by Henk van der Vorst Panel members: • Dr. Sijbolt Noorda, Chairman of SARA • Ing. Amandus Lundqvist, Chairman of SURF • Prof. Dr. Jos Engelen, President of the Governing Board of NWO
15:40 Granting of the Wim Nieuwpoort Award 15:50
40 years Scientific Computing (movie)
16:00 Music entertainment by the Flageolettes and Carmen Gomes Inc. Guided tour at the Museum of the Hermitage Amsterdam, offered by IBM.
9
The integration of ICT and research improves competitiveness Amandus Lundqvist on the cooperation between SURF, SARA and Vancis
Integratie van ICT en onderzoek zorgt voor economische slagkracht
Amandus Lundqvist over de samenwerking tussen SURF, SARA en Vancis
10
Amandus Lundqvist has been chairman
Amandus Lundqvist is sinds 1 mei 2010
of the SURF foundation since 1 May 2010.
voorzitter van de stichting SURF. Voor die
Previous employers include IBM, where
tijd was hij onder meer werkzaam
he served as General Director from 1992
bij IBM, waar hij van 1992 tot 2001 de
to 2001. He served as chairman of the
functie vervulde van Algemeen Directeur.
Executive Board at Eindhoven University
Van 2002 tot 1 mei 2010 was hij voorzitter
of Technology from 2002 to 1 May 2010. We
van het college van bestuur van de TU
asked Lundqvist to share his views on the
Eindhoven. Wij vroegen hem zijn visie over
concrete plans for cooperation between
de vergevorderde plannen tot samenwerking
SURF, SARA and Vancis.
tussen SURF, SARA en Vancis.
Ing. Amandus Lundqvist
Stichting SURF and Stichting SARA have developed concrete plans for a more streamlined collaboration. Could you outline the background to this decision?
“The plans date back to the report by the Van Velzen Committee from 2008. This report revolved around the following key question: how can we develop a world-class ICT infrastructure for the Dutch research community? The report was followed up by a recommendation by ICTRegie, which set out plans to incorporate all national ICT facilities for Dutch researchers in the SURF organization. Although the government adopted this recommendation, it took some time to find the necessary financial means. The plans for further collaboration gained new impetus over the course of 2010 and 2011. The focus then shifted towards the significance of ICT and research in terms of the Netherlands' competitive position. The necessary financial means were finally allocated in late 2011.”
What form will this cooperation take in practice, and which plans and scenarios are currently being explored?
“The collaboration will be further developed in close consultation between SURF and SARA. We also spoke with the original founders of SARA, the University of Amsterdam and VU University Amsterdam. We set up a project team consisting of representatives of both organizations. The formal decision-making procedure is set to take place in 2012. However, we do agree on the most important aspect: SARA's activities should be incorporated into the SURF family. Involving Vancis in the process would seem a logical step, although we do feel the organization should become an independent company operating under SURF's supervision with a special status. We are currently working to further develop this scenario. Vancis and SARA have extremely close ties. Although the two organizations are separate entities, they are clearly interdependent, if only because Vancis is responsible for managing the datacenter that houses SARA's infrastructure. Although this dependence does carry a certain degree of risk, it also offers great potential in terms of technology transfer.
De Stichtingen SURF en SARA hebben vergevorderde plannen om strakker te gaan samenwerken. Wat zijn daar de achtergronden van?
“Die plannen gaan terug tot het rapport van de commissie Van Velzen uit 2008. Centraal daarin stond de vraag: hoe kom je tot een wereldklasse ICT-infrastructuur voor de onderzoekswereld in Nederland? Dat heeft een vervolg gekregen in het advies van ICTRegie, waarin de aanbeveling werd gedaan alle nationale ICT-voorzieningen voor Nederlandse onderzoekers onder te brengen in de SURForganisatie. De regering heeft dat advies overgenomen, maar het heeft enige tijd geduurd voordat daar de bijbehorende middelen bij gevonden werden. In de loop van 2010 en 2011 zijn de plannen tot samenwerking in een stroomversnelling geraakt. Daarbij is de focus komen te liggen op het belang dat de combinatie van ICT en onderzoek heeft voor de concurrentiekracht van Nederland. Uiteindelijk zijn de middelen eind 2011 daadwerkelijk toegekend.”
Op welke manier gaat die samenwerking gestalte krijgen en welke plannen en scenario's worden op dit moment onderzocht?
“De samenwerking krijgt vorm in goed overleg tussen de stichting SURF en de stichting SARA. We hebben ook gesproken met de oorspronkelijke oprichters van de stichting SARA, de Universiteit van Amsterdam en de Vrije Universiteit. We hebben een projectteam ingesteld met vertegenwoordigers van de beide stichtingen. In 2012 moet de formele besluitvorming plaatsvinden. Maar op hoofdlijnen zijn we het eens: de activiteiten van SARA moeten een plaats krijgen binnen de SURF-familie. Als we dat doen, is het verstandig om Vancis mee te nemen in het proces, maar dan als zelfstandig bedrijf onder SURF met een aparte status. Dat scenario gaan we nu verder uitwerken. De relatie tussen Vancis en SARA is zeer hecht. Het zijn weliswaar twee aparte entiteiten, maar met een heel duidelijke afhankelijkheid, alleen al omdat Vancis het datacenter beheert waar de infrastructuur van SARA is gehuisvest. Die afhankelijk‑ heid is een risico, maar biedt ook veel kansen voor technologie transfer.
11
12
Vancis' success can be traced back to two factors: firstly, it maintains close ties with both the Amsterdam Internet Exchange (AMS-IX) and the Research and Education sector on the other. Secondly, Vancis exchanges knowledge with SARA in the area of advanced ICT infrastructures.”
Dat Vancis zo succesvol is, heeft twee oorzaken: ten eerste de nauwe relatie met enerzijds de Amsterdam Internet Exchange (AMS-IX) en anderzijds de wereld van O&O, onderzoek en onderwijs. Een tweede oorzaak is de uitwisseling van kennis op het gebied van geavanceerde ICT-infrastructuren met SARA.”
How will this intended collaboration affect Dutch universities, universities of applied sciences and research institutes?
Wat betekent die geplande samenwerking voor de Nederlandse universiteiten, hogescholen en onderzoeksinstellingen?
Do you expect the new collaboration to yield new types of services?
Verwacht u dat de samenwerking ook nieuwe vormen van dienstverlening gaat opleveren?
“The planned collaboration will be entirely beneficial to Dutch universities and universities of applied sciences. For the first time, we will be in a position to create a competitive ICT infrastructure that comprises both the network and all other SARA facilities. If we then add intensive cooperation in the area of e-Science support, you've got a state-of-the-art center.”
“Absolutely. In fact, that was even one of the prerequisites formulated by the Ministry of Economic Affairs, Agriculture & Innovation, one of our main sponsors. The Ministry is trying to create a more competitive small and medium-sized business sector. As we know from experiences in the US, High Performance Computing, modeling and research can be applied to benefit the sector. It doesn't matter whether you manufacture golf clubs or tires: High Performance Computing can help you make your company more knowledge-intensive, innovate the production process and improve competitiveness. By joining forces, the trifecta of research, government and business can lend an extra dimension to this process. Vancis could play a role in this regard, using the facilities offered by SARA.”
SURF is dedicated to the principle of sustainability. ICT requires a great deal of energy and has a major carbon footprint. Will SURF be stimulating the education sector to reduce its energy consumption?
“I believe we should certainly be taking on that challenge. Green ICT isn't something you can simply opt into, like green energy. Green ICT is an element of corporate social responsibility, and it needs to
“Voor de Nederlandse universiteiten en hogescholen heeft de samenwerking alleen maar voordelen. We kunnen dan echt gaan praten over een competitieve ICT-infrastructuur, die niet alleen het netwerk omvat, maar ook alle andere faciliteiten van SARA. Voeg daaraan toe de intensieve samenwerking op het gebied van e-Science support, en je hebt een state-of-the-art centrum.”
“Ja, dat is zelfs een voorwaarde van het ministerie van Economische Zaken, Landbouw en Innovatie (EL&I), een van de subsidiënten. EL&I zoekt naar wegen om het MKB competitiever te maken. In de VS is gebleken dat je het MKB op een hoger plan kunt brengen met behulp van High Performance Computing, modellering en onderzoek. Of je nu golfclubs produceert of banden, High Performance Computing kan je helpen om je bedrijf kennisintensiever te maken, je productieproces te vernieuwen en slagkracht te geven. In de driehoek onderzoek, overheid en ondernemen kunnen we hier een extra dimensie aan geven. Vancis zou daar een rol in kunnen spelen, met gebruikmaking van de faciliteiten van SARA.”
Duurzaamheid staat hoog in het vaandel bij SURF. ICT is een grote energieverbruiker en veroorzaakt veel CO2-uitstoot. Gaat SURF de educatieve sector bewegen het energieverbruik te verminderen? “Ik vind dat we onszelf die opdracht moeten geven. Groene ICT is geen aanbieding zoals groene stroom, waarvoor je wel of niet kunt kiezen. Groene ICT is een onderdeel van maatschappelijk verantwoord ondernemen, dat moet een onderdeel van ons DNA worden. We willen ICT op de best mogelijke en meest duurzame
become part of our organizational DNA. We want to provide ICT services as effectively and sustainably as we possibly can. SURF recently organized two seminars on the subject. SARA plays a leading role in this process. What could be better than combining the two?”
The Dutch government's priority sectors policy is designed to stimulate the knowledge economy. You are effectively the figurehead for the High Tech priority sector. Which role is SURF set to play in this regard?
“Our collaboration with SARA and Vancis offers interesting perspectives in terms of the government's priority sectors policy. In addition to my role as a figurehead for the High Tech sector, I also act as an ICT ambassador based on the notion that ICT is a precondition for all priority sectors. For this reason, we have developed a separate ICT Roadmap. The emphasis is on identifying developments and innovations that can be applied in multiple priority sectors. Examples of such developments include the issue of cyber security, and the processing of extremely large datasets. SARA and Vancis can both contribute in their own way to the development of High Performance Computing for the priority sectors. The Roadmap defines a number of these important themes. We will be establishing a Priority Sectors Consortium for Knowledge and Innovation specializing in ICT. SURF will have the opportunity to participate in this initiative.”
manier aanbieden. Bij SURF hebben we daar onlangs nog seminars over gehouden. SARA speelt daar een voortrekkersrol in. Wat is er mooier dan die twee te combineren?”
Nederland wil met het topsectorenbeleid de kenniseconomie stimuleren. U bent het boegbeeld van de topsector High Tech. Welke rol gaat SURF hierin spelen?
“De samenwerking met SARA en Vancis biedt interessante mogelijkheden voor het topsectorenbeleid van de overheid. Naast mijn functie als boegbeeld voor de High Tech-sector ben ik ook ambassadeur op het gebied van ICT, met het idee dat ICT een voorwaarde voor alle topsectoren vormt. We hebben daarom een aparte ICT Roadmap ontwikkeld. Het gaat er dan om ontwikkelingen en innovaties te signaleren, die van toepassing kunnen zijn binnen meerdere topsectoren. Een voorbeeld van zo'n ontwikkeling is cybersecurity, een andere is hoe je om moet gaan met zeer grote dataverzamelingen. Bij High Performance Computing voor de topsectoren kunnen SARA en Vancis ieder hun eigen inbreng hebben. Binnen die Roadmap hebben we een aantal van dergelijke thema's geïdentificeerd. We zullen daarover een Topconsortium kennis en innovatie gaan vormen, specifiek voor ICT. Daar kan SURF in participeren.”
13
High Performance Computing
2
High Performance Computing (HPC) has been an essential tool for a broad range of scientific disciplines for decades now. However, supercomputers are no longer the exclusive domain of computer scientists, physicists and mathematicians. This development was clearly reflected at SARA's 40th anniversary celebration, an event attended by some 200 invitees from the Dutch research community.
High Performance Computing (HPC) is al decennia lang een onmisbaar gereedschap voor een breed scala aan wetenschappen. De tijden zijn echter voorbij dat alleen informatici, astronomen, natuurkundigen en wiskundigen gebruik maakten van de supercomputer. Dat bleek overduidelijk tijdens het 40-jarige jubileum van SARA, waarbij zo'n 200 genodigden van de Nederlandse onderzoeksgemeenschap aanwezig waren.
Wim Nieuwpoort Award
Wim Nieuwpoort Award
Huygens User Day
Gebruikersdag Huygens
New supercomputer
Nieuwe supercomputer
Preparations for the replacement of our national supercomputer began in earnest over the course of 2011. By mid-2011, a large number of end users had been interviewed extensively in order to identify their wishes and requirements. Following consultations with end users and research into user applications, an application benchmark
De voorbereidingen voor de vervanging van de nationale super computer zijn in 2011 in volle omvang gestart. Medio 2011 is een groot aantal eindgebruikers uitvoerig geïnterviewd en zijn hun eisen en wensen in kaart gebracht. Op basis van consultatie van eindgebruikers
The anniversary celebrations also included the presentation of the Wim Nieuwpoort Award, a prize established in 2010 in order to promote the use of Dutch supercomputer systems for large-scale computing. The award was presented to Professor Hans de Raedt for his proposal entitled Massively Parallel Quantum Dynamics Simulator (see page 18). The award consists of a € 5,000 cash prize and the opportunity to present the winning proposal at SC12, the international conference on Supercomputing and Communications to be held in the United States in November 2012.
Like last year, SARA organized another edition of the annual Huygens User Day in October, an event that caters to a clear need within the HPC community. The event provides an opportunity for novice and experienced users alike to exchange experiences and benefit from the knowledge of SARA's Huygens team. Amongst other issues, experts will discuss systems architecture, software optimization, OpenMP and debugging.
The technology used in supercomputers is developing at a rapid pace. When the national supercomputer Huygens was originally commissioned in 2008, SARA was at the vanguard of the HPC sector. Amongst other applications, Huygens is used in studies on clean energy, climate change, water management, noise pollution reduction and the improvement of medical treatments. With demand for large-scale computing capacity growing by the day, the current system's capacity has now become inadequate. The system's lifespan is also nearing its end. Replacement of the national Huygens supercomputer is thus an urgent priority for the Dutch scientific and business community. Huygens has dropped from the international top 500 since 2011.
Tijdens dit jubileum is bovendien de Wim Nieuwpoort Award uitgereikt, een prijs die in 2010 is ingesteld om grootschalig rekenen op de supercomputersystemen in Nederland te bevorderen. De prijs werd toegekend aan prof. dr. Hans de Raedt voor zijn inzending Massively Parallel Quantum Dynamics Simulator (zie pagina 19). De prijs bestaat uit een geldbedrag van € 5.000,- en de mogelijkheid het voorstel te presenteren op SC12, de internationale conferentie op het gebied van Supercomputing en Communications in november 2012 in de Verenigde Staten.
Net als in het afgelopen jaar organiseerde SARA in oktober opnieuw de jaarlijkse Huygens gebruikersdag. Dit evenement sluit aan bij een duidelijke behoefte binnen de HPC-gemeenschap. Beginners en gevorderden kunnen op deze dag ervaringen uitwisselen en profiteren van de kennis van het Huygens-team van SARA. Daarbij komen onderwerpen aan de orde als systeemarchitectuur, optimalisatie van software, OpenMP, debugging en nog veel meer.
De technologie waarvan supercomputers gebruik maken, ontwikkelt zich snel. Toen de nationale supercomputer Huygens in 2008 in gebruik werd genomen, bevond SARA zich met deze machine in de voorhoede op HPC-gebied. Huygens wordt onder meer ingezet bij onderzoek op het gebied van schone energie, klimaatverandering, watermanagement, beperken van geluidshinder en verbeteren van medische behandelingen. Omdat de vraag naar grootschalige rekencapaciteit voor onderzoek voortdurend toeneemt, is de capaciteit van het huidige systeem niet langer toereikend. Bovendien komt het einde van de levensduur van het systeem in zicht. De vervanging van de nationale supercomputer Huygens is daarmee urgent en noodzakelijk, zowel voor wetenschap als bedrijfsleven in Nederland. Sinds 2011 staat Huygens niet meer in de internationale top-500.
15
Team Cluster Computing
16
was defined in order to serve as a basis for the selection of a new system. Extensive measurements and analyses were also conducted in order to assess system usage (aspects such as memory and I/O), user applications and scalability. Application performance, low energy consumption and on-demand availability have all been earmarked as key selection criteria. SARA will be initiating a tender procedure for the new supercomputer over the course of 2012.
Grand Challenge Experiences and Future System Requirements
The Grand Challenge Experiences and Future System Requirements workshop is one of the initiatives aimed at stimulating greater user involvement in the new supercomputer. SARA invited researchers who use Huygens or one of the other European supercomputers in Grand Challenges: research projects that can only be conducted on a supercomputer. Workshop participants shared their experiences in working on Grand Challenges and discussed the relevant implications in terms of the new supercomputer.
On demand growth
The current supercomputer has 65 Teraflops of computing power. According to Moore's law, computing power doubles every 18 months. This means the new computer should be able to offer around one Petaflop of computing power. Rather than purchasing the entire machine at once, the new supercomputer will be designed to grow on-demand, according to the needs of its users. The new system's computing power will thus increase over several years until it has reached a capacity of one Petaflop. This will help to minimize the equipment's ecological footprint and operational costs.
National compute cluster LISA
The national compute cluster LISA is a frequently-used high performance capacity computing system that has served its users to satisfaction for many years now. The system thus forms an effective supplement to the national supercomputer for high performance capability computing. Lisa is used by researchers from the University of Amsterdam, VU University Amsterdam and several of the institutes comprising the Foundation for Fundamental Research on Matter (FOM). The system is also used at a national level. Parts of the
en gebruikersapplicaties is een applicatiebenchmark samengesteld voor de selectie van een nieuw systeem. Verder zijn onder andere uitgebreide metingen en analyses verricht van het gebruik van het systeem (zoals geheugen en I/O) en van gebruikersapplicaties en schaalbaarheid. Applicatieperformance, laag energieverbruik en on-demand inzetbaarheid zijn belangrijke selectiecriteria voor het nieuwe systeem. In 2012 zal SARA een aanbesteding voor een nieuwe supercomputer uitschrijven.
Grand Challenge Experiences and Future System Requirements
Een van de manieren om de gebruikers te betrekken bij de nieuwe supercomputer was de workshop Grand Challenge Experiences and Future System Requirements. Voor deze workshop had SARA onderzoekers uitgenodigd die gebruik maken van Huygens of een van de andere Europese supercomputers voor zogenaamde Grand Challenges: onderzoeken die alleen op een supercomputer uitgevoerd kunnen worden. Tijdens deze workshop deelde men ervaringen met Grand Challenges en bespraken de deelnemers de consequenties van deze ervaringen voor een nieuw aan te schaffen supercomputer.
On demand groei
De huidige supercomputer heeft een rekenkracht van 65 Teraflops. Volgens de wet van Moore verdubbelt de rekenkracht elke 18 maanden: dat zou betekenen dat een nieuwe machine over een rekenkracht van ongeveer één Petaflop zou moeten beschikken. Het idee is niet om deze machine in één keer aan te schaffen, maar om de nieuwe supercomputer on demand met het gebruik mee te laten groeien. Dat houdt dus in dat de rekenkracht in een aantal jaren zal toenemen tot één Petaflop. Dat vermindert de ecologische voetafdruk van de apparatuur én de operationele kosten.
Nationaal rekencluster LISA
Het nationaal rekencluster LISA is al vele jaren een veel gebruikt en gewaardeerd systeem voor high performance capacity computing. Daarmee vormt het een uitstekende aanvulling op de nationale supercomputer voor high performance capability computing. Het systeem wordt gebruikt door onderzoekers van de Universiteit van Amsterdam, de Vrije Universiteit en een aantal instituten die deel
Team Supercomputing
cluster are regularly updated with new technology, in order to ensure that the system's performance and energy consumption meet the latest requirements. This helps ensure that researchers have continued access to a state-of-the-art system.
PRACE (Partnership for Advanced Computing in Europe) European cooperation in the area of HPC is becoming increasingly intensive. Eventually, the collaboration will result in a competitive European HPC infrastructure with regional (tier-2), national (tier-1) and European (tier-0) systems. Together, they will form a single European HPC network. Although each country will remain responsible for its own national system, top-level European researchers in need of large-scale computing capacity will also gain access to the European tier-0 systems (France and Germany gained access in 2011). The national tier-1 supercomputers (including the Dutch system) will be integrated in PRACE's research infrastructure over the course of 2012. The systems were previously connected through DEISA (Distributed European Infrastructure for Supercomputing Applications).
SARA organized the first PRACE tier-1 Workshop in November 2011. The workshop was mainly intended for researchers that had taken part in PRACE's first call for proposals for tier-1 computing time. Of the 51 researchers to submit a proposal, a total of 35 were eventually selected.
uitmaken van de Stichting voor Fundamenteel Onderzoek der Materie (FOM). Daarnaast wordt LISA ook landelijk gebruikt. Regelmatig wordt een deel van het cluster verbeterd met nieuwe technologie, zodat performance en energieverbruik aan de eisen blijven voldoen. Hierdoor kunnen onderzoekers blijven beschikken over een state-of-the-art systeem.
PRACE (Partnership for Advanced Computing in Europe) De samenwerking op het gebied van HPC binnen Europa wordt steeds intensiever. Die samenwerking moet uiteindelijk leiden tot een concurrerende HPC-infrastructuur in Europa met regionale (tier-2), nationale (tier-1) en Europese (tier-0) systemen. Samen zorgen ze voor één Europees HPC-stelsel van supercomputers. Elk land moet blijven zorgen voor het eigen nationaal systeem, maar Europese toponderzoekers die grootschalige rekencapaciteit nodig hebben, krijgen tevens toegang tot de Europese tier-0-systemen (in 2011 in Frankrijk en Duitsland). In 2012 zullen de nationale tier-1-supercomputers (waaronder de Nederlandse) geïntegreerd worden binnen de onderzoeksinfrastructuur van PRACE. Tot nu toe waren deze systemen verbonden binnen DEISA (Distributed European Infrastructure for Supercomputing Applications).
In november 2011 is bij SARA de eerste PRACE tier-1 Workshop gehouden. Deze workshop was in de eerste plaats bedoeld voor deelnemers die een voorstel hadden ingezonden voor de eerste call for proposals binnen PRACE voor tier-1-rekentijd. Van de 51 wetenschappers die een voorstel hadden ingezonden, zijn er 35 geselecteerd.
17
Wim Nieuwpoort Award 2011 goes to / gaat naar Prof. Dr. Hans de Raedt Case
18
The second Wim Nieuwpoort Award was presented at SARA's 40 th anniversary celebration at the Amsterdam Hermitage. The research group headed by Prof. Dr. Hans de Raedt submitted the winning proposal, entitled 'Massively Parallel Quantum Dynamics Simulator'. The research group will be receiving € 5,000 and an invitation to take part in SC12, the supercomputing conference to be held in the United States in November 2012.
Wim Nieuwpoort Award SARA and NCF established the Wim Nieuwpoort Award in 2010, in an effort to promote the use of supercomputer systems in the Netherlands for the purpose of large-scale calculation. The award was named after professor emeritus Wim Nieuwpoort, who laid the groundwork for a national infrastructure for scientific computations in the Netherlands. Thanks to Nieuwpoort's efforts in the nineteen eighties, scientific disciplines gained access to advanced computing facilities.
Computational physics Groningen University's Computational Physics research group develops innovative applications for computing and information technology in physics research. De Raedt: ”Thanks to recent developments in the area of computing and information technology, we can now apply computer simulations in our research as a supplement to conventional theoretical and experimental methods. We apply these innovative new technologies in two ways: 1 T he traditional method: we apply a mathematical model in terms of basic physics equations and use the computer to solve these equations without approximation. This allows us to answer questions we would not be able to resolve through the conventional theoretical approach. 2 T he unconventional method: we describe the observed phenomena in terms of simple events. We then draw up simple rules in order to reproduce the experimental facts in a computer simulation, without reverting to basic physics equations.”
Simulation code The winning proposal, De Raedt explains, is “a simulation code that allows us to examine quantum physics phenomena that can only be studied through simulations. The code is thus of great interest to researchers interested in nanomagnetism, decoherence, fundamental questions regarding relaxation to thermal equilibrium and quantum computation. The simulation code will also allow us to develop new fields of research.” Researchers are currently applying the simulation code in various areas: • T he simulation of electron spin resonance (ESR) and nuclear magnetic resonance (NMR) experiments with nanoscale magnets; • T he quantum dynamics of molecular magnets and diluted magnets; • Q uantum annealing; • Simulating physics implementations of quantum computer hardware; • Answering fundamental questions on statistical physics. De Raedt regards the Wim Nieuwpoort Award as an incentive: “The fact that our research group won this award for the simulation code is obviously a token of recognition for our work, but it also confirms that pure scientific research is still valued.”
Collaboration with SARA De Raedt greatly values the ongoing collaboration with SARA: “I have been employing SARA's services since the early nineteen eighties. SARA have always been quick to solve any problems we encountered along the way. SARA's computational facilities are excellent, and on a par with the services offered by leading facilities around the world. I hope they can manage to maintain the same high standards in years to come.”
Wim Nieuwpoort Award 2011 voor Prof. Hans de Raedt
Prof. Dr. Hans de Raedt Prof. emeritus Wim Nieuwpoort
Tijdens de viering van het 40-jarig jubileum van SARA in de Hermitage is voor de tweede keer de Wim Nieuwpoort Award uitgereikt. De onderzoeksgroep van Prof. Dr. Hans de Raedt had met 'Massively Parallel Quantum Dynamics Simulator' het winnende voorstel ingediend. De onder zoekgroep ontvangt € 5.000 en een uitnodiging om deel te nemen aan SC12, de supercomputingconferentie in november 2012 in de Verenigde Staten.
Wim Nieuwpoort Award SARA en NCF hebben de Wim Nieuwpoort Award in 2010 in het leven geroepen om grootschalig rekenen op de supercomputer systemen in Nederland te bevorderen. De award is vernoemd naar professor emeritus Wim Nieuwpoort, de grondlegger van een nationale infrastructuur voor het wetenschappelijk rekenen in Nederland. Dankzij de inspanningen van Nieuwpoort in de jaren tachtig kregen wetenschappelijke disciplines toegang tot geavanceerde rekenfaciliteiten.
Rekenfysica De onderzoeksgroep Rekenfysica van de Rijksuniversiteit Groningen heeft als doel om op innovatieve wijze computer- en informatietechnologie te gebruiken voor onderzoek in de fysica. De Raedt: ”Door recente ontwikkelingen in de computer- en informatietechnologie kunnen wij naast de conventionele theoretische en experimentele methodes ook computersimulatie gebruiken in ons onderzoek. Dit gebeurt op twee manieren: 1 De traditionele manier: we gaan uit van een mathematisch model in termen van de basisvergelijkingen van de natuurkunde en gebruiken de computer om deze vergelijkingen compromisloos op te lossen. We kunnen dan antwoorden geven op vraagstellingen, die we met de gangbare theoretische aanpak niet konden beantwoorden. 2 D e onconventionele manier: we gaan uit van een voorstelling van de geobserveerde verschijnselen in termen van enkel voudige gebeurtenissen. We proberen eenvoudige regels op te stellen die bij computersimulatie de experimentele feiten
reproduceren, zonder een beroep te doen op de basisvergelijkingen van de natuurkunde.”
19
Simulatiecode Het winnende voorstel, zo zegt De Raedt, is “een simulatiecode om fenomenen in de kwantumfysica te onderzoeken die we alleen via simulaties kunnen bestuderen. Dit maakt de code erg interessant voor onderzoekers die geïnteresseerd zijn in nanomagnetisme, decoherence, fundamentele vragen over het relaxeren naar thermisch evenwicht en quantum computation. Met de simulatiecode kunnen we namelijk ook nieuwe onderzoeksgebieden ontsluiten.“ Momenteel gebruiken onderzoekers de simulatiecode in meerdere applicaties: • In de simulatie van elektron-spin-resonantie (ESR) en nucleaire magnetische resonantie (NMR) experimenten op nanoschaal–magneten; • In de kwantumdynamica van molecular magnets en diluted magnets; • In Quantum Annealing; • In de simulatie van natuurkundige realisaties van kwantumcomputerhardware; • Bij de beantwoording van vragen over de fundamenten van statistische fysica. De Raedt ziet de Wim Nieuwpoort Award als een stimulans: “Het feit dat onze onderzoeksgroep met de simulatiecode deze award heeft gewonnen, betekent erkenning voor ons werk, maar ook erkenning dat er nog altijd waardering is voor zuiver wetenschappelijk onderzoek.“
Samenwerking met SARA De Raedt is zeer tevreden over de samenwerking met SARA: “Ik gebruik de diensten van SARA al sinds het begin van de jaren tachtig. Als er al eens een probleem was, dan kon SARA dat steeds snel verhelpen. De rekenfaciliteiten zijn uitstekend en op een internationaal competitief niveau. Ik hoop dat dit in de toekomst zo blijft.“
19
Faster diagnosis for stroke patients / Sneller naar een diagnose bij een beroerte Case
20
Silvia Olabarriaga is head of the e-bioscience group at the Academic Medical Center (AMC) in Amsterdam. The group deals with the area between Informatics and Life Sciences. Olabarriaga's group develops informatics solutions to problems encountered in medical research, often in collaboration with SARA. A good example is the solution to faster diagnosis in stroke patients.
CT scan When a patient with acute stroke arrives at the hospital, it is essential to establish whether he or she is suffering from a cerebrovascular accident or cerebral haemorrhage as soon as possible. To do this, doctors carry out a CT scan of the brain: a 3D image of the head. In order to identify the cause of cerebral haemorrhage or a cerebrovascular accident, the blood vessels in the head are shown by means of CT angiography (CTA). Contrast fluid is injected into the bloodstream before the procedure is carried out. The assessment of a CTA is complicated by the presence of bone, which makes it difficult to see the blood vessels, and certainly to detect finer details.
MMBE In order to remove the bone from the CT scan images, the Radiology and Medical Physics departments at the AMC have worked together to develop the MMBE (Matched Masked Bone Elimination) technique. MMBE makes it easier to visualize the CT scan images. Two CT scans are carried out of the head: one without and one with contrast fluid in the blood vessels. The bone is masked. The scans are placed one on top of the other and very carefully matched. A radiologist can then determine the cause of cerebral haemorrhage or a cerebrovascular accident. The matching process takes around twenty minutes: too long in a life or death situation.
The e-bioscience group has been awarded a grant by the Netherlands National Computing Facilities Foundation (NCF) to parallelize the MMBE program. It has asked SARA to help to develop a solution that will in future make it possible to determine the cause of a stroke within ten minutes. Many scientists and clinicians at the AMC have collaborated in this project, including Henk Marquering, Paul Groot, Ludo Beenen, Charles Majoie and Antoine van Kampen.
Parallelization SARA has analyzed the AMC's programs and examined how the desired time savings can be achieved using parallelization. SARA has come up with a highly successful solution that can match the scans within ten minutes. Olabarriaga is extremely happy with the results, but explains: “We have not yet reached a stage where the program can prove itself in practice. It is currently a 'proof of concept' within the AMC. Doctors and radiologists must assess the program and look at how they want to use it in a clinical context. One issue to be addressed is the transfer time between the CT scan and the processing system. The parallelized program must also be incorporated into the AMC's computer systems. This process is subject to strict requirements. The program must be approved and must have proven itself.”
SARA's role “SARA played the role of implementing party in this project. SARA thoroughly examined and improved the program and has delivered a parallelized program that we can use”, says Olabarriaga. “We would be very happy to engage SARA again for similar projects in the future.”
In het Academisch Medisch Centrum in Amsterdam geeft Silvia Olabarriaga leiding aan de e-bioscience groep. Deze groep houdt zich bezig met het gebied tussen Informatica en Life Sciences. Voor problemen in het medisch onderzoek ontwikkelt de groep van Olabarriaga informaticaoplossingen. Zij werkt hiervoor vaak samen met SARA. Een goed voorbeeld hiervan is de oplossing voor een snellere diagnostiek bij een beroerte. CT-scan Wanneer een patiënt met een acute beroerte in het ziekenhuis aankomt, moet zo snel mogelijk worden vastgesteld of er sprake is van een herseninfarct of hersenbloeding. Artsen maken hiervoor een CT-scan van de hersenen: een 3D-beeld van het hoofd. Om de oorzaak van een hersenbloeding of herseninfarct vast te stellen, worden de bloedvaten in het hoofd afgebeeld door middel van een CT angiografie (CTA). Daarvoor injecteert men vooraf een contrastvloeistof in de bloedbaan. De moeilijkheid bij het beoordelen van een CTA is de aanwezigheid van bot waardoor de vaten niet goed zichtbaar zijn, zeker wanneer het om kleine details gaat.
MMBE Om het bot uit de beelden van de CT-scan te verwijderen, hebben de afdelingen Radiologie en Medische fysica van het AMC samen de MMBE-techniek (Matched Masked Bone Elimination) ontwikkeld. Met MMBE is het mogelijk om de beelden van de CT-scan beter te visualiseren. Men maakt hiertoe twee CT-scans van het hoofd: één zonder en één met contrastvloeistof in de bloedvaten. Het bot wordt gemaskeerd. De scans worden op elkaar gelegd en heel nauwkeurig gematched. Een radioloog kan dan de oorzaak van een hersenbloeding of herseninfarct vaststellen. Dit matchen duurt ongeveer twintig minuten: te lang in een levensbedreigende situatie.
De e-bioscience groep heeft subsidie gekregen van NCF om |het MMBE-programma te parallelliseren. Ze heeft SARA gevraagd om mee te werken aan een oplossing, zodat voortaan binnen tien minuten de oorzaak van een beroerte kan worden vastgesteld. Vele wetenschappers en clinici van het AMC werkten mee aan dit project, onder wie Henk Marquering, Paul Groot, Ludo Beenen, Charles Majoie en Antoine van Kampen.
Parallellisatie SARA heeft de programma's van het AMC geanalyseerd en gekeken hoe met behulp van parallellisatie de gewenste tijdwinst kan worden behaald. SARA heeft ervoor gezorgd dat het matchen van de scans binnen tien minuten zeer goed mogelijk wordt. Olabarriaga is erg tevreden over het resultaat, maar vertelt: “We zijn nog niet zo ver dat het programma zich in de praktijk kan bewijzen. Het is nu een 'proof-of-concept' binnen het AMC. Artsen en radiologen moeten het programma beoordelen en bekijken hoe zij het willen gebruiken in de kliniek. Aandachtspunt hierbij is de transfertijd tussen de CT-scan en het verwerkingsapparaat. Ook moet het geparallelliseerde programma worden opgenomen in de computersystemen van het AMC. Hiervoor gelden strenge eisen. Het programma moet goedgekeurd zijn en zich bewezen hebben.”
Rol van SARA “SARA vervulde in dit project de rol van uitvoerende partij. SARA heeft het programma grondig bekeken en verbeterd en heeft het programma geparallelliseerd opgeleverd waarmee we verder kunnen”, vertelt Olabarriaga. “We zouden SARA in de toekomst graag nog inhuren voor vergelijkbare projecten.”
21
21
Big Data
3
The research sector is becoming increasingly data-intensive: well-known major research infrastructures, such as CERN's Large Hadron Collider, are producing an increasing volume of data. However, there are also other sources of data such as Twitter or DNA analyses of entire populations or ecosystems. The data produced by these sources is also becoming increasingly complex and variable. Big Data is characterized by what are known as the three Vs: Volume, Velocity and Variety. Working with Big Data requires high standards in terms of transport, storage and – most importantly – processing. SARA aims to be one of the first to tailor its services to the processing of this growing data volume.
De wetenschap wordt steeds 'data-intensiever': bekende grote onderzoeksinfrastructuren, zoals de Large Hadron Collidor van CERN, produceren steeds meer data. Maar denk vooral ook aan andere bronnen van data zoals Twitter en DNA-analyses van hele populaties of ecosystemen. Bovendien wordt de data steeds complexer en veranderlijker. Kenmerkend voor Big Data zijn de drie V's: Volume, Velocity en Variety. Omgang met Big Data stelt hoge eisen aan transport, opslag en met name verwerking ervan. SARA zit vooraan om de dienstverlening af te stemmen op de groeiende datastroom.
Scale and complexity
Omvang en complexiteit
SARA is involved in the data explosion affecting these disciplines in various ways. Firstly, we ensure that the data can be easily stored, made accessible and shared. This generally involves use of the BiG Grid. SARA also develops services to facilitate the analysis of complex data. The development of Hadoop (see the chapter on e-Science & Cloud Services, page 28) is a good case in point.
SARA is op verschillende manieren betrokken bij de data-explosie binnen deze wetenschappen. Allereerst zorgen we ervoor dat die data eenvoudig opgeslagen, toegankelijk gemaakt en gedeeld kan worden. Dat gebeurt veelal in BiG Grid-verband. Daarnaast ontwikkelt SARA diensten om de analyse van complexe data te vergemakkelijken. Een voorbeeld daarvan is de ontwikkeling van Hadoop (zie hiervoor het hoofdstuk over e-Science & Cloud Services, pagina 29).
The term Big Data is used to denote datasets that are so large or complex that they cannot be processed or edited by normal means. Such datasets require a different type of knowledge, and different tools. The effects of Big Data can be felt everywhere, especially in sectors that work with large amounts of images, measurement data and mobile devices. Examples of disciplines that produce Big Data include astronomy, healthcare, social sciences, life sciences, water management, ecology and climate studies.
CERN and LOFAR: large volumes
CERN and LOFAR both produce large volumes of data. CERN is home to the Large Hadron Collider (LHC), the world's largest energy particle accelerator. The LHC is used to study the standard model of particle physics. As a part of the BiG Grid initiative, SARA works with Nikhef to store and analyze data from three of the four major LHC experiments. In 2011, the amount of data stored on behalf of the LHC grew by 1500 TeraBytes. LOFAR is the world's largest radio telescope. It consists of a network of thousands of antennas in an area with a diameter of 100 kilometers that spans the three northernmost provinces of the Netherlands and extends to neighboring countries. Dutch astronomers use the telescope to make observations that will help us gain a greater understanding of the universe. Over the course of 2011, the amount of data supplied by LOFAR grew at an even faster rate than the data from the LHC, increasing by over 1900 TeraBytes. The growth in data volumes from LOFAR actually exceeded that of ATLAS, the largest LHC experiment.
Big Data is een benaming voor verzamelingen van gegevens die zo groot of complex zijn dat de gebruikelijke middelen voor beheer en bewerking niet meer toereikend zijn. Dergelijke dataverzamelingen vergen andere kennis en andere tools. De gevolgen van Big Data zijn overal merkbaar, vooral in sectoren met veel beeldmateriaal, meetgegevens en mobiele apparaten. Voorbeelden van vakgebieden waar Big Data geproduceerd wordt zijn de astronomie, gezondheidszorg, sociale wetenschappen, life sciences, waterbeheer, ecologie en klimaatonderzoek.
CERN en LOFAR: grote volumes
Twee dataproducenten die zich kenmerken door grote volumes zijn CERN en LOFAR. CERN huisvest de Large Hadron Collidor (LHC), de grootste deeltjesversneller ter wereld. De LHC wordt gebruikt voor onderzoek naar het standaardmodel van de deeltjesfysica. Binnen het kader van BiG Grid verzorgt SARA in samenwerking met Nikhef de opslag en analyse van data voor drie van de vier grote experimenten van de LHC. In 2011 groeide de dataopslag voor de LHC met bijna 1500 TeraByte. LOFAR is de grootste radiotelescoop van de wereld. De telescoop is opgebouwd als een netwerk van duizenden antennes, die verdeeld zijn over een gebied met een diameter van 100 kilometer in NoordNederland, met uitlopers buiten Nederland. Met deze telescoop doen Nederlandse sterrenkundigen waarnemingen die moeten leiden tot meer kennis over het begin van ons heelal. De data van LOFAR namen in 2011 nog sneller toe dan die van de LHC, en wel met meer dan 1900 TeraByte. LOFAR groeide in hoeveelheden data inmiddels al harder dan ATLAS, het grootste experiment van de LHC.
23
24
As a result of this increase, the total volume of data managed by SARA has now reached a total of 5000 TeraBytes (5 PetaBytes). We expect to see a comparable growth of around 4500 TeraBytes (4.5 PetaBytes) in 2012.
Als resultaat van deze toename is het totale volume van beheerde data bij SARA nu gestegen tot 5000 TeraByte (5 PetaByte). In 2012 verwachten we een vergelijkbare groei van ongeveer 4500 TeraByte (4,5 PetaByte).
Research data: a high level of complexity
Een nieuwe ontwikkeling is de snelle groei van data die veel minder gestructureerd is dan de data die de astronomie en de hogeenergiefysica produceren. Denk bijvoorbeeld aan onderzoeksdata van ziekenhuizen of vanuit de levenswetenschappen. Dat zijn doorgaans complexere data, en bovendien willen onderzoekers die data op veel verschillende manieren kunnen 'bevragen'. Ook binnen de taalwetenschappen bestaat die behoefte, bijvoorbeeld bij het onderzoek naar grote lexicons. Onderzoekers willen daarin kunnen zoeken, annoteren en analyses kunnen uitvoeren.
In another new development, we are also seeing a rapid growth in data that is less structured than the information generated by astronomy and high energy physics research. This includes research data from hospitals or life sciences researchers. This type of data is often of a more complex nature. Furthermore, researchers need the ability to query the information in many different ways. Linguistics researchers also need the same capability for various research purposes, such as the study of large lexicons. Researchers want to be able to search, annotate and analyze data according to their specific needs. The volume of data produced by these disciplines is growing rapidly. A good case in point would be DNA research conducted as a part of bio informatics studies. For example, researchers may wish to link research results to microscopic images and scans. In many cases, they also need the capacity to compare multiple data sources. An example would be the FlySafe project, a study of avian migration patterns conducted by the University of Amsterdam, aimed at ensuring aviation safety. The project sees researchers combine data from military radars, weather radars, the Royal Netherlands Meteorological Institute (KNMI) and data from small GPS transmitters attached to birds, in order to predict migration patterns at a specific point in time.
European cooperation
Interest in Big Data is also growing at European level. Amongst other initiatives, SARA has been collaborating with the European EUDAT project, which was launched in 2011. EUDAT focuses on the development of a Collaborative Data Infrastructure (CDI) capable of meeting the future needs of the research community.
Onderzoeksdata: grote complexiteit
De omvang van de data die in deze sectoren wordt geproduceerd, neemt snel toe. Een voorbeeld is het DNA-onderzoek binnen de bio-informatica. Onderzoekers willen in zo'n geval bijvoorbeeld onderzoeksresultaten in verband brengen met microscoopbeelden en scans. Bovendien wil men vaak meerdere databronnen kunnen vergelijken. Een voorbeeld is het project FlySafe, een onderzoek van de Universiteit van Amsterdam naar vogeltrek, onder andere om veilig vliegverkeer mogelijk te maken. Hierbij combineren onderzoekers data van militaire radars, weerradars, het KNMI, geografische data en data van kleine GPS'jes die op vogels geplaatst worden om een voorspelling te kunnen doen over de vogeltrek op een bepaald moment.
Europese samenwerking
Ook op Europees niveau is er veel belangstelling voor Big Data. SARA werkt in dat verband bijvoorbeeld samen in het Europese project EUDAT, dat in 2011 van start is gegaan. EUDAT richt zich op de ontwikkeling van een zogenaamde Collaborative Data Infrastructuur (CDI) die aan de toekomstige behoefte van onderzoekers voldoet.
Team Data Services
Some of the 'hot issues' currently affecting EUDAT include long-term preservation, long-term storage and data accessibility. The focus is not merely on finding the most effective storage method; it is also important to ensure that data can still be read twenty years down the line, even if the application used to create it has since become obsolete.
25 Een hot issue binnen EUDAT is onder meer long term preservation, langetermijnopslag en toegankelijkheid van data. Daarbij gaat het niet alleen om de wijze van opslag; het is ook belangrijk dat je de data na twintig jaar nog kunt lezen – ook als de applicatie waarmee de data is gemaakt, inmiddels is verouderd.
Persistent Identifiers
Persistent Identifiers
SARA is one of the organizations participating in EPIC, the European Persistent Identifier Consortium. The consortium focuses on the development and distribution of Persistent Identifiers (PID), which is basically a unique code (comparable to an ISBN number) used to identify files. SARA is currently collaborating with German and Finnish EPIC partners. PIDs ensure that the associated data object can be found at all times, even when they refer to another location. Researchers have a stake in ensuring that PIDs are broadly recognized and implemented. For this reason, all EPIC partners are actively seeking out new research institutions that are willing to purchase their PIDs from EPIC. In the Netherlands, the Netherlands Institute for Sound and Vision uses PIDs to improve the accessibility of its own digital collection. A growing number of new users adopted the system in 2011. SARA will be collaborating with Kennisnet and the cultural heritage sector, through participation in the Catch plus project (Continuous Access to Cultural Heritage).
SARA is een van de deelnemers binnen EPIC, het European Persistent Identifier Consortium. Dit consortium richt zich op de ontwikkeling en verspreiding van Persistent Identifiers (PID), als het ware de ISBN-nummers van een file. Binnen EPIC werkt SARA samen met Duitse en Finse partners. Een PID zorgt ervoor dat het bijbehorende dataobject altijd te vinden is, ook als het naar een andere locatie verhuist. Belangrijk voor onderzoekers is dat PID's in brede kring worden erkend en toegepast. Alle EPIC-partners zijn daarom actief op zoek naar nieuwe onderzoeksinstellingen die hun PID's bij EPIC willen afnemen. In Nederland maakt bijvoorbeeld het Instituut voor Beeld en Geluid gebruik van PID's voor het toegankelijk maken van de eigen digitale collectie. In 2011 zijn er meer gebruikers bijgekomen. SARA gaat samenwerken met Kennisnet en met de erfgoedsector in de vorm van het Catch-plus project (Continuous Access to Cultural Heritage).
LOFAR Case
26
For years, the well-known radio telescopes in Dwingeloo and Westerbork allowed us to conduct research on the Milky Way and outer reaches of the universe, making a crucial contribution to radio astronomy. However, these telescopes have their limitations. Stichting ASTRON in Dwingeloo has therefore been working hard to develop their successor: the LOFAR (Low Frequency Array) telescope. Stichting ASTRON is the Netherlands Institute for Radio Astronomy. The institute consists of three pillars: Research and Development, Astronomy and the Radio Observatory. The LOFAR telescope, largely designed and developed by ASTRON, is now operational. The Radio Observatory manages the telescope on behalf of the International LOFAR Telescope (ILT) in addition to its responsibility for the Westerbork Synthesis Radio Telescope (WSRT), and provides LOFAR data to the scientific community. Hanno Holties works as a system engineer at the Radio Observatory.
LOFAR Holties explains: ”The LOFAR telescope had to meet at least two important criteria. The first is a high degree of flexibility. Traditional telescopes only allow us to observe a limited part of the universe at a time, and their mechanical components require a great deal of maintenance. LOFAR is made up of thousands of small antennas in stations throughout the Netherlands. All these antennas are connected electronically. This enables LOFAR to continually monitor the entire visible universe, and respond quickly as soon as an event (such as an exploding star) takes place. Secondly, the telescope had to be highly sensitive. Thanks to its extensive network of antennas, LOFAR can pick up a large spectrum of radio signals.”
BiG Grid infrastructure All radio signals are transmitted to a central processing unit in Groningen via a fiber network. Here, the first round of qualitative processing is conducted, and the data is stored temporarily. LOFAR's computer systems do not allow for long-term data storage. Amongst other facilities, ASTRON uses SARA's BiG Grid infrastructure for long-term storage and data analysis. Compressed data is transferred to SARA in Amsterdam via a fiber optic network, where it is stored on disks and tapes. Radio astronomers are accustomed to accessing data immediately after an observation, so that they can then process it on a workstation. However, the scale of operations at LOFAR is so great that this is no longer possible. Although the BiG Grid infrastructure offers the necessary facilities, processing on this system does require specialist knowledge. This is why ASTRON aims to offer astronomers access to the relevant data via a portal. Scientists can then specify which form of processing they wish to carry out, after which the data will be processed in the BiG Grid infrastructure. This means scientists do not need to have specialized knowledge of the infrastructure's inner workings.
The future: the SKA telescope SARA and ASTRON have been engaged in intensive and constructive collaboration on the LOFAR project since 2008. This collaboration offers perspective for the future in terms of the Netherlands' role in SKA (Square Kilometer Array), an international project. The technologies developed by LOFAR are a good learning process for SKA. Holties: ”SKA consists of mini receivers and static antennas comparable to those used by LOFAR. However, the frequency and scale is so much larger that the resulting radio astronomy data can only be measured in Exabytes and Exaflops. Data processing and storage thus represents a major challenge. We will be applying the lessons we are currently learning at LOFAR in the development of the SKA telescope.”
Wim Nieuwpoort Award 2011 voor Prof. Hans de Raedt
De bekende radiotelescopen in Dwingeloo en Westerbork maakten jarenlang onderzoek mogelijk naar het melk wegstelsel en de rest van het universum en leverden een zeer belangrijke bijdrage aan de radioastronomie. Deze telescopen hebben echter hun beperkingen en daarom is bij Stichting ASTRON in Dwingeloo intensief gewerkt aan de ontwikkeling van de opvolger: de LOFAR-telescoop (Low Frequency Array). Stichting ASTRON is het Nederlands Instituut voor Radio astronom ie. Het bestaat uit drie pijlers: Research and Development, Astronomie en de Radio Sterrenwacht. De LOFAR-telescoop is goeddeels ontworpen en ontwikkeld door ASTRON en is nu operationeel. De Radio Sterrenwacht beheert deze telescoop voor de International LOFAR Telescope (ILT), naast de Westerbork Synthesis Radio Telescope (WSRT), en stelt LOFAR-data beschikbaar aan de wetenschap. Bij de Radio Sterrenwacht werkt Hanno Holties als system engineer.
LOFAR Holties vertelt: ”De LOFAR-telescoop moest voldoen aan tenminste twee belangrijke criteria. Ten eerste grote flexibiliteit. Met de traditionele telescopen kunnen we slechts een beperkt deel van de hemel tegelijk bestuderen en de mechanica vergt veel onderhoud. LOFAR bestaat uit duizenden kleine antennes verspreid over Nederland die elektronisch met elkaar zijn verbonden. Zo kan LOFAR de hele zichtbare hemel continu monitoren en snel reageren als ergens een event (bijvoorbeeld een ontploffende ster) optreedt. Ten tweede een hoge gevoeligheid. LOFAR haalt dankzij het grote aantal antennes heel veel radiosignaal binnen.”
BiG Grid-infrastructuur Alle radiosignalen gaan via glasvezel naar een centrale processing unit in Groningen. Hier vindt de eerste kwalitatieve dataverwerking en de tijdelijke dataopslag plaats. Langetermijnopslag is op de computersystemen van LOFAR niet mogelijk. Voor de langetermijno pslag en de data-analyse maakt ASTRON onder meer gebruik van de BiG Grid-infra structuur bij SARA. Gecomprimeerde data gaat via glasvezel naar SARA in Amsterdam en wordt daar opgeslagen op schijven en tapes. Traditioneel zijn radioastronomen gewend om de data kort na een waarneming te krijgen en zelf te verwerken op een werkstation. Bij LOFAR is de schaal echter zo groot dat dit niet meer kan. De BiG Grid-infrastructuur biedt de mogelijkheden om deze data te verwerken, maar dat vereist de nodige kennis. ASTRON wil daarom via een portal toegang tot de data geven. De wetenschapper kan dan aangeven welke processing hij wil doen waarna de verwerking van de data gebeurt op de BiG Grid-infrastructuur. Op die manier hoeft een wetenschapper niet precies te weten hoe die infrastructuur werkt.
De toekomst: de SKA-telescoop SARA en ASTRON werken al sinds 2008 intensief en constructief samen vanwege het LOFAR-project. Die samenwerking biedt perspectief als het gaat om de Nederlandse rol bij SKA (Square Kilometer Array), een wereldwijd project. De technologieën die LOFAR ontwikkelt zijn een goed leerproces voor SKA. Holties: ”SKA bestaat uit mini-schotels en statische antennes zoals bij LOFAR, maar de frequentie is hoger en de schaal nog groter waardoor de radioastronomie in de Exabytes en Exaflops terechtkomt. De dataverwerking en –opslag is daarmee een grote uitdaging. De lessen die we nu leren met LOFAR kunnen we toepassen bij de ontwikkeling van de SKA-telescoop.”
27
27
E-Science & Cloud Services
4
A growing number of researchers need accessible, high-quality ICT facilities. SARA is catering to this need by developing flexible solutions that help bridge the gap between research and HPC facilities. Collaboration between researchers and ICT specialists is key to these efforts. Grid and Cloud services are already in common use, with new forms of infrastructure currently under development.
Steeds meer wetenschappers hebben behoefte aan een laagdrempelige toegang tot hoogwaardige ICT-voorzieningen. SARA speelt daarop in door flexibele oplossingen te ontwikkelen die een brug slaan tussen wetenschap en HPC-faciliteiten. Samenwerking tussen wetenschappers en ICT-specialisten staat daarbij centraal. Grid- en Clouddiensten worden inmiddels in brede kring gebruikt; nieuwe vormen van infrastructuur staan al weer in de steigers.
Innovation
A large part of SARA's innovation activities are conducted by the e-Science and Cloud Services team. The users' requirements are central to each innovation; technology is developed on the basis of their needs. SARA also works in close collaboration with end users when developing new solutions. This cooperation extends beyond the harmonization of needs and wishes; users invest a great deal of time and energy in the new solutions, which they develop in close collaboration with SARA employees. Many new solutions are initially developed in a Proof of Concept environment, and subsequently made available to a larger user group if proven to be successful. The solution will then be offered in the form of a service.
HPC Cloud
Amongst other solutions, this approach resulted in development of the HPC Cloud. The HPC Cloud provides Dutch researchers with a high performance alternative to the services of commercial cloud providers, coupled with expert support. The HPC Cloud is based around the key concepts of flexibility, virtualization and individual responsibility. Users conducting research on multiple operating systems can use the HPC Cloud to create a hybrid cluster. For example, data can be pre-processed on a Microsoft cluster and analyzed using a Linux cluster. The system allows researchers with a complex workflow involving multiple tools and applications to launch multiple virtual machines within their own environment. Applications can also be scaled up with great ease: researchers can launch ten or fifty virtual machines instead of just one. This innovative infrastructure was still in a developmental phase in 2010. In 2011, SARA moved from a beta environment to a production infrastructure. The new production infrastructure was officially launched on 4 October 2011 at the HPC Cloud day. The day's events included presentations on numerous scientific research projects conducted by means of the HPC Cloud. Some 150 guests witnessed the festive inauguration. Although the HPC Cloud has now become a fully fledged production infrastructure, new innovations are continually being implemented.
Innovatie
Een groot deel van de innovatieactiviteiten van SARA wordt uitgevoerd bij het team e-Science en Cloud Services. Bij elke innovatie staan de behoeften van de gebruikers centraal; de technologie is volgend. Ook bij de ontwikkeling van nieuwe oplossingen werkt SARA nauw samen met de gebruikers. Die samenwerking gaat verder dan afstemming; de gebruikers steken veel tijd en energie in de nieuwe oplossingen en werken zij aan zij met medewerkers van SARA. Veel nieuwe oplossingen worden eerst in een proof-of-concept-omgeving ontwikkeld en bij succes aan een grotere groep gebruikers ter beschikking gesteld. Daarna wordt de oplossing als dienst aangeboden.
HPC Cloud
Deze aanpak heeft bijvoorbeeld geresulteerd in de ontwikkeling van de HPC Cloud. De HPC Cloud biedt onderzoekers in Nederland een high-performance en met expertise ondersteund alternatief voor de diensten van commerciële cloudaanbieders. Sleutelwoorden binnen de HPC Cloud zijn flexibiliteit, virtualisatie en eigen verantwoordelijkheid. Gebruikers die onderzoek doen met behulp van verschillende operating systems, kunnen met de HPC Cloud een hybride cluster samenstellen. Ze kunnen bijvoorbeeld data voorbewerken met een Microsoft-cluster en deze vervolgens analyseren met een Linux-cluster. Onderzoekers die een complexe workflow hebben met verschillende tools en applicaties, kunnen binnen hun eigen omgeving verschillende virtuele machines opstarten. Bovendien kunnen ze zeer eenvoudig applicaties opschalen: in plaats van één virtuele machine kunnen ze er ook tien of vijftig starten. In 2010 verkeerde deze innovatieve infrastructuur nog in een ontwikkelfase, in 2011 is SARA overgegaan van een bètaomgeving naar een productie-infrastructuur. De nieuwe productie-infrastructuur is op 4 oktober 2011 geopend tijdens de HPC Cloud dag. Tijdens deze dag werd een groot aantal voorbeelden gepresenteerd van wetenschappelijk onderzoek dat met de HPC Cloud is uitgevoerd. Ongeveer 150 bezoekers maakten de feestelijke inauguratie mee. Overigens is de HPC Cloud nu dan wel een productie-infrastructuur, maar de innovatie ervan gaat gewoon door.
29
System Engineers of the team e-Science & Cloud Services
30
Hadoop
Hadoop
Hadoop was developed as an implementation of the Map Reduce framework developed by Google. Users from the scientific community were closely involved in its development. A good example of a practical application would be the study on language analysis (information retrieval) by Edgar Meij (UvA) (see page 32).
Hadoop is ontwikkeld als implementatie van het zogenoemde Map Reduce framework, dat ontwikkeld is door Google. Gebruikers vanuit de wetenschap zijn nauw betrokken bij de ontwikkeling van Hadoop. Een voorbeeld van een toepassing is het onderzoek op het gebied van taalanalyse (information retrieval) van Edgar Meij (UvA) (zie pagina 33).
SARA started work on a Proof of Concept for Hadoop in 2010, making the transition to a production infrastructure in 2011. SARA's Hadoop cluster combines storage (300 TeraBytes) and computing power (66 nodes). Each disk has great computing capacity. This means each research question can be allocated to multiple processors at the same time, so that the results can be combined at a later stage.
SARA is in 2010 begonnen met een proof-of-concept van Hadoop, in 2011 is de overstap gemaakt naar een productie-infrastructuur. Het Hadoopcluster bij SARA vormt een combinatie van storage (300 TeraByte) en rekenkracht (66 nodes). Bij elke disk hoort een grote hoeveelheid rekenkracht. Dat maakt het mogelijk om iedere vraag parallel uit te zetten en daarna de resultaten samen te brengen.
Beehub
Beehub
When fully developed, the service will be made available via SURFconext, SURFnet's platform for generic services for the Education and Research segment. SURFconext will provide centralized authentication. Beehub is currently in the pre-production phase, with production expected to start in the second half of 2012.
Het is de bedoeling om deze service aan te bieden via SURFconext, het platform waarop SURFnet generieke diensten aan het O&O-segment aanbiedt. SURFconext regelt centraal de authenticatie. Beehub is nu in de pre-productiefase en gaat naar verwachting in de tweede helft van 2012 in productie.
BiG Grid
BiG Grid
The research sector is currently facing a 'datanami', a veritable flood of data threatening to immerse the scientific world. In addition to (extremely) large volumes, the data is also of an increasing complexity. How does one analyze large amounts of often complex data in a straightforward manner? This question lies at the heart of Hadoop.
In 2011, SARA developed a new service in collaboration with its users: Beehub. This service can be described as a basic, easily accessible data storage solution. The service is currently being developed to serve as a data storage, transfer and sharing system. Beehub can also handle larger data volumes.
BiG Grid is working to develop an e-Science-infrastructure for the Dutch research community. SARA serves as its most important operational partner. Hadoop, Beehub and HPC Cloud all make up part of the BiG Grid infrastructure. This infrastructure was further strengthened in 2011: computing power and storage capacity
De wetenschap wordt geconfronteerd met een 'datanami', een vloedgolf van data die de wetenschap dreigt te overspoelen. Daarbij gaat het niet alleen om (zeer) grote aantallen, maar vooral ook om een toenemende complexiteit. Hoe kun je op een eenvoudige manier grote hoeveelheden (complexe) data analyseren? Deze vraag ligt aan de basis van Hadoop.
In 2011 heeft SARA samen met gebruikers een nieuwe dienst ontwikkeld: Beehub. Deze service kan worden omschreven als een eenvoudige en laagdrempelige oplossing voor dataopslag. Het wordt ontwikkeld als een dataopslag, -transfer en -deelsysteem. Daarbij kan het ook om grotere hoeveelheden data gaan.
BiG Grid richt zich op de ontwikkeling van een e-Science-infrastructuur in Nederland. SARA is daarbinnen de grootste operationele partner. Hadoop, Beehub en HPC Cloud zijn onderdeel van de BiG Gridinfrastructuur. Deze infrastrucuur is in 2011 verder versterkt: de rekenkracht en storage zijn aanzienlijk toegenomen. Daarnaast
Consultants of the team e-Science & Cloud Services
increased substantially. SARA has also launched several new services that will supplement and enrich the existing range of products. Each service is designed to improve the accessibility of HPC facilities for a broad group of users from disciplines such as life sciences, medical sciences, astronomy and high energy physics.
heeft SARA een aantal nieuwe diensten gelanceerd die het bestaande aanbod aanvullen en verrijken. Het gaat er steeds om HPC-faciliteiten toegankelijk te maken voor een brede groep gebruikers, afkomstig uit onder meer de levenswetenschappen, medische wetenschappen, astronomie en hoge-energiefysica.
The e-BioGrid project is BiG Grid's gateway to Life Sciences. The e-BioGrid team sees researchers in life sciences work in close collaboration with SARA's ICT specialists. Together, they develop projects that make effective use of the (grid) infrastructure. e-BioGrid brings together life sciences-related research and infrastructure.
Het project e-BioGrid is de toegangspoort van BiG Grid voor de Life Sciences. Binnen het e-BioGrid-team werken onderzoekers vanuit de levenswetenschappen en ICT-specialisten van SARA nauw samen. Dat resulteert in projecten die effectief van de (grid)infrastructuur gebruik maken. e-BioGrid brengt wetenschap en infrastructuur op het gebied van de levenswetenschappen bij elkaar.
LifeWatch
LifeWatch
The Netherlands plays a key role within LifeWatch, and has committed itself to coordinating a European infrastructure. SARA is closely involved in this process, and helps to ensure an effective match between the technological infrastructure and research questions from the scientific field.
Nederland speelt een belangrijke rol binnen LifeWatch en heeft de coördinatie van een Europese infrastructuur op zich genomen. SARA is daar nauw bij betrokken en draagt bij aan een goede match tussen de technische infrastructuur en de vragen vanuit de wetenschap.
At European level, we are seeing a growing tendency towards cooperation between major research infrastructures such as CERN's Large Hadron Collider. LifeWatch is one such research infrastructure within the field of life sciences. LifeWatch is a data and knowledge hub specializing in life on earth, environmental aspects and biodiversity. The research infrastructure is working to gather data and knowledge and develop tools, applications and virtual labs.
Binnen Europa is een tendens om grote onderzoeksinfrastructuren, zoals de Large Hadron Collidor van CERN, steeds meer te laten samen werken. LifeWatch is een voorbeeld van zo'n onderzoeksinfrastructuur binnen de levenswetenschappen. LifeWatch is een data- en kennishub op het gebied van leven, omgeving en biodiversiteit. Daarbinnen wordt een verzameling van data en kennis, tools, applicaties en virtuele labs opgebouwd.
31
Intelligent search engines / Slimme zoekmachines Case
32
A research group at the University of Amsterdam's Informatics Institute is studying search engines and language technology. Within this research group, postdoctoral researcher Edgar Meij focuses on developing more intelligent search engines. In order to conduct his research, Meij makes use of SARA's Hadoop cluster. “We can develop more intelligent search engines in a number of ways”, Meij explains. “For example, we can improve the user interface through new innovations, or resolve specific use cases. However, I mainly focus on developing more intelligent search engines through the application of conceptual knowledge. This includes both the type of information you would find on Wikipedia, and specific annotations to web pages you want to retrieve. Basically, you want to link the query to the annotations.”
Semantic linking “In order to enable intelligent web page searches, we need to analyze the relevant texts and determine which 'entities' they contain”, Meij explains. “This process is known as semantic linking: we can enrich the web pages with links to – for example – Wikipedia. If we then enter a search query such as 'Michael Jackson' after having incorporated the annotations in the web page, we will establish a one-on-one link to the relevant document.” “However, semantic linking presents a number of problems. Firstly, there might be more well-known people with the name Michael Jackson. So, how can we be sure the information we are getting relates to the right Michael Jackson? The second problem is on the search side. If we enter the query 'Michael Jackson' in Google, the search engine will speculate (based on over fifty features) that we meant the singer Michael Jackson. However, this is not entirely satisfactory. After all, we might have been searching for one of the other Michael Jacksons. This is the challenge we are currently facing: developing a 'smart' solution to these problems.”
Hadoop In order to conduct his research, Meij makes frequent use of SARA's Hadoop cluster, which is financed via BiG Grid. Hadoop is a great help to Meij for two reasons: “Wikipedia is enormous. We use Hadoop to make Wikipedia accessible. Hadoop also allows us to parallelize. In other words: dividing up a large task into sub-tasks. Each sub-task is handled by a separate search engine. The more engines we have, the faster the tasks can be completed. In some cases, we have to search and analyze 20 to 30 TeraBytes of Internet data as a part of our research. That's simply not possible on a normal computer. Hadoop allows us to combine the storage capacity of multiple computers. This ability to store large datasets, such as a dump of the Internet, is extremely useful.”
Collaboration with SARA Meij is satisfied with the ongoing collaboration with SARA: “Our cooperation has been very effective. SARA is a renowned name within the academic world. It's easy to contact their staff members and discuss any issues you may be encountering. I first became familiar with Hadoop during a pilot project, which was an interesting and useful experience.”
t deal zi g) ni igenti Er bes og (lan olger z e intell nt, het n v e g i t p e t n o w o e c n j nw i t logisch e drage zover z abilitei nerated t r r e e a n g p a a r a o e r M s n u isie v n inte ën edene waarin hoop r er idee uit de v matie e e r n b o e m e f e l n w i e n e w antisch or het len van den. Ee n. Hoe o d m e v e e r d s n l n t u a e o e z t h l s eel st it d et niet centraa s het fe Lee he n het s , is er v i a n s a n e r e e o n n n d e e l de (‘m ter te red e stel de ron tologie ngrijks gelijk t dee ach n a i l o 0 e . e e b 3 l d a n b r e t e t stur erste le cen en op idee w eb. He verond le ding en enke l w t e a e d t r h a c o d s i eb is vastg mant iale ta eld’) w in spec otelijk de wer tische w t n s n a e m v m e e o e r z n s h en o het atie die en besc n werk g niet d m e o r r k n o o e f i w n n i t spe rs de bject e tech interne ompute ergelijk ’. Een o web. In c d n t e t e a p h j d i r n s o l ‘beg len, z ng va den a en ta kunnen omgevi kt wor singen r n s e e a f f p m e e n n r o e o t t ‘Voor nu zietede so n, aan aar d eld gek als p rvan gevinge uig, zoekmachine aald, m oe voorbe t j h i r a e e b r b de toekomst er al o d n v o a n e k .Z een eed t ardeinteractiever success eel van op aslimmer, naar br en socialer uit’ rden t k e e i l n p o onderd g e w staa k zich no n fysie manier anks be e d e e n k j h s o i l c l s s a e e i of .D van n derg gigant atieven ‘wolk’ n op ee at een e e a t t d c s m n e t j e o n i c b e o s o egeven en gro kunnen iseerd, e g r n e e t e r ’ k a a a t b t r s a elee geka ked d kin nks on machin en (‘lin van ‘lin ttige li d u k r r n o e n w w e t ne eld ende ie w gekopp Wie is... r 1). D verrass u s u r g e t fi u e i p ische LOD, z semant s l a n an te worde taken a r e o d o v n t a u h he aller het Institu den is e n r a a e . r r e m e k a d erzoe van msterd Een an eij is ond uikers eit van A r it b rs n e e e g k iv Edgar M a n e dee enter m daags van de U taat om et intellig rmatica s h e in r fo b a n In a a o n v * d k * anim **** epassen n meta onderzoe a to t v t e **** e o * h n h d * e r ic ij * z o n H *** 33 g e es do n richt Binnen het Instituut voor Informatica, verbonden aan de Hadoop toeken ekmachin kennisbronnen e sdanig o u z rd n fo a n v in j i Universiteit van Amsterdam, houdt een onderzoeksgroep Voor zijn onderzoek maakt Meij gebruik nte e z het xterne Wvan telligeveelvuldig n zoe atie uit e voor indat uik va n m r r e Hadoop-cluster van SARA gefinancierd wordt viat BiG Grid. zich bezig met zoekmachines en *taaltechnologie. d fo b * o e * g th * e he he m **** **** Postdoctoraal onderzoeker Edgar Meij is binnen deze statistiscis voor Meij erg handig om twee redenen: “Wikipedia is **** opHadoop . g luitin Met behulp van Hadoop maken we Wikipedia enormtsgroot. groep specifiek bezig met het slimmer maken van matieon
* **** **** **** * * * **
de t e i z u n ‘Voor an v e n i h c zoekma st er al om d e t o e k i n t e r a c t i eve r , slimmer er uit’ l en socia Untitled.txt Date: 10/09/11
*********************************************************
SEMANTISCH ZOEKEN KOMT DICHTERBIJ
*********************************************************
Zoekmachines van de toekomst
Page 1 of 1
NIJMEGEN - Bij een Britse vrouwelijke militair die meeliep in de Vierdaagse is Mexicaanse griep vastgesteld. Dat heeft de gemeente Nijmegen donderdag bevestigd. De vrouw meldde zich woensdagavond ziek en wordt inmiddels behandeld met de virusremmer Tamiflu. Ze is opgenomen in het Universitair Medisch Centrum St Radboud (UMC) in Nijmegen en wordt afgezonderd test.xml verpleegd.
Date: 10/09/11
De patiënte meldde zich woensdag met griepklachten op Kamp Heumensoord. Ze ligt in quarantaine in het ziekenhuis en krijgt Tamiflu. De medemilitairen in haar slaapbarak worden gecontroleerd, meldt Omroep Gelderland. <request xmlns="http://fietstas.science.uva.nl/cloud" xmlns:bg_wiki="http://fietstas.science.uva.nl/bg_wiki" Het besmettingsgeval heeft geen gevolgen voor de feesten rond de Vierdaagse en het wandelevenement zelf. Er worden volgens xmlns:wikipedia="http://fietstas.science.uva.nl/wikipedia"> de gemeente geen aanvullende maatregelen genomen vanwege het besmettingsgeval. Volgens de GGD is de kans op verspreiding van
2e28cdff90cc27cb36a7c3eea03b86b7 de ziekte minimaal.
2011-10-09 11:45:20.709039 <status>completed De Britse medische staf die de militairen begeleidt tijdens de Vierdaagse houdt de tentgenoten van de vrouwelijke militair <message>Processed 1 documents out of 1 (errors: 0) nauwlettend in de gaten. Als zij ziekteverschijnselen vertonen, worden ze meteen afgezonderd en behandeld. Beheerders van
http://fietstas.science.uva.nl/cloud/2e28cdff90cc27cb36a7c3eea03b86b7 tijdelijke slaapvoorzieningen, huisartsen en medewerkers van medische verzorgingsposten zijn extra gewezen op wat ze moeten
doen als ze verdachte ziektegevallen tegenkomen.
Page 1 of 2
Voor de manier waarop het web zich ontwikkelt, is de metafoor van het toekennen van versienummers algemeen in zwang geraakt. Na het statische en het interactieve web die men met web 1.0 en 2.0 is gaan aanduiden, is dan nu de vraag welke ontwikkeling de meeste kans maakt met web 3.0 te worden aangeduid. Edgar Meij zal op het NVB Jaarcongres op 17 november aanstaande betogen dat alles om het semantische web zal draaien. Hier geeft hij vast een voorproefje, waarbij hij er vooral op ingaat wat dat voor het zoeken betekent. Edgar Meij
*****************************************************************************************************************
Er bestaat enige discussie over wat de logische opvolger zal zijn van web 2.0, waarin user-generated content, het delen van informatie en interoperabiliteit centraal stonden. Hoewel meer ideeën de ronde doen, is er veel steun voor het idee web 3.0 gelijk te stellen aan het semantische web. Het sturende idee achter het semantische web is dat alle dingen op internet worden beschreven in speciale talen, zodat computers de informatie die ze aantreffen kunnen ‘begrijpen’. Een object kan bijvoorbeeld gekenmerkt worden als onderdeel van een voertuig, als persoon of als een fysieke plek op aarde. Zodra objecten op een dergelijke manier worden gekarakteriseerd, ontstaat een gigantisch netwerk van ‘linked data’ en kunnen computers verrassende en nuttige links ont-
De 20-jarige Britse meldde zich woensdagavond met hoge koorts, een snelle ademhaling en een hoge hartslag, maar is volgens Vierdaagse haar artsen donderdag weer wat opgeknapt. Ze is niet in kritieke toestand.
De wandelaars hadden het donderdag zwaar. Op de beruchte Zevenheuvelenweg regende het pijpenstelen. | ANP PHOTO/VINCENT donderdag JANNINK Tot nu toe één geval van Mexicaanse griep in de Vierdaagse valt voorzitter Andries Hoitsma van het Outbreak Managment Team Nijmegen van het UMC eigenlijk wel mee, zei hij donderdag. ,,Het ziekenhuis heeft zich degelijk voorbereid en sloot meerdere besmettingen niet uit.'' noemt slaapzalen en tentenkampen de meest waarschijnlijke bronnen van besmetting, omdat mensen daar langere tijd Dedicht Britsebij elkaar zijn. Burgemeester Thom de besmetting ,,geen grotemeldde bijzonderheid'' vinden. ,,We konden het verwachten. Aangezien er geen groot risico is voor anderen, reken ik op een normale en plezierige intocht van de Vierdaagse'', aldus De Graaf. Ook de Britse militairen zijn welkom op de Via Gladiola, voegde Willemstein toe. UMC Mexicaanse Hoitsma toe volgens griep gemeente ziekenhuis hoge besmettingsgeval militair afgezonderd Mexicaanse vrouwelijke Willemstein Hoitsma
****************
****************
Edgar Meij is onderzoeker aan het Instituut voor Informatica van de Universiteit van Amsterdam. Hij doet onderzoek naar het intelligenter maken van zoekmachines door het toepassen van informatie uit externe kennisbronnen en richt zich op statistische methoden voor intelligente informatieontsluiting.
dekken, die wellicht nooit door mensen ontdekt zouden zijn. Dit heeft de potentie een compleet nieuwe vorm van kunstmatige intelligentie mogelijk te maken [1]. Maar zover zijn we nog (lang) niet. Er zijn een hoop redenen aan te dragen waarom het semantische web uit de visie van Berners-Lee het niet zal redden. Een van de belangrijkste redenen is het feit dat veelal een enkele centrale ontologie (‘model van de wereld’) wordt verondersteld. Ook is nog niet onomstotelijk vastgesteld dat dergelijke technieken werken in de open omgeving van het web. In specifieke omgevingen, toepassingen en taken worden successen behaald, maar deze vertalen zich nog niet naar breed toepasbare initiatieven. Desondanks bestaat er inmiddels een groeiende ‘wolk’ van datasets met machineleesbare gegevens, die onderling gekoppeld worden (‘linking open data’ of LOD, zie figuur 1). Die wolk kan ingezet worden als semantische ruggengraat om allerhande taken aan te pakken. Een andere reden is het feit dat bij alledaagse gebruikers van het web weinig animo bestaat om deel te nemen aan het toekennen van metadata aan objecten. We zijn dusdanig gewend geraakt aan het gebruik van zoekmachines om een
16 - InformatieProfessional | 11 / 2011
.. Wie is.
zoekmachines. Voor zijn onderzoek maakt Meij gebruik van het Hadoop-cluster van SARA.
“Zoekmachines kun je op verschillende manieren slimmer maken”, vertelt Meij. ”Dit kan door innovaties in de gebruikers interface of door het oplossen van specifieke use cases 1 , maar l | 11 / 201 ionazoekmachines ik richt me vooral op het slimmer P maken ssvan e f o r atie Je kunt hierbij denken fortemzetten. door conceptuele kennis 16 - Inin aan informatie zoals je die in Wikipedia vindt, maar ook aan bepaalde annotaties in webpagina's die je terug wilt vinden. Het gaat erom dat je de zoekvraag (de query) wilt koppelen aan de gemaakte annotaties.”
Semantisch linken “Wanneer we webpagina's op een slimme manier doorzoekbaar willen maken, dan analyseren we de teksten en kijken we welke 'entiteiten' erin voorkomen”, zegt Meij. ”Dit noemen we semantisch linken: we verrijken de webpagina's met links naar bijvoorbeeld Wikipedia. Als we vervolgens een zoekterm ingeven, bijvoorbeeld 'Michael Jackson' en we hebben die annotaties in de webpagina opgenomen, dan hebben we een één-op-één koppeling met het relevante document.” ”Het eerste probleem bij semantisch linken is het feit dat er meerdere bekende Michael Jacksons kunnen zijn. Hoe weet je of de informatie die je krijgt betrekking heeft op de goede Michael Jackson? Het tweede probleem zit aan de zoekkant. Voeren we 'Michael Jackson' in Google in, dan gokt Google (op basis van ruim vijftig features) dat we de zanger Michael Jackson bedoelen, maar dat is niet helemaal bevredigend. We kunnen ook een van de andere Michael Jacksons zoeken. Hier ligt voor ons een uitdaging: het bedenken van een 'slimme' oplossing voor deze problemen.”
toegankelijk. Ook is het handig dat we kunnen parallelliseren, dat wil zeggen het opdelen van een grote taak in subtaken. Iedere subtaak gaat in een aparte machine. Hoe meer machines, des te sneller het gaat. Als we voor ons onderzoek op internet 20 tot 30 TeraBytes aan tekst moeten doorzoeken en analyseren, dan kan dat niet op een normale computer. Met Hadoop kunnen we de opslagcapaciteit van meerdere machines samenvoegen. Het is erg praktisch dat we grote datasets, zoals een dump van het internet, op die manier kunnen opslaan.”
Samenwerking met SARA Meij is tevreden over de samenwerking met SARA: “Die verloopt uitstekend. SARA is binnen de universitaire wereld een bekende partij. Je kunt eenvoudig contact leggen met de medewerkers en met hen overleggen. Ik heb tijdens een pilot kennisgemaakt met Hadoop en dat was een interessante en nuttige ervaring.“
33
InfraWatch: keeping the Hollandse Brug in good condition / de gezondheid van de Hollandse Brug Case
34
The Data Mining Group at LIACS (Leiden Institute of Advanced Computer Science), Leiden University's computer science institute, analyses large quantities of data. InfraWatch is a good example of a project involving huge amounts of data. The project is being headed by Dr. Arno Knobbe. The InfraWatch project will see Knobbe's research group process and analyze data on the condition of the Hollandse Brug. This bridge connects the provinces of Noord-Holland and Flevoland. Amongst other infrastructure features, the Hollandse Brug connects the A6 motorway, a busy road between Amsterdam and Almere. The bridge is relatively old, and was starting to show signs of wear and tear. Strukton construction company installed an extensive network of sensors during major renovation work in 2007, in order to measure the bridge's response to heavy loads.
Monitoring structural health The sensors were left in place after renovation work had been completed, allowing Knobbe's research group to study the data. Knobbe explains: “The network of sensors allowed us to monitor the bridge's health (structural health monitoring). The sensors provide us with approximately 5 GB of data every day. They measure the bridge's vibrations, temperature and elongation when subjected to traffic loads.”
Dynamic and elastic Monitoring a bridge's health is a long-term project. As Knobbe explains, a bridge has both dynamic and elastic properties: “Every time a heavy truck crosses the bridge, it will vibrate and sag slightly before returning to its original position. The bridge's health will deteriorate gradually over time. It's interesting to analyze how the bridge currently responds to a heavy truck in comparison with one, five or ten years ago.
We try to identify key performance indicators that can be measured indirectly in order to explain the subtle deterioration of the bridge's structural health. Eventually, we hope this data will help us make predictions on the bridge's lifespan.”
Hadoop Knobbe's research group is currently limiting its focus to shorter time periods, processing and analyzing the data gathered over three months in 2008. Processing such a mammoth amount of data presents a real challenge, as Knobbe explains: “We have one researcher at InfraWatch whose sole focus is the scalability of existing algorithms. He uses the Hadoop cluster for parallel data processing. All data is segmented into individual periods. If you have enough computer nodes at your disposal, the data for each individual day can then be allocated to a different node. When segmenting data in this way, you need some overlap in order to contextualize the small individual segments.” The Hadoop cluster is still in an experimental stage, and InfraWatch is an interesting use case for SARA, as Knobbe explains: “It's been a very pleasant collaboration so far. We will need a bigger Hadoop cluster in order to continue storing and processing data for InfraWatch in future. SARA is currently working hard to make sure it can keep providing the necessary facilities.”
Strain
70 60 50 40 30
0
10
20
30 Time (seconds)
40
50
60
40
50
60
Vibration
0.01 0.005 0 −0.005 −0.01 0
10
20
30 Time (seconds)
Binnen het LIACS (Leiden Institute of Advanced Computer Science), het informatica-instituut van de Universiteit Leiden, houdt de Data Mining Group zich bezig met het analyseren van grote hoeveelheden data. Een goed voorbeeld van een project met een gigantische hoeveelheid data is InfraWatch. Dr. Arno Knobbe leidt dit project. Voor het project InfraWatch verwerkt en analyseert de onderzoeksgroep van Knobbe data die de 'conditie' van de Hollandse Brug in beeld brengen. De Hollandse Brug verbindt Noord-Holland met Flevoland. Over deze brug loopt onder andere de rijksweg A6, een veel gebruikte verbinding tussen Amsterdam en Almere. De brug is vrij oud en vertoonde mankementen. Tijdens een grootschalige renovatie in 2007 heeft Strukton een uitgebreid sensornetwerk aangebracht om te meten hoe de brug reageert onder zware druk.
Gezondheid van een brug Na de renovatie zijn de sensoren op de brug achtergebleven en is de onderzoeksgroep van Knobbe wetenschappelijk aan de slag gegaan met de data. Knobbe vertelt: “Door het netwerk van de sensoren kunnen we de gezondheid van deze brug monitoren (structural health monitoring). Per dag leveren de sensoren ongeveer 5 GB aan data. De sensoren meten de trillingen, de temperatuur en de rek van de brug onder belasting van verkeer.”
Dynamisch en elastisch De gezondheid van een brug bekijk je over een langere termijn. Een brug is dynamisch en elastisch, zegt Knobbe: “Als er een zware vrachtwagen overheen rijdt, dan trilt de brug en zakt iets door, om vervolgens weer terug te keren in de oorspronkelijke stand.
De gezondheid van een brug neemt slechts geleidelijk af. Het is interessant om te zien hoe de brug nu reageert op een zware vrachtwagen in vergelijking met één, vijf of tien jaar geleden. We zoeken naar key performance indicatoren die we indirect kunnen meten en waardoor we de subtiele achteruitgang van de gezondheid van de brug kunnen verklaren. Uiteindelijk hopen we iets te kunnen zeggen over de levensduur van de brug.”
Hadoop Vooralsnog bekijkt de onderzoeksgroep van Knobbe kortere periodes: de dataverwerking en analyse van een periode van drie maanden uit 2008. Het is een enorme uitdaging om te gaan met deze gigantische hoeveelheid data, vertelt Knobbe: “Eén onderzoeker houdt zich voor InfraWatch specifiek bezig met de schaalbaarheid van de bestaande algoritmen. Hij maakt gebruik van het Hadoop-cluster voor de parallelle dataverwerking. Hij knipt hiervoor de data op in periodes. Als je voldoende computernodes hebt, kun je bijvoorbeeld de data per dag naar een aparte node sturen. Bij het opknippen van die data is overlap nodig, zodat duidelijk is wat de context van het kortere stuk data is.” Het Hadoop-cluster is experimenteel en SARA heeft met InfraWatch een interessante use case, vindt Knobbe: “De samenwerking verloopt erg prettig. Om voor InfraWatch ook in de toekomst de dataopslag en -verwerking te doen is een groter Hadoop-cluster nodig. Daar is SARA nu volop mee aan de slag.”
35
35
Visualization / Visualisatie
5
SARA leads the scientific field when it comes to data visualization. For years, SARA has been working with researchers to develop services that allow for the on-site or remote high-resolution visualization of extremely complex data. Such services play a key role in various areas of research, such as fluid models, cosmic structures and climate systems. In 2011, SARA laid the groundwork for a new, highly advanced facility that opened in 2012: the Collaboratorium.
SARA loopt voorop als het gaat om visualisatie van data. Al jaren ontwikkelt SARA in samenwerking met onderzoekers diensten om op locatie of op afstand zeer complexe data in hoge resolutie te visualiseren. Dergelijke diensten spelen een grote rol in onder andere het onderzoek naar stromingsmodellen, kosmische structuren en klimaatsystemen. In 2011 heeft SARA de basis gelegd voor een nieuwe, zeer geavanceerde faciliteit die in 2012 is geopend: het Collaboratorium.
Until 2010, researchers had access to the CAVE™ at SARA, a research facility offering immersive 3D visualization capacity. Although CAVE was terminated in 2010, SARA spent the intervening period developing a new high-quality visualization service. This new facility is based around the use of Tiled Panel Displays (TPD's): a series of linked screens designed to display high-resolution images. TPDs can be remotely controlled, and allow for images to be streamed over high-speed networks in pixilated format.
Huge smart tablet
TPD technology has recently undergone two key innovations: users now have access to screens with extremely thin edges, and touch overlays spanning multiple screens. This allows for TPDs to be controlled in the same way as a normal tablet: users can click and drag elements across the various screens, allowing for easy access to images and animations which can now be moved and scaled on the display.
Collaboratorium
This technology has now been implemented at the new Collaboratorium, a joint facility run by SARA that will facilitate intensive collaborations with the Netherlands eScience Center (NLeSC) and researchers from various disciplines. The Collaboratorium was established in order to create a facility for researchers capable of supporting various forms of collaboration. The facility is equipped with eight screens, in a 4x2 configuration. Together, they form a high-resolution display with a size of approximately 5 x 1.5 meters. An easy-to-use control panel allows researchers to allocate various sources – such as presentations, films, images or video conferences – to the screens as they see fit. The system also features an advanced window manager that allows for the combination of various data sources. The Collaboratorium also features a 3D visualization facility with active stereo projection. When in use, a projection screen is lowered over the four central screens. The other screens remain available for other purposes.
Tot 2010 hadden onderzoekers bij SARA beschikking over de CAVE™, een ruimte waar onderzoek gedaan kon worden met behulp van 'immersieve' 3D-visualisatie. De CAVE-dienstverlening is in 2010 beëindigd, maar in de tussenliggende periode heeft SARA hard gewerkt aan een nieuwe dienstverlening voor hoogwaardige visualisatie. Het uitgangspunt daarbij vormen de zogenoemde Tiled Panel Displays (TPD's): aaneen geschakelde schermen voor het weergeven van beelden met hoge resolutie. TPD's kunnen worden aangestuurd op afstand waarbij de beelden als pixels over snelle netwerken worden verstuurd.
Reusachtige smart tablet
Recent zijn er twee belangrijke vernieuwingen doorgevoerd binnen de TPD-technologie: gebruikers kunnen nu beschikken over schermen met zeer dunne randen, en over touch overlays over meerdere schermen. Dat maakt het mogelijk om een TPD te bedienen zoals een enorme tablet: gebruikers kunnen slepen en klikken over alle schermen en op die manier gemakkelijk afbeeldingen en animaties oproepen, verplaatsen en schalen op het display.
Collaboratorium
Deze technologie heeft een plaats gekregen binnen het nieuwe Collaboratorium, een samenwerkingsruimte van SARA, waarin ook het Netherlands eScience Center (NLeSC) en onderzoekers intensief gaan samenwerken. Het doel van het Collaboratorium is om een ruimte beschikbaar te stellen aan onderzoekers waarin verschillende vormen van samenwerking worden ondersteund. In deze ruimte hangen acht schermen in 4x2-opstelling die samen een hoge-resolutie display vormen van ongeveer 5 x 1,5 meter. Een eenvoudig bedieningspaneel stelt onderzoekers in staat een verdeling van verschillende bronnen over de schermen te kiezen, bijvoorbeeld een presentatie, films, afbeeldingen of videoconferentie. Daarnaast is er een geavanceerde window manager om databronnen te combineren. Tevens is er een opstelling voor 3D-visualisatie met actief-stereo projectie. Wanneer deze in gebruik is, komt er een projectiescherm naar beneden dat voor de middelste vier schermen hangt. De overige schermen blijven dan beschikbaar voor andere functies.
37
38
The new facility is embedded in SARA's HPC and visualization infrastructure, which includes a 2 x 10 gigabit/s connection to the data center. The Collaboratorium was officially opened in late March of 2012, during a visualization symposium organized by SARA and NLeSC. The opening of the new facility helped draw attention to the use of visualization by the priority sectors and researchers working with Big Data.
De nieuwe faciliteit is ingebed in de HPC- en visualisatie-infrastructuur van SARA, met onder meer een 2 x 10 gigabit/s-verbinding met het datacenter. De officiële opening van het Collaboratorium vond eind maart 2012 plaats tijdens een visualisatiesymposium dat door SARA en NLeSC was georganiseerd. Hiermee is aandacht gegenereerd voor het gebruik van visualisatie voor de topsectoren en onderzoekers die werken met Big Data.
Remote visualization
Visualisatie op afstand
SARA conducted a pilot project on remote visualization in 2010, which has since been developed into a service. A small group of researchers makes intensive use of this facility. One such researcher is Thomas Geenen, who applies visualizations in his geophysics research (see page 40).
In 2010 heeft SARA een pilot gehouden rondom visualisatie op afstand; inmiddels is het als dienst beschikbaar. Een kleine groep wetenschappers maakt hier heel intensief gebruik van. Eén van hen is Thomas Geenen, die visualisaties gebruikt voor geofysisch onderzoek (zie pagina 41).
A growing number of researchers need the capacity to interactively create and display visualizations on their own desktop. SARA is catering to this need by offering a Remote Visualization service. The large datasets are stored at SARA, with the visualization software running on a render farm. The remote workstation only displays the user interface. This means users have access to major visualization and computing power even if their own workstation has limited capacity. Researchers also enjoy great flexibility in terms of where each visualization is displayed. For example, they can opt to display a visualization with far higher resolution at the Collaboratorium.
Steeds meer onderzoekers willen vanaf hun eigen desktop interactief visualisaties kunnen opbouwen en tonen. SARA speelt daarop met een Remote Visualisatie-dienst. Uitgangspunt daarbij is dat de grote datasets bij SARA staan en dat de visualisatiesoftware bij SARA draait op een rendercluster, terwijl alleen de user interface op een remote werkplek getoond wordt. Op deze manier kan een gebruiker beschikken over veel visualisatie- en rekenkracht, waar zijn eigen werkplek wellicht maar beperkte capaciteit zou hebben. De onderzoeker is daarnaast flexibel in waar een visualisatie getoond wordt. Hij kan de visualisaties bijvoorbeeld ook in een veel hogere resolutie in het Collaboratorium laten zien.
CineGrid
CineGrid
SARA initiated a joint project with the latter partner in 2011, aimed at incorporating filmed images of live actors in a game environment. The process involves the use of chromakeying, in which actors perform in front of a green screen. In addition to the image itself, the camera also transmits other lens data, such as the focal length and the actor's exact position. As a result of the Enlighten your
Met deze laatste partij heeft SARA in 2011 een project opgestart waarbij filmopnames van levende acteurs verwerkt kunnen worden in een game-omgeving. Dit gaat met behulp van chromakeying, waarbij acteurs spelen voor een groene wand. De camera stuurt behalve het beeld ook andere lensinformatie door, zoals de brandpuntafstand en de exacte positie van de acteur. Als resultaat van de wedstrijd Enlighten
For several years now, SARA has been participating in a consortium that researches and develops high-resolution film and video: CineGrid NL. Collaboration partners include the University of Amsterdam, SURFnet, Waag Society, Holland Festival and the Netherlands Film and Television Academy (NFTA).
SARA neemt al enige jaren deel aan een consortium dat hoge resolutie film en video onderzoekt en ontwikkelt: CineGrid NL. Samenwerkingspartners zijn onder meer de Universiteit van Amsterdam, SURFnet, Waag Society, Holland Festival en de Nederlandse Film- en Televisieacademie (NFTA).
Visualization team
Research competition, a lightpath was established between NFTA and SARA. A render farm at SARA renders the image of the actor at the appropriate point in the game engine. The director and actors can then view the results 'live' at SARA, and respond interactively.
your Research is een lichtpad tot stand gebracht tussen de NFTA en SARA. Een rendercluster bij SARA rendert het beeld van de acteur op de juiste plek in de game engine. De regisseur en acteurs bij SARA kunnen dan 'live' het resultaat zien en daar interactief op inspelen.
Funding for the collaboration with CineGrid will expire after 2012. The year will culminate in a final event linked to the IBC, the major broadcasting trade fair held in the Amsterdam RAI.
2012 is het laatste jaar dat de samenwerking met CineGrid gefinancierd wordt. Het jaar wordt afgesloten met een slotevenement, dat is gekoppeld aan de IBC, de grote broadcasting-beurs in de RAI.
39
Mantle dynamics: exploring the depths of the earth / Manteldynamica: een kijkje in de diepe aarde Case
40
The Mantle Dynamics research group at Utrecht University's Geosciences Faculty conducts research on the earth's core. What does the earth look like at depths of between a hundred and three thousand kilometers? How can we visualize this part of the earth? How do rocks move at these great depths, and in what way do mantle dynamics affect us? These questions all hold a fascination for Thomas Geenen, a doctoral candidate working in the research group.
The importance of mantle dynamics “Mantle dynamics views the earth as a physical system”, Geenen explains. “We study the movement of rocks deep below the earth's surface. At first sight, the field may appear rather abstract. As researchers, we are thrilled to find out about a newly discovered flow at a depth of 2000 kilometers, but that information won't mean much to the average earth-dweller.” However, such discoveries do hold real significance, as Geenen explains: “Our insights and studies are definitely relevant in terms of oil and gas extraction. For example, we can estimate where oil is likely to form. If thick layers of organic material have been forming in a specific area for millions of years, they will eventually turn into oil given the right temperature and pressure conditions.”
Earthquakes Do rock movements deep under the earth's surface cause 'shallow-focus' earthquakes? Geoscientists are still divided on this issue. Some adhere to the theory that local forces, such as shifting tectonic plates, create tensions that can cause an earthquake. Others, such as Geenen, believe earthquakes are also directly and indirectly caused by movements deep beneath the earth's surface that drive the shifting tectonic plates.
No matter which theory is closest to the truth, earthquakes do help us chart the earth's interior regions. “Earthquakes send seismic shocks through the earth. Analyzing these shocks yields a great deal of information on the structure of the earth's core. We can then use this data in our computer models”, Geenen explains.
Modeling “We want to model the entire earth at once”, Geenen explains. “Modeling the earth at a resolution scale of a few kilometers requires an enormous amount of data. You need to process data for close to a billion points. These computations are carried out on the national supercomputer Huygens at SARA. They yield snapshots of up to a billion individual points, which we can then incorporate into models. However, these models are so large that we always had problems visualizing them in a practical manner. Until a few years ago, we could only view parts of each model at a time. This made it difficult to gain an overview of the overall picture.”
Remote visualization Since the fall of 2010, SARA has been providing an effective solution in the form of Remote Visualization Services. Remote visualization provides the requisite computing power and graphical capacity to visualize the entire model at once. “This makes it much easier for us to gain an overview of the entire picture”, Geenen explains. “We experimented with Remote Visualization during the start-up phase, and were immediately enthusiastic about the results. We exchanged a lot of ideas with SARA's visualization experts, which gave us the opportunity to communicate our exact requirements. SARA is an extremely flexible organization, and its staff are always willing to help us find the solutions we need. That makes working together a very pleasant experience.”
Wim Nieuwpoort Award 2011 voor Prof. Hans de Raedt
Contour lines of the velocity field's magnitude. The flow depicted in this model is driven by density variations based on interpretations of the duration of seismic waves in the earth's core. For the purposes of this study, we are assessing differences between the paths of virtual particles in models comprising the entire mantle or parts thereof. The yellow lines indicate these paths for a cross-section of a global model (top figure) and a regional model (bottom figure).
Een weergave van de contourlijnen van de magnitude van het snelheidsveld. De stroming in dit model wordt aangedreven door dicht heidsverschillen zoals die voortkomen uit een interpretatie van looptijden van seismische golven door het inwendige van de aarde. In deze studie kijken we naar de verschillen tussen paden die virtuele deeltjes zouden afleggen in modellen die de gehele of slechts een gedeelte van de mantel omvatten. De gele lijnen geven deze paden weer voor een uitsnede van een globaal model (bovenste figuur) en een regionaal model (onderste figuur).
Binnen de faculteit Geowetenschappen van de Universiteit Utrecht houdt de onderzoeksgroep Manteldynamica zich bezig met de binnenkant van de aarde. Hoe ziet de aarde er uit op honderd tot drieduizend kilometer diepte? Hoe brengen we dit deel van de aarde in beeld? Hoe bewegen gesteenten zich op deze diepte en wat betekenen de mantelstromingen voor ons? Allemaal boeiende vragen voor Thomas Geenen, promovendus binnen deze onderzoeksgroep.
Belang van manteldynamica “Binnen de manteldynamica kijken we naar de aarde als fysisch systeem”, zegt Geenen. “We kijken naar de beweging van gesteenten diep in de aarde. Het lijkt een abstract vakgebied. Waar wij als onderzoekers opgetogen raken over een nieuw ontdekte stroming op 2000 kilometer diepte, zal de gemiddelde aardbewoner daar nauwelijks belang aan hechten.” Maar dat belang is er wel degelijk, aldus Geenen: “Voor de winning van olie en gas zijn onze inzichten en onderzoeken zeker relevant. We kunnen een inschatting maken van gebieden waar de vorming van olie mogelijk is. Als ergens bijvoorbeeld miljoenen jaren lang dikke pakketten organisch materiaal zijn gemaakt, dan veranderen deze pakketten onder de juiste temperatuur en drukcondities in olie.”
Aardbevingen Zijn bewegingen van gesteenten diep in de aarde de oorzaak van 'ondiepe' aardbevingen? Hierover verschillen aardweten schappers van mening. Sommigen beweren dat vooral door lokale krachten, zoals de onderlinge beweging van aardschollen, spanningen ontstaan die aardbevingen kunnen veroorzaken. Anderen, waaronder Geenen, denken dat aardbevingen ook direct of indirect het gevolg kunnen zijn van bewegingen in de diepe aarde die de aardschollen aandrijven.
Aardbevingen helpen in elk geval wel bij het in kaart brengen van de diepe aarde. “Tijdens aardbevingen gaan er seismische golven door de aarde heen. Dat geeft ons veel gegevens over hoe de aarde eruit ziet. Deze gegevens gebruiken we vervolgens in onze computermodellen”, aldus Geenen.
Modelleren “We willen graag de aarde in één keer modelleren”, vertelt Geenen. “Als je de aarde op een resolutieschaal van een paar kilometer wilt modelleren, dan heb je daar een gigantische hoeveelheid data voor nodig. Het gaat al snel over een miljard punten waarop je iets wilt uitrekenen. Het uitrekenen gebeurt op de nationale supercomputer Huygens bij SARA. We verkrijgen op die manier snapshots van een miljard punten die we verwerken in modellen. De modellen zijn echter zó groot dat het tot voor kort problematisch was om ze op een bruikbare manier te visualiseren. Tot een paar jaar geleden konden we een model alleen deel voor deel bekijken. Het was daardoor moeilijk om een totaalbeeld te vormen.“
Visualisatie op afstand Sinds het najaar van 2010 biedt SARA met Remote Visualization Services een goede oplossing. Remote visualisatie biedt voldoende rekenkracht en grafisch vermogen om een model in één keer te visualiseren. “Dat maakt het veel gemakkelijker om een totaalbeeld te krijgen”, vertelt Geenen. “In de opstartfase hebben we met Remote visualisatie geëxperimenteerd en we waren al snel enthousiast. We hebben veel ideeën kunnen uitwisselen met de visualisatiespecialisten van SARA en we konden aangeven wat we precies nodig hadden. SARA is heel flexibel en denkt met ons mee. Dat werkt erg prettig.”
41
41
DynaNets Case
42
A great deal of research has already been conducted on static networks of relationships between objects, such as the railway network. As of yet, however, there has not been much research on dynamic networks, in which the relationships between objects are subject to constant change. The Computational Science research group at the University of Amsterdam is currently in the midst of a three-year study of dynamic networks: DynaNets. Dr. Robert Belleman is developing visual tools to facilitate the analysis of dynamic networks.
Infectious diseases As a participant in the DynaNets project, Belleman conducts research on the visualization of dynamic networks, such as the spread of infectious diseases: “Each individual is interrelated with many other individuals. When it comes to the spread of infectious diseases, our main focus is on changing relationships. The dynamics of changing relationships affect the spread of viruses. This information is thus key to virus control.” As we know from previous studies, certain dynamic networks are relatively easy to predict. Individuals with normal day-today activities behave according to a set pattern: the individual gets up, goes to work, attends a meeting and returns home. These patterns affect the spread of infectious diseases. DynaNets is now applying our knowledge of such processes and patterns in order to analyze dynamic networks and develop effective methodologies.
Cooperation The DynaNets project brings together mathematicians, computer scientists and experts on infectious diseases, as Belleman explains: “We have developed a new theory in collaboration with experts from the Erasmus Medical Center. These experts also provided us with interesting data on the way in which HIV spreads throughout a population. This information will allow us to verify our theory. In turn, we hope researchers specializing in infectious diseases will be able to apply our results in areas such as vaccination planning. However, we're still in the early stages right now.”
Visualization: Twilight The visualization of dynamic networks is a key aspect of the DynaNets project. Working in collaboration with one of SARA's visualization specialists, DynaNets has developed a new software application: Twilight. “Twilight allows us to visualize dynamic networks in a way that allows for great interactivity”, Belleman explains. “The Twilight software has already yielded our first real 'aha' moment. While studying the predictable clusters within a dynamic network, we saw certain subclusters take shape that defied our expectations. We have developed a hypothesis on the genesis of these sub-clusters, which we are currently exploring in further detail.”
Wim Nieuwpoort Award 2011 voor Prof. Hans de Raedt
Dr. Robert Belleman
Veel onderzoek is reeds gedaan naar statische netwerken van relaties tussen objecten, zoals het spoorwegnet. Er is nog weinig onderzoek verricht naar dynamische netwerken, waarbij de verbindingen tussen objecten constant veranderen. Bij de Computational Science onderzoeksgroep van de Universiteit van Amsterdam loopt op dit moment een driejarig onderzoek naar dynamische netwerken: DynaNets. Dr. Robert Belleman ontwikkelt visuele gereedschappen om de analyse van dynamische netwerken mogelijk te maken.
Samenwerking
Infectieziekten
Visualisatie: Twilight
Binnen het project DynaNets doet Belleman onderzoek naar de visualisatie van dynamische netwerken, zoals de verspreiding van infectieziekten: “Een individu heeft relaties met vele andere individuen. Bij de verspreiding van infectieziekten zijn met name de veranderende relaties van belang. De dynamiek van veranderende relaties heeft effect op de virusverspreiding. Deze informatie is belangrijk bij het bestrijden van een virus.”
Een belangrijk onderdeel van het DynaNets project is het visualiseren van dynamische netwerken. DynaNets heeft samen met een visualisatiespecialist van SARA software ontwikkeld: Twilight. “We kunnen met Twilight dynamische netwerken visualiseren op een dusdanige manier dat we er heel interactief mee kunnen werken”, zegt Belleman. “Dankzij die Twilight-software hebben we ons eerste 'aha-moment' al beleefd. We zagen binnen de voorspelbare clusters in een dynamisch netwerk subclusters ontstaan die we niet hadden verwacht. Over het ontstaan van die subclusters hebben we een hypothese opgesteld die we nu nader onderzoeken.”
Uit eerder onderzoek bleek dat sommige dynamische netwerken vrij voorspelbaar zijn. Van individuen met normale dagelijkse bezigheden verloopt het gedrag volgens een vast patroon: individu staat op, gaat naar zijn werk, woont een vergadering bij en gaat weer naar huis. Die patronen hebben effect op het verspreiden van infectieziekten. De insteek van DynaNets is om met de kennis van dergelijke processen en patronen dynamische netwerken te analyseren en methodieken te ontwikkelen.
Bij het DynaNets project zijn niet alleen wiskundigen en informatici betrokken, maar ook experts op het gebied van infectieziekten, aldus Belleman: “Experts van het Erasmus MC hebben samen met ons een theorie ontwikkeld. Ook hebben zij interessante data aangeleverd over de verspreiding van het Hiv-virus binnen een populatie. Met die informatie kunnen wij onze theorie toetsen. Wij hopen dat de onderzoekers van infectieziekten onze resultaten weer kunnen gebruiken bij bijvoorbeeld vaccinatieplanning. Maar zover zijn we nog niet.”
43
43
Network Innovation & Support
6
A chain is only as strong as its weakest link: SARA is working to develop a network that consists solely of strong links. This is an absolute necessity, given that SARA collaborates with demanding, data-intensive research organizations such as LOFAR in the northern part of the Netherlands and CERN in Geneva. In order to facilitate these partners, SARA provides reliable high-bandwidth end-to-end connections, and the innovative solutions needed to optimize their capacity.
Een ketting is zo sterk als de zwakste schakel: SARA werkt aan een netwerk waarin alle schakels sterk zijn. Dat moet ook wel, want SARA werkt nauw samen met veeleisende en data-intensieve onderzoeksorganisaties, zoals LOFAR in Noord-Nederland en CERN in Genève. Daarom zorgt SARA voor betrouwbare end-to-end-verbindingen met hoge bandbreedte, én voor innovatieve oplossingen om die verbindingen zo goed mogelijk te gebruiken.
SARA´s commercial network activities were transferred to Vancis in 2010. Part of the staff base remained at SARA, including those working to develop SURFnet: the SURFnet6 contract was being performed by SARA. It became clear that Vancis would be fulfilling the SURFnet7 contract in collaboration with Telindus in early 2011. At this point, it was decided that these employees should also be transferred to Vancis. The transfer will help ease the transition from SURFnet6 to SURFnet7. SARA currently still has a small group of network experts. These employees work to maintain and develop SARA´s high-speed networks, and carry out network-related research and innovation activities.
Optimal use of CERN data
In 2010 waren de commerciële netwerkactiviteiten van SARA al overgegaan naar Vancis. Een deel van medewerkers is bij SARA gebleven, waaronder de medewerkers die zich bezighielden met SURFnet: het SURFnet6-contract werd immers uitgevoerd door SARA. Begin 2011 werd duidelijk dat Vancis het SURFnet7-contract samen met Telindus zou gaan uitvoeren. Op dat moment is ervoor gekozen om deze medewerkers ook over te laten gaan naar Vancis. Die overgang vergemakkelijkt een soepele transitie van SURFnet6 naar SURFnet7. Nu is er nog een kleine expertisegroep rond netwerken bij SARA. Deze medewerkers houden bezig met het beheer en de ontwikkeling van de hoge snelheidsnetwerken binnen SARA, en met onderzoek naar en innovatie van netwerken.
SARA has been closely involved in the transfer and distribution of research data from CERN's Large Hadron Collider (LHC) from the earliest stages. SARA and NIKHEF jointly constitute what is known as a tier-1 location: these facilities play a key role in the storage, distribution and processing of data. With the exception of CERN, SARA is the largest network hub in the global LHC network and is linked via multiple interconnections to locations such as the US, Canada, Germany and Denmark.
Optimaal gebruik van data van CERN
The original plan was to distribute CERN data by means of a tree structure: from tier-1 locations to larger institutes, who then transfer the data to smaller institutes. However, it has since become clear that institutes often need to access data from other locations within the 'tree'. This will require a greater number of interconnections within the network. CERN is currently working with various partners, including SARA, to develop a new network design. One option would be to redesign the existing network. However, a second – parallel – network might also provide a feasible solution. SARA organized two meetings on the subject in 2011, which were attended by the entire LHC network community.
Oorspronkelijk was het idee de data van CERN te verdelen via een boomstructuur: van tier-1-locaties via grote instituten naar kleinere instituten. Maar nu blijkt dat instituten ook vaak behoefte hebben aan data die op een andere locatie in de 'boom' staat. Dat betekent dat er meer dwarsverbanden binnen het netwerk nodig zijn. CERN denkt nu met een aantal partners, waaronder SARA, over een nieuw design van het netwerk. Een optie is het bestaande netwerk helemaal opnieuw te ontwerpen, maar het kan ook zijn dat er als het ware een tweede netwerk naast komt. In 2011 zijn hierover twee bijeenkomsten bij SARA gehouden, waarbij de gehele LHC-netwerk gemeenschap aanwezig was.
Enlighten your Research
Nieuwe ronde, nieuwe kansen: in 2011 is voor de derde keer de wedstrijd Enlighten your Research georganiseerd. De organisatoren (SURFnet, SARA, BiG Grid en NWO) stellen de winnaars in staat gebruik te maken van de krachtige mogelijkheden van de nieuwste e-Infrastructuur. Deelnemers kunnen dataopslag winnen, rekentijd, geavanceerde
New game, new chances: 2011 saw the third edition of the Enlighten your Research competition. The organizers (SURFnet, SARA, BiG Grid and the Netherlands Organisation for Scientific Research, NWO) offer the winning participants access to the powerful capacity of the
SARA is vanaf het begin nauw betrokken bij de overdracht en verdeling van onderzoeksdata van de Large Hadron Collidor (LHC) van CERN. SARA is samen met NIKHEF een zogenoemde tier-1-locatie: deze locaties spelen een sleutelrol bij de storage, distributie en verwerking van data. SARA is buiten CERN het grootste netwerkknooppunt binnen het wereldwijde LHC-netwerk en is via dwarsverbanden verbonden met onder meer de VS, Canada, Duitsland en Denemarken.
Enlighten your Research
45
46
latest e-Infrastructure. Participants are eligible to win data storage, computing time, advanced network connections and support services. The prize also includes a maximum cash incentive of € € 20,000. 2011 also saw the first sustainability award for the most effective proposal towards energy conservation.
netwerkverbindingen en ondersteuning. Bovendien is er een geldbedrag van maximaal € 20.000 aan de prijs verbonden. In 2011 was er bovendien voor het eerst een duurzaamheidsprijs voor het meest energiezuinige voorstel te winnen.
A total of fourteen candidates submitted proposals for the competition; most entries originated from the humanities, life sciences and climate studies. SARA was closely involved in selecting the winning candidates. The winners were announced on December 7. The highest score went to a proposal entitled 'Next generation networking for next generation sequencing' by Delft-based researcher Jan Bot (see page 48). In an interesting development, all winning proposals requested lightpaths to SARA.
In totaal veertien inzenders namen deel aan de wedstrijd; binnen hun voorstellen waren met name de geesteswetenschappen, de levens wetenschappen en het klimaatonderzoek sterk vertegenwoordigd. SARA was nauw betrokken bij de selectie van de kandidaten. Op 7 december heeft de jury de winnaars bekend gemaakt. De hoogste score was voor het voorstel 'Next generation networking for next generation sequencing' van de Delftse onderzoeker Jan Bot (zie pagina 49). Een bijzondere bijkomstigheid is dat alle winnaars in hun voorstel lichtpaden naar SARA hebben aangevraagd.
Innovation
Innovatie
2011 also saw SARA engage in a close collaboration with SURFnet on the GigaPort3 Research on Networks project. Two technology assessments were conducted as a part of the project. One of these assessments concerned Named Data Networking, an entirely new form of data transport. The other related to OpenFlow, a programmable network format. Efforts were also made to develop an open source implementation of the IEEE Ethernet monitoring standard. The results were demonstrated at the SC11 in Seattle, in collaboration with US and Canadian partners. The SC11 ranked the international test bed amongst the six best demonstrations (out of a total of eleven accepted entries).
In 2011 heeft SARA ook nauw met SURFnet samenwerkt in het GigaPort3 Research on Networks-project. In dit kader zijn twee technology assessments uitgevoerd. De ene heeft betrekking op Named Data Networking, een geheel nieuwe vorm van datatransport. De andere gaat over OpenFlow, een vorm van programmable networks. Verder is er een open source implementatie gemaakt van de IEEE Ethernet monitoring standaard. Op SC11 in Seattle is dit in samenwerking met Amerikaanse en Canadese pa r tners gedemonstreerd. Dit internationale testbed is door de SC11-organisatie verkozen tot een van de zes beste (van elf geaccepteerde) demonstraties.
SARA has contributed to various national and international projects in the area of network innovation. For example, SARA has been collaborating with SURFnet for several years now as a part of the GÉANT3 initiative. 2011 saw further work on the development of NML, a language used to describe network topologies for monitoring and path finding purposes. Initial agreements on the relevant XML and RDF descriptions have since been reached with partners in Amsterdam, Poland and the State of Washington (USA).
SARA heeft op het gebied van netwerkinnovatie bijgedragen aan een aantal nationale en internationale projecten. In het kader van GÉANT3 werkt SARA al enkele jaren samen met SURFnet. In 2011 is gewerkt aan NML, een taal om netwerktopologieën te beschrijven voor gebruik bij monitoring en path finding. In samenwerking met partners in Amsterdam, Polen en Washington is er een eerste overeenstemming bereikt over de XML- en RDF-beschrijvingen hiervan.
Team Network Innovation & Support
47
Dynamic lightpaths facilitate DNA research / Dynamische lichtpaden vergemakkelijken DNA-onderzoek Case
48
Jan Bot, a Bioinformatics specialist, is working to process Next Generation Sequencing data. Bot is a trainee research assistant at Leiden University and Delft University of Technology (TU Delft). He relies on a large support network for his research in both the Netherlands and abroad. Having won the Enlighten Your Research3 award, Bot can now exchange large quantities of data through this network by means of dynamic lightpaths.
Next Generation Sequencing Why do people from one family grow older than members of another family? Why do specific types of cancer develop in specific types of tissue? The science of genetics can help us answer such questions. Next generation sequencing allows us to build up someone's entire genome on the basis of DNA sequences and compare it to that of others. “Every medical center has one or more of these machines in-house”, Bot explains, “but we need to source all sequences from a single party when conducting a large-scale study. A single party with a high throughput, capable of supplying consistent quality. That's where the foreign partners in our network come in.”
Insufficient bandwidth Next generation sequencing yield large quantities of data, which makes sharing and external processing difficult. “We simply don't have enough available bandwidth”, Bot explains. “We store the data on a hard disk and transport it by car or courier. This is inefficient, and means we run the risk of losing or damaging the data.”
Dynamic lightpaths The winning proposal for the Enlighten Your Research competition is based around establishing a dynamic connection between the fourteen locations in our network. “This will allow a Delft-based researcher who has stored his data locally to share information with – for example – a location in the US by opening the lightpath port between Delft and the United States”, Bot explains. “The data will then be transported to the US via the Delft lightpath. This is a specific example of efficient data exchange.”
Collaboration with SARA SARA plays an important role in these studies, as Bot explains: “We wouldn't be able to use the dynamic lightpath ports if the relevant clusters weren't already managed by SARA. SARA can provide us with all the necessary settings and configurations. This allows us to roll out the lightpaths more efficiently. SARA helps us solve any problems we encounter and provides all the services and operational support we need.”
Binnen het vakgebied Bioinformatica werkt Jan Bot aan het verwerken van Next Generation Sequencing data. Bot is AIO bij de Universiteit Leiden en de TU Delft. Voor zijn onderzoek heeft hij een omvangrijk netwerk opgebouwd in binnen- en buitenland. Het winnen van de wedstrijd Enlighten Your Research3 betekent dat de grootschalige data-uitwisseling binnen dit netwerk voortaan verloopt via dynamische lichtpaden.
Next Generation Sequencing Waarom worden mensen uit de ene familie ouder dan mensen uit een andere familie? Waarom ontstaat er een bepaald type kanker in een bepaald type weefsel? Om dit soort vragen te kunnen beantwoorden, moeten we te rade gaan bij de genetica. Next generation sequencing maakt het mogelijk om iemands complete genoom op te bouwen op basis van DNA-sequenties en het te vergelijken met dat van anderen. “Ieder medisch centrum heeft wel een of meer van deze machines staan”, vertelt Bot, “maar voor grote onderzoeken willen we alle sequenties van één partij ontvangen. Een partij met een grote throughput, die constante kwaliteit levert. Dit zijn de buitenlandse partijen in ons netwerk.”
Onvoldoende bandbreedte De grote hoeveelheid data die binnen next generation sequencing beschikbaar komt, maakt het moeilijk data te delen of elders te laten doorrekenen. “We hebben daarvoor onvoldoende bandbreedte beschikbaar”, zegt Bot. “We zetten de data dan op een harde schijf en transporteren deze per auto of koerier. Dit is inefficiënt en risicovol met kans op verlies of beschadiging.”
Dynamische lichtpaden Het winnende voorstel voor de Enlighten Your Researchprijsvraag bevat het voorstel om de veertien locaties in ons netwerk dynamisch te verbinden. “Een onderzoeker die in Delft zijn data lokaal heeft staan, kan deze delen met een locatie in bijvoorbeeld de Verenigde Staten door de lichtpadpoort tussen Delft en de Verenigde Staten open te zetten”, zegt Bot. “De data gaat dan via het lichtpad van Delft naar de Verenigde Staten. Dit is een specifiek voorbeeld van efficiënte data-uitwisseling.”
Samenwerken met SARA SARA speelt een belangrijke rol in deze onderzoeken, aldus Bot: “We kunnen de dynamische lichtpadpoorten alleen inzetten omdat het beheer van de betrokken clusters al bij SARA ligt. Voor alle instellingen en configuratieopties kunnen we bij SARA terecht. Hierdoor kunnen we de lichtpaden gemakkelijker uitrollen. SARA denkt met ons mee en biedt ons de diensten en operationele support die we nodig hebben.”
49
49
Neuro Image Analysis Case
Screen dump of the neuro workstation used for brain tissue classification and volume measurements / Screendump van het neuro-werkstation ten behoeve van weefselclassificatie en volumemetingen in het brein.
50
In 2001, the Erasmus Medical Center established the Biomedical Imaging Group Rotterdam (BIGR), a collaboration between the Radiology and Medical Informatics departments. BIGR develops software which is used to process medical images such as CT and MR scans. Dr. Henri Vrooman was one of the driving forces behind the BIGR. Vrooman is a university lecturer, and supervises and facilitates research within the Neuro department . What happens to our brains as we age? This is our main focus, Vrooman explains: “We process a large volume of MR brain scans in order to gain more insight into specific clinical pictures such as Alzheimer's and dementia."
The Rotterdam Study The epidemiology department launched The Rotterdam Study in 1990. The study also involves large-scale MR brain imaging, with the BIGR research group closely involved in image data analysis, as Vrooman explains: “We are working to chart the ageing brain. What happens to the shape and volume of the hippocampus as we grow older? What happens to the grey and white matter inside our brains? What sort of picture can we expect to see in the early stages of dementia? This knowledge may help us diagnose dementia at an earlier stage, and can then be applied in support of preventative strategies. Since the start of the study, MR brain scans have been made of over 9000 residents of Rotterdam Ommoord of 45 years of age and older. “We process these 9000 datasets in order to measure many aspects of the brain”, Vrooman explains. “For example, we want to determine the average brain volume for each age group, and the average decrease in brain tissue over a one-year period. You need an enormous amount of datasets in order to draw any statistically significant conclusions from the resulting data.”
Population imaging The importance of population imaging is being increasingly recognized around the world. BIGR is currently processing all MR scans to have been made in Rotterdam over the past 10 years. This comprises a total of over 25,000 datasets, a number that continues to rise as the study continues. The software is complex, and can spend up to 24 hours computing a single dataset. Dataset processing is currently stagnating due to storage problems and long computing times. Collaborations with other medical centers are also causing problems in terms of data transport, privacy and processing inconsistencies due to the use of different software applications.
Lightpaths Since Medical Delta (a joint venture between the universities of Delft, Rotterdam and Leiden, and the University Medical Centers in Leiden and Rotterdam) won second prize in the 'Enlighten Your Research' competition, BIGR has had access to the lightpaths connecting Rotterdam, Delft, and Leiden to SARA. Vrooman explains: “We are currently setting up a central processing unit on SARA's cloud. The various partners send their respective datasets to the cloud, where we can then process the data according to uniform procedures. We will also have our own private network on the cloud, a point-to-point connection.” “Working with lightpath infrastructures proved to be an interesting pilot project”, Vrooman explains. “Our experiences with SARA have been extremely positive. We previously conducted a pilot project in collaboration with SARA involving the Life Science Grid and beta-cloud. Both parties learned a great deal in the process. The staff at SARA are very enthusiastic and eager to help us come up with solutions.”
rendering of the automatically detected brain ventricles (right). A A computergenerated surface point model used in brain shape analysis (left) / Rechts een rendering van de automatisch gedetecteerde ventrikels in het brein. Links een gegenereerd oppervlaktepunten-model ten behoeve van vormanalyse.
Development of a more accurate brain tissue classification and a comparison with the traditional method / Ontwikkeling van een meer nauwkeurige weefselclassificatie in het brein en een vergelijking met de traditionele methode.
In het Erasmus MC is in 2001 de Biomedical Imaging Group Rotterdam (BIGR) opgericht, een samenwerkings verband tussen Radiologie en Medische informatica. BIGR ontwikkelt software en past deze toe om medische beelden zoals CT- en MR-scans te verwerken. Een van de oprichters van de BIGR is dr. ir. Henri Vrooman. Hij is universitair docent en begeleidt en faciliteert onderzoek binnen de Neurosectie.
Population imaging
Wat gebeurt er met ons brein als we ouder worden? Dat is wat ons bezighoudt, vertelt Vrooman: “We verwerken heel veel MR's van het brein om inzicht te krijgen in bepaalde ziektebeelden, zoals Alzheimer en dementie.”
The Rotterdam Study In 1990 is The Rotterdam Study gestart bij de afdeling epidemiologie. Binnen deze studie worden ook op grote schaal MR-beelden van de hersenen gemaakt en de BIGRonderzoeksgroep is nauw betrokken bij de analyse van deze beelddata, aldus Vrooman: "Het doel is om het ouder wordende brein in kaart te brengen. Wat gebeurt er met de vorm en het volume van de hippocampus? Wat gebeurt er met de hoeveelheid grijze en witte stof in de hersenen? Hoe is dit bij (het begin) van dementie? Deze kennis leidt mogelijk tot een vroegere diagnose van dementie, en kan zo preventieve strategieën ondersteunen." Inmiddels zijn er MR's van het brein gemaakt van ruim 9000 inwoners van Rotterdam Ommoord van 45 jaar en ouder. “Wij verwerken deze 9000 datasets om vele aspecten van het brein te meten”, zegt Vrooman. “We willen bijvoorbeeld voor iedere leeftijd het gemiddelde breinvolume weten en de gemiddelde afname van het weefsel binnen een jaar. Om hier statistisch significante uitspraken over te kunnen doen heb je enorm veel datasets nodig.”
Het belang van population imaging wordt wereldwijd steeds meer onderkend. BIGR is bezig met het verwerken van alle MR's die de afgelopen 10 jaar in Rotterdam zijn gemaakt. Dit zijn meer dan 25.000 datasets en dat aantal neemt alleen maar toe. De software is complex en rekent soms 24 uur op één dataset. De verwerking van de datasets stagneert door opslagmoeilijkheden en rekentijden. De samenwerking met andere ziekenhuizen zorgt bovendien voor problemen op het gebied van datatransport, privacy en verschillen in verwerking vanwege verschillende software.
Lichtpaden Dankzij de tweede prijs van Medical Delta (samenwerking tussen de Universiteiten van Delft, Rotterdam en Leiden, en de UMC's van Leiden en Rotterdam) in de 'Enlighten Your Research'-wedstrijd kan BIGR gebruik maken van lichtpaden van Rotterdam, Delft en Leiden naar SARA, aldus Vrooman: “We maken op de cloud van SARA een centrale processing unit. De verschillende partners sturen hun datasets naar de cloud, waar we de data vervolgens uniform kunnen verwerken. We krijgen bovendien ons eigen private netwerk op de cloud, een point-to-point-verbinding. “Het werken met lichtpad-infrastructuren is een interessant pilotproject”, vertelt Vrooman. “Onze ervaringen met SARA zijn heel positief. We hebben al eerder een pilotproject met SARA gedaan op het Life Science Grid en op de beta-cloud. Daar hebben we veel van geleerd. De mensen van SARA zijn erg enthousiast en kunnen goed meedenken in oplossingen.”
51
51
Sustainability
7
The realization that sustainability is not a passing fad has started to take hold across the ICT sector. As computing power and data storage capacity increases, energy consumption is also growing. Thankfully, a growing number of intelligent energy conservation solutions are currently being developed. These solutions also extend to the 'premier league' of supercomputing. SARA plays a pioneering role in this regard, with all development activities now supervised by the overarching SURF organization.
De ICT-sector raakt steeds meer doordrongen van het besef dat duurzaamheid geen modewoord is. Met de groei in rekenkracht en dataopslag neemt ook het energieverbruik toe. Gelukkig komen er steeds meer slimme oplossingen om zuinig met energie om te gaan, ook binnen de eredivisie van supercomputing. SARA is een pionier in het ontwikkelen van dergelijke oplossingen, sinds kort ook onder de paraplu van de stichting SURF.
SURF: coordination and research
SARA and SURF are both closely involved in improving the sustainability of ICT systems at universities, universities of applied sciences and research institutes. The two organizations have both been developing solutions in this area for quite some time. SURF's decision to bundle all sustainability activities in the 'SURF family' is thus a laudable step forward. This includes all activities conducted by SURFnet, SURFdiensten, SURF itself and – in future – SARA and Vancis. In order to ensure effective coordination, a steering group headed by SARA director Anwar Osseyran has been established. The steering group will engage in a dialogue with educational institutions in order to determine which aspects of their ICT can be made more environmentally friendly. Research also plays an important role in developing more environmentally-friendly ICT systems. For this reason, SARA and SURFnet will be conducting a joint study in 2012 to identify potential ways of reducing ICT usage. This study will touch on a broad range of issues. What is more environmentally-friendly: storing data abroad (in countries such as Iceland, which produce a large amount of green energy) or close to the user? This also relates to the following question: is it cheaper to transport energy or data? Finally, researchers will also have to address a fundamental question: under which circumstances is it better to store data, and when is it more effective to store the parameters needed to regenerate this data? These are the types of issues the study aims to resolve.
Sustainable supercomputer
2012 will see SARA issue a tender for a new supercomputer (also see chapter 2). This purchase will also be subject to the highest sustainability standards. In order to ensure optimal sustainability, SARA invested a great deal of effort in consulting with users and assessing the requirements for its new supercomputer over the course of 2011. Naturally, the aspect of low energy consumption will be applied as a key criterion in the selection procedure. The new supercomputer will also be designed to grow on demand, mirroring the intensity of use and requirements of its users. This means SARA will not be purchasing an extremely powerful machine all at once (which would then not be used to its full capacity during the first
SURF: coördinatie en onderzoek
Zowel SARA als SURF zijn nauw betrokken bij het verduurzamen van ICT bij universiteiten, hogescholen en onderzoeksinstellingen. Beide organisaties ontwikkelen al geruime tijd initiatieven op dit vlak. Het is dan ook goed nieuws dat SURF besloten heeft om alle duurzaamheids activiteiten binnen de 'SURF-familie' onder één noemer te brengen. Daarbij gaat het om de activiteiten van SURFnet, SURFdiensten, SURF zelf en straks SARA en Vancis. Om voor coördinatie te zorgen is een stuurgroep ingesteld onder voorzitterschap van SARA-directeur Anwar Osseyran. De stuurgroep gaat in gesprek met de onderwijsinstellingen om na te gaan op welke fronten de ICT groener kan worden. Onderzoek speelt een belangrijke rol bij het groener maken van ICT. Daarom gaat SARA samen met SURFnet in 2012 een onderzoek uitvoeren naar wegen die leiden tot reductie van ICT-gebruik. Daarbij komen veel verschillende vragen aan de orde. Wat is beter voor het milieu: plaatsen van data in het buitenland (bijvoorbeeld in IJsland met veel groene energie) of plaatsen van data dicht bij de gebruiker? Dat heeft ook te maken met de vraag: is het goedkoper om energie te transporteren of data? Een zeer principiële vraag is: wanneer kun je beter data opslaan of en wanneer is het verstandiger om de parameters op te slaan die nodig zijn om de data opnieuw te genereren? Op dergelijke vragen probeert het onderzoek antwoord te geven.
Duurzame supercomputer
In 2012 gaat SARA de aanbesteding starten voor een nieuwe supercomputer (zie ook hoofdstuk 2). Ook bij deze aanschaf streeft SARA naar maximale duurzaamheid. In dat verband is in 2011 veel geïnvesteerd in overleg met gebruikers en onderzoek naar de requirements voor de nieuwe supercomputer. Vanzelfsprekend zal laag energieverbruik een belangrijk selectiecriterium zijn voor de nieuwe supercomputer. Daarnaast is het idee dat de super on demand gaat groeien, parallel aan het gebruik en aan de wensen en de eisen van gebruikers. Dat houdt in dat SARA niet in één keer een zeer krachtige machine zal aanschaffen (die dan de eerste jaren maar voor een deel gebruikt wordt), maar dat de supercomputer in een aantal stappen toegroeit naar de gewenste omvang. Daarmee verminderen we de ecologische voetafdruk van de apparatuur én de operationele kosten, vooral op het vlak van energieverbruik.
53
54
few years). Instead, the supercomputer will be designed to grow to its desired scale over the course of several stages. This strategy will help minimize the equipment's ecological footprint and operational costs, especially in the area of energy consumption. SARA is applying the same principal to its cloud computing activities. Cloud computing also allows for the flexible use of resources and energy. Cloud allows users to pool their resources: in addition to greater efficiency for the users themselves, this also helps achieve savings in terms of energy consumption and the purchase of new equipment.
Green IT Consortium
The Amsterdam Region Green IT Consortium has been active since June 2010. Participating ICT companies aim to reduce energy consumption and cut back on regional CO2 emissions. A growing number of businesses have expressed an interest in taking part: the number of participants grew from 34 to 43 in 2011. Green IT aims to achieve the following objectives: • Stimulating energy conservation in the ICT sector (Greening of IT); • Applying ICT to help green other sectors (Greening by IT); • Contributing to the growth of the green economy in the Netherlands (Green IT Economy). Green IT Amsterdam's areas of focus include the development of smart grids. With a growing trend towards the decentralized generation of energy – by major horticultural businesses, for example – network controllers are having increasing difficulty in balancing supply and demand. Green IT Amsterdam is working to develop new ICT applications that will enable more energy-efficient energy production and distribution. Effective cooperation between ICT companies and energy suppliers will also be key in this regard. In an effort to further this objective, SARA submitted a proposal to the Netherlands Organization for Scientific Research (NWO) in 2011, aimed at establishing a smart grid pilot project at Science Park Amsterdam.
Diezelfde gedachtegang speelt ook een rol bij de activiteiten van SARA op het gebied van cloud computing. Ook bij cloud is het mogelijk om flexibel om te gaan met resources en het energieverbruik te beperken. Cloud stelt gebruikers in staat om resources te poolen: dat is efficiënt voor die gebruikers, maar het zorgt ook voor besparingen op zowel energieverbruik als aanschaf van apparatuur.
Consortium Green IT
Sinds juni 2010 is de Stichting Consortium Green IT Regio Amterdam actief. In deze stichting willen de deelnemende ICT-bedrijven bijdragen aan de vermindering van energiegebruik en daarmee het terugdringen van CO2-emissies in de regio. Een groeiend aantal bedrijven heeft belangstelling voor deelname: in 2011 is het aantal deelnemers gegroeid van 34 tot 43. Green IT heeft de volgende doelstellingen: • Stimulering van energiebesparing in de ICT-sector (Greening of IT); • Inzetten van ICT voor de vergroening van andere sectoren (Greening by IT); • Bijdragen aan de groei van de groene economie in Nederland (Green IT Economy). Een van de aandachtspunten binnen Green IT Amsterdam is de ontwikkeling van smart grids. Door decentrale opwekking van energie, bijvoorbeeld door grote bedrijven in de tuinbouw, is het voor de netbeheerders steeds lastiger om vraag en aanbod op het net in balans te houden. Green IT Amsterdam wil nadenken over de inzet van ICT om energieproductie en distributie energiezuiniger te maken. Daarbij is het belangrijk om een goede samenwerking op te zetten tussen ICT-bedrijven en energiebedrijven. In dat kader heeft SARA in 2011 een voorstel bij NWO ingediend om een proeftuin voor smart grids op te zetten op Science Park Amsterdam.
Organization Chart / Organogram
56 Dr. Ir. Anwar Osseyran directeur/managing director
Drs. Walter Lioen groepsleider/team leader Supercomputing
Dr. Ir. Peter Michielse adjunct-directeur/deputy director
Ing. Jaap Dijkshoorn groepsleider/team leader Cluster Computing
Dr. Ir. Axel Berg manager Operations, Support & Development
Dr. Machiel Jansen Dr. Ir. Ron Trompert groepsleiders/team leaders e-Science & Cloud Services
Drs. Paul Wielinga deputy manager Operations, Support & Development
Ing. Mark van de Sanden groepsleider/team leader Data Services
Dr. Maurice Bouwhuis Relation & Innovation manager
Drs. Paul Wielinga groepsleider/team leader a.i. Visualisatie/Visualization Network Innovation & Support
Board of management / Bestuurssamenstelling In 2011 was het bestuur van SARA als volgt samengesteld In 2011, SARA's Board of Management comprised the following members: • • • • •
Mr. E.H. Broekhuizen (LL M) Drs. P.W. Doop Dr. M.J. Koornstra (voorzitter tot / chairman until 16 June 2011) Dr. S.J. Noorda (voorzitter vanaf / chairman as from 17 June 2011) Mr. H.J. Rutten (LL M)
57
SARA Directeur/Managing Director
Operations, Support & Development
Relatie- en Innovatiemanagement Relation and Innovation Management
Adjunct-directeur/ Deputy Director
Supercomputing
PR & Communicatie/Communications
Directiesecretariaat/Executive assistant
Cluster Computing
Horizontale teams/Horizontal teams
Finance & Control
e-Science & Cloud Services
Gebruikersteam/User-oriented team
Personeel & Organisatie/Human Resources
Data Services
Dienstinnovatie/Service innovation
Facilities/IT
Visualisatie/Visualization
Network Innovation & Support
Selection of publications / Selectie van publicaties
58
N.K. Balabaev et al., Effects of Strong Confinement on the Glass-Transition Temperature in Simulated Atactic Polystyrene Films. A. Bardow et al., Calculating Thermodynamic Properties from Fluctuations at Small Scales. A. Bardow et al., Maxwell-Stefan Diffusivities and Velocity Cross-Correlations in Dilute Ternary Systems. J. van den Bergh et al., Understanding the anomalous paraffin selectivity of ZIF-7 in the separation of light alkane/alkene mixtures. F. Bleichrodt et al., Accelerating a barotropic ocean model using a GPU. B.J. Boersma, Direct numerical simulation of turbulent pipe flow up to a Reynolds number of 61,000. B.J. Boersma, A 6th order staggered compact finite difference method for the incompressible Navier-Stokes equations. W.P. Breugem, A second-order accurate Immersed Boundary Method for fully resolved simulations of particle-laden flows. C. Chau et al., Stochastic Quasi-Newton method: Application to minimal model for proteins. J.F. Doreleijers et al., NRG-CING: integrated validation reports of remediated experimental biomolecular NMR data and coordinates in wwPDB. C. Filippi et al., Electronic excitations of simple cyanine dyes: Reconciling density functional and wave function methods. R. Gupta, Efficient Two-Level Preconditionined Conjugate Gradient Method on the GPU. M.A. Gürkan et al., Fractal geometry of angular momentum evolution in near-Keplerian systems. R. Groote et al., Unfolding and mechanochemical scission of supramolecular polymers containing a metal-ligand coordination bond. C.C. van Heerwaarden, Surface evaporation and water vapor transport in the convective boundary layer. P.B. Hooghiemstra et al., Comparing optimized CO emission estimates using MOPITT or NOAA surface network observations.
S. Houweling et al., Interpreting methane variations in the past two decades using measurements of CH4 mixing ratio and isotopic composition. D. Hudzinskyy et al., Confinement and shear effects for atactic polystyrene film structure and mechanics. E. Janiaud et al., Competition of time and spatial scales in polymer glassy dynamics: Rejuvenation and confinement effects. S. Kjelstrup et al., Fick Diffusion Coefficients of Liquid Mixtures Directly Obtained From Equilibrium Molecular Dynamics. M.A. Kliphuis et al., Global ocean response due to extreme Greenland Ice Sheet melting in an eddy-resolving model. A.V. Kovyrshin et al., Potential-Energy Surfaces of Local Excited States from Subsystemand Selective Kohn-Sham-TDDFT. M.C. Krol et al., Global modelling of H2 mixing ratios and isotopic compositions with the TM5 model. J.G.M. Kuerten et al., Turbulence modification and heat transfer enhancement by inertial particles in turbulent channel flow. R.P.J. Kunnen et al., The role of Stewartson and Ekman layers in turbulent rotating Rayleigh-Bénard convection. R.P.J. Kunnen et al., Structure functions in rotating Rayleigh-Bénard convection. M. Kwakkel et al., An efficient multiple marker front-capturing method for two-phase flows. G. Li et al., Stability and reactivity of active sites for direct benzene oxidation to phenol in Fe/ZSM-5: A comprehensive periodic DFT study. A.V. Lyulin, Effects of the nano-scale structure of polymer surfaces on their adhesion and friction. A.V. Lyulin, Molecular-dynamics simulations of polymers in nanoconfinements. A.V. Lyulin, Simulation of Polymer Deformation: Rejuvenation and Cold Drawing. A.V. Lyulin, Confinement effects on polymer structure and glassy dynamics.
59
60
W.R. Michalek et al., 13th European Turbulence Conference. A. Mijovilovich et al., K6 Detected High-Resolution XANES of FeII and FeIII Models of the 2-His-1-Carboxylate Motif: Analysis of the Carboxylate Binding Mode. S.A. Montzka et al., Small Interannual Variability of Global Atmospheric Hydroxyl. J. Neugebauer et al., First-Principles Calculation of Electronic Spectra of Light-Harvesting Complex II. J. Neugebauer et al., Theoretical Spectroscopy of Astaxanthin in Crustacyanin Proteins: Absorption, Circular Dichroism, and Nuclear Magnetic Resonance. F. Neven et al., SLIDER: A Generic Metaheuristic for the Discovery of Correlated Motifs in Protein-Protein Interaction Networks. I. Onal et al., Ethylene epoxidation catalyzed by chlorine-promoted silver oxide. I. Onal et al., Ethylene epoxidation catalyzed by silver oxide. M.O. Ozbek, Computational study of ethylene epoxidation. M.O. Ozbek et al., Why silver is the unique catalyst for ethylene epoxidation. P. Patra et al., TransCom model simulations of CH4 and related species: linking transport, surface flux and chemical loss with CH4 variability in the troposphere and lower stratosphere. E. van der Poel, Connecting flow structures and heat flux in turbulent Rayleigh-Bénard convection. H.A. de Raedt et al., Classical and quantum annealing in the median of three-satisfiability. H.A. de Raedt et al., Event-Based Corpuscular Model for Quantum Optics Experiments. H.A. de Raedt et al., Event-based Simulation Model for Quantum Optics Experiments. W.J.S. Ramaekers, Development of Flamelet Generated Manifolds for Partially-Premixed Flame Simulations. G.J.H. Roelofs et al., Impact of ammonium nitrate chemistry on the AOT in Cabauw, the Netherlands.
Y. Sakurai et al., Imaging orbital character of doped holes in a cuprate superconductor using high-resolution Compton scattering. R. Schram MSc et al., Exact enumeration of self-avoiding walks. F. Schüßler et al., Nature of cationic lanthanum species in faujasite-type zeolites. F. Serban et al., A Survey of Intelligent Assistants for Data Analysis. G.J.A. Sevink et al., Selective disordering of lamella-forming diblock copolymers under and electric field. I.A. Stavitski et al., Complexity behind CO2 Capture on NH2-MIL-53(Al). R. Stevens, Rayleigh-Bénard turbulence. B.M. Szyja et al., DFT Study on mechanochemical bond breaking in COGEF and Molecular Dynamics simulations. J. Trampert, Hessian kernels of seismic data functionals based upon adjoint techniques. J. Vanschoren et al., Experiment Databases: A new way to share, organize and learn from experiments. W.E. Waterlander et al., The virtual supermarket: An innovative research tool to study consumer food purchasing behaviour. P.K. Wawrzyniak et al., Acetyl group orientation modulates the electronic ground-state asymmetry of the special pair in purple bacterial reaction centers. J.H. Weijs et al., Origin of line tension for a Lennard-Jones nanodroplet. J.H. Weijs et al., Why is surface tension a force parallel to the interface? K.W. West et al., Two-dimensional Mott-Hubbard electrons in an artificial honeycomb lattice. L. Zhang et al., Hybrid lattice Boltzmann/Dynamic Self-Consistent Field simulations of microphase separation and vesicle formation in block copolymer systems. Y. Zhang et al., Molecular Aspects of Glucose Dehydration by Chromium Chlorides in Ionic Liquids. Q. Zhou et al., Horizontal structures of velocity and temperature boundary layers in 2D numerical turbulent Rayleigh-Bénard convection.
61
Colophon / Colofon SARA Science Park 140 1098 XG Amsterdam The Netherlands P.O. Box 94613 1090 GP Amsterdam The Netherlands T +31 20 592 3000 F +31 20 668 3167 E [email protected] www.sara.nl Text / Tekst Hendrikx Van der Spek, Bussum Translation / Vertaling Metamorfose Vertalingen BV, Utrecht Images / Beelden Nan Reunis p. 26-27 Hans Hordijk Design / Vormgeving Crasborn Grafisch Ontwerpers bno, Valkenburg a.d. Geul
SARA Science Park 140 1098 XG Amsterdam The Netherlands P.O. Box 94613 1090 GP Amsterdam The Netherlands T +31 20 592 3000 F +31 20 668 3167 E [email protected] www.sara.nl