Benchmarkonderzoek: Geoptimaliseerde valtest met Dell, Intel en Altair Fredrik Nordgren, MSc M.E. (Master of Science in Mechanical Engineering), Application Engineer, Altair Eric Lequiniou, Directeur, High Performance Computing, Altair Martin Hilgeman, HPC Consultant, Dell
© Dell | Sectie 1 Benchmarkonderzoek: Geoptimaliseerde valtest met Dell, Intel en Altair 1
Inleiding De valtest is een van de belangrijkste onderdelen van het ontwerpen en ontwikkelen van nieuwe producten, en software die deze test nauwkeurig kan simuleren kan fabrikanten aanzienlijke kostenbesparingen opleveren en de introductie van het product op de markt versnellen. Dell, Intel en Altair hebben samen een geïntegreerde simulatie en optimalisatie analyse toegepast op een virtuele valtest-oplossing, voor een bewezen toename in snelheid en nauwkeurigheid. Met deze oplossing kunnen engineers meer verschillende ontwerpen onderzoeken wat leidt tot een extra robuust en betrouwbaar product. Hierdoor kunnen fabrikanten de ontwikkelingstijd van hun ontwerpen aanzienlijk inkorten, waardoor de productkwaliteit toeneemt en de levertijd afneemt.
Uitdaging: De snelheid en nauwkeurigheid van de valtest verbeteren Veel producten, van smartphones tot auto-onderdelen, moeten de valtest doorstaan voordat ze in productie gaan. Het is de taak van de fabrikant om producten te ontwerpen en ontwikkelen die zo goed mogelijk presteren als ze vallen, geplet worden of op een andere manier beschadigd worden. De valtest-simulatiesoftware helpt fabrikanten door de tijd die het kost om een product te testen te beperken, een betere productkwaliteit mogelijk te maken en fysieke tests overbodig te maken. De software bootst de complexiteit van de fysieke omgeving en de materialen na, simuleert de impact of val, en biedt gedetailleerde technische informatie over hoe het product presteert. In het algemeen is de software voor dergelijke situaties al volwassen, omdat de vereisten en oplossingen van valtests gebaseerd zijn op ongevalsimulaties met auto's. In het geval van telefoons zijn er echter unieke uitdagingen aan de valtest verbonden, waaronder het feit dat bij een telefoon veel verschillende onderdelen, materialen en bevestigingsmethodes gebruikt worden, die allemaal zorgvuldig gemodelleerd moeten worden om de potentiële valschade te kunnen beoordelen. Daarnaast moeten engineers het model handmatig instellen en de gegevens verwerken, wat een tijdrovende bezigheid is. Het uiteindelijke doel is een robuust product dat alle valhoeken en andere soorten druk kan weerstaan (druk op het glas, buigen, draaien etc.). Hiervoor zijn vele simulaties nodig, waarvoor naast een snelle en schaalbare oplosser ook een software-omgeving nodig is waarin engineers verschillende ontwerpen kunnen onderzoeken om het fysieke resultaat van de valtest beter te kunnen doorgronden. Daarnaast hebben engineers geïntegreerde, geautomatiseerde oplossingen nodig met belangrijke onderdelen zoals geïntegreerde optimalisatie, om processen te stroomlijnen en de kans op fouten te beperken.
© Dell | Section 1 Benchmarkonderzoek: Geoptimaliseerde valtest met Dell, Intel en Altair 2
Oplossing: Versnel de uitvoering van de valtestsimulatie met Dell, Intel en Altair Dell, Intel en Altair hebben in dit onderzoek samengewerkt om Altairs valtest-simulatiesoftware te testen op een Dell cluster gebaseerd op Intel processors. De door Dell en Intel geboden infrastructuur helpt de simulatie te versnellen door de prestaties van de valtest-analyse oplosser RADIOSS te verbeteren, die opereert op een Dell high-end cluster uitgerust met de nieuwste Intel E5 v2 processors. Deze oplosser, die de belangrijkste rekenintensieve component van de Altair valtestoplossing is, wordt gebruikt voor het soort complexe simulaties dat baat heeft bij efficiënte hardware en snelle processors...
Altair valtest-oplossing Altairs geautomatiseerde valtest-oplossing bestaat uit een pakket van geïntegreerde software tools die ontworpen zijn om de prestaties, doorvoer en gebruiksvriendelijkheid te optimaliseren:
HyperWorks softwarepakket voor modellering, analyse en optimalisatie integreert de volgende componenten in een volledige valtest-oplossing: o High-performance eindige elementen voorverwerkingsproduct (HyperMesh) om zelfs de grootste modellen voor te bereiden, met een complete set van geometrische bewerkingstools om modellen efficiënt voor te bereiden voor meshing o Structurele analyse-oplosser (RADIOSS) al 20 jaar lang bewezen als marktleider in ongevalsimulatie van auto's, met kwaliteit, robuustheid en schaalbaarheid van het hoogste niveau. Met RADIOSS’ Advanced Mass Scaling (AMS) technologie kunnen RADIOSS gebruikers zelfs nog betere prestaties verwachten. o Hypermodern ontwerp-onderzoek, benadering en optimalisatie geïntegreerde software (HyperStudy) inclusief vorm-optimalisatie, directe parametrisatie, dataverzameling en directe RADIOSS resultatenlezers PBS Professional werkbelasting-beheersoftware voor het plannen van high-performance computing (HPC) taken, met sterke schaalbaarheid en gebruiksvriendelijkheid, al 20 jaar lang bewezen op duizenden consumentenwebsites.
Voorgaande tests van Altair toonden aan dat deze oplossing, met RADIOSS’ AMS ingeschakeld, de doorlooptijd van de valtest kan inkorten van 65 tot 36 minuten (45% verbetering), vergeleken met de 64 minuten doorlooptijd van een toonaangevende alternatieve oplosser.
Dell HPC oplossingen gebaseerd op Intel technologie Dell biedt de HPC bouwstenen en kant-en-klare oplossingen waarmee bedrijven over de kracht van HPC technologie kunnen beschikken en de innovatie en ontwikkeling van hun product kunnen optimaliseren. Door voor Intel en Altair te kiezen kunnen bewezen oplossingen voor productontwikkeling op de markt worden gebracht die de productiviteit verbeteren, kosten beperken en het beheer van complexe clusteromgevingen vereenvoudigen. In het geval van deze valtest-analyse werd gekozen voor Dell PowerEdge M620 blade servers die gebaseerd zijn op de Intel® Xeon® processor E5-2600v2 productfamilie. Deze krachtige en energiezuinige processors beschikken over 50% meer kernen en cache dan de vorige generatie; samen met een sneller geheugen en een aantal hardware verbeteringen ten opzichte van servers gebaseerd op de vorige generatie Intel Xeon processor. Nog hogere prestaties voor HPC toepassingen kunnen worden bereikt door Intel® Advanced Vector Extensions (Intel® AVX). Intel® AVX versnelt de vector en floating point berekeningen met ondersteuning voor 256-bit vectors en versnelde 32/64 bit gegevensconversie. De Intel® Xeon® processor E5 v2 familie bestaat uit een uitgebreid aanbod van processorspecificaties dat varieert van aantal kernen tot modellen met een geoptimaliseerde frequentie voor gebruikersspecifieke toepassingen.
© Dell | Section 1 Benchmarkonderzoek: Geoptimaliseerde valtest met Dell, Intel en Altair 3
Benchmarking projectoverzicht
Het toevoegen van een demper tussen het pc-bord en de LCD module om vervorming tegen te gaan bij een val op de achterzijde – rechts worden twee verschillende dempers getoond.
Om de prestaties van de Dell-Intel-Altair oplossing te testen hebben engineers zich gericht op een specifieke toepassing, namelijk of door het gebruik van een dempende pakking de druk op het ontwerp van een telefoon zou afnemen. In dit scenario zorgt de ruimte tussen de backcover en de bescherming voor buigingen en veel spanning op de LCD module in een valtest op de achterkant. Het doel was om een optimale demper te ontwerpen met ideale eigenschappen (dikte, formaat, flexibiliteit etc.) die de druk op de LCD module zoveel mogelijk kon minimaliseren. 1.
Ontwerp: In de eerste fase van het project werd het concept gemodelleerd in HyperMesh en werden ontwerpvariabelen gegenereerd met morphing technologie en input file parametrisatie.
2.
Optimalisatie: Een design-of-experiment (DOE) werd uitgevoerd om een response surface te creëren. Vervolgens werd een optimalisatie uitgevoerd op de response surface in plaats van het eindige elementen model.
3.
Verificatie: Het geoptimaliseerde ontwerp werd beoordeeld en gesimuleerd met finite element analysis (FEA) en de prestatieresultaten werden geverifieerd.
Deze simulaties werden uitgevoerd op systemen met de volgende componenten: 16x Dell PowerEdge M620 blade servers met Intel Xeon E5-2680v2, E5-2667v2, en E5-2697v2 processors, 128 GB geheugen per node, leveraging Mellanox FDR Inifiniband interconnects.
Grafische weergave van de druk op de LCD als functie van oppervlakte en dikte van de demper.
© Dell | Section 1 Benchmarkonderzoek: Geoptimaliseerde valtest met Dell, Intel en Altair 4
Prestatieresultaten Met Altair’ RADIOSS software op een Dell PowerEdge M620 blade systeem waren engineers in staat om de 21 valtestsimulaties uit te voeren die vereist waren in dit optimalisatie-onderzoek en 3 verschillende Intel processors (Intel Xeon E5-2690v2, E5-2667v2 en E5-2697v2 processors respectievelijk) in 2-node configuraties te vergelijken, met de volgende kern- en ruwe prestatiegegevens: CPU
Totale kernen voor 2 nodes
Ruwe FP prestaties GFLOP/s
Enkele simulatie Gemiddelde tijd (s)
Totale tijd Voor 21 simulaties (s)
E5-2680v2
40
896
719
15110
E5-2667v2
32
845
742
15598
E5-2697v2
48
1037
660
13868
Figuur 1. Samenvatting van prestaties Het is duidelijk dat, gemeten in verstreken tijd, de best presterende processor de E5-2697v2 is; het product met de lagere frequentie maar met meer kernen. Deze prestatie wordt verklaard door de uitstekende schaalbaarheid van RADIOSS, omdat de lagere frequentie of intrinsieke prestaties van elke kern de prestaties van het grote aantal kernen niet negatief beïnvloedt.
900 800
Verstreken tijd (s)
700 600 500 E5-2680v2 400
E5-2667v2
300
E5-2697v2
200 100 0 1
2
3
4
5
6
7
8
9 10 11 12 13 14 15 16 17 18 19 20 21 Simulatie nummer
Figuur 2. Details van prestaties
© Dell | Section 1 Benchmarkonderzoek: Geoptimaliseerde valtest met Dell, Intel en Altair 5
Vergeleken met de referentietijd van 65 minuten (3900 seconden) die werd bereikt op een enkele node van Intel Xeon
[email protected] GHz (met 8 kernen), zijn 2 nodes met E5-2697 v2 ongeveer 6 keer sneller (660 seconden voor een enkele simulatie). Hierdoor kon het gehele optimalisatie-onderzoek (21 simulaties) in minder dan 4 uur (13,868 seconden) worden voltooid. Daarnaast kunnen gebruikers met RADIOSS’ Advanced Mass Scaling (AMS) nog sneller resultaten bereiken met dezelfde nauwkeurigheid. AMS biedt een geavanceerde oplossing voor quasi-statische problemen en een alternatieve oplossing voor impliciete non-lineaire simulatie waar convergentie soms moeilijk te bereiken is, bijvoorbeeld door non-lineariteit in de contacten, complex materiaalgedrag en modellering van scheuren. De verwachte prestaties met AMS ingeschakeld zijn 1,7 keer sneller, met een totale doorlooptijd van minder dan 2,5 uur (minder dan 400 seconden voor een enkele simulatie) op basis van de snelste configuratie met Intel E5-2697v2. Een ander aspect om rekening mee te houden bij het optimaliseren van configuraties is dat schaalbaarheid niet alleen een functie is van de Intel Xeon processor en het aantal kernen, maar ook van het aantal gebruikte nodes. Vanwege het parallelle karakter van deze simulaties mag men verwachten dat door ongeveer de helft van de 21 simulaties op de eerste 2 nodes te draaien en de rest op een tweede groep van 2 nodes, een versnelling van factor 2 kan worden bereikt. Deze logica kan worden toegepast om bereikte resultaten te extrapoleren naar situaties met meer nodes om de gewenste simulatietijd te bereiken – bijvoorbeeld een simulatiecluster met 8 nodes Een dergelijke aanpak kan worden vereenvoudigd door een tool als PBS Professional te gebruiken, die de simulatietaken automatisch verdeelt over de beschikbare bronnen om de efficiëntie van berekeningen en het gebruik van bronnen te optimaliseren.
Energiezuinigheid en prestaties In moderne bedrijfsstrategieën en planningsprocessen zijn energie en koeling belangrijke aspecten in het maken van een aankoopbeslissing. De energiezuinigheid van een simulatie-configuratie is dus van groot belang voor bedrijven die op zoek zijn naar zowel optimaal energieverbruik als optimale prestaties. Tijdens het uitvoeren van de simulaties op het Dell PowerEdge blade systeem werd het energieverbruik gemeten in aantal Watt voor elke simulatie (bekijk de grafiek hieronder). Hoewel het gemiddelde energieverbruik van de Intel Xeon E5-2667v2 en E5-2697v2 gelijkwaardig zijn, gebruikt de Xeon E5-2680v2 duidelijk minder stroom tijdens het uitvoeren van de 21 simulaties van deze testcase. Anders bekeken: Voor een 24x7 always-on werkbelasting in een productieomgeving, gebruikt de Xeon E5-2680v2 21.3% minder stroom per node dan de Xeon E5-2697v2, wat meer is dan het TDP verschil van 115W versus 135W (17%).
© Dell | Section 1 Benchmarkonderzoek: Geoptimaliseerde valtest met Dell, Intel en Altair 6
Aanbevolen configuraties De volgende aanbevelingen kunnen worden gedaan voor de nodes die noodzakelijk zijn voor een simulatieomgeving gebaseerd op het valtest-scenario, waarbij gekeken wordt naar algemene prestaties, prijs/prestatieverhouding en energiezuinigheid. Het daadwerkelijk aantal nodes hangt af van de algemene vereisten van de werkbelasting.
Maximale prestaties: Dell PowerEdge compute node met Intel Xeon E5-2697v2 processors (in totaal 24 cores per node), 64GB geheugen en een Mellanox ConnectIB card Minimale configuratie: 2 nodes
Hoge prestaties, maximale energiezuinigheid: Dell PowerEdge R720 compute node met Intel Xeon E5-2680v2 processors (in totaal 20 cores per node), 64GB geheugen en Mellanox ConnectIB card Minimale configuratie: 2 nodes
Basissysteem: Dell PowerEdge R620 compute node met Intel Xeon E5-2667v2 processors (in totaal 16 cores per node), 32GB geheugen, Intel NetEffect X520 iWARP card Minimale configuratie: 2 nodes
© Dell | Section 1 Benchmarkonderzoek: Geoptimaliseerde valtest met Dell, Intel en Altair 7
Samenvatting van resultaten Samenvattend zijn de belangrijkste resultaten van dit onderzoek:
Het Dell-Intel cluster levert 6x snellere prestaties voor de RADIOSS valtest-simulatie vergeleken met de referentiecase o Intel Xeon E5-2697v2 produceerde de beste resultaten van de 3 geteste processors: o Minder dan 4 uur doorlooptijd voor 21 simulaties
RADIOSS’ Advanced Mass Scaling (AMS) kan de resultaten nog eens 1,7x versnellen o Geschatte 1,7x sneller met AMS ingeschakeld o Doorlooptijd van minder dan 2,5 uur (minder dan 400 seconden voor een enkele simulatie)
Intel Xeon E5-2680v2 biedt optimale energiezuinigheid o Xeon E5-2680v2 verbruikt minder stroom tijdens het uitvoeren van de 21 simulaties van deze testcase o In een 24x7 always-on productieomgeving verbruikt de Xeon E5-2680v2 21.3% minder stroom dan de Xeon E5-2697v2, wat meer is dan het TDP verschil van 115W versus 135W (17%).
Door de Altair valtest-oplossing op Dell/Intel systemen te gebruiken, kunnen engineers de valschade van telefoons beperken en aan alle eisen op het gebied van garantie en klanttevredenheid voldoen. Daarnaast kunnen ze de kwaliteit van het ontwerp verbeteren door de invloed van veranderingen te onderzoeken, en inzicht te verkrijgen in het dynamische gedrag van fysieke valtests, met gedetailleerde informatie over hoe de componenten van het product presteren. Dankzij de afname van kosten en tijd van productontwikkeling hebben fabrikanten meer tijd om zich te richten op verbeterde ontwerpen -- wat leidt tot een eindproduct met betere kwaliteit. Naast valtesten zijn er nog een aantal technische berekeningstoepassingen in het Altair HyperWorks simulatiepakket die baat hebben bij hoogwaardige Dell clusters voorzien van de nieuwste Intel processors, in toepassingsgebieden als stamping, noise, vibration and harshness (NVH) simulatie, computational fluid dynamics (CFD) simulatie, etc.
Voor meer informatie
Meer weten over Altair software: o HyperWorks suite: www.altairhyperworks.com o PBS Works suite: www.pbsworks.com
Vraag een demo aan: www.altair.com/dell-intel-drop-test
Meer weten over Dell: www.dell.com en www.dell.co.uk/hpc
Meer weten over Intel: o newsroom.intel.com o blogs.intel.com. o www.intel.com/products/server/processor/xeonE5/index.htm
Contact opnemen: o Altair: www.altair.com/PageAllLocations.aspx o Dell: www.dell.com en www.dell.com/hpc o Intel: www.intel.com
© Dell | Section 1 Benchmarkonderzoek: Geoptimaliseerde valtest met Dell, Intel en Altair 8