GPU versus CPU
Renderen terwijl uw processor stil staat?
SketchUp Pro
Octane Render
1
Visualisatie toekomst is er al ?
Jen-Hsun Huang, oprichter en president en CEO van NVIDIA (GTC Jan Jose Convention Center) legde op 15 mei 2012 uit dat de toekomst er al is. In een kleine twee uur wordt u meegenomen in een wirwar van nieuwe ontwikkelingen en mogelijkheden. Bijgaand een samenvatting van de presentatie. Op pagina 9 de link naar de show van Jen-Hsun Huang.
400 miljoen CUDA GPU’s zijn er momenteel al, meestal slapend, in gebruik!
Wat is CUDA? CUDA is een klein onderdeel in een grafische NVIDIA kaart dat razendsnel parallel berekeningen uitvoert. Zonder dat de output daarvan naar het scherm gaat. Heel veel cores extra.
CUDA in getallen: 1,5 Miljoen downloads 35 super computers 560 universiteiten 22.500 wetenschappelijke publicaties over dit onderwerp.
Uitgeverij Ontmoeting http://www.ontmoeting.nl
@ begin aug. 2012 http://www.ontmoeting.nl/gratis/ 2
GTX 690 De meest gavanceerde NIVDIA kaart van dit moment (~ 990,- Euro), in diverse uitvoeringen (fabrikaten) te verkrijgen. Met 2 Kepler GPU’s en een speciale verdampings kamer techniek voor de koeling. 3072 CORES http://tweakers.net/nieuws/81662/nvidia-introduceert-geforce-gtx-690.html
KEPLER Een super versneller gebaseerd op: • SMX • Hyper-Q • Dynamic Parallelism
KEPLER
KEPLER
SMX
Hyper-Q
met 192 cores en zeer laag energiegebruik
32 gelijktijdige werk toegangen en een betere verdeling van de workflow over de processoren. 3
KEPLER
Dynamic Parallelism De CPU geeft de opdracht voor een bewerking. In de Kepler GPU worden niet alleen de berekeningen uitgevoerd, maar kan ook uit zichzelf nieuwe bewerkingen starten met eigen antwoorden. Daarna volgt de ouput terug naar de CPU of scherm. Een duidelijke verbetering ten opzichte van Fermi.
KEPLER
Dynamic Parallelism Renderingen worden zo uitgevoerd dat de beste kwaliteit (helderheid, resolutie etc.) daaraan wordt toegekend waar er vraag naar is. Links te grof, in het midden te fijn, rechts de gecombineerde rekenkracht, fijn waar nodig, grof waar niets te vinden is. Optimaal weergeven.
4
Tesla K10 & K20 Tesla K10 is vandaag te koop, rechts de K20 in het vierde kwartaal van 2012 verkrijgbaar. (K10 = min of meer een GTX 690 zonder video output, tegen een forse prijs die in de duizenden Euro’s loopt, 4,58 Teraflops en 3072 cores) GPGPU: Grafische kaart voor wetenschappelijke en zware toepassingen. Presteert uitstekend voor b.v. AMBER (biomoleculair progr.) en LAMMPS (life science research progr.).
http://parallelis.com/k10-why-nvidia-had-to-do-it/
De Cloud Nu ook voor het versnellen van de beeldopbouw met parallele processen. De GPU in de computer is de aangever, de Cloud zorgt voor razendsnelle verwerking.
Tesla De eerste GPU die met Cloud computing kan werken. • virtuele GPU’s • Low-Latency Remote display • Energiezuinig
Platformen De grootste uitdaging om een platform onafhankelijk visualisatie systeem aan te bieden is werkelijkheid aan het worden: • virtuele GPU maakt het mogelijk
5
Platformen Is het mogelijk om met een super GPU server allerlei platformen te bedienen? Ja, binnenkort realiteit • virtuele GPU maakt het mogelijk
Een computer wordt een Virtueel programma Citrix werkt al jaren samen met NVDIA iPad Uitgerust met een gratis “Receiver” APP van Citrix voor directe toegang tot bedrijfs files, applicaties en desktops. Indien uw bedrijf met Citrix werkt (XenDesktop), dan kunt u op allerlei platformen (ook mobiel) de gegevens opvragen !
6
iPad De complete desktop van Windows op het scherm om de complete computer te besturen? Kan dat? Kijk maar, het gaat met Citrix.
iPad Een stap verder met Citrix: u kunt zelfs de systeem gegevens oproepen en wijzigigen van de Windows computer op afstand.
Life TV cluster aansturen Met slechts één mini kastje in een te groot 19” rek met slechts een aantal GPU’s. Mogelijk dankzij de parallele rekenkracht van GPU’s.
7
Cisco is er klaar voor . . . Om de markt met video spelletjes te bestormen. Geen fysieke DVD meer in de winkel kopen, maar online spelen via een server met een snelle toegangstijd. Welke technologie volgt dit nieuwe traject? Dell, HP, IBM en Supermicro werken ook al jaren met NVIDIA samen. Er wordt een wereldwijd netwerk opgebouwd, waarvandaan games verkocht en gestreamd zullen worden. Free Record en vele andere MKB winkels zullen dat met lede ogen aanzien.
Spelletjes via de Cloud langzaam? Dat was zo, nu kan er met 260 ms vertraging actief worden gespeeld. Maar niet alleen spelletjes ook andere software kan in de toekomst op dezelfde manier worden aangeboden. Waarbij de rekenkracht elder op een server is geplaatst. En waarbij de klant (abonee) geen fysieke eigenaar van de software is. Het blijft belangrijk om een organisatie in de buurt te houden om uw vragen een op een te kunnen stellen. Een Engelstalig Forum is daar vaak geen goede oplossing voor. 8
Markten worden door elkaar geschud Er gaat de komende tijd veel veranderen. Software op de computer wordt wellicht ouderwets, in de Cloud is het voordeliger en beter (capaciteit en rekenkracht). De computer wordt alleen een soort simpele terminal waarmee kan worden gekeken en bestuurd.
Een grote en dure grafische kaart nodig? Vroeger wel, met een virtuele kaart is dat overbodig (Citrix & NVIDIA ontwikkeling). Zelfs op een iPhone kunt u een zwaar programma benaderen en besturen.
Verdienmodel op zijn kop De manier en de wijze waarop er aan kan worden verdiend zal steeds sneller en vaker gaan veranderen. Het zal meer gecentraliseerd worden, zoals b.v. de wereldwijde AppleStore. Een Microsoft, Google en nog tientallen stores.
van harte Bekijk het zèlf ( 1 uur en 45 minuten) aanbevolen http://smooth-las-akam.istreamplanet.com/live/demo/nvid1/player.html http://youtu.be/XtGf0HaW7x4 http://youtu.be/y9EJr_qzn2M http://youtu.be/K_mZeZAFN0U
NVIDIA en Mythbusters team
Ray Tracey’s blog: Real-time rendered animation previews with Ocatane Render. http://raytracey.blogspot.nl/ 9
Wat zijn de consequenties en hoe snel gaat de introductie en ontwikkeling? NVIDIA zoekt bij de programmeurs, software leveranciers steun om de ontwikkelde hardware producten ook echt tot ontwikkeling te laten komen. Dat kost geld, tijd en energie. Daar komt bij dat in veel gevallen een hardware aanpassing bij de klant nodig is (vooral voor de oudere systemen, die waarschijnlijk moeten worden vervangen).
Is Apple er klaar voor? • 15” MacBook Pro met Retina-display 2,3 GHz (e 2.279,-) biedt een resolutie van 2880 x 1800 @ 220 pixels per inch. Processor 2,3 GHz quad core Intel i7 en dat is prima. Verder 8 GB RAM, uit te breiden naar 16 GB. Geheugen bandbreedte 80 GB/sec. NVIDIA GeForce GT 650 M met 1 GB GDDR5-geheugen geschikt voor 2 beeldschermen aansturing. CUDA wordt ondersteund. CUDA Cores 384 cores, 900 MHz klok met 27,2 miljoen/sec texture fill rate. OpenGL 4.1. Alles wijst erop dat deze geschikt is voor toekomstige ontwikkelingen, vooral in samenwerking met een groot Apple tweede scherm via Thunderbolt bus. • 15” MacBook Pro met Retina-display 2,6 GHz (e 2.899,-) biedt een resolutie van 2880 x 1800 @ 220 pixels per inch. Processor 2,6 GHz quad core Intel i7 en dat is prima. De extra uitbreiding naar 2,7 GHz is niet zinvol. Verder 8 GB RAM, uit te breiden naar 16 GB. Geheugen bandbreedte 80 GB/sec. NVIDIA GeForce GT 650 M met 1 GB GDDR5-geheugen geschikt voor 2 beeldschermen aansturing. CUDA wordt ondersteund. CUDA Cores 384 cores, 900 MHz klok met 27,2 miljoen/sec texture fill rate. OpenGL 4.1. Alles wijst erop dat deze geschikt is voor toekomstige ontwikkelingen, vooral in samenwerking met een groot Apple tweede scherm via Thunderbolt bus.
On the fly of te wel ‘life renderen’ is dat mogelijk? NIVIDA laat het zien, het water klotst in de glazen of platic bak en alle reflecties zijn in de bol en het logo zichtbaar, maar ook de reflecties daar weer van. Toekomstmuziek? Nee, het is alleen een kwestie van de juiste hardware dan gaat het met de geschikte software NU AL WERKEN.
Extra: • Tweede beeldscherm 27 inch via Thunderbolt te koppelen. Prijs e 999,• Mac Mini 2,5 GHz ( e 799,-) met AMD Radeon HD 6630M is een stuk minder dan z’n NIVIDIA concurrent. En mist de toekomstgerichte CUDA technologie. Geen keuze voor 3D of renderingstoepassingen. • iMac 21,5 inch TFT scherm 1920 x 1080 px. 2,7 GHz quad core Intel i5, geheugen uitbreidbaar naar 8 GB. Een AMD Radeon HD 6770M grafische processor met maar slechs 512 MB geheugen, aan de krappe kant dus. Mist CUDA. Ook de CPU snelheid van de i5 blijft is zuinig voor zware toepassingen. • iMac 27 inch TFT scherm 2560 x 1440 px. 2,7 GHz quad core Intel i5, geheugen uitbreidbaar naar 8 GB. Een AMD Radeon HD 6770M grafische processor met maar slechts 512 MB geheugen, aan de krappe kant. Mist CUDA. Jammer dat er geen i7 is gebruikt. • De 3,1 GHz i5 Intel processor quad-core iMac uitvoering heeft een AMD Radeon HD 6970 M grafische kaart met 1 GB GDDR5-geheugen. Ook hier missen we CUDA en CPU power.
10
• MacPro in de configuratie 12-core met twee 2,4 GHz 6-core Intel Xeon E5645 processors. Indrukwekkend samen met de cache. MacPro grafische kaart in twee opties: - ATI Radeon HD 5770 met 1 GB GDDR5-geheugen, PCI Express 2.0, twee Mini DisplayPort-uitgangen en één dual-link DVI-poort - ATI Radeon HD 5870 met 1 GB GDDR5-geheugen, PCI Express 2.0, twee Mini DisplayPort-uitgangen en één dual-link DVI-poort CUDA wordt gemist. Prijs e 3.899,- zonder scherm. • MacPro in de configuratie Quad-core met één 3,2 GHz quad-core Intel Xeon W3565 processors. Indrukwekkend met de cache. Grafische kaart twee opties, zoals hierboven omschreven. CUDA wordt helaas gemist. Prijs e 3.099,- zonder scherm.
Quad-core Apple computer begint met renderen. Alle cores worden benut.
redelijk klaar voor de nieuwe GPU-toekomst. De iMac’s (begin aug. 2012) blijven met hun i5 processor en AMD Radeon GPU’s achter en zijn kennelijk voor een andere markt bedoeld. Ook de Mac Pro biedt niet een optimale kaart (NVIDIA Quadro 4000 kan er wel bijgeplaatst worden) en mist op dit moment de Thunderbolt aansluiting.
Eventueel met een Quadro 4000 for Mac http://www.nvidia.co.uk/object/product-quadro-4000-mac-uk.html
om aan de leemte van CUDA te ontkomen. 256 CUDA cores, 2 GB geheugen GDDR5, 89,6 GB/sec mem. bandbreedte. OpenGL 4.1. De prijs loopt dan wel op.
Conclusie Vreemd genoeg zijn alleen de 2 Mac Book Pro computers met een extern groot scherm
Bestaande CPU techniek voor renderen Kiezen we voor pure rekenkracht voor de huidige renderingsprogramma’s, dan komt de Mac Pro 12-core als beste uit de bus. Vervolgens de Quad-core. En dan kunt u ook naar de 3,1 GHz iMac kijken die prijstechnisch zeker interessant is. Voor pure kracht zijn tòch de Mac Book Pro’s de winnaar (met i7 Intel processor).
Nieuwe GPU CUDA techniek voor renderen Eventueel de Mac Book Pro, deze bezit redelijk snelle grafische kaart met CUDA en goede processor. Flexibeler met Windows computers: Om de mogelijkheid van extra uitbreiden open te houden dient u uit te wijken naar een zelf samengesteld PC board, zware voeding, overklokte CPU. Met ruimte voor drie dikke high-end NVIDIA GPU’s. Eén voor het scherm en twee als SLI-tandem voor CUDA.
Overzicht top modellen GTX serie. 11
PC’s er klaar voor? Deze markt zit complexer in elkaar, maar bij de betere moederborden en zwaardere processoren is het goed mogelijk om één of meerdere high-end GPU kaarten in onder te brengen. Veel flexibeler dan bij Apple. Let wel op de lengte en breedte (soms 3 dik) van de nieuwe high-end grafische kaarten. En de voeding die vermogen moet leveren aan de kaarten. Kies een optimale i7 Intel processor met zoveel mogelijk cores (die aanvaardbaar betaalbaar zijn, 8 cores wordt max. door b.v. Artlantis aangestuurd) en één of meerdere high-end grafische kaarten. Controleer van te voren het moederbord, dat de grote GPU kaarten met koeling er ook werkelijk in kunnen worden geplaatst. Kies NVIDIA met CUDA.
Twee 8-cores processoren plaatsen bij een Windows computer.
http://www.nvidia.co.uk/object/geforce_family_uk.html
GeForce GTX 690 Graphics Cards on GeForce UK GeForce GTX 680 Graphics Cards on GeForce UK GeForce GTX 670 Graphics Cards on GeForce UK GeForce GTX 580 Graphics Cards on GeForce UK GeForce GTX 570 Graphics Cards on GeForce UK GeForce GTX 560 Ti Graphics Cards on GeForce UK GeForce GTX 560 Graphics Cards on GeForce UK GeForce GTX 550 Ti Graphics Cards on GeForce UK GeForce GTX 460 Graphics Cards on GeForce UK Quadro 410, 600, 2000, 2000D, 4000, 5000, 6000 of 7000.
Tempo omschakeling? De ontwikkelingen gaan snel, de markt is veel trager. Het zal nog jaren duren voordat de nieuwe ontwikkelen ook werkelijk in grote getalen zal worden toegepast. De ontwikkeling van GPU gebaseerde programma’s is er ook een van de lange adem. Octane Render is al jaren bezig en Shaderlight is al anderhalf jaar bezig om een werkend verkoopbaar programma op de markt te zetten.
Het schrijven van een CUDA programma is niet eenvoudig en vraagt andere kennis en kunde. Voornamelijk kennis van C en/of C++, Cg of Fortran wordt bij CUDA vereist. En wie weet zijn de Render[in], Artlantis, SU-Podium en V-RAY ook al aan het kijken om een compleet nieuw GPU gebaseerd renderings programma te ontwikkelen, de toekomst zal het leren. De eerste hoogwaardige programma’s die de markt betreden zullen een voordeel hebben op de nakomers. De firma’s laten nu nog niets los van ev. onderzoeken. In de loop van de tijd zal er een twee sporen keuze komen met computers die goed scoren op rekenkracht met processor cores (CPU gebaseerd). En de anderen die de aandacht hebben verlegd naar highend grafische kaarten (GPU CUDA gebaseerd) en zelfs naar de Cloud. En virtuele GPU’s in iPad en iPhones en anderen. Het één hoeft echter het andere niet uit te sluiten, combinaties zijn mogelijk. Film:
http://youtu.be/XtGf0HaW7x4 en u weet direct wat de voordelen van GPU ten opzichte van CPU zijn! Bedenk dat de praktijk met uw computer niet zo rooskleurig zal zijn als hier wordt voorgesteld. 12
Octane Render Het eerste programma voor Windows, Linux en Mac dat gebruik maakt van CUDA om te renderen. U kunt een demo ophalen om eerst eens te proberen. Onderstaand de stappen die we maakten bij een Windows 7 computer: 1. Controleer of u een grafische kaart hebt die CUDA ondersteund (alleen bij NVIDIA kaarten, GeForce en Quadro). In dit geval hadden we een NVIDIA Quadro 600 kaart die CUDA ondersteund. 2. Zoek de bijpassende CUDA driver (NVIDIA site) op die bij uw kaart past. 3. Bij onze Windows computer werd direct nog voor het downloaden gevraagd om het bijpassende Java programma. Wellicht dat het bij Mac al geïnstalleerd is. Het is nodig bij het werken met de CUDA driver. 4. Download Java 5. Download de CUDA driver (175 MB) 6. Geef na het installeren van de CUDA eenmaal één herstart voor de computer. 7. U kunt een demo programma van Octane Render ophalen: http://render.otoy.com/ 8. Installeer Octane Render 9. Als het goed is gegaan wordt de grafische kaart direct herkend in de Preferences van Octane, zie schermafdruk van de Windows 7 computer met grafische kaart Quadro 600. Verder blijkt dat Cuda Driver versie 4.20 wordt herkend met runtime version 4.00. Er zijn 96 cores met een kloksnelheid van 1250 MHz beschikbaar. In het onderste vak van het Preference menu de gegevens van het gebruikte geheugen. Het programma is klaar om te gebruiken (‘save as’ is uitgeschakeld in de demo versie van Octane). Experimenteren maar.
Octane Render zal online worden verkocht, maar men denkt ook aan een dealernetwerk, aangezien juist met Octane Render er veel support vooraf en achteraf nodig zal zijn om alles in goede banen te leiden. Veel locale support zal nodig zijn, veel meer dan bij andere renderings programma’s.
13
LINKS OP INTERNET Wat is GPU computing? http://www.nvidia.com/object/what-is-gpu-computing.html http://developer.nvidia.com/nvidia-gpu-computing-documentation http://developer.nvidia.com/cuda-downloads http://developer.download.nvidia.com/compute/cuda/3_0/toolkit/docs/NVIDIA_CUDA_ProgrammingGuide.pdf http://www.amazon.com/dp/0123814723?tag=wwwnvidiacomc20&camp=14573&creative=327641&linkCode=as1&creativeASIN=0123814723&adid=1DT2S034DXS37V3K5FFY http://www.amazon.com/CUDA-Example-Introduction-General-PurposeProgramming/dp/0131387685/ref=sr_1_1?ie=UTF8&s=books&qid=1271458526&sr=1-1 GPU meter free voor Windows: http://addgadgets.com/gpu_meter/ Info van video kaart (Win) opvragen met GPU-Z: http://www.filehippo.com/download_gpuz/
Netwerk mapper (Windows) met meerdere GPU’s gekoppeld.
Gehoord: “De GTX680 is overal uitverkocht” Volgens NVIDIA is er geen tekort, alleen alles wat wordt geproduceerd gaat direct over de toonbank. Uw gespecialiseerde computer handelaar zal u er alles over kunnen vertellen hoe het exact in elkaar zit. GTX680 is 60% sneller dan de GTX580. En de GTX690 beloofd nog meer, tegen een andere prijs.
NB. Dit overzicht is begin aug 2012 opgesteld. Inmiddels kunnen de prijzen, type nummers en technische gegevens, maar ook de conclusies zijn gewijzigd! Er kunnen geen rechten aan de informatie worden ontleend. http://www.ontmoeting.nl http://www.ontmoeting.nl/gratis/
gratis handleidingen en cursussen
14