PŘEDSTAVENÍ GRAFICKÉHO PROCESORU NVIDIA G200
Bc.Adam Berger Ber 208
Historie a předchůdci G200 V červnu roku 2008 spatřila světlo světa nová grafická karta od společnosti Nvidia. Tato grafická karta opět posunula veškeré chápání grafiky o kus dál a přináší tak mnohem věrohodnější, rychlejší a lepší zpracování obrazu. Její vývoj trval bezmála 4 roky. Výsledek snažení skutečně stojí za to. Předchůdcem grafického čipu G200 jsou grafické karty postavené na čipu G80 (např. Geforce 8800GT a 8800GTX) a G 92( např.9800GTX ). V tabulce níže je porovnání karet 8800GTX s GTX280
Grafické karty postavené na jádru G200 se zatím nabízí ve 2 variantách. Výkonnější GTX280 a méně výkonná GTX260. GTX 260 je postavená na úplně stejné architektuře, pouze má omezené některé jednotky. Výkon je tak uměle snížen. G200 je vyráběná 65nm technologií. Na jádro o velikosti 24mm x 24mm dokázali technici v Nvidii umístit 1,4 miliard tranzistorů. Pro zajímavost G80 měla něco kolem 681 milionů a jádro G92 754 milionů. Což znamená že jádro G200 má skoro dvojnásobný počet tranzistorů oproti G92.
Hlavní přínosy G200
Unifikovaná architektura druhé generace Integrovaná PhysX Multi-GPU SLI a Tri-SLI Podpora DirectX 10 Shader Model 4.0. Jazyk CUDA PCI Express 2.0 Giga Thread Technologie – paralelní zpracování operací Lumenex engine - velmi přesné zobrazení objektů. 128-bitové HDR osvětlení - slibuje dvakrát kvalitnější světelné efekty. Dual Link a Display Port - Přes obě rozhraní je možné zobrazit digitálně rozlišení až 2560x1600 Pure Video HD - Dva HD dekodéry dokáží zobrazit dva HD streamy zároveň. Vylepšené režimy spotřeby
Architektura Na obrázku níže je zobrazeno zjednodušené schéma procesoru G200. Zobrazení hlavně představuje tok dat od thread Schedule(řídí plánování úloh, které jsou poté zpracovány v clusterech jádra) až po ROPs (Render Output unit - zabezpečuje výstup dat z grafické karty) , kde se finální pixely dostávají do frame bufferu a jsou následně zobrazené na vaší obrazovce. Jedná se o architekturu druhé generace. Díky vylepšenému komunikačnímu protokolu má G200 rychlejší a lepší přenos informací v jádru. Vylepšení také doznalo plánování mezi TMUs (Texture mapping unit - mapuje textury na objekty) a SM řadičem.
V jádru se využívají 2 modely zpracování údajů: MIMD (multiple instruction, multiple data) v případe jednotlivých clusterů SIMT (single instruction, multiple thread) v jednotlivých SMs.
TP CLUSTER
Celkově se v jádru nachází 10 thread processing clusterů (na obrázku) Každý jeden cluster je sestaven ze : 1. Tří streaming multiprocessors (SMs), 2. z osmi texturovacích jednotek (TMUs) složených z 8 filtrovacích (TFUs), 8 adresovacích jednotek (TAUs) 3. a lokální paměti L1 cache. Úkolem paměti cache, která se nachází mezi jednotlivými ALUs je uchování jednotlivých informací , které si ALUs vyměňují mezi sebou bez toho,aniž by museli přistupovat na externí paměťový systém.
FAKTA o G200 Vyšší výkon při zpracování textur G200obsahuje v každém clusteru dvě texturovací jednotky skládající se z 2x4 filtrovacích a 2x4 adresovacích jednotek, které dokáží za takt filtrovat a adresovat osm bilineárně filtrovaných pixelů a nebo čtyři: 2x anizotropní filtrované pixely.
Více úloh najednou Jelikož je u her potřeba zvýšit aritmetický výkon , nemusela nVidia nijak razantně zvětšovat počet TMUs ale ALUs. G200 obsahuje 240 tzv. „stream procesorů“ . K navýšení úloh také pomohl jazyk CUDA o kterém bude zmínka za chvíli.
G200 vs G80
Vyšší přesnost operací v plovoucí desetinné čárce - nutné pro výpočty Vyšší frekvence jádra i pamětí Téměř 2x více SP procesorů Možnost třikrát vyššího počtu spuštěných paralelních úloh 1GB pamětí + 512-bit paměťová sběrnice Plná rychlost ROP jednotek Dvakrát delší velikost registrů - vyšší efektivita a výkon Několikrát rychlejší geometry shadery Efektivnější plánovač instrukcí, vyšší výkon při zpracování textur Vylepšený "z-cull" a komprese, vyšší výkon při vysokých rozlišeních
CUDA CUDA je unifikovaná architektura druhé generace umožňující využít u grafických karet jejich GPU nejen pro hry, ale i pro složité výpočty. Cuda je postavena na bázi jazyka C a C++ tak, aby umožnila programování jednoduchých SP jednotek v GPU. Hlavní předností , kterou si CUDA kladla za cíl je paralelizace prováděných úloh tak ,aby využila výpočetní možnosti GPU na maximum a bezezbytku. Princip je jednoduchý. CPU zpracovává vlákno programu a při potřebě výpočtu předá tento úkol právě GPU. V případě, že program je napsaný pro jedno vlákno spustí jej CUDA na všech SP procesorech a tím proces paralelizuje. Tedy i když bude aplikace napsaná na jedno vlákno a spustí se na GPU, stane se z ní více vláknová.
CPU vs GPU Běžné procesory spouští 2 vlákna instrukcí. Ty se snaží provádět jednu za druhou v co nejkratším čase. V současnosti je největší problém v tom, že aplikace jsou psané pro jedno vlákno nikoliv pro více. Jediné více vláknové aplikace jsou hry, editory videa, encodery,simulace, fotografií. GPU je ve skutečnosti mnoho jádrový multiprocesor. Ten je v jednom okamžiku schopen provést několik instrukcí najednou. Například čtyř jádrový procesor provede v jednom okamžiku jen několik instrukcí oproti tomu GPU provede až 100vky instrukcí. Čtyř jádrové CPU může navíc provádět jen 8 vláken, zatím co GPU jich může mít až tisíc. GPU nebude nikdy nahrazovat CPU. Už jen proto, že účel GPU je směrován jedním směrem a podle toho je i vybavena jeho instrukční sada. Ve výpočtech s plovoucí desetinnou čárkou však nemají GPU konkurenci. Velký význam mají GPU pro astro-fyzikální, lékařské, letecké apod. simulace a výpočty. Objevují se i první reálně využitelné aplikace ku prospěchu všech, například software pro výpočet obrazu u mamografů, modelů tomografů a dalších. Na obrázku níže můžete sledovat rozdíl ve zpracování videa HD nebo výpočtu PhysiX.
Závěr Grafický chip společnosti Nvidia rozhodně přinesl mnoho nových aspektů a technik do světa obrazu a grafiky. Díky vylepšené technologii, je možné zpracovávat rychleji video, lékařské snímky a nebo simulace jakéhokoliv typu. Novinka sebou také přinesla snížení spotřeby energie, možnost zapojit kartu do DUAL,TRI SLI režimu nebo Pure video HD. GPU s Cuda má velký potenciál, který se bude dále rozšiřovat.
Zdroje http://pctuning.tyden.cz/ http://cs.wikipedia.org/wiki/GeForce_200 http://www.nvidia.com/content/global/global.php