Vysoká škola báňská – Technická univerzita Ostrava Fakulta elektrotechniky a informatiky
Pokročilé architektury počítačů Architektura Intel Larrabee
5.12.2009
Josef Stoklasa STO228
Obsah:
1. 2. 3. 4. 5. 6.
Úvod do tajů projektu Larrabe Srovnání s příbuznými projekty Intel Struktura Larrabee – použité technologie Srovnání s konkurencí – ATI a NVIDIA Závěr a realita projektu Zdroje
1. Úvod do tajů projektu Larrabee Na začátek je nutno říct, že Larrabee není klasické GPU! Jedná se ve skutečnosti o modifikovaný CPU s několika jádry. Intel se na poli grafických karet sice vyskytuje pouze ve formě základních grafických karet, které nezvládají pokročilejší 3D aplikace, či přehrávání videa v HD kvalitě. V tomto ohledu mají konkurenční firmy jako je NVIDIA, či ATI mnohaletý náskok ve vývoji výkonných grafických karet. Jistě si říkáte v čem je vlastně síla projektu Larrabe. Pojďme se tedy na něj podívat více z blízka. Projekt Larrabee je založena na velkém počtu jader modifikované, velmi dobře známé architektury Intel Pentium. Architektura Intel Pentium byla ve své době samozřejmě vyráběna 600 nm technologií, což se pochopitelně projevilo na velikosti celého čipu.
Wafer Polaris s 80-ti jádrovými procesory Intel Dnes je oproti tomu standardem vyrábění 45 nm technologií, což samozřejmě Intelu umožňuje implementaci několika takovýchto jader na jeden čip. Tak například ve srovnání s architekturou Intel Core 2 Duo (L2 Chache okolo 4MB) se na stejnou plochu vejde okolo 10 jader starší architektury Pentium. Intel Larrabee je tedy ve své podstatě založeno na původní architektuře Pentium, což mu dává nebývalé možnosti pracovat s jakýmkoli x86 kódem, tedy použít jej také pro výpočetní aplikace a nejen pro zpracovávání grafického kódu, a také zaručuje zpětnou kompatibilitu se staršími aplikacemi určenými pro starší grafické akcelerátory. Cílem Larrabee tedy bylo sestavit super výkonnou grafickou kartu s mnoha jádry, která bude zvládat až 160 vektorových operací za takt. Srovnání můžeme vidět v níže uvedené tabulce.
Problémem samozřejmě zůstává uzpůsobení instrukční sady takového x86 procesoru, tak aby bylo efektivně využito všech 10 jader. V tomto ohledu je ovšem zase výhodou plná programovatelnost takovéhoto procesoru. Dokonce se díky ovladačům dokáže v systému tvářit nikoli jako grafická karta, nýbrž jako x86 procesor.
2. Srovnání s příbuznými projekty Intel Larabee je do značné míry podobný architektuře Intel Atom a to především krátkým zřetězením při zpracovávání instrukcí. Larrabee totiž využívá 5-ti stavové pipeline a Atom 16-ti stavové pipeleine. Jádra Larabee mají k dispozici každé (32kB l + 32kB D) cache L1 a jejich cache L2 je společná. Důvod si rozebereme později. Oproti tomu Atom má podstatně nižší cache L1 (32 kB l/24 kB D) a to z důvodu snížení spotřeby, jelikož menší cache L1 má dle expertů zásadní vliv na nižší spotřebu procesoru. Srovnání všech tří architektur Larrabee, Pentium a Atom vidíme v tabulce.
3. Struktura Larrabee – použité technologie Jak již bylo předesláno jádra Larrabe využívají společnou L2 cache z níž má každé jádro vyhrazeno 256 kB, což by měla být ta pravá a optimalizovaná velikost (dle Intelu) pro zpracovávání grafického kódu. Larrabee by mělo využívat známé metody „tile-based“ rendering, která při zpracovávání grafiky pod DirectX, nebo OpenGL rozdělí danou scénu do několika polí o velikosti 64*64 bodů (popřípadě 128*128 bodů) a spolu s informací o barvě a tzv. hodnotě Z (32-bit RGB/32-bit Z) tvoří právě oněch požadovaných 256 kB. Metodu „tile-based“ jsme již mohli vidět v pradávných grafických akcelerátorech Kyro, které se nakonec na trhu neuchytily v tehdejší konkurenci NVIDIA, 3dfx, či ATI. Předností Larrabee, která jej předurčuje právě pro grafické operace je 16-wide ALU, která dokáže pracovat až s 16-ti 32-bitovými operacemi v oblastech čísel s plovoucí řádovou čárkou. Larrabee také disponuje podporou 64-bitových x86 operací a možností 4-cestného simultánního zpracování vícevláknových operací.
Struktura jednoho jádra Larrabee Aby Larrabee mohlo dosáhnout požadovaného výkonu využívá tzv. „ring-bus“ sběrnice. „Ring-bus“ jsme mohli vidět již u některého z dřívějších modelů karet ATI (např. s jádrem ATI R600), která tehdy obsahovala kombinaci čtyř 256-ti bitových sběrnic pro oba směry (512-bit čtení/zápis). Larrabee bude s největší pravděpodobností disponovat rovněž 512-bitovou sběrnicí pro každý směr, což při synchronizovaném taktu 2GHz sběrnice s jádrem dá ve srovnání s konkurencí doposud nevídaný výkon. Toto řešení se zdá pro Larrabee ideální, jelikož jak již bylo předesláno, jádra Larrabee využívají společnou dostatečně velkou L2 cache v níž má každé z jader vyhrazeno 256 kB. Toto tedy patřičně nahrává koherentnosti dat a velice usnadní výměnu velkého množství dat a jejich případné sdílení. Na níže uvedeném obrázku můžeme vidět ilustrativní znázornění struktury jader spolu s L2 cache.
Ilustrativní znázornění struktury jader okolo společné L2 cache
4. Srovnání s konkurencí – ATI a NVIDIA Oba výše zmínění konkurenti využívají pro dosažení požadovaného výkonu GPU oproti Larrabee tzv. „stream“ procesorů. Srovnáme si tedy alespoň teoreticky vektorovou ALU Larrabee se „stream“ procesory obsaženými v jádrech NVIDIA GT200 a ATI RV770. ATI RV770 je složeno ze 160-ti superskalárních procesorů, přičemž každý z nich obsahuje 5 výpočetních jednotek. NVIDIA s jádrem GT200 obsahuje 240 subskalárních jednotek v podobě „stream“ procesorů. Oproti tomu Larrabee má v každém jádře ALU, jež zvládne 16 operací za takt. Není to sice mnoho, ovšem je potřeba si uvědomit, že prototyp Larrabee by měl obsahovat 32 jader, přičemž pokročilejší vývoj by měl teoreticky pomocí 32 nm technologie dosáhnout až 48-mi jader obsažených na jednom čipu.
Srovnání jader Larrabee se současnými AMD RV770 a NVIDIA GT200
5. Závěr a realita projektu Larrabee se jevil jako velmi nadějný projekt a byl označován za možnou revoluci ve světě grafických čipů, avšak je nutno si uvědomit, že vývoj se táhne již od roku 2007 a prototyp měl být původně sestrojen již v letošním roce. Realita je ovšem taková, že Intel letos na podzim oznámil nekomerční distribuci a tedy stažení celého projektu Larrabee pro veřejnou sféru. Po četných problémech, jež provázely celý vývoj již od začátku, mimo jiné také neúnosná spotřeba tolika jader, se projekt Larrabee specializoval na odnož superpočítačů z čehož je zřejmé, že my jakožto běžní uživatelé desktopů si s touto kartou zřejmě nikdy nezadáme. Nezbývá nám, tedy než spoléhat na ostřílené výrobce grafických čipů ATI a NVIDIA, kteří by však zdravou konkurenci již potřebovali, jelikož nadsazené ceny jejich novinek jsou pro průměrného uživatele neúnosné.
6. Zdroje http://www.svethardware.cz http://www.ddworld.cz
http://asd.cdr.cz http://www.intel.com