Roman Výtisk, VYT027
Ohlédnutí za architekturou AMD K8 Představení architektury procesoru AMD K10 ◦ Přínos ◦ Struktura cache ◦ IMC, HyperTransport sběrnice Použitá literatura
Ohlášení x86-64 architektury 5. října 1999. K8 přinesly instrukční sadu x86-64 a LDT(Lightning Data Transport) sběrnici. Později tyto procesory označované jako AMD64 a LDT sběrnice dostala oficiální jméno HyperTransport sběrnice. První K8 procesor byl představen v roce 2001 (frekvence pouhých 800 MHz). Duben 2003 pro Opterony, září pro Athlony. Přínos: 64 – bit instrukční sada HyperTransport sběrnice – náhrada FSB (Front Side Bus) Úpravy jader, více registrů, kompatibilita s x86 IMC (Integrated Memory Controller) – integrovaný řadič paměti. Duben 2005 uvedení dvoujádrových Opteronů, Athlonu 64 X2 Postupně několik revizí, došlo několikrát ke změně výrobní technologie a její minituarizaci od původní 130nm SOI až na konci po 65nm SOI
Výhody: Řadič je přímo v CPU, od výpočetní části vzdálen pár milimetrů → nižší latence, vyšší rychlost a spolehlivost Řadič pracuje na vyšší frekvenci a je vyráběn stejnou technologií jako CPU → vyšší výkon Lepší kompatibilita s paměťmi, nezávislé na základní desce nebo čipsetu → vyšší spolehlivost Řadič je chlazen spolu s CPU Ve víceprocesorových systémech roste maximální použití paměti a jejich propustnost Nevýhody: CPU je vázán na jeden typ paměti → nelze kombinovat různé druhy pamětí na základní desce (např. DDR2 a DDR3 na jedné desce)
schéma jednotlivých částí čipu - 130 nm SOI výrobní technologie a 9 vrstev měděných mezispojů na ploše 194 mm2
První zmínky v roce 2006 Částečně přebírá některé prvky architektury K8 První nativně 4 jádrové CPU s rozměry 283 mm2 vyrobené pomocí 65nm SOI technologie 3 revize ◦ První na začátku prosince 2006, druhá v březnu 2007 , následována jádrem s revizí v červnu 2007 . Zde se již podařilo většinu potíží vyřešit. S K10 AMD přesáhlo magickou hranici 3.0 GHz
Změny, které K10 přináší: ◦ načítání dat mimo pořadí ◦ nezávislé kanály operační paměti ◦ 128-bit FPU ◦ vyšší frekvence pro severní můstek ◦ snížení latencí díky L3 cache ◦ řadu dalších úprav architektury
Jádro navrženo s ohledem na další možné úpravy architektury. Přibylo také několik instrukcí pojmenovaných jako SSE4A Podstatné změny jsou v jádře i na úrovni virtualizace. Hlavní změny se týkají efektivity virtualizace a změny kontextu v případě jeho přepínání.
Schéma jednotlivých částí čipu 65 nm SOI výrobní tech. 11 vrstev měděných mezispojů 463 mil. tranzistorů na ploše 285 mm2 6 frekvenčně nezávislých ppl(Phase-Locked Loop) smyček 5 senzorů - snímání teploty jader
L1 cache: nejblíže výpočetním jednotkám, proto nejrychlejší, slouží k uchování aktuálních nejpotřebnějších dat, instrukční a datová obě 64 Kb, data načítána přímo z paměti, přístupová doba je 3 cykly. nedostatek - L1 má nízkou kapacitu, a tak je zde zcela zásadní kvalitní správa cache.
L2 cache: nesdílená – určena pro konkrétní jádro, přechodný zásobník - slouží k přelévání dat mezi L1 a L2 cache, zabranění duplicit (smazáním při přesunu), protože je L2 nesdílená, nemůže tak dojít k zaplnění daty jiného jádra, přístupová doba je 12 cyklů. nedostatek - v případě, že jádro potřebuje více místa, než je aktuálně v L2 k dispozici, není snadné získat místo pro další data
L3 cache: sdílená – určena pro všechny jádra, více jader může mít v L3 jedinou společnou kopii (výhodné v multimediálních aplikacích), L3 cache není plněna z paměti, ale z L1, a slouží k uchování dat přetečených z L2
Integrovaný řadič paměti má zde nezastupitelné místo. Dva nezávislé 64-bitové kanály a nízké latence přináší výkon zejména v případě vícevláknových aplikací a u software, který je náročný na propustnost. K10 může v jednu chvíli data číst i zapisovat.
HyperTransport 3.0 frekvence až 2600 MHz, vyšší výkon a propustnost. Umí pracovat jak v 16- bitovém režimu, tak být rozdělena na dva 8-bitové linky (a může být překonfigurována za “provozu“). Hodí se to hlavně pro multiprocesorové prostředí, kdy jsou třeba co nejnižší latence a je tak možné spojit více socketu.
http://www.svethardware.cz http://cs.wikipedia.org/wiki/AMD_K10
Děkuji za pozornost