STRUČNÁ HISTÓRIA PROCESOROV 80X86 PRE DESKTOPY PLATFORMY PC
(október 2002 - september 2004)
Miesto úvodu prvom rade treba spomenúť, že história počítačov (počítacích strojov) sa začala písať už v 18. a 19. storočí. Vtedy bolo zostrojených niekoľko mechanických počítacích strojov. História počítačov na elektro-mechanickej a na elektronickej báze sa začala písať na začiatku 40-tych rokov 20. storočia práve kvôli a v súvislosti s 2. svetovou vojnou, ktorá nechváľne urýchlila vývoj aj tejto oblasti. V tej dobe neexistovali tranzistory ani integrované obvody, len vyspelejšie elektrónky a relé. Zariadenie, ktoré dnes plní istú funkciu v podobe čipu na symbolickej ploche 1 cm2 by pred tridsiatimi rokmi zaberalo objem päste dospelého človeka a vážilo aj niekoľko (desiatok) kilogramov, pred sedemdesiatimi rokmi (ak bolo vtedy vôbec možné danú funkciu realizovať) by dané zariadenie zaberalo objem almary starej mamy (či celú izbu), vážilo niekoľko metrických centov (alebo ton) a vydávalo neúnosnú hlučnosť s nepredstaviteľnými nárokmi na energiu a chladenie. Britský Turingov elektronický kryptovací analizačný stroj COLOSSUS (navrhnutý a postavený za 10 mesiacov) rozlúštil rýchlosťou 300 operáciíí za sekundu nacistické kódy šifrované strojom ENIGMA, čo veľmi prispelo k tomu, že spojenci vyhrali vojnu. V priehebu hodiny, či dokonca niekoľkých desiatok minút dokázal rozlúštiť aj tie najtajnejšie a najzložitejšie nacistické kódy, ktoré predtým lúštil celý tím špičkových kryptológov (medzi ktorých patril aj Alan Turing) niekoľko dní. Alan Turing ukázal, že na akýkoľvek výpočtový a algoritmizovateľný problém (ktorý bol preto problémom matematickým), sa dá postaviť počítač. COLOSSUS pozostávajúci z 1800 elektrónok bol postavený v núdzových podmienkach, bez finančnej podpory skeptickej bristkej vlády, zastávajúcej názor, že vojna skončí skôr, kým sa dokončí ten pochybný stroj. Po prvých výsledkoch však bola britská vláda taká nadšená, že okamžite dala postaviť ďalších 10 (!!!) kusov stroja COLOSSUS. V roku 1946 uzrel svetlo sveta dokonalejší legendárny ENIAC, t.j. prvý ovládaný elektrónkový počítač, ktorý bol zostrojený na Pennsylvánskej univerzite v USA. Iróniou však bolo, že jeho celkom prvé využitie bol výpočet balistických dráh striel zo zbraní a rakiet. Elektrónky boli práve príčinou, prečo sa veľmi zahrieval, zaberal veľmi veľa priestoru (okolo 100 m2 – ako veľkopodlažný 4 izbový byt), vážil niekoľko ton a často sa kazil. Veľký pokrok znamenalo vynájdenie tranzistora v r. 1947 a jeho lacnejšej a spoľahlivejšej varianty v r. 1950, ktorou bol plošný tranzistor. Tranzistory však tiež mali nevýhodu a to, že to boli oddelené súčiastky a museli sa vzájomne prepojovať. Toto vyriešil v r. 1958 integrovaný obvod. Rok 1961 vznikli plošné dosky, na ktorých boli integrované obvody spájané už hliníkovým filmom namiesto drôtov - ďalší pokrok. Teraz už bolo všetko pripravené na vznik mikroprocesora. Toľko veľmi stručne o týchto nie nemej zaujímavých úsekoch neľahkej cesty výrobkov IT a pozrieme sa bližšie na dobu, keď bolo možné už prakticky zužitkovať nové poznatky polovodičového priemyslu stelesnené najprv objavom tranzistorov a neskôr integrovaného obvodu, čiže obdobie začiatku sedemdesiatych rokov.
V
1
Charakteristika rocesory - CPU (Central Processing Unit – centrálna riadiaca jednotka) sa rozdeľujú predovšetkým podľa rýchlosti. Tá sa udáva v hertzoch (Hz) a dosahuje typické hodnoty
P
od desiatok Hz v počiatkoch až do niekoľko GHz i viac v súčasnosti. Ako sa táto rýchlosť zisťuje? Procesor počítača je synchrónne zariadenie, ktoré pracuje podľa hodinových kmitov generovaných kryštálom a generátorom frekvencie na základnej doske. Behom jedného kmitu procesor vykoná jednu operáciu. Ak je procesor schopný pracovať s vyššou frekvenciou týchto hodinových kmitov, vykoná za jednu sekundu viac operácií, teda bude vykazovať vyšší výkon oproti rovnakému typu procesora pracujúceho na nižšej frekvencii. Výkon procesora je samozrejme veľmi výrazne závislý na návrhu integrovaného obvodu, spínacích rýchlostiach tranzistorov tohto obvodu a na hustote ich integrácie, teda inými slovami na generácii procesora. Menej seriózne materiály o benchmarkoch a výkonoch rôznych procesorov mnohokrát porovnávajú neporovnateľné, teda dva typy procesorov taktovaných na rôznej frekvencii, dokonca dva procesory rôznej generácie. Neporovnateľné (z hľadiska rovnakej frekvencie) sú aj procesory od rozličných výrobcov. S obľubou sa týkali hlavne testov procesorov Intel Pentium a Pentium II, ktoré porovnávali s procesormi AMD K5 a K6 (resp. zástupci neskorších generácií procesorov od oboch výrobcov). Pri týchto testoch totiž nie vždy vychádza ako víťaz procesor pracujúci na vyššej frekvencii (i keď aj tu sú výnimky možné). Už dlhšie totiž platí rovnosť Výkon = IPC x CPU Clock, t.j. výkon určuje ako pracovná frekvencia procesora, tak aj počet inštrukcií vykonaných za sekundu. Toto kritérium už dlho využíva spoločnosť AMD. Celkový výkon je však tiež ovplyvnený architektúrou, množstvami implementovaných najrôznejších jednotiek a v neposlednom rade inštrukčných súprav. Vďaka nim je možné, že zatiaľčo jadro Pentia III na 500 MHz, pracuje na frekvenci len 10x vyššej než u historického 80486 DX2 na 50 MHz, je jeho výkon takmer 30-násobný, resp. Pentium 4 na 3 GHz pracuje na 30x väčšej frekvencii ako Pentium 100 MHz, jeho výkon je však asi 100-násobný. Ďalší významný parameter predstavuje efektivita mikrokódu. Ide o efektivitu, s ktorou sú napísané jednotlivé mikroprogramy vykonávajúce jednotlivé inštrukcie procesora. Jednoducho povedané, je to počet krokov potrebných na vykonanie jednej inštrukcie (napríklad sčítanie alebo násobenie dvoch čísel). Dôležitá je aj prítomnosť alebo neprítomnosť špeciálnej jednotky - numerického koprocesora, ktorý slúži k priamemu vykonávaniu výpočtov v pohyblivej desatinnej čiarke (floating point operations). V starších typoch procesorov (8086, 80186, 80286, 80386), ktoré neboli touto jednotkou vybavené, sa množstvo matematických operácií muselo emulovať softvérovo, čím sa výrazne znižoval výpočtový výkon počítača ako celku. Všetky novšie procesory od typu 80486 už majú túto jednotku v mikroprocesore, pri starých typoch bolo možné obyčajne koprocesor doplniť do počítača ako samostatný obvod. Ako by sa však mohlo zdať na prvý pohľad, koprocesor neslúži iba na matematické výpočty v nejakom tabuľkovom kalkulátore, dnes má čoraz vyšší význam - využíva sa predovšetkým v modernej grafike a 3D aplikáciách. Parametrom, ktorý zaiste pozná každý užívateľ počítača, je tzv. šírka slova. Tento parameter určuje, aké najväčšie číslo (maximálny počet bitov) dokáže procesor spracovať počas jednej operácie. Šírka slova sa udáva práve v počtoch bitov. Procesor, ktorý má šírku slova 8 bitov teda dokáže v jednej inštrukcii manipulovať s číslom uloženým maximálne na ôsmich bitoch (teda s číslom z intervalu 0 - 255). Takýto procesor a odôvodnene aj sám počítač sa označuje ako osembitový. Analogicky existujú procesory 16 bitové, 32 bitové, 64 bitové, schopné v jednej inštrukcii manipulovať po rade z číslami maximálne 216 – 1 = 65535, 232 – 1 =
2
4294967295 a 264 – 1 = 18446744073709551615. Šírka prenosu dát je parametrom, ktorý sa niekedy zamieňa s predchádzajúcou šírkou slova. Nezávisle od šírky slova, ktoré je procesor schopný spracovať v jednej inštrukcii, je nutné tieto čísla do procesora dodávať alebo z neho odoberať. Šírka prenosu dát určuje, aké maximálne číslo môže byť behom jednej operácie prenesené z alebo do procesora. Udáva sa v bitoch a je dané veľkosťou dátovej zbernice procesora, ktorá slúži práve na tieto presuny dát. Čím je šírka dátovej zbernice väčšia, tým je väčšia i šírka prenosu, a tým je možné za kratší čas preniesť väčšie množstvo dát. So šírkou slova súvisí šírka zbernice. Všeobecne sa zbernicou nazýva sústava vodičov, ktorými prúdia dáta, adresy alebo riadiace signály. Z procesora ako mozgu počítača vycháza mnoho zbernicových vodičov. Všetky informácie prenášané zbernicou sa skladajú z jednotiek a núl, lebo sú kombináciou dvoch stavov. Pokiaľ má zbernica 32 vodičov (čo vodič, to jeden bit), tak sa jedná o 32 bitovú zbernicu. Taká zbernica može vygenerovať 232 = 4 294 967 296 kombinácií. Čím viac má zbernica vodičov, tým lepšie. Nás bude zaujímať : • •
dátová zbernica - prenáša údaje medzi mikroprocesorom a okolím. Čím je širšia, tým viac dát naraz prenesie a tým sa zvyšuje rýchlosť prenosu. adresová zbernica – ňou prúdia adresy. Čím je širšia, tím viac má adresových kombinácií a procesor môže pracovať s väčšou pamäťou.
Vnútorná frekvencia – obvody, ktoré tvoria samotný mikroprocesor, potrebujú taktovacie impulzy, ktoré určujú ich rýchlosť. Každá základná doska obsahuje teda generátor taktov, ktorý generuje taktovacie impulzy pre procesor. Čím je vnútorná taktovacia frekvencia vyššia, tým rýchlejšie procesor pracuje. Samozrejmým dôsledkom tejto činnosti je tiež vyššie zahrievanie procesora, takže sa musí dostatočne chladiť. Kvôli úmerne sa zvyšujúcej teplote nie je možné taktovať procesor do nekonečna. Vonkajšia frekvencia určuje rytmus práce čipových súprav a periférnych zariadení na základnej doske. Tieto obvody však pracujú pomalšie než procesor. Základné dosky umožňujú vybrať si niekoľko rýchlostí pre prácu zbernice čo je práve vonkajšia frekvencia (napr. najstaršie 16.6, 20, 25, 33.3 MHz, staré 50, 60 a 66.6 MHz, staršia 100 MHz stále žijúca 133.3 MHz alebo nové 166.6 a 200 MHz, ako aj pripravované 233.3, 250 či 266.6 MHz). Ale základná doska obsahuje len jeden časovací obvod, ktorý generuje aj vnútornú taktovaciu frekvenciu jadra procesora. Preto je vnútorná frekvencia procesora násobkom vonkajšej frekvencie zbernice, lebo je aj rýchlejšia. Napr. Intel Pentium 4 HT Prescott získa svoju vnútornú pracovnú frekvenciu 3.200 GHz z vonkajšej frekvencie zbernice 200 MHz násobiteľom 16, nakoľko 16x200 MHz = 3.200 GHz, alebo analogicky AMD Athlon XP Barton 2800+ pracujúci na reálnej frekvencii 2.0833 GHz pracuje so zbernicou 166.66 MHz a s násobiteľom 12.5 a preto 166.66x12.5 = 2083.33 MHz... Stále vyššie taktovanie procesov si vyžiadali internú pamäť cache, a tým i nutnosť prispôsobenia prístupovej doby pamäte, kde sú ukladané výsledky spracované procesorom. Konvenčná operačná pamäť vďaka vysokej prístupovej dobe (v počiatkoch stovky a desiatky ns – nanosekúnd, dnes len niekoľko ns) však zďaleka nestačí procesorom a tak je nutné niektoré výsledky dočasne uchovávať v tzv. internej pamäti cache prvej úrovne (Level 1 cache), ktorá je súčasťou procesora. Cache pamäť teda slúži k rýchlemu a neustálemu zásobovaniu procesora dátami zo zbernice. Cache načíta zo zbernice viac údajov, ktoré tam potom čakajú. Akonáhle ich procesor potrebuje, resp. môže s nimi začať pracovať, z cache si ich načíta. Pretože cache pracuje niekoľkonásobne rýchlejšie ako zbernica, nemusí procesor čakať. Cache sa člení na niekoľko úrovní, čím vyššia úroveň, tým má obvykle cache väčšiu kapacitu, je ale tiež pomalšia. Bežné
3
procesory majú dnes obvykle dve úrovne (level 1 - L1 a level 2 - L2), verzie pre servery a pracovné stanice potom často tri. Tretia a druhá úroveň sú väčšinou unifikované, ukladajú sa do nich inštrukcie i dáta. Prvá úroveň je už rozdelená na cache pre inštrukcie a pre dáta. Dôvodom je mechanizmus preddekódovania inštrukcií. Prvýkrát mala L1 cache veľkosť 8 kB. Neskoršie mala pamäť L1 cache už veľkosť 16 kB, z toho 8 kB pre dáta a 8 kB pre inštrukcie. Pri novších typoch procesorov sa veľkosť tejto pamäte zväčšovala až na 128 kB (64 kB pre dáta a 64 kB pre inštrukcie), no jej rapídnemu zväčšovaniu bráni vysoká cena a prácnosť pri návrhu takéhoto procesora. Ako bolo uvedené, od pamäte L1 cache sa odlišuje pamäť L2 či L3 cache, ktorá slúži tým istým účelom (skrátenie prístupovej doby k operačnej pamäti počítača a zefektívnenie jeho práce), konštrukčne však vychádza z iných princípov. Všeobecne má cache pamäť podstatne menšiu kapacitu (64-128 kB pri L1 až 1-2 MB pri L2) ako operačná pamäť a je realizovaná pomocou rýchlych statických pamätí. Jej zvýšenie nad 1-2 MB pri destopoch prakticky nie je účinné a nijako zvlášť nezvyšuje výkon. Adresovanie – je určitý mechanizmus, ktorým si procesor špecifikuje adresy v pamäti, v ktorých sú uložené práve zpracovávané dáta. Adresy sú poradové čísla jednotlivých miest (buniek) operačnej pamäte. Adresy umožňujú určiť, kde je určitá informácia v pamäti uložená. Vonkajšia adresa inštrukcie je adresa pamäťovej bunky, v ktorej je daná inštrukcia uložená, zatiaľčo vnútorná adresa inštrukcie je adresa, v ktorej je uložený operand, s ktorým bude daná inštrukcia pracovať. Ďalším parametrom je veľkosť adresovateľnej pamäte, ktorá udáva veľkosť operačnej pamäte, ktorú je procesor schopný používať. V programe býva táto hodnota zadaná ako logická (virtuálna) adresa. Táto virtuálna adresa sa potom určitým mechanizmom, ktorý je závislý na konkrétnom type procesora, postupne prepočítava na tzv. fyzickú adresu, ktorá je adresou poukazujúcou na konkrétnu pamäťovú bunku v operačnej pamäti. Už procesor Intel 80386 s 32 bitovou adresovou i dátovou zbernicou dokázal adresovať veľkosť pamäte 4 GB. Táto veľkosť priamo súvisí so šírkou adresovej zbernice procesora, preto napr. procesor 80286 s 24 bitovou adresovou a 16 bitovou dátovou zbernicou dokázal adresovať l6 MB pamäte, procesor 8086 s 20 bitovou adresovou zbernicou mal veľkosť adresovateľnej pamäte 1 MB a pri 16 bitovej adresovej zbernici to je len 64 kB. Dnešné 32-bitové procesory dokážu adresovať nie 4 GB pamäte (232 B = 4 GB), ale až 64 GB RAM vďaka rozšírenému adresovaniu (Page Size Extension) na 36 bitov (236 B = 65 536 MB = 64 GB). Register - procesor pracuje s dátami a inštrukciami, ktoré sú uložené v pamäti umiestnenej mimo procesor. Ale dáta, ktoré procesor aktuálne zpracováva, si musí uložiť do svojej vnútornej pamäti, do registru. Počet registrov se u jednotlivých procesorov líši. Obecne sa registre používajú ako časti procesora, radičov a riadiacich jednotiek vstupných a výstupných zariadení. Z toho vyplýva požiadavka, aby rýchlosť výmeny informácií v nich bola v súlade s pracovným kmitočtom uvedených zariadení. Staršie procesory používali sekvenčné spracovanie inštrukcií, tzn. inštrukcie sa spracovávali postupne jedna po druhej. Posledným z procesorov, ktoré toto riešenie využívali bol procesor 80486. Moderné procesory využívajú superskalárnu architektúru, ktorá dokáže spracovávať niekoľko inštrukcií naraz. Toto je možné dosiahnuť niekoľkými spôsobmi. Asi najlepšie riešenie je taký návrh procesora, pri ktorom môžu jeho jednotlivé časti pracovať nezávisle na sebe. V praxi však takéto riešenie nie je jednoduché (problémy s prístupmi viacerých jednotiek do pamäte a práca s dátami, problémy so stavovými registrami a iné), a preto takéto procesory bývajú konštrukčne veľmi zložité (špeciálne porovnávacie obvody, množstvo dátových a stavových registrov a iné). Superskalárnosť možno dosiahnuť zdvojením niektorých funkčných
4
celkov, využíva ju hlavne Pentium. Druhou možnosťou je premyslený návrh procesora, vďaka ktorému môžu jednotlivé celky pracovať nezávisle na sebe (predovšetkým Power PC). Ale ani superskalárny procesor nemôže spracovávať inštrukcie paralelne, pokiaľ pracujú dve inštrukcie, z ktorých jedna pripravuje údaje pre druhú, v tom prípade sa zase pracuje sekvenčne. Ďalšou možnosťou je pipeling. Jedná sa o možnosť, keď aj nesuperskalárne procesory môžu spracovávať viac inštrukcií naraz. Spracovávanie každej inštrukcie sa rozloží na niekoľko fáz. Akonáhle je jedna fáza hotová, postúpi inštrukcia do ďalšej fázy. Uvolnenú fázu začne využívať jiná inštrukcia. Jednotka správy pamäte sa nachádza medzi adresami, ktoré generuje program, a skutočnými adresami v operačnej pamäti. Jednotka mení adresy tak, ako to momentálne vyzerá nejvýhodnejšie pre operačný systém. Hlavním dôvodom pre preklad adries je lepšie využitie operačnej pamäte. Jednotka tiež zaisťuje zabezpečenie ochrany pamäte. V modernom operačnom systéme pracuje zároveň niekoľko programov (tzv. multitasking) i samotný OS. Jednotka správy pamäte musí zabrániť každému programu v narušení činnosti ostatných programov alebo aj samotného OS. Dva programy nemôžu súčasne využívať rovnakú adresu pamäte. Aby bolo splnené pravidlo jednotky, že dva programy nemôžu súčasne využívať rovnakú adresu, majú procesory dva režimy práce : • •
systémový – nekladie obmedzenia, povolené je všetko uživatelský – povolené je to, čo umožní program bežiaci v systémovom režime.
Jednotka s ním spolupracuje, takže môže uživateľským programomm brániť vo vykonávaní chybných operácií. Systémové prerušenie je signál, ktorý vyšle k procesoru program či niektoré hardwarové zariadenie. Odosieľateľ tohoto signálu sa snaží zabrať procesor pre seba. Napr. keď stisnete klávesu na klávesnici, procesor preruší doterajšiu činnosť a daný povel, ktorý "priniesol" signál, spracuje. Všetky modernejšie procesory obsahujú vektorový systém prerušení. To znamená, že každé prerušenie je identifikované svojim číslom. Na určitom mieste v operačnej pamäti je uložená tabuľka vektorov prerušení. Vektor prerušení, identifikovaný číslom prerušení, ukazuje na adresu v pamäti, kde je uložený obslužný podprogram prerušení. To znamená, že prvom prerušení spustí cez prvý vektor prerušenia prvý program, ktorý spracuje zdroje prerušenia. Pred skokom na vektor prerušenia uloží procesor svoj momentálny stav do špeciálneho zásobníka - registra. Umožní mu to vrátiť sa po spracovaní prerušenia späť k pôvodnej činnosti. Výhodou vektorového prerušovacieho systému je možnosť nahradenia obslužného programu prerušení programom vlastným. Procesor musí obsahovať aj mechanismus, ktorý prerušenie dočasne zakáže. V období 32 bitových obvodov sa objavili dve súperiace koncepcie RISC a CISC. RISC znamená Reduced Instruction Set Computer a CISC znamená Complete Instruction Set Computer. Rozdiel medzi obidvoma koncepciami nie je malý. Inštrukčná súprava moderných mikroprocesorov (od Pentia vyššie) je natoľko komplikovaná, že v podstate nie je možné vytvoriť priamy logický obvod, ktorý by tieto inštrukcie dokázal interpretovať. Mikroprocesory s kompletnou inštrukčnou súpravou (CISC) preto pracujú ako dvojúrovňové obvody - jadrom mikroprocesora je logický obvod, ktorý dokáže spracovať súpravu pomerne jednoduchých mikroinštrukcií a druhú úroveň tvorí program napísaný v mikroinštrukciách, ktorý zabezpečí interpretáciu skutočných inštrukcií mikroprocesora. Tvorcovia koncepcie RISC vychádzajú z predpokladu, že táto druhá úroveň je zbytočná. Ak máme veľmi výkonný logický obvod, ktorý dokáže spracovať nejakú súpravu inštrukcií (tj. mikroinštrukcie), nie je dôvod programovať
5
procesor s redukovanou inštrukčnou súpravou (RISC). Samozrejme jednu inštrukciu vykoná oveľa rýchlejšie ako procesor CISC (ktorý na vykonanie jednej inštrukcie musí prebehnúť celý program zložený z mikroinštrukcií). Navyše je procesor typu RISC oveľa jednoduchší, môže byť preto lacnejší a obyčajne pracuje aj na vyššej frekvencii. Nie je to však také jednoduché, ako by sa to zdalo. Procesory RISC disponujú veľmi nepohodlnou a obmedzenou inštrukčnou súpravou. Hoci dnes málokto programuje v assembleri, táto skutočnosť sa prejaví vo veľkosti a optimalizácii všetkých programov. Ak na vykonanie nejakej úlohy máme pri procesore CISC k dispozícii jednu inštrukciu, ktorá pri moderných procesoroch zaberie jeden hodinový takt, pri RISC procesore musíme použiť celý súbor inštrukcií, a tak sa nám hlavná výhoda procesorov RISC začína akosi strácať. Teraz sme sa dotkli práve vlastnosti, ktorá sa objavila prvýkrát pri procesore Pentium, čo je procesor CISC, ktorý disponuje niektorými prvkami architektúry RISC (najčastejšie inštrukcie zabezpečuje priamo logický obvod a nie mikroprogram a iné). Ukazuje sa, že práve táto cesta je najviac perspektívna. Už procesor 80486 bol vyhotovený tak, aby niektoré inštrukcie trvali iba jeden cyklus. Procesor je v zásade primitívne zariadenie, ktoré nevie nič iného než extrémne rýchlo počítať (aj to len v dvojkovej sústave, t.j. rozoznať 0 a 1), prípadne robiť iné špecifické úlohy ako hlásiť svoju teplotu a pod. Pretože jeho prezentácia v inteligenčnom kvociente IQ by bola zhruba okolo nuly, je procesor tak hlúpy a nemysliaci, že preň musí existovať presne definované príkazy. Týmto príkazom sa hovorí sada inštrukcií a v prípade procesorov pre platformu PC (Intel & AMD) ich dnes existuje hneď niekoľko. Tá základná sa nazýva x86 a sú to inštrukcie pre výpočty (sčítanie, odčítanie, násobenie a delenie bezo zvyšku) v obore celých čísel. Prvé procesory podporovali len túto jedinú inštrukčnú sadu. Pretože sada x86 nepodporuje prácu s desatinnými číslami, bolo čoskoro nutné pridať ďalšiu sadu inštrukcií. Tou sadou bola x87. Hlavným dôvodom jej pridania nebolo ani tak to, že by nešlo počítať s desatinnými číslami - operácie šli totiž emulovať na celých číslach a tak to dokonca robil napríklad aj programovací jazyk Pascal ale fakt, že špecifické inštrukcie a pre ne optimalizované časti procesora (matematický koprocesor) dokázali tieto operácie vykonávať omnoho rýchlejšie. Ak vynecháme rozšírenie sady x86 o operácie s 32 bitovými číslami (zavedené s procesorom 80386), bolo ďalším posunom vpred zavedenie tzv. SIMD operácií. Skratka SIMD znamená Single Instruction - Multiple Data (jedna inštrukcia - viac dát). Bežné inštrukčné sady x86 a x87 sú schopné pomocou jednej inštrukcie vypočítať len jednu informáciu (údaj). Dáta sa načítajú do pamäte nazvanej register (značené EAX, EBX...) a potom sa vykoná operácia, ktorá tieto dáta zmení. Do jedného registra je možné nahrať len jednu informáciu (jedno číslo), preto i vykonaná operácia upravuje len toto jedno číslo. SIMD operácie spočívajú v tom, že do jedného registra sa nahrá viac než jedna informácia (viac než jedny dáta). Na takto "poskladanom" registri sa potom prevedie operácia, ktorá zmení všetky dáta naraz. Napríklad: do registra sa uložia štyri čísla – 20, 37, 11 a 99, potom sa vykoná operácia pripočítania čísla 5. Výsledkom budú čísla 25, 42, 16 a 104. Keby sa táto operácia mala vykonať cez inštrukčnú sadu x86, boli by potrebné až štyri inštrukcie. A vykonanie štyroch inštrukcií bude pochopiteľne trvať dlhšie. Z tohoto popisu je zrejmé, že SIMD operácie nemožno využiť vždy, ale len v prípade, keď sú na veľkých blokoch dát vykonávané stále rovnaké operácie. To je v praxi predovšetkým v multimédiách. Vôbec prvými SIMD inštrukciami implementovanými v Intel kompatibilných procesoroch bola inštrukčná sada MMX, prvý krát v procesore Pentium MMX a neskôr v Pentiu II. Nasledovala sada 3Dnow! (v procesoroch od AMD K6, K6-2, K6-2+, K6-III a K6-III+). Ďalšie SIMD inštrukčné sady využiteľné hlavne v multimédiách, ale aj iných aplikáciách stereotypne vykonávajúcich rovnaké operácie na veľkom množstve dát (či už v procesoroch Intelu alebo AMD) spájali predchádzajúce sady, ale i prinášali svoje zdokonalenia: 6
SSE – spája inštrukčnú sadu MMX zdokonalenú na MMX2 a novú KNI, prvý krát sa objavila v Pentiách III, advanced 3Dnow! – spája a zdokonaľuje sadu 3Dnow! a 3Dnow!+ obohatenú o MMX zdokonalenú na MMX+ a ďalšie vylepšenia, prvý krát sa objavila s Athlonmi K7 a K75, SSE2 – radikálne nová SIMD inštrukčná sada, prvý krát sa objavila v Pentiách 4 Willamette a NorthWood 3Dnow! Professional – veľmi pokročilá komplexná SIMD inštrukčná súprava spájajúca advanced 3Dnow! a SSE, prvý krát sa objavila s príchodom Athlonu XP (všetky typy jadra CPU), SSE3 – nová SIMD inštrukčná sada pozostávajúca z 13 nových PNI inštrukcií, prvý krát sa objavila s príchodom nového procesora Pentium 4 Prescott, x86-64 – nová inštrukčná sada pre 64 bitové procesory, prvý krát sa objavila s príchodom nových procesorov K8 – Athlonu 64 a Opteronu. Okrem všetkých týchto inštrukčných súprav s novými procesormi pribúdali aj samostatné nové inštrukcie, napríklad CMPXCHG - Compare and Exchange (porovnaj a vymeň) - bola pridaná v procesore 80486, alebo Pentium Pro ich prinieslo 10 naviac oproti Pentiu (návrhárom sa asi počet 10 inštrukcií zdal málo na to, aby pre ne vymysleli názov a brali ich za inštrukčnú súpravu). Vždy sa viac menej jednalo o inštrukcie, ktoré zrýchľujú stávajúce operácie vyjadrené viacerými staršími inštrukciami. Základnou jednotkou spracovania inštrukcií je thread (vlákno). Programy samy o sebe sú vlastne sekvencie inštrukcií a k nim príslušných dát. Inštrukcie sú vykonávané v tom poradí, ako boli napísané. Každá inštrukcia vykonáva operácie s dátami, z čoho potom vychádzajú výsledky (iné dáta). Podľa výsledkov sa potom obvykle určuje, čo sa bude počítať ďalej. Ako thread si môžeme, pri určitom zjednodušení, predstaviť istú sekvenciu inštrukcií, nejaký výpočet, do ktorého sa uložia vstupné dáta a ktorý poskytne výstupné dáta, ako jeden program. Procesor na to, aby mohol počítať, musí mať nejaké inštrukcie a dáta. Tieto informácie získa procesor z pamäti počítača. Pamäť je pripojená do čipovej sady a čipová sada potom spojená pomocou zbernice Front Side Bus – FSB do procesora. Z FSB putujú dáta obvykle do veľmi rýchlej pamäte cache. Akonáhle inštrukcie dorazia do L1 cache, putujú ďalej do inštrukčného dekóderu. Ten prevádza inštrukcie sád x86, x87, SSE, 3Dnow! atď. na vnútorné inštrukcie procesora zvané µOPs. Výpočtové časti procesora nerozumejú inštrukciám zo súprav x86, x87 ..., len týmto dekódovaným a predpripraveným µOPs. Sú to vlastne mikro-inštukcie pevnej dĺžky (inštrukcie x86 môžu byť rôzne dlhé), ktoré určuju presné chovanie výpočtovej jednotky. Jedna inštrukcia x86 môže byť prevedená na jednu až niekoľko desiatok µOPs, podľa zložitosti operácie. Napríklad také zvýšenie hodnoty v registri o jednotku je omnoho jednoduchšou operáciou ako celočíselné delenie. Odhad vetvenia kódu - dekóder inštrukcií pri svojej činnosti využíva preddekódovanie a tzv. Branch Prediction Table. Ide o to, že v programe sú často podmienkové skoky. Keď je výsledok nejakej operácie taký, uskutoční sa jeden kód, keď onaký, uskutoční sa iný kód. Pretože inštrukcie sú vnútorne v procesore vykonávané v inom poradí, než sú v programu za sebou (tzv. out-of-order), je možné obísť čakanie na dáta, urýchliť výpočet spočítaním subvýpočtov naraz (1+2+3+4 bude trvať dva výpočtové cykly, pretože sa najprv sčíta súčasne 1+2 a 3+4 a potom výsledky - tým sa ušetrí jeden cyklus) alebo dokonca začať počítať kód, ktorý nasleduje až po podmienkovom skoku. Procesor odhadne, aký asi bude výsledok podmienky ešte predtým, než ju skutočne vypočíta, a rovno začne počítať tú vetvu kódu, o ktorej si myslí, že je tá správna a bude nasledovať. Aby mohol dekóder tieto odhady uskutočňovať, musí priebežne sledovať tok inštrukcií a odhadnúť tak, ako sa bude program ďalej vyvíjať.
7
Sledovanie toku inštrukcií sa uskutočňuje tak, že inštrukcie sú dekódované, ale nie sú tvorené µOPs, ale záznamami v Branch Prediction Table – tabuľke predpovedania inštrukcií. µOPs ďalej putujú do Instruction Control Unit – jednotky správy inštrukcií, kde ich môže byť naraz uložených až niekoľko desiatok. Toto je akási rozdeľovacia jednotka, ktorá určuje poradie vykonávania µOPs za sebou a ich pridelenie výpočtovým jednotkám ALU (Aritmetic Logic Unit) a FPU (Floating Point Unit). ALU sa zaoberá výpočtami s celými číslami. FPU naproti tomu znamená počíta s desatinnými číslami, poprípade so SIMD inštrukciami (MMX, 3Dnow!, SSE atd.). Napr. procesor Athlon počnúc generáciou K7 má strojenú jednotku ALU a tiež strojenú jednotku FPU, ktorá je však funkčne diferencovaná: prvá časť FPU slúži čisto pre reálne x87 inštrukcie, druhá časť pre SIMD inštrukcie a tretia slúži na ukladanie. Z Instruction Control Unit sú µOPs zaslané do Integer Scheduler (obsluhuje jednotky ALU) alebo do FPU Scheduler (obsluhuje jednotky FPU). Scheduler sa stará už o samotné prideľovanie µOPs jednotlivým výpočtovým jednotkám. µOPs sú pokiaľ možno prideľované tak, aby sa maximálne využil potenciál jednotlivých výpočtových jednotiek, tj. aby ich v jeden okamžik pracovalo čo najviac. Jednotlivé výpočtové jednotky už vykonajú požadované operácie prikázané jednotlivými µOPs. Pri tom pristupujú do dátovej L1 cache, odkiaľ si berú (a kam ukladajú) dáta. Čo sa týka výroby procesorov, dnešné dve firmy AMD a Intel používajú tie isté postupy a technológie, avšak s rôznou efektívnosťou. Procesor je mozgom počítača, zpracováva dáta a tiež určuje výkon a podľa výkonu i cenu počítača. Procesor, sa skládá z miliónov maličkých tranzistorov, ktoré sú vytvorené fotografickou cestou na kremíkovom plátku veľkosti zhruba nechtu malíčku (1 až 2 cm2 ± autobus). V skutočnosti sa vyrába niekoľko stoviek až tisíc procesorov naraz na kremíkových kruhových platniach priemeru cca 20 až 30 cm – tzv. wafferoch. Ak si niekto kladie otázku, prečo majú waffery kruhový tvar (predsa na štvorcových by bolo oveľa menej odpadu), treba odpovedať na otázku čo sú vlastne waffery a ako sa vyrábajú. Základom úspechu je v ultra-čistých podmienkach „vypestovať“ monokryštál kremíka, ktorý má zvonovitý tvar. Takto získaný monokryštál sa horizontálne nareže na platne, ktorých povrch sa ešte v ultra-čistejších podmienkach fyzikálne aj Porovnanie 200 mm waferu firmy AMD s najnovšími jadrami CPU a 300 chemicky upravuje a vzniká mm waferu firmy Intel so svojimi procesormi. „surový“ waffer. Tranzistory tvoria klopné obvody, ktoré sa vedia nastaviť do dvoch polôh – nula a jedna, vedie – nevedie elektrický prúd. Niektoré z tranzistorov slúžia na ukladanie hodnôt, iné vykonávajú matematické operácie, ďalšie logické operácie atď. Celkom je v procesoroch od niekoľko tisíc tranzistorov v počiatkoch až po desiatky miliónov tranzistorov v súčasnosti. AMD vyrába procesory z 200 mm waferov, zatiaľčo Intel používá výnosnejšie 300 mm wafery. Z toho tiež vyplýva nevýhoda pre AMD a i vyššie ceny pre užívateľov. Bohužiaľ prechod na dokonalejšiu a náročnejšiu výrobnú technológiu sa AMD zatiaľ nedarí. AMD dokáže z 200 mm
8
waferu vyrobiť rádovo 100 až 200 jadier procesorov. To je dané celkovou plochou waferu a veľkosťou jadra CPU, ďalej technickým odpadom pri výrobe, ktorý je v priemere asi 18%. Do predaja sa dostane, po všetkých testoch, len asi 70% vyrobených procesorov. Firma Intel využívá na produkciu procesorov 300 mm wafery. Tým dochádza k zväčšeniu produkcie na 2.25 až 2.5 násobok. Toto se tiež odráža v celkovej produkci továrne a výslednej cene procesorov, ktorá sa oproti 200 mm waferom zníži o 30%. S prechodom na vyspelejšie technológie : 0.5 µm ,0.35 µm, 0.25 µm, 0.18 µm, stále žijúca 0.13 µm, terajšia 0.09 a budúca 0.065 µm sa môže zmenšiť plocha jadra CPU a tým opäť zvýšiť využiteľnosť plochy wafferov, znížiť produkciu odpadu a tým i cenu.
9
Začiatky : 4004 – 80186
V
ýrobu a predaj procesorov možno datovať do začiatku sedemdesiatych rokov. Najprv
boli procesory využívané vo sfére rutinných výpočtov v nenápadných oblastiach alebo naopak vo vedeckých a armádnych kruhoch (to všetko samozrejme ostalo dodnes), neskôr s formovaním platformy PC začiatkom osemdesiatych rokov bolo cieľom vytvoriť systém, ktorý by sa mohol uplatniť aj v podnikovej sfére, neskôr dokonca aj v domácnostiach (odtiaľ pomenovanie PC - Personal Computer, čiže osobný počítač). História procesorov je z dnešného retrospektívneho pohľadu do minulosti plná súťaženia a zavádzania nových technológií. Úplné počiatky tvoria 4-bitové procesory, vývoj pokračaval s 8-bitovými a 16bitovými, pred pätnástimi rokmi prišli 32-bitové, ktoré sa v domácnostiach používajú dodnes, vo sfére pracovných staníc a serverov sa používajú už 64-bitové procesory, ktoré za niekoľko rokov pravdepodobne preniknú aj k bežným užívateľom a vytlačia terajších 32-bitových kráľov. Súčasne s príchodom rýchlejších mnoho-bitových počítačov sa vyvíjali aj operačné systémy a aplikácie určené pre takéto počítače.
Priekopník Intel 4004
8-bitový Intel 8008
História začína už v roku 1968, keď firma Intel prevzala objednávku od japonskej spoločnosti BusiCom, ktorá sa zaoberela vývojom, výrobou a predajom kalkulačiek. Intel mal podľa dohody vyvinúť súpravu 12 čipov, ktoré by BusiComu umožnili skonštuovať jednoduchšiu a lacnejšiu kalkulačku. Tedovi Hoffovi, inžinierovi Intelu, sa tento nápad nezdal byť efektívny, jeho riešenie bolo zjednodušiť dizajn vytvoriť programovateľný procesor. Spolu s Federicom Fagginom a Stanom Mazorom vytvoril čip obsahujúci vlastnú pamäť ROM, v ktorej bol uložený program, pamäť RAM pre spracovávanie dát, vstupno-výstupné zariadenie a nemenovanú 4-bitovú 10
procesnú jednotku, čo sa zapísalo do histórie ako mikroprocesor Intel 4004. Idea umiestniť všetky potrebné obvody (logické, numerické, pamäťové) potrebné na vykonávanie inštrukcií do jedného malého obvodu, bola viac ako revolučná. Intel čip a kompletnú čipovú súpravu aj vyvinul, ale v čase, keď bol čip hotový, spoločnosť BusiCom oň stratila záujem, a tak sa v Inteli rozhodli poskytnúť novinku ostatným výrobcom. Na konci roku 1971 firma Intel predstavila túto
Prvý 16-bitový Intel 8088 Intel 8080
svoju novinku, z ktorej sa stal už spomínaný prvý mikroprocesor 4004. Dnes sa to zdá smiešne, ale tento 4-bitový procesor mal frekvenciu 108 kHz, obsahoval 2 300 tranzistorov, vykonal 60 000 inštrukcií za sekundu (t.j. výkonovo bol porovnateľný s veľkopodlažným ENIAC-om z roku 1946), vyrábal sa 10 µm technológiou a samotné tranzostory zaberali plochu len 4 mm2!!! Po ňom (v roku 1972) nasledoval plnohodnotný rýchlejší 8-bitový procesor 8008 s frekvenciou 200 kHz – ten už vedel spracovávať alfanumerické znaky, na rozdiel od čisto numerického 4004. Tieto procesory sa používali spočiatku najmä v kalkulačkách alebo pri riadení svetelnej signalizácie. V roku 1971 sme zaznamenali vynález EPROM (erasable programmable read-only memory), čiže prepisovateľnej ROM pamäte, čo v praxi znamenalo, že sa dal meniť program procesora , veľmi pridal na jeho praktickosti a mnohostrannosti (predtým sa dal použiť len do kalkulaček či iných „primitývnych“ zariadení). Prvý procesor použitý v osobnom počítači Altair 8800 firmy MITS (pre neho páni Bill Gates a Paul Allen vyvinuli jazyk Basic) bol označený 8080 a bol vyrobený prvý krát v roku 1974, kedy stál 395 USD. Pracoval už na frekvencii 2000 kHz = 2 MHz, obsahoval 6 000 tranzistorov a bol asi 5 krát rýchlejší ako jeho predchodca. Dokázal adresovať 64 kB pamäte RAM a vykonal 290 000 inštrukcií za sekundu. V roku 1980 stál už iba 5 USD. Po čase bol nahradený zdokonaleným typom Intel 8080A. Tento procesor bol vyrábaný s použitím technológie MOS-N, ktorá odštartovala vznik procesorov druhej generácie, ktoré boli asi 10 krát rýchlejšie ako celkom prvé procesory, mali už oddelenú dátovú a adresovú zbermnicu a zdokonalené inštrukčné súpravy. V roku 1976 sa objavuje procesor 8085, ktorý sa ale na trhu neudržal. Vývojový tím, ktorý tieto mikroprocesory dovtedy vyvíjal, odišiel a založil spoločnosť 11
Legendy : prvý 4-biťák Intel 4004 a prvý 8-biťák Intel 8008 z rokov 1971 a 1972 v plnej nádhere
Zilog, kde vytvoril vlastný mikroprocesor Zilog Z- 80. Ten bol na svoju dobu výrazne lepší ako jeho konkurenti, takže sme ho mohli nájsť v niektorých jednoduchších zariadeniach, ako sú niektoré automatické práčky, jednoduchšie kopírky, lacné tlačiarne, hračky a iné. (Zilog Z-80 využival aj slávny mikropočítač Sinclair ZX-Spectrum). Už na konci sedemdesiatych rokov bolo technicky možné prejsť na 16-bitové procesory. V roku 1978 nasledoval teda 16-bitový procesor (počas jednej inštrukcie dokázal spracovať maximálne 16 bitové číslo) 8086 s 29 000 tranzistormi, frekvenciou od 5 cez 6, 8 po 10 MHz a procesor disponoval 16 bitovou dátovou zbernicou, 20 bitovou adresovou zbernicou, pomocou ktorej dokázal adresovať pamäťový priestor s maximálnou kapacitou 1 MB fyzickej pamäte, čo boli na tú dobu obdivuhodné parametre - nikto totiž nepredpokladal, že bude niekedy treba viac ako 1 024 kB = 1 MB operačnej pamäte, štandardom bolo vtedy 16 až 64 kB pamäte. Procesor 8086 bol v podstate upravený a vylepšený Zilog Z-80 na 16-bitové slovo. K prednostiam procesora 8086 patrilo dlhšie slovo a rozšírenie inštrukčného súboru najmä o aritmetické a reťazcové operácie. Spoločnosti Intel k úspechu jednoznačne pomohla strategická spolupráca s firmou IBM, ktorá neskôr definovala a postavila štandard PC platformy 80x86 práve na procesoroch od formy Intel. Procesor 8086 si možno niekto pamätá z prvých osobných počítačov firmy IBM (Veľkej modrej) označených ako IBM PC používajúcich operačný systém v tej dobe neznámej firmy Microsoft. Začal sa preferovať trend architektúry počítača, ktorá umožňovala
Legenda pokračuje : 8-biťák Intel 8085 (základ pre Zilog Z-80) a prvý 16-biťák Intel 8086 (základ prvého PC) z rokov 1976 a 1978 v plnej nádhere 12
jednoduché rozširovanie možností a výkonu počítača. Od tejto doby sa začalo týmto počítačom hovoriť IBM PC kompatibilné. Tu sa začína písať známejšia časť histórie, keď sa firma Intel stala lídrom na trhu práve sa formujúcej platformy PC. 8086 bol však veľmi drahý, preto v roku 1979 Intel uvádza jeho modifikáciu - model 8088 ako cenovo dostupnejšiu verziu 8086-tky. Procesor 8088 bol onen priekopník, používal len 8-bitovú dátovú zbernicu, koprocesor 8087 a pracoval na frekvencii 4.77 MHz. Potom v roku 1980 spoločnosti Intel nevyšiel zámer s pomerne vyspelými procesormi 80186 a 80188 vyrábanými v 8- a 16-bitovej verzii 1 µm technológiou potom, čo o ne trh navzdory tomu neprejavil väčší záujem a začali sa používať do spotrebnej elektroniky. Tieto procesory boli pokračovatelia procesorov 8086 a 8088 z roku 1978 a 1979, používali výkonnejší mikrokód a mali aj vyšší výkon. Pôvodne vyrábaný počítač IBM PC s procesorom 8088 bol rozšírený o ďalšie programové a hlavne technické možnosti. Pre odlíšenie bol označovaný ako IBM PC/XT (eXTended). Ďalší pokrok umožnil výrobu výkonnejších počítačov (s nasledujúcimi generáciami procesorov) označovaných ako IBM PC/AT (Advanced Technology). Počítače PC/AT tak mali niekoľkonásobne vyšší výkon ako počítače PC a PC/XT so starším procesorom 8088.
13
80286 – 80486 roku
1982 bol uvedený na trh na tú dobu ozaj revolučný procesor 80286 s 134 000 tranzistormi, luxusnou inštrukčnou sadou a frekvenciou od 8 cez 10 po 12.5 MHz. Rýchlosť tohoto procesora bola asi 3- až 6-násobná oproti prevratnému procesoru 8086 z roku Revolúcia v PC : Intel 80286 zvnútra a zvonka 1978, bol dokonca schopný podporovať multitasking, dovoľoval 24 bitové adresovanie pre 16 MB reálnej pamäte a ako prvý aj 30 bitové adresovanie pre 1 GB virtuálnej pamäte a bežať v reálnom či chránenom režime (je obdivuhodné, na čo všetko sa vtedy myslelo - operačná pamäť bola vtedy do 640 kB konvenčnej pamäte (isto sa teraz môžeme len pousmiať nad výrokom Billa Gatesa „640 kB ought be enough for everyone – 640 kB operačnej pamäte by malo stačiť každému“) a žiadny operačný systém tej doby multitasking nepodporoval). Na druhej strane je faktom, že na začiatku 80-tych rokov bolo 640 kB postačujúcich. V priebehu svojej éry sa frekvencia vyšplhala až do výšky 16.66 MHz a 80286-tka sa stala menším revolučným medzníkom.
V
Procesor Intel 80386 DX zvrchu a zospodu
Intel 80386 DX pod drobnohľadom
V októbri roku 1985 bol uvedený prevratný následník procesora 80286, a to už 32-bitový procesor Intel 80386 DX (dátová i adresová zbernica boli 32-bitové) s frekvenciou od pôvodných 16.6 MHz cez 20, 25 až po 33.3 MHz a neskôr nakoniec 40 MHz (33.3 MHz verzia bola uvedená na trh v roku 1989). Tento procesor bol už schopný 32-bitovo adresovať 4 GB fyzickej a 46bitovo až neuveriteľných 64 TB (terabytov) = 65 536 GB virtuálnej pamäte (1 TB = 1 024 GB), samozrejme podporoval multitasking, obsahoval 275 000 tranzistorov, mohol tiež bežať vo virtuálnom režime a bol 2-krát rýchlejší než 80286 a asi 100-krát rýchlejší než pôvodný procesor 8008. Okrem toho to bol prvý procesor, ktorý používal reťazené spracovanie údajov (pipelined
14
instruction), ktoré dovolilo procesoru blokovo začať pracovať na ďalšej inštrukcii predtým, než sa dokončila predchádzajúca. Vyrábaný bol v puzdre PGA so 132 vývodmi. Tento procesor bol uvedený aj v iných variantoch, lacnejšia verzia SX so 16-bitovou dátovou zbernicou a verzia SL (s frekvenciou 20, 25 a 33.3 MHz), určená špeciálne pre prenosné počítače. Podľa predsavzatia Intelu bol procesor 80386 spätne kompatibilný s 80286, 80186 dokonca aj s 8086. V tej dobe stále neznáma firma Microsoft na čele s nevyštudovaným Billom Gatesom písala pre PC operačný systém MS DOS a Intel predal licenciu na výrobu procesorov takmer neznámym
Prvý Intel 80486 DX zvnútra
Prvý Intel 80486 DX na 25 MHz zvonka – zvrchu a „odhalený“ zospodu
firmám AMD a Cyrix, čo o desaťročie neskôr iste ľutovala. V apríli roku 1989 uviedla firma Intel na trh procesor Intel 80486 DX, ktorý bol asi 50krát rýchlejší ako revolučný procesor 8086, 2-krát rýchlejší ako 80386 na rovnakej frekvencii a obsahoval už 1.25 miliónov tranzistorov a tiež matematický koprocesor 80387 - jednotku pohyblivej či plávajúcej desatinnej čiarky (floating point unit FPU), ku 80386-tke bolo možné starší typ koprocesora dokúpiť, pracoval so zbernicou 20 až 50 MHz a vyžadoval napájanie voltážou 5 V. Skratka DX znamená, že interná frekvencia procesora je rovná externej frekvencii zbernice. Ku všetkému disponoval procesor 8 kB priamej cache pamäte, čo v podstatnej miere prispelo pipeline architektúre. Pamäť cache je tzv. vyrovnávacia pamäť a slúži na prispôsobavnie rýchlosti. Táto pamäť je totiž oveľa rýchlejšia zbernica medzi procesorom a operačnou pamäťou RAM a do nej sa popredu načítavajú vybrané dáta, ktoré si procesor potom len dočítava z tejto pamäte a nemusí čakať na pomalú zbernicu. Tiež existovala lacnejšia verzia tohoto procesora a síce Intel 80486 SX s 900 000 tranzistormi a 16.6 až 33.3 MHz zbernicou. 80486-tka má oficiálne prvenstvo aj v tom, že procesor bol od základu navrhnutý tak, aby bolo možné celý systém pomerne jednoducho modernizovať, bez nutnosti kupovať novú základnú dosku s úplne iným Socketom a napájaním (tzv.OverDrive technológia). Keď sme hovorili o spätnej kompatibilite otcov, dedov a pradedov 80286, 80186 a 8086, mali sme na mysli prevažne architektúrovú náväznosť. V marci 1992 prichádza ďalšie vydanie 486-tky a síce Intel 80486 DX2 s 1.4 miliónmi tranzistorov, napájaním 5 V a zbernicou 20, 25 a 33.3 MHz, ktorý bol postupne uvedený z
15
frekvencie 40 MHz cez 50, 66.6 po 75 MHz. Podobne skratka DX2 tu znamená, že interná frekvencia procesora je rovná dvojnásobku externej frekvencii zbernice, takže práve v tom čase začal Intel využívať v konštrukcii tohto procesora trik s násobením frekvencie. Išlo o to, že vo vnútri procesora sa nachádzalo zariadenie, ktoré frekvenciu systémovej zbernice FSB vynásobilo príslušnou hodnotou a takýto procesor mohol interne pracovať na niekoľkonásobnej frekvencii. Dodajme, že procesory doteraz nepotrebovali aktívne chladenie (jedine pasívne alebo dokonca stačilo chladenie vnútra skrinky), čo sa zmenilo po príchode posledného exemplára tejto štvrtej generácie procesorov. Intel 80486 DX4 s 1.6 miliónmi tranzistorov na čipe a frekvenciou od 100 cez 120 po 133.3 MHz už musel byť aktívne chladený, pretože inak sa riskovala nielen softwarová nestabilita operačného systému, ale i hardwarové poškodenie samotného procesora. Intel 80486 DX4 pracoval na trojnásobnej frekvencii FSB, nie na štvornásobnej ako by nám analógia našepkala a vyžadoval napájanielen 3.3 V. Procesor disponoval samozrejme s 8 kB cache pamäte prvej úrovne (L1 – level 1).
Intel 486 SX
Intel 486 DX 20, 25, 33.3 a 40 MHz
Intel 486 DX2 50, 60, 66.6 a 75 MHz
Intel 486 DX4 100, 120 a 133.3 MHz
S nástupom 486-tiek sa presadil operačný systém MS DOS končiaci vo verzii 6.22, neskôr MS Windows 3.10 alebo 3.11 for workgroups, rozšírený o sieťové možnosti. Ako bolo uvedené, frekvencia procesora 80486 bola neskôr postupom času zvýšená z pôvodných 40 MHz až na 133.3 MHz. Avšak rovnako označené procesory ponúkali aj iné firmy z ktorých najvýznamnejšie boli AMD, Cyrix, alebo NexGen, napríklad Am4x86 séria AMD Am4x86 DX, Am4x86 DX2 a Am4x86 DX4 na frekvenciách 75, 100 a 120 MHz alebo tiež Am5x86 na 133.3 MHz. Už počínajúc modelom Am4x86 DX z roku 1989 začína oficiálny, otvorený, konkurenčný súboj večných rivalov Intelu a AMD. Procesory Am4x86 DX2 a Am4x86 DX4 z roku 1991 prelomili vtedajší monopol firmy Intel a obsahovali viac ako milión tranzistorov. Pomaly ale isto sa začína schyľovať k prevratnému nástupu piatej generácie mikroprocesorov označenej ako Pentium, ktorému bol schopný v počiatkoch posledný zástupca štvrtej generácie Am5x86 DX4 konkurovať ba čo viac, nebolo potrebné zakúpiť celkom novú základnú dosku, pretože dedo AMD Am5x86 na 133.3 MHz so svojou 33.3 MHz zbernicou, 16 kB L1 cache pamäťou a na doske pre Intel 80486 DX4 šliapal na päty originálnemu Intel Pentiu na 75 MHz. Aby sa spoločnosť Intel mohla odlíšiť od konkurencie, rozhodla sa procesor novej generácie označiť trochu inakšie. Rozhodovanie o novom mene nebolo vôbec jednoduché, pretože do propagácie procesorov 80286, 80386 a 80486 venovala firma nemalé prostriedky, a logickým pokračovateľom mal teda byť procesor 80586. Problém bol ale v tom, že meno by opäť mohli zadarmo využiť i konkurenčné firmy AMD a Cyrix. Nakoniec sa teda firma Intel rozhodla, že po prvýkrát vo svojej histórii označí svoj produkt inakšie než len číslom. Výberovým riadením (meno procesoru mohli okrem iného navrhnúť i všetci zamestnanci Intelu) nakoniec prešli traja kandidáti, a aj keď bol konečný výber niekoľkokrát zmenený, vyhralo nakoniec Pentium. I z tohto mena je vidno, že ide o procesor piatej generácie, a tak trochu pripomína názov 80586. Intel tak urobil kvôli prehranému súdnemu sporu s AMD zameranému na označovanie procesorov štrvtej a piatej generácie 80486 a 80586 a rozhodol sa brániť a odlišovať svoje
16
budúce procesory chráneným menom a preto procesory piatej generácie pomenoval Pentium. V dobe osemdesiatych a začiatkom deväťdesiatych rokov začína svoju revolúciu domáci herný priemysel. Pretože nové nastupujúce 32-bitové počítače platformy PC boli ešte veľmi drahé niet divu, že na trhu boli veľmi lacné 8-bitové počítače Sinclair, Atari alebo Commodore (starší si iste pamätajú Sinclair ZX Spectrum, Atari 800 alebo C64). Na prelome desaťročia (osemdesiate a deväťdesiate roky) prichádza na scénu firma Amiga, ktorá sa preslávila so svojimi 16-bitovými strojmi 500, 500+, neskôr 600 a 600+ či poslednou modelovou sériou 1200. Ďalej nehovoriac o nám známych a dnes viac ako archaických PMD, alebo Didaktiku... Skoro však všetky tieto alternatívne riešenia museli ustúpiť platforme PC, nakoľko počítače tejto platformy boli čím ďalej menšie, rýchlejšie, lacnejšie, všestrannejšie a „multimediálnejšie“.
17
80586 = Pentium (P5 & P54C) vs. K5
P
rielom nastal ku koncu marca v roku 1993, kedy Intel uviedol na trh novinku v podobe
32-bitového procesora v kombinácii CISC a RISC architektúry, ktorý teda nedostal oficiálny názov 80586 ale Pentium s kódovým označením P5 schopný tiež spracovať 16-bitový kód, najprv s frekvenciami 60, 66.6 MHz - tieto verzie sa k nám nedostali, boli vyrábené technológioiu 0.80 µm a neskôr 0.50 µm, navrhnuté boli pre Socket 4 obsahujúci 273 vývodov či nožičiek – pinov a pracovali s napätím až 5 V. Tieto modely mali frekvenciu FSB 60 alebo 66.6 MHz, neobsahovali teda žiadny násobič. Potom prvé Intel Intel Pentium nasleduje model na 75 MHz na báze technológie 0.35 µm Pentium P5 na 60 P54C na 75 MHz s 3.1 miliónmi tranzistorov. Táto verzia Pentia už bola MHz ako ho poznáme určená pre Socket 5 obsahujúci 320 pinov a nebol kompatibilný so Socketom 4. Pentium dostalo do vienka 16 kB L1 cache pamäte a procesor podporoval najprv 50 MHz zbernicu s násobiteľom 1.5, neskôr aj 60 a 66.6 MHz zbernicu. Cache pamäť bola rozdelená na 8 kB pre dátovú a 8 kB pre inštrukčnú. Aj napriek relatívne nízkej frekvencii v porovnaní s rýchlou 486-tkou DX4 na 133.3 MHz bolo Pentium so svojimi 75 MHz o niečo rýchlejšie, dôsledkom odlišnej a revolučnej superskalárnej architektúry, implementáciou dvojice výkonných jednotiek a rozšíreniu údajovej zbernice z 32 na 64 bitov, avšak oveľa prehriatejšie - prvé Pentiá 60 a 66.6 MHz pracovali s napätím až 5 V, od 75 MHz s napätím 3 V. Pokračovatelia modelu na 75 MHz (s kódovým označením P54C) s frekvenciami 90, 100 a 120 MHz vyrábané samozrejme technológiou 0.35 µm a pracujúce na 3 V dali na seba pomerne dlho čakať a objavili sa až v nasledujúcich dvoch rokoch.
prvé AMD K5 PR75 a PR133 neskôr
Prvé Intel Pentium pod drobnohľadom
Cyrix 5x86 PR100 a 6x86 PR166
Prvé Intel Pentium zvrchu a „odhalené“ zospodu 18
Ku koncu éry Pentia prichádzajú modely na frekvenciách 133.3, 150, 166.6, 180 a 200 MHz. Z charakteristík sa zmenilo napájanie (väčšie energetické nároky procesora) na hodnotu 3.3 V a procesory boli vo vyhotovení pre Socket 7 obsahujúci 321 pinov. Socket 7 (321 pinový) bol spätne kompatibilný so Socketom 5 (320 pinovým) v tom zmysle, že staré procesory 75, 90, 100 a 120 MHz pre Socket 5 sa dali osadiť do Socketu 7, Prvý Socket 4 Pokračovateľ Socket 5/7 273 pinov nie však naopak. Aby sa novšie Pentiá 133.3 – 200 MHz 320/321 pinov určené pre Socket 7 nedali osadiť do staršieho Socketu 5, mali preto novšie procesory pre Socket 7 o jednu nožičku viacej. Pentium mohlo pracovať približne 2-krát rýchlejšie ako procesor 80486. Prvé revízie jadra procesorov Pentium P5 sa vyznačovali populárnou chybou koprocesora, ktorá bola neskoršie odstránená – zákazníci vtedy dostávali bezchybný nový CPU za procesor s chybnými výpočtovými jednotkami. Možno preto sa celkom prvé Pentium P5 masovo veľmi nerozšírilo. Pozadu nezostali ani konkurenti AMD a Cyrix. V marci 1996 vzišli z dielne AMD postupne modely K5 (s kódovým označením 5k86) s frekvenciami PR75, PR90, PR100, PR110, PR120, PR133.3, neskôr PR150 a PR166.6 MHz, vyrábané technológiou 0.50 µm potom podobne ako aj Intel 0.35 µm, s 4.3 miliónmi tranzistorov, zbernicou 50, 55, 60 alebo 66.6 MHz a 24 kB cache pamäťou prvej úrovne. Pre ľahšie porovnanie s výkonom procesorov od Intelu, AMD zaviedlo tzv. Pentium-Rating PR ako číslo, ktoré informovalo o rýchlosti procesora v porovnaní so skutočným Pentiom. Firma Cyrix sa v tom čase mohla pýšiť modelmi tiež označenými 5x86 neskôr 6x86 s kódovým označením M1, M1L potom M2 s frekvenciami od PR100 až po PR200 MHz, vyrábanými technológiou 0.35 µm o niečo neskôr s ďalšou rodinou už 0.25 µm. Rodina procesorov Cyrix 6x86 podporovala tou dobou už nevyhnutnosti ako - reťazené spracovanie inštrukcií, obsahovala matematický koprocesor a 16 kB cache pamäte a ku zvýšeniu výkonu používali procesory podobné zbrane ako konkurenti AMD a Intel. Séria M1 neposkytovala dostačujúci výkon (v porovnaní s K5 a Pentiom), používala napájanie 3.3 V, čo spôsobovalo prehrievanie, preto prišli vylepšenia M1L a M2 napájané 2.8 V napätím a zavedeným PRatingom PR120+, PR133.3+, PR150+, PR166.6+ a PR200+. Cyrix neskôr ku koncu roku 1997 odkúpila National Semiconductor Corporation a National prechádza v priebehu rokov 1997 a 1998 do ústrania a v roku 1999 úplne stráca konkurencie schopnosť na poli procesorov pre PC. National ďalej vyrábal procesory do spotrebnej elektroniky (momentálne Cyrix patrí firme VIA, jednému z najväčších výrobcov čipových súprav). V tej dobe bol „výkrikom“ ešte procesor Cyrix Media GX s ratingom PR200 až PR300, umieračikom bol neskôr procesor na 700 MHz. Na scéne procesorov pre PC desktopy a laptopy ostávajú tak v polovici deväťdesiatych rokov z ôsmych spoločností na prelome osemdesiatych a deväťdesiatych rokov prakticky len dvaja rivali Intel a AMD. V podstate sa teda jednalo o piatu generáciu procesorov, ktorej sa niekedy (aj navzdory oficiálne neuznanému označeniu) hovorilo 586. Všetky procesory boli úplne kompatibilné s vtedajším softvérom platformy 80x86 a s novým operačným systémom Microsoftu – Windows 95 a tiež s platformou Intelu (spoločné označenie Wintel), multitasking, t.j. súčasné spustenie a práca s viacerými aplikáciami, bol už samozrejmosťou - stojí na ňom Windows 95.
19
Pentium OverDrive, Pentium Pro (P6), Pentium P55C čiže MMX, Pentium P6 čiže II & Celeron vs. K6, K6-2 & K6-III
N
a konci roku 1995 Intel uvádza Pentium Pro s 5.5 miliónmi tranzistorov (čo by zdokonalenú verziu pôvodného Pentia a zárodkom jadra P6) na frekvenciách postupne 150, 166.6, 180 a 200 MHz so 66.6 MHz FSB, vyrábaného 0.35 µm technológiou, so 16 kB L1 cache pamäte (8 kB dáta + 8 kB inštrukcie) a 256 kB L2 cache pamäte (neskôr až 512 kB, dokonca i 1 MB (!!!) L2 cache pre serverové riešenia) určeného na Socket 8. Pentium Pro malo obdĺžnikový tvar, integrovanú obrovskú L2 cache pamäť oddelenú od výpočtového jadra a vďaka implementovaným novým 10
inštrukciám bolo viac optimalizované pre 32-bitové aplikácie a operačné systémy – napr. Windows NT 3.50 (16-bitové aplikácie pod Windows 95 sa žiaľ nedočkali žiadneho zrýchlenia, dokonca v niektorých prípadoch Pentium Pro v 16-bitových aplikáciách vykazovalo o niečo slabší výkon ako Pentium P54C) a spústa technologických inovácií predurčili tento procesor najmä do pracovných staníc a serverov. Procesor Pentium Pro sa nikdy veľmi nepresadil, najmä vďaka vysokej cene. Na prelome rokov 1996/97 sa v Inteli začína schyľovať k poslednému procesoru architektúry P5...: Pentium MMX (kódové označenie P55C) s podporou multimédií (MultiMedia eXtension) a ďalšími 57 novými inštrukciami (spolu ich bolo už 277!) a pridanými ďalšími 64-bitovými registrami, ktoré uzrelo svetlo sveta v januári 1997 na frekvencii 166.6 MHz a bolo vyrábané technológiou 0.30 µm, neskôr 0.28 µm, v tej dobe s klasickou 66.6 MHz zbernicou, pričom procesor sa pýšil 4.5 miliónmi tranzistorov, výkonnejším predvídaním vetvenia inštrukcií a 32 kB L1 cache pamäte (16 kB inštrukcie, 16 kB dáta), Pentium MMX pokračovalo cez 200 a 233.3 MHz. Pentium MMX teda nemožno považovať za pokračovateľa Pentia Pro. Nový procesor žiaľ potreboval mierne modifikovaný Socket 7 s duálnym napájaním (pri napätí 3.5 alebo 3.3 V by sa procesor už dosť prehrieval, Intel Pentium Pro
Intel Pentium P55C - MMX
Výpočtové jadro Intel Pentia Pro v detailoch Intel Pentium Pro zvonka – zvrchu a „odhalené“ zospodu, kde je dobre vidieť výpočtové jadro vľavo a L2 cache pamäť vpravo
20
preto bežal na 2.8 V), jednalo sa tak už o štvrtú modifikáciu Socketu počnúc celkom prvými Pentiami P5, P54C a nakoniec P55C čiže MMX (nepočítame Pentium Pro, ktoré sedávalo v Sockete 8, postavené na novšej architektúre P6 a ktoré preto nie je prochodcom Pentia MMX). Pentium MMX bolo vôbec prvým procesorom so špeciálnou sadou inštrukcií pre prácu s multimédiami a s mnohými vylepšeniami poskytovalo o 10 až 20 % vyšší výkon v bežných aplikáciách, nárast výkonu v aplikáciách optimalizovaných pre novú inštrukčnú sadu MMX alebo v multimédiách bol ešte väčší, až okolo 30 - 40 %. Preto napr. Pentium P55C na 166.6 MHz MMX nebolo 1.666-krát rýchlejšie od Pentia P54C pracujúceho na 100 MHz, ale asi 2-krát! V marci 1997 však bola ohlásená ďalšia séria mikroprocesorov Pentium OverDrive MMX s frekvenciami 125, 150 a 166.6 MHz určených práve pre základné dosky, ktoré nepodporujú duálne napájanie. Tieto mikroprocesory mali na puzdre integrovaný stabilizátor napájacieho napätia. Neskôr sa rad OverDrive rozšíril ešte o modely s frekvenciou 180 a 200 MHz. Vonkajšia frekvencia tohto procesora bola 66.6 MHz a bol vyrábaný 0.35 mikrónovou technológiou. Pridajme, že v júni 1997 sa objavujú modely Pentia MMX pre notebooky taktované na 166.6, 150 a 133.3 MHz, o chvíľu neskôr v októbri prišli notebookové Pentiá MMX s kódovým označením Tillamook 166.6, 200, 233.3, 266.6 až 300 MHz, vyrábané technológiou 0.25 µm. AMD po odkúpení spoločnosti NexGen v apríli 1997 odpovedalo na Pentium MMX s využitím know-how odborníkov z NexGenu ďalšou generáciou označenou ako K6 (šiesta generácia procesorov - 80686) s kódovým názvom Little Foot (malá stopa) na takte od 166.6, cez 200 a 233.3 MHz a technológiou 0.30 µm, neskôr 0.25 µm, samozrejme s obdobou implementovanej podpore technológie MMX, 24 kB cache pamäte prvej úrovne rozdelenej na 16 kB inštrukčnej a 8 kB dátovej pamäte a 8.8 miliónmi tranzistorov. Procesor K6 bol vyrábaný pre Socket 7 s duálnym napájaním a možno Prvé AMD K6 – PR166.6 ho tak osadiť len do dosiek pre Pentium MMX, obsahoval výrazne vylepšený koprocesor (FPU) čo z neho činilo pomerne zdatného súpera Pentia Pro a Pentia MMX, nie však prichádzajúceho Pentia II.
Zapuzdrené Intel Pentium II Klamath & Deschutes (P6)
V treťom kvartáli roku 1997 pred príchodom operačného systému Windows 98 prichádza z dielne Intelu druhá generácia Pentia, označovaná ako Pentium II (kódový názov P6 teda celkovo tiež už šiesta generácia mikroprocesorov podobne ako predchodca Pentium Pro) s jadrom Klamath (okrem toho Intel začína aj produkciu procesorov Celeron – Jadro Intel Pentia II Deschutes v detailoch 21
„Odhalené“ Intel Pentium II Deschutes a detail na jeho čip L2 cache na puzdre
pre menej výkonné a lacné zostavy). Na počudovanie Intel použil názov pre procesory piatej generácie s dodatkom II, pri novej tradícii by sa jednalo o „Sextium“. Oproti Pentiu, Pentiu Pro a Pentiu MMX obsahuje Sextium, t.j. Pentium II (alebo tiež i 80686) výraznú podporu pre internet, 100 MHz RAM pamäte (doteraz boli pamäte väčšinou typu SIMM, 72 pinové na takte 66.6 MHz), disky väčšie než 8.4 GB, 100 MHz zbernicu (doteraz tiež na 66.6 MHz), nové grafické rozhranie AGP a procesor obsahoval 7.5 miliónov tranzistorov, okrem toho Pentium II kombinuje výhody predchodcu vo svojej architektúre Pentia Pro - veľká cache pamäť, i Pentia MMX - multimediálna inštrukčná sada. Pentium II Klamath sa vyrábalo špeciálne zapuzdrené pre Slot 1 vo formáte SECC (single edge contact cartridge) ešte 0.35 µm technológiou, 66.6 MHz zbernicou a obsahovalo 32 kB L1 cache pamäte priamo v jadre a 512 kB L2 cache pamäte v puzdre miesto na základnej doske, čo tiež prispelo k zvýšeniu výkonu. Intel si od nezvyklého zapuzdrenia pravdepodobne sľuboval nový štandard, namiesto spleti a lesu nožičiek, ktoré boli na starších procesoroch. Prechod na Slot 1 mal však aj iné príčiny, s príchodom nových rozhraní, zberníc a technológií sa prekročili hranice Socketu 5/7, okrem toho Intel mal na Slot 1 patent a mohol tak odstaviť konkurenciu. Táto nie prvá a ani nie posledná zmena Socketu sa nečudo stretávala s radoch používateľov s nevôľou. Procesory Pentium II Klamath štartovali na 233.3 MHz v roku 1997, cez 266.6, 300 a 333.3 MHz o pol roka neskôr. Posledné modely Klamathu na 300 a 333.3 MHz mali také tepelné vyžarovanie, že ich Intel dodával len významným partnerom. Vzápätí prichádza modifikácia Pentia II na jadro Deschutes s podporou 100 MHz zbernice a vyrábané už technológiou 0.25 µm a s rovnakými veľkosťami cache pamätí, napájanie bolo vďaka 0.25 µm výrobnej technológii znížené na 2 V. Objavujú sa modely na 300, 350, 400 a dokonca 450 MHz o pol druhého roka neskôr, nezvyklé nie sú ani modely so zbernicou na 66.6 MHz avšak s taktom 366.6, 433.3 a 466.6 MHz (t.j. s väčším násobiteľom medzi vonkajšou systémovou a vnútornou procesorovou zbernicou). Pre Pentiá Deschutes so 100 MHz zbernicou vyšiel chipset Intel 440BX. L2 cache pamäť Pentia II pracovala na polovičnej frekvencii a bola stále oddelená od samotného jadra procesora. Okrem toho v polovici roku 1998 vychádza serverové Pentium II Xeon s 512 kB až 2 MB L2 cache pamäťou. Pre úplnosť dodajme, že mobilné vydanie Pentia II označovaného ako Dixon s rovnakými parametrami ako Deschutes vychádza v polovici roka 1999, avšak s neporovnateľne väčším počtom tranzistorov.
22
Intel Celeron Covington – Slot 1, bez L2 cache
Intel Celeron A Mendocino – Slot 1, 128 kB L2 cache
Intel Celeron Mendocino – Socket 370 PPGA
Na poli lacných procesorov Intel vsadil na Celeron s jadrom Covington, ktorý vychádza v apríli 1998. Covington sa vyrábal 0.25 µm technológiou pre Slot 1 v prevedení SEPP (single edge processor package), obsahoval 7.5 milióna tranzistorov, nebol zapuzdrený (ako Pentium II) ale skôr „vyzlečený“, pracoval so 66.6 MHz zbernicou ale na rozdiel od Pentia II Klamath neobsahoval žiadnu L2 cache pamäť, L1 cache bola už tradične rozdelená pre dáta a inštrukcie a čítala 32 kB. Takéto vyzlečené Pentium II Klamath pozbavené L2 cache pamäte, ktorým Celeron Covington vlastne bol, sa vyrábalo s výrazne nižšími nákladmi. Moderné procerory (počnúc šiestou generáciou, t.j. Pentium Pro, Pentium II, K6-III) sú relatívne viac závislé od veľmi účinnej a rýchlej L2 cache pamäte aok procesory piatej generácie, preto bez L2 cache pamäte, so 66.6 MHz zbernicou a pozbavený iných zlepšení podstatne poklesol výkon procesora, ktorý bol pomerne slabý. Celeron Covington bol len veľmi lacná náhrada s krátkou dobou trvania a urýchlená reakcia Intelu na K6 a K6-II firmy AMD. Covington štartoval na 266.6 MHz, cez 300 a 333.3 MHz. Intel si uvedomil chybu a v auguste 1998 vychádza modifikácia Covingtonu a síce Celeron Mendocino s takmer rovnakými parametrami ako Covington, avšak s integrovanou L2 cache pamäťou 128 kB a asi s 19 miliónmi tranzistorov (!!!), zväčšenie plochy čipu je vidieť na prvý pohľad. K označeniu sa pridávalo písmeno A, napr. Celeron 366A, na rozlíšenie, že sa jedná o Celeron Mendocino. L2 cache pamäť ale pracovala na plnej frekvencii procesora, nie na polovičnej ako v prípade Pentia II, bola integrovaná priamo do jadra procesora, zatiaľčo pri Pentiu II bola vyrovnávacia L2 cache pamäť sústredená v čipoch umiestnených v púzdre spolu s procesorom. Celeron Mendocino pre Slot 1 štartovalo na 300 MHz a stúpalo cez 333.3, 366.6 a 400 MHz. V januári 1999 sa na frekvenciách 300 MHz objavuje Socketový voľný Celeron Mendocino pre Socket 370 v prevedení PPGA (Plastic Pin Grid Array) s úplne rovnakými parametrami ako jeho brat pre Slot 1 a končí až na 533.3 MHz hranici. To urobilo z Celerona Mendocino (v prevedení Slot 1, ale najmä Socket 370 PPGA) veľmi zdatného súpera pre Pentium II s veľkou ale pomalou a oddelenou 512 kB L2 cache pamäťou, ktoré v kancelárskych aplikáciach ani nestačilo na Celerony naplno využívajúce svojich 128 kB rýchlej L2 cache. Celeron Mendocino sa tak stalo malou legendou pre svoj výkon v možnosti pretaktovania (až o 50% pri zmene FSB zo 66.6 na 100 MHz), naviac Celeron Mendocino v prevedení Slot 1 so 66.6 MHz zbernicou a napájaním 2 V bolo možné osadiť aj do celkom prvých dosiek pre Pentium II Klamath. AMD so svojim K6 mohlo konkurovať Pentiu MMX na 233.3 MHz a Celeronom s jadrom Covington, nemohlo ale konkurovať Pentiuu II Klamath (a neskôr Deschutes) štartujúceho na 233.3 MHz. Preto AMD reagovalo v máji 1998 uvedením ďalšieho zdokonalenia generácie K6 s označením K6-2, s 9.3 miliónmi tranzistorov, 64 kB L1 cache pamäte (32 kB pre dáta a 32 kB pre inštrukcie), vyrábaného 0.25 µm technológiou, 2.4 a 2.3 neskôr 2.2 V napájaním a jadrom Chomper a so štartovacou frekvenciou na 300 MHz (66.6 MHz FSB) a 332.5
23
MHz (95 MHz FSB), a podporou novej inštrukčnej sady 3D now! pozostávajúcej z 21 nových inštrukcií. Ich podstata sa však značne líši od inštrukcií MMX, nakoľko tie boli určené na manipulácie s celými číslami a tak nie je možné s nimi vykonávať ani tie najzákladnejšie geometrické transformácie. Vďaka týmto AMD K6-III: 400 a 450 AMD K6-2: 233.3 až 550 MHz novým inštrukciám je však možné MHz násobiť dve 32-bitové desatinné čísla a k výsledku pripočítať ďalšie 32-bitové desatinné číslo v priebehu jedinej operácie. Dovtedy procesory potrebovali na rovnakú úlohu dve samostatné operácie. Po nich prišli modely na frekvenciách 350 MHz (100 MHz FSB), 380 MHz (95 MHz FSB) ďalej 400 a 450 MHz (100 MHz FSB) či 427.5 a 475 MHz (95 MHz FSB). K6-2 na prelome rokov 1998/99 a začiatkom roku 1999 vrcholilo na frekvenciách 500 a 533.3 MHz (100 a 66.6 MHz FSB), ako celkom posledné K6-2 tepalo na frekvencii 550 MHz so 100 MHz zbernicou. Posledné modely K6-2 na(d) 500 MHz boli osadené v tzv. CPGA (ceramic pin grid array). S dostatočne veľkou L1 cache pamäťou, dodatočnou L2 pamäťou umiestnenou na zákl. doske, 3D now! technológiou značne zrýchľujúcou prácu s reálnymi číslami a kompatibilitou so Socketom 7 nemal procesor K6-2 problémy presadiť sa na trhu. Na rozdiel od procesorov Celeron Mendocino, ktorým AMD svojimi K6-2 od ich uvedenia konkuruje, nemajú K6-2 svoju vlastnú L2 cache pamäť. Jej absencia celkom výrazne spomaľuje prácu s vlastnou pamäťou počítača. Pretože staré modely Celeronu Covington bez L2 cache nezaznamenali žiadný výrazný obchodný úspech, je možno divné prečo sa K6-2 predávali tak dobre: 1) 2)
3)
K6-2 má dvakrát väčšiu primárnu cache oproti všetkým Celeronom, Pentiám II i prvým Pentiám III (64 kB vs. 32 kB) L2 cache pamäť je prítomná na zákl. doske (nie v púzdre ako pri Pentiách II) a to od 512 kB do 2 MB. Obrovskou nevýhodou však bolo, že práca s ňou však žiaľ bežala len na frekvenci zbernice a nie aspoň na ½ frekvencie procesora (o plnej frekvencii CPU ani nehovoriac) – aj to by bol prakticky 3 násobok frekvencie zbernice. K6-2 majú implementovanú pokrokovú inštrukčnú sadu 3Dnow! pre prácu s reálnymi číslami a s multimédiami (nechýba samozrejme MMX pre operácie s celými číslami)
Vo februári 1999 AMD uvádza tretiu a poslednú modifikáciu generácie K6 a síce K6-III s jadrom SharpTooth (ostrý zub) vyrábaného 0.25 µm technológiou, osvedčenou 64 kB L1 cache (32 kB dáta & 32 kB inštrukcie) ale čo je oveľa pozoruhodnejšie s 256 L2 cache pamäte priamo na čipe procesora, ktorý preto obsahoval až 21.3 miliónov tranzistorov (!!!). AMD urobilo integráciou L2 cache do jadra procesora husársky kúsok, pretože celá architektúra bola navrhnutá pre Socket 7 a navyše prechod sa realizoval bez zapúzdrenej verzie K6-III, kde by L2 cache bola v púzdre! Štartovacia frekvencia bola 400 MHz a 100 MHz zbernica. Druhý a posledný model mal frekvenciu 450 MHz. Bohužiaľ technologické problémy neumožnili ísť AMD na vyššie frekvencie, takže zostalo len pri týchto dvoch modeloch – koniec koncov hranice
24
Socketu 7/Super 7 pre posledné a najrýchlejšie procesory piatej/šiestej generácie sú niekde pri 550 - 600 MHz. Výsledkom tohoto tzv. „neúspechu“ s procesorom K6-III je opustenie pätice Socket 7/Super 7 a vývoj nového štandardu – Slot A a procesora K7 – Athlon. Čas a technológie pre AMD na začiatku roku 1999 ešte nedozreli a neumožňovali vyrábať procesory s integrovanou 256 kB, resp. 512 kB L2 cache priamo v jadre procesora a pracujúcej pritom na plnej frekvencii jadra nad 500 či 600 MHz. Procesor K6-III bol hravo schopný konkurovať Pentiu II Deschutes, Celeronu Mendocino i úplne prvým Pentiám III Katmai (jadro P6). Procesory K6-III boli kompatibilné so Socketom 7, avšak bol nutný jeho upgrade na Super 7 (s 95 resp. 100 MHz FSB), kvôli novým a rýchlejším pamätiam, rozhraniam a zberniciam, ktoré sa v tom čase pomaly stávali štandardom. Keď sa procesor K6-III osadil do dosky s implementovanou cache pamäťou, L2 cache pamäť na procesore z nej učinila L3 cache pamäť tretej úrovne. V máji 1999 firma Cyrix, ktorú pred 18 mesiacmi odkúpila firma National Semiconductor Corporation, definitívne končí s výrobou mikroprocesorov pre PC a ďalej sa zaoberá už len výrobou procesorov určených zväčša pre periférie PC alebo iné zariadenia.
25
Pentium III & Celeron vs. Athlon K7, K75, ThunderBird & Duron roku 1999 prichádza k ďalšiemu generačnému skoku ako v AMD, tak neskôr v Inteli. Intel sa vo februári 1999 pochválil procesorom Pentium III so štartovacou frekvenciou na 450 MHz, 9.5 miliónmi tranzistorov a podporou rýchlejších variánt grafického rozhrania AGPx2 a neskôr AGPx4 (označovaného ako AGV ver. 2.0) vyrábaný zapuzdrený najprv 0.25 µm technológiou (jadrá Katmai a Tanner), zbernicou 100 MHz, 32 kB L1 cache, ktorá bola samozrejme rozdelená na 16 kB pre dátovú a 16 kB pre inštrukčnú a 256 či 512 kB L2 cache pamäte, pracujúcej najprv na polovičnej rýchlosti výpočtového jadra a neskôr na jeho plnej rýchlosti využívajúc technológiu DIB a novou inštrukčnou sadou na báze
V Intel Pentium III Katmai a Tanner (P6)
Intel Pentium III Xeon
Socket 370
priebehu
technológie SSE (Streaming Single Instruction Multiple Data Extensions) čo by spojenej MMX a zdokanalenej na MMX2 a novej KNI (Katmai New Instruction) pozostávajúcej zo 70 nových inštrukcií, ktoré pomáhajú programom na rozpoznávanie ľudskej reči a pri modelovaní 3D. Pentium III Katmai bolo vyvinuté na jadre P6 (Pentia II či Pentia Pro) a dosiahlo na hranicu 600 až 666.6 MHz, kde Intel skoro prešiel na novšie jadro. Prvé Pentium III Katmai bolo vlastne Pentium II Deschutes s kompletnou inštrukčnou sadou SSE a niekoľkými ďalšími zlepšeniami zaraďujúcimi Pentium III stále do šiestej generácie procesorov. Tieto prvé verzie Pentia III so 100 MHz FSB boli spätne kompatibilné s doskami pre Pentium II Deschutes samozrejme so 100 MHz FSB a s legendárnym chipsetom Intel 440BX, okrem toho pre Pentium III Katmai vychádza chipset Intel 810 a 815. V októbri 1999 prichádza vylepšené Pentium III s jadrom CopperMine (medený dol) alebo Cascades (lavíny, kaskády) pre pracovné stanice a servery, najprv v prevedení SECC 2 (Single Edge Contact Cartridge) a až potom po vzore starých dobrých Celeronov pre Socket 370 prevedení FCPGA (flip chip pin grid array). Procesor Pentium III s novým jadrom CopperMine sa tak mohol pomaly šplhať k 1 GHz hranici pracovnej frekvencie. Postupne prichádzali modely na 650, 666.6, 700, 733.3, 750, 800, 833.3, 866.6, 900, 933.3 a 1000 MHz. Procesor Pentium III
Intel Pentium III CopperMine/Tualatin
26
CopperMine bol vyrábaný už technológiou 0.18 µm a s napájaním len 1.6 V (procesor sa preto menej prehrieval a bolo možné ísť na vyššie frekvencie), s podporou ako 100, tak neskôr i 133.3 MHz zbernice, 32 kB L1 a 256 kB L2 cache pamäte, ktorá bola už integrovaná priamo do jadra procesora, preto jadro CopperMine ovplývalo až 28.1 miliónmi tranzistorov. Pamäť cache pracovala na plnej rýchlosti procesora, nie na polovičnej ako u Pentia II. Pre novšie Pentiá III CopperMine boli určené predražené chipsety Intel 820 a 840 s nechvaľnými ešte predraženejšími pamäťami RDRAM. Socket 370 (či už v prevedení PPGA pre Celerony alebo FCPGA pre Pentiá III) bol návrat Intelu od Slotov k päticiam a Socketom, vyzerá podobne ako Socket 5/7 pre prvé Pentiá, obsahuje však 370 vývodov, miesto 320/321. Do pätíc typu Socket 370 možno teda vkladať Celeron Mendocino PPGA ako aj Pentium III Katmai/CopperMine FCPGA. Vzhľadom k tomu, že Slot 1 a pätica Socket 370 sú vývodovo a elektricky veľmi podobné a teda kompatibilné (zďaleka však nie tvarovo), bolo možné na trhu zohnať redukcie umozňujúce používať procesory Celeron Mendocino a Pentium III Katmai/CopperMine pre Socket 370 PPGA či FCPGA na základných doskách so Slotom 1. Redukcie neboli len jednoduché drátové prepojky, ale obsahuvali aj súčiastky, čím bolo možné nastavovať plno vecí. Na druhej strane originálny procesor pre Socket 370 bol lacnejší ako zodpovedajúci Slotový variant a príslušná redukcia. Vzápätí ako odpoveď na dianie v AMD (viď nižšie) prichádza celkom posledná modifikácia Pentia III s jadrom Tualatin kopírujúca osvedčenú architektúru CopperMinu a jeho charakteristiky, okrem výrobného procesu a veľkosti L2 cache: Pentium III Tualatin sa už vyrábalo značne pokrokovou 0.13 µm technológiou a s dvojnásobnou L2 cache oproti Pentiu III CopperMine, t.j. s 512 kB. Tualatin štartoval na 1.00 GHz a pristál na frekvencii 1.40 GHz pri 133.3 MHz FSB. Vzhľadom na posledného zástupcu architektúry P6, jednalo sa už o dokonale vypilovanú (a hlavne výkonnú) architektúru.
Intel Celeron Mendocino v prevedení Slot 1 a Socket 370 PPGA
Posledné modely pred architekturou NetBurst: Jadro Intel Celeronu Tualatin a Intel Pentia III Tualatin
Okrajovo spomeňme, že podobne ako serverové Pentium II Xeon, vyšlo neskôr aj serverové Pentium III Xeon, určené pre Slot 2 ktoré sa postupom času vyšplhalo až na 2.2 GHz hranicu, kým ho nenahradili systémy na báze Pentia 4, resp. 64-bitové systémy Itanium 2. Podobne z dielne Intelu prichádza v polovici roku 2000 zbrusu nový Celeron s jadrom Pentia III CopperMine s tradične okresanou L2 cache pamäťou o kapacite 128 kB vs. 256 kB pri
27
Pentiu III CopperMine. Celoron CopperMine mal aj ďalšiu tradičnú nevýhodu oproti svojmu výkonnejšiemu bratrovi: nižšiu frekvenciu zbernice. Jednalo sa vlastne o Celeron Mendocino s podporou inštrukčnej sady SSE, ktorú doposiaľ malo len Pentium III a ďalšími zlepšeniami, používal napájanie 1.45 – 1.5 V a bol určený ešte stále pre Socket 370 FCPGA. CopperMine tiež priniesol pokročilejšiu 0.18 µm výrobnú technológiu a odlišné zapúzdrenie čipu. Prvý Celeron CopperMine s 66.6 MHz FSB tepal na frekvencii 566.6 MHz, teda presne tam, kde končia Celerony Mendocino. FSB na 66.6 MHz vydržalo všetkým Celeronom ozaj dlho, ale keď Pentium III obdržalo opäť rýchlejšiu FSB na frekvencii 133.3 MHz (miesto 100 MHz), tak po nejakej dobe zrýchlil Intel konečne i svoje Celerony. Prvým Celeronom CopperMine so 100 MHz FSB bol model na frekvencii 850 MHz. Toto jadro Intel vybičoval až cez hranicu 1 GHz. Nakoniec prišiel posledný zástupca rodinky Celeronov vychádzajúcich z architektúry P6 a z jadra Pentia III Tualatin, spočiatku vyrábaný 0.18 µm výrobným procesom, neskôr pokročilejším 0.13 µm. Celeron Tualatin končil o dva roky začiatkom roku 2002 na 1.300 GHz vyrábaný spomenutou pokrokovou technológiou 0.13 µm. Pentium III ako aj Celeron s jadrom Tualatin boli poslednými zástupcami šiestej generácie P6 procesorov od Intelu postupne vytlačenej architektúrou siedmej generácie: NetBurst a Pentiami 4. Na záver nasleduje krátky prehľad rodín generácie Pentia II & III a Celeronov s architektúrou šiestej generácie P6: L2 cache
Jadro Pentia II Klamath Deschutes
FSB (MHz) 66.6 100
Výrobný proces (µm) 0.35 0.25
512 kB, 1/2x CPU, v púzdre 512 kB, 1/2x CPU, v púzdre
Jadro Pentia III Katmai CopperMine Tualatin
FSB (MHz) 100 100, 133.3 133.3
Výrobný proces (µm) 0.25 0.18 0.13
256 kB, 1/2x CPU, v púzdre 256 kB, 1x CPU, v jadre 512 kB, 1x CPU, v jadre
Jadro Celeronu Covington (P II) Mendocino (P II) Coppermine (P III) Tualatin (P III)
FSB (MHz) 66.6 66.6 66.6, 100 100
Výrobný proces (µm) 0.25 0.18 0.18 0.18, 0.13
L2 cache
L2 cache žiadna 128 kB, 1x CPU, v jadre 128 kB, 1x CPU, v jadre 256 kB, 1x CPU, v jadre
Frekvencia (MHz) 233.3, 266.6, 300, 333.3 300 - 450
Frekvencia (MHz) 450 – 666.6 666.6 – 1000 1000 – 1400
Frekvencia (MHz) 266.6, 300 a 333.3 300 – 533.3 566.6 – 1000 850 – 1300
28
AMD v júni 1999 prechádza na revolučnú generáciu K7 (siedma generácia procesorov 80786) so štartovacou frekvenciou 500 MHz s výrobnou technológiou 0.25 µm a o niečo neskôr začína tiež podľa vzoru Intelu svoje procesory rozdeľovať na dve skupiny - pre lacné zostavy Duron a pre výkonné Athlon, novinkou bola tiež patentovaná double Aplha EV6 zbernica, ktorá efektívne pracuje na dvojnásobnej frekvencii, než je jej fyzická frekvencia. Athlon bol vôbec prvým procesorom, ktorý prenášal dáta a adresy po FSB rýchlejšie, ako je nominálna frekvencia, konkrétne to bolo 2 krát rýchlejšie.
Logo Duronu
Logo Athlonu
Logo Athlonu XP
Pre procesory K7 bol určený napríklad veľmi známy chipset firmy VIA Apollo KX133. Procesor Athlon (s kódovým označením jadra K7) obsahoval v sebe oproti K6-III nespočetné množstvo nových prevratných prvkov a staršie boli radikálne vylepšené. Spomeňme len nový typ matematického koprocesora, vďaka čomu K7 konečne dosahuje dobrý výkon aj v operáciách s pohyblivou desatinnou čiarkou. Koprocesor – jednotka na operácie s reálnymi číslami obsahovala 3 špecializované jednotky FMUL, FADD a FSTORE; jednotky na celočíselné operácie boli tiež výrazne zdokonalené. Názov Athlon vyjadruje, že sa jedná o skutočného šampióna (atléta) medzi desktopovými 80x86 procesormi, čo aj 2-3 roky okolo milénia platilo. Procesor bol revolučný aj preto, že AMD sa počnúc generácoiu K7 po prvý krát vydalo celkom vlastnou cestou a nesledovalo kompatibilitu s Intelom, ale vyvinulo úplne novú a vlastnú architektúru. Už pôvodný Athlon K7 pracoval so zbernicou 2x100 = 200 MHz čo bolo viac než čokoľvek od Intelu v tej dobe (Intel sa vtedy pýšil systémami s vonkajšou systémovou zbernicou na taktoch 66.6, 100 a chystal 133.3 MHz) a bol navrhnutý pre Slot A, ktorý sa vizuálne veľmi podobal Slotu 1 na Pentiu II a Pentiu III, sloty však neboli kompatibilné. S prechodom na generáciu K7 tiež prišla nová inštrukčná sada enhanced 3D Now! (rozšírené 3D now!), pozostávajúcej z ďalších 24 nových inštrukcií. Athlon K7 disponoval úctyhodnými 128 kB L1 cache pamäte (64 kB dáta & 64 kB inštrukcie) pracujúcej na plnej frekvencii jadra procesora, v puzdre bolo minimálne 256 kB L2 cache (s maximom 8 MB L2 cache), jadro zaberalo kvôli 0.18 µm výrobnému procesu plochu až 184 mm2 a pýšilo sa s 22 miliónmi tranzistorov, o niečo viac ako K6-III. Zvláštnosťou ale je, že vývoj, výroba a predaj Pentia III pokračoval aj vyše 3 roky po jeho premiére a v polovici roku 2002 sa objavujú desktopové modely Pentia III s jadrom Tualatin na taktoch až do 1.400 GHz. To sme ale veľmi predbehli. Faktom zostáva, že nástup Athlonov K7 v podstate pochoval doteraz výkonné Pentium III, ktoré sa zdalo byť úspešným produktom Intelu, ktorý samozrejme nechcel, aby si AMD na prelome milénia ukrojilo ďalší podiel na trhu. Athlon K7 bol však sprvu nedostupný a pre bežných používateľov drahý, preto zo začiatku nachádzal uplatnenie v serveroch a pracovných staniciach. Na prelome milénia mohol
29
mať každý doma počítač tak výkonný, ako bolo monštrum na palube APOLLA 11 pri lete na mesiac v roku 1969, alebo veľké sálové (ťažkopádne chladené) superpočítače tej doby. U AMD platforma Duronu pre lacné zostavy štartovala v druhom kvartáli roku 2000 na takte 600 MHz, s jadrom Duron SpitFire (horúca krv). SpitFire mal závideniahodných 128 kB L1 Prvý AMD Athlon K7 na 500 MHz cache pamäte, ale len 64 kB L2 cache priamo v jadre, samozrejme používal double EV6 zbernicu a postačovalo napájanie jadra napätím 1.6 V. Duron SpitFire Lacný & výkonný AMD pokračuje na 650, 700, 750, 800, 850, 900 a 950 MHz. V auguste Duron Morgan 1000 MHz 2001 AMD uvádza druhú a veľmi úspešnú modifikáciu Duronu s jadrom Morgan na štartovacej frekvencii 950 MHz, veľmi skoro prišli modely na 1.000, 1.100, 1.200 a 1.300 GHz. Duron Morgan bol vlastne Athlon ThunderBird (viď neskôr) prežívajúci len na 64 kB L2 cache pamäte (namiesto 256 kB pri Athlone), zbernicou 2x100 MHz miesto 2x133.3 MHz a ďalšími obmedzeniami. Athlon ako hlavná zbraň AMD proti Intelu prekonal neskôr veľké zmeny. Jadro bolo zdokonalené na K7-II s kódovým označením K75 (ktoré sa však dlho neohrialo). Athlon K7-II s novým jadrom K75 a voliteľnou frekvenciou externej cache umiestnenej ešte v puzdre ako prvý 80x86 procesor pokoril 1 GHz hranicu. Athlon K7-II (750 MHz – 1 GHz) bol spätne kompatibilný s doskami pre prvé Athlony K7 (od 500 po 750 MHz). Počnúc týmto momentom si páni v AMD pravdepodobne povedali, že už nebudú nové revízie, rodiny a nové zdokonalené jadrá generácie K7, t.j. Athlonu, označovať fádnymi číslami (K7, K7-II čiže K75 atď...), ale pestrými názvami. Túto novú tradíciu možno spozorovať, keď v júli 2000 prichádza opäť nové jadro tejto siedmej generácie a síce jadro Athlon ThunderBird (bleskový vták ohnivák a búrlivák, pri starom označovaní by sa jednalo o jadro K7III) so štartovacou frekvenciou 750 MHz, vyrábaný bol už technológiou 0.18 µm najprv aj pre Slot A, nejskôr v prevedení pre Socket 462, alebo inak povedané Socket A, čo bola vlastná platforma AMD, podobne ako mal Intel vlastný Socket pre Pentium 4 (viď nižšie). Ahtlon ThunderBird pre Socket A už nie je kompatibilný s chipsetom VIA Apopllo KX133 a vzniká tak od KX133 Platforma Socketu A (462 pinov) odvodený a chronicky známy VIA Apollo KT133. Od KT133 bol o niečo neskôr odvodený VIA Apollo KT133A s podporou 2x133.3 = 266.6 MHz FSB. Frekvencia adresovaj a dátovej zbernice Athlonu ThunderBirdu bola podporovaná ako 2x100 = 200 MHz, tak neskôr aj 2x133.3 = 266.6 MHz, k dispozícii bolo úctyhodných 128 kB L1 a 256 kB L2 cache pamäte priamo v jadre, okrem toho bola zahrnutá podpora nového rýchleho typu pamätí DDR a procesor obsahoval približne 37 miliónov tranzistorov. Athlon ThundreBird končil v polovici roku 2001 na 1.400 GHz hranici. S poslednými modelmi na 1.333 a 1.400 GHz sa objavili nemalé problémy – procesory mali také energetické nároky a tepelné vyžarovanie, s ktorými výrobcovia základných dosiek, chipsetov a chladičov akosi nepočítali.
30
Pentium 4 Willamette & NorthWood vs. Athlon XP Palomino, ThoroughBred, Thorton, Barton & Sempron
V
novembri 2000 odpovedá Intel a s nástupom Pentia 4 s jadrom Willamette (ako zástupca novšej siedmej generácie procesorov, ktoré už nie sú postavené na jadre P6, ako napríklad Pentium III, ktoré sa preto ťažko dostávalo cez 1 GHz hranicu) vyrábaného najprv 0.18 µm technológiou, so svojimi asi 42 miliónmi tranzistorov na čipe, podporujúci grafické rozhranie AGP 3.0 (4x a 8x AGP), mamutie disky a mnoho gigabytové RAM, modifikovanou inštrukčnou sadou na báze technológie SSE2, postaveného na novej NetBurst architektúre, ktorá v sebe zahrňovala okrem iného aj prevratnú quad pumped zbernicu, odlišnú organizáciu L1 cache pamäte a zlepšené reťazové spracovanie inštrukcií, ničí úspech AMD. Procesor Pentium 4 pri quad pumped zbernici skopíroval a vylepšil výhodu Athlonov, využíval tiež úplne inú logiku FSB s dvojkanálovou rýchlosťou prenosu adries a štvorkanálovým prenosom dát (2x100 = 200 MHz adresy a 4x100 = 400 MHz dáta). Vzhľadom na to že Pentium 4 je plnohodnotný procesor
Prvé Intel Pentium 4 Willamette 1.400 GHz, 400 MHz FSB
Socket 478
Jeden z prvých Intel Pentium 4 NorthWood 2.200 GHz, 533.3 MHz FSB
siedmej generácie (podobne ako Athlon) na rozdiel od starších Pentií III, názov Pentia 4 by bol „Septium“, resp. v notácii 80x86 by bol 80786 podobne ako celá generácia AMD K7. Cache pamäť druhej úrovne prvých Pentií 4 čítala spočiatku 256 kB a pracovala na plnej frekvencii procesora. Intel v počiatkoch vsadil na používanie pamätí typu RamBus RIMM asi s dvojnásobnou frekvenciou, ktoré sú preto o niečo rýchlejšie od typu DDR, avšak asi dva-krát tak drahšie, ale potenciál skrytý v novinke DDR nezostal na prelome milénia v Inteli bez povšimnutia. Ako už bolo uvedené vyššie, Pentiá III sa istý čas nemohli rovnať výkonným Athlonom, preto Intel prišiel s Pentiom 4 ako revanšom. Avšak teraz s odstupom času sa zdá, že to bol skôr krok v záujme sebazáchovy, akoby Pentium 4 (aj keď postavené na úplne novej architektúre) ešte nebolo pripravené pre trh, ale Intel s ním musel za behu prísť, pokiaľ sa nechcel pozerať na úspech AMD. Ako keby Pentium 4 (alebo aj staršie Celerony - v porovnaní s konkurenciou) boli akési nedonosené deti polovodičového priemyslu. Keby sme totiž porovnávali jedno z posledných pretaktovaných Pentií III Tualatin napríklad na 1.400 GHz a jedno z prvých podtaktovaných Pentií 4 Wilamette samozrejme tiež na 1.400 GHz, o dosť by zvíťazilo staršie Pentium III. Pentium 4 dosahuje momentálne svoj výkon hlavne vďaka NetBurst architektúre, výsostným frekvenciám jadra a zbernice, inštrukčnej sade SSE2, čiastočne však aj veľkou cache L2 pamäťou, 0.13 a 0.09 µm výrobným procesom (tieto dve výhody sú už zo strany AMD pre posledných K7 Athlonoch XP úplne eleminované, prípadne prekonané), naposledy pribudla HTtechnológia. Jasný by bol tiež víťaz na poli lacných procesorov, napríklad Duron Morgan na 1000 MHz je dosť vysoko nad výkonom Celeronu Tualatin pri oných 1000 MHz (v skutočnosti Duron Morgan 1000 MHz je dokonca schopný konkurovať Pentiu III CopperMine na 1000 MHz !!!). Ale teraz späť : v novembri 2000 štartovalo Pentium 4 na 1.400 GHz, 4x100 MHz 31
Porovnanie Intel Pentium 4 Willamette – 0.18 µm (256 kB L2 cache) & NorthWood 0.13 µm (512 kB L2 cache)
quad pumped bus (QPB zbernica) a jadrom Wilamette vyrábaným 0.18 µm procesom a 256 kB L2 cache pamäte, určený pre Socket 423. Pokračuje s modelmi na 1.500, 1.600, 1.700, 1.800, 1.900 a 2.000 GHz. Už popredu bolo známe, že Socket 423 príliš dlho nevydrží, lebo ho čoskoro nahradí druhý. Skoro v januári 2002 sa objavuje druhý model Pentia 4 s jadrom NorthWood (severný les), ako pre päticu 423, tak pre 478 (423 alebo 478 pinov) vyrábaný už 0.13 µm technológiou, napájaním 1.50 V, so zbernicou ešte 4x100 = 400 MHz na frekvencii 2.000 neskôr 2.200 a 2.400 GHz a 512 kB pamäte druhej úrovne, preto procesor obsahoval až okolo 55 miliónov tranzistorov! Typická L1 dátová cache pamäť má len 8 kB (!!!), avšak kvôli odlišnej organizácii ju nemožno porovnávať s L1 cache pamäťou procesorov AMD. V tzv. Trace L1 cache pamäti si Pentium 4 uchováva svoje dekódované mikro-inštrukcie µOPs ktoré čakajú kým sa dostanú na rad a nepostúpia do výpočtového jadra. Trace L1 cache má šírku slova až 160 bitov. Trace L1 cache možno odhadnúť na 80 kB, čo na inštrukčnú L1 cache nie je vôbec málo. V Trace L1 cache si procesor Pentium 4 dokáže uložiť presne 12 288 mikroinštrukcií (3 x 212) a v jednom cykle dokáže spracovať tri µOPs naraz. Jedna µOPs má asi 53 bitov (preto 3x53 = cca 160 bitov). Pentium 4 NorthWood má preto celkom 8 kB L1 + 512 kB L2 = 520 kB typickej údajovej cache pamäte, zatiaľčo Athlon ThunderBird mal „len“ 128 kB L1 + 256 kB L2 = 384 kB cache pamäte celkovo. Rozdiel si vyžiadal ďalších 12-13 miliónov tranzistorov na Pentiu 4 NorthWood. Platforma Socketu 423 sa podľa očakávaní ukázala slepou uličkou a veľmi skoro zanikla vo svetle Socketu 478, ktorý sa presadil, už na začiatku roku 2002 mizli pomaly pätice 423 z trhu. V polovici roku 2002 prichádza už tretia modifikácia Pentia 4 s jadrom NorthWood ale už so zbernicou 4x133.3 = 533.3 MHz pre dáta a 2x133.3 = 266.6 MHz pre adresy, s taktom 2.2666 GHz neskôr 2.4000, 2.5333, 2.6666 a 2.8000 GHz, sú aj modely na 2.500, 2.600 GHz so 4x100 = 400 MHz adresovou zbernicou – sú to posledné a najrýchlejšie Posledný Intel Celerun Tualatin 1.300 GHz 32
modely so 400 MHz FSB a posledné, ktoré možno osadiť aj do dosiek pre prvé Pentium 4 Willamette. Podobne ako pri starších Celeronoch, Intel vsadil na známe rozlíšenie písmenom A. Preto napr. Intel Pentium 4 Willamette so 400 MHz FSB a 256 kB L2 cache na 2.000 GHz malo označenie 2.0, zatiaľčo Intel Pentium 4 NorthWood so 400 resp. 533.3 MHz FSB a 512 kB L2 cache tiež na 2.000 GHz sa označovalo 2.0A. Nemôžeme vynechať poznámku, že vyšli aj „nízkotaktované“ NorthWoody na 1.600 GHz a 1.800 GHz, samozrejme označené ako 1.6A a 1.8A. Na poli lacnejších procesorov Celeron, Intel definitívne ukončil výrobu Celeronu Tualatin na 1.400 GHz už v prvom polroku 2002 ale z cenníkov vymizli až v prvom kvartáli 2003. Celeron s jadrom Pentia III Tualatin mal zbernicu 100 MHz, 256 kB cache pamäte druhej úrovne a vyrábal sa 0.13 µm výrobným procesom. Už v máji 2002 vychádza novší rad Celeronov s jadrom Pentia 4 Willamette na 1.700 a 1.800 GHz. Tieto Celerony mali podobne 4x100 = 400 MHz dátovú a 2x100 = 200 MHz adresovú zbernicu, ale len 128 kB L2 cache pamäte (miesto 256 kB pri Pentiu 4 Wilamette), asi 35.5 milióna tranzistorov. Zvláštnosťou ale bolo, že sa vyrábali najprv technológiou 0.18 µm, čo sa paradoxne zdá ako krok späť. Vzápätí v septembri 2002 štartuje Celeron NorthWood na 2.000 GHz s takmer rovnakými parametrami ako Celeron Willamete, ale vyrábal sa už 0.13 µm technológiou, podobne ako starší Celeron Tualatin. Celeron NorthWood pokračuje v novembri 2002 na 2.100 a 2.200 GHz. Čo sa ale medzitým dialo v AMD? V poslednom kvartáli roku 2001 AMD začínalo výrazne pokrivkávať za frekvenciami Pentií 4 (priepasť bola vtedy okolo 300 MHz, dnes už vyše 1000 MHz), preto AMD zo strategických dôvodov znovu upustilo od označovania modelov procesorov pracovnými frekvenciami a prešlo znovu na výkonovo porovnateľný Porovnanie AMD Athlonov XP : prvý ekvivalent, čo urobilo keď v máji 2001 prišlo na ThoroughBred 2200+ rev. OA, 266 FSB vľavo a trh s novým jadrom Athlonu a síce Athlon XP novší ThoroughBred 2600+ rev. OB, 266 FSB (eXtra Performance) Palomino (Palomino je vpravo (rozdiel nie je voľným okom poznať) plemeno bieleho koňa) stále ešte vyrábané technológiou 0.18 µm a tiež vybaveného ďalšou novou inštrukčnou sadou, okrem iného využíval aj prvú intelovskú technológiu SSE. Jednalo sa už o štvrtú zásadnú modifikáciu jadra K7, t.j. akési K7-IV. V skutočnosti rating XP podľa AMD porovnáva Athlon XP a Athlon ThunderBird, t.j. na akej reálnej frekvencii by musel pracovať ThunderBird, aby dosiahol výkon Palomina XP. Prvý pokusný model niesol označenie 1200+ a pracoval na frekvencii 1.1333 GHz. Prvé Frekvenčná (nie výkonnostná) špička desktopové verzie Palomina sa však objavili až v októbri AMD generácie K7 : Athlon XP 2001. Palomino bolo pre AMD ďalším krokom vpred, ThoroughBred-OB (333 MHz FSB) ako hlavné spomeňme novú architektúru QuantiSpeed, 2800+ (2.2500 GHz) dlho očakávanú tepelnú diódu, zníženie vyžarovaného tepla a následne vylepšenú správu prehrievania jadra, nová inštrukčná sada 3D now Profesional! spojila a zdokonalila starú 3D now!, novšiu enhanced 3D now! a intelovskú SSE, voltáž jadra
33
bola znížená na 1.75 V a jadro zaberalo kvôli 0.18 µm technológii plochu 128 mm2, pričom procesor sa pýšil s 37.5 miliónmi tranzistorov. Pre Athlon XP Palomino vyšli chipsety VIA Apollo KT 266 a vylepšený KT 266A so samozrejmou podporou ako 2x100 = 200 MHz FSB, tak aj 2x133.3 = 266.6 MHz FSB a taktiež podporujúc aj celkom prvé 2x100 = 200 MHz DDRAM (PC1600), ako aj 2x133.3 = 266.6 MHz DDRAM (PC2100) – nespomínajúc iných výrobcov chipsetov a samotné AMD. Rýchlosť celej zostavy dávno neurčovala len frekvencia procesora. Athlon XP Palomino v jednom hodinovom cykle vykonal štyri inštrukcie, zatiaľčo Pentium 4 len tri inštrukcie. Preto Palomino v konečnom dôsledku mohlo dosahovať porovnateľných výkonov Pentia 4 na frekvencii asi o 15-20 % nižšej. Oficiálny štartovací model mal XP Performance Rating - alebo starý známy Pentium Rating 1500+ a frekvenciu 1.3333 GHz, a bol teda výkonovo porovnateľný s prvou odrodou Pentia 4 Willamette na 1.500 GHz, (podľa AMD s Athlonom ThunderBirdom na 1.500 GHz) pracoval s 2x133.3 = 266.6 MHz zbernicou a vývoj v AMD smeroval logicky k používaniu pamätí DDR. Ďalšie procesory tejto rodiny Athlonov niesli označenie 1600+ na 1.400 GHz, 1700+ na 1.4666 GHz, 1800+ na 1.5333 GHz, 1900+ na 1.600 GHz, 2000+ na 1.6666 GHz a posledný 2100+ na 1.7333 GHz, objavili sa aj informácie o Palomine s ratingom 2200+ a frekvenciou 1.8000 GHz.
Detailné porovnanie jadier poslednej rodiny generácie K7, čiže Athlonov XP : vľavo prvé štvorcové Palomino 0.18 µm s 256 kB L2 vyrovnávacej cache pamäte, v strede obdĺžnikový a výkonný ThoroughBred 0.13 µm 256 kB L2 cache a vpravo ešte obdĺžnikovejší a najvýkonnejší motor celej generácie K7 - Barton 0.13 µm s nádržou na 512 kB L2 cache. Pri porovnaní ThoroughBreda a Bartona je dobre viditeľné zdvojnásobenie L2 cache pamäte v spodnej časti jadra procesora. Podobne pri porovnaní Palomina s výrobným procesom 0.18 µm a ThoroughBreda so svojimi 0.13 µm, je vidieť preskupenie L2 cache do spodnej časti – nedošlo však k žiadnemu preskupeniu L1 cache a ani jednotiek výpočtového jadra procesora.
Je vskutku neuveriteľné, že napríklad Palomino 1800+ s frekvenciou 1.5333 GHz v niektorých oblastiach šliape na päty nie Pentiu 4 na 1.800 GHz (čo by podľa ratingu malo), ale Pentiu 4 na 2.000 GHz! V júli 2002 AMD uvádza ďalšiu modifikáciu Athlonu a síce Athlon XP s jadrom ThoroughBred-OA (žrebec plnokrvník, čistokrvné plemeno koňa) stále ešte s 2x133.3 MHz zbernicou ale vyrábaný už 0.13 µm technológiou a asi s 37.6 miliónmi tranzistorov na čipe. Tu AMD jasne ukázalo, že technológia 0.18 µm, polovičná efektívna frekvencia dátovej zbernice (2x133.3 MHz namiesto 4x133.3 MHz u Pentia 4) má svoje hranice až niekde pri výkone hypotetického Pentia 4 Wilamette, 256 kB L2 cache na 2.200 GHz, zatiaľčo Intel už skoro rok 34
vyrábal výkonovo porovnateľné Pentia 4, ale technológiou 0.13 µm a s údajovou zbernicou 4x133.3 MHz. Vzápätí spolu s populárnymi chipsetmi VIA Apollo KT266 a KT266A sa na thru pre AMD a jeho ThoroughBredy začína prezadzovať chipset VIA Apollo KT333. Athlon XP ThorouhgBred (ako piata modifikácia jadra K7 s pomysleným označením K7-V) štartoval v polovici roku 2002 s ratingom 2200+, plochou čipu 85 mm2 a voltážou jadra 1.50 až 1.65 V a frekvenciou 1.8000 GHz, ďalej cez 2400+ na 2.000 GHz a 2600+ na 2.1333 GHz. Posledný model 2600+ vyšiel však len „papierovo“ - v dobe tzv. uvedenia na trh ho v skutočnosti na trhu nebolo možné zohnať (dostal sa k nám až tesne pred Vianocami 2002).
Frekvenčne najrýchlejší Athlon XP ThoroughBred-OB 2800+ 333.3 MHz FSB (2.2500 GHz), na obrázku je dobre viditeľný popis ,kód a séria procesora. Modely nad 2800+ majú jadro Barton.
V poslednom kvartáli 2002 sa objavujú modely 2600+ na 2.0833 GHz, 2700+ na 2.1666 GHz a 2800+ na 2.2500 GHz (bohužiaľ tiež len „papierovo“ - a neboli teda ku koncu roka 2002 na Slovensku) s modifikovaným jadrom ThoroughBred-OB (väčšie oproti pôvodnému prvému ThoroughBredu rating 2200+ približne o 3 až 4 mm2), s 37.8 miliónmi tranzistorov, vylepšenou kontrolou prehrievania a zbernicou konečne 2x166.6 = 333.3 MHz. Spolu s prvými
Vysvetlivky k popisu Athlonov XP ThoroughBred 35
Známe ID programy na CPU znázorňujúce mierne pretaktovaný Athlon XP Barton 2800+ s 333.33 MHz FSB a reálnou frekvenciou 2083.33 GHz (12.5 x 166.66 MHz), na hodnotu presne @ 2187.50 MHz (12.5 x 175.00 MHz) - rating cca 3000+ a 350.00 MHz FSB. V záujme stability systému procesor nebežal na definovanom napätí 1,650 V ale na zvýšenom 1.700 V a pamäť RAM PC3200 DDR 400 MHz @ 420 MHz na 2.6 V miesto 2.5 V.
ThoroughBredmi pracujúcimi s 333.3 MHz zbernicou sa v cenníkoch začína objavovať chipset firmy VIA Apollo KT400. Zbernicu 2x166.6 MHz = 333.3 MHz zvládajú len niektoré revízie chipsetu KT333, ale už všetky chipsety KT400. Ak sa vrátime k procesorom, tak jediní zastupci
36
ThoroughBredov na 2x166.6 = 333.3 MHz FSB v zastúpení 2600+, 2700+ a 2800+ majú najvyššie energetické nároky zo všetkých ThoroughBredov. Čo sa týka posledných ThoroughBredov s 2x133.3 = 266.6 MHz FSB, tak už aj modely 2400+ a 2600+ sa vyrábali s novšou revíziou jadra OB, prvý model ThoroughBredu 2200+ sa vyrábal najprv so staršou revíziou OA. Pri uvažovaní nad FSB za zmienku tiež stojí, že ku koncu roka 2002 sa vyrábajú napríklad dve verzie procesora AMD Athlon XP ThoroughBred 2600+ : prvý model s písmenom „C“ na konci svojho kódu a so zbernicou 2x133.3 = 266.6 MHz a násobiteľom 16.0 (t.j. pracujúci na frekvencii 16.0x133.3 = 2.1333 GHz - pri veľkej snahe ste ho u nás mohli kúpiť na samom konci roku 2002), druhý novší model „D“ so zbernicou 2x166.6 = 333.3 MHz a násobiteľom 12.5 (t.j. pracujúci na frekvencii 166.6x12.5 = 2.0833 GHz - ten ste u nás na sklonku roka 2002 zohnať nemohli...). Samozrejmosťou je tu podpora a implementácia starších technológií Rdtsc, Cmov, Hardware Prefetch, MMX, SSE, advanced AMD MMX!, ďalej 3D now!, ako aj novšie enhanced 3D now! spojené v 3D now Prefesional!, avšak vážnym nedostatkom aj tých posledných Athlonov XP je absencia podpory novšej intelovskej technológie SSE2. To sa však výrazne prejaví len v špeciálnych aplikáciách optimalizovaných pre Pentium 4 a využívajúcich inštrukčnú sadu SSE2 (napr. GIMPS Prime95 verzia 21.x a vyššia) - vtedy je Athlon XP Palomino alebo ThoroughBred (oba disponujúce s 256 kB L2 cache) asi v polovici až dvoch tretinách výkonnosti Pentia 4 NorthWood A. Na druhej strane Athlon si drží prvenstvo v operáciách s pohyblivou desatinnou čiarkou a čiastočne i v mutlimédiách a v aplikáciách neoptimalizavaných pre využívanie SSE2. Dá sa teda povedať, že ratingové označovanie procesorov firmou AMD je opodstatnené. Za zmienku tiež stojí, že ku koncu roka 2002 sa na trhu začínajú objavovať tiež „nízkotaktované“ ThoroughBredy-OB 1700+, 1800+ , ktoré nahradili staršie modely so starším stepingom a verziou jadra OA s ôsmymi tranzistorovými vrstvami (podobne ako prvý „vysokotaktovaný“ ThoroughBred-OA 2200+), s novšou revíziou jadra OB s deviatimi vrstvami, neskôr pribudli aj ďalšie „nízkotaktované“ modely so stepingom OB a ratingom 1900+, 2000+, 2100+ a 2200+. Nadšenci pretaktovania na báze platformy AMD vzäpätí našli obľubu v pretaktovávaní nízkotaktovaných Athlon XP ThoroughBredov novšej revízie. Ukazuje sa, že dva presne tie isté typy ThoroughBreda s tým istým kódom nemusia javiť pri pretaktovaní rovnaké vlastnosti, ale záleží od jednotlivých sérií procesorov. Pretaktovanie sa väčšinou realizuje drastickým zvýšením FSB, prípadne v kombinácíí so zmenou násobiteľa. Nielen násobitele, ale všetky podstatné charakteristiky procesora ako voltáž, FSB, max. pracovná teplota a.i., sú na rodinách Athlonov XP realizované a zakódované v mostíkoch na organickom púzdre procesora. Spomínané vlastnosti sa však pri rodine Athlonov XP dajú meniť aj zadrátovaním (spojením istých pinov) na procesore, alebo socketu na základnej doske. Pre matematiky-milovných čitateľov ešte kompletná ponuka užitočných vzorcov pre prevod AXP a P4 ratingu (L1 cache AXP je všade 128 kB) : Nech M je model procesora AMD Athlon XP (Palomino; 0.18 µm; 266.6 MHz FSB; 256 kB L2 on die cache), M = 1500+, 1600+, 1700+ ... 2100+ a f je frekvencia procesora v GHz. Potom platí : M + 500 M = 500(3 f − 1) f = 1500 Nech M je model procesora AMD Athlon XP (ThoroughBred „C“; 0.13 µm; 266.6 MHz FSB; 256 kB L2 on die cache, na sade násobičov nezáleží), M = 1700+, 1800+ ... 2200+ (okrem 2400+
37
a 2600+) a f je frekvencia procesora v GHz. Potom platí : M + 500 f = M = 500(3 f − 1) 1500 Nech M je model procesora AMD Athlon XP (ThoroughBred „C“; 0.13 µm; 266.6 MHz FSB; 256 kB L2 on die cache, premapovaná sada násobičov), M = 2400+ a 2600+ (len pre tieto dva modely) a f je frekvencia procesora v GHz. Potom platí : M + 600 f = M = 600(5 f − 2) 1500 Nech M je model procesora AMD Athlon XP (ThoroughBred „D“; 0.13 µm; 333.3 MHz FSB; 256 kB L2 on die cache, na sade násobičov nezáleží), M = 2600+, 2700+ a 2800+ a f je frekvencia procesora v GHz. Potom platí : M − 100 M = 100(12 f + 1) f = 1200 Nech M je model procesora AMD Athlon XP (Barton „D“; 0.13 µm; 333.3 MHz FSB; 512 kB L2 on die cache, štandardná sada násobičov), M = 2500+, 2600+ a 2800+ a f je frekvencia procesora v GHz. Potom platí : M − 300 f = M = 300(4 f + 1) 1200 Nech M je model procesora AMD Athlon XP (Barton „D“; 0.13 µm; 333.3 MHz FSB; 512 kB L2 on die cache, premapovaná sada násobičov), M = 3000+ a f je frekvencia procesora v GHz. Potom platí : M − 400 f = 1200
M = 400(3 f + 1)
Nech M je model procesora AMD Athlon XP (Barton „E“; 0.13 µm; 400 MHz FSB, 512 kB L2 on die cache, na sade násobičov nezáleží), M = 3000+ a 3200+… a f je frekvencia procesora v GHz. Potom platí : M − 1000 f = M = 1000( f + 1) 1000
Prvý pohľad na generáciu K7 a rodiny použitých Athlonov : vpravo Palomino XP, v strede najstarší zástupca ThunderBird a vľavo prvý ThoroughBred XP (vidno, že všetky procesory nesú známky používania) 38
Druhý pohľad na generáciu K7, tentoraz len na rodiny Athlonov XP : vľavo najstaršie Palomino, v strede solídny ThoroughBred a vpravo najvýkonnejší zo všetkých Athlonov XP Barton
K dokonalosti celých rodín Athlonov XP ThoroughBredov chýbajú už len „nízkotaktované“ modely ThoroughBred-OB so zbernicou 333.3 MHz a ratingom 2200+ a 2400+ (neškodil by ani model 2500+). ThoroughBredy s týmto ratingom majú síce novšiu revíziu jadra OB, ale disponujú s 266.6 MHz FSB, zatiaľ čo ThoroughBredy so zbernicou 333.3 MHz majú svojich zástupcov len s ratingom 2600+, 2700+ a 2800+. Zaujímavé postavenie má model Athlon ThoroughBred 2600+, ktorý sa vyrába (alebo aspoň istý čas vyrábal) ako s 266.6 MHz, tak i 333.3 MHz zbernicou. Ako už bolo uvedené, model s 266.6 MHz FSB pracuje na frekvencii 2.1333 GHz a model s 333.3 MHz FSB na 2.0833 GHz. Ak si uvedomíme rýchlosť pamäte DDR 266.6 MHz (266.6x8 = 2.1333 Gb za sekundu), dostávame tak lahodiacu sústavu zbernice na 266.6 MHz, pamätí na 266.6 MHz a rýchlosti procesora 2.1333 GHz a priepustnosti operačnej pamäte 2.1333 Gb/s. Model 2600+ s 266.6 MHz FSB je teda posledný vhodný pre pamäť DDR na 266.6 MHz (označovanú ako PC2100 – presnejšie PC2133.3). Rýchlejší procesor by bol už pamäťou DDR2100 brzdený. Aká je situácia v prípade 333.3 MHz zbernice a pamätí? DDRAM na 333.3 MHz má priepustnosť 333.3x8 = 2.6666 Gb/s (označovaná ako PC2700 – presnejšie PC2666.6). Procesor Athlon XP na frekvencii 2.6666 GHz by mal rating 3300+ pre ThorougBred a 3500+ pre Barton, samozrejme s 333.3 MHz zbernicou. Rýchlejší procesor by bol opäť pamäťou DDR2700 brzdený. Zatiaľ najrýchlejšia bežne dostupná pamäť DDR na 400 MHz s priepustnosťou 400x8 = 3.200 Gb/s (označovaná preto PC3200) môže naplno využiť výkon procesora Athlon XP Barton so 400 MHz FSB na 3.200 GHz, ktorý by mal rating cca 4000+! V poslednom čase sa objavili pamäte DDR na frekvenciách 433.3, 466.6, 500 a dokonca 533.3 či 550 a 566.6 MHz s neuveriteľnou priepustnosťou porade 3466.6, 3733.3, 4000, 4266.6 či 4400 a 4533.3 Gb/s (označované preto PC3500, PC3700, PC4000, PC4200 či PC4400 a PC4500) – jedná sa o posledných zástupcov DDR-I, výkonnostnú štafetu po nich preberú DDRII. Tie dokážu zamestnať aj Athlon XP Barton so 400 MHz FSB na teoretickej reálnej frekvencii nad 3.500 GHz. Jeho hypotetický rating by bol cca 5000+! Pre zaujímavosť spomeňme, že najstaršie pamäte DDR na frekvencii 2x100=200 MHz s priepustnosťou 1.600 Gb/s, sú najvhodnejšie pre procesor do frekvencie 1.600 GHz s 200 MHz FSB (prípadne 266.6 MHz, nakoľko 200 MHz FSB disponujú len niektoré staršie Athlony ThunderBirdy s frekvenciou pod 1.400 GHz, predchodcovia rodín Athlonov XP). AMD čerpá názvy pre svoje nové jadrá CPU u amerických čistokrvných plemien koní, takže je pravdepodobné, že aj názov Barton má niečo spoločné s nejakým plemenom čistokrvného koňa, ako posledná rodina zo siedmej generácie K7 procesorov spod stajne AMD. Pri ratingovom označovaní prvých Athlon XP Bartonov s písmenom „D“ na konci popisu s 333.3 MHz FSB sa 39
môžeme spýtať, či je opodstatnené posunúť hranicu o 200 PR bodov len kvôli zvýšenej kapacite L2 cache z 256 na 512 kB. Toto zvýšenie sa výrazne prejaví len v prípade, ak procesor pracuje s veľkými množstavmi dát, príp. s dátami, ktoré sa predtým nesmestitli do menšej cache. Zohľadnením väčšiny relevantných faktorov (kapacita L2 cache, frekvencia zbernice, reálna frekvencia samotného procesora ...) dostávame nasledovné vyrovnané či spriemernené výkony Bartonov vs. ThoroughBredov : - Athlon XP Barton „D“ 3000+, (reálne 2.16666 GHz), 512 kB L2 cache s 333.3 MHz FSB je asi na úrovni Athlonu XP ThoroughBred „D“ 2800+, (reálne 2.2500 GHz), 256 kB L2 cache s 333.3 MHz FSB - Athlon XP Barton „D“ 2800+, (reálne 2.08333 GHz), 512 kB L2 cache s 333.3 MHz FSB je asi na úrovni Athlonu XP ThoroughBred „C“ 2600+, (reálne 2.13333 GHz), 256 kB L2 cache s 266.6 MHz FSB - Athlon XP Barton „D“ 2600+, (reálne 1.91666 GHz), 512 kB L2 cache s 333.3 MHz FSB je asi na úrovni mierne pretaktovaného Athlonu XP ThoroughBred „C“ 2400+, (reálne 2.000 GHz), 256 kB L2 cache s 266.6 MHz FSB - Athlon XP Barton „D“ 2500+ (reálne 1.83333 GHz), 512 kB L2 cache s 333.3 MHz FSB je asi na úrovni Athlonu XP ThoroughBred „C“ 2400+ (reálne 2.000 GHz) 256 kB L2 cache s 266.6 MHz FSB Na margo násobičov možno poznamenať, že v prípade Athlonov XP ThoroughBredov a Bartonov je situácia iná ako v prípade väčšiny prvých Athlonov XP Palomino, ďalej všetkých ThunderBirdov a aj Duronov Spitfire či Morgan. ThoroughBred a Barton rozoznávajú až dve sady násobičov, prvú od 5.0 do 12.5 (to poskytuje 16 hodnôt Korešpondencia štandardnej & premapovanej sady binárne kódovaných štyrmi logickými násobičov FSB pri Athlonoch XP ThoroughBred & Barton 0 a 1) a poskytujúcich hodnoty pracovných frekvencií procesora od 500 do 1250 MHz pri 2x100 = 200 MHz FSB a 666.6 až 1666.6 MHz (rating 2000+) pri 2x133.3 = 266.6 MHz FSB. Ďalšia sada násobičov začína na 13.0 a pri niektorých vynechaných hodnotách končí až pri hodnote 24.0! Tá pri 2x133.3 = 266.6 MHz FSB poskytuje pracovné frekvencie procesora od 1733.3 MHz (rating 2100+) po hypotetických 3200 MHz (rating cca 4200+) a pri 2x166.6 = 333.3 MHz FSB od 2166.6 MHz (rating 2700+) po hypotetických 4000 MHz (rating cca 5600+). Uvedené informácie je treba brať so značnou rezervou, nakoľko možnosti architektúty Socketu A sú niekde pri skutočnej frekvencii 2.2 - 2.3 GHz (rating cca 3200+ až 3400+). Okrem toho BIOS-y tejto platformy neumožňujú použiť násobič väčší ako 17... AMD už v roku 2002 nestihlo ďalšiu modifikáciu Athlonu XP jadro Barton. Barton tak oficiálne vychádza až vo februári 2003 a to v zastúpení „nízkotaktovaného“ modelu 2500+ na frekvencii 1.8333 GHz a nasledujúcimi modelmi 2800+ na 2.0833 GHz a najrýchlejší model 3000+ na frekvencii 2.1666 GHz. Od počiatkov Athlonov a generácie K7 v roku 1999 sa jedná už o siedmu podstatnú modifikáciu (!!!) počnúc Ahtlonmi K7, K75 (K7-II), ThunderBird (K7-III), 40
Palomino (K7-IV), ThoroughBredy-OA a OB (K7-V a K7-VI) a nakoniec Barton (K7-VII) (333.3 MHz FSB), ktorý má ešte svojho nasledovníka Barton s jednou modifikáciou týkajúcou sa frekvencie zbernice (z 333.3 MHz na 400 MHz). Štartovacie Bartony sa teda bežne pýšia zbernicou 2x166.6 = 333.3 MHz, čo je už tretia a predposledná zbernica Athlonov počnúc 2x100 = 200 MHz, 2x133.3 = 266.6 MHz a 2x166.6 = 333.3 MHz, končiac 2x200 = 400 MHz. AMD pri uvedení Bartona urobilo okrem zvýšenia FSB aj ďalší veľký krok dopredu – zvýšila sa kapacita L2 cache a to až na 512 kB! Athlon XP Barton sa tak štandardne pýši až s 512 kB L2 cache pamäte, čím úplne zotrel a dokonca predbehol náskok Intelu v tejto oblasti. Barton tak disponuje celkovo so 128 kB L1 + 512 kB L2 cache = úctyhodných 640 kB cache pamäte celkovo (!!!), na rozdiel od 8 kB L1 (data) + 512 kB L2 = 520 kB pri Pentiu 4 NorthWood HT. Aj po započítaní L1 (inštrukčná) Trace cache u Pentií 4 NorthWood (cca 80 až 100 kB) o málo vedie Athlon XP Barton. Zvýšenie kapacity cache pamäte druhej úrovne opäť posunulo výkon procesora o niekoľko percent dopredu (pri špeciálnych náročných aplikáciach aj o viac) – napr. Najrýchlejší Athlon XP ThoroughBred-OB 2800+, 333.3 MHz FSB, 256 kB L2 cache pracuje na frekvencii 2.2500 GHz, zatiaľ čo výkonnejší Athlon XP Barton 3000+, 333.3 MHz FSB, 512 kB L2 cache „len“ na frekvencii 2.1666 GHz! Zvyšuje sa tak rating procesora pri rovnakej frekvencii a zároveň sa prehlbuje priepasť medzi frekvenciami Athlonov XP a príslušných Pentií 4 až k hranici 30 %, miesto doterajších 20 až 25 %. Athlon XP svoj výkon teda zvyšeje sériou radikálnych vylepšení pri nezmenenej (dokonca aj zníženej) frekvencii jadra procesora, zatiaľ čo Pentium 4 zvyšuje svoj výkon prevažne len zväčšovaním taktovacej frekvencie (výnimkou je zdvojnásobenie L2 cache u Pentií 4 na začiatku roku 2002 a HT technológia na konci roku 2002 – nepočítajúc zvyšovanie FSB Pentií 4 zo 400 MHz na 533.3 a 800 MHz). Následkom jednoznačne pozitívneho dvojnásobenia L2 cache stúpol počet tranzistorov Bartonu z 37.5 37.8 milóna pri rodine ThoroughBredov až na 54.3 milióna, defacto na rozvaký počet ako Pentium 4 NorthWood HT. Pritom sa samozrejme zväčšila plocha jadra z 85 – 87 mm2 pri rôznych ThoroughBredoch až na 101 mm2. Pri pozornom sledovaní zisťujeme, že existujú dva druhy Athlonov XP s ratingom 1700+ až 2200+, ďalej dva druhy 2600+ a takisto dva druhy 2800+ a pribudne aj druhý model 3000+, čo môže byť pre laika relatívne neprehľadné. V polovici mája 2003 spod stajne AMD prichádza celkom posledný spomínaný reprezentant siedmej generácie procesorov : Athlon XP s jadrom Barton s FSB 2x200 = 400 MHz, samozrejme 512 kB L2 cache pamäte. Vtedy jediný model (!) má rating 3200+ a pri násobiteli 11 pracuje na frekvencii presne 11x200.0 = 2.2000 GHz. Jeho frekvencia je teda takmer presne medzi frekvenciou ThoroughBredu-OB 333.3 MHz FSB 2800+ (2.2500 GHz – frekvenčná, ale nie výkonnostná špička generácie K7) a Bartonu 333.3 MHz FSB 3000+ (2.1666 GHz). Zo strany AMD opäť možno pozorovať pomerne veľké zvýšenie ratingu svojich procesorov, nakoľko Athlon XP Barton 3200+ (2.2000 GHz) 400 MHz FSB s 512 kB L2 cache je pomerne vyrovnaný súper pre najrýchlejší Výkonnostná (nie frekvenčná) špička plnokrvník Athlon XP ThoroughBred-OB 2800+ AMD generácie K7 : Athlon XP Barton (2.2500 GHz) 333.3 MHz FSB s 256 kB L2 cache, takže 3200+ (2.200 GHz) 2x200 MHz FSB rozdiel 400 bodov v PR ratingu je minimálne pohoršujúci, nakoľko Barton 3200+ vedie nad ThoroughBredom-OB 2800+ len asi o 100-150 PR 41
bodov (a nie o 400) a nad Bartonom 3000+ asi o 50-100 PR bodov (nie o 200), z čoho vyplýva už aj prehnaný rating pre Barton 3000+ (pozri porovnanie výkonov Bartonov vs. ThroroughBredov). Na poli lacných low-endových procesorov Duron, bolo dlhšiu dobu v AMD ticho. Po vyše dvojročnej strnulosti (august 2001 – september 2003), žiadneho zdokonalenia jadra Duronu Morgan a žiadnych nových modelov na vyšších frekvenciách sa už dlhšiu dobu zdalo, že Duron je mŕtvy procesor so starou architektúrou, jadrom ThunderBird a frekvenciami maximálne na 1.300 GHz. AMD v poslednom kvartáli 2003 výrazne rozvírilo dávno pokojnú hladinu okolo takmer pochovaného Duronu Morgan s plánmi na jeho znovuoživenie v podobe tretej modifikácie. Duron s jadrom AppleBred (plod jablka) sa objavil vo štvrtom kvartáli 2003 v podobe modelov na reálnych frekvenciách 1.400 GHz (10.5x133.3 MHz) a 1.600 Vzkriesený Duron AppleBred 1800 MHz GHz (12x133.3 MHz), neskôr sa objavili modely na a 2x133.3 MHz FSB, 64/256 kB L2 cache 1.800 GHz (13.5x133.3 MHz) a 2.000 GHz (15x133.3 (64 kB funkčných, zvyšných 192 kB MHz). Medzi najpodstatnejšiu zmenu oproti Duronu deaktivovaných) Morgan patrí 0.13 µm výrobný proces miesto 0.18 µm (práve ten totiž AMD umožňuje presiahnuť 1.80 GHz hranicu reálnej frekvencie, t.j. rating okolo 2200+) a externý takt zbernice na 2x133.3 = 266.6 MHz (miesto 2x100 = 200 MHz pre Morgan). Vyššie frekvencie veľmi starostlivo kompenzuje dokonalejší 0.13 µm výrobný proces, preto môžeme očakávať napájacie napätie stále na úrovni okolo 1.5 - 1.6 V. Kapacity cache pamätí nových Duron AppleBredov sú navlas rovnaké ako v prípade Morganov, t.j. 128 kB L1 a len 64 kB L2 cache. Možno teda podobne skonštatovať, že Duron AppleBred je vlastne Athlon XP ThoroughBred prežívajúci len na 64 kB L2 cache pamäte, miesto 256 až 512 kB a so zbernicou 2x133.3 = 266.6 MHz miesto 2x166.6 = 333.3 až 2x200 = 400 MHz u Athlonov XP. Výroba Duronu s jadrom Morgan definitívne skončila na 1.300 GHz hranici a AMD už od roku 2001 začína svoje sily sústreďovať na Athlon a jeho ďalší vývoj. V skutočnosti je Duron AppleBred fyzicky totožný s Athlonom XP ThoroughBredom, ktorý má deaktivované ¾ L2 cache (t.j. používa len 64 kB miesto fyzicky prítomných 256 kB). Možno teda skonštatovať, že Duron AppleBred je okresaný Athlon XP ThoroughBred rovnakým spôsobom, ako Athlon XP Thorton je okresaný Athlon XP Barton s deaktivovanou ½ L2 cache (Thorton používa len 256 kB L2 cache z fyzicky prítomných 512 kB). Dá sa však predpokladať, že znovuvzkriesenie Durona (ani Thortona) nebude mať veľmi dlhé trvanie a v druhej polovici roku 2004, resp. v prvom polroku 2005 ich AMD naozaj definitívne odpíše, nakoľko sa vlastne jedná o zachránené procesory z výrobných liniek s vadnou časťou L2 cache (preto bola jej časť deaktivovaná) a AMD tieto inak plne funkčné procesory ponúka ako ďalšie modely. Na konci júla 2004 AMD vydáva procesory s kódovým označením Sempron pre všetky 3 platformy: staručný Socket 462 a nové 754 a 939. Nejedná sa však o nové jadrá, ale o obchodnú značku. Pri Sockete 462 sa jedná o jadrá rodín Athlonu XP obsahujúce len 256 (512) kB L2 cache, miesto 512 kB L2 cache (založené na jadre ThoroughBred-OB, resp. Barton), predtým označované ako Value. Architektúra týchto procerorov nie je tak náchylná na menšiu L2 cache, ako procesory od Intelu. AMD Sempron pre Socket 462 (A) je náhrada za Intel Celeron D
42
Prescott, ktoré vychádzajú takmer súčasne. Z ďalších charakteristík Sempronu možno spomenúť typické napájanie 1.60 a 1.65 V a typickú bartonovskú zbernicu 2x166.6 = 333.3 MHz. Procesory Sempron rovnako ako všetky rodiny Athlonov XP používajú PR rating na označenie frekvence (či skôr výkonu), ktorý sa podľa AMD vzťahuje k pôvodným priekopníckym procesorom Athlon ThunderBird z roku 2000, ktoré odštartovali budúcnosť generácie K7 a Socketu 462 pre bežných používateľov. Semprony zastupujú modely 2800+ (2.000 GHz), 2600+ (1.8333 GHz), 2500+ (1.7500 GHz), 2400+ (1.6666 GHz), 2300+ (1.5833 GHz) a 2200+ (1.500 GHz), všetky založené na spomínaných jadrách ThorougbBred-OB (t.j. iba s 256 kB L2 cache) a vyrábané 0.13 µm technológiou. Na konci septembra 2004 vychádza aj model Sempronu 3000+ pre Socket 462 s reálnou frekvenciou 2.000 GHz založený na jadre Barton, t.j. s 512 kB L2 cache. Tu je vidno ako sa AMD pohráva s PR ratingom a ku koncu roka 2004 je situácia zahmlenejšia ako kedykoľvek predtým (kde sú staré časy na konci roku 2001, keď vyšliel prvý Athlon XP s jadrom Palomino a pre výpočet PR ratingu (ktorému sa dalo ešte veriť) fungoval jediný univerzálny vzorec)........ Z prehľadu je zrejmé, že Semprony majú nižšie násobiče (a tým i reálne frekvencie) ako ich bratia Athlony XP a rating je opäť posunutý asi o 200 PR bodov v porovnaní s Bartonmi, ale pokles výkonu nie je natoľko dramatický. Podľa AMD se jedná o poslednú modifikáciu procesorov generácie K7 do konca roku 2005, kedy bude ukončená podpora platformy Socketu 462 (A). K platforme AMD možno urobiť ešte jednu poznámku – už na začiatku roku 2002 AMD finišovalo výrobu lacnejších low-endových procesorov Duron a teraz sa zdá (ale len na oko), ako by si AMD pílilo pod sebou konár, nakoľko nemá procesor pre lacné počítačové zostavy. Durony Morgan na 1.000 až 1.300 GHz sa v ponuke objavujú ešte aj v druhom kvartáli 2003 ale s postupom ku koncu roka postupne vymizli, nakoľko ich výroba sa ukončila už dávnejšie. Štafetu low-end procesorov siedmej generácie prebral na seba ku konci roka 2003 posledný Duron s jadrom AppleBred s frekvenciami 1.400 – 2.000 GHz a na konci roku 2004 Sempron s ratingom 2200+ až 2800+. Špičku AMD pre generáciu K7 tvoria Athlony XP s jadrom Barton, 512 kB L2 cache a 333.3 či 400 MHz zbernicou, strednú kategóriu vypĺňajú „vysokotaktované“
Vpravo na obrázku je detail modelu Thortona 2200+ na 1.800 GHz s 266.6 MHz zbernicou, napájaním jadra 1.60 V a 256 kB L2 cache – tak hovorí popis na procesore. Pri pohľade na celé púzdro procesora vľavo vidíme zasa nápadne obdĺžnikový tvar jadra priponínajúci Bartony. Thorton je teda napoly – konštrukčne Barton s 512 kB L2 cache a napoly – ThoroughBred s funkčnou 256 kB L2 cache.
Athlony ThoroughBredy s 256 kB L2 cache a 266.6 či 333.3 MHz zbernicou a triedy lowendových procesorov Athlon pokrývali v roku 2003 prvé XP jadrá Palomino alebo 43
„nízkotaktované“ ThoroughBredy s 256 kB L2 cache a len 266.6 MHz FSB. Naozajstný low-end predstavujú Durony s jadrom AppleBread. Tak ako upadli do zabudnutia Durony s jadrom Morgan, postupne začali byť postihnuté aj prvé Athlony XP s jadrom Palomino a portfólio AMD začínali tvoriť Athlony XP ThoroughBredy a Bartony, nepočítajíc low-end zástupcov staronového Durona s jadrom AppleBred a Semprony. AMD sa rozhodlo priniesť ešte niekoľko modelov pre Socket 462 s jadrom Barton a zavŕšiť tak modelový rad s 512 kB L2 cache pamäte. Konkrétne sa jednalo ešte o dva modely Bartonov 2600+ s 333.3 MHz FSB (1916.6 MHz) a 3000+ so 400 MHz FSB (2100.0 MHz). Otázny je model 3200+ s 333.3 MHz zbernicou, ktorého reálna frekvencia by mala byť 2250.0 MHz. Otázny preto, lebo AMD robí problémy produkovať procesory Athlon XP na vyššej reálnej frekvencii ako 2.2 – 2.3 GHz. Preto frekvenčná (nie výkonnostná) špička ThoroughBred „D“ 2800+ (2.2500 GHz) sa poriadne do predaja ani nadostala. Keďže pri platforme Socketu A sú takmer celkom isto vylúčené frekvencie nad 2.3 GHz, pravdepodobne sa už nedočkáme Athlonov XP s ratingom 3400+ a vyšším – tu štafetu preberie Athlon 64. Model Bartonu 3400+ by musel mať reálnu frekvenciu aspoň 2.3 GHz, keď nie 2.4 GHz so 400 MHz FSB a aspoň 2.4 – 2.5 GHz pri 333.3 MHz FSB. Čoho sme sa ešte dočkali bolo vydanie „nízkotaktovaných“ a mierne modifikovaných Bartonov pod kódovým označením Thorton. Charakteristiky sú na vlas rovnaké ako u vyššie taktovaných plnohodnotných Bartonov, jedinými zmenami je mierny pokles počtu tranzistorov z 54.3 na 53.9 milióna a znížená frekvencia FSB z 333.3 na 266.6 MHz , prípadne zo 400 na 333.3 MHz. To znamená, že Thortony majú v porovnaní s Bartonmi veľmi mierne modifikované jadro, ale zníženie počtu tranzistorov vôbec nezodpovedá zníženiu kapacity L2 cache z 512 kB späť na 256 kB – rozdiel by musel byť cca 12-13 miliónov tranzistorov, nie 300 - 400 tisíc. Thortony majú tak na čipe fyzicky prítomných 512 kB L2 cache pamäte, možno by vedeli celú jej kapacitu aj používať, možno len prvú polovicu 256 kB – druhá polovica L2 cache je deaktivovaná. Môže sa tak jednať o akési „obrezané“ Bartony nepodarky s chybnou polovicou L2 cache, ktoré jednoducho neprešli testami a nezískali väčší rating a funkčne sa podobajú na ThoroughBredy. Rating Thortonov, t.j. alias „nízkotaktovaných“ modifikovaných Bartonov obsiahli modely 2000+, 2100+, 2200+, 2400+, prípadne aj 2600+ a spolu s prvými Palominami a tiež s „nízkotaktovanými“ ThoroughBredmi a low-end Duronmi AppleBredmi tak vytvorili segment low-end trhu produkcie AMD a nahradili a vytlačili už dávnejšie mŕtvy procesor Duron Morgan, ako aj celkom prvý Athlon XP Palomino. Ešte neskôr s najväčšou pravdepodobnosťou celé rodiny všetkých Athlonov XP počnúc prvými Palominami, všetkými výbornými ThoroughBredmi-OB, výkonnými Sempronmi a Thortonmi a najvýkonnejšími Bartonmi, ako aj všetkými Duronmi Morgan ale najmä AppleBred budú ako poslední 32-bitoví zástupci siedmej generácie K7 predstavovať lacnejšiu alternetívu k prvému 32/64-bitovému zástupcovi ôsmej generácie Athlonu 64, ktorý preberie štafetu vo výkonnostnej špičke za predpokladu, že by AMD nerozdelilo generáciu K8 - Ahtlonu 64 na niekoľko rodín low-endových a high-endových procesorov podobne ako v roku 1999 AMD rozdelilo generáciu K7 na Athlon a Duron. To sa však už stalo: „dnom“ (či skôr začiatkom pri K8 a koncom pri K7) je Sempron, „low-end“ K8 je Athlon 64 a „high-end“ K8 je Athlon 64 FX. Na záver nasledujú všetky uvedené (a aj posledné) modely posledných rodín Athlonov XP generácie K7 a ich základné charakteristiky. Jednotlivé rodiny sú usporiadané podľa výkonu a nie podľa dátumu uvedenia, prvé sú Palomina, nasledované výkonnejšími ThoroughBredmi a na rovnakej úrovni Thortonmi, kopírované Sempronmi, tabuľku uzatvárajú najvýkonnejšie motory celej generácie K7, čiže Athlony XP s jadrom Barton.
44
Model Athlonu XP (jadro)
P Rating (Model)
FSB (MHz)
Reálna frekvencia (GHz)
Kapacita L2 cache (kB)
Sada násobičov
Napájanie jadra (V)
Výroba (µm)
Palomino
1500+
2x133.3 = 266.6
(10.0x133.3) / 1000 = 1.3333
256
Štand.
1.75
0.18
Palomino
1600+
2x133.3 = 266.6
(10.5x133.3) / 1000 = 1.4000
256
Štand.
1.75
0.18
Palomino
1700+
2x133.3 = 266.6
(11.0x133.3) / 1000 = 1.4666
256
Štand.
1.75
0.18
Palomino
1800+
2x133.3 = 266.6
(11.5x133.3) / 1000 = 1.5333
256
Štand.
1.75
0.18
Palomino
1900+
2x133.3 = 266.6
(12.0x133.3) / 1000 = 1.6000
256
Štand.
1.75
0.18
Palomino
2000+
2x133.3 = 266.6
(12.5x133.3) / 1000 = 1.6666
256
Štand.
1.75
0.18
Palomino
2100+
2x133.3 = 266.6
(13.0x133.3) / 1000 = 1.7333
256
Premap.
1.75
0.18
Palomino
2200+
2x133.3 = 266.6
(13.5x133.3) / 1000 = 1.8000
256
Premap.
1.75
0.18
ThoroughBred OA / OB
1700+
2x133.3 = 266.6
(11.0x133.3) / 1000 = 1.4666
256
Štand.
1.60 – 1.50
0.13
ThoroughBred OA / OB
1800+
2x133.3 = 266.6
(11.5x133.3) / 1000 = 1.5333
256
Štand.
1.60 – 1.50
0.13
ThoroughBred OA / OB
1900+
2x133.3 = 266.6
(12.0x133.3) / 1000 = 1.6000
256
Štand.
1.60 – 1.50
0.13
ThoroughBred OA / OB
2000+
2x133.3 = 266.6
(12.5x133.3) / 1000 = 1.6666
256
Štand.
1.60 – 1.50
0.13
ThoroughBred OA / OB
2100+
2x133.3 = 266.6
(13.0x133.3) / 1000 = 1.7333
256
Premap.
1.65 – 1.60
0.13
ThoroughBred OA / OB
2200+
2x133.3 = 266.6
(13.5x133.3) / 1000 = 1.8000
256
Premap.
1.65 – 1.60
0.13
ThoroughBred OB
2400+
2x133.3 = 266.6
(15.0x133.3) / 1000 = 2.0000
256
Premap.
1.65
0.13
ThoroughBred OB
2600+
2x133.3 = 266.6
(16.0x133.3) / 1000 = 2.1333
256
Premap.
1.65
0.13
ThoroughBred OB
2600+
2x166.6 = 333.3
(12.5x166.6) / 1000 = 2.0833
256
Štand.
1.65
0.13
ThoroughBred OB
2700+
2x166.6 = 333.3
(13.0x166.6) / 1000 = 2.1666
256
Premap.
1.65
0.13
ThoroughBred OB
2800+
2x166.6 = 333.3
(13.5x166.6) / 1000 = 2.2500
256
Premap.
1.65
0.13
Thorton
2000+
2x133.3 = 266.6
(12.5x133.3) / 1000 = 1.6666
256 / 512
Štand.
1.60
0.13
Thorton
2100+
2x133.3 = 266.6
(13.0x133.3) / 1000 = 1.7333
256 / 512
Premap.
1.60
0.13
Thorton
2200+
2x133.3 = 266.6
(13.5x133.3) / 1000 = 1.8000
256 / 512
Premap.
1.60
0.13
Thorton
2400+
2x133.3 = 266.6
(15.0x133.3) / 1000 = 2.0000
256 / 512
Premap.
1.65
0.13
Thorton
2600+
2x133.3 = 266.6
(16.0x133.3) / 1000 = 2.1333
256 / 512
Premap.
1.65
0.13
Sempron
2200+
2x166.6 = 333.3
(9.0x166.6) / 1000 = 1.5000
256
Štand.
1.60
0.13
Sempron
2300+
2x166.6 = 333.3
(9.5x166.6) / 1000 = 1.5833
256
Štand.
1.60
0.13
Sempron
2400+
2x166.6 = 333.3
(10.0x166.6) / 1000 = 1.6666
256
Štand.
1.60
0.13
Sempron
2500+
2x166.6 = 333.3
(10.5x166.6) / 1000 = 1.7500
256
Štand.
1.65
0.13
Sempron
2600+
2x166.6 = 333.3
(11.0x166.6) / 1000 = 1.8333
256
Štand.
1.65
0.13
Sempron
2800+
2x166.6 = 333.3
(12.0x166.6) / 1000 = 2.0000
256
Štand.
1.65
0.13
Sempron
3000+
2x166.6 = 333.3
(12.0x166.6) / 1000 = 2.0000
512
Štand.
1.65
0.13
Barton
2500+
2x166.6 = 333.3
(11.0x166.6) / 1000 = 1.8333
512
Štand.
1.65
0.13
Barton
2600+
2x166.6 = 333.3
(11.5x166.6) / 1000 = 1.9166
512
Štand.
1.65
0.13
Barton
2800+
2x166.6 = 333.3
(12.5x166.6) / 1000 = 2.0833
512
Štand.
1.65
0.13
Barton
3000+
2x166.6 = 333.3
(13.0x166.6) / 1000 = 2.1666
512
Premap.
1.65
0.13
Barton
3200+
2x166.6 = 333.3
(13.5x166.6) / 1000 = 2.2500
512
Premap.
1.65
0.13
Barton
3000+
2x200 = 400
(10.5x200) / 1000 = 2.1000
512
Štand.
1.65
0.13
Barton
3200+
2x200 = 400
(11.0x200) / 1000 = 2.2000
512
Štand.
1.65
0.13
Štand. = štandardná sada násobičov; Premap. = premapovaná
Vývojári v Inteli ale nezaháľali. Spoločnosť Intel v novembri 2002 uvádza na trh už štvrtú (!) modifikáciu procesora Pentium 4 na frekvencii 3.0666 GHz a zbernicou 4x133.3 = 533.3 MHz s podporou HyperThreadingu (HT), stúpanie frekvencie Pentií 4 a jeho ďalšie modifikácie si nejakú tú dobu ešte užijeme (koniec koncov pri návrhu Pentia 4 a architektúry NetBurst bolo cieľom i jeho možné zdokonaľovanie) - Pentium 4 NorthWood na začiatku roku 2004 končí na 3.40 GHz hranici. Zdá sa teda že po rokoch 1999, 2000 a 2001, kedy AMD spôsobovalo odborníkom Intelu väčšie vrásky než inokedy, sú minulosťou a AMD opäť stráca dych, pretože Pentium 4 začína dospievať.
Porovnanie Pentií 4 NorthWood HT s 533.3 a 800 MHz FSB : zvrchu nie je vidieť rozdiel (okrem popisu), zospodu je iné rozmiestnenie a zmenšenie filtračných kondenzátorov. Vľavo P4 800 MHz FSB, vpravo s 533.3 MHz. 45
Ku koncu apríla 2003 Intel uvádza novú čipovú súpravu i875X, označovanú ako CanterWood (okrem toho vychádza aj chipset i865X s názvom SpringDale (Jarné údolie), ako odľahčená verzia CanterWoodu,oba ako náhrada za staršie chipsety i848X a i850X) ako aj svoj nový medzičlánok medzi Pentiom 4 Nortwood HT a Pentiom 4 Prescott a v poradí sa jedná už o zásadnú piatu (!) modifikáciu Pentia 4 od novembra 2001. Tento model má väčšinu charakteristík zhodných s posledným Pentiom 4 NorthWood HT pracujúceho na 3.0666 GHz (23.0x133.3), podporuje samozrejme novšie technológie, 266.6/333.3/400 MHz DDRAM pamäte, počíta so svojim novým chipsetom a podporuje zbernicu 4x133.3 = 533.3 MHz a aj ako celkom prvý 4x200 = 800 MHz v režime Posledné Pentium 4 quad pumped bus. Ako celkom posledné spomeňme jeho NorthWood HT na 3.400 GHz s 800 MHz FSB pre frekvenciu, ktorá je pri násobiteli 15.0 presne 3.000 GHz Socket 478 (15.0x200 MHz). S novým chipsetom, vyššou zbenicou na 800 MHz a tým aj vyššou priepustnosťou systému a HT technológiou, ktorej sa Intel asi tak ľahko nepustí, garantuje novší model tohto Pentia 4 na 3.000 GHz ešte vyšší výkon ako o niekoľko mesiacov starší model s 533.3 MHz zbernicou na takte 3.0666 GHz. Vzápätí v polovici mája 2003 o niekoľko dní vychádzajú aj „nízkotaktované“ modely NotrhWoodov s 4x200 MHz, t.j. 800 MHz quad pumped zbernicou, 512 kB L2 cache pamäte a podporou HyperThreadingu v zastúpení „nízkotaktovaných“ modelov na 2.400, 2.600 a 2.800 GHz. Na samom konci júna 2003 Intel opäť o niečo posunul absolútnu výkonnostnú špičku uvedením predposledného modelu Pentia 4 NorthWood HT s 800 MHz FSB na frekvencii 3.200 GHz, vo februári 2004 vychádza úplne posledný model pre Socket 478 na 3.400 GHz. Ku konci roka 2003 Intel vydáva Intel Pentium 4 HT Extreme Edition s jedinou odlišnosťou: integrovanou 2048 kB L3 cache pamäťou a 168 miliónmi tranzistorov! Druhý a posledný model Pentia 4 HT XE s frekvenciou 3.400 GHz vychádza podobne vo februári 2004. Jednalo sa o posledný výkrik Intelu, ako vyžmýkať z Pentia 4 a platformy socketu 478 posledné kvapky možností. Intel Pentium 4 HT XE (šiesta modifikácia Pentia 4) je vlastne pretaktovaný a upravený Intel Xeon vsadený do socketu µPGA478. Intel chcel týmto procesorom konkurovať Athlonu 64 a Athlonu 64 FX. Na poli cenovo prístupnejších Celeronov na začiatku apríla 2003 Intel po niekoľko mesačnej prestávke po uvedení modelov 2.100 a 2.200 GHz, pokračuje s uvedením dvoch modelov Celeronu rovnako s jadrom Pentia 4 NorthWood na frekvenciách 2.300 a 2.400 GHz, vyrábaných podobne ako ich starší súrodenci 0.13 µm technológiou, so 128 kB L2 cache pamäte druhej úrovne, 4x100 = 400 MHz zbernicou, cca 35.5 miliómni tranzistorov, určených samozrejme pre Socket mPGA478 podobne ako všetky doterajšie Pentiá 4 NorthWood pod 3.4 GHz. Zároveň sa z ponúk Posledné Intel Celerony 2.00 – 2.80 GHz s pomaly začínajú vytrácať prvé Celerony s jadrom jadrom Pentia 4 NorthWood, 128 kB L2 Pentia 4 Willamatte na 1.700 a 1.800 GHz vyrábané cache, 0.13 µm pre Socket 478
46
staršou 0.18 µm technológiou. Bez akýchkoľvek inovácii jadra Celeronu a technických vylepšení na konci júna 2003 vychádzajú modely na 2.500 a 2.600 GHz, na konci septembra 2003 vychádza model na 2.700 GHz a na začiatku novembra aj 2.800 GHz Celeron NorthWood. Faktom je, že platforma Pentia 4 NorthWood HT v polovici roka 2003 pomaly dožíva a dostáva sa na hranice svojich možností: maximálna frekvencia FSB 800 MHz, maximálne frekvencie procesorov 3.20 až 3.40 GHz, špecifikácie Socketu 478 a jeho napájanie sú na samej hranici možností. Intel tak prakticky vyčerpal frekvenčné možnosti NorthWoodu už na konci roka 2002 a začiatku roka 2003! Intelu tak ostávala možnosť už len o pár 100 MHz zdvihnúť frekvenciu Celeronov s jadrami NorthWood.
47
Pentium 4 Prescott & Tejas vs. K8 čiže ClawHammer (SledgeHammer) – Athlon 64 (Athlon 64 FX, Opteron)
N
ové jadro Pentia 4 Prescott uzrelo svetlo trhu
na začiatku februára 2004 (ako predposledná v poradí už siedma (!!!) modifikácia architektúry NetBurst), pýši sa architektúrou 90 nm a štartovacia frekvencia zbernice bola 4x200 = 800 MHz pre dáta a 2x200 = 400 MHz pre adresy, podobne ako pri NorthWoodoch, stropom Pentia 4 Prescott s architektúrou Socketu Takto vyzerá predprodukčná vzorka : Pentium 4 Prescott pre 478 je zbernica 4x200 = 800 Socket T775, bez pinov MHz. So zbernicou nad 800 MHz Intel príde s novým Socketom T. Medzi ďalšie vylepšenia Prescotta patrí napr. aj zvýšenie kapacity L2 cache až na 1024 kB, teda 1 MB, predĺženie celočíselnej pipeline z 20 na 31 stupňov a implementácia nových 13 inštrukcií označovaných ako PNI (Prescott New Instruction). Vzhľadom na multimediálnu povahu je ich označenie SSE3. Ako bolo uvedené, s jadrom Prescott sa lúčime so Socketom 478 (mPGA478), ktorého hranice sú niekde pri 800 MHz zbernici a 3.40 GHz frekvencii CPU a prichádza Socket LGA 775 (Land Grid Array), obsahujúci 775 pinov s označením Socket T. Prvé Pentiá 4 Prescott sa však dodávali ešte pre Socket 478 a 4x200 = 800 MHz FSB. Zbernica sa po čase zvýši na 4x266.6 = 1066.6 MHz, stropom novej platformy Prescottu a Socketu T môže byť FSB 4x300 = 1200 MHz, prípadne až 4x400 = 1600 MHz. Intel tu uvažuje o podpore budúcich pamätí DDR II a III. S pamäťami RamBus RIMM sa už nepočíta. Technológia HyperThreadingu umožňuje aplikáciám „vidieť“ dva procesory namiesto jedného (pracovanie s dvomi threadmi – vláknami inštrukcií v jednom procesore naraz), čím by sa mal opäť podstatne zdvihnúť výkon celej zostavy v aplikáciách podporujúcich a efektívne využívajúcich technológiu HT (až o 30-40 % !!!), ale nie len pri nich. Dopad technológie HT však nie je tak ružový, ako by sa zdalo – v niektorých prípadoch, kde dve paralelné inštrukcie v oboch threadoch inštrukcií majú záujem o tú istú výpočtovú jednotku (ALU či FPU), možno pozorovať dokonca pokles výkonu – na druhej strane sa to zasa nestáva často. Postupom času možno očakávať viac aplikácií a OS skutočne optimalizovaných na efektívne využívanie HT u Pentií. Môže sa teda jednať o podobnú malú revolúciu, akú Prvé Pentium 4 Prescott pod drobnohľadom
48
spôsobila prvá multimediálna inštrukčná sada MMX na prelome rokov 1996/97, ale aj nemusí. V dôsledku toho podobne napr. Pentim 4 NorthWood s HT a 800 MHz FSB na 3.000 GHz nie je 1.5-krát rýchlejšie od Pentia 4 Willamette a 400 MHz FSB samozrejme bez HT na 2.000 GHz, ale až 2-krát rýchlejšie! Ale späť k Prescottu - nebude sa pravdepodobne jednať len o jedinú modifikáciu jadra Pentia 4 v priebehu celého roka 2004 a neskôr (HyperThreading má byť zdokonalený až na 4 virtuálne procesory namiesto dvoch, t.j. HyperThreading druhej generácie pracijúci až so štyrmi threadmi paralelne, po jadre Prescott má prísť jadro Tejan). Otázna je ešte pomerne základná charakteristika Prescottu – implementácia podpory technológie 64bit, t.j. či bude procesor schopný v budúcnosti pracovať aj v 64-bitovom prostredí. Typická dátová L1 cache je u Prescottu 16 kB (miesto 8 kB pri NorthWoode), Trace L1 cache je v Prescotte v porovnamí s Willamette a NorthWoodom tiež dosť vylepšená. Prescott sa vyrába technologickým postupom Strained Silicon (napnutý kremík), ktorý Prescottu umožní isto niekedy v roku 2004 prekročiť ďalšiu magickú hranicu 4 GHz - to Pentiá 4 so svojim výrobným procesom 0.13 µm, jadrom NorthWood nie sú schopné dosiahnuť. Štartovacie frekvencie Prescottu sú však „len“ na úrovni 3.200 a 3.400 GHz a procesor pracuje s napätím 1.25 V. Nové Pentium 4 Prescott je z istého pohľadu neporovnateľné s Pentiami 4 NorthWood HT. V jednoznačný prospech Prescottu hovorí aj prestavaná architektúra. Zatiaľčo pri prechode z Pentia 4 s jadrom Willamette na jadro NorthWood na prelome rokov 2001 a 2002 si Intel s dizajnom veľké starosti nerobil a jednoducho rozšíril L2 cache pamäť, v prípade jadra Prescott je tomu úplne inak. Väčšia L1 i L2 cache je tu tiež, ale hlavne - došlo k preskupeniu jednotiek. Northwood (a čiastočne aj Willamette) trpel lokálnym prehrievaním a jeho životnosť asi nebude nijako zázračná, pretože po pretaktovaní už niekoľko kusov „zomrelo“ na tzv. syndróm náhlej smrti (sudden dead). Ďalšie zmeny sa týkajú jednotiek : FPU je preskupená v dôsledku čoho sa bude jednotka menej prehrievať a Prescott sa pri reálnych x87 inštrukciách menej potí, zdvojená ALU jednotka bude vykazovať väčší výkon ako pri NorthWoodoch, čo môže mať za následok hneď dve veci: Intel v Prescotte eleminute svoj handicap a dostihne AMD a radikálne vylepší spracovanie celočíselných x86 inštrukcií a za druhé to výrazne prospeje HT technológii s tak nejednoznačným nárastom výkonu. Vďaka tomu všetkému sa Prescott môže stať najrýchlejším 80x86 procesorom. Iný pohľad na Pentium 4 Prescott dávajú testy, ktoré sú miernym sklamaním. Pentium 4 Prescott so svojou dlhou pipeline, veľkou ale pomalou cache v istých testoch zaostáva za rovnako taktovaným Pentiom 4 NorthWood. Opakuje sa tak situácia z roku 2001 pri prechode na architektúru NetBurst, keď posledné Pentiá III Tualatin porážali rovnako taktované Pentiá 4 Willamette. Je teda viac jako pravdepodobné, že Prescott je navrhnutý pre vyššie frekvencie, než tie s ktorými prišiel na trh. Vo februári 2004 teda Intel vyrukoval modelom Pentia 4 Prescott na 3.200 a 3.400 GHz, ako aj „nízkotaktovanými“ modelmi Prescottov tikajúcich „len“ na frekvencii 2.800 a 3.000 GHz, v 2. kvartáli je v pláne model 3.600 GHz, v 3. kvartáli 3.800 GHz a v poslednom kvartáli 2004 sa Prescott pokúsi dosiahnuť 4 GHz hranicu. Procesory Pentium 4 Prescott od Intelu s frekvenciou nad 4 GHz by mali na konci roka 2004 tvoriť samotný high-end segment trhu, podobne ako modely na(d) 3 GHz na konci roku 2002 a v 1. polroku 2003. Faktom je, že Intel vo svojich roadmapoch plánuje ostať so svojim Prescotom na výslní asi rok a siahnuť si na 4 GHz (Prescotty budú pritom pokrývať „pásmo“ 2.80 – 4.40 GHz). Vo vzdialenejšej budúcnosti (2. polrok 2005) však Intel plánuje ďalšiu modifikáciu Pentia na jadro Tejas, ako celkom poslednú modifikáciú architektúry NetBurst. Informácie o Pentiu Tejase sú viac ako len hmlisté, štartovacie modely budú vyrábané pre Socket T (LGA 775), v ktorých budú sedieť Prescotty, neskôr už pre nástupcu Socketu T, štarovacia efektívna frekvencia FSB môže byť 4x266.6 = 1066 MHz, procesory Tejas sa budú už bežne pýšiť s 1 MB L2 cache (neskôr pravdepodobne s 2 MB L2 cache), vyrábané majú byť najprv 90 nm výrobným procesom, neskôr 49
dokonalejším 65 nm. Štatovacie frekvencie majú byť na úrovni 4.2 - 4.4 GHz a prekonanie zatiaľ najmagickejšej polo-okrúhlej hranice 5 GHz by nemal byť pre Pentium Tejas väčší problém. Jadrá celkom posledných Pentií 4 Precsott a Tejas môžu byť príbuzní podobne ako jadrá Willamette a NorthWood. Tejas teda asi nebude nič iné ako zdokonalený Prescott, vyrábaný dokonalejšou technológiou 65 nm umožňujúcou frekvencie nad 5 GHz, podobne ako NorthWood je zdokonalený Willamette umožňujúci frekvencie nad 2 GHz (ale pod 3.4 GHz). Doterajšie hlavné modifikácie Pentia 4 a architektúry NetBurst zahŕňa tabuľka: FSB (MHz), režim QPB
Architektúra (nm)
Frekvencia (MHz)
Kapacita L1 cache
Kapacita L2 cache (kB)
Pipeline
Počet tranzistorov
Willamette
400
180
1300 – 2000
8 kB data + 12K µops
256
20
42 mil.
NorthWood
400, 533.3 a 800
130
1600 – 3400
8 kB data + 12K µops
512
20
55 mil.
800
130
3200 & 3400
8 kB data + 12K µops
512 + 2048 L3
20
168 mil.
Jadro Pentia 4
Extreme Edition Prescott
800 a 1066.6
90
2800 – 4400
16 kB data + 12K µops
1024
31
125 mil.
Tejas
1066.6 a ???
90, 65
4400 - ?
32 kB data + 16K µops
2048
31
?
Ďalšia „nepríjemná“ odlišnosť Prescottov a NorthWoodov je ich energetická náročnosť a tepelné vyžarovanie: už štartovacie modely Prescottov v pásme 2.80 – 3.40 GHz bolo ťažké udržať na uzde, končiace modely v pásme 4.00 – 4.20 GHz budú na tom ešte horšie. Spory o chladnom Pentiu 4 a kúriacom Athlone XP sú tak definitívne minulosťou. Zmeny sa týkajú aj low-end zástupcov Intelu, čiže Celeronu. Celerony s jadrom Prescott sa objavili na samom konci júna 2004 ako inak so 4x133.3 = 533.3 MHz zbernicou quad pumped bus (QPB), vyrábané technológiou 90 nm, 256 kB L2 cache, najprv v prevedení dožívajúceho Socketu µPGA478, potom podobne ako Pentiá sa objavujú aj pre Socket T (LGA 775). Veľkosť L2 cache Intel Celeron D Prescott 335 pre socket 478 (reálna pamäte stúpla zo 128 kB pri 130 nm frekvencia 2.800 GHz, QPB 533.3 MHz, 256 kB L2 cache) modeloch na 256 kB pri 90 nm. Nové 90 nm Celerony s jadrom Prescott sa pýšia písmenkom D na konci označenia a podporujú aj inštrukčnú sadu SSE3. Počet tranzistorov sa pohybuje okolo čísla 78.9 miliónov. Konkrétne sa jedná o modely Celeronu D Prescott na frekvenciách 2.4000, 2.5333, 2.6666 a 2.8000, na konci septembra 2004 prichádza model tepajúci na 2.9333 GHz, neskôr sa ešte dočkáme 3.0666 GHz modelu. Na prelome 3. a 4. kvartálu 2004 prišli aj modely Celeronu D Prescott pre Soctet T (LGA775) taktované na tých istých frekvenciách ako PGA478, neskôr očakávame frekvencie vyššie ako 3.0666 GHz (konkrétne 3.2000, 3.3333, 3.4666 a 3.6000 GHz). Spolu s Prescottom v pobode Celeronu sa objavili aj chipsety GrantsDale (i915X) a vyspelejší AlterWood (i925X) s podporou prvých pamätí 200 pinn, 1.8 V, SDRAM DDR-II a ušité Prescottom na mieru viac ako staršie CanterWood (i875X) Logo Intel Celeronu D či SpringDale (i865X), ktoré budú postupne nahrádzané. Intel pri Prescott Prescottovskej zmene architektúry NetBurst Pentia 4 a nástupe 90
50
nm výrobného procesu vyrukoval s model-numberingom, čo je vôbec po prvý krát v histórii: jedným z hlavných parametrov v popise procesora od Intelu bola totiž vždy jeho pracovná frekvencia, čo sa však mení. Nové modelové označovanie procesorov firmou Intel sa skladá z trojice číslic a podobá sa tak na modelové označovanie procesorov Opteron firmou AMD. Intel stavil na 3 rady: 3xx, 5xx a 7xx, kde rada 3xx je vyhradená pre Celerony D Prescott, rada 5xx pre Pentiá 4 Prescott a rada 7xx pre mobilné Pentiá M Dothan (nástupcov Pentia M Centrino). Intel v Celerone D Prescott posunul výkonnostnú latku o niečo vyššie, vďaka zvýšenej QPB zo 400 na 533.3 MHz, ale najmä vďaka zdvojnásobeniu L2 cache zo 128 na 256 kB. Frekvencia QPB a najmä vyrovnávacia cache pamäť je pri architektúre NetBurst oveľa kľúčovejšia ako pri architektúre P6 (Pentium II a III), preto sa stretávame s tak odlišným výkonom procesorov pracujúcich na rovnakej frekvencii. Celeron D s jadrom Prescott je tak v porovnaní s Celeronmi NorthWood a tým viac i Celeronmi Willamette, opäť šampión na poli low-endu rovnako ako bol svojho času šampiónom Celeron s jadrom Mendocino v porovnaní s Celeronom Covington, alebo dokonalý Celeron Tualatin (0.13 µm, 256 kB L2 cache). Intel už na konci roka 2000 opustil vypilovanú architektúru P6, ktorá nemala ďaleko k dokonalosti a vrhol sa na NetBurst, ale až po takmer štyroch rokoch (!!!) ukazuje NetBurst svoje možnosti! Celeron je tak opäť hodný svojho mena v porovnaní pomeru cena/výkon... Dúfajme že v šľapajach Celeronu D prescott bude po stránke výkonu kráčať aj Pentium 4 Prescott... Modelové označovania nových 90 nm procesorov od Intelu s jadrom Prescott pre desktopy a Dothan pre laptopy zahrňuje nasledújúca tabuľka: Procesor
Nové značenie
Frekvencia (GHz)
QPB (MHz)
Pentium M Dohan (90 nm, 2 MB L2 cache)
715 720 725 730 735 740 745 750 755 760 765 770
1.5000 1.4666 1.6000 1.6000 1.7000 1.7333 1.8000 1.8666 2.0000 2.0000 2.1000 2.1333
400 533.3 400 533.3 400 533.3 400 533.3 400 533.3 400 533.3
Procesor
Pentium 4 Prescott (QPB 800 MHz)
Pentium 4 Prescott (QPB 1066.6 MHz)
Nové značenie
Frekvencia (GHz)
520 530 540 550 560 570 580 565 575 585
2.8000 3.0000 3.2000 3.4000 3.6000 3.8000 4.0000 3.7333 4.0000 4.2666
Procesor
Nové značenie
Frekvencia (GHz)
Celeron D Prescott (µPGA 478 & T775)
320 325 330 335 340 345 350 355 360 365 370
2.4000 2.5333 2.6666 2.8000 2.9333 3.0666 3.2000 3.3333 3.4666 3.6000 3.7333
Avšak AMD sa už dlho chystalo zaútočiť novou (ôsmou) generáciou procesorov. Pri taktoch nad 4 GHz však nastanú veľmi vážne problémy s dnes už i tak dosť problematickým chladením procesorov, alebo sa tiež výrazne začne prejavovať malá rýchlosť starších typov pamätí, absolútnym minimom bude DDR-I 333.3 a 400 MHz, resp. rýchlejšie, v prevedení single channel. O chladení poslednej siedmej generácie procesorov posledné tri roky okolo milénia platí len jedno : procesory od Intelu sa prehrievajú omnoho menej než konkurenčné procesory od AMD. Svedčia o tom aj experimenty zo servera Tom´s Hardware Guide (www.tomshardware.com), kde sledovali čo sa stane, keď na niekoľko sekúnd odstránime kompletne celý chladič (aktívny ventilátor aj pasívny chladič), ktorý potom vzápätí asi po 15-20 sekundách vrátime späť a to všetko pri plnom zaťažení procesora (Quake3 aréna a aplikácia Prime95) a priemernej okolitej teplote 20 °C : 1. zostava : Intel Pentium 4 NorthWood 2000 MHz, 400 MHz FSB, Socket 423, chipset Intel 850. Výsledok : aplikácia výrazne spomalí ale nespadne, teplota procesora stúpne na
51
29 °C a prežije bez akejkoľvek ujmy. 2. zostava : Intel Pentium III CopperMine 1000 MHz, 133.3 MHz FSB, Socket 370, chipset Intel 815 EP. Výsledok : aplikácia zamrzne, teplota procesora stúpne na 38 °C a tiež prežije. 3. zostava : AMD Athlon ThunderBird 1400 MHz, 266.6 MHz FSB, Socket 462, chipset VIA KT Apollo 133A. Výsledok : aplikácia spadne, teplota procesora v priebehu niekoľkých sekúnd stúpne na 372 °C (!!!) a je s okolím Socketu úplne zničený (s efektom krásne stúpajúcich kúdolov jemného dymu). 4. zostava : prvé laboratórne AMD Athlon Palomino 1200+ (1.1333 GHz), 266.6 MHz FSB, Socket 462, chipset VIA KT Apollo 266. Výsledok : aplikácia spadne, teplota procesora stúpne behom pár sekúnd na 298 °C a je tiež za účasti veľmi jemnej dymovej clony zničený.
Aplikácia projektu GIMPS Prime95 naplno zamestnávajúca a zahrievajúca každý procesor na 45 – 65 °C v mene vedy a pritom poriadne testujúca stabilitu celého systému
Z toho všetkého plynie, že sa vôbec neoplatí experimentovať s nulovým chladením ani na pár sekúnd, hlavne pri AMD. Avšak s kvalitným chladičom, dobrou teplovodivou pastou a vetranou skryňou je každý Athlon XP (aj prvé Palomino) spoľahlivý služobník s rozdielom, že jeho pracovná teplota je asi o 10 - 15 - 20 °C vyššia, než u Pentia 4, bežne okolo 50 - 55 °C, ale s kvalitným chladením a nižšou okolitou teplotou sa dá pri plnom zaťažení dostať pod 45 °C. Naopak pri nekvalitnom chladení, vyššej okolitej teplote nad 25°C a plnom zaťažení sa nám to môže veľmi ľahko vyšplhať až dosť vysoko nad 65 °C! Ale komu na tom záleží? Veď pri práci
52
na počítači nedržíme prsty na procesore..., okrem toho dnešné základné dosky disponujú spústou tepelných senzorov a dovoľujú automatické vypnutie počítača, keď teplota procesora, resp. chipsetu dosiahne isté medze, napríklad 80, 85, 90 alebo 95 °C ... 110 °C, nastavenie je v BIOSe. Na druhej strane teploty, ktoré dnešné procesory znesú (procesor je po fyzikálnej stránke schopný fungovať a nezpečú sa nám tranzistory) sa pohybujú okolo 85 – 90 °C. Aj keď je procesor pri takej teplote teoreticky schopný fungovať, rozhodne sa prevádzka pri týchto teplotách vôbec neodporúča a trápiť CPU nad 70 – 75 °C prestáva byť „zdravým športom“... A teraz späť k prognózam. Pre notebooky Intel v roku 2002 pripravoval zbrusu nový procesor Banias, neskôr s kódovým označením Centrino. Centrino ako synonymum mobilnej platformy označujúcej a zahŕňajúcej procesor, čipovú súpravu a adaptér bezdrôtových sietí, sa objavuje a spôsobuje malú mobilnú revolúciu v marci 2003. Nástupca jadra Banias a platformy Centrino prišiel v 2. polroku 2004. Jadro Dothan je už vyrábané 90 nm technológiou. To už ale nie je parketa desktopových procesorov. Kedy príde Pentium 5 (t.j. úplne nový a pravdepodobne plnohodnotný 64-bitový procesor architektúry Nehalem nasledujúcej generácie zanechávajúci architektúru NetBurst a Pentiá 4 Prescott a Tejas v tieni), zatiaľ ťažko povedať, bude to však až po roku 2006 a uvedení posledného Pentia 4 Tejas. Avšak architektúra 80x86 pre desktop PC sa tu nejakú tú dobu ešte asi udrží. V zápise 80x86 si môžeme už predstaviť miesto x číslo 8, bude sa teda jednať o ôsmu (vlastne deviatu s nultou 8086 a 8088) generáciu procesorov za viac ako posledné tri dekády, počínajúc rokom 1972. A ako to bolo pri nástupe siedmej generácie v roku 1999, prvenstvo v uvedení ôsmej generácie v roku 2003 opäť vyhralo AMD uvedením Athlonov 64 (o tom však neskôr). AMD sa v polovici roku 2003 úplne podobne ako Intel pomaly blíži k hranici, ktorú možno dosiahnuť v súčasnosti používanou platformou a jadrom procesora siedmej generácie K7. V prípade AMD a jeho EV-6 je to zbernica 2x200 = 400 MHz a PR cca 3200+ bodov (t.j. reálna frekvencia 2.200 až 2.300 GHz). V skutočnosti podľa mnohých syntetických i teoretických benchmarkov realizovaných známymi servermi, je model Bartonu 3200+ (2.200 GHz) so 400 MHz FSB len asi o 3.5 % rýchlejší od modelu 3000+ (2.1666 GHz) so 333.3 MHz FSB, ale si o 50% drahší (!!!). Tiež sa vynára otázka, či bolo správne pridať v novom Bartone „E“ 200 PR bodov len kvôli frekvencii vyššej o 33.3 MHz a vyššej frekvencie zbernice, aj keď je nesporným faktom, že vyššia frekvencia zbernice má jednoznačne pozitívny vplyv na výkon systému. Čo sa týka „porovnania“ výkonnosti najrýchlejších procesorov AMD s Intelom, tu AMD pokrivkáva. Sériou vhodne zvolených rôznych druhov benchmarkov sa ukazuje, že AMD Barton „E“ 3200+ 400 MHz FSB je asi o 4 % menej výkonný ako Intel Pentium 4 NorthWood HT na 3.000 GHz s 800 MHz FSB, asi o 6 % je výkonnejší ako ten istý model Pentia na 2.800 GHz a asi o 0.5 %
AMD ako i spústa ich priaznivcov vidí budúcnosť v kombinovanom 32 a 64-bitovom Hammeri – procesore ôsmej generácie (Opterone pre servery a Athlone 64, Athlone 64 FX pre desktopy) 53
výkonnejší ako Pentium 4 HT na 3.066 GHz s 533.3 MHz FSB. Model Bartonu-E 3200+ 400 MHz FSB má teda reálny výkon asi ako Pentium 4 NorthWood HT 800 MHz FSB na 2.900 GHz, alebo ako hypotetické Pentium 4 NorthWood HT 533.3 MHz FSB na 3.100 GHz. Je teda nad Slnko jasné, že keď model 3200+ nemôže konkurovať 3.000 GHz Pentiu s 800 MHz FSB a mešká za ním o 4 %, nebude mať ani výkon zatiaľ najrýchlejšieho Pentia 4 NorthWood HT na 3.200 GHz, kde bude v celkovom priemere meškať asi o 10 %. Na druhej strane si treba uvedoniť, že výkonnostné rozdiely sú relatívne malé (obyčajne do 10%), kým rozdiel v cenách býva aj dvojnásobný! Aby bolo AMD konkurencieschopným rivalom Intelu, potrebuje nutne zvyšovať frekvenciu svojich procesorov a čiastočne aj zbernice, nakoľko aj zvyšovanie frekvencie zbernice má na výkon procesora pozitívny vplyv. Ako príklad môže poslúžiť istý procesor na 2.000 GHz raz ako 12.0x166.6 MHz a raz ako 15.0x133.3 MHz. Problémom je, že AMD podobne ako Intel už nemôže s frekvenciou procesorov a zbernice ísť vyššie. Jedinou možnosťou na nového AMD Opteron 244 zvrchu, zospodu a zboku : vidno nástupcu Prescott od Intelu je teda odvádzač tepla (heatspreader), ktorý súčasne chráni jadro nový nástupca od AMD: K8 – pred mechanickým poškodením ClawHammer – Athlon64, nakoľko jadro Ahtlonu XP tak ako Pentium 4 NorthWood HT je na konci svojich síl a obaja sú zrelí do dôchodku. Je až neuveriteľné, čo sa podarilo AMD za 4 roky zo siednej generácie K7 vytiahnuť: frekvencia FSB stúpla dvojnásobne (z 200 na 400 MHz), reálna frekvencia procesorov skoro päťnásobne (z 500 MHz na 2.2500 GHz), rating procesorov však viac ako 6 násobne (z 500 na 3200+)! Iróniou však je, že prežitie AMD teraz závisí práve na zvyšovaní frekvencie svojich procesorov aj napriek tomu, že pred dlhším časom sa AMD nechalo počuť, keď tvrdilo, že frekvencia je prežitok...
„Prvá krv“ oficiálne - Athlon 64 3200+ (2.000 GHz, 1 MB L2 cache) pre Socket 754 Laboratórny Athlon 64 3100+ (2.000 GHz, 1 MB L2 cache) už dávno sedel v laboratórnom Sockete 754
54
V tomto čase VIA uvádza pre AMD svoj vylepšený chipset KT400A a schyľuje sa k chipsetu KT600. Pre všetky procesory Barton platí podobné ako pre posledné ThoroughBredy 2600+, 2700+ a 2800+ s 333.3 MHz FSB: doska a chipset s podporou aspoň 2x166.6 = 333.3 MHz FSB (t.j. minimálne KT333 rev 2.0, ale oveľa lepšie vrele doporučený KT400 alebo KT400A Socteket 939/940 pre Socteket 754 pre Athlony 64 resp. vtedy vychádzajúci KT600) Opterony a Athlony 64 FX a DDRAM 2700 či 3200. Posledný Barton „E“ so 400 MHz FSB ako jediný zástupca 3200+ má ešte väčšie nároky : nie všetky revízie chipsetu KT400 podporujú 400 MHz FSB, potrebný je upgrade na KT400A či KT600 (príp. iné značny ako VIA – napr. nForce2 Ultra 400) a vhodné sú jednokanálové pamäte RAM najrýchlejšie spomedzi DDR-I PC3200 (400 MHz), PC3500 (433.3 MHz), PC3700 (466.6 MHz) alebo PC4000 (500 MHz), či rýchlejšie. Na pomalšie pamäte ako DDR 400 MHz PC3200 treba zabudnúť. Je totiž viac ako nevhodné, keď je efektívna frekvencia operačnej pamäte menšia ako efektívna frekvencia FSB. V šľapajach posledných Athlonov XP Bartonov na konci septembra na prelome 3. a 4. kvartálu 2003 by malo (aspoň výkonovo) kráčať dlho očakávané 32/64-bitové „kladivo“ ôsmej generácie K8 od AMD ospevovaný Hammer s registrovaným názvom SledgeHammer - Opteron pre servery, alebo budúci ClawHammer - Athlon 64 pre desktopy, ktorý by sa mal stať novou zbraňou AMD proti Intelu a jeho Prescottu. Hammer alias Opteron, alebo Athlon 64 ako prví zástupci ôsmej generácie by mohli zohrať podobnú úlohu, ako procesor tretej generácie 80386 v druhej polovici osemdesiatych rokov, kedy sa v tichosti prešlo zo 16-bitových procesorov na 32-bitové. Takto by sa už menej ticho prešlo z procesorov 32-bitových na 64-bitové (aj keď intelovské serverové Itanium I (pôvodné označenie Merced) alebo Itanium II (Madison) je tiež 64-bitové). Na konci septembra 2003 AMD uviedlo svoje takmer dva roky odkladané K8 v podobe dvoch modelov : Athlonu 64 3200+ s 1 MB L2 cache pamäte na 2.000 GHz a jeho silnejšieho brata Athlonu 64 FX 51 tiež s 1 MB L2 cache na 2.200 GHz (rating cca 3700+) – okrem toho vychádza aj K8 pre mobilné riešenia označené ako Athlon 64 DRT (Desktop Replacement). Na prvý pohľad je zrejmé, že „slabšie“ modely bez prívlastku FX sú stále označované ratingovo, na rozdiel od ich hi-end bratov s prívlastkom FX. Nové logá Athlonu 64 a Athlonu 64 FX Athlony 64 sú určené pre bežných užívateľov, zatiaľčo Athlony 64 FX pre výkonnostnú špičku trhu. Ako spoločné môžeme uviesť 130 nm výrobný proces novou technológiou SOI (Silicon On Insulator), ktorá znižuje spotrebu čipov až o 25-30 %, takže pri zachovanom výrobnom procese 0.13 µm umožňuje vyššie frekvencie a následne znižuje produkciu zvyškového tepla (K8 sú chladnejšie a tepelne oveľa stabilnejšie
55
procesory ako K7 Athlony XP !!!), novú 2x16 bitovú dual channel 2x200 = 400 MHz DDR zbernicou typu HyperTransport (HT) začínajúcu na 2x400 = 800 MHz efektívne a konečne podporu inštrukčnej sady SSE2 (16 registrov s dĺžkou 128 bitov), čím AMD opäť zotrelo ďalšiu výhodu Pentií 4. Štartovacia frekvencia HyperTransport zbernice je 800 MHz, čo je zľahka ironické: skratka HT je tá istá akú má intelovský HyperThreading, Intel tiež v Pentiách 4 HT disponuje zbernicou maximálne na 800 MHz. Práve kvôli SOI bol príchod generácie K8 o toľko oneskorený. Výpočtové jadrá všetkých K8 Athlonov 64, Athlonov 64 FX (dokonca i Opteronov) sú v podstate odvodené od generácie K7, sú však zdokonalené. Nové procesory sú živené napätím 1.50 – 1.55 V a počet tranzistorov pri maximálnej kapacite 1024 kB L2 cache stúpol na 105.9 milióna! Kvôli výkonu, ktorý sa od procesorov očakáva, sú vybavené aj rozptyľovačom tepla (heatspreaderom), podobne ako Pentiá 4, ktorý nielen veľmi efektívne napomáha odvádzaniu tepla, ale súčasne chráni samotný čip procesora, čo pri celej generácii K7 spôsobovalo problémy a umožňuje pohodlné uchytenie chadiča. Opäť si neodpustím poznámku, že AMD „odkukalo“ výhodu Intelu aj v tejto oblasti. V porovnaní s generáciou K7 (počnúc Athlonmi ThunderBird a Duronmi SpitFire v polovici roka 2000) tu však pozorovať aj ďalší nápadný rozdiel: na žiadnom z K8 nenájdeme žiadne L mostíky!!! Jednou z najviac proklamovaných a vážených schopností procesorov generácie K8 je schopnosť pracovať aj v 64 bitovom prostredí, t.j. v 64 bitovom operačnom systéme a 64 bitovými aplikáciami, ktoré v podstate ešte neexistujú, odhliadnuc od 64AMD K8 Athlon 64 DRT pre socket 754 bez heatspreadera – je dobre viditeľné veľké jadro CPU
CPU-Z identifikuje prvý Athlon 64 rating 3200+ na 2.000 GHz a 800 MHz HHT ako aj všetky základné charakteristiky nového procesora
bitovej edície Win XP a Linuxu (Win 95 OSR1 a OSR2, 98, 98 SE, ME, NT4, 2000 a XP sú všetko 32-bitové operačné systémy). Obdiv vzbudzuje aj šírka zberníc: dátová je samozrejme 64 bitová, fyzická adresová až 40 bitová. Vďaka tomu Athlony 64 a Athlony 64 FX (podobne aj Opterony) dokážu adresovať 40 bitov fyzickej pamäte RAM (240 = 1 024 GB = 1 TB) a 48 bitov virtuálnej RAM, t.j. 262 144 GB = 256 TB RAM = 0.25 PB (petabajtov) RAM. Padla tak takmer 20 rokov stará hranica 32-bitového adresovania pre 4 GB RAM v desktopoch od čias 80386 v roku 1985 (pri rozšírení na 36-bitové adresovanie bola hranica 64 GB RAM). Procesory majú teda značnú rezervu, nakoľko pri dnešných veľkostiach modulov DDR-I (max. 2048 MB = 2 GB) a možnostiach základných dosiek pre Athlony 64 (FX) a Opterony (max. 8 pozícií) by bolo nemožné osadiť viac ako 16 GB RAM. Ďalším zlepšením oproti K7 je mierne zväčšená (predĺžená) celočíselná pipeline z 10 na 12 stupňov (Pentiá 4 NorthWood majú pre seba
56
vyváženú integer pipeline 20 stupňovú, Pentium 4 Prescott až prehnane veľkú 31 stupňovú – čo mu však spôsobuje viac škody ako úžitku) a FP pipeline z 15 na 17 stupňov. Dĺžka pipeline je veľmi ciltivá záležitosť – pri malej dĺžke možno pozorovať veľmi nízky paralelizmus v spracovaní inštrukcií, pri veľkej dĺžke je riziko čakania výpočtového jadra na vyprázdnenie celej pipeline a premrhaných cyklov pri nesprávnom odhade vetvenia kódu. 12 úrovňová celočíselná pipeline je pre AMD veľmi vyváženou zlatou strednou cestou. L1 inštrukčná cache má pri generácii K8 Athlonoch 64 (FX) 40 záznamov, miesto 24 pri K7, šírka (priepustnusť) L2 cache sa zdvojnásobila z 64 na 128 bitov, AMD tiež opäť vylepšilo úroveň predpovedania vetvenia kódu a jeho história teraz obsahuje až 16384 (16k) záznamov, miesto 4096 (4k) pri K7. Latencia L1 cache ostala na hodnote 3. AMD nepredpokladá, že by Athlony 64 (FX) a Opterony prekročili spotrebu 89 W (K7 – Athlony XP vyžarujú max. 69 W), zatiaľčo Pentium Prescott asi bude musieť počítať so spotrebou nad 100 W (to už blikajú žiarovky v miestnosti). Nové K8 – Athlony 64 (FX) i Opterony majú pri výrobnom procese 130 nm plochu jadra až 193 mm2, po prechode na 90 nm v roku 2004 sa zmenší na 120 mm2. Ako vidno zlepšení oproti generácii K7 vládnucej v rokoch 1999 až 2003 je pomerne dosť. Samotné Athlony 64 a Athlony 64 FX majú však aj svoje rozdielnosti. Ako prvý možno spomenúť socket: Athlon 64 je navrhnutý pre socket 754, kým Athlon 64 FX pre socket 940 (podobne ako Opterony), neskôr sa plánuje prechod na socket 939. Ďalším významným rozdielom je podpora dvojkanálových chipsetov a zabudovaný dvojkanálový 144 bitový (2x64 bit dáta + 2x8 bit ECC) radič pamäte v Athlone 64 FX, kým Athlon 64 má len jednokanálový 72 bitový (64 bit dáta + 8 bit ECC) radič DDR pamäte. Athlon 64 FX tak môže teoreticky dosiahnuť priepustnosť RAM až 6.4 Gb/s (pri použitej pamäti dual channel DDR-I 2x200 = 400 MHz PC3200 ECC) na efektívnej frekvencii 2x200 = 400 MHz pri 128 bitovej šírke prenosového pásma, kým Athlon 64 „len“ 3.2 Gb/s na tej istej efektívnej frekvencii 2x200 = 400 MHz pri 64 bitovej šírke pásma svojich DDR-I jednokanálových pamätí. Ako vidno AMD sa podarilo opäť eliminovať ďalší náskok Intelu, ktorý bol doteraz v práci s dvojkanálovými pamäťami nedostihnuteľný, používaním len jednokanálových. Teoreticky je tak pamäťový subsystém Athlonu 64 FX až dva krát výkonnejší ako Athlonu 64, lebo má dvojnásobnú šírku. Prakticky ten rozdiel nie je príliš veľký, niekedy až nulový, všetko závisí na tom, akú aplikáciu procesor používa. Medzi ďalšie rozdiely Athlonu 64 a Athlonu 64 FX možno sponemúť aj integráciu a kapacitu L2 cache: Athlon 64 sa bude vyrábať (resp. dodávať) vo variantách s 256 alebo 512 kB L2 cache, špičkový Athlon 64 FX jedine s 1024 kB. Pre nové procesory K8 sa objavujú chipsety VIA Apollo K8T800, resp. nForce3 150 (pokračovateľ radu nForce2 400 a nForce2 Ultra 400 pre posledné K7 – Athlony XP), na začiatku roka 2004 sa postupne schyľuje k ďalšej najvýkonnejšej variante nForce3 250 ako pokračovateľovi chipsetu nForce3 150. Ako to už býva Nové vlajkové lode AMD v polovici roka 2004: vpravo Athlon 64 chipsety nForce sú v dobe s ratingom 3800+ a vľavo ešte o niečo výkonnejší Athlon 64 FX-53 svojho uvedenia na trh len s ratingom približne 4000+, oba na reálnej frekvencii 2.400 GHz papierové sny IT nadšenca. VIA sa nedala zahanbiť a v prvom 57
kvartáli 2004 uvádza chipset VIA Apollo K8T880 a o niečo neskôr VIA K8T890 s dvojkanálovým radičom DDR-I RAM pamätí. Po uvedených modeloch zo septembra 2003 predstavujúcich „prvú krv“ nasledovali na začiatku januára 2004 ďalšie dva modely : Athlon 64 3400+ (2.200 GHz, 1 MB L2 cache) ako aj slabší ale zato cenovo prístupnejší kolega Athlon 64 3000+ (2.000 GHz, 512 kB L2 cache). V prvom kvartáli 2004 sa AMD ešte „pochválilo“ pravdepodobne najpomalším K8 – Athlonom 64, modelom 2800+ s reálnou frekvenciou len 1.8000 GHz a 512 kB L2 cache. Aj keď procesory K8 - Athlon 64 sa na prelome rokov 2003 a 2004 bežne začínajú objavovať v cenníkoch, vlajkové lode Athlon 64 FX-51 a FX-53 sú v tomto i neskoršom období stále len papierové tigre. Na samom začiatku júna 2004 AMD uvádza hneď štvoricu procesorov Athlon 64 3500+, 3700+, 3800+ a novou vlajkovou loďou sa po FX-51tke stáva Athlon 64 FX-53 s ratingom približne 4000+. Athlony 64 FX-ká sú v dobe svojho vydania (či aj chvíľu potom) najvýkonnejšie procesory pre osobné počítače, nič rýchlejšie v danom čase neexistovalo, Intel menil farby závisťou. Inou vecou je, že tieto procesory bolo ťažké zohnať a ceny neboli ľudové. Bližšie charakteristiky jednotlivých procesorov sú uvedené v nasledujúcej tabuľke. Podobne ako pre Socket 462, aj pre novší Socket 754 vychádzajú na konci júla 2004 Semprony predstavujúce lacnejšie verzie Athlonu 64 s jadrom Paris iba s 256 kB L2 cache a 130 nm výrobnou technológiou a Victoria pre 90 nm výrobný proces, oba s vypnutou podporou 64bitového režimu. Ako prvý prišiel model 3100+ na reálnej frekvencii 2.000 GHz, nasledovať bude 3400+ na 2.2000 GHz a 3700+ na 2.4000 GHz. V oblasti ratingu 4000+ AMD pravdepodobne prejde na 90 nm výrobný proces a jadro Sempron Victoria. Samozrejmosťou na platforme K8 je však už intelovská inštrukčná sada SSE2. V roku 2005 budú naledovať procesory Sempron aj pre päticu Socket 939 s potvrdenou podporou inštrukcií SSE3 a single channel pamäťového radiča. Procesory Sempron či už pre platformu K7 a Socket 462, ktorá v roku 2004 siaha na začiatok svojho konca, alebo K8 a jej nové Sockety 754 a 939, sa vyrábajú s výrazne nižšími nákladni ako ostatné procesory s 512 a najmä 1024 kB L2 cache. Štartovací Sempron Paris 3100+ (2.000 GHz, 0.13 µm, 256 kB L2 cache, 64 bit-) môže preto predstavovať vstup na platformu K8 a Socket 754 za „ľudovú“ cenu, pričom výkonovo je porovnateľný s najslabším ale o niečo drahším Athlonom 64 2800+ (1.800 GHz, 0.13 µm, 512 kB L2 cache, 64 bit+). Neskôr v roku 2004 a 2005 čaká celú generáciu K8 (Opterony aj Semprony, Athlony 64, Athlony 64 FX i mobilné Athlony 64 DTR) prechod na 90 nm výrobný proces umožňujúci ďalšie zvýšenie reálnej frekvencie, prebudovanie radiča a podpora budúcich pamätí SDRAM DDR-II (400, 533.3, 666.6 a 800 MHz efektívne) a novej 64-bitovej grafickej zbernice PCI-Express 16x. AMD má už pre nové 130 a 90 nm Athlony 64 pre roky 2004 – 2005 aj mená: nové Opterony sa budú pýšiť jadrom Athens, Athlony 64 Victoria a Paris, Athlony 64 FX San Diego a mobilné Athlony 64 DTR Odessa. Karty značne zamiešali aj procesory pre Socket 939, kde kraľuje Athlon 64 s jadrom NewCastle. Athlony 64 Victoria a Paris (t.j. Semprony) pre Socket 754 a hlavne Athlony 64 NewCastle pre Socket 939 by sa mali dostať na(d) rating 4000+, zatiaľčo Athlony 64 FX San Diego pre Socket 939/940 by mali byť zastúpené modelmi FX-55, FX-57... s ratingom vysoko nad 4000+ a byť prakticky výkonovo nedostihnuteľné super čipy (veru bude mať čo robiť aj Pentium 4 s jadrom Prescott pri frekvenciách nad 4 GHz). Aktuálnu situáciu a prognózu do krátkej budúcnosti procesorov Athlon 64 (FX) a ich základné charakteristiky zobrazuje nasledujúca tabuľka:
58
Model Hammer K8
Jadro
XP Rating
HTT (MHz)
Socket
Reálna frekvencia CPU (GHz)
Kapacita L2 cache (kB)
Výrobný proces (nm) SOI
Athlon 64 2800+
ClawHammer
2800+
800
754
1.800
512
130
Athlon 64 3000+
ClawHammer
3000+
800
754
2.000
512
130
Sempron 3100+
Paris
3100+
800
754
2.000
256
130
Athlon 64 3200+
ClawHammer
3200+
800
754
2.000
1024
130
Athlon 64 3400+
ClawHammer
3400+
800
754
2.200
1024
130
* Sempron 3400+
Paris
3400+
800
754
2.200
256
130
Athlon 64 3500+
NewCastle
3500+
1000
939
2.200
512
130
Athlon 64 3700+
ClawHammer
3700+
800
754
2.400
1024
130
* Sempron 3700+
Paris
3700+
800
754
2.400
256
130
Athlon 64 3800+
NewCastle
3800+
1000
939
2.400
512
130
* Athlon 64 4000+
ClawHammer
4000+
800
754
2.600
1024
130
* Sempron 4000+
Victoria
4000+
800
754
?
256
90
Athlon 64 FX-51
SledgeHammer
800
940
2.200
1024
130
Athlon 64 FX-53
San Diego
1000
939
2.400
1024
130
Athlon 64 FX-53
SledgeHammer
800
940
2.400
1024
130
* Athlon 64 FX-55
San Diego
1000
939
2.600
1024
130
* Athlon 64 FX-57
San Diego
1000
939
2.800
1024
90
cca 3700+ cca 4000+ cca 4000+ cca 4300+ cca 4500+
Počet kanálov : (max. DDR) 1: (DDR400) 1: (DDR400) 1: (DDR400) 1: (DDR400) 1: (DDR400) 1: (DDR400) 2: (DDR400) 1: (DDR400) 1: (DDR400) 2: (DDR400) ?: (DDR400) 1: (DDR400) 2 : (ECC DDR400) 2: (DDR400) 2 : (ECC DDR400) 2 : (ECC? DDR400) 2 : (ECC? DDR400)
EVP
Šírka pamäťovej zbernice
Veľkosť čipu (mm2)
Počet tranz. (mil.)
nie
64 bit
144
68.5
nie
64 bit
144
68.5
nie
64 bit
119
49.8
nie
64 bit
193
105.7
nie
64 bit
193
105.7
nie
64 bit
119
49.8
áno
128 bit
144
68.5
áno
64 bit
193
105.7
nie
64 bit
119
49.8
áno
128 bit
144
68.5
áno
64 bit
193
105.7
nie
64 bit
119
49.8
nie
128 bit
193
105.7
áno
128 bit
193
105.7
áno
128 bit
193
105.7
áno
128 bit
193
105.7
áno
128 bit
120
105.7
* procesor ešte nebol uvedený (august 2004) ** HTT (HyperTransport Technology) *** EVP (hardware Enhanced Virus Protection)
Pripomeňme, že v pôvodných roadmapoch AMD rating pre „prvú krv“ Athlon 64 ClawHammer 3200+ (2.000 GHz, 1 MB L2 cache, 130 nm, Socket 754) bol pôvodne 3100+, takže by sme sa dočkali pekne odstupňovaných modelov s rozdielom 300 PR bodov (2800, 3100, 3400, 3700, 4000 ...). Za povšimnutie stojí fakt, že reálna frekvencia žiadneho procesora AMD (ani nových K8 Sempronov, Athlonov 64 a Athlonov 64 FX) ani v polovici roka 2004, zatiaľ neprekročila hranicu 2.40 GHz (Intel pritom v prvom polroku 2004 „existuje“ na 3.40 GHz čo sú samotné možné hranice Socketu 478 a nádejou pre vyššie frekvencie je Socket T – LGA 775 a nové Pentium 4 s jadrom Prescott), pri AMD sa však napriek tomu stretávame s ratingom na hranici 4000+ (model Athlon 64 FX-53). Ak dodáme, že hypotetický Athlon 64 FX-53 s 1000 MHz HTT, 1 MB L2 cache pre Socket 939/940 a so 128 bitovou šírkou 400 MHz dvojkanálových DDR RAM na reálnej frekvencii 3.00 GHz by bol vyrovnaný súper hypotetickému Pentiu 4 Notrhwood HT s 800 MHz FSB, 512 kB L2 cache na frekvencii približne 4.5 až 5 GHz, je zrejmé, že K8 – Athlony 64 FX sú o niečom inom ako posledné K7 – Athlony XP, pri ktorých bol rating niekedy nadhodnotený asi o 200 PR bodov (najmä modely Bartonov nad 2500+). Pri generácii K8 tak AMD definitívne pokorilo ďalší handicap, ktorý nedovoľoval procesorom od AMD občas zaexcelovať tak, ako tomu bolo v prípade procesorov od Intelu. Kapacita L2 cache sa zvýšila na 512 až 1024 kB, výrobný proces je 130 nm za pomoci technológie SOI a ďalej 90
59
nm, pamäťová zbernica má šírku tiež 128 bitov, priepustnosť zbernice dosahuje závratných 6.4 alebo 8.0 Gb/s fyzicky (podľa frekvencie HT 800 či 1000 MHz), bol zabudovaný 2 kanálový radič DDR-I pamätí (s prechodom na 90 nm výrobný proces sa chystá podpora DDR-II), bola pridaná podpora intelovských inštrukcií SSE2 (prechodom na 90 nm výrobný proces sa chystá podpora prescottovej SSE3). Jedným z posledných nedostatkov procesorov generácie K7 od AMD v porovnaní s tými od Intelu, bola malá frekvencia FSB: bežne 2x166.66 = 333.33 MHz efektívne, výnimočne pri jednom či dvoch modeloch 2x200 = 400 MHz, kým Intel sa bežne pýšil až 4x200 = 800 MHz efektívne. Zbernica HyperTranspost pri generácii K8 tak búra jednu z posledných bariér, keďže niektoré procesory tejto generácie dosahjú až 2.5-krát vyššiu priepustnosť zbernice, ako posledné Intel Pentium 4 NorthWood či Prescott HT s 800 MHz FSB. Ceny nových procesorov K8 – Athlonu 64 a Athlonu 64 FX vyrábaných technológiou 130 nm a neskôr 90 nm, nie sú nízke, ale isto prispejú k zníženiu cien posledných K7 - Athlonov XP.
Porovnanie niektorých charakteristík posledných zástupcov generácie precosorov K7 – Athlon XP a prvých zástupcov procesorov generácie K8 – Athlon 64 (FX).
Nové logo Opteronu
Už o niekoľko mesiacov skôr na konci apríla 2003 AMD uvádza svoj dlhoačakávaný serverový Opteron ôsmej generácie s kódovým označením 14x, 24x, 84x pre 1-, 2- a 8-procesorové systémy, otázniky visia nad 4procesorovými. AMD sa rozhodlo s novou ôsmou generáciou procesorov (zatiaľ len pre servery) zaviesť nový trojčíslicový systém označovania. Prvá číslica ako už vyplýva z kontextu určuje, pre aké systémy je procesor navrhnutý. Druhá a tretia číslica budú udávať výkon procesora. Druhá číslica začne až od 4 a tretia číslica bude 0, 2, 4 ... atď. Dôvodom pre takto premyslené označenie je podľa AMD skutočnosť, že by si niektorí koncoví používatelia mohli myslieť, že ide o označenie pracovnej frekvencie.
60
Tak napríklad procesory Opteron 140, 142 a 144 sú určené pre jednoprocesorové pracovné stanice a servery, zatiaľčo modely 240, 242 a 244 pre dvojprocesorové. Z nespomenutých zmnieneniahodných a nových chakteristík uveďme, že štartovacie Opterony sa vyrábajú 0.13 µm výrobným procesom, podporujú 2x200 = 400 MHz systémovú zbernicu, inštrukčnú sadu SSE2 a samozrejme aj 80x86 – 64. Modely 140, 240 a 840 pracujú na frekvencii 7x200 = 1.400 GHz; 142, 242 a 842 na 8x200 = 1.600 GHz a séria 144, 244 a 844 na 9x200 = 1.800 GHz. V auguste 2003 sa objavujú opäť rýchlejšie Opterony 246 a 846 (146 ich nasledoval) na frekvencii 10x200 = 2.000 GHz a stávajú sa tak prvými 64-bitovými procesormi, ktoré dosiahli hranicu 2 GHz (!), neskôr vyšli dvojprocesorové modely 248 s frekvenciou 2.200 GHz (a nechýbali ani 148 a 848). Ešte neutíchlo nadšenie okolo nových K8 – Opteronov & Athlonov 64 (FX) a už sa začínajú objavovať informácie o nasledovníkovi z generácie K9, ktorého prvé laboratórne exempláre plánuje AMD vyrobiť už v roku 2005! Posledné modely procesorov generácie K9 by sa mali už vyrábať technológiou 65 nm!
Jadro Opteronov a Athlonov 64 FX : viac ako polovocu jadra (62%) zaberajú obvody 1024 kB L2 cache!
61
Ďalší vývoj & prognóza
N
a prelome rokov 2002 - 2003 mohol mať doma „bežný“ človek s nie moc hlbokými
vreckami počítač, ktorý niekoľkonásobne prevyšoval výpočtovú silu superpočítačov z prelomu šesťdesiatych a sedemdesiatych rokov. Tak ma napadá, či sa situácia za dvadsať-tridsať rokov zopakuje a my budeme bežne na kolenách (alebo ktovie kde) používať počítače s výkonom rádovo 1013 až 1014 FLOPs (teda 10 až 100 tera FLOPs), čo je súčasná výkonnostná špička 32/64-bitových superpočítačov. Pre porovnanie najvýkonnejšie domáce PC dnes (Intel Pentium 4 Prescot HT 3.600 GHz s 4x200 = 800 MHz FSB pre LGA775 alebo AMD Athlon 64 FX-53 pre Socket 939 (rating cca 4000+) s 1000 MHz HTT – HyperTransport Technology), dajú rádovo okolo 1010 FLOPS = 10 giga FLOPs (operácií v pohyblivej desatinnej čiarke za sekundu). Jeden superpočítač je tak asi rádovo 104 násobne výkonnejší ako najrýchlejší osobný počítač. V budúcnosti bude viac ako kedykoľvek v minulosti platiť, že výkon procesora (a napokon aj celej počítačovaj zostavy) nebude bezvýhradne závisieť len od frekvencie procesora - trend je badateľný už teraz : Athlon 64 FX-53 (rating cca 4000+) pracuje na reálnej frekvencii presne 2.400 GHz a AMD ním poskytuje výkon celkom porovnateľný alebo aj vyšší ako Intel Pentiom 4 Prescott HT na 3.600 GHz, ktorého frekvencia je o 1200 MHz, teda celých 50 % vyššia. Dôvodom že procesory od AMD dosahujú porovnateľné výkony ako procesory od Intelu na tak zníženej frekvencii, je premyslená a veľmi efektívne pracujúca architektúra K8 vychádzajúca z úspešnej K7, kde sa v jednom cykle vykonajú 4 µOPS, pričom procesory Intelu Pentium 4 založené na architektúre NetBurst vykonajú v jednom cykle len 3 µOPS. Trendom budúcnosti bude pravdepodobne integrácia viacerých výpočtových jadier do jedného CPU, nakoľko samotné výpočtové jadro spravidla už dnes zaberá častokrát menšiu časť CPU ako vyrovnávacia cache pamäť druhej úrovne a tento trend bude čoraz výraznejší. K zvýšeniu výkonu prispeje aj zvyšovanie „inteligencie“ procesorov, v obmedzenej miere pridávanie cache pamäte, nové inštrukčné sady a nové technológie, pokročilejší výrobný proces a ďalšie, pričom zvyšovanie pracovnej frekvencie výkon procesora už nezdvihne natoľko ako v minulosti. Tým samozrejme netvrdíme, že zvyšovanie skutočnej frekvencie procesorov sa už nebude uskotočňovať, práve naopak. Každý komponent dnešného domáceho PC (základná doska, operačná pamäť, harddisk, grafická karta, zvuková karta, mechaniky FDD, ZIP, CD, DVD a ďalšie) má svoju vlastnú a nemenej zaujímavú históriu. Velmi búrlivý je rozvoj hlavne v oblasti harddiskov (zväčšovanie kapacity (v súč. sa dá celkom bežne zakúpiť 250 GB harddisk, zohnať sa dá aj 400 GB harddisk), prenosovej rýchlosti - rozhraní, bezpečnosti a kontroly dát) a grafických kariet (novšie grafické karty od konca 90-tych rokov obsahujú vlastný chladený grafický procesor (GPU – graphic processing unit) a počet tranzistorov je často 2-násobný ako je počet tranzistorov na procesoroch CPU). V roku 1965 si pán menom Gordon Moore, neskôr spoluzakladateľ Intelu, všimol, že hustota integrácie tranzistorov na integrovaných obvodoch sa každým rokom zdvojnásobila od doby, čo boli integrované obvody vynájdené. Bolo evidentné, že tento trend v blízkej budúcnosti bude pokračovať, ale nikto nevedel, že vydrží celé tri decéniá. Dnes sa tempo rastu trochu spomalilo, zdvojnásobenie je badateľné asi každých 18 mesiacov - a to je dnešné znenie Moorovho zákona. Väčšina expertov, včítane pána Moora samotného sa dnes domnievajú, že Moorov zákon bude platiť ešte asi dve decéniá, ale asi sa nevyhneme jeho ďalšej úprave, keď sa zdvojnásobenie bude konať asi každé dva roky.
62
Hranice technológie 0.13 µm sú niekde pri výkonnostnom ekvivalente Pentia 4 na 3.4 – 3.6 GHz, kde sme boli v 3. kvartáli 2004, 0.09 µm vydrží zhruba do 5 - 6 GHz, kam by sme sa podľa dodržania Moorovho zákona mohli dostať v druhej polovici roku 2005 a v 2006. S plným nástupom 65 nm technológie sa opäť môže zvýšiť počet tranzistorov na čipe (rádovo až na stámilióny) a tiež výkon procesorov možno až na ekvivalent 8 -10 GHz Pentiíí 4, niekedy okolo rokov 2008 - 2010. Keď sa dočkáme technológie 45 nm, 32 nm a podľa analytikov hraničných 22 či 18 nm, môžeme vyrobiť procesory rádovo s miliardami tranzistorov s výkonnostným ekvivalentom 20 - 30 GHz, s L1 cache veľkosti 512 kB či 1 MB a L2 cache pamäť integrovaná priamo v jadre CPU môže byť štandardne 2, 4 či dokonca až 8 MB (ak to vôbec bude mať zmysel) a L3 cache môže bežne dosahovať gigantické hodnoty 16, 24, 32, 64 a 128 MB (!!!), ale až niekedy v rokoch 2016 – 2018 (aj keď už v súčasnosti Itanium 2 disponuje minimálne s 1.5 MB L3 cache, štandardne s 3 MB a maximálne so 6 MB L3 cache pamäte!). Ak sa retrospektívne zamyslíme nad hustotou integrácie tranzistorov zisťujeme, že na jednotkovej ploche 1 cm2 sme na konci 60-tych rokov 10 µm či staršou technológiou vtesnali rádovo desaťtisíc (104) tranzistorov, dnes na tú istú plochu (ktorá zhruba zodpovedá ploche jadra dnešných procesorov) umiestnime technológiou 0.09 µm = 90 nm rádovo sto miliónov (108) tranzistorov, hustota ich intergrácie stúpla rádovo 10 000 násobne! Čipy pracujúce na dnešných základoch pravdepodobne nebude možné vyrábať vyspelejšou technológiou ako približne 20 nm, čo znamená fyzikálnu hranicu pre dnešné čipy. Hustota integrácie tranzistorov sa tak v najbližších 15-tich rokoch zvýši ešte niekoľko desiatok násobne (možno 30-, možno 50násobne, ťažko odhadnúť), nemožno však očakávať niekoľko tisíc násobné navýšenie ako za posledných 35-40 rokov, čo predstavuje celú históriu čipov. Blížime sa tak pomaly k momentu, keď už nebude jednoduché uvádzať stále modernejšie mikroprocesory, pamäte, pamäťové karty, disky atď... Miniaturizácia, neustále zvyšovanie kapacít a výkonu dnešnej elektroniky nás nemôže zachraňovať naveky a na prelome 2. a 3. decénia tohto centúria sa proces miniaturizácie čipov (pracujúcich stále na rovnakom základe) pravdepodobne zastaví. Elektronika založená na elektronických mikročipoch je tak dnes už za polovicou svojho rozmachu a vstupuje do jesene svojho života.S taktýmito počítačmi využívajúcimi elektroniku na samej hranici jej fyzikálnych možností sa budeme môcť baviť ústne ako s človekom v reálnom čase a môžu vzniknúť plnohodnotné virtuálne identity na báze „umelej inteligencie“. Využitia na simuláciu nesmierne zložitých procesov, ozajstné 3D aplikácie, rozpoznávanie obrazu, zvuku či ovládanie rečou, alebo používanie holografie či virtuálnej reality, ktoré boli doteraz všetky doménou superpočítačov, budú ruka v ruke s rozvojom ostatných komponentov (grafické akcelerátory, operačné pamäte ...) tiež omnoho jednoduchšie, rýchlejšie a dostupnejšie. Nemožno však nespomenúť, že pre PC existuje v súčasnosti ako platforma „Wintel+Winamd“, prezentovaná sériou operačných systémov MicroSoft Windows a počítačovými systémami založených na procesoroch od Intelu a AMD, avšak existuje aj minoritná platforma „iMac“, založená na operačnom systéme Macintosh a využívajúca výlučne elegantne vyzerajúce počítače Apple s logom nahryznutého jablka, ktorých srdcom sú výkonné procesory PowerPC G3 a novšie PowerPC G4 (v polovici roka 2003 pricháza piata generácia procesorov pre Apple Mac označovaná ako Power Mac G5, predstavujúca 64-bitový štandard pre platformu iMac). Platforma iMac/Apple sa používa hlavne pri žiaducom výkone spracovaní a strihaní videa, resp. v technickom nasadení (CAD systémy). Bohužiaľ majoritná platforma Wintel/Winamd a konkurenčná iMac sú úplne nekompatibilné. História platformy iMac na počítačoch Apple je kapitolou samou o sebe a prinajmenšom tak bohatou, ako platforma Wintelu/Winamd.
63
Literatúra & zdroje [1] [2] [3] [4] [5] [6] [7] [8] [8] [9]
Počítačový magazín PC REVUE, ročníky 1995 - 2004 http://www.intel.com (domáca stránka spoločnosti Intel) http://www.amd.com (domáca stránka spoločnosti AMD - Advanced Micro Devices) http://www.PCmech.com (server venovaný hardwaru a všetkému okolo) http://www.ITnews.sk (informačný portál zo sveta IT spojený so serverom PC REVUE) http://www.pretaktovanie.sk (server venovaný pretaktovávaniu procesorov a plný informácií) http://www.pretaktovani.cz (opäť server venovaný pretaktovávaniu procesorov a plný informácií) http://www.pctuning.cz (server podobne venovaný pretaktovávaniu procesorov a plný informácií) http://www.referaty.sk (študentské referáty a ďalšie veci zo všetkých možných oblastí) http://www.overclockers.com (server tiež venovaný pretaktovávaniu procesorov a plný informácií)
Obsah Miesto úvodu ...................................................................................................................... Charakteristika ................................................................................................................... Začiatky – 8086, 80186 ...................................................................................................... 80286 – 80486 .................................................................................................................... 80586 – Pentium vs. K5 ...................................................................................................... Pentium OverDrive, Pentium Pro, Pentium MMX & Pentium II vs. K6, K6-2 & K6-III ....... Pentium III vs. K7 – Duron & Athlon K7, K75 (K7-II), ThunderBird (K7-III) ................... Pentium 4 Willamett & NorthWood vs. Athlon XP Palomino, ThoroughBred, Thorton, Barton & Sempron .............................................................................................................. Pentium 4 Prescott & Tejan vs. Hammer (K8) Sempron, Athlon 64 a Athlon 64 FX .......... Ďalší vývoj & prognóza ....................................................................................................... Literatúra & zdroje .............................................................................................................
1 1 10 14 18 20 26 31 48 62 64
Spís(k)al – Peter Michalička
64