1/1
Hardware – doplnkové texty - procesory
Smery vývoja v oblasti procesorov V oblasti procesorov sa vývoj zameriava najmä na tri oblasti: ⇑ stále dokonalejšia a prepracovanejšia architektúra – nové jadra procesorov ⇑ používanie nových materiálov nahradenie Al spojov u procesorov spojmi Cu nový materiál použitý na izolačnú vrstvu hradla, označovaný ako SOI (Silicon on Insulator). Dosahuje nárast výkonu o 35% a na rovnakej architektúre, na tomto materiáli sa predpokladá dosiahnutie frekvencií rádu THz ⇑ neustále zmenšovanie štruktúr jednotlivých súčiastok využívaním nových technológií v súčasnosti (prelom 2001/2002) masívny prechod z technológie 0,18 µm na 0,13 µm u Intelu, AMD aj VIA; technológia 0,13 µm umožňuje znížiť šírku hradla tranzistora až na 0,07 µm. IBM dosiahla veľkosť štruktúry 0,07µm. už na jar 1998 a na tejto technológii v spolupráci s firmou Sun Microsystems pripravila 64 bitový procesor Ultra Sparc Všetky tri oblasti vývoja sa vzájomne stále ovplyvňujú a dopĺňajú: 1.
Zmenšovanie rozmerov súčiastok umožňuje
F zvyšovanie hraničnej taktovacej frekvencie ⇒ práca na vyšších frekvenciách ⇒ zvýšenie rýchlosti spracovania dát procesorom, , menšia plocha čípu ⇒ ekonomické výhody (menšia spotreba materiálu, lepšia výťažnosť); menší odber energie ⇒ nižšie nároky na chladenie F zvyšovanie hustoty integrácie, teda množstva tranzistorov na ploche čípu ⇒ možnosť realizácie dokonalejšej architektúry CPU, teda a výkonnejšieho zapojenia ⇒ zvýšenie rýchlosti spracovania dát procesorom 2.
Nové materiály umožňujú
F priame zvyšovanie hraničnej taktovacej frekvencie F zmenšovanie rozmerov súčiastok ⇒ viď bod 1.
História vývoja hrúbky vodičov na čípe technológia
použité u procesorov
10 µm
i4004 (počiatky vývoja mikroprocesorov)
...
...
0,35 µm
staršie Pentiá s takt. frekvenciou do 266 MHz
0,25 µm
Pentiá od 266 MHz až Pentium III 600 MHz, Celerony 266 MHz až 533 MHz
0,18 µm
Pentiá III od 500 MHz až po 1,1 GHz, Celerony od 600 MHz do 1,1 GHz, Pentiá 4 s jadrom Willamette
0,13 µm
Pentiá III od 1 GHz až po súč.;Celerony 1 GHz až 2 GHz, Pentiá 4 s jadrom Northwood (od jan. 2002)
0,09
Pripravuje sa pre rok 2003
0,065
Pripravuje sa pre rok 2005
Ing. Jaromír Tříska
1
Texty pre VYT a EPS, SPŠE Piešťany 2002
2/2
Hardware – doplnkové texty - procesory
Dôležité parametre, ktoré rozhodujú o vlastnostiach a výkone procesora v v
v
v v v
v
v
v v v v v v
architektúra, na ktorej je postavené jadro počet bitov – šírka dát Ø vnútorná šírka dát Ø šírka dátovej zbernice Ø šírka adresovej zbernice podporované inštrukčné sady, resp. ich rozšírenia Ø RISC, CISC F16 bitové inštrukcie, 32 bitové inštrukcie, 64 bitové inštrukcie Ø MMX, 3DNow!, SSE, SSE2 Ø EPIC, VLIW frekvencia taktovania jadra počet inštrukcií spracovaných za jeden takt jadra technológie urýchlujúce spracovanie inštrukcií Ø koprocesor Ø pipelining, počet stupňov pipeliningu Ø mechanizmus predpovedania cielovej adresy podmienených skokov Ø systém pre predpovedanie vetvenia inštrukcií Ø viacero spolupracujúcich paralelných AL jednotiek Ø zvýšenie frekvencie ALU oproti zvyšku jadra Ø špekulatívne vykonávanie inštrukcií Ø zostavenie časového plánu spracovania jednotlivých príkazov na základe analýzy toku dát Ø využívanie vopred dekódovaných mikroinštrukcií, načítaných zo špeciálnej cache veľkosť a prevedenie cache pamätí Ø veľkosť internej cache L1 Ø veľkosť cache L2 Ø prevedenie cache L2 (na základnej doske, na samostatnom čípe v spoločnom puzdre s procesorom, on-die priamo na čípe procesora); taktovanie L2 (frekvencia FSB, frekvencia jadra, iná frekvencia) Ø prevedenie, taktovanie a veľkosť cache L3 kompaktibilita procesora s inými typmi po softwarovej stránke Ø kompaktibilita základnej inštrukčnej sady Ø kompaktibilita z hľadiska rozširujúcich inštrukčných sad (MMX, 3DNow!, ...) Ø podpora procesora a ním používaných technológií zo strany chipovej sady MB podporované frekvencie zbernice FSB podporované typy pamätí Ø SDRAM, SDRAM DDR, SDRAM QDR, RDRAM technológia – hrúbka štruktúry prevedenie puzdra a pätice Ø pinová a elektrická kompaktibilita s päticami iných procesorov počet tranzistorov na čípe procesora dátum uvedenia na trh
Ing. Jaromír Tříska
2
Texty pre VYT a EPS, SPŠE Piešťany 2002
3/3
Hardware – doplnkové texty - procesory
Vnútorná šírka dát Označovanie mikroprocesorov ako x-bitových má svoj pôvod v „šírke slova“, teda počte bitov tvoriacich základnú jednotku informácie, s ktorou je daný mikroprocesor schopný pracovať. Šírke slova je prispôsobená vnútorná štruktúra mikroprocesora, jeho rozhrania i architektúra celého systému, ktorý je na mikroprocesore založený. 64 bitový mikroprocesor, musí obsahovať 64-bitové registre a podporovať zbernice so šírkou 64 bitov. Máme na mysli tak vnútorné, ako aj vonkajšie. Inštrukčná súprava Každý mikroprocesor disponuje aj vlastnou súpravou operácií, ktoré môže s údajmi vykonávať. Tú označujeme ako inštrukčnú súpravu (sadu). Aj inštrukčné súpravy sa môžu členiť podľa ich dĺžky, ktorá sa –vyjadruje v bitoch. Aj inštrukčné súpravy teda máme 8, 16, 32 a 64bitové. Čím „viac bitový“ je mikroprocesor, tým bude výkonnejší.Výkonnosť mikroprocesora je totiž priamo závislá od toho, koľko informácií (údajov - bitov) je schopný spracovať za jednotku času. Okrem nárastu výkonu samotného jadra mikroprocesora je z hľadiska vytvorenia vyváženého systému dôležité zaoberať sa aj problematikou zberníc. Šírka zberníc Spoločne s nárastom objemu spracúvaných údajov rastie aj požiadavka na širku zberníc. Ruka v ruke s rastom šírky zbernice sa na dosiahnutie vyššieho výkonu menia aj ďalšie dôležité parametre počítačovej architektúry – maximálny adresovaný priestor (udáva teoretickú kapacitu pamäte) i priepustnosť systémových zberníc (objem údajov, ktoré sa po zbernici presunú za jednotku času). Treba si však uvedomiť, že kým alternatívnym zvyšovaním priepustnosti prostredníctvom frekvencie sa obyčajne dosahuje nárast na úrovni desiatok precent, pri rozšírení zbernice sa dosahuje niekoľkonásobok pôvodnej hodnoty (obyčajne dvojnásobok). Navyša treba brať do úvahy aj skutočnosť,že je potrebné, aby boli vnútorné a vonkajšie prenosové kapacity aspoň približne vyrovnané, inak dochádza k celkovej degradácii výkonnosti systému. Inštrukčné sady CISC a RISC, technológie EPIC a VLIW Inštrukčná sada RISC (Reduce Instruction Set Computer) obsahuje malé množstvo jednoduchých inštrukcií, z ktorých sa skladá každý aj najkomplikovanejší výpočet. Inštrukčná sada RISC obsahuje všetky inštrukcie rovnakej dĺžky. Na prácu s pamäťou obsahuje iba jedinú dvojicu inštrukcií, rozhodujúca časť operácií sa vykonáva v spolupráci s registrami. RISC procesory sú konštruované tak, aby dokázali jednoduché inštrukcie vykonávať extrémne rýchlo a efektívne. Najčastejšie používané inštrukcie sa umiestňujú do cache pamäti, tým sa výrazne urýchľuje ich volanie. Pokročilé procesorové architektúry podporujú aj špekulatívne volanie inštrukcií skôr, kým je ich volanie iniciované programom, a neskôr dokonca aj vykonávanie inštrukcií do zásoby ešte skôr, kým ich potreba je vyvolaná samotným programom. V prípade správneho odhadu požiadaviek programu tak sú výsledky pripravené v okamihu, keď o ne program požiada. RISC procesory už dávno používajú techniky pipeliningu, paralelného spracovania inštrukcií, predpovedania vetvenia a skokov a vylúčenia vykonávania tých úsekov (vetví) programu, ktorých výsledky nebudú v konečnom dôsledku potrebné. Ing. Jaromír Tříska
3
Texty pre VYT a EPS, SPŠE Piešťany 2002
Hardware – doplnkové texty - procesory 4/4 Procesory RISC boli od počiatku určené pre výkonné pracovné stanice a servery disponujúce vysokým výkonom. Nevýhodou RISC architektúry je nutnosť riešiť na úrovni aplikačných programov úlohy, ktoré v CISC procesoroch vykoná automaticky príslušná inštrukcia.
Na RISC vsadili najmä IBM, Motorola, Sun Microsystems, HP a Digital. Inštrukčná sada CISC (Complex Instruction Set Computer) obsahuje množstvo často značne komplikovaných (vyše 300) inštrukcií, ich počet stále narastá (sady MMX, SSE, SSE II, ...). Inštrukcie sú rôznej dĺžky, čo ďalej komplikuje ich používanie. Prvky RISC architektúry, ako špekulatívne vykonávanie inštrukcií, vykonávanie inštrukcií do zásoby, pipelining, paralelné spracovanie inštrukcií, predpovedanie vetvenia a skokov, sa dnes bežne používajú aj v CISC procesoroch. Ich výhodou je, že množstvo špecializovaných inštrukcií umožňuje programátorom možnosť písať pomerne jednoducho aplikačný softvér. Postupom času sa ukázalo, že vývojári sú schopní prevziať z každej architektúry to najlepšie a dnes obsahujú najvýkonnejšie procesory prvky architektúry CISC aj RISC. EPIC (Explicitly Parallel Instruction Computing) Táto technológia spracovania inštrukcií kladie dôraz na paralelné spracovanie programu viacerými jednotkami a sled inštrukcií prichádzajúcich do procesora je navrhnutý tak, aby sa minimalizovala potreba analýza predpovedania skokov, prehadzovania poradia vykonávania inštrukcií a ďalších komplikácií pri organizovaní výpočtu. Vhodné poradie inštrukcií sa dosahuje už pri kompilácii programu použitím špecializovaného kompilátora. Technológia EPIC sa často kombinuje s ďalšou technológiou VLIW VLIW (Very Large Instruction Word) Umožňuje zoskupovanie jednotlivých inštrukcií do skupín súčasne vykonávaných inštrukcií. Skupina spárovaných inštrukcií sa nazýva inštrukčné slovo.
Ing. Jaromír Tříska
4
Texty pre VYT a EPS, SPŠE Piešťany 2002
5/5
Hardware – doplnkové texty - procesory
Procesory firmy Intel pre osobné počítače V roku 1968 páni Robert Noyce a Gordon Moore založili firmu Intel (Integrated Electronics), ktorá o dva roky neskôr predstavila prvý mikroprocesor označený Intel 4004. Mal 4-bitovú štruktúru, bol zostavený z 2250 tranzistorov MLS a pracoval rýchlosťou 60 000 operácií za sekundu. Adresoval 1 280 polslabík dát a 4 kB inštrukcií. Zapájal sa do vreckových kalkulačiek. V roku 1972 firmá dáva na trh prvý 8-bitový mikroprocesor 8008 zostavený z 3300 tranzistorov MOS a pracujúci rýchlosťou 30 000 operácií za sekundu. K procesoru bolo možné pripojiť pamäť kapacity 16 kB. Intel 8086 Prvý 16-bitový mikroprocesor Intel 8086 je z roku 1978. Ide o prvý člen rady iAPX 86. Jeho inštrukčný repertoár je čiastočne "zdola kompatibilný", pretože programy pre 8080 po rekompilácii bolo možné robiť i na tomto procesori. Adresovacia kapacita procesoru je 1 MB pamäti. K procesoru 8086 bol vyprojektovaný pomocný špecializovaný procesor pre určitý typ výpočtu, nazývaný koprocesor. Najznámejším je koprocesor pre matematické operácie v pohyblivej rádovej čiarke Intel 8087. Intel 8086 sa stal základom celej generácie 80x86, dodnes sa zachováva spätná kompaktibilita; vyvinutý začiatkom 80. rokov. Procesory Intel 80186 a 80188 sú rozšírením procesorov 8086 a 8088 o dva kanály rýchleho prístupu k pamati (DMA), tri programovateľné časovače impulzov a o niekoľko málo inštrukcií. Neboli veľmi úspešné a ani neboli uvedené na trh. Intel 8088 Zjednodušený variant z 8086, jeho dátová zbernica bola redukovaná na 8 bit. Pracovná frekvencia jadra 4,75 MHz. Pretože pracoval s 16 bitovou architektúrou, boli 16 bitové dáta zasielané v 2 byte za sebou. Dôvodom bolo dosiahnutie spätnej kompaktibility s 8bitovými procesormi radu Intel MCS 80. Stal sa základom počítačov IBM PC XT. Intel 80286 Mikroprocesor Intel 80286 bol daný na trh v roku 1983. O rok neskôr firma IBM predstavuje počítač IMB PC/AT osadený tímto procesorom. Procesor 80286 má nové jadro, šírka adresnej zbernice je zväčšená na 24 bitov, prac frekvencia do 12 MHz, adresovateľná pamäť sa tak zväčšila na 16 MB, má dva pracovné režimy: reálny a chránený. V reálnom režime je procesor vlastne iba rýchlejší 8086 (1MB pamati, instukčný repertoár schodný s 8086). V chránenom režime sú programátorovi dostupné všetky vlastnosti 80286. Tento režim nieje zlučiteľný s 8086, procesor adresuje až 16 MB pamäti a rovnako poskytuje podporu pre virtuálnu pameť do 1GB. Pre spoluprácu s matematickým koprocesorom 80287 je vybavený prostriedkami umožnujúcimi súčastnú prácu procesora a koprocesora. Daľej procesor podporuje zdielanie viacerých programov v operačnej pamati okrem ochrany pamaťových segmentov úrovňami oprávnenia.
Ing. Jaromír Tříska
5
Texty pre VYT a EPS, SPŠE Piešťany 2002
6/6
Hardware – doplnkové texty - procesory
Intel 80386 Jeho zrod sa datuje rokom 1985. Nové jadro, plne 32 bitový procesor, výrazné zlepšenie jednak v adresovateľnosti pamäte – vďaka 32 bitovej adresnej zbernici dokáže adresovať 4 GB operačnej pamäte, lepšia správa pamäte umožňuje pamäť rozdeliť na oblasti, v ktorých môže bežať viacero programov nezávisle na sebe. Má tri pracovné režimy: reálny, chránený a virtuálny 8086. V reálnom režime je procesor, rovnako jako 80286. Zlúčiteľný s 8086, i keď môžeme používať 32 bitové prostredie. V chránenom režime procesor pracuje jako plne 32bitový a poskytuje všetky svoje vlastnosti. Tento režim opať nieje zlúčiteľný s 8086. Dostupná kapacita fyzickej pamati je 4 GB a virtálna pamať 64 TB. Režim virtuálnej 8086 môžeme zapnúť v rámci chráneného režimu procesoru pre konkrétne úlohy. Uloha, ktorá je zpacovávaná jako "virtuálna 8086", ba v prostredí chráneného režimu chová tak, jako by bola riešená procesorom 8086 s vačšinou jeho vlastostiami. Prvýkrát sa objavuje integrovaná cache pamäť na čípe – 8 kB, umožňuje použiť externú cache na základnej doske. Pracovná frekvencia dosiahla 40 MHz. Na vykonanie jedinej inštrukcie však spotrebuje až 5 taktov. Procesor 80386 spolupracuje buď s koprocesorom 80387, alebo 80287. Zjednodušeným variantom je 80386SX, ktorý má síce vnútornú zbernicu šírky 32 bit, šírky vonkajšej adresnej a dátovej zbernice sú však prispôsobené architektúre 80286 – dá sa použiť v základných doskách pre 80286. Intel 80486 Nové jadro (zač. 90. rokov ) začína používať prvky RISC architektúry, najčastejšie používané inštrukcie má implementované priamo na úrovni logických obvodov -–realizuje ich priamo bez mikroprogramu, používa päťstupňový pipelining1, má už zabudovaný matematický Jednotka segmentácie
Stránkovacia jednotka Pamäť CACHE(L1)
Numerická výkonná jednotka
Radič CACHE
Základná výkonná jednotka Jednotka dekódovania inštrukcií
Ing. Jaromír Tříska
Jednotka predvýberu inštrukcií
6
Jednotka styku so sbernicou
Texty pre VYT a EPS, SPŠE Piešťany 2002
Hardware – doplnkové texty - procesory 7/7 koprocesor. Zlepšená architektúra umožňuje rýchlejšie spracovanie inštrukcií – na jednu inštrukciu spotrebuje čas jednoho až dvoch taktov jadra.V základnej verzii označovanej DX sa pracovná frekvencia jadra zhoduje s frekvenciou externej zbernice FSB a pohybovala sa okolo 40 MHz, resp. 66 MHz. Neskôr boli uvedené procesory označované ako DX/2 – u nich pracovalo jadro na dvojnásobnej frekvencii ako FSB, u DX/4 pracuje jadro na trojnásobku externej frekvencie. Pamäť cache L2 bola stále realizovaná iba formou externej pamäte na základnej doske. Procesor označený ako 486 SX bol totožný so základným DX, mal však odpojený matematický koprocesor.
Bloková schéma procesora 80486 Pentium V r. 1993 predstavila firma Intel nový procesor – Pentium, ktoré sa stalo základom ďalšej dlhej rady procesorov. Dôvody, prečo Intel upustil od značenia číslami a namiesto 80586 použil názov Pentium, sú najmä patentové a obchodné. Nové prvky: F superskalárne prvky a nové prvky RISC v architektúre F dve paralelné ALU, ktoré za priaznivých okolností dokážu pracovať súčasne F mechanizmus predpovedania cielovej adresy podmienených skokov F väčšia cache pamäť Nová architektúra sa prejavuje vo výraznom zvyšovaní rýchlosti spracovania inštrukcií – za priaznivých okolností Instrukčná Blok dokáže spracovať až tri CACHE predpovedania inštrukcie v priebehu skoku jediného taktu. Prvé Fronta Pentiá boli vyrábané 0,8 inštrukcií µm technológiou a pracovali na frekvencii Jednotka 60 a 66 MHz; bolo ich Celočíselná Celočíselná styku zo však vyrobených málo a ALU ALU zbernicou komerčne výraznejšou skupinou sú Pentiá Blok uvedené na trh v r. 1994, registrov vyrábané 0,6 µm technológiou a pracujúce na 75, 90 a 100 MHz. Zreťazená Datová Jednoznačne je už u nich ALU CACHE oddelená frekvencia Násobička Delička FSB a frekvencia jadra, pričom rozdiel je daný koeficientom vnútornej násobičky. Procesory sú technologicky naprosto zhodné, pretože však pri
1
Pipelining – špeciálna technika spracovania programu, kedy sa nevykonávajú inštrukcie programového kódu krok za krokom tak, ako sú v programe napísané, ale procesor si vytvára svoje vlastné poradie spracovania inštrukcií. Tie zoraďuje do tzv. pipeline. Viac v kapitole o Pentiu Pro. Ing. Jaromír Tříska
7
Texty pre VYT a EPS, SPŠE Piešťany 2002
Hardware – doplnkové texty - procesory 8/8 týchto frekvenciách začína výraznú úlohu zohrávať zahrievanie procesora a potreba jeho intenzívneho chladenia, stáva sa určujúcou vlastnosťou pre pracovnú frekvenciu jadra práve schopnosť „uchladiť“ procesor, resp. vyššia frekvencia je nastavená u procesorov, ktoré majú samovoľne menšiu tendenciu sa Pipelining prehrievať. Nad 100 MHz sa stáva U moderných procesorov, ktoré disponujú viacerými nevyhnutným aktívny chladič. výpočtovými jednotkami, nie sú inštrukcie vykonávané postupne Postupne boli na trh uvedené Pentiá krok za krokom tak, ako sú načítané inštrukčnou jednotkou, ale s pracovnou frekvenciou jadra aj 133, procesor sa usiluje rozanalyzovať tok inštrukcií v predstihu tak, aby možné určité úseky programu vykonať v predstihu. Na jednej 150, 166 a 200 MHz (0,35 µm bolo jednotke sa vykoná výpočet určitej vetvy alebo úseku programu a technológia). Interná cache bola 16 výsledky sa použijú v okamihu, kedy ich je potreba v hlavnom behu kB,cache druhej úrovne bola stále ešte programu, vykonávanom na ďalšej jednotke. Problémom je vetvenie programu: Ak sa v programe riešená formou externej pamäte na vyskytne neočakávaný skok, stanú sa „vopred spracované“ základnej doske. výsledky nepoužiteľnými. Preto je mimoriadná starostlivos ť
Pentium MMX Tento typ prešiel opäť zásadnou inováciou, ktorá spočívala najmä v implementácii 277 nových inštrukcií, označených ako MMX – sada pre prácu s multimédiami. Ďalej bola rozšírená interná cache na 32 kB a vylepšený systém pre predpovedanie vetvenia inštrukcií (tento vylepšený systém bol prevzatý z vývoja Pentia Pro). Procesory MMX si vyžiadaly nové chipsety, čo spravidla znamenalo aj nové základné dosky. Pentium Pro Nové jadro, obohatené opäť o ďalšie RISC inštrukcie; priamo na číp bola pridaná cache druhej úrovne L2, pričom jej veľkosť je rôzna – existujú viaceré varianty (256 kB, 512 kB, 1 MB), ktoré sa odlišujú najmä výslednou cenou procesora. Vyrábal sa pre frekvencie jadra 166, 180 a 200 MHz. Pipelining bol zväčšený z pôvodných piati na štrnásť. Ďalšie urýchlenie poskytla implementácia ďalších troch techník, Intelom označených súhrnne ako „Dynamic Execution“: Ing. Jaromír Tříska
venovaná analýze programu a predpovedaniu skokov a pred výkonnými jednotkami musia byť umiestnené špeciálne jednotky na výber, usporiadanie, viacstupňové dekódovanie a reťazenie inštrukcií. Tieto jednotky spolupracujú prostredníctvom cache L1 s pamäťovými tabuľkami, kde sú uložené vypočítané adresy cieľov skokov v programe, vypočítané pravdepodobné hodnoty skokov v programe a u novších typov procesorov aj údaje o histórii vývoja vetvenia programu. Ucelená línia jednotiek analýzy programu, preddekódovania inštrukcií a ich spracovania sa nazýva pipeline. Konštrukcia správne fungujúcej pipeline je ve ľmi komplikovaná záležitosť. Hlavným predpokladom efektívnej funkcie pipeline je dosiahnutie čo najpresnejšej predpovede vetvenia programového kódu. Ak sa totiž predpoveď vetvenia vykoná dobre, prebieha výpočet v jednotlivých pipeline plynule, inštrukcie sú vykonávané „s predstihom“ a jednotlivé časti programu, vykonávané jednotlivými pipeline je možné plynule sklada ť do výsledného súvislého toku dát, využitie výkonných jednotiek je optimálne a program je vykonávaný extrémne rýchlo. Ak však dôjde v predpovedi ku chybe, nastane situácia, že rozpracované úlohy v niektorých pipeline sa ukážu ako nepoužiteľné. Pipeline sa musí vyprázdniť a naplniť novými dátami. Rozpracované úlohy sa musia „zahodi ť“ a v tom čase výkonné jednotky nemajú žiadne dáta na spracovanie – musia čakať a efektívny výkon celého výpočtového systému rapídne klesá. Čím dlhšia pipeline je, tým dlhšie trvá jej vyprázdnenie a opätovné naplnenie dátami. Dá sa to zhrnúť takto: Ak analýza programového kódu prebieha spoľahlivo, je tok programu plynule rozdelený do jednotlivých pipeline, v nich sa postupne dekódujú a vykonávajú inštrukcie špeciálnymi zrýchlenými technikami a program ako celok je vykonávaný extrémne rýchlo. Dlhá pipeline je výhodou vtedy, keď pracuje spoľahlivo. Čím dlhšia pipeline, tým viac preddekódovaných inštrukcií, tým efektívnejšie spracovanie programového kódu a tým rýchlejší beh programu. Ak sa však jednotky zodpovedné za analýzu programu a jeho rozdelenie do jednotlivých vetví často mýlia, musí sa často pipeline vyprazdňovať a potom dĺžka pipeline je skôr na škodu. Dĺžka pipeline súvisí ale aj s taktovacou frekvenciou: Čím je vyššia, tým rýchlejšie prebehne vyprázdnenie „chybne založenej“ pipeline a jej naplnenie. V nárastom taktovacej fr ekvencie je tendenciou aj predlžovať pipeline.
8
Texty pre VYT a EPS, SPŠE Piešťany 2002
Hardware – doplnkové texty - procesory 9/9 F predpoveď skokov: procesor načíta niekoľko inštrukcií vopred a určuje, ktoré skoky pravdepodobne nastanú a ktoré skupiny inštrukcií budú spracovávané ako nasledujúce
F analýza toku dát: procesor skúma, ktoré inštrukcie budú závislé na výsledkoch predchádzajúcich inštrukcií a zostaví časový plán spracovania jednotlivých príkazov, aby sa nemuselo čakať na výsledky ešte nevykonanej inštrukcie F špekulatívne vykonávanie inštrukcií: inštrukcie, u ktorých je predpoklad, že sa budú opakovať, vykonáva procesor na základe časového plánu aj keď samotný program ich vykonanie zatial nepotrebuje a predpokladá sa, že sa výsledky využijú (ak by výsledky treba neboli, nič sa nedeje – aj tak by procesor len neproduktívne čakal). Pentium Pro dokáže spracovať aj staršie inštrukcie 16bitových aplikácií, musí ich však spracovať „starým spôsobom“ bez využitia Dynamic Execution a tým sa jeho práca extrémne spomaluje. (pozn. Keďže Windows95 majú časť programového kódu z dôvodov spätnej kompaktibility napísané v 16 bitovom kóde, nie je Pentium Pro vhodné pre prevádzkovanie W95). Významnou vlastnosťou Pentia Pro je schopnosť súčasnej spolupráce viacerých procesorov na jednej základnej doske (bežne 4 procesory spoločne), čo ho predurčuje najmä pre využitie v serveroch. Všetky procesory Pentium od prvých modelov po Pentium MMX a Pentium Pro sú Intelom označované ako procesory piatej generácie P5. Ďalšie procesory rady Pentium, počnúc typom Pentium II, sú označované ako procesory šiestej generácie - P6. Intel Pentium II Vychádza z procesorov Pentium Pro a Pentium MMX. Oproti Pentiu Pro bola doplnená inštrukčná sada MMX a vylepšená práca so 16 bitovým kódom. Interná cache bola 32 kB, z toho 16 kB pre dáta a 16 kB pre inštrukcie. Procesor umožňuje spoluprácu dvoch procesorov Pentium II na jednej základnej doske. Pentium II bol vyrábaný pre frekvencie FSB 66 a 100 MHz – FSB 100 MHz predstavovala významnú novinku a ďalší zásadný krok k zvýšeniu výkonu celej základnej dosky vrátane jej komponent. Interná frekvencia jadra sa pohybovala od 233 MHz u prvých kusov až po 450 MHz ; v priebehu ich výroby prešiel Intel od 0,35 µm technológie na 0,25 µm u rýchlejších typov. Z hľadiska architektúry sú najdôležitejšie zmeny: technológia dynamického spúšťania (spúšťa inštrukcie mimo poradia ), superpipelining, implementácia technológe MMX a technológie "Write Combining" ( pre zvýšenie rýchlosti grafických operácií). Pod strechou s označením Pentium II boli postupne vyvíjané a používané rôzne jadra procesora: F Typ Klamath je určený pre frekvenciu 300 MHz a 66 MHz FSB. F Typ Deschutes je určený pre frekvenciu 500 MHz a FSB 100 MHz . F Typ OverDrive pracuje na vyšších frekvenciach a disponuje aj väčšou L2 cache. Novinkou bola vyrovnávacia cache 2. úrovne o veľkosti najskôr 256 kB, neskôr 512 kB, pracujúca na polovičnej frekvencii ako procesor. Technologicky bolo neriešiteľné takú veľkú cache vyrobiť ako súčasť samotného procesora, preto bola realizovaná formou samostatného čípu, umiestneného v spoločnom puzdre s procesorom. Z hľadiska architektúry si však toto riešenie vyžiadalo vytvorenie duálnych nezávislých zbernic (systémová zbernica a zbernica pre Ing. Jaromír Tříska
9
Texty pre VYT a EPS, SPŠE Piešťany 2002
Hardware – doplnkové texty - procesory 10/10 prácu s pamäťou cache L2) a radikálny zásah do prevedenia puzdra, čo sa prejavilo m.j. novou päticou typu Slot1. Pomocou tejto pätice sa procesor uchytí v základnej doske podobne ako prídavné adaptéry v ISA alebo PCI slotoch;, vývody sú umiestnené na hrane procesora. (Hoci túto päticu Intel propagoval ako nový perspektívny princíp, postupne bol u nových typov nútený najmä pre vysoké náklady na tento typ puzdra koncepciu Slot opustiť a vrátil sa k osvedčeným päticiam.).
Ďalším dôležitým pokrokom bolo zníženie napájacieho napätia jadra procesora, čo znižuje zohrievanie procesora a umožňuje ďalšie zvyšovanie frekvencie. Intel Celeron, postavený na základe Pentium II U typu Pentium II sa poprvýkrát stretávame aj s „odľahčenou“ verziou základného typu procesora, ktorá vstúpila na trh pod označením Celeron. Prvé typy s frekvenciou 233, 266 a 300 MHz pracovali bez pamäte L2 cache. Chýbajúca cache L2 síce umožnila výrazne znížiť cenu, ale nedostatok výkonu sa výrazne prejavoval aj v kancelárskych aplikáciach. Pod tlakom lacných konkurenčných procesorov (AMD, Cyrix) bol Intel donútený chýbajúcu cache L2 nahradiť. Verzia s 300 MHz teda bola časom doplnená o cache L2 128 kB (označenie Celeron 300A) a všeobecne začaly byť Celerony s instalovanou cache L2 označované ako Mendocino. Štandardne sa cache L2 128 kB už inštalovala u všetkých ďalších Celeronov odvodených od Pentia II – 333, 366, 400, 433, 466, 500 MHz. Od plnohodnotných Pentií sa Celerony potom líšili už len frekvenciou FSB, ktorá ostala na 66 MHz. Pätica prvých Celeronov bola výhradne Slot1, časom však bolo od tejto koncepcie upustené a Intel sa vrátil k prevedeniu „socket“ – v prípade Celeronu to bol Socket 370. Pentium II Xeon Je postavený na základe Pentia II, určenie však má podobné ako Pentium Pro – je určený pre výkonné servery; má cache prvej úrovne 32 kB a cache druhej úrovne 512 kB alebo 1 MB; pričom však aj cache L2 komunikuje na frekvencii jadra procesora. Používa jadro procesora Deschutes. Puzdro používa typ pätice Slot2, ďalej sa vyznačuje. V serveroch opäť umožňuje paralelnú spoluprácu viacerých (štandardne 2 alebo 4) procesorov, umožňuje fyzicky adresovať až 64 GB RAM. Variant Xeon bol vyvíjaný aj pre ďalšie varianty Pentia - pokračoval modelom Pentium III Xeon. Mobile Pentium II Základom je Pentium II, parametre sú obdobné, ale dôraz je kladený na prepracovaný systém optimalizácie spotreby energie, čo je veľmi dôležité v predpokladanej oblasti nasadenia – notebooky. Pentium III Na trh prichádza na jar 1999. Je postavené na novom jadre Katmai. Do tohto jadra bola implementovaná ďalšia inštrukčná sada 70tich nových inštrukcií, označovaná ako Katmai New Instructions, neskôr známa skôr ako SSE – Streaming SMD Extensions. Prvé Pentiá III sa vyrábajú stále 0,25 µm technológiou, procesor obsahuje 9,5 mil. tranzistorov, objavuje sa nová architektúra procesora DIB. Frekvencia sa pohybuje od 450 do 600 MHz, cache L1 má 16 kB pre pre inštrukcie a 16 kB pre dáta. Cache L2 má 512 kB a je realizovaná mimo čípu. Procesor podporuje adresovanie 64 GB RAM, kešovanie prvých 4 GB. Ing. Jaromír Tříska
10
Texty pre VYT a EPS, SPŠE Piešťany 2002
Hardware – doplnkové texty - procesory 11/11 Nová architektúra si vyžaduje nový prístup k analýze toku údajov: tok inštrukcií sa optimalizuje ešte pred ich vykonaním s cielom zabezpečiť ich nadväznosť a tak zvýšiť priepustnosť procesora.
Inštrukčná sada SSE je orientovaná najmä na prácu s 3D objektami, novinkou sú inštrukcie typu SIMD Single Instruction Multiple Data: Inštrukcia sa načíta iba jedenkrát a môže sa opakovane vykonávať s rôznymi vstupnými hodnotami (pri klasickom postupe je nutné vždy načítať znova inštrukciu spoločne aj s dátami). Inštrukcie SSE významne urýchlujú prácu s 3D objektami, najmä výpočty pri transformácii týchto objektov, ich renderovaní, tieňovaní, vykreslovaní pri rôznych schémach osvetlenia, výrazne lepšia je práca s detailami čo prispieva k realistickejšiemu zobrazeniu scén; významný prínos je patrný pri zobrazovaní animovaných scén. Významne sa zvýšila aj úroveň práce so zvukom, s hlasom (rozpoznávanie hlasu), výrazný nárast výkonu sa objavuje aj pri procesoch, využívajúcich Fourrierove transformácie, pokročilé filtrovanie a podobné matematické techniky. Aby bolo možné výhody novej inštrukčnej sady využiť, musí byť aplikačný SW napísaný tak, aby vedel tieto inštrukcie využiť. Špecializovaný program na podporu využívania SSE je napríklad DirectX. Keďže technológia 0,25 µm sa frekvenciou 600 MHz dostala na hranice svojich možností, bolo vyvinuté nové jadro Coppermine, vyrábané 0,18 µm technológiou, na ktoré prechádza Intel od jesene 1999. Frekvencia narastá postupne až do 1100 MHz. Pamäť L2 cache s kapacitou 256 kB je integrovaná na samotný chip procesora (L2 teda pracuje na rovnakej frekvencii ako procesor), frekvencia FSB je 100, neskôr 133 MHz a podporuje aj grafický port AGP. Na tomto jadre boli vyrobené aj Pentiá III pre frekvencie vyše 1,1 GHz, ukázalo sa však, že hranica 1 GHz sa ukázala ako limitujúca aj pre technológiu 0,18 µm a procesory pripravené pre frekvenciu 1130 MHz boli začiatkom roku 2001 stiahnuté z trhu. . Od januára 2002 sú na trhu Pentiá III s cache L2 o veľkosti 512 kB. Zároveň sa prechádza opäť na nové jadro zvané Tualatin, vyrábané 0,13 µm technológiou a s frekvenciou jadra 1000 až 1400 MHz. Predpokladá sa aj rýchlejšia FSB 200 MHz. Intel Celeron, postavený na základe Pentium III Celerony verzie Pentium III sú postavené spravidla na rovnakom jadre, ako je práve aktuálne u „orginálneho“ Pentia, FSB oproti starším Celeronom poskočila do januára 2001 na 100 MHz (Celerony od frekvencie 800 MHz) a veľkosť cache L2 ostáva na 128 kB. (presnejšie:frekvencia FSB je vždy o stupeň nižšia ako u orginálneho Pentia a L2 je oproti orginálnemu procesoru polovičná.). Od januára 2002 prichádza na trh nová verzia Celeronu s 0,13 µm jadrom Tualatin a 256 kB L2. Výkon procesora sa tak blíži výkonu orginálneho Pentia III, handicapom ostáva pomalšia 100 MHz FSB. Intel Timna Vývoj tohto jadra bol koncom r. 2000 zastavený; ide teda o „slepú uličku“ vývoja – pre zaujímavosť však stojí za to sa o tomto projekte aspoň zmieniť. Procesor bol vyvíjaný pre veľmi lacné PC a malo byť do neho integrovaných viacero funkcií, doteraz sprostredkovávaných doplnkovými čípmi. Mal prevziať o.i. funkciu grafického čípu a funkciu radiča pamätí (túto funkciu plní štandardne čípová sada s BIOSom). Ing. Jaromír Tříska
11
Texty pre VYT a EPS, SPŠE Piešťany 2002
Hardware – doplnkové texty - procesory 12/12 Projekt stroskotal na problémoch s pamäťou – počítalo sa totiž výhradne s podporou pamäte typu RDRAM. Okrem technických problémov v komunikácii s pamäťou sa však ukázalo, že kombinácia extrémne lacného procesora s veľmi drahou pamäťou (RAMBUS) je aj zo strategicko ekonomického hľadiska hrubou chybou.
Pentium III Xeon Pokračovateľ radu „serverových“ Pentií. Využíva nové jadrá „Tanner“ – má zabudované SSE inštrukcie, pracuje na frekvencii 450 a 500 MHz a využíva až 2 MB cache L2; a Cascades – pracuje na frekvenciách jadra od 600 MHz, využíva frekvenciu FSB 133 MHz, cache L2 má menšiu (256 kB), ale umiestnenú priamo v jadre procesora (on-die), takže využíva širšiu dátovú cestu na prenos údajov medzi cache a výkonnými jednotkami. Intel Itanium Úplne nový rad procesorov od Intelu. Je prvý plne 64 bitový procesor, teda s vnútornou šírkou dát 64 bit a s inštrukčným slovom 128 bit. Je určený do výkonných serverov, pre spoluprácu 4 a viac procesorov; v žiadnom prípade pre stanice triedy PC. (Pozn.: Pripravuje sa verzia jadra označená Yamhill, ktorá má mať prepracovanú kompaktibilitu aj s 32 bitovými inštrukciami a mala by priamo konkurovať Hammeru od AMD). Nie je určená na spracovanie 32 bitového kódu (aj keď spätná kompaktibilita existuje). Má konkurovať procesorom Alpha, PA-RISC, POWER PC, Ultra Sparc firiem IBM, SUN, Motorola v segmente veľkých výkonných serverov. Vývoj jadra s pôvodným kódovým označením Merced prebieha od r. 1994 v spolupráci s firmou Hewlet-Packard. Celkom nová architektúra IA-64 využíva prvky RISC aj CISC a je postavená na celkom novej inštrukčnej sade EPIC – programovanie pomocou explicitne paralelných inštrukcií. Prvé vzorky sú k dispozícii od augusta 1999, a to Itanium 733 MHz s 32 kB L1, 96 kB L2 a 2 MB, resp. neskôr 4 MB L3 cache (L1 a L2 sú v prevedení „on-die“- priamo na čípe, L3 je realizovaná formou samostatných čípov po 1 MB mimo procesor.) Procesor obsahuje 28 miliónov tranzistorov, cache 300 miliónov. Frekvencia FSB je 266 MHz, čo pri šírke zbernice 64 bit dáva dátovú priepustnosť 2,1 GB/s. Čipová sada dodávaná Intelom podporuje až 4 procesory na doske a 64 GB RAM. Obsahuje 128 všeobecných registrov a 128 FP registrov (pre výpočty s plávajúcou desatinnnou čiarkou). Všetky registre je možné dynamicky pridelovať a premenovávať. Cenou za zjednodušenie práce s registrami je narastajúci počet bitov potrebných na ich adresovanie a dĺžka inštrukcie. Itanium 2 dosiahlo na jeseň 2002 takt 1 GHz, obsahuje prekladač IA 32 (pre inštrukcie x86) a prekladač PA-RISC. Má 3 MB cache priamo na čípe. Zbernica má šírku 128 bit a je taktovaná na 400 MHz. Technológia – 0,18 um. Výkon – pri 800 MHz dosahuje 13 GFLOPS. Nasadenie procesorov bude spočiatku v serveroch Escala firmy Bull vo verziách 4 procesory, 16 procesorov, 32 procesorov. Podporované operačné systémy: MS Windows Whistler LE, AIX5L, LINUX, Modesto Novell, Digital Unix, HP UX 11i. Predaj sa začal v polovici roka 2001, 2000 kusov odkúpila IBM pre dva tisícprocesorové servery. McKinley Bol uvedený vo februári 2002 ako primy nasledovník procesora Itanium. Je vyrábaný 0,18 µm technológiou, prvé vzorky pracujú na frekvencii 1 GHz. Frekvencia FSB bola zvýšená Ing. Jaromír Tříska
12
Texty pre VYT a EPS, SPŠE Piešťany 2002
Hardware – doplnkové texty - procesory 13/13 na 400 MHz a jej šírka na 128 bit, čo umožnilo zvýšiť rýchlosť prenosu dát na 6,4 GB/s. Cache L2 bola zväčšená na 256 kB. Priamo na číp bola implementovaná cache L3 s veľkosťou 3 MB, čím dosiahol číp rekordnej veľkosti – 464 mm2 . Výrobná cena čípu je udávaná cca 300 $, po zarátaní ceny montáže, testovania, balenia a najmä nákladov na vývoj sa predpokladá predajná cena jedného procesora 4220 $ pri odbere 1000 kusovej série.
V súčasnosti pokračujú vývojové práce na jadrách Madison a DeerField, ktoré by mali byť na trh uvedené v r. 2003. DeerField sa má stať lacnejším variantom McKinleye, Madison bude vyrábaný 0,13 µm technológiou a prevziať vedenie vo výkonnostnom poli 64 bitových procesorov Intel. Aj on však už má pripravených nasledovníkov – jadrá Montecio (predp. uvedenie v r. 2004) a Chivano (2005 – 2006). Pentium 4 Prvé modely boli postavené na jadre s kódovým označením Willamette. Na trh bol uvedený koncom novembra 2000 vo verzii 1,4 a 1,5 GHz frekvencie jadra. Cache L1 má len 8 kB, má však ďalšiu cache 12 kB určenú špeciálne na uloženie dekódovaných x86 inštrukcií, tzv. mikro-ops pamäť. L2 cache má veľkosť 256 kB. Nová mikroarchitektura použitá u Pentia 4 sa volá NetBurst a prináša niekoľko nových prvkov: Rapid Execution Engine – ALU pracuje na dvojnásobnej frekvencii:niektoré inštrukcie sú vykonané v priebehu polovice taktu procesora Hyper Pipeline – v priebehu spracovávania jednej inštrukcie sa už z pamäti načíta ďalšia inštrukcia a začne sa pracovať na jej vykonaní bez toho, že by sa čakalo na výsledok predchádzajúcej inštrukcie. V priaznivom prípade môže táto stratégia výrazne urýchliť proces výpočtu, inokedy sa však môže ukázať nevyhnutné celú pipeline vyprázdniť a až potom pokračovať v práci. Veľmi dlhá pipeline teda prácu niekedy výrazne urýchli, za nepriaznivých okolností postupnosti inštrukcií však používanie dlhej pipeline je nevýhodné. Ak však procesor dokáže včas zistiť, čo bude v najbližších chvílach potrebovať, a správne predpovedať vetvenie programu, bude urýchlenie efektívne. Pipelining sa začal využívať už u 80486, dĺžka pipeline sa postupne predlžovala až na 20 stupňovú pipeline u Pentia 4. Execution Trace Cache – v nej sú uložené už dekódované x86 inštrukcie; je umiestnená za dekodérom a zaisťuje, že nie je potrebné čakať na výsledky dekodéru, ale výsledok sa zoberie priamo z tejto pomocnej cache. Nová inštrukčná sada nazvaná SSE2 – Streaming SIMD Extensions 2 obsahuje nových 144 inštrukcií, ktoré výrazne urýchlujú vykonávanie výpočtov v plávajúcej desatinnej čiarke (v jedinom takte sa spracuje väčšie množstvo dát, získa sa viacero ďalej použiteľných výsledkov a veľkosť jednotky súčasne spracovaných dát sa zvyšuje z 64 na 128 bit). Tak dokáže výrazne urýchliť spracovanie videa, audia a 3D grafiky v aplikáciách, ktoré dokážu túto novú sadu inštrukcií plnohodnotne využiť. Podpora týchto inštrukcií je zabudovaná aj do DirectX ver. 7b, ver. 8 a vyšších. Ing. Jaromír Tříska
13
Texty pre VYT a EPS, SPŠE Piešťany 2002
Hardware – doplnkové texty - procesory 14/14 Nová pätica má označenie Socket 423, čo predpokladá samozrejme nové základné dosky a novú čipovú sadu, ktorá podporuje aj ďalšie vymoženosti prinášané Pentiom 4: Takt FSB 400 MHz a pamäte RDRAM (Rambus – RIMM moduly).
Začiatkom roka 2002 priniesol Intel novú verziu Pentia 4, ktorá sa od prvej série značne odlišuje: Je postavená na novom jadre Northwood, vyrábanom 0,13 µm technológiou, obsahujúcom 55 miliónov tranzistorov pri zmenšení rozmerov čípu na 146 mm2. Frekvencia jadra dosiahla 2,6 GHz, pôvodná verzia s 256 kB cache bola nahradená novou verziou s 512 kB L2 cache. Veľkosť L1 cache ostáva nezmenená – 12 kB pre mikroinštrukcie, 8 kB pre dáta; vylepšená architektúra si vyžiadala aj novú päticu (označenie Socket 478), takže do základných dosiek pre pentiá so Socket 423 nové procesory nie je možné použiť. Zaujímavosťou sú aj nové čípové sady, ktoré upustili od prísnej viazanosti platformy Pentium 4 na Rambus a podpory sa dočkala aj DDR SDRAM. Dňa 15. mája 2002 sa objavuje aj P4 na vylepšenom jadre, označovanom jako Northwood A. Pracuje od frekvencie 2,26 GHz (ďalšie modely na 2,4 GHz a 2,53 GHz) a objavila sa podpora aj systémovej zbernica s taktom fyzicky na 133 MHz, tj. efektívna frekvencia 533 MHz v režime QDR. Zmeny v architektúre jadra nie sú žiadne, ide vlastne iba o „pretaktovaný“ Northwood. PC Revue 6/2002, str. 30
Významný prelom nastal u verzie 3,06 GHz Pentium4 3,06 GHz: (133 MHz FSB x 23 2 násobič), ktorá bola obohatená o podporu hyperthreadingu. (Táto technológia sa pod označením SMT - Simultaneous MultiThreading používa už od marca 2002 v procesoroch Intel Xeon MP - Foster.)
Tabuľka vývoja základných parametrov procesora triedy Pentium 4 Obdobie
20.11.2000 – 27.8.2001 7.1.2002 – 14.1.2002 2.2.2004
Kódové meno jadra
Frekvencie jadra [GHz]
Frekvencie zbernice [MHz]
Veľkosť L2 Počet Plocha cache tranzistorov čípu [kB] [miliónov] [mm2]
Technológia [µm]
Willamette
1,4 – 2,0
400
256
42
217
0,18
Northwood
2,0 – 3,06
400, 533
512
55
127
0,13
Prescott
2,6 – 3,2*
800
1024
125
0,09
Koncom roka 2003 bol na trh uvedený model Pentium 4 s jadrom Northwood a s pracovnou frekvenciou 3,4 GHz. Objavuje sa podpora 800 MHz FSB. Objavuje sa aj procesor Pentium XE – eXtreme Edition – na pracovných frekvenciách 3,2 a 3,4 GHz, s kapacitou L2 2 MB a L3 tiež 2 MB priamo na čípe, podporou taktu FSB 800 MHz , a s počtom 169 miliónov tranzistorov na čípe. Nový procesor s jadrom Prescott a s označením Pentium 4 E bol verejnosti predstavený 2. februára 2004. Z technologického hľadiska je najväčším prelomom nástup 0,09 µm technológie. Počet tranzistorov je 125 miliónov pri kapacite L2 cache 1 MB. Významnou novinkou je tiež celkom automatizovaný návrh celého procesora (zatiaľ boli automaticky
2
Hyperthreading – viď samostatná kapitola „Multiprocesing a hyperthreading“.
Ing. Jaromír Tříska
14
Texty pre VYT a EPS, SPŠE Piešťany 2002
Hardware – doplnkové texty - procesory 15/15 navrhované iba jednotlivé funkčné bloky procesorov a tie boli tímom vývojárov prepojené do funkčného celku).
Značné zmeny sa prejavili aj v architektúre jadra NetBurst - zvyšovanie pracovnej frekvencie súvisí s predĺžením pipeline na 31 stupňov, (oproti 21 stupňovej pipeline u jadier Willamette a Northwood). Novým spôsobom je vyriešená aj podpora hyperthreadingu – úprava jadra by mala odstrániť pokles výkonu pri práci s jedinou aplikáciou pri zapnutom hyperthreadingu. Ku tejto zmene prispela aj nová inštrukčná sada SSE3, ktorá prináša inštrukcie na podporu práce s komplexnými matematickými oprácami, inštrukciu na kódovanie videa, inštrukcie na operácie SIMD (Single Instruction Multiple Data – jediná inštrukcia sa opakuje viackrát pre rôzne vstupné dáta, nie je potrebné opakovane načítať aj inštrukciu aj dáta – významné urýchlenie operácií so spracováním grafiky a multimédií), a inštrukcie na optimalizáciu hyperthreadingu. Novým spôsobom je vyriešený aj systém tepelnej ochrany, čo je však vynútené značne vysokým vývinom tepla na procesore. Priestor pre špekulácie okamžite po zverejnení základných údajov o architektúre nového jadra poskytla skutočnosť, že nárast počtu tranzistorov v jadre procesora nezodpovedá nárastu výkonu ani nárastu kapacity cache L2; spolu s oznámenými parametrami pripravovanej novej pätice (bude sa volať Socket T a bude mať o 277 pinov viac ako v súčasnosti používaná pätica) sa medzi odborníkmi objavil názor, že jadro Prescott v sebe ukrýva zatiaľ nepoužité obvody, ktoré budú u nových modelov využité na implementáciu 64 bitovej inštrukčnej sady a že Prescott disponuje zatiaľ nezverejnenou obdobou technológie x86-64. Krátko na to Intel skutočne oficiálně demonštroval použitie 64 bit inštrukcií v upravených súčasných 32 bit procesoroch založených na architektuře NetBurst (Pentium 4). Táto technológia (pomenovaná Yamhill, resp. CT) má byť dostupná už v druhom štvtťroku 2004. ALU jednotky v jadre majú byť schopné pracovať v dvoch režimoch: 32-bitovom, kedy ALU pracujú na dvojnásobnej frekvencii jadra, a 64-bitovom s pracovnou frekvenciou ALU zhodnou s frekvenciou jadra. Druhý režim sa bude vyznačovať o 56% zníženou spotrebou. Toto riešenie „duálnych“ jadier je iba núdzové a nemôže konkurovať plnohodnotným 64-bitovým Opteronom alebo Itaniám. Predpoklad ďalšieho vývoja Pentia 4 Prescott sa odvíja od predpokladu vývojárov Intelu, že architektúra NetBurst je schopná práce aj na 10 GHz. Jadro Prescott s taktom 4,4 GHz by sa na trhu malo objaviť počiatkom roka 2005. Nasledovať bude jadro Tejas, ktoré sa na verejnosti objaví zrejme ov druhom štvrťroku 2005. Intel Celeron, postavený na základe Pentium 4 Od jadra Tualatin, spojeného s platformou Pentia III, odstúpil Intel 15.5.2002, kedy bol na trh uvedený nový Celeron postavený na jadre Willamette. Pracovné frekvencie sú 1,7 GHz a 1,8 GHz, kapacita L2 cache 128 kB, technológia 0,18 um, počet tranzistorov je 35,5 miliónov, efektívna frekvencia zbernice je 400 MHz. Od septembra 2002 potom boli u nových Celeronov nasadené jadrá Northwood vyrobené 0,13 um technológiou a s frekvenciou jadra od 2 GHz vyššie (2800 MHz počiatkom roka 2004); ostatné parametre ostávajú nezmenené. PC Revue 6/2002, str. 30, PC Revue 12/2002, str. 62
Ing. Jaromír Tříska
15
Texty pre VYT a EPS, SPŠE Piešťany 2002
16/16
Hardware – doplnkové texty - procesory
Intel Pentium 4 – verzia Xeon Napriek dohadom, že verziou pre Pentium III dosiahol projekt Xeon svojho vrcholu a s ukončením výroby Pentia III skončí aj Xeon., a že jeho funkciu by mal prevziať úplne nový rad 64 bitových procesorov triedy Itanium, bol v marci 2002 predstavený nový Intel Xeon MP s jadrom Foster. Je určený pre viacprocesorové, maximálne však osemprocesorové systémy, vyrába sa na frekvencii jadra 1,4 až 1,6 GHz, s 8 kB L1, 256 kB L2 a 1024 kB L3. Pre dvojprocesorové systémy je predstavený model Intel Xeon s 512 kB L2 a frekvenciou jadra 1,8 až 2,2 GHz. Novinkou je technológia Hyper-Threading, ktorá umožňuje operačnému systému využívať jeden procesor ako dvojicu procesorov. (Chip 04/02) Novú sadu procesorov triedy Intel Xeon predstavil Intel 18.11.2002. Sú vyrábané technológiou 0,13 µm, pracovné frekvencie sú 2,8 GHz, 2,6 GHz, 2,4 GHz a 2 GHz, (počiatkom roka 2004 už cez 3 GHz), takt FSB je 533 MHz. Integrovaná L2 cache má 512 kB, procesory sú určené do pracovných staníc a dvojcestných serverov. Podporujú multiprocesing aj hyperthreading, podporujú 1 MB cache L3. Spolu s procesormi boli prezentované aj nové čipsety. Uvádzacia cena procesorov sa pohybuje od US$ 234 po US$ 455 za 2,8 GHz model. Verzia pre Intel Xeon MP.
viacprocesorové,
max.
osemprocesorové
systémy
má
označenie
Nový Xeon s kódovým označením Nocona bude využívať jadro Prescott, bude použiteľný pre 32-bitové aj 64-bitové aplikácie. Xeon s celkom novým jadrom Potomac sa na trhu objaví v r. 2005 a bude už plne 64bitový. Zdroj: http://www.namodro.cz
Procesory pre mobilné počítače Prakticky všetky verzie Pentií sú vyrábané aj vo verziách pre mobilné počítače – notebooky. Prvoradým hľadiskom u tejto triedy procesorov sú úspory energie, ktorej sa dosahuje často aj za cenu zníženia výkonu (nižšie frekvencie, zníženie taktu pri poklese napájacieho napätia a pod. ) a špeciálnymi funkciami na zníženie a optimalizáciu odberu, zabudovanými priamo v procesore. Principiálne však vždy ide o procesory postavené na rovnakom jadre ako sú procesory pre stolné počítače. Pentium 4 – M Verzia procesora Pentium 4, určená pre notebooky V apríli 2002 bol predstavený procesor pre notebooky, postavený na základe Pentia 4: Názov – Mobile Intel Pentium 4 Processor M; jadro odvodené z jadra Northwood, 0,13 µm technológia, frekvencia od 1,6 GHz vyššie, 512 kB cache L2, 400 MHz FSB, podpora DDR SDRAM, silná podpora špeciálnych funkcií na úsporu energie, spotreba v úspornom režime (snížená taktovacia frekvencia na 1,2 GHz) pod 2 W, v režime „sleep“ pod 0,5 W. Podpora MMX, SSE, SSE2.
Ing. Jaromír Tříska
16
Texty pre VYT a EPS, SPŠE Piešťany 2002
17/17
Hardware – doplnkové texty - procesory
Prehľad vývoja procesorov Intel Dátum uvedenia
Procesor
Frekvencia
Poznámka
15.11.1971
i4004
108 kHz
prvý procesor Intel
apríl 1974
i8080
2 MHz
procesor použitý v 8 bitovom osobnom po čítači Altair
jún 1979
i8088
5 MHz
procesor použitý v 16 bitovom osobnom po čítači IBM PC
február 1982
i80286
12 MHZ
plne 16 bitový procesor
17.10.1985
i80386 DX
16-33 MHz
32 bitový procesor
10.4.1989
i80486 DX
20 - 50 MHz
32 bitový procesor
22.3.1993
Pentium
60 a 66 MHz
Prvé Pentium
10.10.1994
Pentium
75 - 200 MHz
8.1.1997
Pentium MMX
166 - 233 MHz
Inštrukcie MMX
7.5.1997
Pentium II
233 - 450 MHz
Inštrukcie MMX + L2 cache
26.2.1999
Pentium III
450 - 933 MHz
Inštrukcie SSE, časom L2 cache on die
20.11.2000
Pentium 4
1,4- 2,8 GHz
Nová architektúra, inštrukcie SSE2
14.11. 2002
Pentium 4 HT
3,06 GHz
Technológia HT
2.2.2004
Pentium 4 E
2,8 – 3,2 GHz
Nové jadro, SSE3, vylepšenie HT
Pentium M je uvedený na trh počiatkom roka 2003 a je určený pre mobilné počítače, najmä notebooky ("Centrino"). Obsahuje 77 miliónov tranzistorov (oproti 55 miliónom "desktopovej" verzie Pentia 4), vyrobených 0,13 mikrometrovou technológiou. Nárast počtu tranzistorov ide predovšetkým na vrub extrémnej pamäti cache L2, ktorá u Pentia M dosiahla 1 MB (takouto hodnotou cache pamäti doposiaľ disponovali iba serverové Xeony). Pracovná frekvencia jadra je podľa verzie 1,3; 1,4; 1,5 a 1,6 GHz; variant Low Voltage určený do mininotebookov pracuje na frekvencii 1,1 GHz a variant Ultra Low Voltage určený do počítačov Tablet PC je taktovaný na 900 MHz. Nárast výkonu oproti Pentiu 4 dokladuje skutočnosť, že v testoch notebookov Pentium M 1,6 GHz porážalo mobilnú verziu Pentia 4 M 2,2 GHz. Obdivuhodná je technológia riadenia spotreby: Pri napájaní zo siete bez aktivácie úsporných režimov je spotreba procesora 30 watt, pri napájaní z batérií a pri aktivácii úsporných režimov klasá spotreba Pentia M na 12 watt a u variantov Low Voltage až na 1 watt! Pokles spotreby je ovšem "vykúpený" znížením taktovacej frekvencie zo 1,6 GHz na 600 MHz. Systémovú zbernicu používa Pentium M taktovanú na 100 MHz v režime Quad-Pumped Bus, čiže efektívne pracuje na 400 MHz. Novinky v jadre: Jednotka Branch Prediction zlepšuje úspešnosť predpovedania skokov, technológia Micro -Op Fusion umožňuje zlučovanie viacerých mikroinštrukcií do jediného kroku a tým zväčšenie počtu inštrukcií vykonaných v priebehu jediného taktu. Pre Pentium M sa pripravuje už nové jadro, postavené na 90 nanometrovej technológii, s kódovým označením Dothan.
Ing. Jaromír Tříska
17
Texty pre VYT a EPS, SPŠE Piešťany 2002
18/18
Hardware – doplnkové texty - procesory
TRENDY Intel ohlásil (a splnil) prechod na 0,09 µm technológiu v roku 2003, pripravuje 0,065 v r. 2005; hranica 5 GHz by mala byť dosiahnutá v dohľadnej budúcnosti; koncom dsaťročia by sa mala posunúť do oblasti medzi 10 až 20 GHz. Pripravuje sa aj terrahertzový procesor na technológii SOI – Silicon On Insulator Procesory pre osobné počítače od ďalších firiem Hoci firma Intel stála dlhé roky na čele vývoja procesorov tejto triedy, úspešne jej po celý čas „šliapali na päty“ ďalšie firmy – najmä Advanced Micro Devices – AMD, a firma Cyrix. Procesory týchto firiem boli síce postavené na odlišných jadrách ako intelovské procesory, avšak zhodnosť používanej inštrukčnej sady aj zhodnosť prevedenia a zapojenia pätíc zabezpečovali kompaktibilitu s intelovskými procesormi do takej miery, že sa vžilo označenie „klony Intelovských procesorov“. V základných doskách určených pre procesory Intel dokázali úspešne pracovať a vytláčať tak do istej miery Intel z trhu. Výrazne nižšia cena týchto procesorov ovšem bola zaplatená tiež slabšími výkonmi klonov, ktoré najmä v prvých verziách (označovaných ako klony i386 a i486) nedokázali po stránke výkonu „pravým“ Intelom konkurovať. Klony však boli vyhovujúce pre menej náročné aplikácie, takže mnoho domácich používateľov alebo aj firiem, ktoré potrebovali lacné počítače do kancelárií, zvolilo cestu výrazne lacnejších, hoci menej výkonných procesorov. V tých časoch bolo obvyklé aj označovanie procesorov vyjadrením tzv. Intel – ratingu, tzn. porovnávanie výkonu klonu s intelovským procesorom rovnakej triedy. V posledných piatich rokoch však najmä firma AMD dokázala vystúpiť z tieňa Intela a predstaviť vlastné orginálne procesory, ktoré výkonom predčili (a aj v súčasnosti dokážu predčiť) aj najlepších „favoritov“ od Intelu.
Ing. Jaromír Tříska
18
Texty pre VYT a EPS, SPŠE Piešťany 2002
19/19
Hardware – doplnkové texty - procesory
Procesory firmy AMD pre osobné počítače Z dnešného pohľadu si pozornosť zaslúži ako prvý procesor, ktorý donútil Intel začať brať AMD ako schopného konkurenta, procesor označovaný Am486, resp. AMD 486. Dosahovali frekvenciu jadra 100, 120 a 133 MHz a boli plne kompaktibilné so základnými doskami určenými pre Intel 80486 – po stránke softwarovej, inštrukčnej, prevedenia puzdra a pätice aj elektrických hodnôt. Procesor Am5x86 bol prevedením kompaktibilný s doskami pre 80486, ale výkon sa blížil skôr hodnotám dosahovaným prvými Pentiami. AMD K5 Je to už procesor typu Pentium. Označenie používa Pentium Rating – porovnanie s výkonom Pentia. Napr. označenie K5 – PR166 označuje procesor AMD, pracujúci na frekvencii jadra 133 MHz, vonkajšia frekvencia (FSB) je 66 MHz. Označenie PR166 potom znamená, že výkon procesora zodpovedá výkonu Pentia, ktoré by pracovalo na 166 MHz. Toto Prehľad procesorov K5: špekulatívne označovane výkonu ratingom je ovšem značne diskutabilné. označenie frekvencia jadra frekvencia FSB procesora
[MHz]
[MHz]
Procesor disponuje 16kB L1pre K5-PR 166 133 66 120 60 inštrukcie a 8 kB pre dáta. Spracovanie K5-PR 150 K5-PR 133 100 66 inštrukcií je podobné ako u Pentia Pro, používa K5-PR 120 90 60 sa rozklad na mikroinštrukcie, ktoré sú K5-PR 100 100 66 90 60 spracovávané paralelne. Využíva sa aj K5-PR 90 K5-PR 75 75 50 spracovanie inštrukcií mimo poradia, dynamická predpoveď vetvenia programu a predpovedania skokov a špekulatívne spracovanie inštrukcií. V jednom takte je možné spracovať za vhodných podmienok až 4 inštrukcie. Z hľadiska inštrukcií je kompaktibilný s inštrukciami 80x86 a puzdro je plne kompaktibilné s puzdrami prvých Pentií, takže ich bolo možné osadiť do základných dosiek určených pre Pentiá – ovšem za podmienky, že základná doska umožňuje nastaviť príslušné hodnoty FSB a napájacích napätí. Celkovo však procesory K5 neboli veľmi vydarené, zahrievali sa a boli problémy s ich kompatibilitou. AMD K6 Jadro procesora bolo navrhnuté tak, aby pri prevádzkovaní Windows’95 a Windows NT bol jeho výkon porovnateľný s výkonom Pentia Pro. Podporuje inštrukcie MMX (AMD zakúpila na inštrukcie MMX licenciu od Intela). Vyrábal sa 0,35 µm, neskôr 0,25 µm technológiou, má cache L1 64 kB ( 32 KB pre inštrukcie, 32 pre údaje ), využíva frekvenciu FSB 66 MHz, vyrábal sa vo frekvenciach 166, 200, 233, 266 a MHz.. Päticu používa rovnakú ako Pentium – Socket 7.
Ing. Jaromír Tříska
19
Texty pre VYT a EPS, SPŠE Piešťany 2002
20/20
Hardware – doplnkové texty - procesory
AMD K6-2 Označuja sa tiež ako K6-3D. Okrem podpory MMX podporuje ďalšiu sadu 21 nových inštrukcií pre efektívnejšie výpočty v plávajúcej desatinnej čiarke (FLOPS), ktorá sa označuje ako 3DNow! Rýchle výpočty tohto typu sú veľmi dôležité pre rýchle vykreslovanie animovanej grafiky – najmä v 3D móde, teda pre náročné hry a videosekvencie. Pre využitie schopností 3DNow! je ovšem nevyhnutné, aby príslušný aplikačný program nové inštrukcie poznal a využíval – program musí byť pre 3DNow! napísaný. Intel túto sadu do svojich procesorov nikdy nezačlenil. Chip sa vyrábal sa 0,25 µm technológiou, vo verzii K6+3D obsahuje okrem 64 kB L1 navyše aj cache L2 256 kB priamo na chipe a pracujúcej na frekvencii jadra, a dokáže využívať aj cache na základnej doske (túto cache na doske využíva K6-3D ako cache L2) ako L3 do hodnoty 1024 kB. V doskách určených pre intelovské procesory používa Socket7 a pracuje na FSB 66 MHz, ale pri doske s vylepšeným chipsetom dokáže pracovať aj na 95, príp. 100 MHz FSB – toto riešenie sa označuje ako Super7: Pätica sa zhoduje so Socket 7 , ale základná doska podporuje 100 MHz FSB USB a Ultra DMA. Jadro sa vyrábalo pre frekvencie od 266 do 550 MHz. AMD K6-III Nové jadro s kódovým označením SharpTooth pracuje na frekvencii 400 alebo 450 MHz, cache L1 je zväčšená na 128 KB, L2 cache s veľkosťou 256 KB je priamo v čipe a pracuje na frekvencii jadra. Používa päticu Socket7, frekvenciu FSB 100 MHz. Podporuje všetky spomínané inštrukčné sady. AMD K6 pre nootebooky V oblasti nootebookov sa uplatnili pomerne úspešne procesory K6 vo verzii K6-2P, ale aj prispôsobený procesor K6-III+ (napr. vo výborných notebookoch fy Armada). Samozrejmosťou sú minimalizovaný príkon a vyžarovanie stratového tepla. AMD K7 Athlon Začal sa vyrábať v polovici roka 1999 0,25 µm technológiou so 128 kB L1 cache a 512 kB cache L2, ktorá však nebola integrovaná do chipu a pracovala na frekvencii FSB. Novinkou, ktorá dala Athlonom významný náskok pred Pentiom III, je schopnosť pracovať na 200 MHz frekvencii FSB. Nové jadro Thunderbird bolo vyvinuté v polovici roka 2000 s nástupom 0,18 µm technológie. Zmenilo sa prevedenie cache L2 – bola sice zmenšená na 256 kB, ale integrovaná na chip procesora a pracuje na jeho frekvencii. Athlony s jadrom Thunderbird síce boli vyrábané aj vo verzii pre päticu Slot A, ale aj AMD od tejto koncepcie ustúpil a novšie prevedenia Athlon Thunderbirdu sa vyrábajú už opäť v päticovom prevedení – Socket A. Prevedenie Slot A ostáva určené iba pre OEM odberateľov. Frekvencie jadra: od 750 do 1000 Ing. Jaromír Tříska
20
Texty pre VYT a EPS, SPŠE Piešťany 2002
Hardware – doplnkové texty - procesory 21/21 MHz v r. 2000. v r. 2001 dosiahla 1,2 GHz a frekvenciu FSB 266 MHz (S FSB 200 MHz dokázal Athlon dosiahnúť max. frekvencie jadra 1250 MHz). Pre 266 MHz FSB však musia byť opäť vyrobené nové základné dosky plus chipsety.
Novinkou je náhrada Al spojov spojmi Cu (Cu už dlhšie používajú firmy Motorola a IBM pre výkonné procesory do serverov). Tento procesor pri svojom uvedení na trh v r. 2000 vo verzii Thunderbird svojim výkonom výrazne „prevalcoval“ vtedajšie procesory Intel, Bloková schéma mikroprocesor Athlon:
a cenami deklasoval Intel už úplne. Dá sa povedať, že išlo a najväčší úspech firmy AMD na poli procesorov a uvedením dvojice Athlon/Duron sa firma AMD dokázala vymaniť z „tieňa“ Intelu a dokázala sa postaviť ako jeho plnohodnotný konkurent. To sa prejavilo aj zrušením problematického označovania procesorov pomocou „P-ratingu“. Pozoruhodné bolo napr porovnanie výkonov 1,2 GHz
Ing. Jaromír Tříska
21
Texty pre VYT a EPS, SPŠE Piešťany 2002
Hardware – doplnkové texty - procesory 22/22 Athlona a 1,5 GHz Pentia 4, kde Athlon poráža Pentium 4 prakticky vo všetkých výkonnostných
testoch o 15% až 25% (Chip 01/01). Na jar roku 2001 bolo jadro Thunderbird nahradené jádrom Palomino (s vylepšenou jednotkou pro vetvené predpovedanie). Na tomto jadre bol pripravený a na trh uvedený procesor Schéma jednotky pre výpočty s pevnou desatinnou čiarkou:
Ing. Jaromír Tříska
22
Texty pre VYT a EPS, SPŠE Piešťany 2002
23/23
Hardware – doplnkové texty - procesory
Schéma jednotky pre výpočty s plávajúcou desatinnou čiarkou:
Ing. Jaromír Tříska
23
Texty pre VYT a EPS, SPŠE Piešťany 2002
24/24
Hardware – doplnkové texty - procesory
Teplotné charakteristiky procesora Athlon:
Athlon XP V r. 2002 bola na trh uvedená nová verzia s jadrom Thoroughbred, mikroarchitektúra zmenená nebola, 0,13 µm technológia umožnila zmenšiť plochu čípu a zvýšiť frekvenciu jadra postupne z 1,4 GHz na 2 GHz (označenie 2400+ ). Okrem frekvencie FSB 266 MHz sa objavuje podpora aj 333 MHz FSB. Modely s jadrom Thorton sa vyrábajú na v prevedeniach 2000+ (1667 MHz), 2200+ (1800 MHz), 2700+ (2170 MHz); technológia, cache aj frekvencia FSB ostávajú oproti Thoroughbredu nezmenené. Počiatkom roka 2003 sa objavuje nová verzia Athlona XP s jadrom nazvaným Barton, označenie modelov zachováva PR a k dispozícii sú prevedenia 2500+ (1830 MHz), 2600+ (1917 MHz), 2800+ (2080 MHz), 3000+ (2160 MHz). Ostáva 0,13 µm technológia. Najdôležitejšou v jadre je však rozšírenie cache na 512 kB L2 + 128 kB L1 a štandardná podpora 333 MHz FSB. AMD Athlon XP-M Verzia desktopového procesora pre notebooky, vyskytuje sa v prevedeniach PR 1600+, PR 2500+ . Špeciálna edícia Athlon XP-M LV (Low Voltage) má v porovnaní s klasickým thlonom XP-M zníženú spotrebu.
Ing. Jaromír Tříska
24
Texty pre VYT a EPS, SPŠE Piešťany 2002
25/25
Hardware – doplnkové texty - procesory
AMD Athlon Mustang Vyvíjaná a nedokončená verzia procesora Athlon bola určená pre výkonné pracovné stanice a servery; hlavným kladom mala byť podpora multiprocesingu. Projekt bol nahradený urýchlením vývoja multiprocesorových verzií Athlona MP. AMD Athlon MP Na jeseň 2001 bol uvedený Athlon s označením AMD Athlon MP 1500+, 1600+ ,1800+, 1900+ (označenie opäť podľa PR; napr. Athlon 1600+ má reálnu frekvenciu jadra 1,4 GHz). Ide o verziu procesora Athlon odvodenú od verzie XP, postavenú na jadre Palomino. Štruktúra s názvom QuantiSpeed je ale určená pre multiprocesing – k tomu je architektúra doplnená o technológiu AMD Smart MP, ktorá má umožňuje výkonnejší multiprocesing. Neskôr sa v prevedení pre multiprocesing objavili aj procesory Athlon MP postavené na jadre Thoroughbred, taktované od 2 GHz vyššie s označením 2400+, 2600+, 2800+. AMD Duron Prvý model z r. 2000 je postavený na jadre s kódovým označením Spitfire. Toto jadro je menšie od jadra Athlona – o menšiu L2, v ostatných parametroch je totožné s Thunderbirdom. Predstavuje lacnejší variant k procesorom Athlon – hlavným rozdielom je menšia cache L2 u Durona – 64 kB, ktorá však rovnako ako u Athlona pracuje na frekvencii jadra. Cache L1 má 128 kB. Frekvencia FSB u Durona je tiež 200 MHz - v tomto sa obchodná politika AMD a Intel líši – AMD u lacnejších typov nepotlačuje max. frekvenciu FSB, ako to bežne robí Intel u Celerona. Podporuje inštrukčné sady MMX, SSE a 3DNow! Prvé verzie Durona sa vyrábali na frekvenciách 600 až 950 MHz, vývoj pokračoval paralelne s Athlonom. Duron sa ukázal tiež ako veľmi úspešný procesor – najmä svojim pomerom výkon/cena, keďže ponúkal za výrazne nižšiu cenu výkon porovnateľný s Pentiom III a Celerony vo výkonnostných testoch deklasoval; v porovnaní s Athlonom vykazoval iba o 5-10% nižšiu výkonnosť. Na jeseň roka 2001 sa na trhu objavil nový Duron s jadrom Morgan, vyrábaným 0,13 µm technológiou, taktovacia frekvencia presiahla 1200 MHz a v testoch smelo konkuruje Celeronu 1200, aj Pentiu 4 1400 MHz. V poradí tretie prevedenie Durona s jadrom Applebread vyrábaným 0,13 µm technológiou, sa objavuje v r. 2003. Jadro Applebread je vlastne jadro Barton, používané v Athlonoch XP, iba oproti Athlonu je cache zachovaná na úrovni predchádzajúcich modelov Duronov – 64 kB L2 + 128 kB L1. Taktovacie frakvencie sú 1400, 1600 a 1800 MHz, podporovaná frekvencia FSB je 266 MHz. Nevýhodou tohto procesora je – rovnako ako u Athlona – náchylnosť na prehrievanie sa.
Procesory pre výkonné počítače a servery Platforma AMD Sledge Hammer Tento procesor bol od počiatku pripravovaný ako konkurent Intelovského 64 bitového procesora pre servery McKinley. Architektúra procesora Sledge Hammer Ing. Jaromír Tříska
25
Texty pre VYT a EPS, SPŠE Piešťany 2002
26/26 (neskôr rozvinutá aj do platformy Claw Hammer s vyústením do sady desktopových procesorov Athlon 64) bola od začiatku vyvíjaná celkom nezávisle od platformy Intelovských 64bitových procesorov. Hardware – doplnkové texty - procesory
Mikroprocesory postavené na architektúry Hammer sa z obvodového hľadiska člení na 6 blokov: • jadro procesora • segmenty cache pamäte prvej úrovne pre inštrukcie • segmenty cache pamäte prvej úrovne pre dáta • cache pamäť druhej úrovne • radič pamäte DDR • radič zbernice HyperTransport V jadre procesora sa nachádza devať výkonných jednotiek: o
tri aritmeticko-logické jednotky ALU
o
tri jednotky generovania adresy AGU
o
tri jednotky pre výpočty s desatinnými číslami (každá používa odlišné algoritmy spracovania dát)
Počet aj usporiadanie jednotiek zodpovedajú Athlonu XP. Väčší počet jednotiek nemá podľa vývojárov AMD zmysel, pretože ani Athlon, ani Pentium 4 nedokážu všetky jednotky využiť na 100%. Nedovoľuje to nedostatočná priepustnosť dátových kanálov medzi systémom a mikroprocesorom. Zlepšenie v tomto smere prináša integrovanie radiča pamäte a zbernica Hypertransport.3 Ani zapracovanie týchto jednotiek nezabezpečí dostatočné zásobovanie výkonných jednotiek dátami. Pipeline sa predlžuje na dvanásť stupňov (z desiatich stupňov u Athlona XP). Dvanásťstupňová pipeline je rovnaká pre jednotky na výpočty s pevnou desatinnou čiarkou aj pre jednotky na výpočty s desatinnými číslami. (Na porovnanie – jadrá Prescott Pentií 4 disponujú 31 stupňovou pipeline.)
3
Hypertransport – nová architektúra zbernice na komunikáciu medzi procesormi navzájom v multiprocesorovom systéme a medzi procesorom a ďalšími zbernicami. Bližšie v samostatnom odseku
Ing. Jaromír Tříska
26
Texty pre VYT a EPS, SPŠE Piešťany 2002
Hardware – doplnkové texty - procesory 27/27 Rovnomerné rozdeľovanie inštrukcií medzi výkonné jednotky zabezpečuje trojica osemmiestnych plánovačov (každý „zásobuje“ inštrukciami jednu ALU a jednu AGU) a jeden tridsaťšesť-miestny plánovač, ktorý zásobuje inštrukciami jednotky pre spracovaní operácií s desatinnými číslami.
Tieto plánovače sú zásobované inštrukciami prostredníctvom pomerne zložitej jednotky výberu, usporiadania, viacstupňového dekódovania a reťazenia inštrukcií. Táto jednotka spolupracuje prostredníctvom cache L1 s pamäťovými tabuľkami, kde sú uložené vypočítané adresy cieľov skokov v programe, vypočítané pravdepodobné hodnoty skokov v programe a údaje o histórii vývoja vetvenia programu. Na elimináciu chybných predpovedí vetvenia programu disponuje jadro Hammer ďalšou unikátnou novinkou – kalkulátorom vývoja vetvení programu. Výpočet požadovanej hodnoty síce trvá pomerne dlho – päť taktov procesora – ale výsledok spoľahlivo určí, aké vetvenie v programe nastane a ktorá vetva bude aktuálna. Samotné dáta pre inštrukcie získávajú výkonné jednotky prostredníctvom údajovej L1 cache. Tá sa oproti Athlonu XP nemení – je delená na 64 kB pre inštrukcie a 64 kB pre dáta. L2 cache u Opterona dosahuje 1 MB.
Ing. Jaromír Tříska
27
Texty pre VYT a EPS, SPŠE Piešťany 2002
28/28
Hardware – doplnkové texty - procesory
Radič pamäte integrovaný do mikroprocesora Úlohu radiča pamäte doposiaľ zastávala chipová súprava. Tá aj bola rozhodujúcim prvkom v určení typu pamäte, ktorý bude systémom podporovaný.
Prenesenie úlohy radiča pamäte priamo do procesora významným spôsobom zjednoduší aj urýchli komunikáciu medzi procesorom a operačnou pamäťou. Nezanedbateľným prínosom je aj významné uľahčenie práce návrhárom systémov. Na druhej strane vzniká pevné prepojenie medzi konkrétnym typom procesora a typom podporovaných pamätí, čo môže prinášať problémy v prípade snahy osadiť systém modernejšími, rýchlejšími pamäťami. Hammer podporuje PC 1600, PC 2100 a PC 2700. Údajová zbernica pamätí je riešená po samostatných 64bitových kanáloch. Platforma Claw Hammer (procesory Athlon 64) disponuje jedným 64bitovým kanálom, šírka údajovej zbernice pamätí u platformy Sledge Hammer (procesory Opteron) je 2 kanály, teda 128 bitov. Pre pamäte typu DDR s efektívnou taktovacou frekvenciou 333 MHz je možné dosiahnuť teoretickú priepustnosť zbernice až 5,33 GB/s. U viacprocesorových systémov platí táto hodnota
Ing. Jaromír Tříska
28
Texty pre VYT a EPS, SPŠE Piešťany 2002
Hardware – doplnkové texty - procesory 29/29 samostatne pre každý procesor, teda nezávisí od okamžitej komunikácie ďalších procesorov. Reálna priepustnosť každého systému predstavuje 50% až 70% teoretickej priepustnosti.
Zbernica Hypertransport Zbernica Hypertransport je vyvíjaná a podporovaná ako firmou AMD, tak aj Intelom. Jej úlohou je nahradiť existujúcu zbernicu FSB, ktorá má na starosti komunikáciu medzi mikroprocesorom, pamäťami a prostredníctvom chipsetu (spravidla obvody NorthBridge) so zbernicou PCI.
Údajová rýchlosť zbernice HyperTransport dosahuje 3,2 GB/s na jeden 64bitový kanál, u dvojkanálových zberníc (napr. u Opteronov) dosahuje 6,4 Gb/s. Zbernica hypertransport zabezpečuje prenos údajov medzi procesormi navzájom u viacprocesorových systémov, medzi procesormi a ďalšími zbernicami ako PCI-X, southbridge a AGP. X-BAR Ako je zrejmé zo schémy, je každý blok operačnej pamäte priradený konkrétnemu procesoru, s ktorým komunikuje cez integrovaný radič operačnej pamäte. Táto komunikácia je Ing. Jaromír Tříska
29
Texty pre VYT a EPS, SPŠE Piešťany 2002
Hardware – doplnkové texty - procesory 30/30 veľmi rýchla a jednoznačná. Je však nutné vyriešiť aj komunikáciu konkrétnej pamäti s iným procesorom, alebo s grafickou kartou, PCI-X zbernicou atď. Na tento účel je vnútri procesora zabudovaný veľmi rýchly prepínač, ktorý na základe požiadavky bloku System Request Queue zrealizuje prepojenie radiča pamäťovej zbernice so zbernicou HyperTransport. Komunikácia prostredníctvom bloku X-BAR beží po 64bitovej zbernici, ktorá je taktovaná rovnako ako jadro procesora. Pre napr. 2 GHz procesor potom prenosová rýchlosť predstavuje 8B x 2G = 16 GB/s.
Ako sa prejavuje zmena architektúry na výkone procesora? Pri porovnaní rovnako taktovaných procesorov Athlon XP a Opteron ide o nárast výkonu cca 25%. Zlepšenie priepustnosti zberníc sa podiela na náraste výkonu 20%, zmena jadra má u 32bitových aplikácií vplyv na 5% zvýšenie výkonu. U 64 bitových aplikácií je nárast výkonu jadra naporovnateľne vyšší. Pohľad do minulosti Analogická situácia nastala pred 1ť rokmi pri nástupe procesora 80386, ktorý bol prelomom medzi 16 bitovými a 32 bitovými počítačmi. Vtedy sa ukázalo, že výmena HW prebehla v priebehu niekoľkých (3 – 5 ) rokov, prechod na 32-bitový SW, najmä v oblasti aplikácií, trval vyše 10 rokov. Dá sa predpokladať, že po nástupe 64bitových procesorov bude situácia obdobná a dostatočne rýchly vývoj a dostupnosť 64bitových aplikácií bude limitujúcim faktorom pri nástupe 64bitovej platformy. Konkrétne typy procesorov postavených na jadre Hammer OPTERON Procesor bol pod názvom OPTERON predstavený v apríli roka 2002, na trh bol uvedený v r. 2003. Má plne 64 bitovú architektúru, na rozdiel od McKinley však efektívne podporuje aj 32 bitovú inštrukčnú sadu i80x86. Je vyrábaný 0,13 um technológiou a je určený pre viacprocesorové systémy. Presnejšie – Opteron s označením 1xx je určený pre jednoprocesorové systémy, procesory označené Opteron 2xx sú určené pre 1-2 procesorové systémy, Opteron 8xx je určený až pre osemprocesorové systémy. Opteron je v súčasnosti vyrábaný na frekvenciách jadra 1400 MHz (označenie x40), 1600 MHz (označenie x42), 1800 MHz (označenie x44), 2000 MHz (označenie x46). Takže napríklad Opteron určený pre jednoprocesorové systémy s frekvenciou jadra má označenie Opteron 140, Opteron pre osemprocesorové systémy na 1600 MHz má označenie Opteron 842, dvojgigahertzový Opteron pre dvojprocesorové systémy sa označuje ako Opteron 246. Integrovaný radič operačnej pamäte a zbernica Hypertransport podľa mienky odborníkov prispievajú ku zvýšeniu výkonu 64 bitových procesorov AMD viac, ako samotná 64 bitová architektúra. Bitová šírka pamäťového radiča je 128 bitov a pracuje na dvoch nezávislých 64 bitových kanáloch. Podporuje pamäte typu DDR 200 a DDR 400 s označením ECC (tzv. registrované pamäte) . V prvej polovici roka 2004 sa počíta s prechodom na 0,09 um a procesory na tomto jadre majú pracovné mená Odessa, San Diego a Athens. Ich pätica má 940 pinov, cache L2 májú zhodne 1 MB.
Ing. Jaromír Tříska
30
Texty pre VYT a EPS, SPŠE Piešťany 2002
31/31
Hardware – doplnkové texty - procesory
Architektúra procesora Claw Hammer Je „bratom“ SledgeHammera, jeho určenie je smerované do najdrahších osobných počítačov , notebookov, desktopov a jednoprocesorových pracovných staníc. Bol uvedený na trh pod obchodným názvom ATHLON 64 Vyrába sa 0,13 um technológiou, má plne 64 bitovú architektúru, vrátane 64 bitových registrov a podpory 64 bitových inštrukcií. Okrem podpory 64 bitových inštrukcií poskytuje podporu aj 32 bitovej inštrukčnej sade, čo mu oproti 64 bitovým procesorom od Intelu prináša značnú výhodu v kompktibilite so staršími aplikáciami. Má L1 cache veľkú 128 kB, L2 má 1 MB. Oproti Opteronom nedisponuje Athlon 64 podporou multiprocesingu a bitová šírka jeho pamäťového radiča je 64 bitov – používa jeden kanál pamäťového radiča. Podporuje integrovaný radič operačnej pamäte a zbernicu Hypertransport. Súbežne však bol na trh uvedený aj Athlon 64 FX, ktorý predstavuje výkonnostnú špičku na poli procesorov pre pracovné stanice a desktopy. Jeho hlavným trumfom je využívanie dvojkanálového prístupu do pamäte celkovo so 128 bitovou šírkou – v tomto ohľade prevzal prvky architektúry od Opteronov. Ďalšie parametre Athlonov 64: Podpora 400 MHz frekvencie FSB, integrovaný radič pamäte s technológiou HyperTransport, podpora MMX, SSE, SSE2 aj 3DNow! , ostáva označenie modelov pomocou PR, takže Athlon 64 s označením 3200+ je v skutočnosti taktovaný na 2000 MHz. Hlavnou slabinou procesora Athlon 64 v čase jeho uvedenia na trh je nedostupnosť 64 bitových aplikácií, takže užívateľ ostáva odkázaný na používanie 32 bitového software. Aj keď sa v testoch potvrdilo, že Athlon 64 si dokáže veľmi slušne poradiť aj so spracovaním 32 bitového kódu, jeho hlavná sila – 64 bitové prostredie – ostáva nevyužité a vo výkonových testoch ostáva približne na rovnakej úrovni so špičkovými 32 bitovými procesormi. Jeho plný výkon sa bude môcť prejaviť až pri dostupnosti 64 bitových aplikácií. V priebehu roka 2004 sa na trh pripravujú 0,09 um verzie procesorov Athlon, a to Athlon 64 s jadrom Victoria so 64 bitovou pamäťovou zbernicou, Athlon FX 57 s jadrom San Diego so 128 bitovou pamäťovou zbernicou. Pre mobilné počítače je určená špeciálna verzia Athlon 64 DTR. PC World 1/2003, str. 113, PC Revue 11/2003 str. 52
Ing. Jaromír Tříska
31
Texty pre VYT a EPS, SPŠE Piešťany 2002
32/32
Hardware – doplnkové texty - procesory
Procesory firmy IDT WinChip C6, C6+ V r. 1997 sa na trhu objavil nečakane nový výrobca procesorov „Intelovského typu“ – firma IDT so svojim procesorom WinChip IDT C6. Skôr ako Pentium pripomína „vylepšenú“ i486, vyrábal sa 0,35 µm technológiou, obsahuje cache L164 kB , nedostakom je pomalšia jednotka paralelného spracovania dát. Podporuje MMX. Podporuje frekvenciu FSB 60, 66, 75, 83 a 100 (C6+) MHz a pracuje na frekvenciách jadra 180 až 240 MHz, resp.C6+ až do 300 MHz. Začiatkom roka 1999 bol uvedený vylepšený typ WinChip 2, vyrábaný 0,35 aj 0,25 µm technológiou, päticou kompaktibilný s procesorom Pentium MMX, ktorý okrem MMX podporoval aj 3DNow! a po softwarovej stránke aj puzdrom bol plne kompaktibilný s Pentiom MMX. Z hľadiska výkonu sa pohyboval na úrovni AMD K6-2, Cyrix 6x86MX a Cyrix MII . Po odkúpení IDT firmou VIA sa procesory WinChip stali základom pre stavbu nových procesorov VIA C3.
Procesory firmy Cyrix pre osobné počítače Ak firma AMD dokázala Intelu najmä v posledných rokoch poriadne „podkúriť“ aj v oblasti špičkových procesorov, firma Cyrix sa etablovala ako výrobca technologicky nenáročných a najmä lacných „klonov“. V priebehu rokov spolupracovala firma s IBM, SGS Thomson a Texas Instruments, takže s procesory pôvodu Cyrix sa môžeme stretnúť aj pod označením týchto firiem. Klony i386 a i486 boli na trhu pomerne úspešné, poskytovali prijateľný výkon za výrazne nižšiu cenu. Pracoval aj na klonoch Pentií – prvé Pentiá „klonoval“ pod označením Cyrix 5x86. Procesor bol päticou kompaktibilný s i486, výkonom dosahoval približne úroveň Pentia 90 MHz. Cyrix 6x86 Predstavuje odpoveď Cyrixu na Pentium Pro. Dokáže rozkladať spracovávané inštrukcie, navyše proti Pentiu Pro optimalizuje vykonávanie 16bitového kódu. Obsahuje Cache L1 16 kB. Nevýhoda – menšia stabilita, potreba silného chladenia. Cyrix 6x86MX Bol doplnený o inštrukcie MMX, L1 bola zväčšená na 64 kB. Podporuje 66,75,83 nebo 100 MHz FSB. vyrábal sa s označením využívajúcim „Pentium Rating“ v intervale od PR166 po PR 333, pričom procesor označený PR333 pracoval v skutočnosti na frekvencii jadra 250 MHz. Cyrix MII PR Procesory MII boli postavené na 0,35 µm technológii ako priamy konkurent Pentia II, na trh boli uvedené zač. roka 1999. Sú postavené pre 100MHz FSB, (aj keď v skutočnosti sa 100 MHz FSB využije iba u verzie PR333 – tzn. 2,5 x 100 MHz = 250 MHz reál. frekv. jadra; procesory PR166 až PR300 využívajú nižšie frekvencie FSB), obsahujú inštrukcie MMX, majú cache L1 64 kB, dokáže rozkladať a spracovávať inštrukcie v dvoch nezávislých vetvách. Ing. Jaromír Tříska
32
Texty pre VYT a EPS, SPŠE Piešťany 2002
Hardware – doplnkové texty - procesory 33/33 Skôr ako zaujímavosť stojí za zmienku, že počiatkom roka 1999 bola jedna verzia týchto procesorov vyrábaná 0,25 µm technológiou v halách IBM pod označením IBM 6x86MX PR333.
MediaGX Projekt bol predstavený začiatkom roka 1999. a jeho zámerom bolo vytvoriť chip, ktorý bude mať v sebe integrované viaceré funkcie, ktoré doteraz plnili komponenty základnej dosky a adaptéry: Funkcie grafickej karty, zvukovej karty, radičov pamäte aj PCI rozhrania, gameportu a dvoch USB portov mal prevziať sám procesor. Výhodou bola komunikácia medzi komponentami na frekvencii a na úrovni jadra pri 128 bitovej šírke vnútornej zbernice. Táto koncepcia mala viesť jednak k výraznému zrýchleniu komunikácie a zároveň sa stať základom konštrukcie veľmi lacných multimediálnych počítačov, Procesor MediaGX je kompatibilný s technológiou MMX, podporuje MPEG1, využíva novú "Virtual System Architecture" (VSA) – čo je nová SW technológia vyvinutá firmou Cyrix, ktorá svojimi inštrukciami nahradzuje HW vybavenie – počítač s Media GX nepotrebuje žiadne prídavné komponenty – nemôžu nastať problémy s kompaktibilitou, s ovladačmi atď.; VSA je totiž postavený tak, aby bol pre aplikácie celkom transparentný. Procesor bol ďalej podporovaný novo vyvinutými technológiami: XpressRAM na priamu komunikáciu procesora s SDRAM bez potreby používať L2 cache, XpressGRAPHICS nahradzuje grafický adaptér bez nutnosti využívať špeciálnu videopamäť a pritom dosiahnúť veľmi dobrý grafický výkon, XpressAUDIO je kompaktibilný so štandardnými zvukovými kartami a vie spracovať všetky formáty zvuku. Nevýhody tejto koncepcie sú však tiež zrejmé: Veľmi vysoké nároky na takto koncipovaný procesor, nutnosť použiť špeciálnu základný dosku aj so špeciálnym chipsetom a nemožnosť akokoľvek hardwerovo takýto systém upgradeovať. Táto koncepcia sa objavila aj u ďalších firiem – napr niečo podobné sa pokúšal Intel vytvoriť pod hlavičkou projektu Timna. Vzhľadom na udalosti vo firme Cyrix – predaj firmy pod krídla VIA - však projekt nebol dokončený. Cyrix JALAPENO Projekt procesora s označením Cyrix M3 pre 0,18 µm technológiu s jadrom Jalapeno bol tiež predstavený zač. roka 1999. Hlavné ciele boli zvýšiť frekvenciu jadra na 600 – 800 MHz, zlepšiť komunikáciu s pamäťou, zlepšiť prácu vo výpočtoch s plávajúcou desatinnou čiarkou – riešené úplne novou konštrukciou FPU jednotky – a zmenšiť plochu čípu. 256KB on-chip L2 cache pracuje na frekvencii jadra. Grafický subsystém môže používať L2 cache pre kešování textur aj ako kompozitný buffer pre multi-pass grafické operace. Priamo na čípe je integrovaný aj radič pamäti. Nová FPU má dve nezávislé FPU/MMX jednotky, obidve zreťazené. Duálny FPU podporuje vykonávanie MMX aj 3DNow! inštrukcií a přináša lepšiu integráciu s grafickým subsystémom.
Ing. Jaromír Tříska
33
Texty pre VYT a EPS, SPŠE Piešťany 2002
34/34
Hardware – doplnkové texty - procesory
Procesory firmy VIA pre osobné počítače Ukázalo sa, že dlhá stagnácia know-how firmy na „klonoch“ úspešnejších firiem neumožňuje firme Cyrix prežiť a v r. 2000 bola mikroprocesorová divízia firmy Cyrix odkúpená ambicióznou firmou VIA Technologies, ktorá sa v posledných rokoch prepracovala na čelo v oblasti vývoja a produkcie chipových súprav. Okrem odkúpenia firmy Cyrix posilnila VIA svoju pozíciu aj odkúpením konštrukčnej skupiny Centaur Technology firmy IDT. VIA Cyrix III – „Josuha“ Prvé procesory VIA Cyrix III boli postavené na jadre Joshua (získané od National Semiconductor) – pokračovanie radu Cyrix MII. Boli vyrábané 0,18 µm technológiou, mali 64 kB cache L1 a pomerne veľkú 256 kB L2, označenie PR433 (skutočná frekv. 300), PR466, PR500 a PR533 tentokrát znamenalo porovnávanie sa s Celeronmi. Procesory však celkovo neboli vydarené, výroba aj uvedenie na trh bolo viackrát odložené, nakoniec sa vyrobila sa iba malá séria a boli nahradené procesormi s jadrom Samuel (jadro bolo vyvinuté firmou Centaur Technologies – IDT ako jadro pre procesory WinChip). VIA Cyrix III – „Samuel“ Nové procesory Cyrix III založené na jadre Samuel (alias WinChip4) sa začali vyrábať v lete r. 2000. Používajú 0,18 µm technológiu, jadro obsahuje 128 kB L1 (64 kB pre inštrukcie a 64 kB pre dáta), podporuje 3D Now! a MMX. FSB: 66, 100 aj 133 MHz, frekvencia jadra od 500 do 667 MHz. Pri označovaní procesorov bol opustený systém PR, takže uvedená frekvencia je skutočne frekvenciou jadra. Použitá pätica Socket 370 – ide do dosiek určených pre Celerony (niekedy však treba update BIOSu). Nemá žiadnu cache L2, používa 12 stupňovú pipeline. Absencia tejto cache však výrazne degraduje výkon, v testoch (Chip 09/2000) vykazoval aj Celeron 366 MHz lepšie výsledky ako Cyrix III 533 MHz – v celočíselných operáciách boli výkony porovnateľné, pri použití výpočtov s plávajúcou desatinnou čiarkou bol Celeron výrazne lepší. Ani výrazne nižšia cena nekompenzuje slabý výkon, takže pôvodný zámer konkurovať Celeronu priamo na „jeho“ základných doskách nevyšiel. Skutočným tvrdým konkurentom Celerona sa v tomto čase stal Duron (aj keď používal inú päticu, chipset aj základný dosku ako Celeron). Výhodou ostáva malý tepelný výkon, ktorý umožňuje orientovať sa na segment prenosných počítačov. VIA C3 – „Samuel 2“ Začiatkom roka 2001 sa do výroby pripravil procesor s jadrom Samuel 2, ktorý sa vyrába 0,15 µm technológiou, má 128 kB L1 a 64 kB L2, podporuje frekvenciu FSB 133 MHz, frekvencia jadra ide od 700 MHz vyššie – 733, 750, 800, 850 a 866MHz., podporuje MMX a 3DNow! Významným plus je veľmi nízka spotreba – 6W – a tým málo vyžiareného tepla. V decembri 2001 zúročila VIA túto výbornú vlastnosť procesorom: VIA C3 Eden ESP – používa iba pasívne chladenie – tepelný výkon do 5W, a je určený pre priame spájkovanie do základnej dosky, takt 400, 533 a 667 MHz (v budúcnosti 933 MHz), FSB 133 MHz. (zdroj: PC World jan.2002.)
Ing. Jaromír Tříska
34
Texty pre VYT a EPS, SPŠE Piešťany 2002
35/35
Hardware – doplnkové texty - procesory
VIA C3 – „Ezra“ Na jeseň 2001 bol na trh uvedený nový variant procesora VIA C3, vytvorený 0,13 µm technológiou s novým jadrom Ezra (vzhľadom na „pôvod“ sa tiež označuje ako „WinChip5“). Napriek pôvodne avízovanej L2 256 kB (udáva množstvo literatúry, vychádzajúcej z pôvodných vyhlásení VIA) sú skutočné veľkosti cache: L1 128 kB a L2 64 kB (L2 však pracuje na frekvencii CPU) Podporuje 100/133 MHz FSB a MMX™ aj 3DNow!; avízovaná podpora SSE sa teda tiež nekoná. Začal na frekvencii 800 MHz, koncom roka 2001 bol na trh uvedený model s 933 MHz. VIA C3 - "Nemiah" je meno nového procesora fy. VIA technologies vyrábaného technológiou 0,13 mikrometra so štartovaciou pracovnou frekvenciou 1 GHz, päticou rovnakou ako má Pentium III, spotrebou 11,25 W a cenou 45 USD. Aj nový procesor je určený do tichých domácich a kancelárskych počítačov a lacnejších notebookov.
Procesory firmy Transmeta pre osobné počítače Táto firma sa orientuje na procesory pre mobilné počítače. Má vlastnú unikátnu radu procesorov Crusoe, ktoré pracujú v nootebookoch, handhaldoch aj PDA. Špecialitami sú nízke nároky na príkon, schopnosť plynule meniť pracovnú frekvenciu od výkonnostných nárokov spustenej aplikácie a vysoká HW nezávislosť - o nasadení rpocesora v PDA, notebooku či komunikátore rozhoduje výhradne najnižšia vrstva SW. V súčasnosti sú pre notebooky aktuálne procesory Crusoe TM3200 je vyrobený 0,22 µm technológiou, pracuje na 333 a 400 MHz, frekvencia FSB sa neudáva, používa 96 kB cache L1, L2 nemá. Crusoe TM5400 je vyrobený 0,18 µm technológiou, pracuje na 500 až 700 MHz, frekvencia FSB sa neudáva, používa 128 kB cache L1 a 256 kB L2 pracujúcej na frekvencii jadra; zvláštnosťou je premenná hodnota napájacieho napätia – od 1,2 do 1,6 V.
Ing. Jaromír Tříska
35
Texty pre VYT a EPS, SPŠE Piešťany 2002
36/36
Hardware – doplnkové texty - procesory
Procesory firmy Motorola Motorola sa v segmente procesorov pre osobné a výkonné počítače sústreďuje na procesory typu RISC a svoje procesory zaraďuje podľa náročnosti technológie do tried označených G1 až G6. Platformu týchto procesorov nazýva PowerPC. V triede osobných počítačov sa procesory Motorola uplatňujú v počítačoch Apple Macintosh. Obchodná stratégia tejto firmy je od firiem podielajúcich sa na „Intelovskej“ platforme veľmi odlišná: Počítače sa dodávajú ako hotové uzatvorené systémy; nepočíta sa s žiadnymi upgrade komponent, výmenami prídavných kariet či procesorov. Preto sa ani samotné procesory na trhu neobjavujú, a ani dokumentácia k predávanej zostave neoplýva podrobnosťami o type procesora, ktorým je konkrétna zostava vybavená – údaj sa spravidla obmedzuje na údaj o „generácii“ – napr. procesor „PowerPC G3“ , taktovacej frekvencii procesora, a o kapacite cache pamätí. V oblasti platformy PowerPC spolupracuje Motorola veľmi úzko s IBM. Power PC G1 Charakteristické rysy: 0,60um technológia, pracovná frekvencia 33 až 120 MHz Procesory v tejto rade majú označenie MPC 601, 5xx, 821, 823, 850, 860, 862 Power PC G2 Charakteristické rysy: 0,50um technológia, pracovná frekvencia nad 300 MHz Procesory v tejto rade majú označenie MPC 5xxx, 603, 604, 8240, 8245, 8255, 8260, 8264, 8265, 8266, ...82xx Procesory tejto kategórie boli montované do počítačov Power Macintosh modely 4400, 5500, 6500 a powerBook 1400, resp. 3400 (konkrétne procesor 603e) a Power Macintosh modely 7300, 8600, 9500, 9600 (konkrétne procesor604e) Charakteristika 603e: Takt 200-300 MHz, 256 kB cache L2. Charakteristika 604e: Takt 200-350 MHz, 256 kB až 1 MB cache L2. Porovnanie 200 MHz procesora 604e a 200 MHz Pentia Pro v auguste 1996 preukázalo, že 604e prekonáva výkonom Pentium o 26%. Podrobnosti testovania však nie sú známe. Power PC G3 Charakteristické rysy: 0,27um technológia, pracovná frekvencia nad 450 MHz, podpora cache L2 mimo čípu Procesory v tejto rade majú označenie MPC 740, 745, 750, 755, ..., 7xx Týmito procesormi boli vybavené počítače iMac a iBook dodávané v r. 1999. Takt 350 až 500 MHz, takt FSB 100 MHz, cache L2 512 kB. Power PC G4 Charakteristické rysy: 0,15um technológia, pracovná frekvencia dosahuje 1 GHz, pamäť cache L2 je v jadre procesora, podpora symetrického multiprocesingu, dve paralelné spolupracujúce výkonné jednotky v jadre, nová výkonná jednotka pre výpočty s plávajúcou desatinnou čiarkou Velocity Engine. Procesory v tejto rade majú označenie MPC 7400, 7410, 7450, 7440, 7455..., 74xx Ing. Jaromír Tříska
36
Texty pre VYT a EPS, SPŠE Piešťany 2002
Hardware – doplnkové texty - procesory 37/37 Procesormi tejto skupiny boli vybavené počítače triedy PowerMac G4 v r. 1999, ich takt bol 500 MHz (ovšem v prospektoch bolo uvádzané 2x500 MHz – ovšem tzn. nie 1 GHz, ale dve jednotky v jadre a každá na 500 MHz). V priebehu roka 2001 bolo dosiahnutých 733 MHz s predpokladom dosiahnutia gigahertzovej frekvencie v r. 2002. Podarilo sa však integrovať priamo na číp cache L2 s kapacitou 256 kB (ovšem procesor s touto cache „zvláda“ maximálne 500 MHz). Vo vývoji je G4e, pripravovaný s použitím SOI technológie (zvýšenie výkonu o 22% pri rovnakej frekvencii, možnosť taktovať na 1,5 GHz, výrazné zníženie príkonu energie). Na platforme G4 pripravuje nový procesor aj IBM triedy Power G4, snahou je s využitím technológie SOI dosiahnúť taktu cez gigahertz a na číp zmestiť tri nezávislé cache L2, každú o veľkosti 500 kB.
Na platforme Power PC G4 bol počiatkom roka 2002 predstavený nový 32 bitový procesor MPC7455. Vyrába sa vo verziách s frekvenciou jadra 600 MHz až 1000 MHz., frekvencia FSB je 133 MHz. Procesor obsahuje štyri ALU jednotky – 3x jednoduchá, 1x komplexná, ďalej dve jednotky FPU a štyri jednotky AltiVec (AltiVec je u PowerPC niečo ak 3Dnow! alebo SSE u AMDa Intela). Disponuje cache L1 32 kB pre dáta a 32 kB pre inštrukcie a cache L2 priamo na čípe s kapacitou 256 kB. podporuje aj externú cache L3 1 alebo 2 MB. Vyrába sa 0,18 um technológiou s využitím SOI technológie. Je určený pre symetrický multiprocesing – na motherboard sa osadzuje dvojica týchto procesorov; v gigahertzovej verzii potom dosahujú spolu výpočtový výkon 15 GFLOPS. Power PC G5 je 64 bitový procesor fy IBM, určený pre výkonné pracovné stanice Power Mac G5. Procesor je z radu procesorov Power PC 970, pričom Power PC G5 sa od základného modelu líši doplnenými špeciálnými funkciami fy. Apple – a to AltiVec/Velocity Engine. Taktovacia frekvencia je 1,6 GHz, 1,8 GHz, 2,0 GHz, FSB beží fyzicky na štvrtine rýchlosti procesora, ale keďže je zbernica typu DDR, je efektívny takt polovica taktu procesora. Dátová priepustnosť zbernice udávaná výrobcom je 8 Gb/s. Procesor je optimalizovaný na aplikácie využívajúce 64bitovú inštrukčnú sadu, bez straty výkonu je však schopný spracovávať aj 32 bitové aplikácie a pracovať s 32bitovým operačným systémom. Procesor dokáže v jednom takte spracovať súčasne až 215 inštrukcií. Procesor je konštruovaný pre podporu dvojprocesorového multiprocesingu; v MP režime využíva každý procesor vlastnú zbernicu; priepustnosť dát v tejto konfigurácii predstavuje 16 Gb/s. Je vyrábaný 0,13um technológiou. Vysokému výkonu procesora zodpovedá aj čípová sada, používaná v počítačoch Power Mac G5, podporujúca pamäte 400 MHz/128 bit s max kapacitou až 8 GB, technológiu HyperTransport4 na pripojenie ovladača 133 MHz PCI-X zbernice a diskové rozhranie serial ATA.
4
Hypertransport – nová architektúra zbernice na komunikáciu medzi procesormi navzájom v multiprocesorovom systéme a medzi procesorom a ďalšími zbernicami. Bližšie v kapitole venovanej platforme AMD Sledge Hammer Ing. Jaromír Tříska
37
Texty pre VYT a EPS, SPŠE Piešťany 2002
38/38
Hardware – doplnkové texty - procesory
Ing. Jaromír Tříska
38
Texty pre VYT a EPS, SPŠE Piešťany 2002
39/39
Hardware – doplnkové texty - procesory
Procesory pre výkonné stanice a servery Zatial čo v triede procesorov pre osobné počítače dominovali osembitové, šestnásťbitové a tridsaťdvabitové procesory, sú výkonné počítače takmer výhradne kráľovstvom 64bitových procesorov, ktorých vývoj sa začal niekedy začiatkom osemdesiatych rokov 20. storočia a verejnosti boli predstavené asi o desať rokov neskôr. Najznámejšie z nich sú Alpha, PA-RISC, MIPS, PowerPC či Ultra SPARC. Druhý typ, ktroý priniesol rok 1989, je 64bitový RISC procesor Intel 80860. Tento procesor nie je vzhľadom k architektúre RISC, kompatibilní s radou procesorov iAPX 86, a preto sa o ňom v tomto texte nezmieňujeme. Počíta ba s ním pre super-výkonné stanice s obrovským výpočtovým potenciálom v pohyblivej rádovej čiarke (17 MFLOPS na čipe) a pre grafické transformácie v reálnom čase. Inštrukčné sady pre 64bitové procesory Aby bol naplno využitý výkonnostný potenciál procesorov, bolo potrebné súbežne s vývojom nových architektúr pripraviť aj nové inštrukčné sady. Vychádzajú z inštrukčnej sady RISC, obsahujú však rozšírenia a vylepšenia navrhnuté vzhľadom na schopnosti a potreby konkrétnej architektúry jadra procesora. Vzniklo tak niekoľko platforiem, z ktorých najznámejšie sú: VLIW Very Large Instruction Word Majú schopnosť spracúvať viac inštrukcií súčasne. VLIW bola vytvorená báze 32-bitových mikroprocesorov RISC tak, aby procesor bol schopný v jednom momente spracúvať dve inštrukcie súbežne. Podarilo sa vytvoriť inštrukčnú súpravu, ktorá disponovala inštrukciami dvojnásobnej dĺžky, než mali dovtedy používané inštrukcie. Neišlo vtedy o úplne nové inštrukcie, ale o „párovanie“ dovtedy používaných kratších –32bitových- inštrukcií. Na tejto platforme tak vznikli mikroprocesory so 64-bitovou inštrukčnou súpravou, ktoré však „vnútorne“ spracúvali 32-bitové inštrukcie. UVLIW Ultra Very Large Instruction Word Ďalšie zvýšenie výkonnosti mikroprocesora prostredníctvom zvyšovania počtu súbežne spracúvaných inštrukcií. Základom sú stále 32- bitové inštrukcie, ale súčasne sa spracúvajú hneď štyri, to znamená predĺženie inštrukčného slova zo 64 bitov na 128 bitov. Keďže však ostatné prvky mikroprocesorovej architektúry ostali „nedotknuté“, aj tieto mikroprocesory sa označujú ako 64-bitové. DVLIW Dynamic Very Large Instruction Word Využíva 128-bitovú inštrukčnú súpravu, pri ktorej je každá inštrukcia zložená zo štvorice 32-bitových inštrukcií. Odlišný je princíp zostavovania jednotlivých inštrukcií. EPIC Explicitly Parallel Instruction Computing Spoločná mikroprocesorová architektúra HP a Intelu, optimalizovaná na súbežné spracovanie viacerých inštrukcií. Táto architektúra, hoci je 64-bitová, používa inštrukčné slovo s dĺžkou 128 bitov. Neobsahuje štvoricu, ale iba trojicu inštrukcií. Na rozdiel od predchádzajúcich prináša EPIC celkom novú inštrukčnú súpravu.
Ing. Jaromír Tříska
39
Texty pre VYT a EPS, SPŠE Piešťany 2002
40/40
Hardware – doplnkové texty - procesory
Významné platformy 64bitových procesorov ALPHA Vyvíjala spoločnosť Digital. Už v počiatočnom štádiu vývoja v osemdesiatych rokoch minulého storočia bola táto architektúra navrhnutá ako 64-bitová. V čase uvedenia prvého mikroprocesora Alpha EV4 nejestvoval nijaký iný 64-bitový mikroprocesor. Už prvá Alpha používala 64-bitovú inštrukčnú súpravu (presnejšie: Každá 64-bitová inštrukcia bola zložená z dvoch 32-bitových inštrukcií., inštrukcie Alphy však umožňovali spracovanie 64-bitových údajových slov), 64-bitové adresovanie a mikroprocesor disponoval tridsiatimi dvoma 64bitovými registrami na spracovanie operácií s celými číslami a rovnakým počtom 64-bitových registrov na spracovanie operácií s desatinnou čiarkou. Prvé 64-bitové mikroprocesory EV-4 (Alpha 21064) sa na trhu objavili už před desiatimi rokmi – v roku 1992. V roku 1995 EV-5 (Alpha 21164). Počet inštrukcií spracúvaných súčasne sa zdvojnásobil. Alpha 21164 teda vedela spracovávať súčasne štyri inštrukcie. V roku 1998, prichádza na trh Alpha 21264 (EV-6). Tento mikroprocesor je schopný spracovávať súčasne šesť inštrukcií, pričom štyri sú celočíselné a ďalšie dve musia byť operácie s desatinnými číslami. EV-7 (21364). V jedinom čipe boli okrem samotného jadra mikroprocesora integrované aj niektoré ďalšie komponenty mikroprocesorovej architektúry. Jadro mikroprocesora EV-7 bolo takmer totožné s jadrom jeho predchodcu. Priamo do čipu bola implementovaná sekundárna pamäť cache, radič pamäte a sieťové rozhranie. Nadadenia mikroprocesorov vo viacprocesorových systémoch typu SMP (Shared Memory Multi Processing).Alpha je EV-8 (21464) ktorá podporuje TLP, SMT, štvorcestný SMT, osemcestnú superkalárnu architektúru ujožňujúcu spracovanie ôsmich inštrukcií súčasne. V r. 2001 Compaq odpredal technológiu a vývoj tejto platformy Intelu. HP PA-RISC Ďalším významným pojmom medzi-bitovými RISC architektúrami je HP PA-RISC od spoločnosti Hewllet-Packard. Tajomná skratka PA-RISC znamená Precision Architecture RISC. Jej vývoj sa v spoločnosti Hewlett-Packard začal v roku 1986. Prvým čipom v rade PA-RISC bol mikroprocesor PA 7100 , uvedený na trh v roku 1992. Ten umožňoval súčasné spracovanie dvoch inštrukcií v jednom cykle. To však iba v prípade, že šlo o kombináciu operácie s celým číslom a operácie s desatinným čislom. PA 7200 uvedený v roku 1994 bol doplnený o ďalšiu výkonnú jednotku. Aj tento čip mohol spravúvať súčasne iba dve inštrukcie, vďaka implementácii spomenutej výkonnej jednotky mohlo ísť buď o dve operácie s celými čislami, alebo o rovnakú kombináciu ako v prípade PA 7100. V januári 1996 predstavuje spoločnosť ďalšiu generáciu čipov PA-RISC. Označenie architektúry PA-RISC 2.0 hovorí jasne, že ide o novú generáciu architektúry, ktorá je už úplne 64-bitová. PA 8000 umožňuje spracovanie štvorice inštrukcií súčasne a podporuje 1 MB externej pamäte cache, ktorá je spoločná pre údaje i inštrukcie. PA 8200 (uvedený na trh v lete 1998) pamäťou cache s kapacitou 4 MB (z toho 2 MB pre údaje a 2 MB pre inštrukcie). Okrem rozšírenia pamäte boli v jadre realizované iba malé zmeny. V priebehu roka 1998 prichádza ďalší číp z rodiny PA 8x00 – PA 8500. Ten je, ako prvý mikroprocesor tejto rodiny, vybavený pamäťou cache implementovanou priamo v jadre. Jej kapacita je sice nižšia ako u predchodcu, 1,5MB (1 MB pre údaje a 0,5 MB pre inštrukcie), ale integrácia priamo do čipu z pohľadu výkonnosti vyvážila zníženie jej kapacity. Zvýšila sa pracovná frekvencia mikroprocesora. V roku 2000 spoločnosť predstavila mikroprocesor PA 8600, ktorý sa líšil iba drobnými úpravami . V r. 2001 roku nastúpil mikroprocesor PA 8700 , ktorý síce vychádza z čipu PA 8500, disponuje však vyššou kapacitou pamäte cache (1,5 MB údajovej a 0,75 MB inštrukčnej ), zvýšená bola pracovná frekvencia , ale aj počet výkonných Ing. Jaromír Tříska
40
Texty pre VYT a EPS, SPŠE Piešťany 2002
Hardware – doplnkové texty - procesory 41/41 jednotiek (na desať). I keď sa nezmenil počet inštrukcií spracúvaných v jednom cykle, rozširila sa pridaním výkonných jednotiek celková priepustnosť mikroprocesora. Rozšírený bol aj maximálne adresovateľný preistor (kapacita pamäťe). V budúcnosti by sme sa mali dočkať ešťe verzií PA 8800 a PA 8900, mali by maťpracovnú frekvenciu nad úrovňou 1 GHz. PA 8800 bude mať podstatne väčšie zmeny. Tento mikroprocesor sa označuje aj ako Mako. Čip Pa 8800 by totiž mal obsahovať dve identické jadrá 8700 pracujúce v režime SMP , každé vybavené 750 kB L1 cache pre údaje a rovnakým množstvom L1 cache pre inštrukcie (spolu 3 MB), v rovnakom čípe by mal byť aj kontrolér L2 cache a zbernicové rozhranie. V module mikroprocesora má byť externe veľká pamäť L2 cache s kapacitou 32 MB. Pamäť má byť typu EMS (takzvaná jednotranzistorová SRAM). HP sa podarilo zaistiť, že inštrukcie používané v PA-RISC sú aj v inštrukčnej súprave ISA, používanej v architektúre IA-64, obe platformy sú totiž binárne kompatibilné. V PA 8800 by sa tento mikroprocesor mal dodávať v module, ktorý bude pinovo kompatibilný s modulmi mikroprocesorov Intel McKinley.
POWER Ďalším hráčom na poli 64-bitových serverov i mikroprocesorov je IBM. Doslova domovskými vodami pre 64-bitové servery a teda aj mikroprocesory sú systémy RS/6000. Počiatky architektúry POWER siahajú do roku 1990. V roku 1993 IBM predstavila archtiektúru POWER 2 , ktorá disponovala dvojicou výkonných jednotiek tak na spracovanie celočíselných operácií, ako aj na spracovanie operácií s desatinnou čiarkou. Súčasťou pratformy POWER sú aj mikroprocesory PowerPC (modely 601,603,604 a604e). Prvé 64-bitové mikroprocesory IBM však prišli na trh iba v roku 1997, keď spoločnosť uviedla mikroprocesory RS64. O rok neskôr POWER3, ktorá je kombináciu RS64 a PowerPC. Najnovšia architektúra POWER4 ktorá podobne ako HP 8800 prináša implementáciu dvoch mikroprocesorových jadier na jednom čipe. Ide o jadro odvodené od miroprocesorov PowerPC a Power3. Priamo v čipe je integrovaná pamäť cache prvej (po64 kB inštrukčnej a údajovej pre každý z mikroprocesorov) i druhej úrovne (1,5 MB pre každý mikroprocesor) v module je možné implementovať až 128 MB pamäte cache tretej úrovne. Pracovná frekvencia sa má rýchlo vyšplhať od 500 MHz po 1 GHz a vyššie. IA-64 Hoci z pohľadu súčasníka sa môže zdať, že Intel so svojim Itaniom je v prostredí 64 bitových procesorov nováčikom, opak je pravdou. Treba iba pripomenúť 64bitový RISC procesor Intel 80860, s vtedy obrovským výpočtovým výkonom v pohyblivej desatinnej čiarke 17 MFLOPS, uvedený na trh v r. 1989 a určený pre výkonné grafické stanice Itanium a najnovšie McKinley sú teda skôr návratom Intelu do dávno známej oblasti. Od vyššie zmienených platforiem je platforma IA-64 vo veľkej miere odlišná a prináša veľa noviniek. Napríklad z pohľadu možnosti paralelného spravovania inštrukcií i podpory multiprocesingu by mala predstavovať špičku. Intel začal spoločne s firmou Hewlett-Packard pracovať na vývoji archtiektúry EPIC, ktorej konkretizáciou sa stala IA-64 a prvým reálnym mikroprocesorom je Itanium . Architektúra IA-64 je úplne nová, nie je zviazaná s architekrúrami RISC ani CISC. Prioritou sa celkom logicky stali 64-bitové aplikácie, výkonnosť mikroprocesora pri ich vykonávaní však nie je oslnivá. Itanium disponuje podporou pre vykonávanie troch inštrukcii v jednom cykle.
Ing. Jaromír Tříska
41
Texty pre VYT a EPS, SPŠE Piešťany 2002
42/42
Hardware – doplnkové texty - procesory
Štruktúra inštrukčného slova IA-64 Inštrukcia 1
Inštrukcia 2
Inštrukcia 3
Šablóna
Každá inštrukcia obsahuje:
Šablóna obsahuje:
Ø Ø Ø Ø Ø
Ø
Kód inštrukcie Register predpovedí (6 bit)
Ø
Zdroj 1-2 (7 bit)
informáciu inštrukcií
o
zoskupení
príznak predvýberu
Cielový register (7 bit) Rozšírenie kódu inštrukcie
Kľúčové črty IA-64 ♦ ♦ ♦ ♦
♦
celé inštrukčné slovo má dĺžku 128 bitov paralelné spracovanie inštrukcií flexibilné združovanie inštrukcií veľký súbor priamo adresovateľných registrov nový prístup k vetveniu programu typu If- Then - Else
Priamo na čipe je cache prvej úrovne s kapacitou 16 kB pre údaje a takú istú kapacitu má aj rovnaká pamäť vyhradená pre inštrukcie. Pamäť cache druhej úrovne je tiež implentovaná priamo na čipe a má kapacitu 96 kB. V mikroprocesorovom module je aj pamäť tretej úrovne s kapacitou 2 alebo 4 MB (podľa verzie). HAMMER V porovnaní s ostatnými je architektúra úplne odlišná. Na rozdiel od všetkých doteraz jestvujúcich 64-bitových platforiem táto vychádza z architektúry x86, a nielen to. AMD v doposiaľ zverejnených materiáloch uvádza, že ide o prirodzené rozšírenie architektúry x86. Podľa AMD bude ich 64-bitový mikroprocesor rovnako výkonný tak v prostredí 64-bitového operačného systému, ako aj v prostredí 32-bitových operačných systémov. Z pohľadu 32-bitových aplikácii by sa vraj tento mikroprocesor mal správať ako dva 32-bitové mikroprocesory pracujúce v režime SMP. V súčastnosti rovnako ako v minulosti sú 64-bitové mikroprocesory výsadou serverov a veľmi vykonných pracovných staníc, 32-bitové mikroprocesory sú určené obyčajným „deskotopovým smrteľníkom“. Pokiaľ nebude na trhu dostatok aplikácii pre 64-bitové mikroprocesory, ich nasadenie bude obmedzené. ZÁVER V súčasnosti rovnako ako v minulosti ostáva svet 64 bitových procesorov vyhradený pre servery a veľmi výkonné pracovné stanice, u ktorých sú kladené mimoriadne vysoké požiadavky na rýchle spracovanie obrovského množstva dát. Nasadeniu týchto procesorov v oblasti osobných počítačov bráni jednak vysoká cena, v neposlednom rade potom neexistencia vhodných aplikácií optimalizovaných pre túto platformu.
Ing. Jaromír Tříska
42
Texty pre VYT a EPS, SPŠE Piešťany 2002
43/43
Hardware – doplnkové texty - procesory
Procesory pre handheldy a PDA Štandardom sú procesory rodiny ARM. označené SA-1110 , pracujúce na 206 MHz frekvencie jadra a určené pre aplikácie postavené na operačnom systéme MS Windows Pocket PC. Intel predstavil 12. 2. 2002 dva nové procesory, nadväzujúce na triedu SA 1110 Procesory triedy PXA 2x0 Ide o 32 bitové procesory postavené na jadre Xscale, používajú architektúru ARM 5TE, sú softwarovo kompaktibilné s predch. verziou ARM4, na ktorej bol postavený SA-1110. Vyrábajú sa 0,18 um technológiou, využívajú Intel Media Processing Technology, čo je 16bitová obdoba MMX, využívajú cache 32 kB pre dáta a 32 kB pre inštrukcie, navyše 2 kB FIFO cache pre „prúdové dáta“. Môžu prepínať za chodu medzi módmi LowPower a Turbo – podľa potrieb užívateľa s dôrazom na úsporu energie, alebo na výkon. PXA 210 sa vyrába s interným taktom 133 až 200 MHz a je prednostne určený pre mobilné telefóny, počíta sa s ním aj do PDA a handheldov. PXA 250 má interný takt 200, 300 a 400 MHz, umožňuje pripojiť RAM cez 16 bitovú aj 32 bitovú zbernicu a okrem iného podporuje aj USB. Počíta sa s ním do najkomfortnejších PDA a handheldov.
Ing. Jaromír Tříska
43
Texty pre VYT a EPS, SPŠE Piešťany 2002
44/44
Hardware – doplnkové texty - procesory
Jednočípové mikropočítače – mikrokontroléry Jednočipové mikropočítače dnes nájdeme v mnohých zariadeniach, s ktorými sa každodenne stretávame. Okrem úzko špecializovaných meracích a riadiacich systémov, by sa bez nich nezaobišli ani technické prostriedky bežného užívateľa, akými sú napríklad videorekordér, CD prehrávač, fax, mobilný telefón, či mikrovlná rúra. Jednočipový (monolitický) mikropočítač je vlastne vo svojej najhlbšej podstate integrovaný obvod, ktorý v sebe vďaka veľkej integrácii skrýva všetky najdôležitejšie časti počítačovej architektúry. Tieto sú volené tak, aby bol schopný v základe fungovať samostatne, bez ďalších periférií. V zásade nemožno špecifikovať vlastnosti všetkých typov, pretože tak ako aj u iných výrobkov, špecifické vlastnosti závisia najmä od architektúry čipu a v neposlednom rade aj od jeho výrobcu. V menej náročnom mikropočítačovom zariadení a spracovaní signálov sú v dnešnej dobe štandardom jednočipové osembitové mikropočítače firiem Motorola 68HC05 alebo 68HC11, Intel 8051 a rada jeho variant - klonov od rôznych výrobcov (Phillips, Siemens, Atmel, Dallas) alebo Zilog Z8, ale i modernizovaná rada Z80. Ďalším výrobcom je aj Americká firma MICROCHIP, ktorá na našom trhu prezentuje radu svojich mikrokontrolérov (jednočipový mikropočítač sa zvykne nazývať aj mikrokontrolér) PIC. Skratka PIC pochádza z anglického jazyka a znamená Peripheral Interface Controller. Ako je z anglického názvu zrejmé ide o procesory so zameraním na realizáciu meracích a akčných členov väčších riadiacich systémov. Akčným členom máme na mysli stýkač, alebo vinutie
krokového motoru a podobne. Obr. 1 Architektúru jednočipových mikropočítačov je asi najlepšie vysvetliť na procesoroch rady 8051. Ing. Jaromír Tříska
44
Texty pre VYT a EPS, SPŠE Piešťany 2002
45/45
Hardware – doplnkové texty - procesory
Intel 8051 Tento procesor pochádza z roku 1980 a je vývojovo procesorom relatívne starým. U návrhárov je však ešte i dnes veľmi obľúbený, takže mnoho výrobcov sa orientuje na výrobu procesorov s týmto jadrom. Napríklad firma Philips vyrába 24 rôznych typov týchto procesorov majúcich jadro 8051, ku ktorému sú podľa náročnosti pripojené rôzne periférie (viz. obr. 1). Výrobcovia ponúkajú procesory od základnej hodinovej frekvencie 12 MHz až po 30 MHz v štandardnom puzdre DIL, v prevedení PLCC až po malé púzdra PQFP. Mikroprocesor 8051 je 8bitový jednočipový mikroprocesor s harwardskou štruktúrou, u ktorej je oddelená programová a dátová pamäť. Procesor, ktorého vnútorná štruktúra je zobrazená na obrázku č. 2, je schopný samostatnej činnosti po pripojení vonkajšieho piezokeramického rezonátoru (kryštálu) a jedného napájacieho napätia 5V. Na čipe procesoru je umiestnená vlastná procesorová jednotka CPU, ktorá je vnútornou zbernicou spojená s pamäťou programu ROM alebo EEPROM s kapacitou 4kB (existujú aj typy bez tejto pamäte), s pamäťou RAM s kapacitou 128 bytov a so štyrmi vstupno-výstupnými bránami P0 až P3, ktoré zabezpečujú styk procesoru s vonkajšími perifériami. Pokiaľ nechceme, alebo nemôžeme využívať procesor v jednočipovej konfigurácii sú z neho vyvedené riadiace signály pre správu vonkajšej programovej alebo dátovej pamäti, z nich každá môže mať až 64kB. Pre jednoduchšiu komunikáciu s perifériami je procesor vybavený radičom prerušení, ktorý spracováva 5 zdrojov prerušení. Čítače, ktoré uľahčujú realizáciu časovania sú 16 bitové, s hodinovým signálom odvodeným z interného generátoru hodín alebo z vonkajších vstupov T0 alebo T1. Pre jednoduchší styk s okolím je procesor vybavený duplexným sériovým rozhraním. Mikroradič je
ďalej vybavený Booleovským procesorom. Obr. 2 Programovanie mikroradičov sa prevádza pomocou jazyka symbolických adries assembleru. Každá z typových rád procesorov má špecifický assembler, ktorý obsahuje až Ing. Jaromír Tříska
45
Texty pre VYT a EPS, SPŠE Piešťany 2002
Hardware – doplnkové texty - procesory 46/46 niekoľko desiatok základných príkazov. Napr. už spomínané mikroradiče 8051 sú odvodené od jadra 8051, čiže aj assembler je totožný s 8051. Príkladom štruktúry programu daného assembleru je jednoduchý prepis obsahu portu P0 na port P1 : ORG 00H ZAC: MOV A,P0 - presun obsahu P0 do akumulátoru MOV P1,A - presun obsahu akumulátora na P1 JMP ZAC - skok na začiatok cyklu … END
Po zostavení programu sa tento prevedie vhodným prekladačom na niektorý zo štandardizovaných kódov (napr. Intel HEX) a programovacím zariadením prenesie do vnútornej pamäti programu (OTP,EEPROM). Výhodou mikroradičov obsahujúcich EEPROM je možnosť mnohonásobného prepisu programu, a teda aj väčšia univerzálnosť použitia.
Ing. Jaromír Tříska
46
Texty pre VYT a EPS, SPŠE Piešťany 2002
47/47
Hardware – doplnkové texty - procesory
Ing. Jaromír Tříska
47
Texty pre VYT a EPS, SPŠE Piešťany 2002
48/48
Hardware – doplnkové texty - procesory
Multiprocesing a hyperthreading Multiprocesing Multiprocesingom rozumieme spoluprácu viacerých procesorov na plnení určitej úlohy. Procesory sa združujú do tzv. clusterov, čo sú dvojice, čtvorice či osmice procesorov, ktoré prostredníctvom riadiacej logiky spolupracujú na riešení jedinej úlohy). Táto technológia je dokonale prepracovaná už veľa rokov a využíva sa najmä u mainframov. Multiprocesing sa však používa aj v segmente procesorov pre PC – spoluprácu procesorov umožňujú napríklad Pentium Xeon , Intel Itanium, McKinley,AMD Athlon MP. Multiprocesorový systém Procesor 1 Riadiaca logika Výkonné jednotky Cache
Procesor 2 Riadiaca logika Výkonné jednotky Cache Zbernica Pamäť
Multiprocesing musí byť podporovaný zo strany dosky, čípovej súpravy, BIOSu, operačného systému a samozrejme aj aplikácia musí byť napísaná tak, aby bolo možné proces rozdeliť do tzv. vlákien – threadov. Prostriedky štandardných jednoprocesorových systémov na zvýšenie výkonu Moderné procesory - prakticky už od 80486 - disponujú viacerými výkonnými jednotkami, ktorých postupne pribúdalo - prvé Pentium disponuje dvoma samostatnými ALU, ktoré za priaznivých okolností dokážu pracovať paralelne, postupne počet samostatných výkonných jednotiek narastal. Vznikali jednotky špecializované na výpočty s pevnou desatinnou čiarkou (pre operácie s celočíselnými údajmi) a výpočty s pohyblivou desatinnou čiarkou (výpočty s reálnymi číslami). Paralelné využívanie viacerých jednotiek na beh jediného programu si však vyžaduje zvýšené nároky na riadiacu logiku. Objavujú sa techniky pipeliningu, u Pentia4 vypracované až do úrovne dvadsaťstupňového hyperpipeliningu, techniky vetvenia programu a predpovedania skokov, špekulatívneho vykonávania inštrukcií a ďalšie, ktoré zabezpečujú rýchlejší beh programu efektívnym využívaním výkonných jednotiek. Analýza programu, jeho rozdelenie do samostatne spracovávaných „vlákien“ a urýchlenie výpočtu paralelným využívaním viacerých výpočtových jednotiek však ešte neznamená, že by procesor bol schopný paralelne spracovávať dve samostatné úlohy. Zdanlivý súčasný beh viacerých programov na jednoprocesorovom systéme sa dosahuje za pomoci operačného systému technikou multitaskingu, kedy operačný systém prepína medzi jednotlivými programami – postupne vždy na krátky časový úsek spustí určitý program na procesore. Plnohodnotný paralelný beh viacerých programov na jednom procesore však umožňuje až hyperthreading. Hyperthreading Zjednodušene sa dá povedať, že to je vlastne "falošný" multiprocesing. Ing. Jaromír Tříska
48
Texty pre VYT a EPS, SPŠE Piešťany 2002
Hardware – doplnkové texty - procesory 49/49 Techniky známe z multiprocesingu využíva v rámci jediného procesora, ktorý sa pre operačný systém i pre aplikáciše tvári, ako by obsahoval dve jadrá. V skutočnosti sa však podstatná časť jadra - výkonné jednotky, obvody na spoluprácu s pamäťami a cache pamäť nemení. Prepracovaná je však riadiaca logika procesora, ktorá má na starosti aktuálny stav výpočtového procesu: registre a stavový vektor. Riadiaca logika dostáva stále informácie od jednotky ArchStates, ktorá sleduje vyťaženie jednotlivých výkonných jednotiek. Ak riadiaca logika zistí, že na spracovanie čaká viacero úloh a že sa uvoľnili niektoré výpočtové jednotky procesora - napr. práve vykonávaná úloha čaká na prísun nových dát z operačnej pamäti - využije okamžite uvoľnené výkonné prostriedky na spracovanie druhej úlohy. Výhodou oproti multiprocesingu je to, že riadiaca logika distribuuje úlohy v rámci jediného procesora, čo umožňuje úlohy distribuovať efektívnejšie jako v prípade viacerých fyzických procesorov, a zároveň sa lepšie využijú prostriedky, ktoré procesor poskytuje.
Uvádza sa až 30% zvýšenie výkonu procesora pri zväčšení potrebnej plochy čípu o 5%. Zvýšenie výkonu sa prejaví však iba u tých programov, ktoré sú optimalizované pre hyperthreading, inak povedané sú pre túto techniku "napísané". V opačnom prípade dochádza aj ku spomaleniu vykonávania úloh - riadiaca logika sa pokúša proces rozdeliť do threadov, ale samotný program to neumožňuje. Mikroprocesor s hyperthreadingom Logický procesor 1 Riadiaca logika 1
Logický procesor 2 Arch Riadiaca logika 2 Výkonné jednotky Cache Zbernica Pamäť
Jednoznačný nárast výkonu však bol zrejmý v prípade súčasného behu viacerých programov - napríklad práca s Internetom a súbežný beh antivírusového programu alebo šifrovania dát na pozadí. Ďalej musí byť technika HT podporovaná aj zo strany základnej dosky, musí byť podporovaná BIOSom a operačným systémom. Táto technológia sa pod označením SMT - Simultaneous MultiThreading používa od marca 2002 v procesoroch Intel Xeon MP – Foster, v novembri 2002 bol prestavený ďalší procesor od Intelu, podporujúci túto techniku - model Pentium 4 HT 3,06 GHz.. Zdroj: PC WORLD 01/2003, str. 99, PC Revue 12/2002, str. 40
Ing. Jaromír Tříska
49
Texty pre VYT a EPS, SPŠE Piešťany 2002
50/50
Hardware – doplnkové texty - procesory Performance Rating – klady a riziká
„S příchodem Athlonů a Pentií 4 se od sebe naše architektury podstatně odchýlily.“ prohlásil výkonný ředitel AMD Seen a zdůraznil, že Athlon vykoná za jeden hodinový cyklus více práce než Pentium 4, a je tedy na stejné frekvenci rychlejší – například Athlon 1,4 GHz je v mnoha benchmarcích schopen porazit Pentium 4 1,7 GHz. Jenže uživatel, který se o technické záležitosti příliš nezajímá, si všimne především frekvence a nebude se pídit po nějakém počtu vykonaných instrukcí za hodinový cyklus. Jak tedy takovému uživateli jednoduchou formou sdělit, že frekvence není všechno? Metoda, kterou pro tento účel již dávno vynalezlo konsorcium firem AMD, Cyrix, IBM a SGS-Thomson, se zkráceně jmenuje Peformance Rating (zkráceně PR), což některé zdroje interpretují též jako Pentium Rating. Spočívá lapidárně řečeno v tom, že daný model procesoru není na trhu označován svou skutečnou pracovní frekvencí, ale frekvencí Pentia, kterému je schopen se zhruba výkonově vyrovnat. Například procesor Cyrix MII PR150 (nechť odpočívá v pokoji :-) neběžel na 150, ale 120 MHz – v programech, které používaly pouze celočíselné výpočty (kancelářský software, starší hry atd.) se však dokázal vyrovnat Pentiu 150. Ukazatel PR sice do jisté míry vyrovnal neobjektivnost posuzování procesorů podle frekvence, ale jeho odpůrci mu právem vytýkali, že i on je zavádějící: procesory AMD a zejména Cyrix měly totiž podstatně slabší jednotku pro výpočty v pohyblivé řádové čárce (FPU), takže pokud by se chtěl podle PR řídit například hráč hry Quake nebo konstruktér používající programy CAD, splakali by nad výdělkem. Nutno ovšem dodat, že AMD od té doby ve svých procesorech jednotku FPU značně vylepšilo a dnes v tomto ohledu Intel překonává. Zatímco procesory Cyrix (nyní divize firmy VIA) nepřestaly PR používat dodnes, AMD to nikdy nemělo zapotřebí – až do nedávné doby. Za nastalé situace je však dost pravděpodobné, že k zavedení PR brzy sáhne, a vypadá to, že bude s ratingem svých procesorů poměrně opatrná – chce se bezpochyby vyhnout obvinění z nadhodnocování. Athlon Palomino běžící na frekvenci 1333 MHz by tak měl dostat jen PR1500+, ačkoli se ve většině současných aplikací výkonově vyrovná Pentiu 4 1900 MHz. Další modely by měly být označeny takto: Athlon 1400 MHz => PR1600+ Athlon 1466 MHz => PR1700+ Athlon 1533 MHz => PR1800+ Výrobci počítačů však nejsou plánem na zavedení PR právě nadšeni: prodáte uživateli něco jménem PR1600+ a ono se mu to pak bude hlásit jako 1400? AMD sice ujišťuje, že BIOS bude uživateli místo reálné frekvence ukazovat hodnotu PR, ale utility typu WCPUID budou vždy schopny zjistit skutečný kmitočet. Z marketingového hlediska metoda PR skutečně není ideální a vysoké megahertzy Pentií 4, jakkoli jsou výkonově nepřesvědčivé, představují pro prodeje Athlonů zejména do budoucna vážnou hrozbu.
Ing. Jaromír Tříska
50
Texty pre VYT a EPS, SPŠE Piešťany 2002