Pannon Egyetem Villamosmérnöki és Inf. Rendszerek Tanszék
Digitális Technika I. (VEMIVI1112D)
Bevezetés. Hol tart ma a digitális technológia? Előadó: Dr. Vassányi István
[email protected]
Feltételek:
Tárgy neve (kódja): Digitális Technika I. (VEMIVI1112D) Ajánlott könyvek:
Dr. Arató Péter: Logikai rendszerek tervezése (BME kiadó) Franklin P. Posser, David E. Winkel: The Art of Digital Design (Prentice Hall)
Óralátogatás: nem kötelező Követelmények: egy ZH lesz (utolsó előtti héten) Megajánlott jegy: Jegy(ZH) >= 4 Vizsgára bocsátás feltétele: a ZH-n legalább 2-es érdemjegy megszerzése PótZH: utolsó héten (aláírás feltétel teljesítése) Vizsga: írásbeli (szóbeli)
Kapcsolódó jegyzet, segédanyag:
http://www.virt.vein.hu → Oktatás → Tantárgyak → Digitális Technika I. Fóliák,
óravázlatok (.ppt) Feltöltésük folyamatosan
Oktatási cél: A kombinációs és sorrendi hálózatok klasszikus tervezési módszereinek, illetve megvalósításainak ismertetése. MSI/LSI áramkörök működési táblázatainak, alkalmazásainak, valamint digitális áramkörök (TTL, CMOS) jellemzőinek megismerése
Hol tart ma a digitális technológia?
Bevezetés: CMOS
Mikro-minimalizálás elve:
Gordon Moore törvénye (1965): rendkívüli jelentőséggel bír a memóriák és a félvezető áramkörök méretcsökkenése esetén. Tanulmány: félvezető áramkörök fejlődése (prognózis) A technológia fejlődésével minden 18 hónapban az 1 felületegységre (mm² Si) eső tranzisztorok száma közel megduplázódik (integritási sűrűség) Ezzel szemben az eszközök ára csökken, vagy stagnál.
2010: Itanium 9300 (Tukwila): 2 milliárd tranzisztor / chip (2010), 70%-a cache 3D rétegszerkezet szilíciumon Működő 32nm/45nm csíkszélességű tranzisztor (high K fém dielektrikum, Hafnium) pl: Intel újgenerációs processzoraiban Metal gate (a PolySi –ot váltja fel)
2012:*
Itanium 9500 (Poulson) 32nm / 3.1 milliárd tranz. 8 mag, 54 MB L3 Cache, 12 utasítás/clock, több szintű párhuzamosság L2 cache: 6 MB, 768 kB per core 170 W @ 2.5 GHz 1300..4600 $ / db
2015: Itanium Kittson (??) * http://www.xbitlabs.com/news/cpu/display/20121108120233_Intel_Launches_Eight_Core_Itanium_9500_Poulson_Mission_Critical_Server_Processor.html
Moore törvénye: Intel processzorok és memóriák 1970 és 2010 között 1,00E+10 Intel Itanium® 2 (9MB Cache)
4G
Intel Core™2 Quad (Q6600)
2G
1G
1,00E+09 256M
512M
Intel Core™ i7 (EE-975)
128M
1,00E+08
Intel Pentium® 4
16M
Transistors per die / Memory capacity
Intel Itanium® 2
64M
1,00E+07
Intel Pentium®
1M
64K
1,00E+05 16K
1,00E+04
8080
8086
Intel Celeron®
Intel 486™
1,00E+06 256K
Intel Core™2 Duo (E4300)
Intel Itanium® Intel Pentium® III
Intel Pentium® II
4M
Intel Itanium® (Tukwila)
Intel 386™ Intel 286™
8088
4K
4004 8008
1,00E+03
1K
1,00E+02
1,00E+01
1,00E+00 1965
1970
1975
1980
1985
1990
1995
Year
Microprocessor
Memory
2000
2005
2010
2015
1. Roadmap projections for Semiconductor technology (prediction) Dynamic Ram
Year
Microprocessors
Smallest Wiring On-Chip feature Chip size Billions of Chip size Millions of Levels / Clock chip [µm] [mm²] bits / chip [mm²] transistors / cm² (MHz)
1995 1998 2001 2004 2007 2010
0.35 0.25 0.18 0.13 0.09 0.07
190 280 420 640 960 1400
0,064 0,256 1 4 16 64
250 300 360 430 520 620
I/O /chip
4 7 13 25 50 90
300 450 600 800 1000 1100
4-5 5 5-6 6 6-7 7-8
500
3600 ?
7 8
2. NOW and near future:
2004 end of 2005 2009*
0.09-0.13 0.065 0.03
*EUV: extrem UV lithographical technique
110 70 Mbit
900 1350 2000 2600 3600 4800
Flash memory
2006-II. 2008 Sep-08
<50 nm 16 Gbit (max 32 GB) 40-20 nm 32 Gbit (max 64 GB) ~20 nm 16 Gbit (max 32 GB)
16 milliárd! Samsung CF NOR technology Samsung NAND CF (PRAM t) Samsung SSD PRAM technology
Órajelnövelés helyett Párhuzamosítás!
Többmagos tech. Intel Core2 Duo/Extreme AMD Athlon 64 X2 5200+ IBM Power6 (2 magos) Intel Core2 Duo/Extreme Intel Core2 Quad (4 mag) AMD Phenom Quad(4 m) IBM Cell (8 magos) - PS3
Feature
65nm 90nm SOI 65nm SOI 45nm (HKMG) 65nm 65nm SOI 90nm SOI
Size
Millions of trans.
143 mm2 291 millió 2 199 mm 233 millió 2 341 mm 700 millió 2 2x107mm 2 x 410 millió 2 2x143mm 2 x 291 millió 285 mm2 463 millió 2 221 mm 231 millió
Dissipation (TPD/ACP)
2.9 GHz 65-125 W Conroe 2.6 GHz 65-80 W Windsor <5 GHz >100 W 2.6 GHz 130W Penryn 2.6 GHz 130 W Conroe 2.2GHz 95 W Agena 3.2 GHz 85 W
Kvantumszámítógép D-Wave 2007.febr. sokváltozós feladatokra: biometrika, parametrikus adatbázisok , pénzügyi számítások számára
A párhuzamosítás háttere
A kisebb méretekkel lineárisan csökken a disszipáció (és nő a sebesség), az órajel-frekvencia emelhető
Viszont a területi elemsűrűség négyzetesen nő
A nagyon kis területről nem lehet nagy hőt elvezetni
Ez az órajelnövelés korlátja
Egy, szupergyors magot a “hőhalál” miatt nem tudunk készíteni
Viszont több mag létrehozásával a teljesítmény fokozható
FELTÉVE hogy a feladat párhuzamosítható
A párhuzamosítás több szinten képzelhető el:
Áramköri/architekturális pl. pipeline szorzó
Automatizált fordítás, pl. loop unrolling
Funkcionális párhuzamosítás, többszálú programozás alkalmazáson belül
Alkalmazások párhuzamos futtatása
Szuperszámítógépek (2014)
Első szuperszámítógépek LARC: (Livermore – US) atom-kutatásokra (1960) IBM 7030 / Strech (1961)
2015: 1. 2. 3. 4.
Tianhe-2 (Kína): Intel Xeon E5-2692 12C, 2.200GHz 3120000 cores, 33.8 Pflops, 17808 kW Titan - Cray XK7 , Opteron 6274 16C 2.200GHz (Cray), 560640 cores,17.6 PFlops, 8209 kW Sequoia - BlueGene/Q, Power BQC 16C, 1.60 GHz (IBM) 1572864 cores, 17.2 PFlops, 7890 kW K computer, SPARC64 VIIIfx 2.0GHz (Fujitsu) 705024 cores,10.5 Pflops,12660 kW
2013. 1. DOE/SC/Oak Ridge National Laboratory United States Titan - Cray XK7 , Opteron 6274 16C 2.200GHz, Cray Gemini interconnect, NVIDIA K20x Cray Inc. 560640 cores, 17.6 / 27.1 (elméleti) PetaFLOP/s , 8.209 MW 710 TB (32+6 GB/node), 18688 hybrid node:16-core AMD Opteron CPU + Tesla K20 GPU Cray linux op. rsz. 2. DOE/NNSA/LLNL United States Sequoia - BlueGene/Q, Power BQC 16C 1.60 GHz, Custom IBM 1572864 16.3 / 20.1 7890 3. RIKEN Advanced Institute for Computational Science (AICS) Japan K computer, SPARC64 VIIIfx 2.0GHz, Tofu interconnect Fujitsu 705024 10.51 11280.4 12660
2012.
1. K Computer: SPARC64 (Kobe, Japan) 10.51 PetaFLOP/s (~1 millió PC) 88,128 db. 2.0GHz 8-core SPARC64 VIIIfx processzor (45 nm) 864 szekrényben, 705,024 mag, Szekrényenként 6 I/O és 96 számítási node (egyenként 16 GB memóriával), össz. 1327 TB m. 6 dimenziós tórusz hálózati topológia, lokális/globális fájlrendszer kombinációja 9.89 MW teljesítmény-felvétel (824 Gflops/KW: nagyon hatékony) 2. Tianhe-1A: NUDT TH MPP, X5670 2.93Ghz + NVIDIA Tesla GPUs, 186 368 processzor (Intel EM64T Xeon X5670 2.93 GHz ), 229 TB memória 2.57 PetaFLOP/s teljesítmény 3.) Jaguar Cray XT5-HE Opteron Six-Core 2.6 GHz (Oak Ridge Laboratory Tennessee) 224 162 processzor (1.759 millió GFLOPs (~ 1.76 PetaFLOP teljesítmény) 10.) IBM Roadrunner BladeCenter QS22/LS21 Cluster, (LANL, Los Alamos) 129 600 processzoros rendszer (PowerXCell 8i 3.2 GHz ) 73 TB memória (N/A) 1.105 PetaFLOP/s
Tianhe-2
Ilyen volt: Tianhe-1A
Cray Titan
IBM Sequoia-Bluegene/Q
K computer (Fujitsu-Riken)
Jaguar Cray XT5-HE
Lehetőségek: Fetch-DecodeExecute (FDE) – párhuzamosítás
átlapolt végrehajtás (látszólagos) - pipeline teljesen párhuzamos végrehajtás (több processzor) – pl. CELL BE (IBM) Heterogén multi-core-os rendszerek
Architekturális példák
https://www-01.ibm.com/chips/techlib/techlib.nsf/products/Cell_Broadband_Engine https://www-01.ibm.com/chips/techlib/techlib.nsf/techdocs/1AEEE1270EA2776387257060006E61BA/$file/CBEA_v1.02_11Oct2007_pub.pdf
AMD X4 Phenom II. (4 mag, 45nm, 3GHz, 758 millió tranzisztor, 125W, Deneb kódnéven)
Intel Nehalem-EX: 80 mag
ISSC’2007 Polaris: 80 mag
65 nm technológia 3D rétegszerkezet
100 – 175 W
1 TeraFLOPs. 4 - 5.1 GHz
Intel Core i7 EE 980x 32nm 3.3 GHz 6 mag / 12 szál
Más alternatíva: D-Wave 2 kvantumszámítógép
2015: 1000 qubit-es változat „qubit”: a kvantum-rendszer alapegysége, amellyel a digitalis technikában ismert ‘0’ és ‘1’ állapotok két normalizált és kölcsönösen ortogonális kvantum állapot-pár segítségével ábrázolhatók { |0 > , |1 > }. A qubitek ‘összefonódnak’, ezáltal lekérdezhetők Félvezetők helyett szupravezető nióbiumot használnak mágneses vákuumban (0.01 K hőmérsékleten) a qubit megvalósítására Csak speciális (optimalizálási) problémákra: pl. megkeresni egy függvény minimumát. A feladatot a külső mágneses tér manipulációjával írják le. A qubit-rendszer a legalacsonyabb energiájú állapotra áll be. Prímszám-szorzatok faktorizálása (56153 a 2015-ös rekord) Komoly gond a stabilitás 2015. dec.: a Google új kvantumalgoritmussal demonstrálta a D-Wave 2 működését
http://www.dwavesys.com