Pannon Egyetem Villamosmérnöki és Inf. Rendszerek Tanszék
Digitális Technika I. (VEMIVI1112D)
Bevezetés. Hol tart ma a digitális technológia? Előadó: Dr. Vassányi István
[email protected]
Feltételek:
Tárgy neve (kódja): Digitális Technika I. (VEMIVI1112D) Ajánlott könyvek:
Dr. Arató Péter: Logikai rendszerek tervezése (BME kiadó) Franklin P. Posser, David E. Winkel: The Art of Digital Design (Prentice Hall)
Óralátogatás: nem kötelező Követelmények: egy ZH lesz (utolsó előtti héten) Megajánlott jegy: Jegy(ZH) >= 4 Vizsgára bocsátás feltétele: a ZH-n legalább 2-es érdemjegy megszerzése PótZH: utolsó héten (aláírás feltétel teljesítése) Vizsga: írásbeli (szóbeli)
Kapcsolódó jegyzet, segédanyag:
http://www.virt.vein.hu → Oktatás → Tantárgyak → Digitális Technika I. Fóliák,
óravázlatok (.ppt) Feltöltésük folyamatosan
Oktatási cél: A kombinációs és sorrendi hálózatok klasszikus tervezési módszereinek, illetve megvalósításainak ismertetése. MSI/LSI áramkörök működési táblázatainak, alkalmazásainak, valamint digitális áramkörök (TTL, CMOS) jellemzőinek megismerése
Hol tart ma a digitális technológia?
Bevezetés: CMOS
Mikro-minimalizálás elve:
Gordon Moore törvénye (1965): rendkívüli jelentőséggel bír a memóriák és a félvezető áramkörök méretcsökkenése esetén. Tanulmány: félvezető áramkörök fejlődése (prognózis) A technológia fejlődésével minden 18 hónapban az 1 felületegységre (mm² Si) eső tranzisztorok száma közel megduplázódik (integritási sűrűség) Ezzel szemben az eszközök ára csökken, vagy stagnál.
2010: Itanium 9300 (Tukwila): 2 milliárd tranzisztor / chip (2010), 70%-a cache 3D rétegszerkezet szilíciumon Működő 32nm/45nm csíkszélességű tranzisztor (high K fém dielektrikum, Hafnium) pl: Intel újgenerációs processzoraiban Metal gate (a PolySi –ot váltja fel)
2012:*
Itanium 9500 (Poulson) 32nm / 3.1 milliárd tranz. 8 mag, 54 MB L3 Cache, 12 utasítás/clock, több szintű párhuzamosság L2 cache: 6 MB, 768 kB per core 170 W @ 2.5 GHz 1300..4600 $ / db * http://www.xbitlabs.com/news/cpu/display/20121108120233_Intel_Launches_Eight_Core_Itanium_9500_Poulson_Mission_Critical_Server_Processor.html
Moore törvénye: Intel processzorok és memóriák 1970 és 2010 között 1,00E+10 Intel Itanium® 2 (9MB Cache)
4G
Intel Core™2 Quad (Q6600)
2G
1G
1,00E+09 256M
512M
Intel Core™ i7 (EE-975)
128M
1,00E+08
Intel Pentium® 4
16M
Transistors per die / Memory capacity
Intel Itanium® 2
64M
1,00E+07
Intel Pentium®
1M
64K
1,00E+05 16K
1,00E+04
8080
8086
Intel Celeron®
Intel 486™
1,00E+06 256K
Intel Core™2 Duo (E4300)
Intel Itanium® Intel Pentium® III
Intel Pentium® II
4M
Intel Itanium® (Tukwila)
Intel 386™ Intel 286™
8088
4K
4004 8008
1,00E+03
1K
1,00E+02
1,00E+01
1,00E+00 1965
1970
1975
1980
1985
1990
1995
Year
Microprocessor
Memory
2000
2005
2010
2015
1. Roadmap projections for Semiconductor technology (prediction) Dynamic Ram
Year
Microprocessors
Smallest Wiring On-Chip feature Chip size Billions of Chip size Millions of Levels / Clock chip [µm] [mm²] bits / chip [mm²] transistors / cm² (MHz)
1995 1998 2001 2004 2007 2010
0.35 0.25 0.18 0.13 0.09 0.07
190 280 420 640 960 1400
0,064 0,256 1 4 16 64
250 300 360 430 520 620
I/O /chip
4 7 13 25 50 90
300 450 600 800 1000 1100
4-5 5 5-6 6 6-7 7-8
500
3600 ?
7 8
2. NOW and near future:
2004 end of 2005 2009*
0.09-0.13 0.065 0.03
*EUV: extrem UV lithographical technique
110 70 Mbit
900 1350 2000 2600 3600 4800
Flash memory
2006-II. 2008 Sep-08
<50 nm 16 Gbit (max 32 GB) 40-20 nm 32 Gbit (max 64 GB) ~20 nm 16 Gbit (max 32 GB)
16 milliárd! Samsung CF NOR technology Samsung NAND CF (PRAM t) Samsung SSD PRAM technology
Órajelnövelés helyett Párhuzamosítás!
Többmagos tech. Intel Core2 Duo/Extreme AMD Athlon 64 X2 5200+ IBM Power6 (2 magos) Intel Core2 Duo/Extreme Intel Core2 Quad (4 mag) AMD Phenom Quad(4 m) IBM Cell (8 magos) - PS3
Feature
65nm 90nm SOI 65nm SOI 45nm (HKMG) 65nm 65nm SOI 90nm SOI
Size
Millions of trans.
143 mm2 291 millió 2 199 mm 233 millió 2 341 mm 700 millió 2 2x107mm 2 x 410 millió 2 2x143mm 2 x 291 millió 285 mm2 463 millió 2 221 mm 231 millió
Dissipation (TPD/ACP)
2.9 GHz 65-125 W Conroe 2.6 GHz 65-80 W Windsor <5 GHz >100 W 2.6 GHz 130W Penryn 2.6 GHz 130 W Conroe 2.2GHz 95 W Agena 3.2 GHz 85 W
Kvantumszámítógép D-Wave 2007.febr. sokváltozós feladatokra: biometrika, parametrikus adatbázisok , pénzügyi számítások számára
A párhuzamosítás háttere
A kisebb méretekkel lineárisan csökken a disszipáció (és nő a sebesség), az órajel-frekvencia emelhető
Viszont a területi elemsűrűség négyzetesen nő
A nagyon kis területről nem lehet nagy hőt elvezetni
Ez az órajelnövelés korlátja
Egy, szupergyors magot a “hőhalál” miatt nem tudunk készíteni
Viszont több mag létrehozásával a teljesítmény fokozható
FELTÉVE hogy a feladat párhuzamosítható
A párhuzamosítás több szinten képzelhető el:
Áramköri/architekturális pl. pipeline szorzó
Automatizált fordítás, pl. loop unrolling
Funkcionális párhuzamosítás, többszálú programozás alkalmazáson belül
Alkalmazások párhuzamos futtatása
Szuperszámítógépek (2014)
Első szuperszámítógépek LARC: (Livermore – US) atom-kutatásokra (1960) IBM 7030 / Strech (1961)
2014: 1. 2. 3. 4.
Tianhe-2 (Kína): Intel Xeon E5-2692 12C, 2.200GHz 3120000 cores, 33.8 Pflops, 17808 kW Titan - Cray XK7 , Opteron 6274 16C 2.200GHz (Cray), 560640 cores,17.6 PFlops, 8209 kW Sequoia - BlueGene/Q, Power BQC 16C, 1.60 GHz (IBM) 1572864 cores, 17.2 PFlops, 7890 kW K computer, SPARC64 VIIIfx 2.0GHz (Fujitsu) 705024 cores,10.5 Pflops,12660 kW
2013. 1. DOE/SC/Oak Ridge National Laboratory United States Titan - Cray XK7 , Opteron 6274 16C 2.200GHz, Cray Gemini interconnect, NVIDIA K20x Cray Inc. 560640 cores, 17.6 / 27.1 (elméleti) PetaFLOP/s , 8.209 MW 710 TB (32+6 GB/node), 18688 hybrid node:16-core AMD Opteron CPU + Tesla K20 GPU Cray linux op. rsz. 2. DOE/NNSA/LLNL United States Sequoia - BlueGene/Q, Power BQC 16C 1.60 GHz, Custom IBM 1572864 16.3 / 20.1 7890 3. RIKEN Advanced Institute for Computational Science (AICS) Japan K computer, SPARC64 VIIIfx 2.0GHz, Tofu interconnect Fujitsu 705024 10.51 11280.4 12660
2012.
1. K Computer: SPARC64 (Kobe, Japan) 10.51 PetaFLOP/s (~1 millió PC) 88,128 db. 2.0GHz 8-core SPARC64 VIIIfx processzor (45 nm) 864 szekrényben, 705,024 mag, Szekrényenként 6 I/O és 96 számítási node (egyenként 16 GB memóriával), össz. 1327 TB m. 6 dimenziós tórusz hálózati topológia, lokális/globális fájlrendszer kombinációja 9.89 MW teljesítmény-felvétel (824 Gflops/KW: nagyon hatékony) 2. Tianhe-1A: NUDT TH MPP, X5670 2.93Ghz + NVIDIA Tesla GPUs, 186 368 processzor (Intel EM64T Xeon X5670 2.93 GHz ), 229 TB memória 2.57 PetaFLOP/s teljesítmény 3.) Jaguar Cray XT5-HE Opteron Six-Core 2.6 GHz (Oak Ridge Laboratory Tennessee) 224 162 processzor (1.759 millió GFLOPs (~ 1.76 PetaFLOP teljesítmény) 10.) IBM Roadrunner BladeCenter QS22/LS21 Cluster, (LANL, Los Alamos) 129 600 processzoros rendszer (PowerXCell 8i 3.2 GHz ) 73 TB memória (N/A) 1.105 PetaFLOP/s
Tianhe-2
Cray Titan
IBM Sequoia-Bluegene/Q
K computer (Fujitsu-Riken)
Jaguar Cray XT5-HE
Lehetőségek: Fetch-DecodeExecute (FDE) – párhuzamosítás
átlapolt végrehajtás (látszólagos) - pipeline teljesen párhuzamos végrehajtás (több processzor) – pl. CELL BE (IBM) Heterogén multi-core-os rendszerek
Tianhe-1A
Architekturális példák
https://www-01.ibm.com/chips/techlib/techlib.nsf/products/Cell_Broadband_Engine https://www-01.ibm.com/chips/techlib/techlib.nsf/techdocs/1AEEE1270EA2776387257060006E61BA/$file/CBEA_v1.02_11Oct2007_pub.pdf
AMD X4 Phenom II. (4 mag, 45nm, 3GHz, 758 millió tranzisztor, 125W, Deneb kódnéven)
Intel Nehalem-EX: 80 mag
ISSC’2007 Polaris: 80 mag
65 nm technológia 3D rétegszerkezet
100 – 175 W
1 TeraFLOPs. 4 - 5.1 GHz
Intel Core i7 EE 980x 32nm 3.3 GHz 6 mag / 12 szál
Más alternatíva: D-Wave One Kvantumszámítógép
2013: 512 qubit-es változat
„qubit”: a kvantum-rendszer alapegysége, amellyel Boole algebrában ismert ‘0’ és ‘1’ állapotok két normalizált és kölcsönösen ortogonális kvantum állapot-pár segítségével ábrázolhatók { |0 > , |1 > },
Félvezetők helyett szupravezető fémet használnak mágneses vákuumban: niobium (ultra alacsony hőmérsékleten) Még nem bizonyított In May 2013, Google Inc announced that it was launching the Quantum Artificial Intelligence Lab, to be hosted by NASA’s Ames Research Center. The lab will house a 512-qubit quantum computer from D-Wave Systems, and the USRA (Universities Space Research Association) will invite researchers from around the world to share time on it. The goal is to study how quantum
[
computing might advance machine learning
http://www.dwavesys.com