´ o´ Adminisztraci Tematika ´ ıtog ´ ep ´ architektur ´ gyors´ıtasa ´ Szam´ ´ ak ´ ´ ıtog ´ ep ´ architektur ´ fejlod ˝ ese ´ Hagyomanyos szam´ ´ ak ´ as ´ architektur ´ Multimedi ´ ak ´ fejlod ˝ ese ´ GPU architektur ´ ak ´ Kitekintes
´ anos ´ ´ u´ Grafikus processzorok altal cel ´ programozasa (GPGPU) ´ V. Gabor ´ Eichhardt I., Hajder L. es
[email protected],
[email protected],
[email protected] ¨ os ¨ Lorand ´ ´ Eotv Tudomanyegyetem, Informatikai Kar ´ ev ´ 2014/2015. tavaszi fel ˝ as ´ 17. 1. eload 2015. szeptember
´ o´ Adminisztraci Tematika ´ ıtog ´ ep ´ architektur ´ gyors´ıtasa ´ Szam´ ´ ak ´ ´ ıtog ´ ep ´ architektur ´ fejlod ˝ ese ´ Hagyomanyos szam´ ´ ak ´ as ´ architektur ´ Multimedi ´ ak ´ fejlod ˝ ese ´ GPU architektur ´ ak ´ Kitekintes
Tartalom 1
´ o´ Adminisztraci ´ es ´ elerhet ´ ˝ egek ´ Bemutatkozas os ˝ asok, ´ Eload gyakorlatok ´ ´ es ´ Szamonk er
2
Tematika
3
´ ıtog ´ ep ´ architektur ´ gyors´ıtasa ´ Szam´ ´ ak
4
´ ´ ıtog ´ ep ´ architektur ´ fejlod ˝ ese ´ Hagyomanyos szam´ ´ ak
5
´ as ´ architektur ´ Multimedi ´ ak
6
´ fejlod ˝ ese ´ GPU architektur ´ ak
7
´ Kitekintes ˝ as ´ 1. eload
´ o´ Adminisztraci Tematika ´ ıtog ´ ep ´ architektur ´ gyors´ıtasa ´ Szam´ ´ ak ´ ´ ıtog ´ ep ´ architektur ´ fejlod ˝ ese ´ Hagyomanyos szam´ ´ ak ´ as ´ architektur ´ Multimedi ´ ak ´ fejlod ˝ ese ´ GPU architektur ´ ak ´ Kitekintes
´ es ´ elerhet ´ ˝ egek ´ Bemutatkozas os ˝ asok, ´ Eload gyakorlatok ´ ´ es ´ Szamonk er
Tartalom 1
´ o´ Adminisztraci ´ es ´ elerhet ´ ˝ egek ´ Bemutatkozas os ˝ asok, ´ Eload gyakorlatok ´ ´ es ´ Szamonk er
2
Tematika
3
´ ıtog ´ ep ´ architektur ´ gyors´ıtasa ´ Szam´ ´ ak
4
´ ´ ıtog ´ ep ´ architektur ´ fejlod ˝ ese ´ Hagyomanyos szam´ ´ ak
5
´ as ´ architektur ´ Multimedi ´ ak
6
´ fejlod ˝ ese ´ GPU architektur ´ ak
7
´ Kitekintes ˝ as ´ 1. eload
´ o´ Adminisztraci Tematika ´ ıtog ´ ep ´ architektur ´ gyors´ıtasa ´ Szam´ ´ ak ´ ´ ıtog ´ ep ´ architektur ´ fejlod ˝ ese ´ Hagyomanyos szam´ ´ ak ´ as ´ architektur ´ Multimedi ´ ak ´ fejlod ˝ ese ´ GPU architektur ´ ak ´ Kitekintes
´ es ´ elerhet ´ ˝ egek ´ Bemutatkozas os ˝ asok, ´ Eload gyakorlatok ´ ´ es ´ Szamonk er
´ es ´ elerhet ´ ˝ egek ´ Bemutatkozas os ´ Eichhardt Ivan Email:
[email protected] Szoba: MTA SZTAKI XI.ker Kende u. 13-17. 306-os szoba
Hajder Levente Email: {hajder.levente}@sztaki.mta.hu Szoba: MTA SZTAKI XI.ker Kende u. 13-17. 312-es szoba
´ Valasek Gabor Email:
[email protected] ´ omb ¨ Szoba: ELTE deli-t 2.704
˝ as ´ 1. eload
´ o´ Adminisztraci Tematika ´ ıtog ´ ep ´ architektur ´ gyors´ıtasa ´ Szam´ ´ ak ´ ´ ıtog ´ ep ´ architektur ´ fejlod ˝ ese ´ Hagyomanyos szam´ ´ ak ´ as ´ architektur ´ Multimedi ´ ak ´ fejlod ˝ ese ´ GPU architektur ´ ak ´ Kitekintes
´ es ´ elerhet ´ ˝ egek ´ Bemutatkozas os ˝ asok, ´ Eload gyakorlatok ´ ´ es ´ Szamonk er
˝ as ´ Eload
˝ as ´ Eload ´ Heti egy ora. Helysz´ın: Grafika labor 16.00-16.45
Gyakorlat ´ Heti 2 ora. Helysz´ın: Grafika labor 17.00-18.30
˝ as ´ es ´ a gyakorlat ugyis ¨ Az eload ossze -vissza lesz. ´ ´ Ahogy a tananyag megk´ıvanja
Honlap: http://cg.elte.hu
˝ as ´ 1. eload
´ o´ Adminisztraci Tematika ´ ıtog ´ ep ´ architektur ´ gyors´ıtasa ´ Szam´ ´ ak ´ ´ ıtog ´ ep ´ architektur ´ fejlod ˝ ese ´ Hagyomanyos szam´ ´ ak ´ as ´ architektur ´ Multimedi ´ ak ´ fejlod ˝ ese ´ GPU architektur ´ ak ´ Kitekintes
´ es ´ elerhet ´ ˝ egek ´ Bemutatkozas os ˝ asok, ´ Eload gyakorlatok ´ ´ es ´ Szamonk er
´ ´ es ´ Szamonk er ´ evk ´ ozi ¨ kovetelm ¨ ´ Fel eny: ´ ak ´ latogat ´ ´ erosen ˝ ´ Or asa ajanlott. ´ darab kotelez ¨ ˝ ´ ıtese ´ Ket oen beadando´ feladat elkesz´ ´ Feladatki´ırasok hamarosan...
¨ ´ vizsgaidoszakban ˝ Kovetelm eny ´ Szobeli vizsga ´ kidolgozasa ´ Egy kihuzott tetel ´ ´ ´ a beadandokr ´ ol, ´ a felmerult ´ egekr ´ ˝ es ´ Elbeszelget es ol ¨ nehezs ´ lehetos ˝ egekr ´ ˝ megoldasi ol
˝ as ´ 1. eload
´ o´ Adminisztraci Tematika ´ ıtog ´ ep ´ architektur ´ gyors´ıtasa ´ Szam´ ´ ak ´ ´ ıtog ´ ep ´ architektur ´ fejlod ˝ ese ´ Hagyomanyos szam´ ´ ak ´ as ´ architektur ´ Multimedi ´ ak ´ fejlod ˝ ese ´ GPU architektur ´ ak ´ Kitekintes
´ es ´ elerhet ´ ˝ egek ´ Bemutatkozas os ˝ asok, ´ Eload gyakorlatok ´ ´ es ´ Szamonk er
´ Hol lehet ezt hasznalni? ´ kritikus a programozasi ´ feladatokban Sebesseg ´ asi ´ teruletek: ´ ´ ol ´ a meteorologiai ´ Felhasznal reszecskefizik at ¨ ˝ ´ ´ a numerikus optimalizal ´ asig ´ elorejelz eseken at szinte mindenhol ˝ ok ´ hol hasznalt ´ ak/haszn ´ ´ ´ a tudast: ´ Az eload alhatn ak ´ ıtog ´ epes ´ Szam´ grafika ´ ıtog ´ epes ´ ´ ´ Szam´ kepfeldolgoz as ´ ıtog ´ epes ´ ´ as ´ Szam´ 3D lat ´ Geometria modellezes ´ algebra) Matematikai algoritmusok (linearis ... ˝ as ´ 1. eload
´ o´ Adminisztraci Tematika ´ ıtog ´ ep ´ architektur ´ gyors´ıtasa ´ Szam´ ´ ak ´ ´ ıtog ´ ep ´ architektur ´ fejlod ˝ ese ´ Hagyomanyos szam´ ´ ak ´ as ´ architektur ´ Multimedi ´ ak ´ fejlod ˝ ese ´ GPU architektur ´ ak ´ Kitekintes
Tartalom 1
´ o´ Adminisztraci ´ es ´ elerhet ´ ˝ egek ´ Bemutatkozas os ˝ asok, ´ Eload gyakorlatok ´ ´ es ´ Szamonk er
2
Tematika
3
´ ıtog ´ ep ´ architektur ´ gyors´ıtasa ´ Szam´ ´ ak
4
´ ´ ıtog ´ ep ´ architektur ´ fejlod ˝ ese ´ Hagyomanyos szam´ ´ ak
5
´ as ´ architektur ´ Multimedi ´ ak
6
´ fejlod ˝ ese ´ GPU architektur ´ ak
7
´ Kitekintes ˝ as ´ 1. eload
´ o´ Adminisztraci Tematika ´ ıtog ´ ep ´ architektur ´ gyors´ıtasa ´ Szam´ ´ ak ´ ´ ıtog ´ ep ´ architektur ´ fejlod ˝ ese ´ Hagyomanyos szam´ ´ ak ´ as ´ architektur ´ Multimedi ´ ak ´ fejlod ˝ ese ´ GPU architektur ´ ak ´ Kitekintes
˝ lesz szo´ a fel ´ evben? ´ Tematika: mirol ´ ıtog ´ ep ´ architektur ´ fejlod ˝ ese ´ Szam´ ´ ak ´ ´ ak ´ Parhuzamos architektur ´ ar ¨ enelem, ´ ˝ ese ´ GPU tort grafikus processzorok fejlod ´ ´ Legelterjedtebb API-k attekint ese OpenCL CUDA
´ algoritmusok parhuzamos´ ´ ´ ´ ok, ´ Specialis ıtasa: iteraci ´ rekurziok,..stb. ´ Esettanulmanyok
˝ as ´ 1. eload
´ o´ Adminisztraci Tematika ´ ıtog ´ ep ´ architektur ´ gyors´ıtasa ´ Szam´ ´ ak ´ ´ ıtog ´ ep ´ architektur ´ fejlod ˝ ese ´ Hagyomanyos szam´ ´ ak ´ as ´ architektur ´ Multimedi ´ ak ´ fejlod ˝ ese ´ GPU architektur ´ ak ´ Kitekintes
˝ lesz szo´ a fel ´ evben? ´ Tematika: mirol
´ asi ´ kerd ´ esek: ´ Optimalizal hogyan lesz gyorsabb a programunk? ´ Esettanulmanyok ´ rekurz´ıv sugark ´ ovet ¨ es) ´ Grafika (rendereles, ´ ´ ˝ ´ ´ Kepfeldolgozas (szur ˝ ok megvalos´ıtasa) ´ algrebra (nagy matrixok ´ ´ ert ´ ekeinek ´ Linearis sajat ´ ´ szam´ıtasa)
˝ as ´ 1. eload
´ o´ Adminisztraci Tematika ´ ıtog ´ ep ´ architektur ´ gyors´ıtasa ´ Szam´ ´ ak ´ ´ ıtog ´ ep ´ architektur ´ fejlod ˝ ese ´ Hagyomanyos szam´ ´ ak ´ as ´ architektur ´ Multimedi ´ ak ´ fejlod ˝ ese ´ GPU architektur ´ ak ´ Kitekintes
Tartalom 1
´ o´ Adminisztraci ´ es ´ elerhet ´ ˝ egek ´ Bemutatkozas os ˝ asok, ´ Eload gyakorlatok ´ ´ es ´ Szamonk er
2
Tematika
3
´ ıtog ´ ep ´ architektur ´ gyors´ıtasa ´ Szam´ ´ ak
4
´ ´ ıtog ´ ep ´ architektur ´ fejlod ˝ ese ´ Hagyomanyos szam´ ´ ak
5
´ as ´ architektur ´ Multimedi ´ ak
6
´ fejlod ˝ ese ´ GPU architektur ´ ak
7
´ Kitekintes ˝ as ´ 1. eload
´ o´ Adminisztraci Tematika ´ ıtog ´ ep ´ architektur ´ gyors´ıtasa ´ Szam´ ´ ak ´ ´ ıtog ´ ep ´ architektur ´ fejlod ˝ ese ´ Hagyomanyos szam´ ´ ak ´ as ´ architektur ´ Multimedi ´ ak ´ fejlod ˝ ese ´ GPU architektur ´ ak ´ Kitekintes
´ ıtog ´ ep ´ feldolgozasi ´ sebesseg ´ enek ´ ´ A szam´ hatarai
˝ ´ ´ ıtast ´ lelass´ıtani Alapvetoen harom dolog tud egy szam´ 1
´ tul A feny ´ lassu´ ´ ara ´ ez viccesen hangzik... Laikusok szam
2 3
´ ´ par ´ milliard ´ tranzisztor a lapkara ´ Kene meg ´ ˝ Rosszul tervezett algoritmusok (emberi tenyez o)
´ ´ Lassuk az okokat egyesevel!
˝ as ´ 1. eload
´ o´ Adminisztraci Tematika ´ ıtog ´ ep ´ architektur ´ gyors´ıtasa ´ Szam´ ´ ak ´ ´ ıtog ´ ep ´ architektur ´ fejlod ˝ ese ´ Hagyomanyos szam´ ´ ak ´ as ´ architektur ´ Multimedi ´ ak ´ fejlod ˝ ese ´ GPU architektur ´ ak ´ Kitekintes
´ Lassu´ feny ´ ´ peld ´ aval ´ Kezdjuk asi ¨ egy ki szamol ´ sebessege ´ A feny 300.000km/s ´ unk Van egy gep ¨ AMD A8-6500K 3,5 GHz CPU-val ´ ´ 1 meteres kabellel csatlakoztatunk egy USB merevlemezt. ´ ´ ˝ ¨ ´ A proci 2 orajel alatt kepes lebegopontos osszead asra ¨ A kovetkez o˝ adat a lemezen van, be kell olvasni. ´ osszead ¨ ´ tudna a proci addig elvegezni, ´ Hany ast am´ıg a ˝ az elektronok (fenysebess ´ ´ ´ lemezrol eggel) megerkeznek a CPU-ba? ˝ as ´ 1. eload
´ o´ Adminisztraci Tematika ´ ıtog ´ ep ´ architektur ´ gyors´ıtasa ´ Szam´ ´ ak ´ ´ ıtog ´ ep ´ architektur ´ fejlod ˝ ese ´ Hagyomanyos szam´ ´ ak ´ as ´ architektur ´ Multimedi ´ ak ´ fejlod ˝ ese ´ GPU architektur ´ ak ´ Kitekintes
´ Lassu´ feny ´ Feladat megoldasa: ´ A processzor orajele 3, 5Ghz = 3.500.000.000Hz ´ Egy orajel 1/3.500.000.000 = 285.7 psec (pikosec) ´ orajel ´ ¨ ´ 571, 8 psec idot ˝ vesz igenybe ´ Ket (egy osszead as) 8 −12 ´ ennyi ido˝ alatt 310 m/s · 571, 8 ∗ 10 s = 0.17m A feny utat tesz meg ´ ´ ´ 1m/0, 17m ≈ 6 Meteres kabel eseten: ´ a CPU-nk 6 utas´ıtasnyi ´ ˝ malmozott, am´ıg az adat Tehat idot ´ megerkezett. ´ akkor egyeb ´ lass´ıto´ tenyez ´ ˝ ´ Es ovel nem is szamoltunk... ´ ese ´ 20 msec... Pl. HDD tipikus eler ´ ...ami alatt a CPU szabadsagra is mehet. ˝ as ´ 1. eload
´ o´ Adminisztraci Tematika ´ ıtog ´ ep ´ architektur ´ gyors´ıtasa ´ Szam´ ´ ak ´ ´ ıtog ´ ep ´ architektur ´ fejlod ˝ ese ´ Hagyomanyos szam´ ´ ak ´ as ´ architektur ´ Multimedi ´ ak ´ fejlod ˝ ese ´ GPU architektur ´ ak ´ Kitekintes
´ Lassu´ feny ´ Feladat megoldasa: ´ A processzor orajele 3, 5Ghz = 3.500.000.000Hz ´ Egy orajel 1/3.500.000.000 = 285.7 psec (pikosec) ´ orajel ´ ¨ ´ 571, 8 psec idot ˝ vesz igenybe ´ Ket (egy osszead as) 8 −12 ´ ennyi ido˝ alatt 310 m/s · 571, 8 ∗ 10 s = 0.17m A feny utat tesz meg ´ ´ ´ 1m/0, 17m ≈ 6 Meteres kabel eseten: ´ a CPU-nk 6 utas´ıtasnyi ´ ˝ malmozott, am´ıg az adat Tehat idot ´ megerkezett. ´ akkor egyeb ´ lass´ıto´ tenyez ´ ˝ ´ Es ovel nem is szamoltunk... ´ ese ´ 20 msec... Pl. HDD tipikus eler ´ ...ami alatt a CPU szabadsagra is mehet. ˝ as ´ 1. eload
´ o´ Adminisztraci Tematika ´ ıtog ´ ep ´ architektur ´ gyors´ıtasa ´ Szam´ ´ ak ´ ´ ıtog ´ ep ´ architektur ´ fejlod ˝ ese ´ Hagyomanyos szam´ ´ ak ´ as ´ architektur ´ Multimedi ´ ak ´ fejlod ˝ ese ´ GPU architektur ´ ak ´ Kitekintes
´ Lassu´ feny ´ Feladat megoldasa: ´ A processzor orajele 3, 5Ghz = 3.500.000.000Hz ´ Egy orajel 1/3.500.000.000 = 285.7 psec (pikosec) ´ orajel ´ ¨ ´ 571, 8 psec idot ˝ vesz igenybe ´ Ket (egy osszead as) 8 −12 ´ ennyi ido˝ alatt 310 m/s · 571, 8 ∗ 10 s = 0.17m A feny utat tesz meg ´ ´ ´ 1m/0, 17m ≈ 6 Meteres kabel eseten: ´ a CPU-nk 6 utas´ıtasnyi ´ ˝ malmozott, am´ıg az adat Tehat idot ´ megerkezett. ´ akkor egyeb ´ lass´ıto´ tenyez ´ ˝ ´ Es ovel nem is szamoltunk... ´ ese ´ 20 msec... Pl. HDD tipikus eler ´ ...ami alatt a CPU szabadsagra is mehet. ˝ as ´ 1. eload
´ o´ Adminisztraci Tematika ´ ıtog ´ ep ´ architektur ´ gyors´ıtasa ´ Szam´ ´ ak ´ ´ ıtog ´ ep ´ architektur ´ fejlod ˝ ese ´ Hagyomanyos szam´ ´ ak ´ as ´ architektur ´ Multimedi ´ ak ´ fejlod ˝ ese ´ GPU architektur ´ ak ´ Kitekintes
´ Lassu´ feny ´ Feladat megoldasa: ´ A processzor orajele 3, 5Ghz = 3.500.000.000Hz ´ Egy orajel 1/3.500.000.000 = 285.7 psec (pikosec) ´ orajel ´ ¨ ´ 571, 8 psec idot ˝ vesz igenybe ´ Ket (egy osszead as) 8 −12 ´ ennyi ido˝ alatt 310 m/s · 571, 8 ∗ 10 s = 0.17m A feny utat tesz meg ´ ´ ´ 1m/0, 17m ≈ 6 Meteres kabel eseten: ´ a CPU-nk 6 utas´ıtasnyi ´ ˝ malmozott, am´ıg az adat Tehat idot ´ megerkezett. ´ akkor egyeb ´ lass´ıto´ tenyez ´ ˝ ´ Es ovel nem is szamoltunk... ´ ese ´ 20 msec... Pl. HDD tipikus eler ´ ...ami alatt a CPU szabadsagra is mehet. ˝ as ´ 1. eload
´ o´ Adminisztraci Tematika ´ ıtog ´ ep ´ architektur ´ gyors´ıtasa ´ Szam´ ´ ak ´ ´ ıtog ´ ep ´ architektur ´ fejlod ˝ ese ´ Hagyomanyos szam´ ´ ak ´ as ´ architektur ´ Multimedi ´ ak ´ fejlod ˝ ese ´ GPU architektur ´ ak ´ Kitekintes
´ Lassu´ feny ´ Feladat megoldasa: ´ A processzor orajele 3, 5Ghz = 3.500.000.000Hz ´ Egy orajel 1/3.500.000.000 = 285.7 psec (pikosec) ´ orajel ´ ¨ ´ 571, 8 psec idot ˝ vesz igenybe ´ Ket (egy osszead as) 8 −12 ´ ennyi ido˝ alatt 310 m/s · 571, 8 ∗ 10 s = 0.17m A feny utat tesz meg ´ ´ ´ 1m/0, 17m ≈ 6 Meteres kabel eseten: ´ a CPU-nk 6 utas´ıtasnyi ´ ˝ malmozott, am´ıg az adat Tehat idot ´ megerkezett. ´ akkor egyeb ´ lass´ıto´ tenyez ´ ˝ ´ Es ovel nem is szamoltunk... ´ ese ´ 20 msec... Pl. HDD tipikus eler ´ ...ami alatt a CPU szabadsagra is mehet. ˝ as ´ 1. eload
´ o´ Adminisztraci Tematika ´ ıtog ´ ep ´ architektur ´ gyors´ıtasa ´ Szam´ ´ ak ´ ´ ıtog ´ ep ´ architektur ´ fejlod ˝ ese ´ Hagyomanyos szam´ ´ ak ´ as ´ architektur ´ Multimedi ´ ak ´ fejlod ˝ ese ´ GPU architektur ´ ak ´ Kitekintes
´ Lassu´ feny ´ Feladat megoldasa: ´ A processzor orajele 3, 5Ghz = 3.500.000.000Hz ´ Egy orajel 1/3.500.000.000 = 285.7 psec (pikosec) ´ orajel ´ ¨ ´ 571, 8 psec idot ˝ vesz igenybe ´ Ket (egy osszead as) 8 −12 ´ ennyi ido˝ alatt 310 m/s · 571, 8 ∗ 10 s = 0.17m A feny utat tesz meg ´ ´ ´ 1m/0, 17m ≈ 6 Meteres kabel eseten: ´ a CPU-nk 6 utas´ıtasnyi ´ ˝ malmozott, am´ıg az adat Tehat idot ´ megerkezett. ´ akkor egyeb ´ lass´ıto´ tenyez ´ ˝ ´ Es ovel nem is szamoltunk... ´ ese ´ 20 msec... Pl. HDD tipikus eler ´ ...ami alatt a CPU szabadsagra is mehet. ˝ as ´ 1. eload
´ o´ Adminisztraci Tematika ´ ıtog ´ ep ´ architektur ´ gyors´ıtasa ´ Szam´ ´ ak ´ ´ ıtog ´ ep ´ architektur ´ fejlod ˝ ese ´ Hagyomanyos szam´ ´ ak ´ as ´ architektur ´ Multimedi ´ ak ´ fejlod ˝ ese ´ GPU architektur ´ ak ´ Kitekintes
´ Lassu´ feny ´ Feladat megoldasa: ´ A processzor orajele 3, 5Ghz = 3.500.000.000Hz ´ Egy orajel 1/3.500.000.000 = 285.7 psec (pikosec) ´ orajel ´ ¨ ´ 571, 8 psec idot ˝ vesz igenybe ´ Ket (egy osszead as) 8 −12 ´ ennyi ido˝ alatt 310 m/s · 571, 8 ∗ 10 s = 0.17m A feny utat tesz meg ´ ´ ´ 1m/0, 17m ≈ 6 Meteres kabel eseten: ´ a CPU-nk 6 utas´ıtasnyi ´ ˝ malmozott, am´ıg az adat Tehat idot ´ megerkezett. ´ akkor egyeb ´ lass´ıto´ tenyez ´ ˝ ´ Es ovel nem is szamoltunk... ´ ese ´ 20 msec... Pl. HDD tipikus eler ´ ...ami alatt a CPU szabadsagra is mehet. ˝ as ´ 1. eload
´ o´ Adminisztraci Tematika ´ ıtog ´ ep ´ architektur ´ gyors´ıtasa ´ Szam´ ´ ak ´ ´ ıtog ´ ep ´ architektur ´ fejlod ˝ ese ´ Hagyomanyos szam´ ´ ak ´ as ´ architektur ´ Multimedi ´ ak ´ fejlod ˝ ese ´ GPU architektur ´ ak ´ Kitekintes
´ tranzisztor Keves ´ utani ´ lep ´ esekb ´ ˝ allnak ´ Az algoritmusaink egymas ol ´ vegrehajt ´ ´ Szekvencialis as
´ ol ´ fuggetlen ´ Az egymast utas´ıtasokat egyszerre lehet ¨ ´ vegrehajtani ´ ´ Kulcs: parhuzamos´ ıtas ´ ´ szamtalan ´ ´ ´ Parhuzamos´ ıtas modon lehetseges ´ a GPU-k hasznalata ´ Ennek egyik formaja ´ ´ ¨ ´ ´ ´ ´ Parhuzamos´ıtas tobb vegrehajto egyseget igenyel,.. ...szaporodnak a tranzisztorok a foglalatban.
˝ as ´ 1. eload
´ o´ Adminisztraci Tematika ´ ıtog ´ ep ´ architektur ´ gyors´ıtasa ´ Szam´ ´ ak ´ ´ ıtog ´ ep ´ architektur ´ fejlod ˝ ese ´ Hagyomanyos szam´ ´ ak ´ as ´ architektur ´ Multimedi ´ ak ´ fejlod ˝ ese ´ GPU architektur ´ ak ´ Kitekintes
Rosszul meg´ırt programok
´ ˝ Az emberi tenyez o... ´ kudarca... Az oktatok ´ lustasaga ´ A programozok ... ... ´ a specinek, hogy megoldast ´ talaljon ´ Nem celja a ´ ara. ´ problem
˝ as ´ 1. eload
´ o´ Adminisztraci Tematika ´ ıtog ´ ep ´ architektur ´ gyors´ıtasa ´ Szam´ ´ ak ´ ´ ıtog ´ ep ´ architektur ´ fejlod ˝ ese ´ Hagyomanyos szam´ ´ ak ´ as ´ architektur ´ Multimedi ´ ak ´ fejlod ˝ ese ´ GPU architektur ´ ak ´ Kitekintes
´ Megoldasok
´ lassu: Ha a feny ´ utaztassuk kevesebbet az adatokat ´ ´ gyors´ıt: tervezzunk ´ Ha a parhuzamoss ag ¨ parhuzamos ´ architektur ´ akat (Ha rosszul programozunk: programozzunk jobban!)
˝ as ´ 1. eload
´ o´ Adminisztraci Tematika ´ ıtog ´ ep ´ architektur ´ gyors´ıtasa ´ Szam´ ´ ak ´ ´ ıtog ´ ep ´ architektur ´ fejlod ˝ ese ´ Hagyomanyos szam´ ´ ak ´ as ´ architektur ´ Multimedi ´ ak ´ fejlod ˝ ese ´ GPU architektur ´ ak ´ Kitekintes
´ (1) Lassu´ feny ´ ´ Sajnos a fenysebess egen nem tudunk gyors´ıtani ´ (1): adatokat (elektronokat) kozelebbre ¨ Megoldas kell hozni ´ ak ´ ki a gyors´ıtot ´ arat ´ Erre talalt (cache) ˝ Meg kell mondani elore, hogy milyen adatokra lesz ´ ... szuks ¨ eg, ´ ...vagy ki kell talalni.
´ (2): egyszerre tobb ¨ adatot kell mozgatni Megoldas ¨ vezeteken ´ ´ Tobb parhuzamosan. ´ volt ertelme ´ Ezert a 32 bites processzorokat 64 bitesre ´ cserelni. ´ ´ at ´ 32 bit 32 vezeteket jelent, 64 bit a duplaj
´ ´ anak: ´ ´ Komoly tanulsaga a problem nagy adatmozgatas ˝ vesz igenybe. ´ sok idot ˝ as ´ 1. eload
´ o´ Adminisztraci Tematika ´ ıtog ´ ep ´ architektur ´ gyors´ıtasa ´ Szam´ ´ ak ´ ´ ıtog ´ ep ´ architektur ´ fejlod ˝ ese ´ Hagyomanyos szam´ ´ ak ´ as ´ architektur ´ Multimedi ´ ak ´ fejlod ˝ ese ´ GPU architektur ´ ak ´ Kitekintes
´ (2) Lassu´ feny ´ letezik. ´ GPU-kban cache szinten
˝ as ´ 1. eload
´ o´ Adminisztraci Tematika ´ ıtog ´ ep ´ architektur ´ gyors´ıtasa ´ Szam´ ´ ak ´ ´ ıtog ´ ep ´ architektur ´ fejlod ˝ ese ´ Hagyomanyos szam´ ´ ak ´ as ´ architektur ´ Multimedi ´ ak ´ fejlod ˝ ese ´ GPU architektur ´ ak ´ Kitekintes
´ (3) Lassu´ feny
´ ´ Cache kezelesre oda kell a programozaskor is figyelni. ´ keresztul ´ cache-elni Indirekcion ¨ nehez ´ Pelda: http://gameprogrammingpatterns.com/ data-locality.html/ ´ ´ otvenszer ¨ Masodik megoldas (!) gyorsabb
˝ as ´ 1. eload
´ o´ Adminisztraci Tematika ´ ıtog ´ ep ´ architektur ´ gyors´ıtasa ´ Szam´ ´ ak ´ ´ ıtog ´ ep ´ architektur ´ fejlod ˝ ese ´ Hagyomanyos szam´ ´ ak ´ as ´ architektur ´ Multimedi ´ ak ´ fejlod ˝ ese ´ GPU architektur ´ ak ´ Kitekintes
´ (4) Lassu´ feny
´ ¨ ´ Memoriat´ ıpusok osszehasonl´ ıtasa ´ Memoria t´ıpusa Regiszterek ´ ar ´ Gyors´ıtot RAM ´ ozati ´ ´ ar ´ Hal gyors´ıtot SSD Merevlemez
´ es ´ Eler ∼ 1nsec ∼ 10nsec ∼ 500nsec ∼ 50µsec ∼ 200µsec ∼ 20msec
´ adatatvitel n/a ∼ 100GByte/sec ∼ 1Gbit/sec n/a ∼ 200Mbit/sec ∼ 50Mbit/sec
˝ as ´ 1. eload
´ o´ Adminisztraci Tematika ´ ıtog ´ ep ´ architektur ´ gyors´ıtasa ´ Szam´ ´ ak ´ ´ ıtog ´ ep ´ architektur ´ fejlod ˝ ese ´ Hagyomanyos szam´ ´ ak ´ as ´ architektur ´ Multimedi ´ ak ´ fejlod ˝ ese ´ GPU architektur ´ ak ´ Kitekintes
´ (4) Lassu´ feny ´ az utas´ıtast ´ is be kell olvasni Magat ´ legyen minel ´ rovidebb ¨ Az utas´ıtas ´ lehet hasznalni ´ Ehhez kevesebb utas´ıtast ´ ¨ regiszter szokasos ´ Cserebe tobb
´ utas´ıtask ´ eszlet: ´ Redukalt RISC architektura ´ RISC: Reduced Instruction Set Computer ´ ”Hagyomanyos” CISC architektura: Complex Instruction Set ´ Computer
´ a CISC architektura Ma mar ´ belul ¨ RISC ´ at ´ kell ford´ıtani Processzor a processzorban: az utas´ıtast ´ tobb ¨ RISC parancs ´ırhat le. Egy CISC utas´ıtast ˝ sem lesz kevesebb tranzisztor a gepben, ´ ˝ Ettol sot... ˝ as ´ 1. eload
´ o´ Adminisztraci Tematika ´ ıtog ´ ep ´ architektur ´ gyors´ıtasa ´ Szam´ ´ ak ´ ´ ıtog ´ ep ´ architektur ´ fejlod ˝ ese ´ Hagyomanyos szam´ ´ ak ´ as ´ architektur ´ Multimedi ´ ak ´ fejlod ˝ ese ´ GPU architektur ´ ak ´ Kitekintes
´ ´ (5) Parhuzamos architektur ´ ak
´ elet ´ utja Egy utas´ıtas ´ (elnagyoltan) 1 2 3 4 5
´ (F: fetch) Beolvasas ´ ´ (D: decode) Ertelmez es ´ ´ (L: load) Parameterek beolvasasa ´ ´ (E: execution) Muvelet vegrehajt asa ˝ ´ vissza´ırasa ´ (WB: write back) Eredmeny
´ ´ ol ´ fuggetlenek ´ ol. ´ Az egyes reszek nagyjab egymast ¨ ´ ´ ´ Parhuzamosan vegrehajthat ok
˝ as ´ 1. eload
´ o´ Adminisztraci Tematika ´ ıtog ´ ep ´ architektur ´ gyors´ıtasa ´ Szam´ ´ ak ´ ´ ıtog ´ ep ´ architektur ´ fejlod ˝ ese ´ Hagyomanyos szam´ ´ ak ´ as ´ architektur ´ Multimedi ´ ak ´ fejlod ˝ ese ´ GPU architektur ´ ak ´ Kitekintes
´ ´ (1) Parhuzamos architektur ´ ak
´ ´ ´ ´ ´ Futoszalag elv: reszfeladatok parhuzamos vegrehajt asa
˝ as ´ 1. eload
´ o´ Adminisztraci Tematika ´ ıtog ´ ep ´ architektur ´ gyors´ıtasa ´ Szam´ ´ ak ´ ´ ıtog ´ ep ´ architektur ´ fejlod ˝ ese ´ Hagyomanyos szam´ ´ ak ´ as ´ architektur ´ Multimedi ´ ak ´ fejlod ˝ ese ´ GPU architektur ´ ak ´ Kitekintes
´ ´ (2) Parhuzamos architektur ´ ak
´ ´ ´ jol ´ megvalasztott ´ ´ A futoszalag-v egrehajt ast utas´ıtasok seg´ıtik ´ jobb szokott lenni Kevesebb utas´ıtas ´ RISC architektura ´ ajanlatos ´ is alak´ıtjak ´ at ´ a regi ´ CISC architektur ´ Ezert RISC-e´ ´ akat belul. ¨ ´ Pl. Intel x86/x64 processzorcsalad.
˝ as ´ 1. eload
´ o´ Adminisztraci Tematika ´ ıtog ´ ep ´ architektur ´ gyors´ıtasa ´ Szam´ ´ ak ´ ´ ıtog ´ ep ´ architektur ´ fejlod ˝ ese ´ Hagyomanyos szam´ ´ ak ´ as ´ architektur ´ Multimedi ´ ak ´ fejlod ˝ ese ´ GPU architektur ´ ak ´ Kitekintes
´ ´ (3) Parhuzamos architektur ´ ak ´ programozas ´ gyenge pontja: felteteles ´ Szekvencialis ´ ugrasok if/else while/do-while for switch/case
´ ˝ meg kell becsulni Felteteleket elore ¨ (statisztikai ´ esek) ´ felmer ´ elorejelz ˝ ´ Utas´ıtas es ´ architektura Szuperskalar ´
˝ as ´ 1. eload
´ o´ Adminisztraci Tematika ´ ıtog ´ ep ´ architektur ´ gyors´ıtasa ´ Szam´ ´ ak ´ ´ ıtog ´ ep ´ architektur ´ fejlod ˝ ese ´ Hagyomanyos szam´ ´ ak ´ as ´ architektur ´ Multimedi ´ ak ´ fejlod ˝ ese ´ GPU architektur ´ ak ´ Kitekintes
´ ´ (4) Parhuzamos architektur ´ ak ´ parhuzamos´ ´ ´ ol ´ van szo, ´ szekvencialis ´ programokat Bar ıtasr futtat ´ sajat ´ adatain dolgozik. Minden utas´ıtas SISD architektura: Single Instruction Single Data ´
´ ˝ parhuzamos´ ´ ´ tobb ¨ CPU betetele ´ Legkezenfekv obb ıtas: ¨ utas´ıtas ´ a sajat ´ adatain dolgozik. Egyszerre tobb MIMD architektura: Multiple Instruction Multiple Data ´
´ fajtaja: ´ MIMD architektura ´ ket ´ ´ a processzek szintjen: ´ tobb ¨ fuggetlen Parhuzamoss ag CPU ¨ (mag). ´ ´ a szalak ´ ´ tobb ¨ szal ´ CPU-n belul Parhuzamoss ag szintjen: ¨ ˝ as ´ 1. eload
´ o´ Adminisztraci Tematika ´ ıtog ´ ep ´ architektur ´ gyors´ıtasa ´ Szam´ ´ ak ´ ´ ıtog ´ ep ´ architektur ´ fejlod ˝ ese ´ Hagyomanyos szam´ ´ ak ´ as ´ architektur ´ Multimedi ´ ak ´ fejlod ˝ ese ´ GPU architektur ´ ak ´ Kitekintes
´ ´ (5) Parhuzamos architektur ´ ak ´ mar ´ ismerjuk SISD/MIMD architektur ´ at ¨ Mi lehet a MISD/SIMD architektura? ´ MISD: Multiple Instruction Single Data? ´ utas´ıtas ´ ugyanazon az adaton. Mas ´ ¨ aramk ´ ¨ ´ ıtjuk. Ertelme: Ugyanazt tobb orrel szam´ ´ ¨ ´ Ha az egyik hibazik, a tobbi felulb´ hibatur ¨ ıralhatja: ˝ o˝ rendszerek ˝ gyorsabb nem lesz a rendszerunk Ettol ¨ → nem foglalkozunk vele
˝ as ´ 1. eload
´ o´ Adminisztraci Tematika ´ ıtog ´ ep ´ architektur ´ gyors´ıtasa ´ Szam´ ´ ak ´ ´ ıtog ´ ep ´ architektur ´ fejlod ˝ ese ´ Hagyomanyos szam´ ´ ak ´ as ´ architektur ´ Multimedi ´ ak ´ fejlod ˝ ese ´ GPU architektur ´ ak ´ Kitekintes
´ ´ (6) Parhuzamos architektur ´ ak SIMD: Single Instruction Multiple Data ´ ´ Elerkezt unk ¨ a GPU architektur ´ ahoz!
´ sok adaton kell vegrehajtani. ´ Ugyanazt az utas´ıtast ´ ´ szaml ´ ainak ´ ¨ ´ Pelda: Nagy ceg osszead asa. ´ parhuzamos´ ´ ´ Rendk´ıvul ıthato. ¨ jol
´ SIMD variansai Vector processzor (szinon´ıma) ¨ ´ u´ SIMT: Single Instruction Multiple Thread: SIMD tobbsz al ´ valtoztata
˝ as ´ 1. eload
´ o´ Adminisztraci Tematika ´ ıtog ´ ep ´ architektur ´ gyors´ıtasa ´ Szam´ ´ ak ´ ´ ıtog ´ ep ´ architektur ´ fejlod ˝ ese ´ Hagyomanyos szam´ ´ ak ´ as ´ architektur ´ Multimedi ´ ak ´ fejlod ˝ ese ´ GPU architektur ´ ak ´ Kitekintes
´ miniaturiz ´ as ´ Kitekintes: ¨ al ´ ´ milyen vastagok a vezetekek ´ Cs´ıkszeless eg: Jelenleg: ∼ 30 nm. ´ ´ csokken ¨ ´ enek ´ ˝ Cs´ıkszeless eg es elonyei ¨ tranzisztor fer ´ el azonos teruleten Tobb ¨ ´ Magasabb orajel
´ Korlatok: ´ ´ uk. ´ er ´ oje ˝ : Atomi mereteket hamarosan elerj ¨ Atom atm ´ ∼ 10 − 100 pikometer ´ o´ aram ´ Szivarg
˝ as ´ 1. eload
´ o´ Adminisztraci Tematika ´ ıtog ´ ep ´ architektur ´ gyors´ıtasa ´ Szam´ ´ ak ´ ´ ıtog ´ ep ´ architektur ´ fejlod ˝ ese ´ Hagyomanyos szam´ ´ ak ´ as ´ architektur ´ Multimedi ´ ak ´ fejlod ˝ ese ´ GPU architektur ´ ak ´ Kitekintes
Tartalom 1
´ o´ Adminisztraci ´ es ´ elerhet ´ ˝ egek ´ Bemutatkozas os ˝ asok, ´ Eload gyakorlatok ´ ´ es ´ Szamonk er
2
Tematika
3
´ ıtog ´ ep ´ architektur ´ gyors´ıtasa ´ Szam´ ´ ak
4
´ ´ ıtog ´ ep ´ architektur ´ fejlod ˝ ese ´ Hagyomanyos szam´ ´ ak
5
´ as ´ architektur ´ Multimedi ´ ak
6
´ fejlod ˝ ese ´ GPU architektur ´ ak
7
´ Kitekintes ˝ as ´ 1. eload
´ o´ Adminisztraci Tematika ´ ıtog ´ ep ´ architektur ´ gyors´ıtasa ´ Szam´ ´ ak ´ ´ ıtog ´ ep ´ architektur ´ fejlod ˝ ese ´ Hagyomanyos szam´ ´ ak ´ as ´ architektur ´ Multimedi ´ ak ´ fejlod ˝ ese ´ GPU architektur ´ ak ´ Kitekintes
´ ıtog ´ ep ´ architektur ´ tort ¨ eneti ´ ˝ ese ´ Szam´ fejlod ´ ak ˝ ´ cel ´ u´ aramk ´ ¨ ok ¨ Oskor: specialis or ´ szam´ ´ ıtasi ´ feladatok elvegz ´ es ´ ere ´ terveztek ´ Konkret
´ Okor: Neumann-elvvel megjelenik a ”program” mint fogalom ´ aban ´ ´ Programot a memori taroljuk ¨ ´ (CPU) megjelenik Kozponti feldolgozo´ egyseg
¨ epkor: ´ ´ Koz CPU gyors´ıtgatasa ´ ´ arak, ´ ´ Futoszalagok, gyors´ıtot RISC, szuperskalar rendszerek
´ ¨ CPU egy gepben, ´ ¨ mag egy CPU-n Ujkor: Tobb majd tobb belul. ¨ ´ ¨ ´ Parhuzamos (tobbprocesszoros) programozas ¨ ´ ´ Tobbsz alas programozas
´ altal ´ anos ´ ´ ıtasi ´ Legujabb kor: GPU-k bevetese szam´ ´ ˝ as ´ 1. eload feladatokra
´ o´ Adminisztraci Tematika ´ ıtog ´ ep ´ architektur ´ gyors´ıtasa ´ Szam´ ´ ak ´ ´ ıtog ´ ep ´ architektur ´ fejlod ˝ ese ´ Hagyomanyos szam´ ´ ak ´ as ´ architektur ´ Multimedi ´ ak ´ fejlod ˝ ese ´ GPU architektur ´ ak ´ Kitekintes
Tartalom 1
´ o´ Adminisztraci ´ es ´ elerhet ´ ˝ egek ´ Bemutatkozas os ˝ asok, ´ Eload gyakorlatok ´ ´ es ´ Szamonk er
2
Tematika
3
´ ıtog ´ ep ´ architektur ´ gyors´ıtasa ´ Szam´ ´ ak
4
´ ´ ıtog ´ ep ´ architektur ´ fejlod ˝ ese ´ Hagyomanyos szam´ ´ ak
5
´ as ´ architektur ´ Multimedi ´ ak
6
´ fejlod ˝ ese ´ GPU architektur ´ ak
7
´ Kitekintes ˝ as ´ 1. eload
´ o´ Adminisztraci Tematika ´ ıtog ´ ep ´ architektur ´ gyors´ıtasa ´ Szam´ ´ ak ´ ´ ıtog ´ ep ´ architektur ´ fejlod ˝ ese ´ Hagyomanyos szam´ ´ ak ´ as ´ architektur ´ Multimedi ´ ak ´ fejlod ˝ ese ´ GPU architektur ´ ak ´ Kitekintes
´ as ´ architektur ´ Multimedi ´ ak ´ ´ en ´ bemutatkozott. MIMD architektura veg ´ 90-es evek ´ as ´ processzor kulcsszot ´ talalt ´ ak ´ Marketingesek a multimedi ki Intel: SSE, SSE2 AMD: 3DNow!
´ ´ ´ ´ Multimedia: parhuzamos adatokon vegrehajtott utas´ıtasok ´ aban ´ ´ as ´ regiszter Altal 4 multimedi ´ ´ ´ Utas´ıtasok: algebrai muveletek, feltetelek vizsgalata, ˝ ´ ..stb. konverziok, ´ es ´ lebegopontos ˝ ´ ´ muk ¨ Egesz szamokon egyarant ˝ odik
´ evel ´ ˝ eg ´ et. ´ GPU-k megjelenes elvesztette jelentoss ˝ as ´ 1. eload
´ o´ Adminisztraci Tematika ´ ıtog ´ ep ´ architektur ´ gyors´ıtasa ´ Szam´ ´ ak ´ ´ ıtog ´ ep ´ architektur ´ fejlod ˝ ese ´ Hagyomanyos szam´ ´ ak ´ as ´ architektur ´ Multimedi ´ ak ´ fejlod ˝ ese ´ GPU architektur ´ ak ´ Kitekintes
Tartalom 1
´ o´ Adminisztraci ´ es ´ elerhet ´ ˝ egek ´ Bemutatkozas os ˝ asok, ´ Eload gyakorlatok ´ ´ es ´ Szamonk er
2
Tematika
3
´ ıtog ´ ep ´ architektur ´ gyors´ıtasa ´ Szam´ ´ ak
4
´ ´ ıtog ´ ep ´ architektur ´ fejlod ˝ ese ´ Hagyomanyos szam´ ´ ak
5
´ as ´ architektur ´ Multimedi ´ ak
6
´ fejlod ˝ ese ´ GPU architektur ´ ak
7
´ Kitekintes ˝ as ´ 1. eload
´ o´ Adminisztraci Tematika ´ ıtog ´ ep ´ architektur ´ gyors´ıtasa ´ Szam´ ´ ak ´ ´ ıtog ´ ep ´ architektur ´ fejlod ˝ ese ´ Hagyomanyos szam´ ´ ak ´ as ´ architektur ´ Multimedi ´ ak ´ fejlod ˝ ese ´ GPU architektur ´ ak ´ Kitekintes
´ fejlod ˝ ese ´ GPU architektur ´ ak ˝ grafikus processzorok elotti ˝ ketdimenzi ´ ´ 1995 elott: os ´ gyors´ıtasok: 1978: Intel iSBX 275 Video Graphics Controller ´ Hardveres vonal, ´ıv, bitmap...stb. rajzolas
1986: Comodore Amiga : Blitter ´ fuggetlen CPU-tol grafikus processszorral ¨
1986: Texas Instruments: TMS34010, ´ anos ´ ´ u´ processzor, grafikara ´ hegyezett Altal cel ´ eszlettel ´ utas´ıtask
´ ´ egyre tobb ¨ grafikus chipgyart ´ o´ termeke ´ 90-es evek elejen jelent meg ATI, Matrox, S3 ...stb ˝ as ´ 1. eload
´ o´ Adminisztraci Tematika ´ ıtog ´ ep ´ architektur ´ gyors´ıtasa ´ Szam´ ´ ak ´ ´ ıtog ´ ep ´ architektur ´ fejlod ˝ ese ´ Hagyomanyos szam´ ´ ak ´ as ´ architektur ´ Multimedi ´ ak ´ fejlod ˝ ese ´ GPU architektur ´ ak ´ Kitekintes
´ fejlod ˝ ese ´ GPU architektur ´ ak ´ oan ´ ´ Grafikus pipeline rendk´ıvul parhuzamos´ ıthato´ ¨ kival
˝ as ´ 1. eload
´ o´ Adminisztraci Tematika ´ ıtog ´ ep ´ architektur ´ gyors´ıtasa ´ Szam´ ´ ak ´ ´ ıtog ´ ep ´ architektur ´ fejlod ˝ ese ´ Hagyomanyos szam´ ´ ak ´ as ´ architektur ´ Multimedi ´ ak ´ fejlod ˝ ese ´ GPU architektur ´ ak ´ Kitekintes
´ fejlod ˝ ese ´ GPU architektur ´ ak ˝ 3D-s gyors´ıtasok ´ 1995-tol: ´ hajtoereje: ´ ´ DirectX API-k Fejlesztes OpenGL es ´ megjelenese ´ ´ vizualizaci ´ o´ tamogat ´ ´ Haromdimenzi os asa ´ kepszint ´ ´ ´ Inkrementalis ezis alapjan ´ ´ a kepszint ´ ´ ´ Futoszalag elv megjelenese ezisben (jol ´ ´ parhuzamos´ ıthato!)
´ ok ´ es ´ megvilag´ ´ ıtas ´ (T&L: Tranform & Ligting) Transzformaci Nvidia GeForce 256 ´ ak ´ (meregdr ´ ´ an) ´ is megjelentek Profi karty ag
´ an ´ az elso˝ shader-ek megjelentek 2000 taj ´ pixelek szam´ ´ ıtas ´ ara ´ kul ¨ program ´ırhato´ Vertex-ek es ¨ on ´ ´ GPU-krol ´ itt kezdunk ´ Mai ertelemben hasznalt ¨ beszelni NVidia GeForce3, Ati Radeon 9700 ˝ as ´ 1. eload
´ o´ Adminisztraci Tematika ´ ıtog ´ ep ´ architektur ´ gyors´ıtasa ´ Szam´ ´ ak ´ ´ ıtog ´ ep ´ architektur ´ fejlod ˝ ese ´ Hagyomanyos szam´ ´ ak ´ as ´ architektur ´ Multimedi ´ ak ´ fejlod ˝ ese ´ GPU architektur ´ ak ´ Kitekintes
´ generaci ´ oi ´ GPU architektur ´ ak ´ o: ´ 1996-tol ´ 1. generaci 3dfx Voodoo 1 millio´ tranzisztor 50MHz 4 MB (64 bites) RAM
CPU ´ asa ´ Vertex (csucs) transzformal ´
GPU ´ es ´ textura ´ lekepz z-buffer ´ as ´ (pixelek sz´ınenek ´ ´ ıtasa) ´ raszterizal szam´
˝ as ´ 1. eload
´ o´ Adminisztraci Tematika ´ ıtog ´ ep ´ architektur ´ gyors´ıtasa ´ Szam´ ´ ak ´ ´ ıtog ´ ep ´ architektur ´ fejlod ˝ ese ´ Hagyomanyos szam´ ´ ak ´ as ´ architektur ´ Multimedi ´ ak ´ fejlod ˝ ese ´ GPU architektur ´ ak ´ Kitekintes
´ generaci ´ oi ´ GPU architektur ´ ak
´ o: ´ 1999 2. generaci NVidia GeForce 256 23 millio´ tranzisztor 120MHz 32Mb (128 bites) RAM ´ ´ adat 4 darab grafikus futoszalag (nem programozhato, ´ ´ ´ futoszalagon belul ıthato) ¨ nem modos´
ATI Radeon 7500
˝ as ´ 1. eload
´ o´ Adminisztraci Tematika ´ ıtog ´ ep ´ architektur ´ gyors´ıtasa ´ Szam´ ´ ak ´ ´ ıtog ´ ep ´ architektur ´ fejlod ˝ ese ´ Hagyomanyos szam´ ´ ak ´ as ´ architektur ´ Multimedi ´ ak ´ fejlod ˝ ese ´ GPU architektur ´ ak ´ Kitekintes
´ generaci ´ oi ´ GPU architektur ´ ak ´ o: ´ 2001 3. generaci NVidia GeForce 3 57 millio´ tranzisztor 120MHz 64Mb (128 bites) RAM
ATI Radeon 8500 Microsoft XBox
Programozhato´ ´ Assembly-szeru˝ nyelv: kernel programozas ´ ´ ´ Vegrehajt o´ neve: shader (arnyal o) ´ ´ ´ Adat a futoszalagon belul ıthato. ¨ is modos´
˝ as ´ 1. eload
´ o´ Adminisztraci Tematika ´ ıtog ´ ep ´ architektur ´ gyors´ıtasa ´ Szam´ ´ ak ´ ´ ıtog ´ ep ´ architektur ´ fejlod ˝ ese ´ Hagyomanyos szam´ ´ ak ´ as ´ architektur ´ Multimedi ´ ak ´ fejlod ˝ ese ´ GPU architektur ´ ak ´ Kitekintes
´ generaci ´ oi ´ GPU architektur ´ ak ´ o: ´ 2002 4. generaci NVidia GeForce FX 80 millio´ tranzisztor 400MHz 128Mb (128 bites) RAM
ATI Radeon 9700
´ ag ´ Teljes programozhatos ´ ´ Vertex shader: terbeli pontok + vektor/matrixm uveletek ˝ ´ ıtasa ´ Pixel shader: sz´ınek szam´
˝ as ´ 1. eload
´ o´ Adminisztraci Tematika ´ ıtog ´ ep ´ architektur ´ gyors´ıtasa ´ Szam´ ´ ak ´ ´ ıtog ´ ep ´ architektur ´ fejlod ˝ ese ´ Hagyomanyos szam´ ´ ak ´ as ´ architektur ´ Multimedi ´ ak ´ fejlod ˝ ese ´ GPU architektur ´ ak ´ Kitekintes
´ generaci ´ oi ´ GPU architektur ´ ak ´ o: ´ 2003 5. generaci NVidia GeForce FX 80 millio´ tranzisztor 400MHz 128Mb (128 bites) RAM
ATI Radeon 9700
´ ag ´ Teljes programozhatos ´ ´ Vertex shader: terbeli pontok + vektor/matrixm uveletek ˝ ´ ıtasa, ´ Pixel shader: sz´ınek szam´ texturam uveletek ´ ˝ ˝ ´ ´ Teljes lebegopontos tamogat as
˝ as ´ 1. eload
´ o´ Adminisztraci Tematika ´ ıtog ´ ep ´ architektur ´ gyors´ıtasa ´ Szam´ ´ ak ´ ´ ıtog ´ ep ´ architektur ´ fejlod ˝ ese ´ Hagyomanyos szam´ ´ ak ´ as ´ architektur ´ Multimedi ´ ak ´ fejlod ˝ ese ´ GPU architektur ´ ak ´ Kitekintes
´ generaci ´ oi ´ GPU architektur ´ ak ´ o: ´ 2004 6. generaci NVidia GeForce 6 146 millio´ tranzisztor 500MHz 256Mb (256 bites) RAM
ATI Radeon 9700
´ Reszei: Programozhato´ vertex motor Programozhato´ fragment motor ´ o´ motor Textur ´ az ´ eg ´ osszehasonl´ ¨ Melys ıto´ motor
˝ as ´ 1. eload
´ o´ Adminisztraci Tematika ´ ıtog ´ ep ´ architektur ´ gyors´ıtasa ´ Szam´ ´ ak ´ ´ ıtog ´ ep ´ architektur ´ fejlod ˝ ese ´ Hagyomanyos szam´ ´ ak ´ as ´ architektur ´ Multimedi ´ ak ´ fejlod ˝ ese ´ GPU architektur ´ ak ´ Kitekintes
´ generaci ´ oi ´ GPU architektur ´ ak
´ o: ´ 2007 7. generaci NVidia GeForce 8 (Kepler architektura) ´ 210 millio´ tranzisztor 575MHz / 1.35GHz 384Mb (256 bites) RAM
Stream processing megjelenik ´ a shaderek mas ´ sebesseggel ´ ¨ A mag es muk ˝ odnek
˝ as ´ 1. eload
´ o´ Adminisztraci Tematika ´ ıtog ´ ep ´ architektur ´ gyors´ıtasa ´ Szam´ ´ ak ´ ´ ıtog ´ ep ´ architektur ´ fejlod ˝ ese ´ Hagyomanyos szam´ ´ ak ´ as ´ architektur ´ Multimedi ´ ak ´ fejlod ˝ ese ´ GPU architektur ´ ak ´ Kitekintes
´ generaci ´ oi ´ GPU architektur ´ ak ´ o: ´ 2010 8. generaci NVidia Fermi architektura ´ ´ tranzisztor 1 milliard 700MHz 1, 5Gb (384 bites) RAM
´ Massz´ıvan parhuzamos ˝ Tetszolegesen programozhato´ ´ Shader-ek helyett a szalak (threads) jelennek meg ´ Reszei: Vertex motor Geometria motor ´ o´ motor Textur ´ az ˝ as ´ 1. eload
´ o´ Adminisztraci Tematika ´ ıtog ´ ep ´ architektur ´ gyors´ıtasa ´ Szam´ ´ ak ´ ´ ıtog ´ ep ´ architektur ´ fejlod ˝ ese ´ Hagyomanyos szam´ ´ ak ´ as ´ architektur ´ Multimedi ´ ak ´ fejlod ˝ ese ´ GPU architektur ´ ak ´ Kitekintes
´ generaci ´ oi ´ GPU architektur ´ ak ´ o: ´ 2012 9. generaci NVidia Kepler architektura ´ ´ tranzisztor 1,3 milliard 256 KB L2 cache ´ 1056 MHz orajel ∼ 400 mag
´ ´ magasabb teljes´ıtmeny/watt ´ ´ energiatakarekoss ag: arany ´ ´ ´ CPU nelk ´ ul Dynamic Parallelism: szalak letrehoz asa ¨ ¨ CPU szal ´ tudja szimultan ´ programozni a Hyper-Q: tobb GPU-t
˝ as ´ 1. eload
´ o´ Adminisztraci Tematika ´ ıtog ´ ep ´ architektur ´ gyors´ıtasa ´ Szam´ ´ ak ´ ´ ıtog ´ ep ´ architektur ´ fejlod ˝ ese ´ Hagyomanyos szam´ ´ ak ´ as ´ architektur ´ Multimedi ´ ak ´ fejlod ˝ ese ´ GPU architektur ´ ak ´ Kitekintes
´ generaci ´ oi ´ GPU architektur ´ ak ´ o: ´ 2014 10. generaci NVidia Maxwell architektura ´ ´ tranzisztor 1,9 milliard 2 MB L2 cache ´ 1020 MHz orajel ∼ 640 mag
´ ´ energiatakarekoss ag ´ elorejelz ˝ ´ jav´ıtott utas´ıtas es nagyobb L2 cache
˝ as ´ 1. eload
´ o´ Adminisztraci Tematika ´ ıtog ´ ep ´ architektur ´ gyors´ıtasa ´ Szam´ ´ ak ´ ´ ıtog ´ ep ´ architektur ´ fejlod ˝ ese ´ Hagyomanyos szam´ ´ ak ´ as ´ architektur ´ Multimedi ´ ak ´ fejlod ˝ ese ´ GPU architektur ´ ak ´ Kitekintes
´ generaci ´ oi ´ GPU architektur ´ ak
´ o: ´ a nem tul ´ ¨ oben... ˝ 11. generaci jov ´ tavoli NVidia Pascal architektura ´
´ 3D memoria ´ Egyes´ıtett CPU-GPU memoria ´ lenyegesen ´ NVlink: PCI Expressnel gyorsabb ´ memoriabusz
˝ as ´ 1. eload
´ o´ Adminisztraci Tematika ´ ıtog ´ ep ´ architektur ´ gyors´ıtasa ´ Szam´ ´ ak ´ ´ ıtog ´ ep ´ architektur ´ fejlod ˝ ese ´ Hagyomanyos szam´ ´ ak ´ as ´ architektur ´ Multimedi ´ ak ´ fejlod ˝ ese ´ GPU architektur ´ ak ´ Kitekintes
Tartalom 1
´ o´ Adminisztraci ´ es ´ elerhet ´ ˝ egek ´ Bemutatkozas os ˝ asok, ´ Eload gyakorlatok ´ ´ es ´ Szamonk er
2
Tematika
3
´ ıtog ´ ep ´ architektur ´ gyors´ıtasa ´ Szam´ ´ ak
4
´ ´ ıtog ´ ep ´ architektur ´ fejlod ˝ ese ´ Hagyomanyos szam´ ´ ak
5
´ as ´ architektur ´ Multimedi ´ ak
6
´ fejlod ˝ ese ´ GPU architektur ´ ak
7
´ Kitekintes ˝ as ´ 1. eload
´ o´ Adminisztraci Tematika ´ ıtog ´ ep ´ architektur ´ gyors´ıtasa ´ Szam´ ´ ak ´ ´ ıtog ´ ep ´ architektur ´ fejlod ˝ ese ´ Hagyomanyos szam´ ´ ak ´ as ´ architektur ´ Multimedi ´ ak ´ fejlod ˝ ese ´ GPU architektur ´ ak ´ Kitekintes
´ Mobil GPU Kitekintes: ´ ´ nagyon magas Hagyomanyos GPU-k fogyasztasa ´ eleg ´ hamar lemer´ıtene´ az aksit 300 Watt teljes´ıtmeny ´ ez utobbi ´ ´ ıtas ´ nem igaz, mert a vezetekek ´ Bar all´ hamarabb ´ egn ´ enek ´ szet
´ ıtas ´ fogyasztassal ´ ´ Minden szam´ is jar ¨ ´ ıtas ´ Mobil eszkozben a GPU-k a felesleges szam´ ´ ere ´ optimalizaltak ´ elkerul ¨ es Pl. Z-buffer algoritmus : IMR (immediate mode rendering) helyett TBR (tile-based rendering).
´ koncentraltak ´ Grafikara ´ utobbi ´ ˝ ´ GPGPU is megjelent a mobilokban Bar idoben mar ˝ as ´ 1. eload
´ o´ Adminisztraci Tematika ´ ıtog ´ ep ´ architektur ´ gyors´ıtasa ´ Szam´ ´ ak ´ ´ ıtog ´ ep ´ architektur ´ fejlod ˝ ese ´ Hagyomanyos szam´ ´ ak ´ as ´ architektur ´ Multimedi ´ ak ´ fejlod ˝ ese ´ GPU architektur ´ ak ´ Kitekintes
¨ onj ¨ uk Kosz ¨ a figyelmet!
˝ as ´ 1. eload