egy szisztolikus példa

Bevezet´ es

P´ elda

Automatikus párhuzamos´ıtás – egy szisztolikus példa

P´ arhuzamos´ıt´ as

Bevezet´ es

P´ elda

´ Attekint´ es

Bevezetés Példa – konkrét szisztolikus algoritmus Automatikus párhuzamos´ıtási m´ odszer – ¨ otlet


Bevezet´ es

P´ elda

´ Attekint´ es



Bevezet´ es

P´ elda

´ Attekint´ es



Bevezet´ es

P´ elda

Motiváció

Növekv˝o igény a gyors adatfeldolgozásra Pl. néhány szám´ıtásigényes feladatra: id˝ojárás modellezés kép- illetve jelfeldolgozás szeizmológiai szám´ıtások tengeri áramlatok modellezése ... megoldási lehet˝oségek: a hardver tökéletes´ıtése – fizikai korlátok párhuzamos programozás


Bevezet´ es

P´ elda


Gyors´ıtás

n processzor = n-szeres sebességn¨ ovekedés? pl. “Proc.” sz´ ama 1 ty´ uk 10 ty´ uk

Id˝ o 10 nap alatt 1 nap alatt (10-szer gyorsabban)

Feladat 10 tojás 10 tojás

Bevezet´ es

P´ elda


Gyors´ıtás

n processzor = n-szeres sebességn¨ ovekedés? pl. “Proc.” sz´ ama 1 ty´ uk 10 ty´ uk

1 n˝o 9 n˝o

Id˝ o 10 nap alatt 1 nap alatt (10-szer gyorsabban) ∗∗∗ 9 h´ onap alatt 1—————– h´ onap alatt . . .

Feladat 10 tojás 10 tojás

1 gyerek

Bevezet´ es

P´ elda


Párhuzamosság párhuzamosság megvalós´ıtása: a feladatot kisebb részekre bontjuk az egyes részfeladatokat szétosztjuk a processzorok között, melyek párhuzamosan dolgozhatnak sz¨ ukség van a processzorok munkájának az ¨ osszehangolására a részfeladat megoldása lehet˝ oleg ne tartson r¨ ovidebb ideig, mint ami sz¨ ukséges a feladat kiosztásához felmer¨ ul˝o kérdések: hogyan kapcsolódnak egymáshoz a processzorok (milyen párhuzamos architekt´ ura) hogyan osszuk szét a feladatokat az egyes processzorok között

Bevezet´ es

P´ elda

Különböz˝o osztályozási kritériumok. . .

Szorosan összekapcsolt rendszerek (shared memory)

Gyengén ¨ osszekapcsolt (szét)osztott rendszerek (distributed memory)


Bevezet´ es

P´ elda


processzorok kapcsolatrendszere – különböz˝o topológiák

Figure: Az ¨ osszek¨ ot˝ o h´ al´ ozatok “tengere” [Par:02]

Bevezet´ es

P´ elda


Szisztolikus architektúrák jellemz˝ok: azonos (általában egyszer˝ u) m˝ uveleteket végz˝ o processzorok (PE) szabályos strukt´ ura, lokális kapcsolat a szomszédos PE-k közt szinkron m˝ uködés (globális ´ orajelre) globális be-/ kimenet (a “szélen” lev˝ o PE-ken kereszt¨ ul)

PE PE PE PE PE

- Mem´ oria Figure: Line´ aris szisztolikus architekt´ ura

Bevezet´ es

P´ elda


Példa – “Hosszú” egészek szorzása (szekvenciális alg.) Feladat: Adott két egész szám: A = am−1 am−2 . . . a1 a0 , illetve B = bn−1 bn−2 . . . b1 b0 . Szám´ıtsuk ki: C = cm+n−1 cm+n−2 . . . c1 c0 = A × B. a- c b

a-× b + c (a + b + c)

Figure: Processzor, mely képes elvégezni két sz´ amjegy “´ atviteles” szorz´ as´ at (illetve osszead´ ¨ as´ at)

A szekveciális algoritmus bonyolultsága: O(m × n)

Pl. A = 321, B = 987: 321 × 987 2247 2568 2889 316827

Bevezet´ es

P´ elda


Példa – “Hosszú” (tetsz˝oleges pontosságú) egészek szorzása (online szisztolikus alg.) Lépés: 0

y

$ 321 987

-

$

$ $ $

$ $

$ $

hy , r i = d[1 × 7] = h7, 0i

$

$

$ $

$ $ $

$ $

-

O(m + n)

xa xb 0 - ha hb0

y

0

ha1 hb1

-xa 0 -xb

hy , r i = d[xa×xb], if s = $ 6= xa

h$, $i h$, $i, if s = $ = xa

Eredmény: Alg. bonyolultsága:

r za zb

... $ $

0

s

Processzorok száma: Max{m, n}/2

d[a] = ha

a mod β, b ci β

Bevezet´ es

P´ elda



y

7 032 098

-

1

0

$

1 7 1 7

$ $

hy , r i = d[0 + 7 × 2 + 1 × 8] = h2, 2i Eredmény:

$ $

$ $ $

$ $

...

$ $

r za zb

-

xa xb 0 - ha hb0

y

0

ha1 hb1

-xa 0 -xb

hy , r i = d[r + hb0 × xa + + ha0 × xb], if s = 1

h$, $i h$, $i, if s = $ = xa

7

Alg. bonyolultsága: O(m + n)

$

0

s


d[a] = ha

a mod β, b ci β

Bevezet´ es

P´ elda



y

2 003 009

-

2

2

$

2 8 1 7

2 8

hy , r i = d[2 + 2 × 8 + 7 × 3 + 1 × 9] = h8, 4i Eredmény:

$ $

$ $ $

$ $

...

$ $

r za zb

-

xa xb 0 - ha hb0

y

0

ha1 hb1

-xa 0 -xb

hy , r i = d[r + ha1 × hb1 + + hb0 × xa + + ha0 × xb], if s = 2

h$, $i h$, $i, if s = $ = xa

27


$

0

s


d[a] = ha

a mod β, b ci β

Bevezet´ es

P´ elda



y

8 000 000

-

3

4

$

3 9 1 7

2 8

hy , r i = d[4 + 8 × 3 + 2 × 9 + 7 × 0 + 1 × 0] = h6, 4i Eredmény:

$

3 9

$ $ $

$ $

-

d[3 × 9] = h7, 2i

O(m + n)

xa xb 0 - ha hb0

y

0

ha1 hb1

-xa 0 -xb

hy , r i = d[r + hb1 × za + + ha1 × zb + + hb0 × xa + + ha0 × xb], if s = 3 d[xa×xb], if s = $ 6= xa

827

Alg. bonyolultsága:

r za zb

... $ $

0

s


d[a] = ha

a mod β, b ci β

Bevezet´ es

P´ elda



y

6 000 000

-

4

4

7

0 0 1 7

2 8

hy , r i = d[4+8×0+1×0+7× 0 + 1 × 0+7] = h1, 1i Eredmény:

1

0 0

2 3 9

3 9

-

d[2 + 9 × 0 + 3 × 0] = h2, 0i

6827


r za zb

... $ $

0

s

xa xb 0 - ha hb0

y

0

ha1 hb1

-xa 0 -xb

hy , r i = d[r + hb1 × za + + ha1 × zb + + hb0 × xa + + ha0 × xb + y 0 ], if s = 4 d[r + hb0 × xa + + ha0 × xb], if s = 1


d[a] = ha

a mod β, b ci β

Bevezet´ es

P´ elda



y

1 000 000

-

4

1

2

0 0 1 7

2 8

hy , r i = d[1+8×0+1×0+ 7×0+1×0+ 2] = h3, 0i

2

0 0

0 0 0

3 9

-

d[0 + 0 × 0 + 9 × 0 + 3 × 0] = h0, 0i

Eredmény: 16827 Alg. bonyolultsága: O(m + n)

r za zb

... 0 0

0

s


xa xb 0 - ha hb0

y

0

ha1 hb1

-xa 0 -xb

hy , r i = d[r + hb1 × za + + ha1 × zb + + hb0 × xa + + ha0 × xb + y 0 ], if s = 4 d[r + ha1 × hb1 + + hb0 × xa + + ha0 × xb], if s = 2 d[a] = ha

a mod β, b ci β

Bevezet´ es

P´ elda



y

3 000 000

-

4

0 0 0

1 7

2 8

0

3

0 0

0 0 0

3 9

r za zb

...

0 0

0

s

-

xa xb 0 - ha hb0

y

0

ha1 hb1

-xa 0 -xb

hy , r i =

Eredmény: 316827 Alg. bonyolultsága: O(m + n)


d[a] = ha

a mod β, b ci β

Bevezet´ es

P´ elda

Automatikus párhuzamos´ıtás – ötlet

Figure: Line´ aris szisztolikus r´ acs – indukt´ıv (rekurz´ıv) felép´ıtése

hasonlóság – a szisztolikus rács indukt´ıv felép´ıtése, illetve – a feadat rekurz´ıv megfogalmazása (funkcionális program argumentumának indukt´ıv dekompoz´ıci´ oja) k¨ oz¨ ott


Bevezet´ es

P´ elda


Automatikus párhuzamos´ıtás – ötlet

Két lépés: konkrét architekt´ ura–t´ıpus el˝ ozetes tanulmányozása cél: találni egy rekurz´ıv ¨ osszef¨ uggést, mely az illet˝ o t´ıpus´ u architekt´ ura m˝ uködését jellemzi ugyanezt a logikát alkalmazzuk ford´ıtva: ha siker¨ ul a feladatnak egy olyan rekurz´ıv le´ırását megadni, ami megfelel egy (vagy több) bizonyos architekt´ ura m˝ uk¨ odését jellemz˝o le´ırásnak ⇒ a feladatot (viszonylag) egyszer˝ u levet´ıteni az illet˝ o t´ıpus´ u architekt´ urára.

Bevezet´ es

P´ elda


Egy konkrét architektúra–t´ıpus tanulmányozása Adatfolyam egy online szisztolikus t¨ ombben, mely a bemenetet k = 2 lépést követ˝oen kezdi tovább´ıtni.

az Y = F [X ] eredménylista (az els˝o 4 elem kivételével) kiszámolható rekurz´ıvan X4 illetve F [X2 ] f¨ uggvényében

Bevezet´ es

P´ elda


A ∗ B kifejezés kifejtése kifejtés szabályai (polinomok szorzása esetén): skaláris elem hozzádása egy polinomhoz:

a + (b ^ B) = (a + b) ^ B két polinom összeadása:

(a ^ A) + (b ^ B) = (a + b) ^ (A + B) skaláris elem szorzása egy polinommal:

a ∗ (b ^ B) = (a ∗ b) ^ (a ∗ B)

két polinom szorzása: (a ^ A) ∗ (b ^ B) =

(a ∗ b) ^ ((a ∗ B) + (b ∗ A) + (0 ^ (A ∗ B)))

Bevezet´ es

P´ elda

A ∗ B kifejezés kifejtése (polinomok szorzása esetén)

A∗B = = (a0 ^ A1 ) ∗ (b0  ^ B1 )   a0 ∗ B1 = ha0 ∗ b0 i^ + b0 ∗ A1   (A1 ∗ B1 )  0^  a ∗ (b1 ^ B2 )  0 = ha0 ∗ b0 i^ + b0 ∗ (a1 ^ A2 )   0 ^ A1 ∗ B1    a0 ∗ B2 = ha0 ∗ b0 , a0 ∗ b1 + b0 ∗ a1 i^ + b ∗ A2   0 A1 ∗ B1


Bevezet´ es

P´ elda


= ...

= h a0 ∗ b0 ,

a0 ∗ b1 + b0 ∗ a1 , a2 ∗ b0 + a1 ∗ b1 + a0 ∗ b2 ),

a3 ∗ b0 + a2 ∗ b1 + a1 ∗ b2 + a0 ∗ b3 i^

^ ((a0 ∗ B4 ) + (b0 ∗ A4 )+

+(a1 ∗ B3 ) + (b1 ∗ A3 ) + (A2 ∗ B2 )) a kapott rekurz´ıv összef¨ uggés:   H0 [A] ∗ T4 [B]       H0 [B] ∗ T4 [A] T4 [A ∗ B] = + H1 [A] ∗ T3 [B]     H1 [B] ∗ T3 [A]    T2 [A] ∗ T2 [B]

Bevezet´ es

P´ elda


Az átmenetfüggvény meghatározása a kapott rekurz´ıv o¨sszefüggés alapján a kifejezés elemeinek megfeleltetése az egyes regisztereknek: T2 [A] ∗ T2 [B] → y 0 T4 [A ∗ B] → y T4 [A] → xa, T4 [B] → xb T3 [A] → za, T3 [B] → zb H0 [A] → ha0 , H0 [B] → hb0 H1 [A] → ha1 , H1 [B] → hb1 Az els˝o négy elem kiszám´ıtását megad´ o¨ osszef¨ uggésb˝ ol hasonló módon kapjuk az átmenetf¨ uggvény y kiszám´ıtására vonatkoz´ o részét az els˝o négy lépésben (amikor a jobboldali szomszéd PE még nem szolgáltat semmiféle részeredményt).

egy szisztolikus példa

Recommend Documents