TÁMOP-4.2.2.C-11/1/KONV-2012-0004 Nemzeti kutatóközpont fejlett infokommunikációs technológiák kidolgozására és piaci bevezetésére
FELADATFÜGGŐ FELÉPÍTÉSŰ PIPELINE TÖBBPROCESSZOROS RENDSZEREK TERVEZÉSI MÓDSZERÉNEK KIDOLGOZÁSA ÉS ALKALMAZÁSA NAGY SEBESSÉGIGÉNYŰ BEÁGYAZOTT CÉLRENDSZEREKBEN DR. ARATÓ PÉTER PROF. EM. BME IRÁNYÍTÁSTECHNIKA ÉS INFORMATIKA TANSZÉK
TÁMOP-4.2.2.C-11/1/KONV-2012-0004
FELADATOK
• • • • • • • •
Nemzeti kutatóközpont fejlett infokommunikációs technológiák kidolgozására és piaci bevezetésére
Módszer kidolgozása többprocesszoros rendszerek tervezési eredményeinek összehasonlító értékelésére a rendszer-szintű szintézis folyamatában. Módszer kidolgozása hierarchikusan egymásba ágyazott hurkok kezelésére pipeline rendszerek magas szintű szintézise során. Pipeline rendszerek magas szintű szintéziséhez kidolgozott módszerek alkalmazása tipikus mintafeladatokban. Pipeline rendszerek magas szintű szintéziséhez kidolgozott módszerek hatékonyság-elemzése tömbműveletek kezelésében. Kidolgozott módszer hatékonyság-elemzése hangforrás lokalizálós alkalmazásban Kidolgozott módszer hatékonyság-elemzése nagy sebességű adatgyűjtő jelfeldolgozó rendszereken történő alkalmazás révén. A leggyakrabban használt szabványos kommunikációs protokollok alkalmazásához szükséges továbbfejlesztések. A PIPE rendszer továbbfejlesztése új alkalmazási szempontok szerint.
2
A FELADATFÜGGŐ FELÉPÍTÉSŰ TÖBBPROCESSZOROS (HETEROGÉN) RENDSZEREK FŐBB JELLEMZŐI:
TÁMOP-4.2.2.C-11/1/KONV-2012-0004 Nemzeti kutatóközpont fejlett infokommunikációs technológiák kidolgozására és piaci bevezetésére
• A részfeladatokat ellátó ú.n. komponens processzorok a részfeladat jellegétől, komplexitásától és a sebességigénytől függően különböző fajtájú készen kapható programozható vagy célhardvernek minősülő nagy integráltsági fokú egységek lehetnek –
(pl. Mikroprocesszor, mikrokontroller, FPGA , DSP, GPU, stb.)
• A komponens processzorok közötti kommunikáció valamilyen szabványos sínszervezésben történik -- (pl. CAN, UART, USB, 8251A, stb.)
• A nagy sebességigény miatt a rendszer működtethető pipeline üzemmódban előírható újraindítási idővel (átbocsátási tényezővel)
3
A FELADATFÜGGŐ FELÉPÍTÉSŰ TÖBBPROCESSZOROS (HETEROGÉN) RENDSZEREK RENDSZERSZINTŰ SZINTÉZISÉNEK FŐBB NEHÉZSÉGEI
•
•
•
A jelenlegi gyakorlatban az intuitív rendszerstruktúrák hatékonysági értékelése és minősítése csak próbálgatással lehetséges Az adatfolyam gráf elemi műveletei helyett – Szisztematikus módszerek hiányában nincs mód a különböző megoldások összehasonlító elemzésére és egyértelmű metrikák megfogalmazására. A magas szintű kiindulási feladatleírásból kiindulva a részfeladatokra (szegmensekre) bontásra (megfelelő dekompozicióra) nincs hatékony módszer – A szegmenshurkok kialakulása veszélyezteti hatékonyságot. A magas szintű szintézis eszközök hatékony alkalmazása azok módosítása nélkül nem lehetséges -- Az adatfolyam gráf elemi műveletei helyett a szegmesgráfot kell kezelni az ütemezés és allokáció során. -- A magas szintű feladatleírásban a hurkok és az adattömbök szimbolikus kezelésére módszert kell kialakítani
TÁMOP-4.2.2.C-11/1/KONV-2012-0004 Nemzeti kutatóközpont fejlett infokommunikációs technológiák kidolgozására és piaci bevezetésére
• A jelen kutató munka célja olyan új rendszerszintű szintézis módszer és kísérleti tervező eszköz (DECHLS) kidolgozása, amely többek között ezeket a főbb nehézségeket kiküszöböli és így lehetővé teszi a szisztemetikus szintézist a magas szintű programnyelven adott feladatleírásból kiindulva az intuitív tervezési lépéseknek a lehető legnagyobb mértékű kiiktatása mellett.
4
TÁMOP-4.2.2.C-11/1/KONV-2012-0004 HURKOK KIALAKULÁSA A SZEGMENS-GRÁFBAN NEM MEGFELELŐ DEKOMPOZÍCIÓ ESETÉN
Nemzeti kutatóközpont fejlett infokommunikációs technológiák kidolgozására és piaci bevezetésére
e1
e1
e3
e2
e4
e3
e2
e4
S1
e5
e5
S2
S2 e6
e6
S1
S1
S1
S2
S2
5
A DECHLS RENDSZERSZINTŰ SZINTÉZIS MÓDSZER ÉS KÍSÉRLETI TERVEZŐ ESZKÖZ FOLYAMATÁBRÁJA
TÁMOP-4.2.2.C-11/1/KONV-2012-0004 Nemzeti kutatóközpont fejlett infokommunikációs technológiák kidolgozására és piaci bevezetésére
Description of the task for the whole system
Decomposition tool
y
Number of segments is prescribed?
y
n
Decomposition is intended?
n Generating the HLS input directly
Calculate a beneficial number of segments
Forming the segments based on CM Generating the HLS input from the segments
Scheduling
Modified HLS tool
Allocation y
n
Pipeline mode desired?
Calculate the restart time (R) n
Result
y
A desired value of R (Rd) is given?
y
n R≤Rd
n
Cost is acceptable?
Reduce R by insertion of buffers and/or multiple copies of nodes for satisfying R
y
L:=L+dL
6 Result
A DECHLS ESZKÖZ PÉLDAALKALMAZÁSA
TÁMOP-4.2.2.C-11/1/KONV-2012-0004
HANGFORRÁS LOKALIZÁLÓ RENDSZER (1)
Nemzeti kutatóközpont fejlett infokommunikációs technológiák kidolgozására és piaci bevezetésére
Input 1
Input 2
FFT1
FFT2
SC2
SC1
Input 4
FFT3
FFT4 P4
P3
P2
P1
Input 3
SC3
SC4
VOTE P5 HT
Output
A hangforrás lokalizáció intuitíven dekomponált szegmes gráfja Goraczko, M.; Liu, J.; Lymberopoulos, D., "Energy-Optimal Software Partitioning in Heterogeneous Multiprocessor Embedded Systems", DAC 2008, June 8–13, 2008, Anaheim, California, USA 7
TÁMOP-4.2.2.C-11/1/KONV-2012-0004
A DECHLS ESZKÖZ PÉLDAALKALMAZÁSA
Nemzeti kutatóközpont fejlett infokommunikációs technológiák kidolgozására és piaci bevezetésére
HANGFORRÁS LOKALIZÁLÓ RENDSZER (2)
Number of processors versus restart time plot (intuitive decomposition)
Number of processors versus restart time plot 20 (without decomposition) Cost [number of processors]
Cost [number of processors]
15
14
13
12
11
10 1000
1500
2000
2500
3000
Restart time [time steps]
Költség és újraindítási idő függvénye (intuitív dekompozíció mellett)
3500
4000
19 18 17 16 15 14 13 1000
1500
2000
2500
3000
3500
4000
Restart time [time steps]
Költség és újraindítási idő függvénye (dekompozíció nélkül)
8
TÁMOP-4.2.2.C-11/1/KONV-2012-0004
A DECHLS ESZKÖZ PÉLDAALKALMAZÁSA
Nemzeti kutatóközpont fejlett infokommunikációs technológiák kidolgozására és piaci bevezetésére
HANGFORRÁS LOKALIZÁLÓ RENDSZER (3)
S5
S1
S1 S2
S4 S3
S2
S2
S4
S5
Szegmens gráf a KL dekompozíció esetén, előírt 5db szegmensre
TÁMOP-4.2.2.C-11/1/KONV-2012-0004
A DECHLS ESZKÖZ PÉLDAALKALMAZÁSA
Nemzeti kutatóközpont fejlett infokommunikációs technológiák kidolgozására és piaci bevezetésére
HANGFORRÁS LOKALIZÁLÓ RENDSZER (4) S1 S7
S1 S2
S6 S5
S3 S4
S2
S3
S4
S5
S6
S7
Szegmens gráf KL dekompozíció esetén, előírt 7db szegmensre 10
TÁMOP-4.2.2.C-11/1/KONV-2012-0004
A DECHLS ESZKÖZ PÉLDAALKALMAZÁSA
Nemzeti kutatóközpont fejlett infokommunikációs technológiák kidolgozására és piaci bevezetésére
HANGFORRÁS LOKALIZÁLÓ RENDSZER (5)
Number of processors
15
Number of processors versus restart time plot (different number of segments)
13 11 9 7 5 3 1000
1500
2000 2500 3000 Restart time [time steps]
3500
4000
Decomposed to 5 segments (Fig. 9 and 11; Latency=5178) Decomposed to 7 segments (Fig. 10 and 12; Latency=5178) Spectral clustering 4 segments (Fig. 14; Latency=5178)
Költség és újraindítási idő függvény különböző szegmens számok esetén
11
TÁMOP-4.2.2.C-11/1/KONV-2012-0004
A DECHLS ESZKÖZ PÉLDAALKALMAZÁSA
Nemzeti kutatóközpont fejlett infokommunikációs technológiák kidolgozására és piaci bevezetésére
HANGFORRÁS LOKALIZÁLÓ RENDSZER (6)
Number of processors versus restart time plots 19
Cost [number of processors]
17 15 13 11 9 7 5 3 1000
1500
2000
2500
Without decomposition (Latency=4217) Decomposed to 5 segments (Fig. 9 and 11; Latency=5178) Decomposed to 7 segments (Fig. 10 and 12; Latency=5178) Increased latency, no decomposition (Latency=5178) Spectral clustering 4 segments (Fig. 14; Latency=5178) Intuitive decomposition (Latency=5025) Increased latency, intuitive decomposition (Latency=5178)
3000
3500
4000
Restart time [time steps]
Költség és újraindítási idő függvények
12
RÉSZTVEVŐK ÉS ELVÉGZETT FELADATOK (1)
TÁMOP-4.2.2.C-11/1/KONV-2012-0004 Nemzeti kutatóközpont fejlett infokommunikációs technológiák kidolgozására és piaci bevezetésére
Dr. Arató Péter professzor emeritusz (BME Irányítástechnika és Informatika Tanszék)
• A DECHLS kísérleti rendszerszintű tervező eszköz kidolgozása. • A szegmenshurkok elkerülését biztosító dekompozíciós eljárás alapelveinek kidolgozása. • A Chaco és hMETIS gráf-dekompozíciós eszközözök analízise és értékelése. • Javaslat a kísérleti rendszer szintű szintézis eljárás genetikus dekompozíciós algoritmusának kiváltására. • A komponens processzorok közötti kommunikáció leggyakrabban használt szabványos sínrendszereinek analízise és értékelése. • Módszer a komponens processzorok közötti kommunikáció idejének figyelembe vételére és optimalizálására a rendszer szintű szintézis során. • A PIPE tervező rendszer allokációs algoritmusának újratervezése a komponens processzok közötti kommunikációs idők optimalizálása céljából. • Módszer az adatfüggő hurokidők becslésére a magas szintű szintézis folyamatában. • Módszer a hierarchikusan egymásba ágyazott hurkok adatfolyam-gráfjának leírására pipeline rendszerek magas szintű szintézise során.
13
RÉSZTVEVŐK ÉS ELVÉGZETT FELADATOK (2)
TÁMOP-4.2.2.C-11/1/KONV-2012-0004 Nemzeti kutatóközpont fejlett infokommunikációs technológiák kidolgozására és piaci bevezetésére
Rácz György PhD hallgató (BME Irányítástechnika és Informatika Tanszék) • A hangforrás lokalizáló rendszer példaalkalmazásának kidolgozása és értékelése. • Az adatgyűjtő rendszer példaalkalmazásának kidolgozása és értékelése. Suba Gergely PhD hallgató (BME Irányítástechnika és Informatika Tanszék) • A rendszerszintű szintézis során alkalmazható magas szintű feladatleíró nyelvek hatékonyság-elemzése. • Pipeline rendszerek magas szintű szintézisében alkalmazott módszerek hatékonyság-elemzése tömbműveletek esetében.
14
TÁMOP-4.2.2.C-11/1/KONV-2012-0004
INDIKÁTOROK
Nemzeti kutatóközpont fejlett infokommunikációs technológiák kidolgozására és piaci bevezetésére
Dr. Arató Péter: 2 tanulmány (2014.10.30 és 2014.12.19) Rácz György: 2 tanulmány (2014.10.30 és 2014.12.19) Suba Gergely: 2 tanulmány (2014.10.30 és 2014.12.19) ASCONIKK Konferencia előadás, 2014. dec. 16. György Rácz, Tibor Gergely Markovits, György Pilászy, Péter Arató„Handling data dependent execution times of software loops in the high level design of real time systems”
15
TÁMOP-4.2.2.C-11/1/KONV-2012-0004 Nemzeti kutatóközpont fejlett infokommunikációs technológiák kidolgozására és piaci bevezetésére
KÖSZÖNÖM A FIGYELMET!