19. – 21. 5. 2009, Hradec nad Moravicí
METAL 2009
___________________________________________________________________________
ANALÝZA CHEMICKÉHO PŘÍHŘEVU OCELI PROSTŘEDNICTVÍM REGRESE A UMĚLÝCH NEURONOVÝCH SÍTÍ ANALYSIS OF CHEMICAL REHEATING OF STEEL BY MEANS OF REGRESSION AND ARTIFICIAL NEURAL NETWORKS Ondřej Zimný a Jan Morávka b Zora Jančíková a a
VŠB-TU Ostrava, Tř.17 Listopadu 15, 708 33 Ostrava - Poruba, ČR,
[email protected],
[email protected] b Materiálový a metalurgický výzkum, s.r.o., Pohraniční 693/31, 706 02 Ostrava Vítkovice, ČR,
[email protected] Abstrakt Metalurgické procesy patří mezi složité fyzikálně-chemické procesy teoreticky popsatelné pomocí vícerozměrných obecně nelineárních dynamických systémů s různými dopravními zpožděními v jejich struktuře. Před realizací praxí požadované úlohy řízení těchto systémů je potřebné provést jejich strukturální a parametrickou identifikaci. Jelikož jde o procesy velmi složité a komplexní, nejsou doposud známé všechny exaktní vztahy pro jejich matematický popis. Některé metalurgické systémy jsou zatím prakticky nepopsané (tzv. černá skřínka), další popsané pouze částečně (tzv. šedá skřínka), zatímco jen velice málo z nich je popsaných téměř úplně (tzv. bílá skřínka). Zjišťování vnitřní struktury nedostatečně popsaných systémů se děje prostřednictvím fyzikálního modelování, prostřednictvím měření důležitých veličin a následně pomocí regresní analýzy či umělých neuronových sítí aplikovaných na měřená data. Při identifikaci systémů pomocí metod statistické analýzy je určitá šance dopátrat se jejich vhodné vnitřní struktury (tj. přejít od černé skřínky k šedé, či od šedé k bílé), i když tento přístup je velice náročný na znalosti a čas. Identifikace pomocí umělých neuronových sítí umožňuje spíše vnější popis systémů (tj. vytvoření modelů černých skřínek), kdy dostáváme přijatelnou shodu mezi skutečnými a modelovanými výstupy, čili tzv. estimaci (odhad, predikci) výstupu. Tento přístup je tedy vhodnější spíše k řízení než k samotné identifikaci. Příspěvek se zabývá možnostmi predikce teploty po chemickém příhřevu oceli na zařízení integrovaného systému sekundární metalurgie pomocí regresní analýzy i umělých neuronových sítí a porovnáním obou těchto přístupů. Abstract Metallurgical processes belong to complex physical-chemical processes theoretically described by means of multidimensional generally nonlinear dynamic systems with different transfer lags in their structure. Before realization of these systems control requested by practice it is necessary to execute their structural and parametric identification. As these processes are very complex, all exact relations for their mathematical description are not known so far. Some metallurgical systems are practically non-described so far (black box), further described only partially (grey box), while only a little of them are described 1
19. – 21. 5. 2009, Hradec nad Moravicí
METAL 2009
___________________________________________________________________________ almost fully (white box). Determination of internal structure of insufficiently described systems is done by means physical modeling, by measurement if important data and subsequently by means of regression analysis or artificial neural networks applied to measured data. There is certain chance to determine a proper system internal structure at system identification by means of statistical analysis (i.e. to come from black box to grey box or from grey box to white box), though this approach is knowledge and timeconsuming. Identification by means of artificial neural networks enables rather external system description (i.e. black box models creation), when we get an acceptable accordance between real and modeled outputs, i.e. so called output estimation (prediction). This approach is thus more suitable for control than for identification itself. Contribution deals with a possibility of prediction of a temperature after a steel chemical heating on device of integrated system of secondary metallurgy by means of regression analysis and artificial neural networks and with a comparison of both of these approaches. 1. ÚVOD Cílem tohoto článku je prezentovat odhad i porovnání hodnot predikované výstupní teploty oceli po chemickém příhřevu pomocí regresní analýzy (RA) a umělých neuronových sítí (UNS). Pokud je kesonové zařízení vybaveno kyslíkovou trysku, naskýtá se příležitost provedení chemického příhřevu. Proces chemického příhřevu lze stručně shrnout následujícím popisem: • Operátor vychází z příchozí teploty Tepl_hom. Na základě této teploty mu počítač doporučí množství hliníku (Al), kyslíku (O2) a oxidu vápenatého (CaO). • Nejprve je vnesen hliník, poté se začne foukat kyslík a bezprostředně po vyjetí kyslíkové trysky se přidá oxid vápenatý. Tyto prvky spolu souvisí, podle příchozí teploty je vneseno do tavby dané množství hliníku, úměrně tomu je přidáno množství kyslíku a také oxidu vápenatého. Mimo vnesený hliník dochází rovněž k „spalování“ ostatních prvků rozpuštěných v oceli včetně železa. • Významný teplotní přínos představují především prvky, jako jsou mangan (Mn), křemík (Si), hliník (Al) a uhlík (C). • Výstupní proměnná Tepl_2 je měřena na konci chemického příhřevu po ukončení foukání kyslíku. S ohledem na klasifikaci systémů v abstraktu lze konstatovat, že analyzovaný chemický příhřev patří do skupiny částečně popsaných procesů, takže jde o tzv. šedou skřínku. Cílem analýzy je zvýšit informaci o struktuře a vazbách tohoto procesu, tzn. přiblížit se ke struktuře tzv. bílé skřínky. Pro analýzu byla použita data získaná z ocelárenského závodu sekundární metalurgie. Proměnné využité k analýze jsou uvedeny v Tabulce 1.
2
19. – 21. 5. 2009, Hradec nad Moravicí
METAL 2009
___________________________________________________________________________ Tabulka 1. Analyzované proměnné Table 1. Analyzed variables Proměnná Hmot_FLS Před_Odp_Tepl Uprav_Odp_Tepl Čas_Oxyvit_ISSM Doba_Vak Tepl_Hom Doba_Odp_FLS Doba_Mer_Hom_Chp Del_Tepl_Mer_Hom_Chp Del_Si_Hom_Chp Del_Mn_Hom_Chp Tepl_Efekt_Si Tepl_Efekt_Mn Del_Al_Hom_Chp Tepl_Efekt_Al Sum_Tep_Ef_AlSiMn del_tep_CaO O2_AlSiMn O2_SiMn O2_Mer Al_Mer kyslík CaO Tepl_2
Veličina hmotnost tavby [kg] odpichová teplota [°C] upravená odpichová teplota [°C] doba, která uplynula od konce odpichu do spuštění vakuového zpracování [s] doba vakuování [s] teplota po homogenizaci na zařízení ISSM [°C] skutečná doba odpichu tavby z konvertoru [s] doba mezi dvěma měřeními, a to před procedurou VOH (Vacuum Oxygen Heating) a po ní [s] změna teploty před VOH a po VOH [°C] snížení množství křemíku při VOH [kg] snížení množství manganu při VOH [kg] teplotní efekt způsobený křemíkem [°C] teplotní efekt způsobený manganem [°C] přísada hliníku [kg] teplotní efekt způsobený hliníkem [°C] celkový teplotní efekt v důsledku oxidace hliníku, křemíku a manganu [°C] změna teploty oceli způsobená vápnem [°C] stechiometrická potřeba plynného kyslíku na oxidaci hliníku, křemíku a manganu při VOH [Nm3/t] stechiometrická potřeba plynného kyslíku na oxidaci křemíku a manganu při VOH [Nm3/t] měrná spotřeba kyslíku na příhřev [Nm3/t] měrná spotřeba hliníku na příhřev [kg/t] spotřeba kyslíku [Nm3] spotřeba oxidu vapenatého v [kg] teplota po chemickém příhřevu [°C] – výstup
Z tabulky 1 vyplývá, že pro analýzu bylo k dispozici 23 vysvětlujících proměnných a jedna vysvětlovaná, či výstupní proměnná (Tepl_2). 2. UMÉLÉ NEURONOVÉ SÍTĚ Umělé neuronové sítě (UNS) jsou vhodné pro aproximaci vztahů mezi různými procesními daty, zejména pak mezi daty nestrukturovanými s vysokým stupněm nelinearity a daty nepřesnými a Prahování neúplnými. X W UNS využívají distribuované W paralelní zpracování informace při Y X W + provádění výpočtů, tzn., že ukládání, zpracování a předávání Agregace X W informace probíhá prostřednictvím Soma Synapse celé neuronové sítě. Základem matematického modelu UNS je formální neuron, Obr. 1. Neuron jako matematický procesor který lze získat přeformulováním Fig. 1. Neuron as a mathematic processor zjednodušené funkce neuronu 1
0
1
2
3
2
3
3
19. – 21. 5. 2009, Hradec nad Moravicí
METAL 2009
___________________________________________________________________________ neurofyziologického do matematických vztahů. Neuronová buňka se skládá z mnoha části, z nichž čtyři následující lze považovat za základní. Jedná se o synapse, soma, dendrity a axon - obr.1. Formální neuron má n obecně reálných vstupů x1,…, xn odpovídající dendritům. Všechny vstupy jsou ohodnoceny příslušnými synaptickými váhami w1,…, wn. Váhy určují míru propustnosti vstupního signálu. Zvážena suma vstupních hodnot představuje vnitřní potenciál neuronu. Operace probíhající v neuronu můžeme rozdělit na operace synaptické a somatické. Do operací synaptických patří konfluence z i (t) = x i (t) ⋅ w i (t) (1) Do operací somatických patří agregace n
u(t) = ∑ z i (t)
(2)
i=1
prahování v(t) = u(t) - w 0
(3)
a nelineární zobrazení y(t) = 1/(1+e v(t) )
(4) Výstup neuronu y, modelující elektrický impuls axonu, je dán obecně nelineární přenosovou funkcí, jejímž argumentem je vnitřní potenciál. Pokud vnitřní potenciál neuronu překoná prahovou hodnotu, dojde k excitaci neuronu na hodnotu danou příslušnou přenosovou funkcí. Pro všechny typy predikcí se v podstatě hodí UNS, které jsou univerzálními aproximátory funkcí, tedy zejména sítě, využívající pro své učení algoritmus zpětného šíření (Back-propagation).
2.1. Predikce teploty pomocí umělých neuronových sítí Získaná data byla nejprve upravena a vytříděna. Na základě upravených dat a vybraných vstupních proměnných byly vytvářeny modely UNS. Jako vstupní proměnné byly použity: hmotnost tavby, teploty před chemickým příhřevem, doba vakuování, hmotnosti chemických prvků hliníku, manganu, křemíku, oxidu vápenatého a množství kyslíku (tj. 11 vysvětlujících proměnných). Jako hodnota predikovaná je určená proměnná teplota po chemickém příhřevu. Zobecněná bloková struktura vstupů a výstupu umělé neuronové sítě je zobrazena na obr.2. Schéma vytvořené sítě je na obr.3.
4
19. – 21. 5. 2009, Hradec nad Moravicí
METAL 2009
___________________________________________________________________________ Typ sítě
Obr. 2. Bloková struktura neuronové sítě Fig. 2. Block structure of neural network
Obr. 3. Struktura umělé neuronové sítě Fig. 3. Structure of artificial neural network
K vytváření a analýze umělých neuronových sítí byl použit komerční program Statistica-Neuronové sítě. V tomto programu bylo vytvořeno několik modelů. Jako výsledný model byl vybrán ten, který měl nejlepší parametry vyjadřující míru nepřesnosti mezi skutečnými a předikovanými hodnotami. Vybraný model představuje třívrstvou neuronovou síť, která má 11 neuronů ve vstupní vrstvě, 5 ve skryté vrstvě a jeden neuron ve výstupní vrstvě. Parametry vybrané sítě byly implementovány do samostatného programu, nezávislém na programu Statistica. Tento program umožňuje na základě zadání vstupních hodnot predikovat teplotu po chemickém příhřevu a změnu teploty, kterou chemický příhřev způsobí. Na obr.4,5 jsou zobrazeny grafy s výsledky, které byly získané z vytvořené UNS. Histogram
Porovnání predikované a měřené teploty 240 1640 Měřená hodnota
220
Predikovaná hodnota
200
1620
180 160
1600 Tepl_2°C
140 120
1580
100 Počet pozorování
1560
1540
1520 0
100
200
300
400
500
600
700
80 60 40 20 0
800
počet případů
-45
-40
-35
-30
-25
-20
-15
-10
-5
0
5
10
15
20
25
30
Rezidua
Obr. 4. Porovnání predikované a měřené teploty Fig. 4. Comparison of predicted and measured temperature
Obr. 5. Histogram reziduí UNS Fig. 5. Histogram of residues of ANN
První graf zobrazuje rozdíl mezi měřenou a předikovanou hodnotou výstupní teploty proměnné Tepl_2 v závislosti na počtu případů. Na druhém grafu (obr. 5) je zobrazen histogram reziduí. Z tohoto grafu je patrné, že většina predikovaných hodnot se liší od změřených hodnot v teplotním rozmezí do ±5 °C. Pro vyjádření a porovnání míry nepřesnosti mezi skutečnými hodnotami a predikovanými hodnotami UNS nebo RA lze použít tři „univerzální“ a základní parametry kvality predikce modelů: SSE, RMS a R2. 5
19. – 21. 5. 2009, Hradec nad Moravicí
METAL 2009
___________________________________________________________________________ Pro vybranou umělou neuronovou síť, uvedenou výše, jsou porovnávací parametry a jejich hodnoty následující: SSE - (Sum of squared error) součet čtverců chyb n
(5)
SSE = ∑ (y i − o i ) 2 i =1
SSE = 21714,772 kde je n yi oi
- počet vzorů trénovací nebo testovací množiny, - predikované hodnoty výstupu neuronové sítě, - skutečné hodnoty výstupu objektu.
RMS - (Root Mean Squared) střední kvadratická (standardní, směrodatná) chyba regrese n
RMS =
∑ (y − o ) i
2
i
(6)
i =1
n −1 RMS = 5,58564
R2 - koeficient (pro nelineární modely index) determinace SSE R2 = 1 − SST R2 = 0,875796
(7)
kde je SSE - součet čtverců chyb SST - celkový součet čtverců chyb Na obr.6 je viditelné okno vytvořeného programu, umožňující uživateli po zadání příslušných vstupních proměnných vypočítat predikovanou (dopředu odhadovanou) výstupní teplotu po chemickým příhřevu. Dojde i k výpočtu změny teploty, tedy k výpočtu rozdílů teploty před a po chemickém příhřevu.
Obr. 6. Program pro predikci teploty po chemickém příhřevu Fig. 6. Program for prediction of temperature after chemical reheating
Na základě těchto informací lze naplánovat délku následných operací při zpracování oceli na zařízení sekundární metalurgie. Popřípadě lze měnit vstupní parametry tak, aby bylo dosaženo žádané výstupní hodnoty, a to ještě před
6
19. – 21. 5. 2009, Hradec nad Moravicí
METAL 2009
___________________________________________________________________________ samotným procesem chemického příhřevu. 3. REGRESNÍ ANALÝZA Regresní analýza byla nejprve aplikována na všechna data (taveb) a s uvažováním všech dostupných regresorů (tj. 23 vysvětlujících proměnných podle tabulky 1) za předpokladu jejich lineárního (aditivního) působení na regresand (výstupní proměnnou). Pomocí bohaté regresní diagnostiky však bylo zjištěno, že: • mezi některými regresory existují silné korelační vazby, • některé záznamy (tavby) vykazují vybočující hodnoty. Prostřednictvím ukazatele VIF (Variance Inflation Factor) a mnohorozměrové analýzy dat (metoda hlavních komponent) byly z množiny regresorů odstraněny ty, které byly významně závislé na ostatních. Tímto krokem obsahovala podmnožina regresorů pouze „dominantní“, ovlivňující (a už ne ovlivňované) a vzájemně téměř nezávislé (ortogonální) vysvětlující proměnné. Z množiny dat byly odstraněny záznamy s vybočujícími hodnotami v tavbách. Takto upravená podmnožina regresorů a dat byla východiskem jak pro analýzu pomocí UNS, tak i pomocí vícenásobné regrese (RA). Po konzultaci s technology byla podmnožina regresorů ještě upravena na 11 regresorů - viz obr. 2.
3.1. Úplný vícenásobný lineární regresní model Pro vybranou podmnožinu 11 regresorů a dat bez vybočujících záznamů byl použit úplný (se všemi regresory) vícenásobný lineární regresní model (LRMU), který má obecný tvar: m
y = b0 + b1 ⋅ x1 + ... + b11 ⋅ x11 + ε = b0 + ∑ b j ⋅ x j + ε ,
(8)
j =1
kde je y b0 bj xj
ε m
- regresand (vysvětlovaná proměnná), - absolutní člen (konstanta), - regresní (vazební, váhové) koeficienty, - regresory (vysvětlující proměnné), - chyba regrese, reziduum, - počet regresorů.
Regresní diagnostika výsledků aplikace tohoto modelu (LRMU) ukázala, že model je sice vysoce statisticky významný, v čase stabilní, s prakticky nekolineárními regresory, avšak 4 z nich, tj. Uprav_odp_tepl, Doba_Vak, Del_Mn_hom_chp a CaO se (překvapivě) jevily jako statisticky nevýznamné. Model není lineární (chybí mu nelinearity regresorů typu mocnina, inverzní funkce - hyperbola, či logaritmus), o čemž do jisté míry svědčí i statisticky významný absolutní člen. Model je statisticky nekorektní, protože jeho rezidua vykazují všechny „nectnosti“ - heteroskedasticitu (přímou i autoregresně podmíněnou), nenormalitu a autokorelaci. Prakticky to znamenalo, že model potřeboval úpravu ve dvou směrech: 1. Analýza nelinearity regresorů a jejich zavedení do modelu 2. Odstranění statisticky nevýznamných (neovlivňujících, „přebytečných“) regresorů.
3.2. Redukovaný transformovaný vícenásobný regresní model Regresní diagnostika, jako i komponentní a reziduální grafy ukázaly, že je vhodné u proměnné Doba_Vak přidat její kvadrát, u proměnné Doba_Mer_Hom_Chp její převrácenou hodnotu, přidat interakci (součin) proměnných Hmot_FLS a CaO, jako i odstranit vliv dvou vybočujících bodů (taveb).
7
19. – 21. 5. 2009, Hradec nad Moravicí
METAL 2009
___________________________________________________________________________ Po těchto úpravách vykazoval model (LRMT) některé statisticky nevýznamné regresory (hmotnost tavby, upravená odpichová teplota a snížení množství manganu při VOH), které byly postupně odstraněny pomocí tzv. krokové (stepwise) metody se zpětným (backward) výběrem (významných) regresorů. Výsledný redukovaný model s transformovanými 10ti regresory (LRMTR) vykazoval statisticky „dobré“ vlastnosti. Jeho index determinace (tzv. regresní rabat) R2 = 87,5 % je prakticky stejný jako u UNS, hodnoty SSE a RMS jsou dokonce nižší. Na obr.7,8 jsou viditelné graf predikce a histogram reziduí výsledného regresního modelu LRMTR. Z obou grafů je zřejmé, že model LRMTR přijatelně predikuje výstupní teplotu chemického příhřevu. Jeho rezidua vykazují normální rozdělení se směrodatnou odchylkou asi 5 °C.
Obr. 7. Porovnání predikované a měřené teploty Fig. 7. Comparison of predicted and measured temperature
Obr. 8. Histogram reziduí modelu LRMTR Fig. 8. Histogram of residues from model LRMTR
3. ZÁVĚR Cílem článku bylo prezentovat možnosti predikce teploty po chemickém příhřevu oceli na zařízení integrovaného systému sekundární metalurgie pomocí regresní analýzy (RA) i umělých neuronových sítí (UNS) a porovnání obou přístupů. Výsledky analýzy, jako i možnosti, přednosti a nedostatky (silné a slabé stránky) obou přístupů jsou stručně a přehledně shrnuty v tabulce 2: Tabulka 2. Porovnání přístupů analýzy Table 2. Comparison of analysis methods Objekt Koeficient determinace R2 [%] Součet čtverců reziduí SSE [°C2] Směrodatná chyba regrese RMS [°C] Počet regresorů Přístupnost hodnot vazebních koeficientů Diagnostika vlivnosti (významnosti) vstupů Diagnostika adekvátnosti modelu Diagnostika přeurčenosti modelu Diagnostika korektnosti modelu Diagnostika reziduí modelu
8
RA 87,5 19 279 5,31 11 / 10 ano ano ano ano ano ano
UNS 87,6 21 715 5,59 11 ano ano ne ano ne ne
Poznámka UNS lepší RA lepší RA lepší RA věrnější v programu UNS je i v UNS
19. – 21. 5. 2009, Hradec nad Moravicí
METAL 2009
___________________________________________________________________________ Z uvedeného porovnání je vidět, že UNS jsou obecně vhodné spíše k predikci výstupu než k určení adekvátní struktury a přenosových koeficientů procesu. LITERATURA [1] [2] [3]
JANČÍKOVÁ, Z. Umělé neuronové sítě v materiálovém inženýrství. Monografie, GEP ARTS Ostrava, 2006. ISBN 80-248-1174-X. KRAYZEL, M. Technologie mimopecního zpracování na zařízení ISSM, technická zpráva, Vítkovice, a. s., 2007. JANČÍKOVÁ, Z., ROUBÍČEK, V., JUCHELKOVÁ, D. Application of Artificial Intelligence Methods for Prediction of Steel Mechanical Properties. Metalurgija, 47 (2008) 2, s. 133-137, ISSN 0543-5846.
9