Kvalimetrie. Řízení a plánování jakosti pomocí NN a PLS metod. Karel Kupka
Abstrakt: Příspěvek popisuje principy dvou vybraných predikčních vícerozměrných metod a ukazuje vlastnosti multilineárních modelů PLS (partial least squares) a NN (neuronových sítí, Neural Network) a jejich možnosti při modelování výrobních a technologických procesů a plánování jakosti. Příspěvek je doplněn příklady aplikací z prostředí průmyslu a výzkumu v ČR.
1. Úvod Technologická praxe poskytuje soubory hodnot měřitelných parametrů z různých částí výroby, přípravy a zpracování materiálů, vstupních a výstupních kontrol. Mezi těmito parametry existují často užší, či volnější vztahy fyzikálního, kauzálního, či ekonomického charakteru. Vhodným modelování těchto vztahů je potenciálně možné tyto parametry odhadovat, predikovat ještě dříve, než jsou tyto parametry známy. Tím je za určitých okolností možno včas reagovat na případné problémy dříve, než se přímo projeví, případně je možné využít těchto modelů při designu a optimalizaci technologických postupů modelováním různých technologických podmínek a jejich vlivu na hodnoty výstupních parametrů, např. kvality produktu. Dále je možné využít modelů rovněž ke zpětné predikci vstupních parametrů při daných požadovaných vlastnostech produktu. Pokud je model korektní, lze v omezeném rozmezí hodnot parametrů zlepšovat, optimalizovat, nebo stabilizovat důležité vlastnosti technologie (například náklady, opotřebení, poruchovost, spotřebu energie a surovin), či kvalitu produktu (stabilizace parametrů jakosti, zmetkovitost, shodnost, způsobilost). Pokročilé lineární a nelineární vícerozměrné prediktivní statistické modely jsou spolehlivou cestou ke zlepšování jakosti, plánování jakosti, konkurenčním výhodám a
quality excelence, neboť účinně využívá všech druhů a úrovní informací a vědomostí v dané technologii, podniku, odvětví.
Relace statistického modelování a řízení jakosti – transformace dat na kvalitu a zisk
Příklad informačních datových bází, toky dat a možnosti modelování vztahů ve výrobním subjektu Pokročilé statistické techniky a modely využívající a modelující současně více parametrů a zkoumající vztahy mezi různými skupinami parametrů v oblasti technologií a řízení jakosti za účelem zlepšení jakosti se nazývají metodami kvalimetrie. Lze sem zařadit mnoho vícerozměrných metod, jako techniky vícerozměrné analýzy (metody hlavních komponent, korespondenční a diskriminační analýzu, kanonické korelace), metody zobecněné lineární regrese, logistické regrese, klasifikační a regresní stromy, metody z oblasti Data Mining a KDD. V tomto příspěvku se zabýváme dvěmi metodami – metodou parciálních nejmenších čtverců a neuronovými sítěmi. Cílem metod kvalimetrie z hlediska subjektu je popsat globálně vztahy mezi důležitými parametry v podniku z oblasti surovin, technologie, produktu, obchodu, marketingu, designu a vývoje. Tento popis ve formě statistických modelů je pak bezprostředně použitelný pro podporu rozhodování a plánování a zlepšování jakosti. Některé typické aplikace billineárních modelů PLS a neuronových sítí: Technologické aplikace a QC / QA / QI / QP – Technologie: Procesní parametry ↔ Fyzikální vlastnosti Technologie: Procesní parametry ↔ Fyzikální vlastnosti Proces/chemické složení ↔ Sensoric/Quality parametry Vstupní faktory ↔ Výstupní kval/kvantitativní vlastnosti Procesní podmínky ↔ Výstupní kval/kvantitativní vlastnosti Obecné aplikace – Toxicology: Composition/Structure ↔ Toxicity Health/Pharmaceutics: Chemical Structure ↔ Bioeffects Pollution: Composition ↔ Origin/Source Pollution: Composition ↔ Human health effects Environment: Environmental factors ↔ Species diversity QSAR: Quantitative Structure – Activity Relationship
Tyto prediktivní metody byly v českých podnicích jako např.:
využity
při
řešení
úloh
-
Plzeňský pivovar/Pilsner Urquell – analýza, predikce a plánování vlastností piva a marketingová analýza produktového portfolia a detekce obchodních příležitostí na globálním trhu v podniku;
-
Jaderná Elektrárna Dukovany: statistických nestabilit techologie nákladů na provoz a údržbu;
-
Kaučuk Kralupy – optimalizace vlastností butadienových kopolymerů a analýza produktového portfolia;
-
Třinecké železárny, Mittal Steel Ostrava– budování inteligentních modelů pro plánování parametrů technologie ve slévárenství a optimalizace vlastností produktů s minimalizací nákladů a ztrát, implementace ztrátových funkcí
predikce možných s následným snížení
a při výzkumných úkolech, např. výzkum bioluminiscenční aktivity bakterií pro monitoring životního prostředí, nebo koloristických vlastností anorganických pigmentů.
2. PLS: Parciální nejmenší čtverce – porozumění jakosti v technologii Metoda parciálních nejmenších čtverců (Partial Least Squares) byla intuitivně popsána koncem Hermanem Woldem (1) formou iterativního algoritmu. Matematické pozadí této metody byla objevena teprve později (2). PLS modeluje vztah dvou vícerozměrných veličin. 2.1. Metodika a metody PLS Metody PLS jsou založené na syntéze principu příbuzném metodě hlavních komponent (PCA) a vícenásobné lineární regrese. Tato matematická metoda je využívána v ekonometrii, chemometrii, biometrii a v poslední době se objevují aplikace
v kvalimetrii. Cílem metody je odhalit vztahy mezi vícerozměrnými daty v databázích a využít této znalosti k přibližnému výpočtu hodnot jedné skupiny veličin z druhé. 2.2. Podstata Metody PLS Tabulku naměřených hodnot p veličin (sloupců) s n řádky označme jako matici X(n x p), a odpovídající tabulku se stejným počtem řádků n ale s q veličinami označme Y(n x q), Abychom extrahovali maximum informace z p- a q- rozměrných matic do prostoru s nižší dimenzí k, rozložíme X a Y na ortogonální matice T (n x k) a U (n x k), s koeficienty P a Q. X = TP + E Y = UQ + F T (n x k), U (n x k), k ≤ min(p, q). Zajištění maximální relevance Xkomponent pro Y, tyto transformace maximalizují kovariance mezi T a U. Dimenzionalita T a U je typicky menší než X a Y a sloupce T a U jsou ortogonální. To zlepší stabilitu modelu. Šum a irelevantní informace se koncentruje v „popelnicích“ E a F. Je-li k = p, pak E = 0. Dekompozice U = TB (B je čtvercová diagonální matice) poskytuje nástroj pro predikci Y z X: Y = TBQ, T = XPKombinací tohoto a předchozích vztahů je zřejmý vztah (vnitřní lineární vazba mezi X a Y). U = TB BQ = R
X = TP + E Y = TR + F
T se konstruuje z nových dat X. Protože T = XP–, Y = XP–BQ, a tedy P–BQ reprezentuje originální (obecně vychýlené a zkrácené – tedy stabilnější) regresní parametry modelu Y = XA. Na rozdíl od klasické lineární regrese jsou v PLS X a Y rovnocenné, tedy zaměnitelné – je jedno, kterou matici označíme X a kterou Y. Proto lze predikovat Y z X stejně jako X z Y. Je tedy PLS rovněž často používaným nástrojem pro lineární vícerozměrnou kalibraci.
P X
=
T
+
E
Q Y
=
U
X
+
PREDIKCE
F
Y
Grafické znázornění PLS 2.3. Aplikace PLS pro plánování kvality piva a mapování portfolia produktů v Plzeňském pivovaru Jednou z typických aplikací PLS je modelování vztahů chemické složení – vlastnosti, nebo chemická struktura – vlastnosti. Vlastnostmi se rozumí vlastnosti fyzikální, chemické, biochemické, toxikologické a podobně. V Plzeňském pivovaru byla využita metoda PLS pro modelování vztahu chemické složení – subjektivní chuťové parametry. Subjektivní hodnocení je realizováno skupinou profesionálních panelistů-degustérů. Kromě nalezení vztahu složení – vlastnosti, který mohl být využit pro predikci subjektivních vlastností bez nutnosti ochutnávání, byl pomocí grafické interpretace PLS-Biplot diagnostikována rovněž distribuce jednotlivých značek a produktů na trhu v podprostoru hlavních komponent P a Q, což je důležitý zdroj informace pro případná strategická rozhodnutí vedení firmy. Uvedené grafy jsou pouze ilustrativní a byly mírně pozměněny pro citlivost údajů.
Predikční kapacita PLS modelu pro všechny prediktory, grafy predikce
PLS-Biplot distribuce brands v podprostoru prvních dvou komponent matice vlastností Q
2.4. Aplikace PLS pro detekci ztrát, optimalizaci polymerace a identifikaci eficientních tříd produktů v Kaučuku Kralupy Data z technologie a hodnocení jakosti jsou základním zdrojem pro implementované analytické a identifikační postupy. Metodami PLS se podařilo nalézt významné vztahy mezi různými úrovněmi technologie a vlastnostmi produktu – butadienových kopolymerů, které definují jakost produktu. Pomocí Biplot analýzy bylo možné identifikovat a potlačit nestability kvality v řádu desítek procent celkových ztrát technologie. Pomocí inverzního PLS modelu pak je možné vypočítat optimální režimy technologických postupů a izolovat a klasifikovat potenciální nové podskupiny produktů.
Procesní trajektorie s diagnostikou nestabilit a klasifikací úrovní jakosti
3. NN: Neural Networks 3.1. Podstata neuronových sítí Matematické modely neuronové sítě jsou inspirovány strukturou a funkcí biologického neuronu. Model neuronu lze vyjádřit jako yi = σ * ( ( wij * x j − µi ) , kde xj jsou vstupní hodnoty, wij jsou
∑ j
váhové koeficienty a σ* je aktivační funkce, která transformuje vstupy na výstupní signál neuronu. Aktivační funkce má za úkol rozeznat, zda kombinace úrovně vstupních signálů je dostatečně významná (zda není podprahová, či příliš vysoká), resp. kvantifikovat v určitém rozmezí jejich významnost. Mezi nejjednodušší aktivační funkce patří třeba skoková funkce, která může mít tvar
σ ( x) = 1 pro x ≥ 0 σ (x) = 0 pro x < 0
Skoková aktivační funkce
Schéma neuronu
V neuronových sítích se často se využívá logistická aktivační funkce σ =
1 , která je případně parametrizována 1-2 1 + exp(− x)
parametry. Vstupní veličina xi je po normalizaci vážena vahou wji a v neuronu transformována aktivační funkcí σj+1, i (z) = 1/(1 + e – z), kde z je lineární kombinace vstupních veličin, zi = a0 + Σaijzi-1,j. Váhy wji představují vazbu mezi vstupní hodnotou a neuronem. z = xi.wij; σj+1, i (z) = 1/(1 + e – z); zi = a0 + Σaij zi-1,j
1
σ
0 0
X
Logistická aktivační funkce Jednovrsvá neuronová síť
3.2. Vícevrstvé neuronové sítě Architektura vícevrstvých neuronových sítí umožňuje řešení lineárně neseparabilních klasifikačních problémů a modelování silně nelineárních systémů. Optimalizace takových sítí je však daleko náročnější na optimalizační algoritmy.
Příklady struktury vícevrstvé neuronové sítě 3.3. Postup použití NN Aplikace NN má obyčejně 3 kroky: • Volba vhodné struktury sítě (architektura) • Trénování sítě na změřených datech (učení) s případnou validací sítě • Predikce pomocí NN Nevýhodou modelů NN je apriorní neexistence statistických atributů, jako intervalů spolehlivosti, obtížná, či nemožná interpretace parametrů, nemožnost testování významnosti vlivu proměnných na výstupní hodnoty. Tyto nedostatky je možné
druhotně odstranit některými vypočetně-intenzivními technikami, např. bootstrapingem, Monte-Carlo metodami, případně linearizací odpovídajícího regresního modelu a asymptotickým výpočtem statistických parametrů. Poměrně výhodné a intuitivní je vizualizace váhových koeficientů například pomocí tloušťky dentritů ve schématu neuronové sítě. Tlusté čáry pak odpovídají intenzivnějšímu toku informací mezi uzly sítě, případně ze vstupní, či do výstupní proměnné a tak vlastně naznačují i významnost jednotlivých proměnných i vhodnost navržené architektury sítě. Predikční neuronová síť s vyznačenou intenzitou toku informace – použitá při modelování optických vlastností anorganických pigmentů a technologických podmínek pro světové trhy v prostoru L-a-b 3.4. Využití NN pro modelování a předpovědi časových řad. Jedním ze speciálních využití neuronových sítí je modelování časových řad (NN-TS). Lze zde využít nelineární analogie autoregresního (AR) modelu. V autoregresním modelu je posloupnost hodnot xi–m, xi–m+1, ..., xi–1, xi modelována jako lineární kombinace xi = amxi–m + am-1xi–m+1, ..., +a1xi–1 + a0. Použije-li se místo lineárního autoregresního modelu regresní neuronová síť, je možno vytvořit třídu nelineárních autoregresních modelů, jehož podmnožinou jsou i lineární modely. Spojením s vhodnou cross-validací lze popsat širší oblast problémů popsatelných stacionárními časovými řadami. Nestacionární časové řady nelze tímto způsobem modelovat pro lokální povahu neuronové sítě.
3.5. Aplikace NN při modelování parametrů jakosti ve Mittal Steel Ostrava Základními parametry kvality a důležitým elementem systému jakosti železáren, oceláren a sléváren jsou vlastnosti sledované zákazníkem, především chemické složení, fyzikální a chemické vlastnosti, homogenita. NN-řízené statistické modelovací postupy aplikované na data procesní a data ze zkušeben vedly ke konstrukci stabilních predikčních modelů a metodik použitelných při optimalizaci stability a snižování vad. Dále je možné těmito modely určit technologické postupy vedoucí k produktu požadovaných vlastností. Procesní predikční modely byly navíc využity při včasné identifikaci nestabilit a chybných taveb, apod.
Ilustrace – jeden z NN-modelů při optimalizaci nákladů a jakosti ocelových produktů 3.6. Aplikace NN-časové řady pro predikci chování dynamických systémů v JE Dukovany Příkladem aplikace NN-TS je použití tohoto modelu pro modelování a předpovědi časového průběhu některých chemických a fyzikálních parametrů média v primárním a sekundárním okruhu jaderné elektrárny Dukovany. Model NNTS zde predikoval podstatně lépe než klasické modely časové řady AR, resp. ARIMA. Následující obrázek představuje fitovaný průběh naměřených hodnot s předpovědí 15 budoucích měření (silná čára). Této předpovědi validovaného modelu lze využít u kritických veličin k včasné předpovědi případných budoucích
výchylek k od předpokládaných úrrovní. Odchy ylka od 1-kro okové předpov vědi přesahu ující jistý náásobek rezidu uální směrod datné odchylky y predikce (n např. 3σr) můžže být navíc diagnosticky využit v jako varrovná statisticcká nestabilitaa, Model NN N-TS zde pak bude sloužit jaako inteligenttní regulační diagram. d
Časov vá řada fitova aná neuronovo ou autoregressí s 15-krokov vou předpovědí (tučně)
Odpovíd dající neurono ová síť se 7 + 3 neurony ve skrytých vrsttvách a grafem predikce p Adresa a autora: Ing. Kareel Kupka, Ph.D D., TriloByte Sttatistical Software s.r.o., Jiráskova 21, 530 002 Pardubice e-mail: ku
[email protected] Tento příspěvek byl vytvořen na pracovišti T TriloByte Statiistical Software pomocí softwaare QCExpert za státního přííspěvku „Výzkkumné centrum 1M06047“: CQ QR, Centrum pro p jakost a Spolehlivost.