REQUEST‘06 Sborník příspěvků 1. konference Centra pro jakost a spolehlivost výroby Praha, 30. 1. – 1. 2. 2007
CQR 2007
Tato publikace vznikla za podpory projektu Ministerstva školstvi, mládeže a tělovýchovy, číslo 1M06047 Editor: Doc. RNDr. Gejza Dohnal, CSc. © 2007 Centrum pro jakost a spolehlivost výroby, ČVUT v Praze Karlovo nám. 13, 121 35 Praha 2 ISBN 978-80-01-03709-6
Obsah: Vladimír Bajzík: Využití logistické regrese pro hodnocení omaku …………………….. 5 Michal Balatka: Stanovení nejistot při výpočtu kontaminace zasaženého území …… 12 Josef Bednář: MSA - Analýza systému měření ………………………………….…….. 18 Libor Beránek, Rudolf Dvořák, Lucie Bačáková: Navrhování experimentů pro biomedicínský výzkum pomocí meod DOE ……………………………………………………….. 24 Radim Briš: Řešení vybraných modelů s obnovou ………………………………….. 30 Eliška Cézová: Metrologie v praxi ……………………………………………….……….. 43 Dana Černá, Václav Finěk: Diskrétní waveletová transformace, zhlazování a prahování ………. 53 Gejza Dohnal: Modely montážních linek ……………………………………………….. 76 Radim Flegl: Podnikové procesy a jejich spolehlivost ……………………………….. 86 Petra Halfarová, Milan Hutyra: Problematika zavádění statistických metod …………………….…….. 97 Václav Chmelík: Statistická analýza výroby a povlakování pístků ………………..….. 104 Josef Chudoba: Hodnocení přesnosti výsledků z metody FMECA ………………….. 114 Pavel Jahoda, Radim Briš: Korekce exponenciální analýzy při posuzování vhodnosti modelu morbidity ……………………………………………………….. 124 Ivan Janiga, Ivan Garaj: Použitie štatistických tolerančných intervalov v riadení kvality ..… 136
1
Eva Jarošová: Analýza experimentu pro robustní návrh …………………………….. 153 Zdeněk Karpíšek: Fuzzy-spolehlivost ……………………………………………………….. 164 Petr Kolář: MS Project jako nástroj pro analýzu spolehlivosti …………..……….. 178 Miroslav Koucký: Algebraický přístup k problematice výpočtu spolehlivosti sítí ……… 187 Jan Král, Josef Křepela: SW podpory při řešení projektů s aplikací statistických metod ..…… 197 Otakar Král: Význam systémového přístupu k projektu a zásady projektového řízení ……………………………………………..……….. 207 Karel Kupka: Kvalimetrie. Řízení a plánování jakosti pomocí NN a PLS metod. ……………………………………………….. 217 Aleš Linka, Maroš Tunák: Simulation and recognition of common fabric defects ……………….. 229 Aleš Linka, Maroš Tunák, Petr Volf: Stochastická simulace postupných deformací tkaniny ……………….. 239 Bohumil Maroš: Jaký je rozdíl rizika chyby zbytečného signálu v regulačním diagramu ………………………………………………………………….. 250 Martin Meca: Modelování doby mezi odchody zákazníků v systému PH/PH/1 …………………………………………….……….. 258 Jifií Michálek: Jak interpretovat ukazatele způsobilosti a výkonnosti
…………….... 265
Jiří Militký: Komplexní kriterium jakosti pro příze …………………………..…….. 275 Jakub Nedbálek: Analýza spolehlivosti tlakové nádoby metodou Monte Carlo ……… 292
2
Pavel Praks, Josef Chudoba, Radim Briš: Modelování spolehlivosti kompresorové stanice tranzitního plynovodu užitím spojitých markovských procesů ……………………………….………………………….……….. 299 Jan Adam Strouhal: Příklad použití klasifikačního stromu při hodnocení spolehlivosti software …………………………………………..……….. 317 Blanka Tomková: Využití predikce vlastností kompozitů s textilní výztuží pro optimalizaci výrobního procesu ……………………………………….. 323 Petr Volf: O modelu spolehlivosti s latentním procesem opotřebení ….……….. 331 Viktor Witkovský: Metódy výpočtu konfidenčných intervalov pre referenčnú hodnotu ………………………………………………………….….…….. 346 Jaroslav Zajíček: Zefektivnûní procesu RCM …………………………………………….. 368 Libor Žák: Využití expertního systému při odhadu vlastností výrobků ……….. 375
3
Sborník konference REQUEST'06
Konference REQUEST (REliability, Quality and ESTimation) se konala v Praze ve dnech 30.1. – 1.2. 2007 jako první konference Centra pro jakost a spolehlivost výroby (CQR). Toto centrum bylo vytvořeno na základě podpory Ministerstva školství, mládeže a tělovýchovy České republiky v rámci projektu pro rozvoj vědy a výzkumu číslo 1M06047. Členy CQR jsou: České vysoké učení technické v Praze, fakulta strojní, Vysoké učení technické v Brně, fakulta strojního inženýrství, Vysoká škola báňská – technická univerzita Ostrava, fakulty elektrotechniky a informatiky, metalurgie a materiálového inženýrství, Technická univerzita Liberec, fakulty textilní, pedagogická a fakulta mechatroniky a mezioborových inženýrských studií, Ústav teorie informace a automatizace Akademie věd České republiky, oddělení stochastické informatiky, firmy ISQ Praha s.r.o. a Trilobyte Statistical Software, s.r.o. Konference probíhala ve čtyřech sekcích: Management jakosti a statistické metody, Hodnocení jakosti, qualimetrie, metrologie, Modelování procesů ve spolehlivosti a Statistické metody pro řízení jakosti, hodnocení rizik. Příspěvky jsou ve sborníku řazeny abecedně podle jména autora. Součástí sborníku je CD-ROM, obsahující program konference a prezentace účastníků.
4
Využití logistické regrese pro hodnocení omaku Vladimír Bajzík
Úvod Jedním z primárních projevů textilií je omak. Jedná se o pocit, který vyvolá textilie při kontaktu s pokožkou. Je to integrální psychofyzikální vlastnost, jejíž hodnocení je obtížné. Vedle sady tzv. primárních vlastností ze kterých se hodnocení omaku skládá hraje také důležitou roli hodnotitel – jeho zkušenosti s hodnocením, psychické rozpoložení, zda se jedná o muže či ženu atd. Proto existuje snaha nahradit subjektivní hodnocení omaku objektivním, založeném na měření mechanických vlastností spojených s omakem, nezávislým na hodnotitelích. Nejrozšířenějším systémem, který se používá pro predikci je systém KES, který se velmi často také používá jako komparační metoda při vývoji nových postupů. Při hodnocení subjektivního omaku se nejčastěji používá stupnicová metoda. Princip spočívá v zařazování individuálních textilií do zvolené subjektivní stupnice - ordinální škály (např. 1-velmi špatný, 2-špatný, 3-dostačující, 4-průměrný, 5-dobrý, 6 - velmi dobrý, 7 – znamenitý). Je-li užití textilií exaktně specifikováno (např. pánské večerní oblekovky) je možné použít např. i tří stupňovou bodovou škálu (0 – horší omak, 1 – průměrný omak, 2 – lepší omak), popř. dvoustupňovou škálu (0 – špatný omak, 1 – dobrý omak). Data získaná subjektivním hodnocením omaku (zde celkový omak – THV) patří do ordinální škály, proto lze pro nalezení vztahu mezi THV a fyzikálně-mechanickými vlastnostmi a následnou predikci použít některý vícerozměrné techniky statistické analýzy dat jako jsou diskriminační analýza a logistická regrese.
1. Systém KES Systém KES je sada 4 přístrojů, které měří 15 charakteristik rozdělených do 5 skupin (tahové, smykové, ohybové, objemové, povrchové) v rozsazích simulující běžné namáhání oděvních textilií
5
Sborník konference REQUEST'06
při nošení. Systém KES byl vytvořen pro objektivní hodnocení omaku textilií, zejména tkanin. Umožňuje objektivně odhadnout celkové pocity většiny lidí při jejich přímém kontaktu s textilií. Šestnáctou charakteristikou, která se používá při predikci omaku je plošná hmotnost. Pro predikci omaku se používá těchto charakteristik: 1) Tahové charakteristiky: 1. LT – Linearita, WT - deformační energie, RT - pružnost 2) Ohybové charakteristiky: B - tuhost v ohybu na jednotku délky, HB - Moment hystereze na jednotku délky 3) Smykové charakteristiky: G - tuhost ve smyku, 2HG -hystereze při úhlu smyku φ =0,5°, 2HG5 - hystereze při úhlu smyku φ =5° 4) Objemové charakteristiky: LC: linearita, WC -energie potřebná ke stlačení, RC - pružnost 5) Povrchové charakteristiky: MIU - koeficient tření, MMD průměrná odchylka MIU, SMD - geometrická drsnost. 6) Geometrické charakteristiky: T – tloušťka, W – plošná hmotnost. Výpočet predikce probíhá ve 2 krocích. Nejprve se hodnoty standardizují a vypočtou se tzv. predikované primární složky omaku Yj 16
Y j = C 0 j + ∑ C ij i =1
Xi − Xi
σi
kde Xi je i-tá charakteristika nebo její desítkový logaritmus, X i a σi je průměr a směrodatná odchylka i-té charakteristiky, C0i a Cij regresní koeficienty i-té charakteristiky a j-tého primárního omaku. Hodnoty parametrů X i , σi, C0i a Cij se volí podle účelu použití textilií. Ve druhém kroku se vypočte objektivní hodnota celkového omaku
⎡ ⎛ Y j − M j1 ⎞ ⎛ Y j2 − M j 2 ⎟ ⎜ + C ′j 2 ⎜ THV = C 0′ + ∑ ⎢C ′j1 ⎟ ⎜ ⎜ σ ′j 2 ′ σ j =1 ⎢ j1 ⎠ ⎝ ⎣ ⎝ 3
⎞⎤ ⎟⎥ ⎟⎥ ⎠⎦
(THV) kde C0’, Cj1’, Cj2’ jsou regresní koeficienty, Mj1, Mj2, σj1, σj2 jsou průměry a směrodatné odchylky Y a Y2 a opět se volí podle účelu použití textilie. Pro konstrukci predikční rovnice byla použita stepwise regrese. V navrženém regresním modelu je použito 16 měřených charakteristik mezi kterými existují korelace.
6
V. Bajzík: Využití logistické regrese pro hodnocení omaku
2. Logistická regrese Logistická regrese byla vyvinuta jako alternativní metoda k metodě nejmenších čtverců pro případ, kdy závisle proměnná y je binární. V současné době ji však lze používat obecně pro závisle proměnnou pocházející z nominální nebo ordinální škály. Dá se použít i jako alternativa ke klasifikaci, kdy nejsou splněny předpoklady vícerozměrného normálního rozdělení. V případě binární proměnné logistická regrese předikuje pravděpodobnost dané události, která se buď stala (y=1) nebo nestala (y=0). Pro vytvoření vazební podmínky se používá logitová transformace, která vede k sigmoidálnímu vztahu mezi y a xi . Při predikci pomocí logistické regrese situace nastala v případě, že pravděpodobnost predikované události je větší 0,5, je-li menší událost nenastala. Při řešení logistické regrese se odhadují regresní koeficienty βi (i=1,2,…p) pomocí logitové transformace
⎛ π ( x) ⎞ ⎟⎟ = b0 + b1 x1 + b2 x 2 + ..... + b p x p , ln⎜⎜ ⎝ 1 − π ( x) ⎠ kde π(x) je pravděpodobnost, že situace nastala a 1- π(x) vyjadřuje pravděpodobnost, že situace nenastala, bi jsou odhady regresních koeficientů βi. 3. Experimentální část Pro konstrukci predikčního modelu pomocí logistické regrese bylo použito 49 tkanin pro pánské oblekovky. Každá tkanina byla subjektivně hodnocena pomocí panelu 20 respondentů pro potřeby logistické regrese do 2 třídy. První třída omak je špatný (y=0), druhá třída omak je dobrý (y=1). Výsledné zařazení textilie do dané třídy, bylo provedeno na základě převážného zařazení do třídy, tj. většina hodnotitelů hodnotila známkou 1, tkanina byla zařazena do druhé třídy (textilie má dobrý omak). Když hodnotila většina hodnotitelů známkou 0, byla textilie zařazena do první třídy (textilie má špatný omak). Objektivní hodnocení omaku bylo realizováno na systému KES, tj. u každé tkaniny bylo proměřeno 16 vlastností. Pomocí průzkumové analýzy dat, korelační matice a variability v datech bylo následně
7
Sborník konference REQUEST'06
vytipováno 10 vlastností pro tvorbu predikční rovnice. Mezi vytypovanými vlastnostmi byly WT, RT, B, G, 2HG, 2HG5, WC, MIU, MMD, SMD. Při konstrukci regresního modelu se testuje jednak významnost regresních koeficientů bi, jednak významnost jednotlivých proměnných xi pro predikci y. Pro testování významnosti regresních koeficientů bi lze použít Waldovo textační kriterium. 2
Wa ,i
⎛ b ⎞ = ⎜⎜ i ⎟⎟ , ⎝ s(bi ) ⎠
které má rozdělení χ2 s jedním stupněm volnosti. I když určit příspěvek jednotlivých proměnných v regresi, jelikož závisí na příspěvcích ostatních proměnných lze stanovit parciální korelaci Ri mezi jednotlivými závisle proměnnými a nezávisle proměnnou.
Ri = ±
Wa.i − 2df , − 2 ln L( 0 )
kde df je počet stupňů volnosti, který se týká počtu odhadovaných parametrů. L(0) je pravděpodobnost základního logistického modelu, který obsahuje pouze absolutní člen.
4. Výsledky Vzorky byly rozděleny do dvou skupin. První skupinu tvořilo 42 textilií a byly použity pro tvorbu modelu, druhá skupina, tj. 7 kusů bylo použito pro ověření funkčnosti nalezeného modelu. Výsledky konstrukce regresního modelu ukazují, že regresní koeficienty jsou většinou nad hladinou významnosti α=0,1. Největší vliv na THV mají proměnné WT, RT, B a SMD. Následující Tabulka II ukazuje počet správně a špatně zařazených objektů.
8
V. Bajzík: Využití logistické regrese pro hodnocení omaku
Proměnná
χ2
spočtená hladina významnosti
regresní koef.
odhad
Waldova statistika
spočtená hladina významnosti
Tabulka I. Odhady koeficientů a vliv jednotlivých proměnných
WT RT B G 2HG 2HG5 WC MIU MMD SMD
13,49 7,61 11,58 1,76 0,43 0,12 1,09 0,00042 0,046 13,01
0,0002 0,0058 0,0007 0,1843 0,5106 0,7248 0,2976 0,9836 0,8294 0,0003
b0 b1 b2 b3 B4 b5 b6 b7 b8 b9 b10
-29,53 -1,31 0,39 25,72 18,60 1,00 -5,47 42,81 74,06 224,8 -2,592
0,9753 1,5792 1,5934 0,3177 0,7882 0,0051 0,1937 1,4013 0,2601 1,7931 2,7495
0,3234 0,2089 0,2068 0,573 0,3747 0,9432 0,6599 0,2365 0,6101 0,1806 0,0973
Tabulka II. Klasifikace objektů – tvorba modelu Naměřené hodnoty omaku
Třída 1 Třída 2
Predikované hodnoty omaku
Třída 1 13 2
Třída 2 2 25
Procento správně zařazených objektů 86,67 92,59
Tabulka III. Klasifikace objektů – ověření modelu Naměřené hodnoty omaku
Třída 1 Třída 2
Predikované hodnoty omaku
Třída 1 2 0
Třída 2 0 5
9
Procento správně zařazených objektů 100 100
Sborník konference REQUEST'06
stupně volnosti 10
Tabulka IV. Přehled modelu χ2 spočtená hladina významnosti 49,13 0,0000
Z Tabulky II. a Obr. 1. Je zřejmé, že došlo k celkem uspokojivému proložení funkce daty. Těsnost proložení D=77,69% (obdoba R2 u lineární regrese). Hlubší analýza provedená s porovnáním výsledků ze subjektivního hodnocení omaku ukazuje, že většina textilií, které jsou modelem špatně fitovány jsou současně nejednoznačně zařazeny subjektivně. Tabulka III ukazuje, že ověřované textilie byly zařazeny všechny dobře. To ukazuje na dobrou účinnost modelu. Výsledky v tabulce IV. Ukazují, že model jako celek je na hladině významnosti α=0,05 statisticky významný.
Obr.1. Proložení modelu a rezidua.
Závěr V případě, že při hodnocení omaku je zapotřebí rozhodnout zda je omak dobrý nebo špatný, tj. je-li chápán jako binární proměnná, lze logistickou regresi považovat za vhodnou metodu pro konstrukci predikční rovnice.
10
V. Bajzík: Využití logistické regrese pro hodnocení omaku
Literatura [1] Bajzík, Vladimír. Predikce subjektivního hodnocení omaku pomocí vícerozměrných statistických metod. In Zajištění kvality analytických výsledků:Sborník přednášek ze semináře v Komorní Lhotce. 1. vydání. Český Těšín : 2 Theta. 2007. s. 94101. ISBN 80-86380-32-7 [2] Kawabata, Sueo. The Standardization and Analysis of Fabric Hand. 2nd. ed., The Textile Machinery Society of Japan, Osaka 1982 [3] Meloun, Milan; Miltký Jiří. Statistická analýza experimentálních dat. 1. vydání. Praha: Academia. 2004. ISBN 80-200-1254-0 Adresa autora: Ing. Vladimír Bajzík, Technická univerzita v Liberci, Fakulta textilní, Katedra textilních materiálů, Hálkova 6, 46117 Liberec. e-mail: Vladimí
[email protected] Tato práce byla vytvořena v rámci projektu MŠMT 1M06047 - CQR
11
Stanovení nejistot při výpočtu kontaminace zasaženého území Michal Balatka Abstrakt Hodnocení ekologického rizika kontaminovaných území představuje komplexní úlohu, která vyžaduje celou řadu vstupních dat. Mezi ně patří údaje o koncentračním poli, které popisují časoprostorový vývoj koncentrací škodlivin v jednotlivých složkách životního prostředí. Jednou z možností získání těchto údajů jsou výpočty prováděné pomocí simulačních modelů transportu látek v přírodním prostředí. Modely vyžadují velké množství často obtížně měřitelných vstupních parametrů, které jsou zatíženy určitou mírou nejistoty. Proto je třeba provádět postupně několik variantních výpočtů s různými skupinami hodnot vstupních parametrů. Výslednou hodnotu koncentrace látky např. v podzemní vodě v daném místě a čase je proto vhodnější vyjádřit jako spojitou náhodnou veličinou s příslušným typem rozdělení pravděpodobnosti. Jednu z možností, jak zjistit parametry tohoto rozdělení, nabízí vyvinutý algoritmus, který je založen na simulační metodě Monte-Carlo. Popis s příkladem nasazení tohoto algoritmu představuje náplň tohoto příspěvku.
Úvod Dlouhodobý (chronický) únik nebezpečných látek do životního prostředí, může představovat riziko pro zdraví člověka i ekosystémů. Zdroje těchto úniků nejčastěji představují například pozůstatky po důlní činnosti, skládky všech možných typů, průmyslové areály, bývalé vojenské prostory, atd. Jedny z důležitých podkladů k hodnocení rizika představují údaje o rozmístění koncentrací škodlivin v jednotlivých složkách životního prostředí, které se v zasaženém území vyskytují. Soubor takových dat pro celou plochu označujeme jako koncentrační pole. Na rozdíl od rizik akutních spojených většinou s průmyslovými či dopravními haváriemi nebo živelnými pohromami, se následky neprojevují okamžitě, ale dlouhodobě v řádu let i několika desetiletí. Protože se
12
M. Balatka: Stanovení nejistot při výpočtu kontaminace zasaženého území
za tuto dobu kontaminace pohybuje, je vhodné znát také časový vývoj koncentračního pole. Klíčové médium, v kterém se dlouhodobě unikající látky často pohybují představuje podzemní voda. Pro predikci vývoje koncentrací nebezpečných látek v podzemní vodě dnes existuje celá řada počítačových modelů, založených nejčastěji na numerických metodách konečných diferencí nebo konečných prvků. Představme si 3D model horninového prostředí založený na metodě konečných prvků, který je určen pro výpočet vývoje pohybu kontaminace v podzemní vodě. Takový model je složen z poměrně podrobných údajů tří základních skupin dat. První skupinu tvoří údaje o hydraulických vlastnostech hornin, druhou počáteční a okrajové podmínky proudění podzemní vody a třetí skupinu tvoří okrajové a počáteční podmínky pro transport látek v podzemní vodě. Všechny tyto typy parametrů se získávají velmi obtížně. Provádějí se pomocí metod jako jsou laboratorní měření na vzorcích získaných z průzkumných vrtů, fyzikální měření přímo v terénu, ze znalostí o stavbě geologického podloží celého regionu. Získávání těchto dat je technicky velmi obtížné a finančně velmi nákladné. Typický problém představuje i vysoká variabilita horninového prostředí, která velmi často roste směrem k zemskému povrchu. Například propustnost horniny naměřená v jednom místě, se tak může o několik metrů dále lišit o jeden řád i více. Převážná většina parametrů modelu horninového prostředí se získává pomocí nejrůznějších sofistikovaných odhadů. Výsledky výpočtů těchto modelů jsou potom vždy zatíženy většími či menšími nejistotami.
Zpracování nejistot Výsledek výpočtu představuje koncentrační pole, které poskytuje údaje o koncentracích sledovaných látek v daných místech a časech. Nejistoty těchto koncentrací se zpravidla omezují analýzou citlivosti, pomocí které se zjistí ty vstupní parametry modelu, na jejichž změny koncentrační pole v zájmových místech i časech reaguje velmi citlivě. Těmto parametrům je potom při určování jejich hodnot věnována zvýšená pozornost. Parametry modelu horninového prostředí, který je určen k výpočtu transportu látek ve vodě, lze také přímo vyjádřit stochasticky pomocí náhodných veličin s předepsaným rozdělením pravděpodobnosti. Hustotou pravděpodobnosti zde můžeme rozumět vyjádření míry
13
Sborník konference REQUEST'06
věrohodnosti pro jednotlivé hodnoty takto vyjádřeného konkrétního parametru. Výsledné koncentrace jsou v tomto případě opět vyjádřeny jako náhodné veličiny s danými rozděleními pravděpodobností. Parametry těchto rozdělení se v praxi určují numericky pomocí simulace Monte-Carlo. Stochasticky vyjádřené parametry představují n-tici, pro kterou se provede veliké množství náhodných výběrů. Pro každou tuto n-tici se provede výpočet koncentračního pole. Pro každé místo a čas tak získáme velké množství náhodně vybraných hodnot koncentrací, z kterých lze vypočítat přibližné parametry jejich rozdělení s dostatečnou přesností. Tato metoda je velmi intuitivní a dostatečně obecná. Má však dvě podstatná omezení. První omezení spočívá ve skutečnosti, že hodnoty v rámci jedné n-tice vstupních parametrů jsou vybírány nezávisle na sobě. Pokud se například provede náhodný výběr celkové pórovitosti horninového prostředí 31%, musí se výběr aktivní pórovitosti (pórový prostor se dělí na aktivní a neaktivní póry) již řídit hodnotou 31%, tak aby ji nepřekročil. Druhé omezení spočívá v nárocích na výpočetní techniku. Každá vybraná n-tice vstupních parametrů modelu představuje samostatný výpočet koncentračního pole. U menších modelů tyto výpočty mohou trvat několik minut, u větších až několik hodin nebo dokonce dnů. Dostatečně velké množství vybraných n-tic se přitom řádově musí pohybovat minimálně v tisících. Jako příklad využití této metody může sloužit článek v literatuře [1].
Nejistoty pomocí variant modelů jako celků V následujícím přístupu hodnocení nejistot se navrhne několik variant modelu horninového prostředí (hodnoty parametrů horninového prostředí, počáteční a okrajové podmínky podzemního proudění a transportu). Každá z těchto variant představuje samostatný model, jehož parametry jsou dány a nijak se již dále z hlediska analýzy nejistot neupravují. Každé variantě je dále nutno přiřadit bodové hodnocení podle toho, jak moc se jeví věrohodná. Čím je přitom hodnota sledované varianty oproti hodnocení ostatních variant větší, tím větší je i její věrohodnost. K dispozici jsou tedy varianty modelu horninového prostředí s hodnotami vyjadřujícími jejich věrohodnost. Ohodnocené varianty
14
M. Balatka: Stanovení nejistot při výpočtu kontaminace zasaženého území
představují výchozí vstupy do algoritmu, jehož výsledkem by opět měly být parametry spojitých rozdělení náhodných veličin pro koncentrace v daných místech a časech. Algoritmus popisuje blokové schéma na obrázku č. 1.
Obr. 1: Blokové schéma algoritmu pro výpočet nejistot koncentrace Prvním krokem při výpočtu nejistot je stanovení pravděpodobností výskytu pro jednotlivé varianty, které v tomto smyslu představují úplný prostor disjunktních jevů. Tyto pravděpodobnosti se získají z bodového hodnocení variant jako: pravděpodobnost varianty = body varianty / suma bodů všech variant. Tímto krokem vznikne diskrétní rozdělení, z kterého se mohou provádět simulované náhodné výběry. V daných místech a časech nám tak vycházejí koncentrace v závislosti na vybrané variantě. Nejedná se samozřejmě o koncentrace libovolné. Stále se zde opakují izolované hodnoty, z nichž každá odpovídá jedné z vybíraných variant modelu podzemí. Tím by byly nejistoty koncentrací ve sledovaných místech popsány pomocí diskrétních náhodných veličin, což není zcela korektní přístup, protože koncentrace je veličina spojitá. Této skutečnosti lze dosáhnou v dalším kroku. V dosud popsaných krocích byl tedy simulován náhodný výběr jedné z variant modelu podzemí a byla tak získána hodnota koncentrace nebezpečné látky pro sledované místo. I v rámci jedné varianty však existuje celá řada nejistot, které by bylo možno vyjádřit dalšími „sub-variantami“. To by však bylo velmi náročné a nepraktické. Tyto sub-varianty lze však pro sledovaná místa nahradit například logaritmicko-normálním rozdělením koncentra-ce.
15
Sborník konference REQUEST'06
Hodnota koncentrace vypočtená pro danou variantu pak představuje modus (nejvíce předpokládanou hodnotu). Druhý parametr rozdělení představuje rozptyl určený z rozptylu rozdělení variant. Logaritmicko-normální rozdělení je vhodné zejména proto, že náhodná veličina může stejně jako u koncentrace nabývat kladných hodnot. V případě nuly se předpokládá, že teoreticky nikdy koncentrace škodlivé látky nedosáhne na zasaženém území nulové hodnoty. Z tohoto rozdělení pro určené místo a čas se opět simuluje výběr náhodné koncentrace. Výše uvedené kroky je třeba zopakovat v dostatečně velkém počtu. Z výsledných náhodných koncentrací se potom opět provede odhad parametrů rozdělení. Pro účely hodnocení rizik se jedná hlavně o kvantity, které popisují, s jakou pravděpodobností nastane překročení stanovených limitů. Na rozdíl od metody výpočtu nejistot uvedené v předchozí kapitole, zde odpadá velké množství výpočtů na modelech. Pro každou variantu, kterých v praxi může být několik jednotek maximálně desítek, se provede pouze jeden výpočet. Při opakovaném výběru dané varianty modelu je již příslušné koncentrační pole k dispozici. Protože jednotlivé varianty modelu představují z hlediska algoritmu uzavřenou skupinu parametrů, do kterých se nezasahuje, nejsou hodnoty parametrů vybírány nezávisle na sobě. Každá varianta se při simulaci vybírá jako jeden celek.
Obrázek č. 2: Ukázka výpočtu nejistot koncentrace v určitém místě Graf na obrázku č. 2 demonstruje výpočet nejistoty koncentrace v konkrétním místě. Obrázek 2 a) popisuje bodové hodnocení
16
M. Balatka: Stanovení nejistot při výpočtu kontaminace zasaženého území
věrohodnosti šesti variant, kterým v tomto místě vycházejí příslušné koncentrace. Na obrázku 2 b) je histogram sestavený z dostatečně velkého množství výpočtů podle výše popsaného algoritmu. Z těchto hodnot se potom určí parametry rozdělení výsledné koncentrace, které jsou uvedeny v tabulce: Parametr Pravděpodobnost překročení limitu 30 mg/l Medián 95% kvantil
Hodnota 73% 44 mg/l 120 mg/l
Závěr Tento článek popisuje principy výpočtu nejistot, které budou implementovány ve vyvíjeném softwarovém prostředku určeném k hodnocení ekologických rizik v lokalitách postižených dlouhodobými úniky nebezpečných látek. Způsob výpočtu nejistot založený na ohodnocených variantách modelu horninového prostředí byl navržen s ohledem na poznatky z oblasti tvorby těchto modelů. Konečná podoba algoritmu není ještě zcela uzavřená. K možným změnám by mohlo v blízké budoucnosti dojít při řešení větších praktických úloh. Literatura [1] Balatka M.: Nalezení efektivního způsobu čištění vrstev s nízkou propustností, Konference Sanační technologie IX, Vodní zdroje EKOMONITOR s.r.o., Luhačovice 2006, ISBN 80-86832-20-1 Adresa autora: Ing. Michal Balatka, Fakulta mechatroniky a mezioborových inženýrských studií, Technická univerzita v Liberci, Hálkova 6, 461 17 Liberec Email:
[email protected] Tato práce byla vytvořena v rámci projektu MŠMT 1M06047 - CQR
17
MSA-Analýza systému měření Josef Bednář Abstrakt: V příspěvku je popsáno provedení analýzy systému měření v technické praxi pro spojitá data. Je zde popsáno provedení R&R studie pomocí analýzy rozptylu a dalších statistických nástrojů. K provedení výše uvedených analýz byl použit statistický software Minitab. Článek je součástí řešení projektu MŠMT České republiky čís. 1M06047 Centrum pro jakost a spolehlivost ve výrobě. 1. Úvod V technické praxi často narážíme na otázku, zda lze naměřeným hodnotám věřit, zda nám popisují skutečný proces nebo zda dochází k významnému zkreslení hodnot systémem měření. Matematicky zapsáno, celková variabilita zaznamenaných dat je součtem variability procesu a variability systému měření
σ T2 = σ 2p + σ m2 . Při zkoumání systému měření narážíme na dva problémy: a) Variabilita systému měření - R&R studie •
Opakovatelnost - variabilita výsledků měření vyprodukovaná jedním měřícím přístrojem, použitým opakovaně jedním hodnotitelem měřícím jednu identickou charakteristiku na stejném výrobku
•
Reprodukovatelnost - variabilita v průměrech měření provedených různými hodnotiteli za pomocí stejného měřícího přístroje pro měření stejné charakteristiky na stejném výrobku (pokud máme více měřidel, můžeme hovořit o reprodukovatelnosti měřidel – místo operátora měníme měřidla.
b) Poloha výsledků – studie linearity a strannosti (srovnání s etalony nebo o řád přesnějšími měřidly) •
Přesnost – strannost (vychýlení) - rozdíl mezi napozorovaným průměrem a referenční hodnotou
18
J. Bednář: MSA - Analýza systému měření
•
Stabilita - celková variabilita v měřeních získaná měřícím systémem na stejném normálu nebo při měření jediné charakteristiky v delším časovém úseku.
•
Linearita - rozdíl mezi hodnotami strannosti v předpokládaném pracovním rozsahu měřidla.
2. R&R studie Studie reprodukovatelnosti a opakovatelnosti měřidla umožňuje stanovit, kolik pozorované variability procesu vzniká v důsledku variability systému měření tuto variabilitu dále klasifikuje (obr.1.). Celková variabilita
Proces
Systém měření
Variabilita měřícího zařízení
Variabilita operátora
Opakovatelnost
Reprodukovatelnost Operátor
Interakce Operátor*Vzorek
Obr. 1: Rozdělení celkové variability zaznamenaných dat Nejčastěji se používají následující dvě charakteristiky:
%R & R =
smesurement system stotal
- srovnání variability systému měření
s celkovou variabilitou,
P /T =
6.smesurement system USL − LSL
- srovnání variability systému měření
s tolerančním rozpětím.
19
Sborník konference REQUEST'06
Obecné směrnice pro výše uvedené charakteristiky: R&R% resp. P/T < 10% - systém měření je přípustný vzhledem k procesu resp. tolerančnímu rozpětí 10% < R&R% resp. P/T < 30% - systém měření je podmíněně přípustný vzhledem k procesu resp. tolerančnímu rozpětí, závisí na poměru ceny nápravy a významnosti sledované veličiny. R&R% resp. P/T > 30% - systém měření není přípustný vzhledem k procesu resp. tolerančnímu rozpětí. Provedení R&R studie v Minitabu 14.2 ilustruje následující příklad.
3. Příklad R&R studie Provedeme R&R studii pro 10 výrobků, 3 operátory a 3 pokusy (tři různí operátoři měří 10 stejných výrobku, které reprezentují proces celý pokus opakujeme 3-krát (obr. 2). Doporučuje se, aby pokus proběhl v provozních podmínkách a operátoři nevěděli, že probíhá nějaký pokus. Gage Run Chart of Measurement by Part, Operator Reported by : Tolerance: Misc:
Gage name: Date of study :
1
2
4
3
5 2
Measurem ent
Mean
0
-2
6
7
9
8
10
2
0
Mean
-2
Operator
Panel variable: Part
Obr.2: Průběhový diagram
20
Operator A B C
J. Bednář: MSA - Analýza systému měření
Průběhový diagram napoví, ale analýza odpoví. Gage R&R Study - ANOVA Method Two-Way ANOVA Table With Interaction Source Part Operator Part*Operator Repeatability Total
DF 9 2 18 60 89
SS 88,3619 3,1673 0,3590 2,7589 94,6471
MS 9,81799 1,58363 0,01994 0,04598
F 492,291 79,406 0,434
P 0,000 0,000 0,974
F 245,614 39,617
P 0,000 0,000
Alpha to remove interaction term = 0,25
Two-Way ANOVA Table Without Interaction Source Part Operator Repeatability Total
DF 9 2 78 89
SS 88,3619 3,1673 3,1179 94,6471
MS 9,81799 1,58363 0,03997
Pozitivní je, že je významný faktor vzorek, ale špatné je že je významná opakovatelnost i reprodukovatelnost (faktor operátor). Interakci Part*Operator systém odstranil protože je nevýznamná. Nyní vypočítáme charakteristiky variability Gage R&R Source Total Gage R&R Repeatability Reproducibility Operator Part-To-Part Total Variation
VarComp 0,09143 0,03997 0,05146 0,05146 1,08645 1,17788
%Contribution (of VarComp) 7,76 3,39 4,37 4,37 92,24 100,00
Process tolerance = 4
21
Sborník konference REQUEST'06
%R&R od 10% do 30% systém měření může být přípustný ke sledování procesu, závisí to na aplikaci, ceně měřidla, nákladech na nápravu atd.
Study Var Source StdDev (SD) (6 * SD) Total Gage R&R 0,30237 1,81423 Repeatability 0,19993 1,19960 Reproducibility 0,22684 1,36103 Operator 0,22684 1,36103 Part-To-Part 1,04233 6,25396 Total Variation 1,08530 6,51180
%Study Var %Tolerance (%SV) (SV/Toler) 27,86 45,36 18,42 29,99 20,90 34,03 20,90 34,03 96,04 156,35 100,00 162,79
Number of Distinct Categories = 4
Počet rozdílných kategorii výrobků, které systém měření rozezná v procesu
P/T nad 30% nemá být použito ke sledování požadavku zákazníka
Gage R&R (ANOVA) for Measurement Reported by : Tolerance: Misc:
Gage name: Date of study : Components of Variation
Measurement by Part
Percent
160
% Contribution
2
% Study Var % Toleranc e
0
80
0
-2
Gage R&R
Repeat
Reprod
1
Part-to-Part
2
3
Sample Range
A
B
LCL=0
B
A
B Operator
10
C
2
_ _ UCL=0,351 X=0,001 LCL=-0,348
Av erage
Sample Mean
9
Operator * Part Interaction
C
2
0
8
-2
Xbar Chart by Operator A
7
0
_ R=0,342
0,0
6
2
UCL=0,880
0,5
5
Measurement by Operator
C
1,0
4
Part
R Chart by Operator
Operator A B C
0
-2
-2
1
2
3
4
5 6 Part
7
8
9
Obr. 3: Dodatečný grafický výstup k R&R studii
22
10
J. Bednář: MSA - Analýza systému měření
Závěr příkladu Variabilita systému měření je vzhledem k procesu podmíněně způsobila,ale vzhledem k požadavkům zákazníka je nezpůsobilá. Opakovatelnost a reprodukovatelnost je zhruba stejná. 4. Závěr Na konkrétním příkladu jsme si ukázali, že variabilitu systému měření je schopný s použitím statistického software ověřit i člověk, který se statistice nevěnuje. Dokonce, pokud má zájem, může získat i další užitečné informace o systému měření.
Literatura [1] [2] [3]
Meloun M., Militký J.: Kompendium statistického zpracování dat. Academica, Praha, 2002 Minitab User‘s Guide 2: Data Analysis and Quality tools. USA, 2000. Juran J. M.: Juran's Quality Control Handbook. McGraw-Hill, 1988.
Adresa autora: Ing. Josef Bednář, Ph.D., Vysoké učení technické v Brně, Fakulta strojního inženýrství, Ústav matematiky, Technická 2896/2, 616 69 Brno e-mail:
[email protected]
Tato práce byla vytvořena v rámci projektu MŠMT 1M06047 - CQR
23
Navrhování experimentů pro biomedicínský výzkum pomocí metod DOE Libor Beránek, Rudolf Dvořák, Lucie Bačáková Abstrakt V minulých desetiletích se v medicíně rozšířilo použití umělých materiálů, ať už v orthopedii, zubní či rekonstrukční chirurgii. Jedním z řady potenciálních materiálů uvažovaných pro tato použití je i uhlíkový kompozit CFRC. Uhlíkové kompozity jsou však náchylné k uvolňování částic uhlíkového materiálu do okolního prostředí, které se mohou kumulovat v tkáních a poškodit je. Dalším faktorem ovlivňujícím proliferaci buněk může být i jejich doménové uspořádání. Proto bylo rozhodnuto, že za pomoci statistických metod DOE bude navržen experiment, který má zhodnotit vliv a přínos různých zpracování povrchu, na biokompatibilitu tohoto kompozitního materiálu. Adhese a proliferace buněk jsou obvykle ovlivňovány morfologií povrchu, popsanou například drsností povrchu. Pro možnost využití umělých materiálů jako biomateriálů je potřeba pochopit vliv drsnosti a jiných faktorů ovlivňujících vlastnosti povrchu na biokompatibilitu daného materiálu. Klíčová slova: DOE, navrhování experimentů, CFRC, PACVD Úvod Kompozitní materiály, například kompozity s uhlíkovou či polymerní matricí vyztuženou uhlíkovými vlákny, jsou považovány za perspektivní pro konstrukci kostních a kloubních náhrad, kostních implantátů, pomůcek pro osteosyntézu i kostních fixací. Jejich nevýhodou však často bývají povrchové fyzikální a chemické vlastnosti méně vhodné pro adhesi buněk a následnou integraci implantátu do okolní kostní tkáně, jako je například nevhodná povrchová topografie materiálu, vysoká hydrofobicita apod.
24
L. Beránek a kol.: Navrhování experimentů pro biomedicínský výzkum
Uhlíkové kompozity jsou navíc náchylné k uvolňování částic uhlíkového materiálu do okolního prostředí, které se mohou kumulovat v okolních tkáních a poškodit je. Proto je důležitým odvětvím konstrukce materiálů pro dlouhodobou implantaci do lidského organismu povrchová úprava těchto materiálů, například broušením, leštěním a pokrýváním mechanicky odolnými biokompatibilními vrstvami.
Biokompatibilní materiál Aby mohl být materiál považován za biokompatibilní měl by mít podobné mechanické vlastnosti jako okolní materiál a nedocházelo tak k aseptické nekróze. Dále nesmí uvolňovat žádné toxické nebo kancerogenní částice a musí splňovat požadovanou interakci s buňkami, tedy mohou být inertní anebo mohou podporovat adhesi v závislosti na jejich zamýšleném použití (např. čočky, klouby vs. cévy, kosti).
Kompozitní materiál Carbon-Fiber Reinforced Carbon CFRC byl připraven v Ústavu struktury a mechaniky hornin AVČR (pí Křížková, ing. Gregor) z komerčně dostupné uhlíkové tkaniny (Toray T 800) infiltrované prekursorem uhlíkové matrice (fenolická pryskyřice UMAFORM LE, Synpo a. s., Pardubice). Materiál byl karbonizován při 1000oC a grafitizován při 2200oC. Na konci výrobního procesu tedy obdržíme materiál, jehož chemické složení je téměř 100% C. Mechanické vlastnosti mohou být modifikovány ve velkém rozsahu, použitím různých typů tkaní a počtem vrstev. Návrh experimentu Po důkladném rozboru situace byl navržen statistický experiment, který v sobě zahrnuje tři faktory a každý faktor se třemi úrovněmi neboli verzemi. Jedná se o úplný návrh typu 33, tedy návrh obsahuje celkem 27 jednotlivých běhů, které pokrývají všechny možné kombinace jednotlivých verzí faktorů. Dále bylo rozhodnuto z důvodu získání odhadu všech možných interakcí mezi faktory,
25
Sborník konference REQUEST'06
uvažovat dvě replikace návrhu, tj. celkem 54 běhů. Jedná se tedy o celkem komplikovaný návrh, ale jeho provedení nám poskytne velice důkladnou informaci o vlivu jednotlivých faktorů. Zvolené faktory jsou Faktor A – opracování povrchu - úrovně: − neopracovaný povrch − opracování pomocí laseru − opracování broušením Faktor B – perforace laserem - úrovně: − bez perforace − kombinace I (0,1;0,2;0,3) (průměr, hloubka, rozteč) − kombinace II (0,4;0,8;1,2) Faktor C – deponovaná ochranná vrstva – úrovně: − bez vrstvy − DLC při předpětí -50V − DLC při předpětí -100V Celkem tedy bylo připraveno 54 destiček (9x9 mm) s odpovídající úpravou povrchu podle plánu experimentu. Jako „response“ budou sloužit hodnoty počtů buněk třetí den po nasazení a jejich plocha.
Měření drsnosti povrchu Měření bylo prováděno na profiloměru Taylor- Hobson Talysurf 6 bez použití kluzné bodky. Měření bylo provedeno na každém z 54 vzorků v 6ti řezech (3 rovnoběžné řezy ve 2 na sebe navzájem kolmých směrech). Byly sledovány následující parametry Ra, Rq, Ry, Rtm, Rv, Rp, Sm, DELQ, Rsk, Rku, S, R3z, Rpm, R3y včetně jejich výběrových směrodatných odchylek. Což nám poskytuje veliké množství dat, které budeme analyzovat ve fázi statistického vyhodnocování experimentu.
26
L. Beránek a kol.: Navrhování experimentů pro biomedicínský výzkum
[µm], bezrozměrné
Vliv opracování povrchu na vybrané ukazatele 70 60 50 40 30 20 10 0 Ra -10
Rq
Ry
Neupravované vzorky
Rtm Broušené
Rsk Laserované
Rku vybrané ukazatele
Graf 1. Vliv opracování povrchu na vybrané ukazatele Vybrané modifikace povrchu
Obr.1 broušený povrch
Obr. 3 broušený + perforace 1+ DLC 2
Obr.2 laserovaný povrch
Obr. 4 broušený + perforace 2 +DLC 2
27
Sborník konference REQUEST'06
Obr. 5 laserovaný + perforace 2
Obr. 6 laserovaný + perforace 2
První čtyři snímky byly pořízeny na dílenském mikroskopu vybaveném CCD kamerou při 40ti násobném zvětšení. Snímky 5 a 6 byly pořízeny na elektronovém řádkovacím mikroskopu při zvětšení 35x resp. 150x. Závěr Momentálně jsou vzorky spolu s plánem experimentu ve Fyziologickém ústavu AV ČR, kde na nich bude provedena kultivace a následné vyhodnocení počtů a ploch buněk. Údaje poté budou podrobeny statistické anylýze, za účelem určení rohodujících faktorů, které mají nejvýraznější vliv na růst buněk. Dále bude určena optimální varianta opracování povrchu kompozitního materiálu. Literatura [1] Bačáková L., Nosková L., Filová E., Švorčík V., Koutná E., Starý V., Horník J., Glogar P.: Adhese cévních a kostních buněk na umělé materiály vyvíjené pro tkáňové inženýrství (Adhesion of vascular and bone cells on synthetic materials developed for tissue engineering), Československý časopis pro fyziku 56: 74-79, 2006 [2] Bačáková L: Tkáňové inženýrství – nový trend v současné medicíně a biotechnologiích. Předneseno na akci Týden vědy a techniky, 6.-12. 11. 2006, Praha
28
L. Beránek a kol.: Navrhování experimentů pro biomedicínský výzkum
Adresy autorů: Ing. Libor Beránek, České vysoké učení technické v Praze, fakulta strojní, Ústav strojírenské technologie, Technická 4, 160 00 Praha 6. e-mail:
[email protected] Doc.Ing. Rudolf Dvořák, CSc., České vysoké učení technické v Praze, fakulta strojní, Ústav strojírenské technologie, Technická 4, 160 00 Praha 6. e-mail:
[email protected] MUDr. Lucie Bačáková, CSc., Fyziologický ústav AV ČR. Videnska 1083, 142 20 Praha 4 - Krč e-mail:
[email protected] Tato práce byla vytvořena za podpory projektu MŠMT 1M06047 - CQR
29
Řešení vybraných modelů s obnovou Radim Briš
1. Úvod Při řadě inženýrských výpočtů spolehlivosti je nezbytné správně posoudit vliv výměn či obnov prvku na jeho spolehlivost v průběhu nějakého zadaného období. Aby provozovatel složitého zařízení mohl správně a včas rozhodnout, kdy prvek vyměnit nebo jak ho udržovat při procesech stárnutí, je potřeba znát chování spolehlivostních charakteristik v závislosti na těchto zásazích. Tento příspěvek se zabývá generací a popisem základních matematických modelů s obnovou, které jsou ve vybraných případech vyřešeny. Hlavní část příspěvku je koncentrována v kapitole 3, která demonstruje užití Laplaceovy transformace na známém Poissonově procesu, dále rozšíření tohoto postupu na obecnější situaci, kdy doba do poruchy je modelována Gamma rozdělením. Modely pro stárnutí jsou dále reprezentovány Weibullovým rozdělením, kde funkce obnovy je odhadnuta numericky pomocí diskrétní Fourierovy transformace. Podkapitola 3.2 přináší popis různých modelů s údržbou, z nichž je detailně rozpracován a vyřešen model s periodickými výměnami. Tento model je dále v závěru zobecněn na praktičtější model s periodickými prohlídkami s částečnou obnovou. 2. Proces obnovy Jestliže X1, X2, … jsou nezávislé nezáporné stejně rozdělené náhodné veličiny s konečnou střední hodnotou a rozptylem, n
S 0 = 0, S n = ∑ X i , n ∈ N , i =1
potom náhodný proces {S n }n =0 je v teorii obnovy nazván procesem obnovy. Někdy se takto označuje také přímo posloupnost uvedených náhodných veličin {Xn}∞n=0. V případě, kdy rozdělení doby do poruchy je exponenciální, jedná se o Poissonův proces. Funkcí Fn (t) se značí distribuční funkce náhodné veličiny Sn. S procesem obnovy je také spojeno několik dalších náhodných proměnných, jež charakterizují jeho chování (v čase). Pro pevné t ≥ 0, dáno jako počet obnov v intervalu [0,t], tedy ∞
N t = max {n : S n p t }
30
R. Briš: Řešení vybraných modelů s obnovou.
Z toho také vyplývá, že SNt ≤ t < SNt+1. Vzhledem k tomu, že v intervalu [0,t] dojde k n poruchám (a zároveň také k obnovám) jedině tehdy, jestliže k n-té poruše došlo nejpozději v čase t, je
P{N t ≥ n} = P{S n p t } = Fn (t ). Pravděpodobnost, že v čase t došlo v daném procesu obnovy právě k n obnovám je dána vztahem
P{N t = n} = P{S n p t ∧ S n +1 ≥ t } = Fn (t )[1 − Fn +1 (t ) ] = Fn (t ) − Fn +1 (t ) Jestliže Nt, t ≤ 0 udává počet obnov v intervalu [0,t], pak funkce
H (t ) = EN t , t ≥ 0
je nazývána funkcí obnovy. Jak je patrné, udává střední počet obnov v intervalu [0,t]. Střední počet obnov v intervalu [t1, t2], 0< t1< t2 lze poté vyčíslit z rozdílu H(t1) – H(t2), neboť počet obnov v tomto intervalu je Nt2 – Nt1. Funkci obnovy lze také ekvivalentně vyjádřit z distribučních funkcí Fn(t) náhodných veličin Sn: ∞
∞
n =0
n =1
H (t ) = ∑ nP ( N t = n ) = ∑ n[Fn (t ) − Fn +1 (t )] ∞
= ∑ Fn (t )
(1) ( 2)
n =1
Pro výpočet funkce obnovy H(t) je důležitá rovnice obnovy, jež poskytuje vzájemně jednoznačný vztah mezi distribuční funkcí doby do obnovy a funkcí obnovy: jestliže distribuční funkce doby do obnovy F(t) je spojitá, pak funkce obnovy H(t) vyhovuje integrální rovnici t
H (t ) = F (t ) + ∫ H (t − u ) F (u ) du . 0
Tuto rovnici lze jednoduše odvodit z rovnice 2 pomocí její integrální transformace (např. Laplaceovy). Existuje-li derivace funkce obnovy, pak tato se nazývá hustota obnovy. Pro ni můžeme s pomocí hustoty fn(t) = F’n(t) napsat: ∞
h (t ) = ∑ f n (t ). n =1
Hustota obnovy splňuje následující integrální rovnici (3), t
h (t ) = f (t ) + ∫ h (t − u ) f (u ) du , 0
což je tzv. rovnice obnovy pro hustotu obnovy.
31
(3)
Sborník konference REQUEST'06
Slovně lze rovnici popsat také přibližně tak, že pro ∆t→0 pravděpodobnost obnovy h(t)∆t v intervalu (t, t + ∆t] je rovno součtu pravděpodobností f(t) ∆t, že v intervalu (t, t + ∆t] dojde k první obnově a součtu pravděpodobnosti že dojde ∀u ∈ (0, t ) k obnově v t – u následované dobou do poruchy délky u. 3. Modely s obnovou Následující část je věnována konkrétním modelům, jimiž lze matematicky popsat chování zařízení (komponent), které jsou určitým způsobem udržovány za účelem například maximální využitelnosti. 3.1 Modely se zanedbatelnou dobou obnovy V některých případech lze uvažovat nulovou dobu do obnovy. Jedním z takových případů je model, v němž dobou do poruchy (náhodnou veličinou) je počet ujetých kilometrů, počet výrobků, či jinak podobně. Druhou skupinou jsou případy, kdy doba do obnovy je „podstatně menší než“ doba do poruchy a její zahrnutí do modelů by zřetelně neovlivnilo očekávaný výsledek. 3.1.1 Poissonův proces Poissonův proces je jednoduše definován exponenciálním rozdělením doby do poruchy X, tedy f (t ) = λ e − λt ; t ≥ 0, λ f 0 Pak intenzita poruch r(t) = λ = konst. je konstantní a zároveň pravděpodobnost obnovy v intervalu (t, t + ∆t), t ≥ 0 je rovna λ∆t + o(∆t), kde o(∆t) je rovna pravděpodobnosti více než jedné obnovy v (t, t + ∆t) a výskyt obnovy v tomto intervalu není závislý na historii procesu před časem t. Distribuční funkce doby do n-té obnovy poruchy do Fn (t), n=1,2,… je Erlangova typu, neboť se jedná o součet n nezávislých náhodných veličin s exponenciálním rozdělením. K tomu lze také dojít např. pomocí Laplaceovy transformace. Nechť f(t) = λ e –λt je hustota pravděpodobnosti doby do poruchy. Její obraz je roven: ∞
f ( s ) = ∫ λ e −( s + λ ) t dt = *
0
λ
s+λ
32
,
s ∈ C , Re( s ) f −λ .
R. Briš: Řešení vybraných modelů s obnovou.
Vzhledem k tomu, že hustota pravděpodobnosti doby do n-té obnovy je nnásobná konvoluce
f n (t ) = f (t ) ∗ f (t ) ∗ ... ∗ f (t ), je její Laplaceův obraz roven
λn f (s) = (s + λ ) a * n
Nyní fn (t) jako inverzní Laplaceův obraz k funkci fn* (s), lze vypočíst jednoduše například pomocí reziduální věty (funkce fn* (s) má jeden nnásobný pól v bodě –λ, je analytická pro Re (s) > –λ.
f n (t ) = =
c + i∞
1 f n* ( s )e st ds = Re s f n* ( s )e st 2πi c −∫i∞
s=− λ
λ (λ t ) n −1 e −λt ( n − 1)! k −1
Fn (t ) = 1 − ∑ e −λt j =0
(λ t ) j j!
t≥0
Funkci obnovy lze vypočíst také následujícím způsobem: Pravděpodobnost, že v intervalu [0, t] dojde k n-poruchám je rovna P(Nt = n) = Fn (t) – Fn+1 (t), to jest n −1
P ( N t = n ) = 1 − ∑ e − λt j =0
n ( λt ) n − λt ( λt ) j ( λt ) j )= − (1 − ∑ e −λt e j! n! j! j =0
a funkce obnovy H(t) je následně rovna střední hodnotě diskrétní náhodné veličiny Nt, což je n ∞
∞
n =0
n =1
H (t ) = EN t = ∑ nP ( N t = n ) = ∑ n
Hustota obnovy je konstantní
h (t ) =
(λ t ) − λt e = λt. n!
d H (t ) = λ . dt
Obdobné odvození funkce obnovy se nachází např. v [Bart.70, str. 29]. 3.2.1. Gamma rozdělení doby do poruchy Doba do poruchy modelována prostřednictvím Gamma rozdělení má hustotu pravděpodobnosti a − λt
f (t ) =
λ (λt ) e Γ(a)
,
33
t ≥ 0, λ f 0, a f 0.
Sborník konference REQUEST'06
Laplaceův obraz F(t) je roven
f * (s) =
λa Γ(a )
∞
( a −1) − s ( t + λ ) ∫ t e dt = 0
a
f n* ( s ) =
λa , (s + λ )a
Re( s ) f − λ
λna ( s + λ ) na
{
λ (λ t ) na e −λt
}
f n (t ) = L−1 f n* ( s ) =
Γ ( na )
Odtud mají-ji nezávislé náhodné veličiny X1, X2, … Xn Gamma rozdělení s parametry λ, a, pak jejich součet má opět Gamma rozdělení s parametry λ, na. Výpočet hustoty obnovy je poměrně snadný pro a ∈ N , tedy ve speciálním případě, kdy doba do poruchy pochází z rozdělení Erlangova. Postup, opět s využitím Laplaceovy integrální transformace, je následující: ∞
h ( t ) = ∑ f n ( t ), n =1
f * (s) f (s) = 1 − f * (s)
∞
h (s) = ∑ *
* n
n =1
Pro výpočet zpětné transformace je třeba určit kořeny rovnice 1 – f *(s) = 0, v tomto případě (s + λ)a = λa. Těmi jsou jeden nulový kořen a (a - 1) nenulových sk daných následujícími rovnicemi, z ∈ C , zapsáno v goniometrickém tvaru:
( s + λ )α = λα , z
α
( subst . z = s + λ )
[cos(αϕ ) + i sin(αϕ )] = λα
... z =λ
ϕ=
2 kπ
α
k = 1,2,...
,
... s k = λ (e
i 2 kπ
α
s0 = 0
34
− 1),
k = 1,2,...α − 1,
R. Briš: Řešení vybraných modelů s obnovou.
S těmito kořeny lze následně h*(s) rozložit na parciální zlomky, nebo ekvivalentně řešit h(t) pomocí reziduí. Vzhledem k tomu, že všechny předešlé kořeny jsou jednoduchými póly funkce h*(s), je
f * (sk )
a −1
h * (s) = ∑ k =0
*'
− f ( s k )( s − s k ) '
protože f*(sk) = 1 a pro Erlangovo rozdělení f * ( s ) = Po zpětné transformaci je hustota obnovy rovna
h (t ) =
λ a
a −1
+∑
λ + sk a
k =1
a −1
λ + sk
k =0
a(s − s k )
=∑
,
−a * f ( s ). λ+s
e sk t ,
t f 0,
ve výrazu je výše odvozený k-tý nenulový kořen rovnice (s + λ)a = λa , s ∈ C , s k ∈ C , Například pro a = 4 jsou nenulové kořeny rovny iπ
s1 = λ (e 2 − 1) = ( −1 + i )λ , s 2 = λ (e iπ − 1) = −2λ , s 3 = λ (e a hustota obnovy
h (t ) =
λ 4
3
+∑ k =1
λ + sk 4
i 3π 2
− 1) = ( −1 − i )λ
e sk t =
λ 4
[1 − e
− 2 λt
Obrázek 1: Hustota obnovy pro Erlangovo rozdělení
35
]
− e − λt sin( λt ) .
Sborník konference REQUEST'06
3.1.3. Weibullovo rozdělení doby do poruchy, numerický výpočet Doba do poruchy s Weibullovým rozdělením má hustotu pravděpodobnosti α
f (t ) = αλ (λ t )α −1 e − ( λt ) , t ≥ 0 α > 0 je parametr tvaru, λ > 0 je parametr měřítka. Vzhledem k tomu, že parametr α (s výjimkou případu, kdy α = 1 a rozdělení přechází v exponenciální) komplikuje analytické řešení rovnice pro hustotu obnovy, nabízí se numerické řešení. To s jistou chybou numerického výpočtu poskytuje diskrétní informaci o hledané funkci na konečném intervalu. Asymptotické hodnoty lze určit ze znalostí konečných středních hodnot doby do poruchy. Hustotu pravděpodobnosti fn(t), n = 2, 3, …, čili hustotu pravděpodobnosti doby do n-té poruchy, lze vypočíst jako konvoluci funkcí fn-1*f. Numericky to lze provést např. pomocí diskrétní Fourierovy transformace. Nechť je dáno N ∈ N ,jež lineárně diskretizuje zvolený časový interval [0,T], T ∈ R , na vektor t délky N, jehož i-tý prvek je roven
t (i ) =
(i − 1)T , N −1
i = 1,2,... N
a vektor funkčních hodnot hustoty pravděpodobnosti f délky N, jehož prvky jsou
f (i ) = f (t (i )),
i = 1,2,... N .
Pak diskrétní Fourierova transformace f* vektoru f je dána vztahem N
f * (i ) = ∑ f ( j ) ω N( i −1)( j −1) , j =1
kde jádro diskrétní Fourierovy transformace ω N = e
−
2 πi N
.
je rovno Stejně jako u spojité integrální transformace je Fourierův obraz konvolute f*f roven součinu integrálních obrazů f, takže
f n* = f n*−1 . f * ,
n = 2,3,....
Zpětný obraz fn se vypočte podle analogického vztahu
f n (i ) =
1 N
N
∑f
* n
( j ) ω N− ( i −1)( j −1) .
j =1
Numerickou integrací lze pak určit vektor distribuční funkce Fn. Vzorec pro ∞ výpočet funkce obnovy
H (t ) = ∑ Fn (t )
( 5)
n =0
je nutno nahradit při numerickém výpočtu konečnou sumou prvních K vypočtených členů. To lze provést, neboť tyto členy rychle konvergují
36
R. Briš: Řešení vybraných modelů s obnovou.
k nule na nekonečném intervalu [0, T]. Zároveň také Sn = X1 + X2 + … + Xn má asymptoticky normální rozdělení N(nµ, nσ2) kde µ a σ2 jsou konečná střední hodnota a rozptyl Xi. Vzhledem k tomu, že Weibullovo rozdělení doby do poruchy pro α > 1 (α parametr tvaru) má rostoucí intenzitu poruch
r (t ) = λα (λ t ) α −1 lze distribuční funkci Fn (t) shora odhadnout funkcí n −1
Fn (t ) ≤ 1 − ∑
t ( )i
µ
e − µt = G n (t ),
i!
i =0
t p nµ ,
kde µ je střední hodnota doby do poruchy (viz. [BaPr65, kap. 2]).
µ=
Γ(1 +
λ
1
)
α .
Takto lze tedy odhadnout chybu konečného součtu H (t ) = protože zbytek je omezen ∞
∑F
n
∞
(t ) ≤
n = K +1
∑G
n
(t ),
n = K +1
K
∑F
n
(t )
n =0
t p nµ
a výše uvedeným odhadem ∞
t
∑ G n (t ) =
µ
n = K +1
=
t
µ
K
∞
−∑∑ n =1 i = n
K
− ∑ G n (t ) = n =1
t
µ
K
n −1
n =1
i =0
− ∑1 − ∑
( t / µ ) i − µt e i!
( t / µ ) − µt t (t / µ ) n − µ t e = (1 − ∑ e , µ i! n! n =0 i
∞
∞
n −1
n =1
n =1
i =0
∑ G n (t ) = ∑ 1 − ∑
K −1
∞ (t / µ ) i − µ t n ( t / µ ) n − µt t e = . e =∑ µ i! n! n =1
Obrázek 2: Funkce obnovy pro Weibullovo rozdělení
37
Sborník konference REQUEST'06
3.2 Modely s údržbou Mohou se vyskytovat případy, kdy porucha zařízení je mnohem dražší a nebezpečnější, než údržba, je tedy vhodné ji zařadit do procesu. Za údržbu se dá považovat také například preventivní úplná, nebo částečná výměna za prvek nový, případně takovou opravu prvku, že jej lze považovat za nový. Základní tři typy preventivní plánované údržby jsou: • výměny založené na věku – prvek je vyměněn po předepsané době τ , nebo v okamžiku poruchy; • periodické výměny – prvek je pravidelně vyměňován bez ohledu na to, jak dlouho pracoval; • náhodné výměny – výměny se provádějí v okamžiku poruchy, nebo po uplynutí doby, jež je náhodnou veličinou, například s normálním rozdělením. Je zřejmé, že periodické výměny jsou méně efektivní,m než výměny založené na věku. Doba do nejbližší plánované výměny od okamžiku poruchy je totiž menší, nebo rovna τ . Vyskytují se tak situace, kdy dojde k obnově krátce po sobě. Dále výměny zařízení obecně mají význam pouze tehdy, jestliže intenzita poruch je rostoucí, tzn. že zařízení se s prodlužující dobou užívání opotřebovává. 3.2.1 Modely s periodickými výměnami Nechť zařízení prodělává po časovém intervalu provozu τ c pravidelnou údržbu, jejímž smyslem je odhalení případných skrytých chyb a jejich případné odstranění. Doba údržby zařízení je τ d a po této době je zařízení opět uvedeno do provozu. F(t) je zde rozdělení doby do poruchy X. Pak v intervalu [0, τ c+ τ d) je pravděpodobnost, že se zařízení nachází v porušeném stavu rovna
t pτc
P (t ) = F (t ),
t ≥τc
= 1,
Za stav poruchy se tedy bere doba do údržby po případné poruše i období, kdy je zařízení v údržbě. Pravděpodobnost P(t), t ∈ [0, ∞ ) (také koeficient nepohotovosti) je generována soustavou rovnic
P (t ) = Pn (t ),
n ∈ N ∪ {0} : n (τ c + τ d ) p t ≤ ( n + 1)(τ c + τ d ),
... Pi (t ) = Pi −1 (t ) − Pi −1 (iτ c )
i = 1,2,..., n − 1,
... P0 (t ) = F (t ), t f 0. 38
R. Briš: Řešení vybraných modelů s obnovou.
Zde Pi(t) reprezentuje pravděpodobnost, že se zařízení nachází ve stavu poruchy za předpokladu, že předtím bylo podrobeno i prohlídkám. Člen Pi1(t) - Pi-1(iτc) reprezentuje pravděpodobnost, že zařízení bylo při předchozí prohlídce v pořádku a porušilo se v intervalu (iτc, t), Pi-1(iτc) P0(t - i(τc + τd)) je pravděpodobnost, že bylo při předchozí prohlídce v poruše a od ní se znova porušilo. Exponenciální rozdělení doby do poruchy Nechť F (t ) = 1 − e − λt . Pro čas t ∈ [0, ∞ ) je pravděpodobnost P(t) rovna
P (t ) = F (t − n (τ c + τ d )), = 1,
t ∈ [ n (τ c + τ d ), n (τ c + τ d ) + τ c ),
t ∈ [ n (τ c + τ d ) + τ c , ( n + 1)(τ c + τ d )).
Je-li τ d = 0, výraz pro P(t) se dále zjednoduší na tvar
P (t ) = F (t − nτ c ),
n ∈ N ∪ {0} : n(τ c + τ d ) ≤ t p ( n + 1)(τ c + τ d ).
Obrázek 3: Koeficient nepohotovosti pro exp. rozdělení Weibullovo rozdělení doby do poruchy Nechť intenzita poruch daného rozdělení doby do poruchy není konstantní, je tedy funkcí času uplynulého od poslední obnovy. V tom případě je nutné pro dané t a s ním svázané n udávající počet provedených prohlídek řešit výše uvedenou soustavu n rovnic a řešení uvedené soustavy se nikterak neeliminuje jako u exponenciálního rozdělení.
39
Sborník konference REQUEST'06
Obrázek 4: Koeficient nepohotovosti pro Weib. rozdělení Na obrázcích 3 a 4 slabě vyznačená křivka znázorňuje body lokálních extrémů v případě zkrácení doby do první prohlídky. 3.2.2 Periodické prohlídky s částečnou obnovou Praktičtější význam může mít model, u něhož se předpokládá, že v případě zjištění závady během periodické prohlídky je dosaženo pouze částečné obnovy. K tomu může dojít například tehdy, jestliže se porouchá jen část zařízení (která má přesto za následek nefunkčnost celku) a při opravě je obnovena pouze tato část. Ostatní části tedy pokračují s jistým stářím. Jedna z jednoduchých možností, jak toto řešit, je modelovat část neobnovenou rozdělením doby do poruchy Fnr(t) a obnovenou Fre(t). Přitom tyto rozdělení nejsou vázány na fyzické celky, neboť informace o tom, která část se při poslední prohlídce porouchala, je zanedbávána. Stejně tak fakt, že v aktuálně neobnovené části se mohou vyskytovat celky obnovené při předešlých prohlídkách. Tyto nepřesnosti se mohou částečně eliminovat vhodným typem a parametry rozdělení Fnr(t). Pravděpodobnost P(t), t ∈ [0, τc ) , že se zařízení nachází ve stavu poruchy je rovna
P(t ) = 1 − Rnr (t ) Rre (t ) = Fnr (t ) + Fre (t ) − Fnr (t ) Fre (t ). Rovnice předešlého modelu 3.2.1 pak přejdou na tvar
P (t ) = Pn (t ),
n ∈ N ∪ {0} : n (τ c + τ d ) p t ≤ ( n + 1)(τ c + τ d ),
... Pi (t ) = Pi −1 (t ) − Pi −1 (iτ c ) Rnr (t ) Rre (t − i (τ c + τ d )), ... P0 (t ) = 1 − Rnr (t ) Rre (t ), t f 0.
40
i = 1,2,..., n − 1,
R. Briš: Řešení vybraných modelů s obnovou.
Na následujícím obrázku 5 je uveden příklad, kdy perioda inspekčních prohlídek je τc = 4, rozdělení doby do poruchy obnovované části je logaritmicko-normální LN (2, 0.25), (EXre ≅ 7.62) a neobnovované Weibullovo, Weib (2 * 10-5, 2), (EXnr ≅ 210.5).
Obrázek 5: Koeficient nepohotovosti při částečné obnově 4
Závěr
V tomto příspěvku bylo popsáno několik modelů s obnovou, přičemž hlavní těžiště práce spočívalo v modelech se zanedbatelnou dobou obnovy. Byly řešeny modely orientované na popis procesu stárnutí, jako je Gamma rozdělení či Weibullovo rozdělení. Se znalostí teorie obnovy byly tyto procesy matematicky modelovány a následně řešeny. V rámci modelů s údržbou byly úspěšně vyřešeny soustavy rovnic pro intervalové pravděpodobnosti, že se komponenta nachází v porušeném stavu, generované pro modely s periodickými výměnami, pro exponenciální a Weibullovo rozdělení. Další pokračování tohoto výzkumu lze vidět v rozšíření těchto postupů na alternující modely s obnovou. Vyřešené modely poukázaly na možnosti základních matematických postupů, jako je Laplaceova či Fourierova transformace při jejich řešení. Použití diskrétní Fourierovy transformace přineslo uspokojivé výsledky včetně kvantifikace chyby. S dosaženými výsledky a získanými zkušenostmi by bylo možné dále pokračovat v sestavování a řešení složitějších matematických modelů přesněji popisujících reálné problémy. Například zahrnutím určitých vazeb, které by upřesňovaly vznik, případně obnovu jednotlivých typů poruch, jež ve skutečnosti nemusí být navzájem nezávislé. Stejně tak by ovšem bylo prakticky využitelné pokračování směrem výpočtu optimální strategie údržby se stanovenými náklady spojenými s poruchami,
41
Sborník konference REQUEST'06
výměnami a prohlídkami jednotlivých komponent systému a určením středního počtu těchto událostí na daném časovém intervalu.
Literatura [1] Bartlett M.S., Renewal Theory, Meten & Co. Ltd. Science paperbacks, 1970, ISBN 412 20570 X. [2] Barlow R. and Proschan F., Mathematical Theory of Reliability, Wiley 1965.
Adresa autora: Doc. Ing. Radim Briš, CSc., Vysoká škola báňská – Technická univerzita Ostrava, fakulta elektrotechniky a informatiky, katedra aplikované matematiky, Tř.17.listopadu 15, 708 33 Ostrava-Poruba.
e-mail:
[email protected] Tato práce byla vytvořena v rámci projektu MŠMT 1M06047 - CQR.
42
Metrologie v praxi Eliška Cézová
1.
Úvod Metrologie se zabývá jednotností a správností měření. Pro podnikovou metrologii bychom měli definovat měřidla, která v daném oboru používáme, řádně je rozčlenit a označit. Zároveň je v podnikové praxi třeba stanovit postup od nákupu měřidla až po jeho vyřazení z evidence. Metrologie je souhrn všech znalostí a činností souvisejících s měřením a zahrnuje teoretické i praktické aspekty vztahující se k měření bez ohledu na úroveň jejich přesnosti a bez ohledu na oblast vědy a techniky, kde se příslušné problémy řeší. Základním úkolem metrologie je zabezpečit jednotnost a přesnost měření Základní rozdělení měřidel: − − − − −
etalony kontrolní měřidla pracovní měřidla stanovená pracovní měřidla nestanovená orientační (informativní) měřidla
2.
Charakteristika jednotlivých měřidel Etalon měřicí jednotky anebo stupnice určité veličiny je měřidlo sloužící k realizaci a uchovávání této jednotky nebo stupnice a k jejímu přenosu na měřidla nižší přesnosti. Etalony se nesmí používat k pracovním (provozním) měřením, slouží výhradně k zabezpečování jednotnosti měřidel a měření. Etalony primární jsou mezinárodní a národní (státní). Od těchto etalonů se odvozují etalony nižších řádů až po hlavní etalony organizací. Navázání etalonů se provádí pomocí kalibrace (u ČMI). Kalibrací se zajišťuje jejich jednotnost a přesnost (správnost a shodnost).
43
Sborník konference REQUEST'06
Kontrolní měřidla nenahrazují etalony a nepoužívají se k provoznímu měření, slouží pouze ke kontrolním účelům a (jsou definována v řádech podnikové metrologie). Měly by mít řádově vyšší přesnost než měřidla, která jsou pro příslušná měření použita v provozu. Návaznost je zajišťována kalibrací na etalon vyššího řádu. (Nejsou v zákoně uvedena). Pracovní měřidla nestanovená („pracovní měřidla“) slouží k měření na výkonných pracovištích, mají vliv na množství a jakost výroby, na ochranu zdraví a bezpečnosti i životního prostředí. Musí být periodicky kalibrována (uživatelem, který kalibruje ve vlastním metrologickém pracovišti nebo využije služeb metrologických pracovišť jiných subjektů, jež mají své etalony řádně navázané. Lhůty kalibrace si určuje sám uživatel. Pracovní měřidla stanovená („stanovená měřidla“) stanoví MPO (ministerstvo průmyslu a obchodu) vyhláškou (č. 345/2002 Sb.) k povinnému ověřování s ohledem na jejich význam: o v závazkových vztazích (např. při prodeji, nájmu, při poskytování služeb atd.) o pro stanovení sankcí, poplatků, tarifů a daní o pro ochranu zdraví o pro ochranu životního prostředí o pro bezpečnost při práci o při ochraně jiných veřejných zájmů chráněných zvláštními právními předpisy Orientační (informativní) měřidla jsou definována v řádech podnikové metrologie jako měřidla jejichž použití neovlivňuje jakost, množství popřípadě bezpečnost a ochranu zdraví pracovníků při práci. Tyto měřidla orientačně informují o stavu nebo velikosti jevu nebo látkového množství (mohou podléhat vstupní kalibraci). (Nejsou v zákoně uvedena). Návazností měřidel se rozumí zařazení daných měřidel do nepřerušené posloupnosti přenosu hodnoty veličiny počínající etalonem nejvyšší metrologické kvality pro daný účel. Způsob návaznosti pracovních měřidel stanoví uživatel měřidla. Schéma návaznosti měřidel (SNM) je dokument uvádějící hierarchii měřidel (od primárních (státních) etalonů až na pracovní měřidla), sestavený pro měření dané veličiny, popisující postup operací
44
E. Cézová: Metrologie v praxi.
určených k přenosu hodnoty jednotky této veličiny a stanovující přesnosti požadované pro každou z těchto operací. Ověřování je soubor operací skládající se ze zkoušky a opatřením úřední značkou na měřidle (nevystavuje se ověřovací list) nebo z vystavením certifikátu (ověřovacího listu), kterým se konstatuje a potvrzuje, že měřidlo odpovídá předepsaným požadavkům. Nejsou uváděny výsledky měření, ale konstatuje se shoda parametrů s příslušnou specifikací. Ověřením měřidla se potvrzuje, že měřidlo má požadované metrologické vlastnosti, a že odpovídá ustanovením právních předpisů, technických norem i dalších technických předpisů, popřípadě schválenému typu. Kalibrace měřidel je soubor operací, kterými se metrologické vlastnosti měřidla porovnávají s měřidlem metrologickým navázaným, zpravidla s etalonem organizace, jiné kalibrační laboratoře nebo etalonem ČMI. Výsledky kalibrace se zaznamenávají do kalibračního listu. (Kalibrace na rozdíl od ověřování nekončí opatřením plomby nebo značky). Kalibrační postup je předpis, který obsahuje souhrn činností při kalibraci měřidel a slouží jako návod pro práci zaměstnanců v kalibrační laboratoři. Každý kalibrační postup by měl být: • úplný – musí obsahovat potřebné údaje • správný – bez chyb a nesprávných údajů • srozumitelný – obsah musí být jednoznačný, aby nevznikaly pochybnosti o významu jednotlivých údajů a pojmů, zvláště při používání zkratek • účelný – musí určovat optimální podmínky pro co nejefektivnější průběh kalibrace s minimálními náklady a pracností • validovaný – musí být potvrzena a uznána platnost postupu v případě, že se nejedná o postup normalizovaný • stručný – v textové části uvádět pouze nezbytné a důležité údaje potřebné ke kalibraci měřidel s použitím správných technických termínů • přehledný – čitelný a vhodně upravený
45
Sborník konference REQUEST'06
Ukázka kalibračního listu:
Zákony týkající se metrologie najdete v referencích [2], [3] a [4]. Norma týkající se metrologie najdete v referencích [1].
46
E. Cézová: Metrologie v praxi.
3.
Schéma postupu od koupě měřidla až po jeho vyřazení Požadavky na měřidlo (obor, rozsah, tolerance, přesnost)
Výběrové řízení na dodavatele
Neshoda
Schválení nákupu a nákup měřidla Ne Kontrola shody s požadavky Ano Evidence měřidla a určení uživatele Zabezpečení konfirmace dle měřidla SM, PM Označení, doba platnosti Předání uživateli, seznámení s měřidlem Uživatel pracuje Ne Zajistit opravu měřidla (externě, interně)
Došlo k poškození či prošlé konfirmaci Ano Vedoucí rozhodne co s měřidlem
Ano Je měřidlo opravitelné? Ne Vyjmutí měřidla z evidence (metrolog)
Metrologická konfirmace dle norem je soubor činností požadovaných pro zajištění toho, aby měřící vybavení bylo ve shodě s požadavky na jeho zamýšlené použití. Metrologická konfirmace obecně zahrnuje kalibraci a ověřování, jakékoli nezbytné seřízení nebo opravu a následnou rekalibraci, porovnání s metrologickými požadavky na zamýšlené použití vybavení, stejně jako jakékoli požadované zapečetění a označení štítkem.
47
Sborník konference REQUEST'06
4.
Metrologický řád Každý podnik, který pracuje s měřidly, má stanovena pravidla v metrologickému řádu pro daná měřidla, podle nichž se řídí. Za jeho dodržování a aktualizování odpovídá metrolog, který je řádně proškolen a je seznámen se všemi měřidly, které jsou v daném podniku a k jakému účelu jsou využívány. Podnikový metrologický řád by měl zahrnovat: − Obsah − Cíl − Pojmy, definice, zkratky − Odpovědnost a pravomoc − Rozdělení měřidel − Volba měřidel − Evidence a značení měřidel − Výdej měřidel − Kalibrace měřidel − Ověřování měřidel − Vyřazování měřidel − Související dokumenty − Přílohy Přílohy k metrologickému řádu se mohou skládat dokumentů: − evidenční karta měřidla − seznam pracovních měřidel stanovených − seznam pracovních měřidel nestanovených − seznam referenčních materiálů − kalibrační postup pro nestanovená pracovní měřidla − matice odpovědnosti − matice dokumentace − doklad o převzetí měřidel − objednávka externí kalibrace − oznámení o vadném měřidle
48
z těchto
E. Cézová: Metrologie v praxi.
5.
Povinnosti uživatele − − − − − −
Používat jen evidovaná měřidla Ohlásit podezření na neshodu měřidla Kontrola funkčnosti Správné užívání Správné uchovávání Sledování kalibračních známek a evidenčních čísel
Evidenci měřidel lze vést v papírové podobě nebo v elektronické formě. Neměli bychom opomíjet dobré rozlišení měřidel, ať už číselnou řadou či barevně. Díky současným vyspělým technologiím, jako jsou databáze, lze měřidla evidovat nejen podle data platnosti kalibračních listů, ale i podle jednotlivých podnikových středisek nebo podle jmenného seznamu uživatelů či měřidel. Evidenční karta měřidla by měla obsahovat tyto základní údaje: − Název měřidla − Jméno výrobce, model a typové označení − Výrobní číslo − Evidenční číslo metrologické evidence − Datum výroby a datum uvedení do provozu − Stav při převzetí − Umístění měřidla − Podrobné údaje z kontrol včetně údajů o ověření nebo kalibrace měřidel − Podrobnosti o prováděné údržbě − Evidence závad, poškození, úprav a oprav U každého měřidla je třeba evidovat základní chybu měřidla (udává ji výrobce). Je to chyba měřidla určená za referenčních podmínek. Tyto podmínky je třeba zachovávat pro správnost měření a jeho platnost. Dalším evidovaným údajem je třída přesnosti měřidla, která se zpravidla vyjadřuje číslem nebo symbolem přijatým dohodou a nazývaným index třídy.
49
Sborník konference REQUEST'06
6.
Nejistoty Nejistoty měření tvoří parametr připojený k výsledku měření. Je to odhad části měření, který charakterizuje rozmezí hodnot, v němž leží skutečná hodnota měřené veličiny. Nejistota se může dotýkat výsledku měření, ale též hodnot odečítaných na použitých přístrojích, hodnot použitých konstant, korekcí apod. od kterých nejistota výsledku měření závisí. Více o nejistotách se dozvíte v referencích [5], [6] a [7]: a) Nejistota typu A Nejistotu typu A získáme statistickou analýzou série naměřených hodnot z opakovaných měření stejné veličiny. Je ovlivněna náhodnými vlivy. n
u A ≡ s( y) =
∑(y
i
− y) 2
i =1
n * (n − 1)
Počet opakovaných měření by měl být větší než deset, protože jinak není možné učinit kvalifikovaný odhad. Pokud není k dispozici potřebný počet měření, použijeme korigovanou nejistotu uAk
u Ak = k * s( y ) kde k je koeficient závislý na počtu opakovaných měření. Hodnoty koeficientu k pro různé počty opakovaných měření jsou v následující tabulce: n 9 8 7 6 5 4 3 2 k 1,2 1,2 1,3 1,3 1,4 1,7 2,3 7,0
Příklad výpočtu v tabulce: i yi 1 5,09 2 5,05 3 4,92 4 4,98 5 5,11
nejistoty typu A: Jednotlivé naměřené hodnoty jsou ∆yi 0,077 0,037 -0,093 -0,033 0,097
∆yi 2 0,006 0,001 0,009 0,001 0,009
i yi 6 4,92 7 5,07 8 5,03 9 4,95 n=9 45,12
50
∆yi -0,093 0,057 0,017 -0,063 0,000
∆yi 2 0,009 0,003 0,000 0,004 0,043
E. Cézová: Metrologie v praxi.
n
u A ≡ s( y) =
∑ ( yi − y ) 2 i =1
n * (n − 1)
9
=
∑ ∆y
2 i
1
9 *8
=
0,043 = 0,024324mm 72
Protože bylo naměřeno pouze devět hodnot, je třeba korigovat nejistotu koeficientem z tabulky, který je roven k=1,2.
u Ak = k * s( y) = 1,2 * 0,024324 = 0,029189 mm b) Nejistota typu B Standardní nejistota typu B se odhaduje expertním odhadem na základě dostupných informací a zkušenosti. Nejčastěji použijeme: − údaje výrobce měřicí techniky (technické parametry použitého zařízení) − zkušenosti z předchozích měření − zkušenosti s vlastnostmi chování materiálů a techniky a poznatky o nich − údaje získané při kalibraci a z certifikátů − nejistoty referenčních údajů v příručkách Nejistotu etalonu přepíšeme z kalibračního listu. Chybu měřidla přečteme z návodu. Příklad určení nejistoty typu B: PřepoZdroj Velikost Rozdělení čet χi Zmax ± Nejistota etalonu 0,0015 normální 1 Chyba měřidla 0,02 normální 2 Chyba čtení 0,01 rovnoměrné 3 Deform.ramen
0,016
normální
Přírůstek UBi UBi=Zmax/ χi 0,0015 0,01 0,005773
2 0,008 ΣUBi = 0,025273 mm
c) Nejistota typu C Kombinovaná standardní nejistota typu C se získá sloučením standardní nejistoty typu A (uA) s výslednou standardní nejistotou typu B (uB):
u C ( x ) = u A2 ( x ) + u B2 ( x ) Příklad určení nejistoty typu C:
uC ( x ) = u A2 ( x ) + u B2 ( x) = 0,029189 2 + 0,025273 2 = 0,038759 mm
51
Sborník konference REQUEST'06
d) Rozšířená nejistota Rozšířená nejistota je součinem standardní nejistoty měření a koeficientu rozšíření k = 2, což pro normální rozdělení odpovídá pravděpodobnostnímu pokrytí cca 95% (zaručuje interval spolehlivosti přibližně 95 %). Příklad určení rozšířené nejistoty:
U = k ∗ u c = 2 * 0,038759 = 0,077518 mm Výsledek měření má potom tvar: (5,0133±0,077518)mm
7.
Závěr
Přínosy pro firmu v oblasti metrologie jsou především: − snížení zmetkovitosti a reklamací − snížení nákladů − zlepšení image firmy zvýšením jakosti produkce − zvýšení konkurenceschopnosti − garance stability jakosti Reference [1] Norma ČSN EN ISO 10012 (010360) systémy managementu měření – požadavky na procesy měření a měřicí vybavení [2] Zákon č. 505/1990 Sb. se nahrazuje zákonem č. 119/2000 Sb. [3] Vyhláška č.65/2006 Sb. [4] Vyhláška č. 345/2002 Sb. [5] TPM 0051-93 Stanovenie neistot pri meraniach [6] EAL – R2 Metodika vyjadřování nejistot při kalibracích [7] Norma ČSN EN ISO/IEC 17 025:2001 Všeobecné požadavky na způsobilost zkušebních a kalibračních laboratoří. Adresa autora: Ing. Eliška Cézová, České vysoké učení technické v Praze, Fakulta strojní, Ústav technické matematiky, Karlovo nám. 13, 121 35 Praha 2 e-mail:
[email protected] Tato práce byla vytvořena za podpory projektu MŠMT 1M06047 - CQR
52
Diskrétní waveletová transformace, zhlazování a prahování Dana erná 1 , Václav Fin¥k
2
Abstrakt. Waveletová analýza m·ºe být vyuºita p°i monitoro-
vání, vyhodnocování a analýze strojových proces·. Nap°íklad p°i detekci závad p°evodového systému byl získáván vibra£ní signál z akcelerometru. Tento signál byl dále transformován pomocí diskrétní waveletové transformace a následn¥ byly pouze dominantní waveletové koecienty p°edány neuronové síti ke klasikaci. Tímto zp·sobem se výrazn¥ zmen²ilo mnoºství zpracovávaných dat a p°esto bylo moºné úsp¥²n¥ detekovat v²echny chybové stavy (viz. [8]). V tomto p°ísp¥vku se budeme v¥novat diskrétním waveletovým transformacím, zhlazování a prahování signálu. Vhodné prahování totiº umoº¬uje výrazn¥ zredukovat mnoºství zpracovávaných dat p°i minimální ztrát¥ informace. Klí£ová slova: Wavelety, waveletová transformace, zhlazování a prahování signálu, neuronové sít¥, detekce závad.
1 Wavelety úvod Díky velmi rychlému rozvoji se v posledních letech m·ºe zdát, ºe pojem wavelet je pouºíván v mnoha významech, které spolu zdánliv¥ v·bec nesouvisí. P°esto je moºné najít n¥kolik sty£ných bod·. Wim Sweldens, který se zaslouºil o roz²í°ení pojmu wavelet, v jednom ze svých £lánk· uvádí následující pokus o denici: Wavelety jsou stavební bloky, které umoº¬ují rychle dekorelovat data. 1 2
Podporována projektem MMT £íslo LC06024. Podporován projektem MMT £íslo 1M06047.
53
Sborník konference REQUEST'06
Pokusme se to nyní blíºe vysv¥tlit. Ozna£íme-li X prostor funkcí nebo signál·, potom jsou wavelety stavebními bloky pro tyto funkce. Matematicky to znamená, ºe tvo°í bázi tohoto prostoru. Tedy libovolný prvek z prostoru X m·ºeme vyjád°it lineární kombinací wavelet·. Ozna£íme-li wavelety ψi , pak signál f ∈ X lze napsat ve tvaru X ci ψi f= i
Studovaný signál je nyní reprezentován posloupností koecient· ci . Signály okolního sv¥ta nejsou náhodné hodnoty, ale vykazují jistou korelaci (závislost), a to jak v oblasti prostorové, tak i v oblasti frekven£ní. Korelace je tém¥° vºdy lokální vzorky, které jsou blízko sebe, jsou více korelované neº vzorky, které jsou daleko od sebe. Podívejme se nap°íklad na obrázek. Body, které jsou blízko sebe, budou pravd¥podobn¥ siln¥ korelované (budou mít t°eba velmi podobnou barvu). Naopak lze t¥ºko o£ekávat závislost mezi body leºícími na opa£ných stranách obrázku. Wavelety mají schopnost korelaci v datech odstra¬ovat. To znamená, ºe reprezentace pomocí wavelet· je oproti p·vodní reprezentaci kompaktn¥j²í. V praxi se tato vlastnost projevuje tak, ºe mezi waveletovými koecienty ci je jich pouze málo významných. Toho se s úsp¥chem vyuºívá nap°íklad p°i kompresi obrázk·. Aby wavelety mohly potla£ovat korelaci v signálu, m¥ly by být zpracovávanému signálu podobné (korelované stejným zp·sobem). V¥t²inou tedy budeme poºadovat wavelety dob°e lokalizované jak v prostorové, tak ve frekven£ní oblasti. Lokalizovanost v prostorové oblasti znamená, ºe funkce má (tém¥°) kompaktní nosi£. Lokalizovanost ve frekven£ní oblasti odpovídá lokalizovanosti spektra tedy lokalizovanost Fourierovy transformace waveletu. Pokles spektra sm¥rem k vysokým frekvencím odpovídá hladkosti waveletu. ím je wavelet hlad²í, tím rychlej²í je pokles. Pokles spektra sm¥rem k nízkým frekvencím koresponduje s po£tem nulových moment· waveletu. Dal²í vlastnost, kterou poºadujeme od wavelet·, je moºnost rychlých výpo£t·. Jde o to, abychom byli schopni rychle p°echázet mezi p·vodní a waveletovou reprezentací dat, protoºe rychlost je ve v¥t²in¥ aplikací klí£ová. Za rychlé algoritmy se v¥t²inou povaºují algoritmy, jejichº sloºitost je
54
D. Černá, V. Finěk: Diskrétní waveletová transformace ...
O(N logN ), kde N je velikost vstupních dat. Waveletové algoritmy mají obvykle sloºitost O(N ), zatímco nap°íklad diskrétní Fourierova transformace má sloºitost O(N logN ).
2 Wavelety Waveletem budeme rozum¥t takovou funkci ψ ∈ L2 (R), ºe systém {ψj,k }j,k∈Z jejích translací a dyadických dilatací tvo°í ortonormální bázi Hilbertova prostoru L2 (R). Funkce ψj,k je pro kaºdá dv¥ celá £ísla j, k denována p°edpisem ¡ ¢ ψj,k = 2j/2 ψ 2j x − k . Písmeno k reprezentuje translaci (posun) a 2j reprezentuje dyadickou dilataci p·vodní funkce ψ. Wavelet je obvykle konstruován tak, aby waveletový systém {ψj,k }j,k∈Z tvo°il ortonormální systém v prostoru L2 (R), ale jsou i jiné moºnosti. Ortonormalita systému znamená, ºe informace obsaºená ve waveletovém koecientu není obsaºena v ºádném jiném waveletovém koecientu a také ºe m·ºeme kompletn¥ zrekonstruovat p·vodní signál pomocí waveletových koecient·. Nebo-li pro kaºdou funkci (signál) f ∈ L2 (R) platí XX f= hf, ψj,k i ψj,k j∈Z k∈Z
(konvergence °ad je v norm¥ prostoru L2 (R) a symbol hf, ψj,k i zna£í skalární sou£in v prostoru L2 (R)). Základem konstrukce waveletového systému {ψj,k }j,k∈Z zaloºeného na translaci a dyadické dilataci jediné funkce ψ ∈ L2 (R) je obvykle tzv. multirozklad (multiresolution analysis). Není to jediný zp·sob konstrukce ortonormální waveletové báze, nicmén¥ kaºdý wavelet s kompaktním nosi£em lze zkonstruovat pomocí multirozkladu. Multirozkladu se zde nebudeme dále v¥novat, pouze vyuºijeme n¥které jeho vlastnosti. Hlavní je existence tzv. ²kálové funkce φ ∈ L2 (R). Podobn¥ jako pro wavelet i pro ²kálovou funkci denujme op¥t pomocí translace a dilatace ¡ ¢ φj,k = 2j/2 φ 2j x − k .
55
Sborník konference REQUEST'06
Multirozklad je konstruován tak, ºe systém funkcí {φj0 ,k }k∈Z reprezentuje hladkou £ást signálu (aproximaci signálu) a p°idáváním waveletových systém· na r·zných úrovních rozli²ení (²kálách) {ψj0 ,k }k∈Z , {ψj0 +1,k }k∈Z , . . . postupn¥ p°idáváme dal²í detaily zkoumaného signálu. To znamená, ºe kaºdý signál f ∈ L2 (R) m·ºeme jednozna£n¥ reprezentovat kombinací ²kálových a waveletových koecient·
f=
X
hf, φj0 ,k i φj0 ,k +
∞ X X
hf, ψj,k i ψj,k ,
(1)
j=j0 k∈Z
k∈Z
pro libovolné celé £íslo j0 . Dále z vlastností multirozkladu plyne, ºe ²kálovou funkci φ m·ºeme popsat pomocí (²kálové rovnice) lineární kombinace jejich zmen²ených a posunutých verzí takto X φ(x) = hk φ(2x − k), k
kde φ(2x − k) je zmen²ená verze ²kálové funkce φ posunutá o celé £íslo k a násobená ²kálovým koecientem hk . P°edchozí rovnice nám v podstat¥ °íká, ºe ²kálovou funkci na jedné ²kále m·ºeme spo£ítat pomocí n¥kolika ²kálových funkcí na p°edchozí ²kále, coº je základem diskrétní waveletové transformace. Podobným zp·sobem mohou být ²kálové koecienty pouºity rovn¥º k výpo£tu waveletu na jedné ²kále pomocí n¥kolika ²kálových funkcí na p°edchozí ²kále prost°ednictvím tzv. waveletové rovnice X ψ(x) = (−1)k h1−k φ(2x − k). k
Tato konstrukce zaji²´uje, ºe wavelety a k nim p°íslu²né ²kálové funkce jsou navzájem ortogonální. Je²t¥ poznamenejme, ºe dále budeme uvaºovat pouze wavelety s kompaktním nosi£em, které mají pouze kone£ný po£et ²kálových koecient· r·zných od nuly.
P°íklad 1. Nejjednodu²²ím p°íkladem ortonormálního waveletu je Haarova funkce. Její ²kálová i waveletová rovnice obsahují pouze dva koecienty r·zné
56
D. Černá, V. Finěk: Diskrétní waveletová transformace ...
od nuly a
φ(x) = φ(2x) + φ(2x − 1)
ψ(x) = φ(2x) − φ(2x − 1).
e²ení ²kálové rovnice je zobrazeno na obrázku 3 je to první funkce zleva a následn¥ z waveletové rovnice dostaneme Haar·v wavelet to je druhá funkce zleva na obrázku 3. Obrázek 1 prezentuje Haarovu ²kálovou bázi pro j0 = 2 ze vztahu (1) na intervalu [0, 1]. Tuto bázi m·ºeme ekvivalentn¥ p°evést na bázi, která obsahuje Haarovu ²kálovou bázi pro j0 = 1 ze vztahu (1) a k tomu je²t¥ dva wavelety na úrovni rozkladu j = 1 ze vztahu (1). Tato báze je zobrazena na obrázku 2. T°etí moºnost, jak ekvivalentn¥ reprezentovat tuto bázi, spo£ívá v uºití Haarovy ²kálové báze pro j0 = 0 ze vztahu (1) (obsahuje jedinou funkci a sice ²kálovou funkci φ), k tomu musíme p°idat wavelet ψ odpovídající úrovni rozkladu j = 0 ze vztahu (1) a op¥t dva wavelety na úrovni rozkladu j = 1 ze vztahu (1). Tato báze je zobrazena na obrázku 3. Prost°ednictvím t¥chto bází lze £p°esn¥ ¤ ¤ funkce, £ ¤ £ ¤ £reprodukovat které jsou po £ástech konstantní na intervalech 0, 14 , 14 , 12 , 12 , 34 , 34 , 1 .
2
2
2
2
1,5
1,5
1,5
1,5
1
1
1
1
0,5
0,5
0,5
0,5
0
0 0
0,2
0,4
0,6 x
0,8
1
0 0
0,2
0,4
0,6
0,8
1
0 0
x
0,2
0,4
0,6
0,8
1
x
0
0,2
Obrázek 1: kálové funkce φ2,0 , φ2,1 , φ2,2 , φ2,3 .
0,4
0,6
0,8
1
x
3 Diskrétní waveletová transformace V p°edchozí £ásti jsme vid¥li, ºe wavelety a ²kálové funkce na r·zných ²kálách spolu úzce souvisí. Toho nyní vyuºijeme p°i odvozování diskrétní
57
Sborník konference REQUEST'06
1,4
1,4
1,2
1,2
1
1
0,8
0,8
0,6
0,6
0,4
0,4
1
1
0,5
0,5
0
0 0
0,2
0,4
0,6
0,8
1
0
0,2
0,4
x
0,2
0,2
0
0,6
0,8
1
0,8
1
x
-0,5
-0,5
-1
-1
0 0
0,2
0,4
0,6
0,8
1
0
0,2
0,4
x
0,6
0,8
1
x
Obrázek 2: kálové funkce φ1,0 , φ1,1 a wavelety ψ1,0 , ψ1,1 .
2
1
1,5
0,5
1
0
0,5
-0,5
1
1
0,5
0,5
0 0
0,2
0,4
0,6
0,8
1
0 0
x
0,2
0,4
0,6
0,8
1
0
x
0,2
0,4
0,6 x
-0,5
-0,5
-1
-1
-1
0 0
0,2
0,4
0,6
0,8
1
x
Obrázek 3: kálová funkce φ = φ0,0 a wavelety ψ = ψ0,0 , ψ1,0 , ψ1,1 . waveletové transformace. Je-li funkce (signál) f ∈ L2 (R), potom ozna£me symbolem yj,k ²kálové koecienty funkce f a symbolem xj,k waveletové koecienty funkce f a tedy platí Z ∞ f (x)ψj,k (x) dx, xj,k = hf, ψj,k i = −∞
Z yj,k = hf, φj,k i =
∞
−∞
58
f (x)φj,k (x) dx.
D. Černá, V. Finěk: Diskrétní waveletová transformace ...
Dosadíme-li do t¥chto vztah· ²kálovou (resp. waveletovou) rovnici a po n¥kolika jednoduchých úpravách dostaneme: Z ∞ Z ∞ ¡ ¢ f (x)2j/2 ψ 2j x − k dx f (x)ψj,k (x) dx = xj,k = −∞ Z−∞ ∞ X f (x) (−1)l h1−l 2j/2 φ(2(2j x − k) − l) dx = −∞
X
=
l
Z
l
j/2
(−1) h1−l 2
l
X
=
l
(−1) h1−l
l
1 √ 2
Z
∞
f (x) φ(2j+1 x − 2k − l) dx
−∞ ∞
f (x) 2(j+1)/2 φ(2j+1 x − 2k − l) dx
−∞
1 X √ (−1)l h1−l yj+1,2k+l 2 l
=
a podobn¥ pro ²kálové koecienty Z ∞ Z ∞ ¡ ¢ f (x) 2j/2 φ 2j x − k dx f (x) φj,k (x) dx = yj,k = −∞ Z−∞ ∞ X j/2 f (x) hl 2 φ(2(2j x − k) − l) dx = −∞
=
X l
= =
hl 2j/2
Zl
∞
f (x) φ(2j+1 x − 2k − l) dx
−∞
Z ∞ 1 f (x) 2(j+1)/2 φ(2j+1 x − 2k − l) dx hl √ 2 −∞ l X 1 √ hl yj+1,2k+l . 2 l
X
Tím jsme odvodili algoritmus pro rozklad (analýzu) signálu. Ale m·ºeme jít i v opa£ném sm¥ru a postupn¥ rekonstruovat rozloºený signál. Porovnámeli rovnici (1) pro j0 = l s rovnicí (1) pro j0 = l + 1 dostaneme následující rovnost X X X yl+1,k φl+1,k . xl,k ψl,k = yl,k φl,k + k∈Z
k∈Z
k∈Z
59
Sborník konference REQUEST'06
Na funkce φl,k a ψl,k v p°edchozí rovnosti op¥t aplikujeme waveletovou a ²kálovou rovnici a obdrºíme
X 1 X 1 X (−1)m h1−m φl+1,2k+m = h1−m φl+1,2k+m + xl,k √ yl,k √ 2 2 m m k∈Z k∈Z X = yl+1,k φl+1,k (2)
X
k∈Z
nebo-li po p°e£íslování vnit°ních °ad (abychom mohli snáze porovnávat koecienty)
X
yl+1,k φl+1,k =
k∈Z
=
X 1 X 1 X (−1)m h1−m−2k φl+1,m . (3) hm−2k φl+1,m + xl,k √ yl,k √ 2 2 m m k∈Z k∈Z
X
Nakonec (vzhledem k tomu, ºe jednotlivé posunuté ²kálové funkce jsou navzájem lineárn¥ nezávislé) porovnáme koecienty nap°íklad u funkce φl+1,k a obdrºíme algoritmus pro rekonstrukci signálu
1 X 1 X (−1)m h1−m−2k xl,m . hm−2k yl,m + √ yl+1,k = √ 2 m 2 m
P°íklad 2. P°ipome¬me si je²t¥ ²kálovou a waveletovou rovnici pro Haar·v
wavelet
φ(x) = φ(2x) + φ(2x − 1)
a
ψ(x) = φ(2x) − φ(2x − 1).
Tedy oba p°íslu²né ²kálové koecienty jsou rovny jedné a první waveletový koecient je roven jedné a druhý mínus jedné. Ostatní koecienty jsou rovny nule. Budeme nyní p°edpokládat, ºe vektor [1, 2, 3, 4] reprezentuje koecienty Haarovy ²kálové báze pro j0 = 2 ze vztahu (1) na intervalu [0, 1] a budeme chtít provést waveletovou transformaci tohoto vektoru pomocí
60
D. Černá, V. Finěk: Diskrétní waveletová transformace ...
Haarova waveletu. Postupujeme podle vzorc· odvozených v p°edchozí £ásti a dostaneme ¸ ¸ · · 3 7 −1 −1 1+2 3+4 1−2 3−4 √ √ √ √ √ , √ , √ , √ . , , , = 2 2 2 2 2 2 2 2 Nejprve jsme spo£etli √ sou£et prvního a druhého prvku zadaného vektoru a sou£et jsme vyd¥lili 2, poté√jsme spo£etli sou£et t°etího a £tvrtého prvku a sou£et jsme op¥t vyd¥lili 2. A nakonec jsme √ spo£etli rozdíl prvního a druhého prvku a tento rozdíl jsme vyd¥lili 2, poté √ jsme spo£etli rozdíl t°etího a £tvrtého prvku a rozdíl jsme op¥t vyd¥lili 2. Tím jsme provedli jednu úrove¬ rozkladu, ale m·ºeme pokra£ovat s první polovinou vektoru dále ¸ ¸ · · −1 −1 3 + 7 3 − 7 −1 −1 √ √ √ √ . , = 5, −2, , , , 2 2 2 2 2 2 Dále jiº rozkládat nelze, takºe jsme spo£etli úplný rozklad zadaného vektoru pomocí Haarova waveletu.
4 Srovnání diskrétní waveletové a Fourierovy transformace Uº jsme si °ekli, ºe waveletová transformace má sloºitost O(N ), zatímco Fourierova transformace má sloºitost O(N logN ). Tedy waveletová transformace je rychlej²í. Dal²ím rozdílem je, ºe waveletová transformace má lokální charakter zatímco Fourierova globální. Z toho plyne, ºe waveletová transformace poskytuje lep²í aproximaci nespojitostí. Podívejme se na n¥kolik obrázk·. Na prvním z nich je zadaný signál. Na druhých dvou obrázcích byla na signál aplikována jednak Fourierova a jednak waveletová transformace a bylo ponecháno 20 v absolutní hodnot¥ nejv¥t²ích koecient· z 512. U Fourierovy transformace to znamenalo, ºe byly zanedbány v²echny koecienty, které byly v absolutní hodnot¥ men²í neº 8, 1079. Zatímco u waveletové transformace to znamenalo, ºe byly zanedbány v²echny koecienty, které byly v absolutní hodnot¥ men²í neº 0, 3087. Na t°etí dvojici obrázk· bylo
61
Sborník konference REQUEST'06
1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0
Fourier
0
100
200
300
400
500
Obrázek 4: Studovaný signál D4 wavelet
1.2
1.2
1
1
0.8
0.8
0.6
0.6
0.4
0.4
0.2
0.2
0
0
−0.2
−0.2
0
100
200
300
600
400
500
600
0
100
200
300
400
500
600
Obrázek 5: Ponecháno 20 v absolutní hodnot¥ nejv¥t²ích koecient· z 512. po transformacích ponecháno 60 v absolutní hodnot¥ nejv¥t²ích koecient· z 512. U Fourierovy transformace to znamenalo, ºe byly zanedbány v²echny koecienty, které byly v absolutní hodnot¥ men²í neº 2, 7375. Zatímco u waveletové transformace to znamenalo, ºe byly zanedbány v²echny koecienty, které byly v absolutní hodnot¥ men²í neº 1, 1 × 10−4 . V tomto p°ípad¥ tedy sta£ilo pouºít 60 nejdominantn¥j²ích koecient· k aproximaci studovaného signálu a velikost zbylých 552 koecient· byla zanedbateln¥ malá.
62
D. Černá, V. Finěk: Diskrétní waveletová transformace ...
Fourier
D4 wavelet
1.2
1
1
0.8
0.8 0.6 0.6 0.4 0.4 0.2 0.2 0
0
−0.2
0
100
200
300
400
500
−0.2
600
0
100
200
300
400
500
600
Obrázek 6: Ponecháno 60 v absolutní hodnot¥ nejv¥t²ích koecient· z 512.
5 Zpracování signálu Dosud jsme uvaºovali diskrétní transformaci funkce f a ukázali jsme si, jak lze tuto funkci reprezentovat pomocí waveletové báze nebo pomocí kombinace ²kálové a waveletové báze. Nyní budeme p°edpokládat, ºe máme diskrétní vstupní signál kone£né délky, která je p°irozenou mocninou dvojky. Obvykle se p°edpokládá, ºe jednotlivé hodnoty vstupního signálu odpovídají p°íslu²ným ²kálovým koecient·m. (Nebo si také m·ºeme vstupní signál p°edstavit jako vektor, na který aplikujeme lineární (waveletové) transformace.) Nyní m·ºeme stejným zp·sobem, který jsme popsali v p°edchozí £ásti, provést rozklad diskrétního signálu. Jakmile máme provedený úplný rozklad signálu (tedy rozklad aº na nejniº²í moºnou úrove¬), m·ºeme p°ed provedením rekonstrukce signálu zm¥nit libovolný koecient. M·ºeme nap°íklad celé skupiny koecient· nahradit nulou, nebo nahradit pouze n¥které koecienty nulou, nebo m·ºeme zm¥nit velikost n¥kterých koecient·. Prost¥ m·ºeme s koecienty manipulovat mnoha r·znými zp·soby v závislosti na ú£elu, kterého chceme dosáhnout. Budeme-li dále v textu mluvit o rozkladu signálu, budeme mít vºdy na mysli úplný rozklad. P°i analýze signálu p°edpokládáme, ºe velké waveletové koecienty lépe charakterizují podstatu studovaného signálu neº malé waveletové koecienty.
63
Sborník konference REQUEST'06
5.1 Volba waveletu D·leºitým krokem je volba konkrétního waveletu, které budeme pouºívat pro rozklad signálu. Uve¤me si n¥kolik obecných doporu£ení. Víme, ºe my²lenkou waveletového rozkladu je aproximace signálu ²kálovou funkcí a vyjád°ení detail· prost°ednictvím wavelet·. Pro hladké signály je tedy vhodné vybírat hladké ²kálové funkce. Pokud o£ekáváme, ºe signál bude obsahovat jemné detaily, je rozumné zvolit ²kálovou funkci s krátkým nosi£em, aby nedocházelo k rozmazání signálu. Zvlá²tní p°ípad nastává, m·ºeme-li p°edpokládat, ºe zpracovávaný signál je polynom stupn¥ k. Potom je nejlep²í zvolit wavelet, který má k + 1 nulových moment·, protoºe p°íslu²ná ²kálová funkce aproximuje polynomy do stupn¥ k p°esn¥. P°i rozkladu signálu pomocí tohoto waveletu dostaneme v²echny waveletové koecienty rovny nule. Tuto metodu m·ºeme vyuºít i s p°edpokladem, ºe p·vodní signál je polynomiální pouze na ur£itém intervalu [a, b]. Pak ov²em nulujeme pouze koecienty p°íslu²né wavelet·m, jejichº celý nosi£ je v tomto intervalu obsaºen.
5.2 Zhlazování signálu Zhlazování signálu je zaloºeno na skute£nosti, ºe zatímco waveletové koecienty signálu reprezentují jednotlivé detaily, tak ²kálové koecienty p°edstavují aproximaci zkoumaného signálu. Volbou waveletu a p°íslu²né ²kálové funkce lze ovlivnit dosaºitelnou hladkost £ásti signálu reprezentovanou ²kálovými koecienty (hladkost podstatným zp·sobem závisí na hladkosti zkoumaného signálu). Tato závislost funguje tak, ºe pokud si k analýze signálu vybereme nap°íklad wavelet se t°emi nulovými momenty, potom lze v p°ípad¥, ºe by signál byl tvo°en konstantní, lineární nebo kvadratickou funkcí, tento signál reprodukovat p°esn¥ pouze na základ¥ ²kálových koecient·. V opa£ném p°ípad¥ budou ²kálové koecienty reprodukovat pouze polynomiální £ást (do stupn¥ dva) signálu. Zhlazování signálu tedy provedeme tak, ºe v úplném rozkladu ponecháme ²kálové koecienty plus waveletové koecienty do ur£ité ²kály a ostatní waveletové koecienty reprezentující jemné detaily nahradíme nulami (scale-dependent smoothing).
64
D. Černá, V. Finěk: Diskrétní waveletová transformace ...
5.3 Prahování Zmen²ování velikosti koecient· se v¥t²inou vyuºívá k odstran¥ní ²umu ze signálu. Zahrnuje zmen²ení nebo odstran¥ní vybraných waveletových koecient·. K dispozici je nep°eberné mnoºství metod pro výb¥r a modikaci koecient·. Asi nejpopulárn¥j²í jsou m¥kké a tvrdé prahování. Tvrdé prahování spo£ívá v tom, ºe v²echny waveletové koecienty, které jsou men²í neº zvolený práh λ, nahradíme nulami. To m·ºeme formáln¥ zapsat takto ( 0 pro xj,k < λ, xTj,k = xj,k pro xj,k ≥ λ. M¥kké prahování oproti tvrdému zohled¬uje, ºe v²echny waveletové koecienty obsahují jak signál tak ²um a pokou²í se odstranit ²um ze v²ech koecient·. P°i m¥kkém prahování tedy v²echny koecienty, které jsou men²í neº zvolený práh λ, nahradíme nulami a ostatní posuneme sm¥rem k nule o velikost prahu ( 0 pro xj,k < λ, xM j,k = signum(xj,k )(|xj,k − λ|) pro xj,k ≥ λ. Nevýhodou m¥kkého prahování je, ºe p°i n¥m dochází k v¥t²í ztrát¥ energie (euklidovská norma na druhou) neº p°i tvrdém prahování. Problém je, ºe v praxi v¥t²inou neznáme p°esný tvar signálu ani tvar zkreslujícího ²umu. Volba prahu je proto netriviální a k jeho vhodnému stanovení m·ºeme pouºít r·zná kritéria zaloºená na základ¥ signálu a (nebo) ²umu. Práh m·ºe být nap°íklad konstantní hodnota aplikovaná na v²echny koecienty, nebo jen na koecienty na n¥kterých ²kálách, nebo m·ºe být velikost prahu r·zná pro r·zné ²kály. Velkého pokroku v oblasti potla£ení ²umu dosáhli Donoho a Johnstone ([2], [3]). Navrhli volbu prahu λ, která je zaloºena na následujícím tvrzení.
V¥ta 3. Nech´ e1 , . . . , eM je posloupnost nezávislých náhodných veli£in,
65
Sborník konference REQUEST'06
které mají rozd¥lení N (0, σ 2 ). Pak platí ¶ µ √ lim P max |ei | > σ 2 ln M → 0. i
M →∞
A protoºe u ²umu p°edpokládáme práv¥ normální rozd¥lení N (0, σ 2 ), °íká p°edchozí v¥ta, ºe velikost ²umu v signálu bude√pravd¥podobn¥ men²í √ neº σ 2 ln M . Odtud vychází volba prahu λ = σ 2 ln M . Protoºe ortogonální waveletová transformace nemá vliv na rozd¥lení ²umu, z·stává i hodnota prahu stejná na v²ech úrovních rozkladu (viz. [10] strana 169). Otázkou ov²em z·stává, jak ur£it rozptyl ²umu. Pokud nemáme k dispozici ºádné apriorní informace o moºném rozptylu, je t°eba n¥jakým zp·sobem stanovit odhad. Praktické experimenty ukazují, ºe waveletové koecienty na nejjemn¥j²í úrovni (nejjemn¥j²í detaily) odpovídají tém¥° výhradn¥ ²umu. Z toho d·vodu je odhad rozptylu v¥t²inou po£ítán práv¥ z t¥chto koecient·, nap°íklad jako jejich standardní odchylka. Donoho a Johnstone pouºili ve své práci [3] následující empirický odhad spo£ítali medián absolutních hodnot nejjemn¥j²ích waveletových koecient·, výsledek vyd¥lili hodnotou 0,6745 a tuto hodnotu pouºili jako odhad rozptylu ²umu. Na následujících obrázcích je uveden p°íklad na odstran¥ní ²umu pomocí tvrdého prahování. Vzhledem k tomu, ºe studovaný signál je velmi hladký, je 5 4 3 2 1 0 −1 −2 −3 −4 −5
0
100
200
300
400
500
600
Obrázek 7: P·vodní signál plus bílý ²um s jednotkovým rozptylem. vhodné pouºít wavelet, který má více nulových moment·. V tomto p°ípad¥ jsme zvolili wavelet D14, který má 7 nulových moment·. Byly uºity dv¥
66
D. Černá, V. Finěk: Diskrétní waveletová transformace ...
volby prahu. P°i první volb¥ jsme vyuºili toho, ºe známe velikost rozptylu (jedna). Potom jsme dostali √ √ λ1 = σ 2 ln M = 2 ln 512 ≈ 3, 532230068. (512 je délka signálu.) V druhém p°ípad¥ jsme vyuºili vý²e uvedený odhad 2
2
1.5
1.5
1
1
0.5
0.5
0
0
−0.5
−0.5
−1
−1
−1.5
−1.5
−2
0
100
200
300
400
500
−2
600
0
100
200
300
400
500
600
Obrázek 8: P·vodní signál a signál po odstran¥ní ²umu pomocí waveletu D14. rozptylu ²umu
√ M ED √ λ2 = σ 2 ln M ≈ 2 ln 512 ≈ 3, 296049822. 0, 6745 MED je ozna£ení pro medián absolutních hodnot nejjemn¥j²ích waveletových koecient·. Vidíme, ºe v tomto p°ípad¥ jsou oba odhady prahu podobné a oba odhady vedly k ponechání 12 nejdominantn¥j²ích koecient·.
5.4 Metody redukce dat Technologický pokrok vytvá°í pro rmy i pro jednotlivce p°ístup k cenným informacím o výrobním procesu (o stavu automobilu, ...), které mohou být vyuºity ke zlep²ování kvality, zvy²ování efektivnosti nebo k v£asné detekci závad. S r·stem mnoºství dat rostou nároky na jejich zpracování a analýzu. Z toho d·vodu je nezbytné vyuºívat techniky redukce dat. Jednou z moºností jak sladit protich·dné poºadavky na p°esnost modelu a na redukci
67
Sborník konference REQUEST'06
dat je i diskrétní waveletová transformace. Její nejjednodu²²í vyuºití spo£ívá v tom, ºe p°i analýze získaného signálu vyuºijeme jen n¥kolik procent (nebo dokonce jen n¥kolik desítek) nejdominantn¥j²ích waveletových koecient·. Dal²í moºností je vyuºít k redukci n¥kterou d°íve uvedenou (nebo podobnou) metodu na zhlazování nebo prahování. Nedávno se objevilo n¥kolik zajímavých prací v tomto sm¥ru. První z nich je ²kálogram. kálogram m¥°í energii signálu na r·zných úrovních rozkladu (²kálách). V práci [5] byl navrºen ²kálogram s prahováním a bylo odvozeno asymptotické rozd¥lení ²kálogramu s prahováním. Dal²í moºností popsanou v £lánku [6] jsou odvozené metody pro odhad vhodného prahu, které nevyºadují odhad standardní odchylky.
6 Diagnostika poruch hnací soustavy 6.1 Popis problému V¥t²ina strojních za°ízení obsahuje motor a jiné rotující £ásti. Aby p°i posuzování stavu za°ízení nebylo t°eba toto za°ízení nejprve rozebrat, vyuºívají se k analýze stavu vnit°ních £ástí r·zné signály získané zevnit° stroje. U rotujících za°ízení se k diagnostice poruch obvykle vyuºívá vibra£ní signál. Na obrázku 9 je schéma hnací soustavy, p°i£emº k získávání vibra£ního signálu byl vyuºit akcelerometr. Na získaný vibra£ní signál byla aplikována diskrétní waveletová transformace (s Daubechiovským waveletem D4) a cílem bylo detekovat ²est p°ípad·: A: p°evodovka i loºiska jsou v po°ádku, B: loºiska jsou v po°ádku a závada £íslo 1 na p°evodovce, C: loºiska jsou v po°ádku a závada £íslo 2 na p°evodovce, D: vadná loºiska a p°evodovka je v po°ádku, E: vadná loºiska a závada £íslo 1 na p°evodovce,
68
D. Černá, V. Finěk: Diskrétní waveletová transformace ...
Obrázek 9: Schéma hnací soustavy F: vadná loºiska a závada £íslo 2 na p°evodovce. P°íklady pro v²echny uvedené situace jsou uvedeny na následujících ²esti obrázcích. Z kaºdého signálu bylo vybráno deset nejdominantn¥j²ích koe-
cient· a jejich hodnoty a po°adí byly zvoleny jako vstup pro vícevrstvou neuronovou sí´.
6.2 Vícevrstvá neuronová sí´ - metoda backpropagation Vícevrstvá neuronová sí´ s algoritmem zp¥tného ²í°ení chyby (backpropagation) je nejznám¥j²í a nejpouºívan¥j²í model neuronové sít¥ a vyuºívá se
69
Sborník konference REQUEST'06
ve v¥t²in¥ aplikací. Sí´ má zpravidla n vstupních neuron·, m výstupních neuron· a jednu nebo dv¥ skryté vrstvy. Neurony v jednotlivých vrstvách jsou spojeny perceptrony. Aktiva£ní funkce spojitého perceptronu m·ºe být
70
D. Černá, V. Finěk: Diskrétní waveletová transformace ...
nap°íklad sigmoida denovaná vzorcem:
yj = y(ξj ) =
1 , 1 + e−λξj
kde
• yj jsou aktiva£ní funkce, • xi jsou vstupní data (p°ípadn¥ aktiva£ní funkce v p°ípad¥ druhé a dal²ích vrstev), • λ je parametr strmosti sigmoidy ur£uje nelineární nár·st sigmoidy v okolí bodu nula (míru rozhodnosti neuronu); obvykle se uvaºuje λ = 1,
71
Sborník konference REQUEST'06
Obrázek 10: Schéma dvouvrstvé neuronové sít¥.
• ξj =
P
i wi,j xi
+ bj ,
• bj jsou hledané prahové koecienty, • wi,j jsou hledané váhové koecienty. Dal²í moºnosti volby aktiva£ní funkce p°edstavují nap°íklad skoková funkce, lineární funkce a podobn¥.
Obrázek 11: Sigmoida (λ = 1).
72
D. Černá, V. Finěk: Diskrétní waveletová transformace ...
Stav kaºdého neuronu se pohybuje v rozmezí od 0 do 1. Pokud se hodnota na vstupu neuronu blíºí k ∞, blíºí se výstupní hodnota k 1. Pokud se hodnota vstupu blíºí k −∞, výstup se blíºí k 0. Spoj od neuronu i k neuronu j je ohodnocen váhou wi,j . U£ení sít¥ metodou backpropagation spo£ívá v minimalizaci celkové chyby pro v²echny vzory z trénovací mnoºiny, p°i£emº chyba vzoru p°edstavuje st°ední kvadratickou odchylku vektoru poºadovaných a vypo£tených hodnot, tj. matematicky
E(w) =
1X (y(xi ) − di )2 , 2 i
kde di jsou hodnoty poºadovaných výstup·. P°ed u£ením jsou váhy a prahové koecienty nastaveny náhodn¥. Váhy potom upravujeme nap°íklad tak, ºe od váhy v p°ede²lém kroku ode£teme ur£itý díl derivace chyby podle této váhy reprezentovaný koecientem u£ení. P°itom postupujeme od horních vrstev ke spodním - od toho byl odvozen název metoda zp¥tného ²í°ení chyby. Podrobnosti lze nalézt nap°íklad v [9] nebo v [11].
6.3 Výsledky neuronové sít¥ Pro u£ení i pro testování bylo zvoleno 48 vzork· vibra£ních signál·. Kaºdý z nich obsahoval 6 vzork· pro kaºdou situaci. Na vstupu bylo 20 neuron· a na výstupu 6 neuron·. Neuronová sí´ byla trénována tak, aby pro u£ební vzorek produkovala na p¥ti uzlech nulu a na jednom jedni£ku. P°i£emº pro kaºdý klasikovaný p°ípad byl rezervován jeden výstupní neuron (jedni£ka na prvním výstupním neuronu potom signalizovala, ºe nastává p°ípad A tedy ºe p°evodovka i loºiska jsou v po°ádku). Topologie skryté vrstvy byla ur£ena obvyklou metodou pokus· a omyl· (optimální bylo 14 neuron· ve skryté vrstv¥). Pr·m¥rná úsp¥²nost p°i klasikaci testovacích vzork· byla 96%. Nam¥°ené vibra£ní signály a výsledky neuronové sít¥ byly £erpány z [8].
73
Sborník konference REQUEST'06
7 Záv¥r Diskrétní (rychlá) waveletová transformace se ukázala být velmi ú£inným nástrojem p°i analýze signál· (které nap°íklad nejsou periodické, obsahují ²um, jsou p°eru²ované, ...). Mezi nejuºite£n¥j²í vlastnosti pat°í rychlé algoritmy, rozklad signálu na aproxima£ní £ást (reprezentovanou ²kálovými koecienty) a detaily (reprezentovanou waveletovými koecienty), p°i£emº se ukazuje, ºe v¥t²ina waveletových koecient· je malých (zanedbatelných). Zanedbáním malých koecient· (redukcí dat) získáme kompaktn¥j²í tvar signálu, který m·ºe být vyuºit nap°íklad k úsp¥²né detekci závad hnací soustavy.
Reference
[1] P. Addison: The Illustrated Wavelet Transform Handbook, Bristol and Philadelphia, Institute of Physics Publishing, 2002. [2] D. L. Donoho: De-noising by soft-thresholding, IEEE Transactions on Information Theory 41(3), 613-627, 1995. [3] D. L. Donoho, I. M. Johnstone: Ideal Spatial Adaptation via Wavelet Shrinkage, Biometrika 81(3), 425-455, 1994. [4] M. W. Frazier: An Introduction to Wavelets through Linear Algebra, Springer, 1999. [5] M. K. Jeong, D. Chen, J. Ch. Lu: Thresholded scalogram and its applications in process fault detection, Applied stochastic models in business and industry, 19(3), 231-244, 2003. [6] M. K. Jeong, J. Ch. Lu, B. Vidakovic, D. Chen: Wavelet-Based Data Reduction Techniques for Process Fault Detection, Technometrics, 48(1), 26-40, 2006.
74
D. Černá, V. Finěk: Diskrétní waveletová transformace ...
[7] K. Najzar: Základy teorie wavelet·, Praha, Karolinum, 2004. [8] B. A. Paya, I. I. Esat, M. N. M. Badi: Articial Neural Network Based Fault Diagnostics of Rotating Machinery Using Wavelet Transforms as a Preprocessor, Mechanical Systems and Signal Processing, 11(5), 751765, 1997. [9] J. íma, R. Neruda: Teoretické otázky neuronových sítí, Praha, MATFYZPRESS, 1996. [10] B. Vidakovic: Statistical Modeling by Wavelets, New York, John Wiley & Sons., 1999. [11] I. Vondrák: Um¥lá inteligence a neuronové sít¥, Ostrava, VB TU, 1994.
Adresy autor·:
RNDr. Václav Fin¥k, Ph.D., Mgr. Dana erná, Technická univerzita Liberec, fakulta pedagogická, katedra matematiky a didaktiky matematiky, Hálkova 6, 461 17 Liberec 1. e-mail: vaclav.
[email protected],
[email protected] Tato práce byla vytvo°ena v rámci projekt· MMT £íslo LC06024 a 1M06047.
75
Modelování montážní linky Gejza Dohnal
1. Montážní linka S rozvojem hromadné výroby je velice těsně spojen rozvoj a automatizace výrobních a montážních linek. Tyto linky se od sebe obecně liší jednak topologií (uspořádáním pracovních stanic a pohybem výrobků mezi nimi), jednak okruhem činností, které linka vykonává. Společným prvkem je zpravidla transportní systém (dopravník, vozíky), propojující jednotlivé pracovní stanice. Montážní linka má jeden vstupní uzel, kterým vstupují základní prvky pro montáž, montážní jednotky. V průběhu montážního procesu jsou tyto jednotky doplňovány a upravovány tak, aby na konci linky vystupoval hotový výrobek. Jedna montážní linka obecně umožňuje montáž několika typů výrobků, které se od sebe mohou více či méně lišit. Podle toho, zda je linka určena pro jediný typ výrobků nebo pro několik typů zároveň, označujeme montážní linky jako a) linky s jednoduchým programem (single model assembly line, SMAL), na nichž jsou montovány pouze výrobky jediného typu b) linky se smíšeným programem (mixed model assembly line, MMAL), umožňující montáž několika typů výrobků bez nutnosti změny parametrů linky, přenastavení nástrojů či automatů c) linky s různými programy (multiple model assembly line), které vyžadují při změně typu montovaného výrobku změnu nastavení parametrů, výměnu nástrojů či přeprogramování automatů. Každý z uvedených typů montážních linek vyvolává poněkud jiný okruh problémů a metod k jejich řešení.
76
G. Dohnal: Modelování montážní linky.
Obr. 1. Různé typy montážních linek podle skladby montovaných výrobků. Dalším základním prvkem montážní linky jsou pracovní stanice. Každá pracovní stanice zajišťuje několik operací (činností), při nichž je montážní jednotka doplňována o další komponenty, případně jiným způsobem zpracovávána (obráběna, povrchově upravována, seřizována, nastavována, …). Jedna pracovní stanice obvykle působí v určitém vymezeném prostoru, zahrnujícím část dráhy transportního systému, po předem vymezený čas. Některé typy montážních linek (linky typu U, U-shape assembly line) umožňují působení jedné pracovní stanice na dvou různých místech montážní linky (viz obr. 2), čímž může být zvýšena efektivita linky. Obr. 2. Dva typy montážních linek podle prostorového uspořádání: a) přímá, b) linka typu U. Pracovní stanice jsou zde vyznačeny čárkovaně, jednotlivé operace jako kroužky. Montážní operace v jednotlivých pracovních stanicích vyžadují plynulý přísun montovaných komponent. Tyto komponenty jsou soustřeďovány kolem transportního systému v průběžně doplňovaných zásobnících. V případě linek se smíšeným programem navíc tyto komponenty musejí být v zásobnících řazeny způsobem, odpovídajícím pořadí montovaných typů v transportním systému. Schéma takovéto montážní linky je na obr. 3.
77
Sborník konference REQUEST'06
Obr. 3. Montážní linka MMAL se třemi typy montovaných výrobků, třemi pracovními stanicemi, zásobníky komponent a sklady pro jednotlivé typy výrobků.
2. Řešené problémy S provozem montážních linek je spojena celá řada problémů, řešených pomocí matematických modelů a optimalizačních metod. 2.1. Problém vyvážení linky (balance problem) První skupina problémů, v literatuře označovaná jako SALBP (Simple Assembly Line Balancing Problem), řeší úlohu rozdělení montážních úkonů (operací) mezi pracovní stanice tak, aby byla zachována návaznost operací (podle předem daného schématu, grafu návazností) a nebyl překročen maximálně povolený čas montáže (délku cyklu) na každé stanici na straně jedné a tento čas byl co nejlépe využit na straně druhé. Tyto úlohy sledují některý z následujících cílů: - minimalizaci počtu pracovních stanic při zachování dané délky cyklu - minimalizaci délky cyklu (maximalizaci intenzity produkce) při daném počtu pracovních stanic - současnou minimalizaci délky cyklu a počtu stanic tak, aby byla minimální celková doba prodlevy (nečinnosti pracovních stanic, neefektivita linky)
78
G. Dohnal: Modelování montážní linky.
Příklad: Montážní linka zahrnuje devět operací, jejichž délky (v časových jednotkách) a návaznosti ukazuje následující graf návazností (čísla v oválech označují číslo operace/délka operace). Linka obsahuje pět pracovních stanic S1, S2, S3, S4 a S5. 1/6 3/4
2/6 4/5
7/4 5/4
8/2
9/9
6/5
Jedním z možných řešení problému vyvážení této linky je následující rozdělení operací: S1={1,3}, S2={4,5}, S3={2,7}, S4={6,8}, S5={9}. Minimální délka cyklu je 10 časových jednotek. Obecnější úloha GALBP (General Assembly Line Balancing Problem) zahrnuje další omezení (například prostorové) a podmínky (paralelní stanice, seskupování operací, nekompatibilitu operací, specifitu pracovních stanic). Tyto úlohy a jejich řešení se liší podle konkrétních podmínek montážních linek, nicméně vždy se jedná o optimalizační úlohy. 2.2. Plánování produkce (production planning) a zásobovací strategie (supply policy) V případě linek typu MMAL (obr. 3) se objevují problémy s optimální strukturou produkce (posloupnost jednotlivých typů montovaných jednotek v čase) a problémy spojené se zajištěním dodávky komponent. První skupina úloh závisí na zvolené strategii „výroby na objednávku“ nebo „výroby na sklad“. Z matematického hlediska je zajímavější druhá skupina úloh, hledající optimílní strategie dodávky komponent do zásobníků montážní linky. Komponenty musejí být připraveny k montáži ve správném pořadí tak, aby nedocházelo k prodlevám a k přeplnění zásobníků komponentami určitých typů. 2.2. Optimalizace lidských zdrojů Zajímavý okruh úloh se týká stanovení optimálního počtu pracovníků a jejich specializace tak, aby při výpadku jednoho pracovníka nedošlo k ohrožení provozu linky. To souvisí s optimalizací nákladů na lidské zdroje (mzda, školení, zástupnost, doažitelnost, …)
79
Sborník konference REQUEST'06
3. Hledání kritických míst V následující kapitole se budu blíže zabývat jedním problémem, spojeným se spolehlivostí linky, s hledáním jejích kritických míst. Montážní linku lze v základním tvaru chápat jako tandemovou síť hromadné obsluhy, jejíž jednotlivé prvky jsou tvořeny systémy, které se v teorii hromadné obsluhy označují jako G/G/1/k. Předpokládejme, že linka je tvořena L pracovními stanicemi, mezi nimiž je vždy transportní subsystém. Jak pracovní stanice, tak i transportní subsystém, mají předřazený zásobník s konečnou kapacitou, v němž se mohou hromadit montážní jednotky, čekající na zpracování či na transport. U každé stanice může být navíc kontrolní stanice, která provádí výstupní kontrolu jakosti pro tuto pracovní stanici (obr. 4). pracovní stanice j
Zj
Wj
transportní subsystém j
Cj
Kj
transportní subsystém j+1
pracovní stanice j+1
Zj+1
Tj
Wj+1
Cj+1
Kj+1
Tj+1
Obr. 4. Model montážní linky s omezenými zásobníky a kontrolní stanicí: Zj – zásob-ník před j-tou stanicí, Wj – j-tá pracovní stanice, Cj – kontrola výstupu z j-té stani-ce, Kj – zásobník j-tého transportního subsystému, Tj – j-tý transportní subsystém Tento model předpokládá, že montážní jednotky vstupují do systému pracovní stanice j v časových intervalech, jejichž délka je obecně chápána jako náhodná veličina Aj s rozdělením pravdě-podobnosti s distribuční funkcí Aj(t), j=1,…,L, přičemž na vstupu do montážní linky jsou tyto intervaly vzájemně stochasticky nezávislé. Doba montáže v pracovní stanici je opět náhodná veličina Bj, nezá-vislá na Aj s distribuční funkcí Bj(t) , j=1,…,L. Zavedeme nyní označení, týkající se charakteristik j-tého prvku montážní linky: Nechť λaj ,c aj - intenzita a variační koeficient vstupního proudu montážních jednotek do pracovní stanice j (je to zároveň intenzita a variační koeficient výstupu z prvku j-1)
80
G. Dohnal: Modelování montážní linky.
λdj ,c dj
-
intenzita
a
variační
koeficient
výstupního
proudu
montážních jednotek z pracovní stanice j (intenzita a variační koeficient vstupu do kontrolního stanoviště j) λbj ,c bj - intenzita a variační koeficient výstupního proudu z kontrolní
λcj ,c cj
stanice j (intenzita a variační koeficient vstupu do transportního subsystému j) - intenzita a variační koeficient výstupního proudu
µ j , µˆ j
z transportního subsystému j (je to zároveň intenzita a variační koeficient vstupu do prvku j+1 linky) - intenzita obsluhy pracovní stanice j a transportního
subsystému j n j ,m j - počet jednotek v zásobníku pracovní stanice j a transportního subsystému j N j , M j - kapacity zásobníku pracovní stanice j a transportního subsystému j
λa j ca j
W j
nj, Nj
pj
λd j
µj
cd j
λb j cb j
Vj mj, Mj
µˆ j
qj W j ,V j - doba čekání na zpracování v zásobníku pracovní stanice j a
pj
transportního subsystému j - pravděpodobnost nalezení neopravitelného výrobku kontrolní
qj
stanicí j - pravděpodobnost nalezení opravitelného výrobku kontrolní stanicí j
Označme dále d j , dˆ j - náklady na jednotku objemu zásobníku pracovní stanice j a transportního subsystému j α j , β j - přípustné pravděpodobnosti překročení kapacity zásobníku pracovní stanice j a transportního subsystému j Cílem optimalizační úlohy je potom nalézt minimum funkce L
∑ (d N j
j
+ dˆj M j )
j =1
za splnění podmínek
81
λc j cc j
Sborník konference REQUEST'06 P(n j = N j +1) ≤ α j ,
j =1,K,L,
P(m j = M j +1) ≤ β j , j =1,K,L.
(1)
To znamená, že hledáme nejmenší „přípustné“ kapacity zásobníků, při kterých s předem danou pravděpodobností nedojde k přeplnění zásobníků a tím k zablokování linky. Prvek, který za těchto podmínek vyžaduje největší kapacitu zásobníků, je nejslabším článkem v lince (bottleneck). Mezi výstupní itenzitou λcL a vstupní intenzitou λaL platí následující vztah λcL λa = L ∏ j=1(1− α j )(1− β j )(1− p j ) Za předpokladu, že pravděpodobnosti přeplnění zásobníků jsou nulové, bude λa =
∏
λcL L j=1
(1− p j )
Optimalizační algoritmus potom může probíhat v následujících krocích: 1) Načti vstupní údaje o lince: L, λa ,c a , p j , q j , µ j , µˆ j , α j , β j . Polož
λ1a = λa ,c1a = c a .
2) Pro j=1,…,L postupně 2a) minimalizuj d j N j za podmínky P( n j = N j + 1) ≤ 2b) minimalizuj dˆ j M j za podmínky
αj
P(m j = M j +1) ≤ β j
3) Pro j=1,…,L spočti charakteristiky stanic (průměrný počet jednotek v zásobnících N j , M j , průměrné doby čekání W j ,V j , intenzitu provozu ρ . Hlavní problém spočívá v kroku 2. Pro výpočet pravděpodobností v (1) bychom potřebovali znát rozdělení pravděpodobnosti dob mezi vstupy jednotek do stanice j (= výstupy ze stanice j-1) a jejich stochastickou nezávislost. To však lze předpokládat pouze v případě systémů M/M/1/k. V obecném případě G/G/1/k jsou doby mezi výstupy ze systému závislé a jejich rozdělení pravděpodobnosti nelze „rozumným způsobem“ vyjádřit. Druhý problém lze obejít aproximací rozdělení doby mezi příchody a doby montáže rozděleními fázového typu PH(α,T) a PH(β,S). Rozdělení dob mezi výstupy je potom opět rozdělení fázového typu se známými parametry. Závislost dob mezi odchody v systému G/G/1 je
82
G. Dohnal: Modelování montážní linky.
způsobena tím, že systém může být ve stavu, kdy čeká na příchod montážní jednotky. Pokud by nečekal, potom bude rozdělení dob mezi výstupy shodné s rozdělením dob montáže a tyto doby budou stochasticky nezávislé. V našem případě nás zajímá situace, kdy je systém blízko „přeplnění“, tedy má naplněný zásobník a čekání na příchod montážní jednotky nehrozí. V takovém případě můžeme závislost zanedbat a předpokládat, že doby mezi odchody jednotek ze stanice jsou nezávislé, neboli že doby mezi vstupy do následující stanice jsou nezávislé. Potom můžeme použít následující postup: Ad 2a) Minimalizace výrazu d j N j znamená nalezení nejmenšího Nj takového, že je ještě splněna uvedená podmínka. Splnění této podmínky lze převést na podmínku λaj − λdj ≤ α j. λaj
(2)
d K tomu je třeba spočítat hodnotu intenzity výstupního proudu λ j . d Obecně lze tuto hodnotu spočítat spolu s variačním koeficientem c j
z obecného vztahu pomocí derivací Laplace-Stieltjetsovy transformace F*(t) distribuční funkce F(t) dob mezi odchody:
[
]
λ = −[F *' (0)] , c = λ F *'' (0) − (F *' (0)) .1/ 2 . −1
2
(3) V některých případech lze vztah (3) nahradit analytickým výrazem, jak je tomu například při předpokladu rozdělení fázového typu (viz dále). Prakticky tento krok probíhá tak, že začneme od Nj = 1, pomocí (3) spočteme λdj ,c dj a zjistíme splnění podmínky (2). Není-li splněna, zvýšíme Nj o 1 a vše opakujeme, dokud nebude (2) splněno. Ad 2b) Po ukončení kroku 2a) spočteme λbj ,c bj ze vztahů
λbj = (1 − p j )λdj , cbj = [ p j + (1 − p j )(c dj ) 2 ]
1/ 2
c c a postupným výpočtem λ j , c j a zvyšováním hodnoty Mj od 1, dokud
nebude platit nerovnost analogická (3): λbj − λcj ≤ β j. λbj
Za předpokladu například useknutého normálního rozdělení doby montáže, rovnoměrného rozdělení a řady jiných, je velmi proble-
83
Sborník konference REQUEST'06
matické vyjádření distribuční funkce F(t) a její L-S transformace. Poněkud jednodušší situace je při použití rozdělení fázového typu. 4. Aproximace rozdělením fázového typu Definice: Náhodná veličina Y má rozdělení fázového typu (PH rozdělení) s reprezentací (α,T) řádu p, dá-li se interpretovat jako doba do absorpce Markovova procesu s p+1 stavy, z nichž stav (p+1) je absorpční, s počátečním rozdělením (α, α0) a maticí intenzit přechodů
⎛ T T0 ⎞ ⎜ ⎟ ⎜0 0 ⎟. ⎝ ⎠ Poznámka: Je-li matice T regulární, potom jsou stavy 1, …, p přechodné a veličina Y je s pravděpodobností 1 konečná (viz [1]). Charakteristiky PH rozdělení: Označme e vektor samých jedniček. (i)
Distribuční funkce náhodné veličiny Y má tvar
(ii)
Hustota pravděpodobnosti náhodné veličiny Y je rovna
(iii)
F ( y ) = 1 − α exp(Ty )e F (y) = 0
f ( y ) = α exp(Ty )T 0 e f (y) = 0
y≥0 y<0
Budeme-li interpretovat Y jako dobu do poruchy, potom intenzitu poruchy lze vyjádřit vztahem
r ( y) = (iv)
y≥0 y<0
f ( y) α exp(Ty )T 0 = 1 − F ( y) α exp(Ty )e
Je-li T regulární, potom Laplaceova transformace PH rozdělení má tvar ∞
∫e
− sy
F (dy ) = α ( sI − T) −1 T 0
0
(v)
Je-li T regulární, má náhodná veličina Y všechny momenty konečné a
mk = EX k = (− 1) k!αT − k e k
k ∈N
Lze ukázat, že množina rozdělení fázového typu je hustá v množině všech spojitých rozdělení na intervalu 0, ∞) . To znamená, že libo-
84
G. Dohnal: Modelování montážní linky.
volné spojité rozdělení na 0, ∞) lze aproximovat libovolně přesně nějakým rozdělením fázového typu. Tato aproximace ovšem není jednoznačná a v některých případech může být konvergence k limitnímu rozdělení velmi pomalá. Nicméně, pro řadu obvyklých rozdělení lze tuto aproximaci nalézt poměrně dobře (viz [2]). 5. Závěr V případě montážní linky s ne-exponenciálními rozděleními doby montáže a dob mezi vstupy montážních jednotek do linky lze nalézt kritická místa pomocí algoritmu, naznačeného v kapitole 3. Tento algoritmus lze zjednodušit aproximací rozdělení doby montáže a doby mezi příchody jednotek do systému rozdělením fázového typu. Literatura
[1] Neuts, M. F. (1981). Matrix geometric solutions in stochastic models. Johns Hopkins University Press, Baltimore, MD [2] Johnson, M. A., Taaffe, M. R., The denseness of phase distributions. Research Memorandum No. 88-20, School of Industrial Engeneering, Purdue University [3] Asmussen, S., Olsson, M., Nerman, O., Fitting Phase-type Distributions via the EM Algorithm. Scandinavian Journal of Statistics 23 [4] Dohnal G., Meca M.: Fitting Distribution of Nonnegative Random Variable with PH-distribution. Workshop CTU 2002 [5] Dohnal G., Meca M.: Aproximace obecných systémů hromadné obsluhy pomocí EM algoritmu. ROBUST 2002, JČMF, 87-94 Adresa autora: Doc. RNDr. Gejza Dohnal, CSc., České vysoké učení technické v Praze, Fakulta strojní, Ústav technické matematiky, Karlovo nám. 13, 121 35 Praha 2 e-mail: gejza.
[email protected] Tato práce byla vytvořena za podpory projektu MŠMT 1M06047 - CQR
85
Podnikové procesy a jejich spolehlivost Radim Flegl
1.
Úvod
Jak již napovídá název „Centrum pro jakost a spolehlivost výroby“, je předmětem činnosti CQR řešení problémů spojených s jakostí a spolehlivostí, zaměřené na výrobu. V ISQ PRAHA jsme si vytkli za cíl vytvořit metodický materiál, který by řešil problematiku spolehlivosti výrobních procesů. Spolehlivost procesů je problematika odlišující se od problematiky spolehlivosti technických systémů. Spolehlivost technických systémů (výrobní zařízení atp.) do ní vstupuje jako jeden z možných vlivů. Řešení spolehlivosti procesů rozšiřuje koncept procesního řízení organizace dle norem řady ISO 9000:2000. Péče o spolehlivost procesů je jedním z hledisek neustálého zlepšování procesů v organizaci. Náš výzkumný úkol zahrnuje teoretická východiska řešeného problému a návrhy metod použitelných k řešení v manažerské praxi. Výstupem bude tedy metodika, jak přistupovat k problematice spolehlivosti procesů, jak ji hodnotit a měřit a jakých metod využívat při jejím zlepšování. 2.
Význam spolehlivosti podnikových procesů
Spolehlivost podnikových procesů podmínkou nutnou k realizaci jakostní produkce ve vymezeném čase. Spolehlivost dodávky zákazníkovi*) je spolu s jakostí a cenou kritériem konkurenceschopnosti, tudíž i kritériem přežití podniku. Zejména v oblasti automobilního průmyslu je časové hledisko stěžejní a v současné době velmi aktuální z toho důvodu, že pláno*)
Spolehlivost je podle posledního návrhu normy IEC 56/946/DC definována jako schopnost provádět požadované funkce, když je to požadováno - v případě dodavatelsko-odběratelských vztahů je to tedy schopnost dodávat zboží nebo poskytovat služby, když je to požadováno.
86
R. Flegl: Podnikové procesy a jejich spolehlivost.
vání výroby je v tomto odvětví obvyklé realizovat systémem Just-inTime, tedy s minimálními výrobními zásobami. Produkty je zákazníkovi nutné předat v poměrně přesně vymezeném čase, zpravidla přímo na výrobní pás. Zpoždění dodávky ohrožuje realizaci výrobních procesů zákazníka (náhlý nedostatek materiálu může i zastavit celou výrobní linku). Vyvolané ekonomické škody se potom zákazník snaží přenést na svého subdodavatele, který je svojí opožděnou dodávkou způsobil. Naopak předčasná dodávka je rovněž nežádoucí, protože zákazník nemá vybudovány dostatečné skladovací kapacity pro takovéto nadnormativní výrobní zásoby. Přitom je potřeba si uvědomit, že dodavatelé automobilního průmyslu bývají na svých zákaznících poměrně závislí (málo odběratelů s velkými objemy zakázek) a ztráta zákazníka může tedy znamenat vážné ekonomické potíže či dokonce i zánik organizace. Jak vyhovět rostoucímu důrazu na přesnost dodávek v čase? Při současném tlaku na snižování nákladů zákazníky (z důvodu globalizačních tlaků na trhu) není možné problém, jako bylo zvykem dříve, řešit prostřednictvím pojistných zásob, protože ty, jak je známo z ekonomické teorie, krom vyvolání vlastních skladovacích nákladů vedou navíc i k vázání oběžného kapitálu, a celkovému zvýšení nákladů. Jedinou správnou odpovědí na tuto výzvu globálních trhů je tedy optimalizace podnikových procesů z hlediska jejich spolehlivosti, tak abychom měli jistotu (byť s určitou mírou zbytkového rizika), že podnikové vstupy budou transformovány na výstupy (produkty) v plánovaném čase a zákazník bude v plánovaném termínu uspokojen. Poměrně podrobně byla v minulosti rozpracována teorie spolehlivosti v oblasti zkoumání spolehlivosti technických objektů a systémů. Průkopnickými se v této oblasti staly obory, jako je letecký, jaderný či automobilní průmysl, kde případné selhání produktu má společensky nepřijatelné následky, nebo elektronika, kde je zájem o spolehlivost vynucen vysokou složitostí a komplexností těchto systémů. Spolehlivosti procesů byla doposud věnována pozornost jen okrajově. 3.
Cíle pro výzkum
Cílem projektu je vytvořit metodologii pro hodnocení spolehlivosti podnikových procesů a pro následné zvyšování spolehlivosti těchto procesů. Výstupem bude teoreticko-metodologický materiál popisu-
87
Sborník konference REQUEST'06
jící komplexní přístup k problematice spolehlivosti podnikových procesů. Práce tématicky navazuje na procesní řízení, které je považováno za moderní přístup k řízení podniku (např. dle norem řady ISO 9000:2000) a dále je rozvíjí z hlediska managementu spolehlivosti. Náš projekt přistupuje k problematice jakosti procesů z nového úhlu pohledu. Spolehlivost je znakem jakosti procesu stejně jako znakem jakosti výrobku. Spolehlivost procesu zároveň určitým způsobem odráží jeho stabilitu, a její hodnocení by se tedy mělo stát důležitým prvkem při hodnocení jeho způsobilosti. Projekt je zaměřen na metodiku zlepšování podnikových procesů s důrazem na zvyšování jejich spolehlivosti. Zabývá se tedy i metodami analýzy procesů a zlepšování procesů v organizaci. Hlavním cílem našeho projektu je navrhnout metodologii pro zvyšování spolehlivosti podnikových procesů zahrnující: 1)
Analýzu podnikových procesů:
2)
vybrané metody pro analýzu procesů v organizaci, modifikace těchto metod s ohledem na analýzu spolehlivosti, doporučení pro aplikaci těchto metod. Hodnocení spolehlivosti podnikových procesů:
3)
kategorizace procesů z hlediska hodnocení jejich spolehlivosti, metody pro hodnocení spolehlivosti procesů, ukazatele spolehlivosti podnikových procesů. Analýzu příčin nespolehlivosti podnikových procesů:
4)
metody pro analýzu příčin nespolehlivosti,
modifikace těchto metod pro analýzu příčin nespolehlivosti podnikových procesů.
Zlepšování spolehlivosti podnikových procesů:
metody zlepšování procesů, modifikace těchto metod pro zlepšování spolehlivosti podnikových procesů.
88
R. Flegl: Podnikové procesy a jejich spolehlivost.
4.
Hypotézy
Na základě rozboru řešené problematiky jsme dospěli k několika základním hypotézám, které mají zásadní význam pro vyřešení zvoleného úkolu: 1. Aby bylo možné spolehlivost procesů zlepšovat, je třeba ji nejprve nějakou metodou měřit. Předpokládáme, že ke kvantifikaci spolehlivosti procesů bude možné za určitých podmínek analogicky využít některých metod a přístupů známých z oblasti teorie spolehlivosti technických systémů. Vzhledem k rozmanitosti charakteru podnikových procesů bude třeba určit podmínky využití těchto metod, jejich vhodnost podle jednotlivých typů procesů atp. 2. Prvním krokem ke zlepšení spolehlivosti procesů je poznání příčin jejich nespolehlivosti. Předpokládáme, že k analýze příčin nespolehlivosti procesů bude možné za určitých podmínek analogicky využít některých metod a přístupů známých z oblasti spolehlivosti technických systémů či japonských metod analýzy nejakosti. 3. Následný krokem ke zlepšení spolehlivosti procesů jsou opatření zabraňující jejich nespolehlivosti. Předpokládáme, že ke zlepšování spolehlivosti procesů bude možné za určitých podmínek analogicky využít některých metod a přístupů známých z oblasti péče o jakost či japonských metod zdokonalování podniků. 4. Spolehlivost procesu je komplexnějším pojmem než spolehlivost technických systémů. V oblasti spolehlivosti procesů se plně projevuje systém „člověk-stroj-prostředí“. Složky „člověk“ a „prostředí“ jsou v oblasti spolehlivosti technických systémů chápány spíše okrajově jako provozní podmínky, resp. Požadavky na obsluhu a údržbu. Selhání způsobené obsluhou kupř. nebývá chápáno jako nespolehlivost zařízení, ale jako vnější faktor. Oproti tomu pojem spolehlivosti procesu zahrnuje všechny tři složky. Na základě obecně platných zkušeností předpokládáme, že lidský faktor bude mít, přinejmenším u určitých typů procesů, rozhodující vliv na jejich spolehlivost.
89
Sborník konference REQUEST'06
5.
Pojem spolehlivosti procesu
5.1 Spolehlivost definovaná jako dosahování výstupů procesu Hlavní podstatou procesu je transformace vstupů na výstupy*). Spolehlivost procesu tedy vyjadřuje časovou stabilitu tohoto děje vyjadřuje pravdě-podobnost že k této transformaci v určitém časovém úseku dojde (splnění požadavku na výstup z procesu). Pokud dojde k situaci, že výstupy z procesu nejsou v souladu s požadavky na výstupy, jedná se o poruchu procesu. V takovém případě je potřeba proces nebo jeho část zopakovat. Speciálním případem poruchy procesu je zpoždění oproti plánu. Jsou-li poruchy procesu systematické, jedná se o mezní stav procesu a je nutné proces předefinovat. FAKTORY OKOLÍ
VSTUP
PROCES
VÝSTUPY
VLIV NA OKOLÍ
Obr. č. 1 – Transformační model procesu 5.2 Spolehlivost definovaná jako spolehlivost obsluhy Druhou možností je „zákaznický“ pohled na spolehlivost procesu. Vycházíme z toho, že proces poskytuje určité „služby“ interním nebo externím zákazníkům. Na spolehlivost procesu tedy můžeme nahlížet i jako na spolehlivost služby1 a dále ji členit na pohotovost procesu a nepřetržitost procesu. Dále navrhuji do spolehlivosti procesu v širším smyslu zahrnout i integritu procesu. *)
V oblasti podnikových procesů je proces obvykle definován jako uskupení činností (souběžně i následně probíhajících), které mají logický výstup s užitkem pro zákazníka. 1
Chodounský, J.: Spolehlivost služby.Praha, Česká společnost pro jakost 1998, ISBN 80-02-01197. (s.8)
90
R. Flegl: Podnikové procesy a jejich spolehlivost.
Pohotovost procesu: představuje schopnost poskytnutí služby (provedení určitých činností) v požadované kvalitě za daných podmínek, je-li vyžádána interním či externím zákazníkem resp. dán signál k její realizaci. Tato vlastnost je závislá na vlastnostech objektů, jejichž prostřednictvím se služba/činnost provádí. Nepřetržitost procesu: představuje schopnost již zahájenou službu/činnost provádět v daných podmínkách po požadovanou dobu, tj. nedojde k selhání procesu. Integrita procesu: vyjadřuje schopnost provádět činnosti bez mimořádných zhoršení tj. ve stálé jakosti. 6.
Ukazatele pro hodnocení spolehlivosti procesů
Návrh ukazatelů spolehlivosti procesu je třeba realizovat vždy s ohledem na charakter a podmínky daného procesu. Pro hodnocení jejich spolehlivosti považuji za účelné rozdělit procesy do následujících skupin: 1. procesy kontinuální, 2. procesy opakované, 3. procesy jednorázové. 6.1 Hodnocení spolehlivosti kontinuálních procesů V oblasti kontinuálních procesů je možné s výhodou použít aparát teorie spolehlivosti, jak jej známe z hodnocení spolehlivosti technických systémů. K hodnocení spolehlivosti kontinuálního procesu přistupujeme jako k hodnocení spolehlivosti obnovovaných objektů. 6.2 Hodnocení spolehlivosti opakovaných procesů K hodnocení procesů, které se pravidelně či nepravidelně v životě podniku opakují je rovněž vhodné využít aparát teorie spolehlivosti, jak jej známe z hodnocení spolehlivosti technických systémů. V tomto případě, vzhledem k situaci střídání provozu procesů a obdobími klidu, jeví jako nejvhodnější pro posouzení spolehlivosti těchto procesů zejména ukazatele pohotovosti a operační
91
Sborník konference REQUEST'06
pohotovosti. Ukazatele bezporuchovosti a udržovatelnosti je možné rovněž využít, pokud je to vhledem k charakteru procesů účelné. 6.3 Hodnocení spolehlivosti jednorázových procesů Spolehlivost jednorázových (neopakovaných) procesů lze hodnotit v případě, že se jedná o procesy složité, mající např. charakter projektu. Pro hodnocení spolehlivosti těchto procesů navrhuji rozdělit poruchy na: a) kritické, b) méně významné. Kritická porucha určité činnosti může na dlouhou dobu vyřadit z provozu celý rozsáhlý proces. Méně významné poruchy mohou způsobit vícenáklady a průtahy při realizaci procesu. Pro hodnocení spolehlivosti procesu z hlediska kritických poruch navrhuji využít metodu blokových schémat spolehlivosti, kde se snažíme z pravděpodobnosti selhání dílčích činností usoudit na pravděpodobnost selhání procesu jako celku. Při hodnocení spolehlivosti z hlediska méně významných poruch, které mohou znamenat spíše průtahy než celkové selhání, je možné využít metodu PERT (Program Evaluation and Review Technique). Základem metody PERT je síťový graf. Síťový graf je vhodným nástrojem pro stanovení optimálního harmonogramu průběhu složitých činností a jejich následné monitorování. Na rozdíl od metody CPM (Critical Path Method - metoda kritické cesty) vychází metoda PERT, při časové analýze ze stochastického chápání dob trvání činností, a tedy umožňuje určité pravděpodobnostní výpočty ohledně doby trvání projektu, a tedy vyjádřit určitým způsobem i spolehlivost procesu. 7.
Zvyšování spolehlivosti procesů
7.1 Faktory ovlivňující spolehlivost podnikových procesů Vlivy na spolehlivost procesu rozčlenit například do následujících šest základních kategorií, které souvisí se 6 základními otázkami (viz obr. č. 2): 1. Materiál: Z čeho se to dělá? 2. Stroje a vybavení: S čím to dělá? 3. Prostředí procesu: Kde se to dělá?
92
R. Flegl: Podnikové procesy a jejich spolehlivost.
4. Lidský faktor: Kdo to dělá? 5. Postupy: Jak se to dělá? 6. Informace: Na základě jakých informací? Informace
Postupy
Lidský faktor SPOLEHLIVOST PROCESU
Materiál
Stroje a vybavení
Prostředí procesu
Obr. č.2 - Základní kategorie diagramu příčina-následek pro analýzu spolehlivosti procesu Podle těchto kategoriích je vhodné také strukturovat opatření pro zvyšování spolehlivosti procesů.
7.2
Metodický postup pro zvyšování spolehlivosti podnikových procesů Pro zvýšení spolehlivosti celkového podnikového procesu, tj. výroby a dodávání produktů zákazníkům, je třeba především přestat pohlížet na podnik jako na tzv."černou skříňku" přeměňující vstupy na výstupy a pohlédnout do jeho útrob jako na složitý kybernetický systém. Výsledný dodavatelský proces je totiž výsledkem složení celé řady dílčích výrobních i nevýrobních procesů. Na spolehlivosti těchto dílčích procesů závisí spolehlivost celku. Zde přeneseně platí ona okřídlená poučka o pevnosti řetězu: "Řetěz je tak pevný jako jeho nejslabší článek". Samozřejmě nezáleží jen na spolehlivosti dílčích procesů jako takových ale i na jejich správném propojení a řadě dalších faktorů. Zkušenost podnikové praxe říká, že, mají-li být problémy mající složitou strukturu úspěšně vyřešeny, je třeba aplikovat nějaký systematický přístup. Je tedy potřeba navrhnout metodický postup Ke zvýšení spolehlivosti celkového podnikového procesu navrhujeme realizovat následující kroky:
93
Sborník konference REQUEST'06
1. Dekomponovat celkový podnikový proces na dílčí podnikové procesy. 2. Kategorizovat tyto dílčí procesy podle jejich funkce: a) hlavní procesy, b) podpůrné procesy, c) řídící procesy. 3. Analyzovat posloupnost a návaznosti těchto procesů z hlediska: a) vstupů a výstupů procesů, b) časového sledu (posloupnost, procesy paralelní a sériové). 4. Určit kritické procesy z hlediska: a) významu (např. pomocí metody FMEA), b) časového (např. pomocí síťové analýzy metodou kritické cesty), c) nahraditelnosti / zálohovatelnosti. 5. Dekomponovat tyto kritické procesy na dílčí složky (např. pomocí Ishikawova diagramu) – například již výše zmíněných 6: a) spolehlivost strojů, zařízení a vybavení, b) spolehlivost lidského činitele, c) kvalita vstupního materiálu, d) spolehlivost a kvalita informačních vstupů, e) kvalita výrobních postupů a dokumentace, f) kvalita okolního prostředí. 6. Určit, které z těchto faktorů jsou v daných procesech rozhodující. 7. Zvolit vhodné metody pro analýzu možnosti zvyšování spolehlivosti určených kritických faktorů. 8. Naplánovat a zrealizovat zlepšování. 9. Přezkoumat účinnost. 8.
Závěr
Co říci závěrem? Péče o spolehlivost podnikových procesů může být jedním z hledisek zlepšování procesů v rámci QMS podle ISO 9000:2000. Představuje trochu netradiční pohled na problematiku řízení podnikových procesů resp. procesního managementu, ale význam takovýchto aktivit vzrůstá s postupně narůstajícím tlakem na dosahování spolehlivosti v dodavatelsko-odběratelských vztazích.
94
R. Flegl: Podnikové procesy a jejich spolehlivost.
Literatura: [1]
GALLOWAY, D.: Mapping Work Processes. Milwaukee, ASQC Quality Press 1994, ISBN 0-87389-266-6, 89 s.
[2]
GARSCHA, J.B.: Rozvoj organizace pomocí managementu procesů. Překlad něm. orig., vydaného v r. 2002 ÖVQ Training & Certif., Rakousko. Praha, Česká společnost pro jakost 2003, ISBN: 80-0201581-9, 226 s.
[3]
CHODOUNSKÝ, J.: Spolehlivost služby.Praha, Česká společnost pro jakost 1998. ISBN 80-02-01197, 71 s.
[4]
ISHIKAWA, K.: Co je celopodnikové řízení jakosti? Japonská cesta. České Budějovice, Bartoň QSV 1994, ISBN 80-02-00974-6, 175 s.
[5]
KRÁL, O.-MERTA, J.: Informace v současnosti jako zdroj konkurenční výhody, model pro zavedení a správu efektivního systému bezpečnosti informací v organizaci. In: Sborník semináře Soudobé trendy v jakosti řízení XII. Zlenice, ISQ PRAHA, s.r.o. 2004, s. 52-67.
[6]
MAJER,P.: Moderní metody rozvrhování výroby. Brno, 2003. 90 s. Disertační práce, VUT Brno, Fakulta strojního inženýrství. Ústav automatizace a informatiky. Školitel RNDr. Jiří Dvořák, CSc.
[7]
MELAN, E.H.:Process Management. Methods for Improving Products and Service. New York, Mc.Graw-Hill, Inc. 1993, ISBN 007-041339-8, 262 s.
[8]
MYKISKA, A.: Spolehlivost v systémech jakosti. Praha, Vydavatelství ČVUT 1995, ISBN 80-01-01262-X, 103 s.
[9]
MYKISKA, A., et al.: Řízení a zabezpečování jakosti. Praha, Vydavatelství ČVUT 1998, ISBN 80-01-01720-6, 112 s.
[10] MYKISKA, A.: Identifikace, analýza a ošetření rizik v reprodukčním procesu. In: Sborník semináře Soudobé trendy v řízení jakosti XI. Zlenice, ISQ PRAHA, s.r.o. 2003, s. 1-21. [11] MYKISKA, A.: Bezpečnost a spolehlivost technických systémů. Praha, Vydavatelství ČVUT 2004, ISBN 80-01-02868-2, 206 s. [12] NENADÁL J.: Měření v systémech managementu jakosti. Praha, Management Press 2001, ISBN 80-7261-054-6, 310 s. [13] PANDE, P.S. - NEUMANN, R.P. - CAVANAGH, R.R.: Zavádíme metodu Six Sigma. Přeložil Ing. M. Lhoták, MSc. a kol. Brno, TwinsCom 2002, ISBN 80-238-9289-4, 416 s.
95
Sborník konference REQUEST'06
[14] PLURA, J.: Plánování a neustálé zlepšování jakosti. Praha, Computer Press 2001, ISBN 80-7226-543-1, 244 s. [15] SHINGO, S.: Zero Quality Control: Source Inspection and the Pokayoke System.Portland, Oregon, Productivity Press 1986, ISBN 0915299-07-0, 303 s. Adresa autora: Ing. Radim Flegl, ISQ PRAHA, s.r.o., Pechlátova 19, 150 00 Praha 5 e-mail:
[email protected] Tato práce byla vytvořena za podpory projektu MŠMT 1M06047 - CQR
96
Problematika zavádění statistických metod Petra HALFAROVÁ, Milan HUTYRA
Abstrakt: Dnes si již bez použití jednoduchých statistických veličin nedokážeme představit řízení podniku. Ovšem pokročilejší tatistické metody mnohdy zůstávají neoprávněně na okraji zájmu. U mnohých statistických metod nejsou plně využívány jejich veškeré možnosti nebo jsou tyto statistické metody aplikovány nesprávným způsobem, což většinou vede k předčasnému rozhodnutí o ukončení využívání těchto metod, případně špatné interpretaci výsledků.
Při vyslovení slova statistika mnohým naskočí husí kůže. Cokoliv, co se týká matematiky je pro mnohé obestřeno tajemstvím a vystačí si s poznáním pojmu průměr. Ovšem mnozí tuto prvotní nechuť již překonali a věřím, že malé procento z nich objevilo krásu matematiky a jejich aplikací. V oblasti řízení jakosti hrají statistické metody neopomenutelnou úlohu. Prvotní rozmach zavádění statistických metod, který se týkal především velkých firem mnohdy se zahraničním kapitálem, je již určitě za námi. A tyto firmy také většinou úspěšně užívají výsledky a vyhodnocení, které jim používání statistických metod přináší. Pochopili, že „nutnost“, s kterou je zaváděli, přešla v užitečnost. Oblast statistických metod potkává některé zaměstnance každodenně a již si nedokážou představit svou práci bez jejich využívání. V malých a středních firmách je situace o něco složitější. Mnohé menší firmy statistické metody míjejí úplně, některé se pokoušejí „něco“ měřit a případně i vyhodnocovat, jiní již za sebou mají úspěšnou prvotní zkušenost a pokračují dále. Každá z firem si ale prošla všemi fázemi, které jsou obvyklé při prosazování jakékoliv změny či novinky. Některé firmy jsou stále ještě na cestě, jiné už u pomyslného konce. Pro většinu malých a středních firem je zavádění statistických metod nelehkou cestou. Mnozí ji naštěstí berou jako výzvu a nenechají se odradit prvním neúspěchem či problémem a každý, byť i
97
Sborník konference REQUEST'06
sebemenší krůček je žene dopředu. I oni ale narážejí v jakékoliv fázi zavádění těchto metod na problémy a bariéry. A je to na nich jak se s nimi vypořádají. Tab.1: Fáze prosazování statistických metod Stav Charakteristika stavu K čemu nám to bude? My to určitě nevyužijeme. Odmítavý postoj Stálo by nás to značné úsilí a peníze, které se nám určitě nevrátí. Možná bychom to i využili. Tání ledu Když to mají oni. Taky by nám to mohlo pochybnosti pomoci. Tak, už to měříme. Začínáme a měříme Měříme a uvidíme co s těmi daty budeme provádět dál. Měření je pro nás samozřejmostí a data se Měříme a pokoušíme snad správně vyhodnotit. vyhodnocujeme Měříme a vyhodnocujeme. Vyhodnocujeme a Měříme, vyhodnocuje a výsledky plně využíváme využíváme vyhodnocení
První problém - finance Prvním výrazným problémem, který napadne téměř každého jsou finance. Zvláště menší firmy pociťují tento problém jako významný, a jen velmi těžko jej překonávají. Uvědomují si, že tak jako všechno, i zavádění statistických metod, je bude stát nemalé finanční prostředky. To samozřejmě ano - nákup techniky, zaškolení pracovníků či případné zakoupení vhodného software, to vše jsou pro firmy náklady. Jsou to ale náklady, které se firmě vrátí zpět. Je to investice do budoucna. Pro podniky střední velikosti je finanční hledisko také důležité, ale dokáží ho překonat daleko rychleji, především díky svému kapitálovému zázemí. Jindy na podniky tlačí zákazníci a odběratelé, či obchodní partneři. Finanční stránku řeší podniky nejenom při zavádění statistických metod, ale také ve fázi již probíhajících měření a vyhodnocování. Nejčastěji je to v souvislosti dalšího vzdělávání a školení
98
P. Halfarová, M. Hutyra: Problematika zavádění statistických metod.
zaměstnanců, nebo při zakoupení nového softwaru na analýzu a zpracovávání dat. To jsou jistě nemalé finanční položky, které firma ráda investuje, za předpokladu viditelných výsledků. Pokud si management firmy uvědomí, že výsledky statistického zpracování jsou nápomocny v dalším řízení a rozhodování, jistě tuto investici schválí i v budoucnosti. To samozřejmě zvyšuje šance na vynaložení dalších finančních prostředků týkajících se oblasti zavádění a využívání statistických metod. Tab.2: První problém finance nákup techniky – počítače, monitory
FINANCE
školení zaměstnanců – odborná školení či intenzivní kurzy pro zaměstnance týkající se statistických metod software – zakoupení vhodného software na statistické vyhodnocování dat
Ačkoliv by se na první pohled mohlo zdát, že jedinou a také největší bariérou jsou finance, není tomu tak. Hraji bezesporu významnou roli, avšak častokrát významnější úlohu hraje samotný lidský faktor. Druhý problém – lidský faktor Primární příčinou, která ovlivňuje významnou měrou statistické výsledky jsou samotní lidé, tedy zaměstnanci. První skupinu tvoří především zaměstnanci, kteří mají na starosti samotné měření dat. Jsou to právě oni, na nichž závisí zda následný výsledek statistického zpracování, bude přesný a použitelný. Jedno ze základních pravidel statistiky hovoří právě o tom, že statistický výsledek bude vypovídající, pokud pracuji s přesnými a skutečnými vstupními daty. Pokud tedy při měření selže konkrétní pracovník a jeho lajdácky vyplněné záznamy budeme zpracovávat, dopustíme se chyb a nepřesností, aniž to tušíme. Nezodpovědným přístupem můžeme rozumět např. samotný špatný odečet z měřidla, měření s nedostatečnou přesností, nedodržování časových harmonogramů stanovených pro měření, nečitelný záznam, případně neprovedení
99
Sborník konference REQUEST'06
samotného měření vůbec a následné doplnění záznamů smyšlenými hodnotami. Druhou skupinou tvoří lidé, kteří již naměřená data zpracovávají. Měli by to být lidé s odpovídajícími znalostmi a dovednostmi, lidé, kteří zvládají danou oblast statistiky na určité úrovni. Pokud bude data zpracovávat někdo, kdo si není jistý v základních principech matematické statistiky, může dojít k nesprávnému použití některých statistických metod či nesprávné interpretaci příslušného statistického postupu. Tab.3: Druhý problém lidský faktor lajdácký a špatný odečet z měřidla
LIDSKÝ FAKTOR
měření s nedostatečnou přesností Lidé měřící data
nedodržení časového harmonogramu nečitelný záznam
Lidé zpracovávající data
nevyplnění záznamu vůbec a následné vyplnění záznamu smyšlenými hodnotami nesprávné použití statistických metod nesprávná interpretace výsledků
Existuje mnoho oblastí statistiky, kde se nezkušený zaměstnanec může potýkat s problémy. Jedná se o nevhodné použití příslušných nástrojů matematické statistiky většinou plynoucí z nedostatečné či povrchní znalosti dané problematiky. Uvedu zde jen některé problémy, na které může dotyčný při zpracování dat narazit. Jedním ze sedmi základních nástrojů managementu jakosti je histogram, který je velmi častým používaných grafických nástrojem pro zobrazení naměřených dat. Ovšem nesprávně zvolená šířka třídy, může snížit informace, kterou nám histogram může poskyt-nout. V případě, že vytvoříme příliš málo intervalů, tak nám získaný histogram neposkytne očekávanou informaci o charakteru rozdě-
100
P. Halfarová, M. Hutyra: Problematika zavádění statistických metod.
lených dat, naopak pokud vytvoříme zbytečně mnoho tříd, bude histogram příliš členitý a jeho využitelnost bude taktéž malá. Také vybočující měření mohou značně zkreslit výsledky ať už u výpočtu rozptylu či nám mohou způsobit nemalé problému u regulačních diagramů. Přitom prokazatelně odlehlou hodnotu můžeme ze souboru dat vyřadit. Je ovšem nutné vždy brát v úvahu skutečnost, za které nám odlehlá hodnota vznikla. Někdy omylem můžeme vyřadit hodnoty, které se nám zdají být odlehlé, ovšem ve skutečnosti nám poskytnou důležitou informaci. Velmi často mohou odlehlé hodnoty vzniknout omylem například špatným zapsáním desetinné čárky či odhadem nečitelného zápisu. Bodový odhad střední hodnoty nebo rozptylu velmi málo vypoví o množství dat, které se zpracovávají. Vhodnější je využití intervalu spolehlivosti, v němž skutečná hodnota leží s velkou pravděpodobností. Málo využívané bývají i robustní charakteristiky. V případech, kdy máme podezření, že v datech jsou odlehlé nebo chybné hodnoty, je medián daleko vhodnější pro popis daného souboru než běžně používaná střední hodnota. Stejně dobře nám poslouží i uřezaný průměr, který se počítá jako běžný průměr, v němž nejsou brány v úvahu okrajové hodnoty. S výše uvedenými oblastmi statistiky se potká každý, kdo se rozhodne zpracovávat data a využívat statistický software. Každý software mu poskytne hromadu výsledků, ovšem je na samotném pracovníkovi, aby se sám rozhodnul, zda právě tento výsledek je ten nejvhodnější a zda technika, kterou zvolil je právě ta jediná nejlepší.
Třetí problém – volba softwaru Dalším úskalím, které vstupuje do problematiky zpracování dat je volba vhodného softwarového produktu na zpracovávání naměřených dat. Statistický software k zpracovávání dat rozdělit na dvě základní skupiny. Prvním je běžně dostupný komerční software v kancelářských aplikacích, např. MS Office. Jedná se především o aplikace tabulkových procesorů jako např. nejznámější MS Excel. Druhou skupinu tvoří úzce specializované produkty na zpracování dat jako Statgraphics, Statistica, QC Expert nebo SPSS, nebo komplexní produkty pro řízení jakosti obsahující i nástroje pro analýzu dat (Palstat caq).
101
Sborník konference REQUEST'06
Mezi výše uvedenými dvěmi skupinami je však podstatný rozdíl. Začíná-li někdo zpracovávat data, nejjednodušší a nejdostupnější nabízející se volbou je využití zmíněného tabulkového procesoru MS Excel. Prvotní nadšení opadá, jakmile uživatel zjistí, že veškeré algoritmy pro výpočty je nucen si sám vytvořit a to za použití funkcí nebo za pomoci implementovaného makro jazyka. Uživatel může rovněž využít standardně implementované nástroje pro analýzu dat, avšak jejich nabídka je omezená. Pro firmy začínající se zaváděním statistických metod se může zdát MS Excel jako velmi vhodný nástroj, ale časem dojdou ke zjištění, že na složitější statistické metody je třeba mít značné znalosti obecné teorie příslušné problematiky. Na základě těchto skutečností dojdou k závěru, že tabulkový procesor je pro ně nedostačující a jsou nuceni sáhnout ke specializovaným programům. V současné době je k dispozici poměrné široká nabídka statistických aplikací se zaměřením na oblast řízení jakosti. Mezi nimi lze najít i kvalitní produkty v češtině. Úskalím se může jevit ovládání programu, které se však stane jasným a srozumitelným po vhodném proškolení. Daleko obtížnějším úkolem je správně porozumět výstupům programu a následně je správně interpretovat. Tab.4: Třetí problém volba softwaru na zpracování dat
VOLBA SOFTWARU
Běžně dostupný komerční software
MS Excel Statistica QC Expert
Specializovaný statistický software
Statgraphics SPSS Palstat caq
102
P. Halfarová, M. Hutyra: Problematika zavádění statistických metod.
S výše nastíněnými problémy se může podnik setkat jak při zavádění, tak i při každodenním užívání statistických metod. Chceme-li minimalizovat výše uvedené úskalí při zavádění statistických metod, měli bychom apelovat na etiku a znalosti konkrétních zaměstnanců, a v neposlední řadě přesvědčit vedení o tom, že investice do statistických metod je rentabilní.
Literatura: [1] Hendl, J.: Přehled statistických metod zpracování dat : analýza a metaanalýza dat. 1. vydání. Praha: Portál 2004. 583s. ISBN 80-7367-123-9 [2] Kupka, K.: Statistické řízení jakosti. Pardubice: TriloByte. 191s. ISBN 80-238-1818-X [3] Plura, J.: Plánování a nestálé zlepšování jakosti. 1. vydání. Praha: Computer Press 2001. 244s. ISBN 80-7226-543-1
Adresy autorů: Ing. Petra Halfarová, Vysoká škola báňská – Technická univerzita Ostrava, Fakulta metalurgie a materiálového inženýrství, katedra kontroly a řízení jakosti, Tř.17.listopadu 15, 708 33 Ostrava-Poruba.
e-mail:
[email protected] Doc. Ing. Milan Hutyra, CSc., Vysoká škola báňská – Technická univerzita Ostrava, Fakulta metalurgie a materiálového inženýrství, katedra kontroly a řízení jakosti, Tř.17.listopadu 15, 708 33 Ostrava-Poruba.
e-mail:
[email protected] Tato práce byla vytvořena v rámci projektu MŠMT 1M06047 - CQR.
103
Statistická analýza výroby a povlakování pístků
Václav Chmelík Úvod Statistická analýza výroby je důležitý prostředek pro poznání stavu výrobních procesů. Bez důkladné analýzy není možné seriozně vyhodnotit stav jakéhokoliv procesu a učinit následná rozhodnutí. Pro seriozní analýzu jsou ale potřeba také seriozní data, tj. data, která nejsou zatížena chybami. Za předpokladu, že měřidlo použité pro měření sledovaného znaku(ů) je správně kalibrováno, může být výsledek ovlivněn chybou měřidla, tedy jeho rozptylem a chybou osoby, která měření provádí. Na ověření, zda je měřidlo pro dané měření vhodné je možné použít např. koeficienty způsobilosti měřidla cg, cgk. Další metodou, která umožní posoudit, zda je měřidlo pro daný účel vhodné a zda není měření ovlivněno operátorem je metoda R&R (Reproducibility&Repeability). Může se však stát, že ani splnění požadavků uvedených metod nemusí stačit. Následující příspěvek ukazuje, že je nutné brát zřetel i na vlivy, které jsou uvedenými metodami nepostižitelné.
Výsledky měření Výsledky měření, které budou dále uvedeny se týkají měření průměrů hliníkových válečků. Válečky byly vyráběny ve dvojicích soustružením s předepsanými parametry: průměr: (31,862±0,005) mm, obvod.házení: (0,005÷0,030) mm, kruhovitost: 0,01mm. Výrobní dávkou bylo 16 ks dvojválečků. Každý váleček byl měřen na dvou místech, celkem tedy 64 hodnot z dávky. Pro měření byla použita měřidla: - indukčnostní snímač TESA s rozlišením 0,001 mm v pistolovém držáku pro usnadnění a urychlení měření, - vzduchový snímač Air Micro se snímači v diferenciálním zapojení s rozlišením 0,0001 mm.
104
V. Chmelík: Statistická analýza výroby a povlakování pístků.
Všechna vyhodnocení a grafy jsou zpracovány v programu Minitab, verze 14. Probability Plot of podskupiny 1 Normal - 95% CI 99,9
Mean 31,86 StDev 0,002545 N 64 AD 1,313 P-Value <0,005
99
Percent
95 90 80 70 60 50 40 30 20 10 5 1 0,1
31,855
31,860
31,865 podskupiny 1
31,870
31,875
Obr. 1 Na obrázku 1 jsou pomocí pravděpodobnostního grafu znázorněny výsledky měření dávky pomocí snímače TESA. Hodnota jsou rozděleny do 11 tříd a jejich rozdělení není symetrické ačkoliv není žádný důvod proč by průměr měl mít nesymetrické rozdělení. Podobně při zobrazení hodnot v histogramu a výpočtu koeficientů způsobilosti na obr. 2 Process Capability of podskupiny 1 (using 95,0% confidence) LSL
USL Within Overall
Process Data LSL 31,857 Target * USL 31,867 Sample Mean 31,8635 Sample N 64 StDev (Within) 0,00264085 StDev (Ov erall) 0,00255476
Potential (Within) Cp Lower CL Upper CL CPL CPU Cpk Lower CL Upper CL
Capability 0,63 0,50 0,76 0,82 0,45 0,45 0,32 0,57
Ov erall Capability
31,857 31,859 31,861 31,863 31,865 31,867 31,869 Observ ed Perf ormance PPM < LSL 0,00 PPM > USL 109375,00 PPM Total 109375,00
Exp. Within Perf ormance PPM < LSL 7152,74 PPM > USL 90584,12 PPM Total 97736,86
Exp. Ov erall Perf ormance PPM < LSL 5670,06 PPM > USL 83451,38 PPM Total 89121,44
Obr. 2
105
Pp Lower CL Upper CL PPL PPU Ppk Lower CL Upper CL Cpm Lower CL
0,65 0,54 0,77 0,84 0,46 0,46 0,35 0,58 * *
Sborník konference REQUEST'06
Sledovaná dávka byla změřena měřidlem Air Micro s výsledky: Probability Plot of N podskupiny 1 Normal - 95% CI 99,9
Mean 31,86 StDev 0,001600 N 64 AD 0,395 P-Value 0,362
99 95
Percent
90 80 70 60 50 40 30 20 10 5 1 0,1
31,8550
31,8575
31,8600 31,8625 N podskupiny 1
31,8650
31,8675
Obr. 3
Process Capability of N podskupiny 1 (using 95,0% confidence) LSL Process LSL Target USL Sample Mean Sample N StDev (Within) StDev (Ov erall)
USL
Within Overall
Data 31,857 * 31,867 31,8616 64 0,0015238 0,00160596
Potential (Within) Cp Lower CL Upper CL CPL CPU Cpk Lower CL Upper CL
Capability 1,09 0,86 1,32 1,00 1,19 1,00 0,77 1,23
Ov erall Capability
5 ,8 31 Observ ed Perf ormance PPM < LSL 0,00 PPM > USL 0,00 PPM Total 0,00
70
5 ,8 31
85
6 ,8 31
Exp. Within Perf ormance PPM < LSL 1339,45 PPM > USL 185,30 PPM Total 1524,75
00
6 ,8 31
15
,8 31
0 63
6 ,8 31
45
Exp. Ov erall Perf ormance PPM < LSL 2194,51 PPM > USL 365,03 PPM Total 2559,54
6 ,8 31
60
Pp Lower CL Upper CL PPL PPU Ppk Lower CL Upper CL Cpm Lower CL
1,04 0,86 1,22 0,95 1,13 0,95 0,76 1,13 * *
Obr. 4 Hodnoty měřené Měřidlem Air Micro vykazují normální rozdělení a koeficienty způsobilosti a výkonnosti jsou výrazně lepší.
106
V. Chmelík: Statistická analýza výroby a povlakování pístků.
Při hledání příčin rozdílů v uváděných výsledcích bylo rozhodnuto proměřit další geometrické charakteristiky sledovaných součástí tj. pístků. Geometrické charakteristiky strojních součástí jsou: - rozměry s jejich tolerancemi, - úchylky tvaru a polohy, - struktura povrchu. Na pístcích byla měřena jejich kruhovitost a vlnitost povrchu ve směru osy pístku. Pro měření kruhovitosti byl použit kruhoměr Taylor Hobson Talyrond 30 s nastavením podmínek: referenční kružnice MCC, filtrace 1 – 15 upr (1 – 15 vln na obvod). Vlnitost byla měřena na dotykovém profiloměru Talysurf 6 firmy Taylor Hobson za podminek: základní délka 2,5 mm, vyhodnocovaná délka 12,5 mm.
Obr. 5
107
Sborník konference REQUEST'06
Nastavené podmínky zahrnují do vyhodnocení v obou případech spíše nerovnosti s větší vlnovou délkou. Uvedené průběhy úchylek (obr. 5,6,7) ukazují, že další geometrické charakteristiky (úchylka kruhovitosti a vlnitost povrchu) mohou ovlivnit výsledky měření rozměrů i když vyhovují zadané specifikaci s rezervou.
Obr. 6 Pozn.: úchylka kruhovitosti je P-V (peak to valey) Místa měření byla náhodně vybrána, hodnoty úchylek kruhovitosti jsou velmi podobné, liší se průběh profilu resp. jejich tvar. Podobně průběhy vlnitosti opět na dvou náhodně vybraných místech.(Obr. 7)
108
V. Chmelík: Statistická analýza výroby a povlakování pístků.
Obr. 7 Stejně byla analyzovány pístky povlakované vrstvou teflonu (po vytvrzení a osoustružení vrstvy) tedy pístky s povrchem, se kterým půjdou na konečnou montáž. Pro měření byla použita stejná měřidla a nastaveny stejné podmínky. Dále jsou uvedeny pouze grafické výstupy. Obr. 8 a 9 ukazuje rozdělení hodnot průměru naměřených měřidlem TESA, obr. 10,11 rozdělení hodnot naměřených měřidlem Air Micro . Probability Plot of podskupiny 3 Normal - 95% CI 99,9
Mean 31,98 StDev 0,001006 N 64 AD 3,319 P-Value <0,005
99
Percent
95 90 80 70 60 50 40 30 20 10 5 1 0,1
31,973 31,974 31,975 31,976 31,977 31,978 31,979 31,980 31,981
podskupiny 3
Obr. 8
109
Sborník konference REQUEST'06
cess Capability of podskupiny 3 Proc (using 95,0% c onfidence) US L
LSL Proces s LSL Target USL Sample Mean Sample N StDev (Within) StDev (Ov erall)
Within Overall
Data 31,974 * 31,982 31,9769 64 0,000849927 0,00100993
Potential (Within) Cp Lower CL Upper CL CPL CPU Cpk Lower CL Upper CL
Capability 1,57 1,24 1,90 1,15 1,99 1,15 0,90 1,41
Ov erall Capability
31,974 ormance Observ ed Perf o 0,00 PPM < LSL 0,00 PPM > USL 0,00 PPM Total
31,976
Exp. Within Perf ormance 273,95 PPM < LSL 0,00 PPM > USL 273,95 PPM Total
31,978
31,980
Exp. Ov erall Perf ormance 1815,23 PPM < LSL 0,27 PPM > USL 1815,49 PPM Total
Obr.. 9
Obr. 10
110
31,9 82
Pp Lower CL Upper CL PPL PPU Ppk Lower CL Upper CL Cpm Lower CL
1,32 1,09 1,55 0,97 1,67 0,97 0,78 1,16 * *
V. Chmelík: Statistická analýza výroby a povlakování pístků.
Probability Plot of N podskupiny 3 Normal - 95% CI 99,9
Mean 31,98 StDev 0,001005 N 64 AD 0,420 P-Value 0,316
99 95
Percent
90 80 70 60 50 40 30 20 10 5 1 0,1
31,977 31,978 31,979 31,980 31,981 31,982 31,983 31,984 31,985 31,986
N podskupiny 3
Obr. 11 Obr. 12,13 ukazuje průběh kruhovitosti na dvou náhodně vybraných místech, obr. 14 průběhy vlnitosti na dvou opět náhodně vybraných místech povrchu.
Obr. 12
111
Sborník konference REQUEST'06
Obr. 13 Výsledky vyhodnocení ukazují podobné rozdíly a nesrovnalosti jako u nepovlakovaných pístků, u hodnot naměřených měřidlem Air Micro je výrazný posun hodnot k horní hranici specifikace.
Obr. 14
112
V. Chmelík: Statistická analýza výroby a povlakování pístků.
Závěr Pro vysvětlení nesrovnalostí je nutné vzít v úvahu: - různou rozlišovací schopnost použitých měřidel (0,001/0,0001 mm), - různý tvar a velikost měřicích dotyků (TESA ploché dotyky o velikosti ~ 12 mm, Air Micro průměry trysek < 1 mm, - různé velikosti úchylek kruhovitosti a různé tvary profilů v různých místech měřených pístků, - různé hloubky vln a průběhy vlnitosti na různých místech povrchu. Při náhodném působení výše uvedených faktorů může dojít k rozdílům ve vyhodnocovaných parametrech. Uvedený příspěvek si neklade za cíl vysvětlit vliv uvedených faktorů. To by vyžadovalo velmi důkladnou a pracnou metrologickou a statistickou analýzu, vyžadující větší počet měřených součástí. Autor chce pouze upozornit na nutnost znalosti geometrických charakteristik hodnocených součástí a tomu je potom nutno přizpůsobit metodiku měření (např. měřit ve stejném místě nebo ve stejné poloze, volba měřicích dotyků, rozlišovací schopnost apod.). Tyto požadavky je možné zevšeobecnit a jejich význam roste s nároky na přesnost hodnocených součástí. Ne vždy stačí pouhé formální splnění požadavků na opakovatelnost měřidla a reprodukovatelnost operátorů. Literatura: [1] Smejkal, T.: Analýza procesu výroby pístků v podniku Valeo Compressor Europe s. r. o. Diplomová práce FS ČVUT v Praze 2006 [2] Filip, J.: Analýza procesu povlakování pístů v podniku Valeo Compressor Europe s. r. o. Diplomová práce FS ČVUT v Praze 2006 Adresa autora: Ing. Václav Chmelík, CSc., České vysoké učení technické v Praze, fakulta strojní, Ústav strojírenské technologie, Technická 4, 160 00 Praha 6. e-mail:
[email protected] Tato práce byla vytvořena za podpory projektu MŠMT 1M06047 - CQR
113
Hodnocení přesnosti výsledků z metody FMECA Josef Chudoba
1. Úvod Metoda FMECA je semikvantitativní metoda, pomocí které se identifikují poruchy s významnými důsledky ovlivňující funkci systému. Závažnost následků poruchy se popisuje kritičností. Existuje několik tříd nebo úrovní kritičnosti v závislosti na nebezpečích a snížení provozuschopnosti systému a někdy též na pravděpodobnosti výskytu. Při zadávání kritičnosti se dopouštíme dvou základních chyb. První je, že se špatně odhadne hodnota kritičnosti. Tato chyba vznikne, jestliže jednotlivých úrovní kritičnosti je velké množství. Druhá chyba vzniká velkou zaokrouhlovací chybou vstupů a tím zároveň výstupu. Této chyby se autor dopustí, jestliže jednotlivých úrovní kritičnosti je málo. Omezením velikosti jedné chyby roste vliv druhé. Cílem této práce je popsat způsob zjištění velikosti druhé chyby. Předpokládá se, že autor neudělá chybu při zadávání vstupních dat. K určení celkového výsledku rizikovosti se využívá jednoduchých matematických vzorců. Například sčítání nebo násobení jednotlivých rizikovostí. Další variantou je určení speciálního vzorce podle fyzikálně/ekonomicko/-bezpečnostní podstaty úlohy. Tento příspěvek se bude zabývat určením přesnosti pomocí poslední, třetí varianty. Byla řešena testovací úloha, která se zabývala finančním zjištěním škody, při uzavření dopravního úseku z nějaké příčiny. Finanční škody jsou dány několika faktory, například: hustotou dopravy, frekvencí událostí, finanční škodou, délkou objížďky a zdravotní újmou. Každý tento faktor je bodově ohodnocen a podle daného vzorce je přiřazena výsledná diskrétní bodová hodnota.
114
J. Chudoba: Hodnocení přesnosti výsledků z metody FMECA.
2. Hodnocené faktory Ke každému objektu a hodnocené události, jejíž výskyt je na objektu reálně možný, se zvažují následující faktory: 1. Intenzita výskytu události [h-1] 2. Náklady na obnovu [Kč] 3. Vícenáklady na objížďku [Kč/h] 4. Hustota dopravy [1] 5. MTTR - doba do obnovy [h] 6. Vliv na bezpečnost / životy [Kč] Ke každému z výše uvedených faktorů byla vytvořená bodová stupnice v rozsahu 1 až 5. Rozdělení do pětistupňové škály nevyžaduje přehnané nároky na hodnotitele a navíc poskytuje dostatečnou přesnost výsledků prováděných analýz. 2.1 Intenzita výskytu události Vytvořená stupnice je přibližně logaritmická s přihlédnutím na běžně používané časové jednotky.
2.2 Náklady na obnovu Náklady na obnovu jsou tzv. jednorázové náklady - tyto náklady nejsou závislé na času, po který bude obnova probíhat.
115
X1
Intenzita výskytu události
1
1x za 100 let
2
1x za 10 let
3
1x za rok
4
1x za měsíc
5
1x za týden a častěji
X2
Náklady na obnovu
1
do 10 000 Kč
2
do 100 000 Kč
3
do 1 000 000 Kč
4
do 10 000 000 Kč
5
nad 10 000 000 Kč
Sborník konference REQUEST'06
2.3 Vícenáklady na objížďku Vícenáklady na objížďku jsou X3 Vícenáklady na objížďku re-prezentovány rozdílem dédo 10km 1 lek tras (původní trasa a do 20km objížďka) v kilometrech. 2 Spodní hranice (do 10km) se do 50km 3 bude vztahovat především na do 100km 4 silnice nižších tříd, kde je silniční síť hustší, naopak nejnad 100km 5 vyšší hodnota (nad 100km) bude ve většině případů reprezentovat objížďku po železniční síti. 2.4 Hustota dopravy Hodnotící stupnice hustoty dopravy byla vytvořena na základě údajů ze statistických ročenek Ministerstva dopravy ČR.
X4
Hustota dopravy
1
do 5 ks/h
2
5 až 50 ks/h
3
30 až 150 ks/h
4
I.třída (100 až 2 000 ks/h)
5
dálnice (1 000 až 5 000 ks/h)
2.5 MTTR - doba do obnovy Doba do obnovy je čas od X5 vzniku nežádoucí události až 1 po plné zprovoznění hodnoceného objektu. 2
MTTR - doba do obnovy 8 hodin den
3
týden
4
měsíc
5
rok
116
J. Chudoba: Hodnocení přesnosti výsledků z metody FMECA.
2.6
Vliv na bezpečnost / životy
Vliv na bezpečnost, případně životy lidí, se hodnotí pro fázi vzniku nežádoucí události. Zdravotní následky způsobené během obnovy/opravy v analýze zanedbáváme
X6
Vliv na bezpečnost / životy
1
poškození zdraví bez trvalého následku
2
poškození zdraví s trvalými následky
3
úmrtí jedné osoby
4
úmrtí 2-10 osob
5
úmrtí 11-100 osob
Transformace semikvantitativního hodnocení na kvantitativní výpočet Sestavení modelu, který by F1 Intenzita výskytu události 1/h počítal pouze s bodovým F2 Náklady na obnovu Kč ohod-nocením F3 Vícenáklady na objížďku Kč/ks jednotlivých faktorů, by bylo velmi složité. Bylo by F4 Hustota dopravy ks/h nutné správně zvolit váhoF5 MTTR - doba do obnovy h vé faktory a dále také uvažovat, zda je stupnice F6 Vliv na bezpečnost / životy Kč zvolena lineárně, logaritmicky atd. Jednodušší a přesnější variantou je převod na čistě kvantitativní hodnocení. Uvažované faktory tedy vyjádříme v jednotkách dle následující tabulky. 3.
3.1
Intenzita výskytu události
X1
Pravděpodobnost nastoupení jevu
1/h
1
1x za 100 let
1,0E-06
2
1x za 10 let
1,0E-05
3
1x za rok
1,0E-04
4
1x za měsíc
1,0E-03
5
1x za týden a častěji
1,0E-02
117
Sborník konference REQUEST'06
3.2
Náklady na obnovu
X2
Náklady na obnovu
Kč
1
do 10 000 Kč
5,00E+03
2
do 100 000 Kč
5,00E+04
3
do 1 000 000 Kč
5,00E+05
4
do 10 000 000 Kč
5,00E+06
5
nad 10 000 000 Kč
5,00E+07
Vícenáklady na objížďku
3.3 X3
Vícenáklady na objížďku
Kč
1
do 10km
45
2
do 20km
135
3
do 50km
315
4
do 100km
675
5
nad 100km
1350
X4
Hustota dopravy
ks/h
1
do 5 ks/h
3
2
5 až 50 ks/h
30
3
30 až 150 ks/h
100
4
I.třída (100 až 2 000 ks/h)
1000
5
dálnice (1 000 až 5 000 ks/h)
2500
Hustota dopravy
3.4
118
J. Chudoba: Hodnocení přesnosti výsledků z metody FMECA.
MTTR – doba do obnovy
3.5 X5
MTTR – doba do obnovy
h
1
8 hodin
6
2
den
24
3
týden
100
4
měsíc
1000
5
rok
10000
3.6 X6
Vliv na bezpečnost / životy Vliv na bezpečnost / životy
Kč
1
poškození zdraví bez trvalého následku
2,0E+04
2
poškození zdraví s trvalými následky
2,0E+05
3
úmrtí jedné osoby
2,0E+06
4
úmrtí 2-10 osob
2,0E+07
5
úmrtí 11-100 osob
2,0E+08
4. Model výpočtu rizika V případě, že se úspěšně provedl převod na bodové hodnoty viz. kap.3, je již snadné získat rizikové číslo hodnocené nežádoucí události. Součinem jednotkových vícenákladů na objížďku (F3) a hustotou dopravy (F4) získáme hodinové ztráty z objížďky. Po vynásobení dobou do obnovy (F5) již máme celkové náklady z objížďky v Kč. F3 * F4 * F5 Jednorázové náklady na obnovu (F2) a vliv na bezpečnost/životy (F6) jsou již v Kč, je tedy možné je pouze přičíst. F2 + F3 * F4 * F5 + F6 V této chvíli jsou již známy finančně ohodnocené důsledky z analyzované události. Tyto důsledky se násobí intenzitou výskytu události, čímž se získá rizikové číslo v Kč/h. R = F1 * (F2 + F3 * F4 * F5 + F6) Jak bylo již zmíněno, ke každému objektu lze analyzovat více
119
Sborník konference REQUEST'06
nežádoucích událostí. V tomto případě je pak výsledné rizikové číslo objektu dáno součtem všech dílčích rizikových čísel analyzovaných událostí na příslušném objektu: Rv = Σ Ri 5.
Zpětný přepočet výsledného rizika do bodové stupnice R [Kč/h]
R [bod]
R [Kč/h]
R [bod]
0,025 až 0,1
1
25 až 100
6
0,1 až 0,4
2
100 až 400
7
0,4 až 1,6
3
400 až 1 600
8
1,6 až 6,4
4
1 600 až 6 400
9
6,4 až 25
5
více než 6 400
10
6. Metodika zjišťování chyby Základem metodiky je namodelování mnoha fiktivních scénářů (pro matlabovskou simulaci jich bylo použito 10 000 000), kde se předpokládá znalost skutečné finanční, hodinové, frekvenční hodnoty události. Na základě těchto přesných vstupů se vypočte výsledná škoda dopravní infrastruktury v korunách za hodinu. Při znalosti škody dopravní infrastruktury v korunách za hodinu se přiřadí události výsledná bodová hodnota dle tabulky 3. Pomocí tohoto postupu se zjistí přesná hodnota rizika kritičnosti dopravní infrastruktury. Dle tabulky 4.1 až 4.6 v [1] se pro každý scénář finančním, hodinovým, frekvenčím vstupním hodnotám přiřadí bodové ohodnocení. Na základě tohoto bodového ohodnocení se vybere hodnota, která reprezentuje celý interval. Pomocí této hodnoty se získá odhad celkové škody dopravní infrastruktury v korunách za hodinu. Následně ze znalosti celkové škody dopravní infrastruktury se přiřadí odhadovaná bodová hodnota rizika kritičnosti dopravní infrastruktury - tabulka 3. Pro každý scénář se vytvoří rozdíl v absolutní hodnotě přesné hodnoty rizika a odhadované bodové hodnoty rizika. Pro všechny scénáře se vytvoří součet vzniklých rozdílů a zjistí se střední hodnota odchylky odhadované a přesné kritičnosti dopravní infrastruktury.
120
J. Chudoba: Hodnocení přesnosti výsledků z metody FMECA.
6.1 Určení skutečných vstupních dat Odhad hodnot pro každý fiktivní scénář byl řešen na základě náhodných čísel rovnoměrného rozdělení v rozmezí 0,1 a příslušné transformace, která upraví náhodné číslo do reálné hodnoty daného faktoru. Protože všechny faktory mají exponenciální stupnici v rámci jednoho bodu, byla navržena exponenciální transformace. Náklady na údržbu jsou v rámci jednoho bodu v rozmezí 103 až 104, 104 až 105, 105 až 106, 106 až 107, 107 až 108Kč. Příslušná transformace z náhodného čísla má následující vzorec: F x = 10 ( k 1 * nahcislo
)+ k2
nejvyssi ) nejnizsi k 2 = log nejnizsi
k 1 = log(
kde nejvyšší/nejnižší označuje maximální/minimální hodnotu, kterou lze zadat pro daný parametr. Výhoda této transformace je, že hodnoty jsou náhodné a zároveň respektují exponenciální tvar stupnice. Každý interval je zastoupen přibližně stejným množstvím hodnot. Parametry k1 a k2 jsou uvedeny v následující tabulce:
Fx
k1
k2
Fx
k1
k2
1
4
-6
4
3
0,47
2
4
-3,7
5
3,4
0,6
3
1,5
1,65
6
4
4,3
Příklad: Na základě náhodných čísel z rovnoměrného rozdělení se určí hodnoty parametrů Fx. Náhodná čísla jsou například 0.8451, 0.3443, 0.5356, 0.1077, 0.3307, 0.1389. Těmto náhodným číslům odpovídají následující hodnoty: F1= 0,002401 1/h
F2= 119500 Kč
F3= 284,1 Kč
F4= 6,210 ks/h
F5= 53,05 h
F6= 71710 Kč
Nevýhodou těchto dat je, že se předpokládá nezávislost jednotlivých parametrů F1 až F6. Tento předpoklad plně nevystihuje reálnou situaci. Systém popisuje všechny scénáře jako stejně pravděpodobné, což není ve skutečnosti pravda.
121
Sborník konference REQUEST'06
6.2 Výpočet skutečné kritičnosti dopravní infrastruktury Výsledná skutečná kritičnost se vypočítá podle vzorce (2), který je již uveden ve zprávě Hodnocení kritičnosti dopravní infrastruktury [1]. R = F1 * (F2 + F3 * F4 * F5 + F6) Pomocí vzorce (2) se vypočítají celkové škody za hodinu a na základě velikosti této škody je přidělena kritičnost scénáře. Kritičnost scénáře je označena 1 až 10. V kapitole 3.1 bylo uvedeno, že v simulacích vznikají i scénáře, které jsou silně nepravděpodobné. Skutečná kritičnost některých scénářů je výrazně vyšší než bodové označení 10, proto byla bodová škála rozšířena na 13 stupňů. Jednotlivé bodové hodnoty kritičnosti jsou uvedeny v tabulce 3. Škody min
Škody max
Škody min
Škody max
R=1
0
0,025 Kč
R=2
0,025 Kč
0,10 Kč
R=3
0,10 Kč
0,40 Kč
R=4
0,40 Kč
1,60 Kč
R=5
1,60 Kč
6,40 Kč
R=6
6,40 Kč
25 Kč
R=7
25 Kč
100 Kč
R=8
100 Kč
400 Kč
R=9
400 Kč
1600 Kč
R=10
1600 Kč
6400 Kč
R=11
6400 Kč
25 000 Kč
R=12
25 000 Kč
100 000 Kč
R=13
100 000 Kč
400 000 Kč
Tab 3.: Kritičnost scénářů při známých škodách za hodinu Z dat v odstavci 3.1 a na základě vzorce (2) se zjistila celková hodnota škody dopravní infrastruktury za hodinu. Tato škoda je 638,80 Kč za hodinu. Tato částka odpovídá bodové hodnotě 9 kritičnosti dopravní infrastruktury. 6.3 Výpočet odhadované kritičnosti dopravní infrastruktury Z náhodných čísel se po transformaci zjistily hodnoty parametrů F1 až F6. Podle [1] lze každou hodnotu zařadit do bodové stupnice 1 až 5 každého parametru. Každý tento parametr má stanovenu střední hodnotu. S pomocí této střední hodnoty a vzorce (2) se vypočítá odhadovaná škoda dopravní infrastruktury. Odhadované škody dopravní infrastruktury lze zařadit do tabulky kritičností dopravní
122
J. Chudoba: Hodnocení přesnosti výsledků z metody FMECA.
infrastruktury. Na základě vstupních dat příkladu je celková odhadovaná škoda: R=F1*(F2+F3*F4*F5+F6)=0,001*(500 000+315*30*100+200 000)= = 1645Kč/hod. Podle výsledku je kritičnost dopravní infrastruktury ohodnocena 10 body. 6.4 Určení výsledků přesnosti kritičnosti Pro každý scénář byl vypočten v absolutní hodnotě rozdíl odhadované a skutečné kritičnosti. Sečtením těchto rozdílů přes všechny scénáře byla zjištěna střední hodnota rozdílů odhadované a skutečné kritičnosti. Střední hodnota rozdílu byla na základě 107 simulací odhadnuta na 0,6335. 7. Závěr Bylo zjištěno, že skutečná a odhadovaná kritičnost se liší od sebe po vytvoření 107 simulací v průměru o 0,6335 bodu. Z tohoto důvodu lze přijmout závěr, že semikvantitativní analýza je dostatečně přesná a lze ji použít v praxi. V analýze se neuvažoval případ, že odborník zapíše omylem hodnotu špatně nebo se neumí rozhodnout mezi dvěma bodovými hodnotami. Tento fakt může zhoršit výsledek analýzy. Literatura
[1] Zajíček J.: Hodnocení kritičnosti dopravní infrastruktury, TUL, 2006 Adresa autora: Ing. Josef Chudoba, Technická univerzita v Liberci, Fakulta mechatroniky a mezioborových inženýrských studií, Katedra modelování procesů, Hálkova 6, 461 17 Liberec 1 e-mail:
[email protected] Tato práce byla vytvořena za podpory projektu MŠMT 1M06047 - CQR
123
Korekce exponenciální analýzy p°i posuzování vhodnosti modelu morbidity Radim Bri², Pavel Jahoda
Abstrakt. P°ísp¥vek pojednává o zp°esn¥ní metodiky ov¥°ování
vhodnosti modelu morbidity p°i operacích kolorekta. Postupem v léka°ství vyuºívaným (viz. [1], [2], [3], [4], [5]) byl pomocí logistické regrese vytvo°en model (viz. [6]) stanovující riziko morbidity po t¥chto operacích provedených na FN Ostrava-Poruba. Vhodnost tohoto modelu byla ov¥°ována, mimo jiné, i pomocí exponenciální analýzy (byla pouºita nap°. v [5]). V algoritmu této exponenciální analýzy se v²ak vyskytují hrubé odhady, které mohou vést k nep°esným, dokonce zavád¥jícím, záv¥r·m ohledn¥ vhodnosti modelu. Proto je zde popsáno, jak tyto nedostatky jednoduchým zp·sobem odstranit.
1 Úvod V £láncích [1], [3], [4], [5], [6] a diserta£ní práci [2] byla popsána konstrukce a pouºití statistického modelu POSSUM, pomocí n¥hoº je moºné odhadnout pravd¥podobnost komplikací (morbidity), p°ípadn¥ úmrtí (mortality), po opera£ním zákroku. Tento model byl vytvo°en následujícím postupem.
1.1 Konstrukce modelu POSSUM Technikou lineární multivariantní diskriminan£ní analýzy bylo v [3] stanoveno 12 nezávislých faktor· závaºnosti fysiologického stavu a 6 nezávislých faktor· závaºnosti opera£ního výkonu, které se signikantn¥ podílí na poopera£ní mortalit¥ a morbidit¥. Na základ¥ zji²t¥ných hodnot t¥chto faktor· je moºno kaºdému pacientovi p°i°adit hodnoty tzv. fyziologického skóre PS a opera£ního skóre OS. Pokud známe tyto hodnoty a výsledky opera£ních zákrok· u dostate£ného po£tu pacient· (tj. zda po operaci do²lo, £i nedo²lo, ke komplikacím - morbidit¥), pak jsme schopni pomocí logistické regrese
124
R. Briš, P. Jahoda: Korekce exponenciální analýzy při posuzování modelu morbidity.
vytvo°it model stanovující riziko morbidity. Sta£í znát PS a OS daného pacienta a pomocí vytvo°eného modelu ur£íme pravd¥podobnost, ºe u tohoto pacienta dojde po operaci ke komplikacím. Logistickou regresi pouºíváme pro závisle prom¥nnou veli£inu Y , která m·ºe nabývat hodnot y = 0, nebo y = 1 ([7]). Hodnota Y je rovna 1 v p°ípad¥, ºe sledovaná událost (situace) nastala a v opa£ném p°ípad¥ Y nabývá hodnoty 0. P°edpokládejme, ºe hodnota Y závisí na hodnotách x1 , . . . , xp nezávislých prom¥nných X1 , · · · , Xp . Ozna£me x = (x1 , · · · , xp ), π(x) = E(Y | x) (tj. π(x) p°edstavuje st°ední hodnotu veli£iny Y pro libovolné, pevn¥ zvolené x. Potom π(x) m·ºeme povaºovat za pravd¥podobnost jevu Y = 1. Dále zavedeme ozna£ení
g(x) = β0 +
p X
βi xi ,
i=1
kde βi ∈ R, i = 0, · · · , p jsou tzv. koecienty logistické regrese. Logistická regrese p°edpokládá závislost π(x) na x1 , . . . , xp ve tvaru
eg(x) (1) 1 + eg(x) Hledané hodnoty koecient· logistické regrese βi ur£ujeme metodou maximální v¥rohodnosti. V na²em p°ípad¥ je Y morbidita, π(x) pravd¥podobnost výskytu komplikací (morbidity), x1 = P S , x2 = OS , p = 2 a funkce maximální v¥rohodnosti má tvar: π(x) =
L(x1 , x2 , β) =
n Y
π(xi )yi (1 − π(xi ))1−yi ,
i=1
kde n je po£et pacient·, β = (β0 , β1 , β2 ) je vektor neznámých koecient·, yi = 1 v p°ípad¥, ºe u i-tého pacienta do²lo po operaci ke komplikacím a yi = 0 v opa£ném p°ípad¥. P Si a OSi jsou hodnoty fyziologického, respektive opera£ního skóre i-tého pacienta, x1i = P Si , x2i = OSi , xi = (x1i , x2i ),
125
Sborník konference REQUEST'06
π(xi ) = a
eg(xi ) , 1 + eg(xi )
g(xi ) = β0 + β1 x1i + β2 x2i = β0 + β1 P Si + β2 OSi .
Logaritmováním funkce maximální v¥rohodnosti obdrºíme
ln L(x1 , x2 , β) =
n X
yi ln π(xi ) + (1 − yi )(1 − ln π(xi )).
i=1
Hodnoty βi , i = 0, 1, 2 ur£íme tak, aby hodnota ln L(x1 , x2 , β) byla minimální pro dané hodnoty x1i a x2i , i = 1, . . . , n. Tímto zp·sobem byly vytvo°eny modely morbidity pro r·zná chirurgická pracovi²t¥ a r·zné typy chirurgických zákrok· ve Velké Británii [1], [3], [4], [5], ale také pro Fakultní nemocnici Ostrava-Poruba [2],[6].
2 Verikace modelu POSSUM O tom, zda model, vytvo°ený vý²e popsaným zp·sobem, dob°e popisuje výskyt poopera£ní morbidity na daném léka°ském pracovi²ti, m·ºeme rozhodnout pomocí celé °ady test·. Jedná se nap°íklad o standardní χ2 testy, χ2 test dobré shody pro vhodnost pouºitého modelu [7], χ2 testy významnosti parametr· logistické regrese[7], nebo Hosmer-Lemeshow test[7]. Dal²ím prost°edkem, jak ov¥°it vhodnost modelu, je zp¥tn¥ srovnat skute£né po£ty pacient· s poopera£ními komplikacemi a po£ty pacient· s komplikacemi, které p°edpov¥d¥l model. Jedná se o tzv. exponenciální analýzu.
2.1 Exponenciální analýza Algoritmus exponenciální analýzy byl pro ú£ely medicíny pouºit v [5] a byl zde popsán následujícím zp·sobem.
126
R. Briš, P. Jahoda: Korekce exponenciální analýzy při posuzování modelu morbidity.
• Máme-li výsledky operací celkem n pacient·, pak kaºdému pacientovi m·ºeme p°i°adit po°adové £íslo i ∈ {1, . . . , n} a ztotoºnit jej s tímto po°adovým £íslem. Máme tedy mnoºinu pacient· {1, . . . , n}. Modelem stanovenou pravd¥podobnost, ºe i-tý pacient (tj. pacient i) bude mít poopera£ní komplikace, ozna£me pi . Budeme °íkat, ºe pacient i pat°í do mnoºiny pacient· A(a;b) , práv¥ kdyº pi ∈ (a, bi. Symbolem np (A) ozna£íme modelem p°edpovídaný (predikovaný) po£et pacient· z mnoºiny A ⊆ {1, . . . , n} s poopera£ními komplikacemi a symbolem nr (A) skute£ný (reálný) po£et pacient· z mnoºiny A ⊆ {1, . . . , n} s poopera£ními komplikacemi. • Vytvo°íme mnoºiny pacient· podle vypo£tených hodnot pi , a to tak, ºe za£neme od mnoºiny A1 = A(0,9;1) a ur£íme hodnotu nr (A1 ), np (A1 ) a nakonec vypo£teme hodnotu F1 =
nr (A1 ) np (A1 ) .
Poté zv¥t²íme interval na 80%-100% a vytvo°íme tak mnoºinu pacient· A2 = A(0,8;1) , jejichº pi ∈ (0, 8; 1i. Analogicky ur£íme hodnoty
nr (A2 ), np (A2 ), F2 =
nr (A2 ) np (A2 ) .
Obdobn¥ budeme zv¥t²ovat interval dále (samoz°ejm¥ maximáln¥ na 0% - 100%) , aº po k -tou mnoºinu pacient· Ak = A(1−k.0,1;1) , dokud je spln¥na podmínka
np (A1 ) ≤ np (A2 ) ≤ · · · ≤ np (Ak ).
(2)
• Pokud by byla poru²ena vý²e uvedená podmínka, tzn. nastala by situace np (A1 ) ≤ np (A2 ) ≤ · · · ≤ np (A(k−1) ) > np (Ak ), pak zv¥t²ování intervalu u k − 1. mnoºiny pacient· Ak−1 = A(1−(k−1).0,1;1) zastavíme a následující k -tou skupinu pacient· budou tvo°it pacienti z mnoºiny Ak = A(0;1−(k−1)0,1) , k + 1 mnoºina bude Ak+1 = A(0,1;1−(k−1)0,1) , ... , aº dojdeme k poslední, r-té, skupin¥ Ar = A(1−k.0,1;1−(k−1)0,1) . • Vytvo°ili jsme tak r mnoºin pacient· a u kaºdé j -té mnoºiny, j = n (A ) 1, · · · , r ur£íme hodnoty nr (Aj ), np (Aj ), Fj = npr (Ajj ) a se°adíme je do tabulky (hodnoty np (Aj ) se zaokrouhlují na celá £ísla a pro výpo£et Fj
127
Sborník konference REQUEST'06
se pouºívá zaokrouhlená hodnota np (Aj )). V prvním sloupci , Group, jsou uvedeny mnoºiny pacient·, konkrétn¥ intervaly, v nichº se nachází jejich pi . V druhém sloupci, Number, m·ºeme nalézt, kolik pacient· pat°í do dané mnoºiny a ve zbývajících sloupcích jsou hodnoty np (Aj ), nr (Aj ) a Fj .
• Je z°ejmé, ºe model je vhodný k popisu výskytu morbidity, jestliºe hodnoty Fj , kde j ∈ {1, . . . , r} jsou statisticky blízké hodnot¥ 1 (a v ideálním p°ípad¥ rovny 1).
2.2 Predikovaný po£et komplikací My²lenka exponenciální analýzy p°edstavuje jednoduchý a elegantní zp·sob, jak ov¥°it vhodnost modelu. Pokud se v²ak zamyslíme nad uvedeným algoritmem exponenciální analýzy (jak byl popsán v [5]), narazíme na zaráºející skute£nost. Jedná se o to, ºe je t°eba p°i posloupnosti zv¥t²ování mnoºiny pacient· sledovat, zda také odpovídající posloupnost p°edpovídaných po£t· komplikací v t¥chto mnoºinách je neklesající. Jde o kontrolu platnosti podmínky (2), np (A1 ) ≤ np (A2 ) ≤ · · · ≤ np (Ak ) (a k poru²ení této podmínky opravdu n¥kdy docházelo). Ale dobrý statistický model by m¥l tuto podmínku automaticky spl¬ovat! A opravdu, v modelu vytvo°eném pomocí logistické regrese problém není. Chybu je t°eba hledat jinde. Jde o pom¥rn¥ hrubý odhad, pouºívaný v [5] ke stanovení hodnot np (Aj ), j = 1, · · · , r, tj. modelem predikovaných po£t· pacient· s komplikacemi v mnoºin¥ Aj . Hodnota np (Aj ) je zde dána následujícím vztahem. Jestliºe uvaºujeme mnoºinu pacient· Aj , jejichº pi ∈ (a, bi, a 6= 0 a pat°í do ní celkem nj pacient·, potom
np (Aj ) = a.nj
(3)
Se zmen²ující se délkou intervalu (a, bi sice roste p°esnost tohoto odhadu hodnoty np (Aj ), ale musíme si uv¥domit, ºe v na²em p°ípad¥ je b − a ≥ 0, 1. Interval (a, bi je tak po°ád je²t¥ dost ²iroký na to, aby p°i odhadu hodnoty np (Aj ) pomocí vztahu (3) mohlo dojít ke zna£ným nep°esnostem.
128
R. Briš, P. Jahoda: Korekce exponenciální analýzy při posuzování modelu morbidity.
(Poznamenejme, ºe v p°ípad¥ a = 0, b < 100 je hodnota np (Aj ) dána jako medián hodnot pi ∈ (0, bi krát sto a v p°ípad¥ (a, bi = (0, 100i ur£ujeme hodnotu np (Aj ) jako sou£et v²ech predikovaných komplikací z jednotlivých mnoºin pacient·, ale tak, aby nebyla jedna a tẠpredikovaná komplikace zapo£ítána vícekrát .) Demonstrujme na konkrétním p°íkladu nevhodnost pouºití vztahu (3). P°edpokládejme, ºe skupina pacient·, jimº byla modelem p°edpov¥zena pravd¥podobnost komplikace mezi 30% a 100%, tzn. mnoºina Aj0 = A(30;100) , je tvo°ena n = 11 pacienty, p°i£emº jednomu byla ur£ena pravd¥podobnost komplikací p1 = 50% a zbývajícím desíti pravd¥podobnost p2 = 90%. Podle vý²e uvedeného algoritmu exponenciální analýzy a vztahu (3) odhadujeme, ºe model p°edpovídá
np (Aj0 ) = a.nj0 = 0, 3.11 = 3, 3 komplikací po operaci, tzn. po zaokrouhlení celkem 3 komplikace po t¥chto 11 operacích. To je ale zjevn¥ hrubá chyba p°i interpretaci výsledk· modelu! Vºdy´ jen u 10 pacient· model p°edpov¥d¥l pravd¥podobnost komplikace 0, 9, a tak model p°edpokládá, ºe z t¥chto 10 pacient· bude cca 9 mít po operaci komplikace! Správný po£et komplikací, které model skute£n¥ p°edpovídá, obdrºíme jednodu²e pomocí v¥ty o úplné pravd¥podobnosti. Vý²e popsanou mnoºinu n = 11 pacient· A(30%;100%) m·ºeme rozd¥lit podle jejich pravd¥podobnosti komplikace do dvou podmnoºin. První obsahuje n1 = 1 pacient·, s pravd¥podobností komplikace p1 = 0, 5 a druhá n2 = 10 pacient· s pravd¥podobností komplikace p2 = 0, 9. Podle v¥ty o úplné pravd¥podobnosti ur£íme pravd¥podobnost jevu A , ºe náhodn¥ vybraný pacient z mnoºiny A(30%;100%) bude mít komplikace, následujícím zp·sobem. Ozna£me H1 jev, kdy náhodn¥ vybraný pacient pat°í do první podmnoºiny a H2 jev, kdy náhodn¥ vybraný pacient pat°í do druhé podmnoºiny. Potom
P (A) = P (A | H1 )P (H1 ) + P (A | H2 )P (H2 ), n2 n1 + p2 , P (A) = p1 n n
129
(4)
Sborník konference REQUEST'06
19 10 1 + 0, 9 = . 22 11 11 Nyní je jiº z°ejmé, ºe model odhaduje po£et komplikací ve skupin¥ A(30%,100%) následovn¥
P (A) = 0, 5
np (A(30%,100%) ) = n.P (A) = 9, 5.
(5)
To je v hrubém rozporu s vý²e ur£eným po£tem 3 komplikací, který jsme obdrºeli pomocí p·vodního algoritmu exponenciální analýzy. Tento postup, zp°esn¥ní p·vodního algoritmu, m·ºeme formulovat obecn¥ pro libovolnou mnoºinu pacient· A. Jestliºe v mnoºin¥ A je n pacient· a P (A) je pravd¥podobnost, ºe náhodn¥ vybraný pacient z mnoºiny A bude mít komplikace, potom
np (A) = n.P (A). Jestliºe se v této mnoºin¥ A o n pacientech vyskytlo r r·zných pravd¥podobností komplikací p1 , · · · , pr a nj je po£et pacient· s pravd¥podobností komplikace pj , pak m·ºeme, analogicky jako v (5) a (4), psát
np (A) = n.
r X
pj .
j=1
r X nj = pj .nj . n j=1
Pokud provedeme p°ezna£ení a kaºdému pacientovi i (pacienty jsme ztotoºnili s jejich po°adovými £ísly) z mnoºiny A p°i°adíme pravd¥podobnost komplikace pi , pak je z°ejmé, ºe
np (A) =
X
pi .
(6)
i∈A
Po£et predikovaných komplikací v dané mnoºin¥ pacient· tedy ur£íme jako sou£et pravd¥podobností komplikací jednotlivých pacient· této mnoºiny.
V takovém p°ípad¥ je jiº z°ejmé, ºe kdyº pro mnoºiny pacient· platí Ai ⊆ Aj , potom np (Ai ) ≤ np (Aj ).
130
R. Briš, P. Jahoda: Korekce exponenciální analýzy při posuzování modelu morbidity.
Pokud tedy budeme pro stanovení po£tu modelem predikovaných komplikací pouºívat vztah (6) místo vztahu (3), m·ºeme zjednodu²it algoritmus exponenciální analýzy následovn¥.
• Máme-li výsledky operací celkem n pacient·, a modelem stanovené pravd¥podobnosti komplikací pi , i = 1, . . . , n pro kaºdého i-tého pacienta, pak vytvo°íme mnoºiny pacient· (které ztotoºníme s jejich po°adovým £íslem) Aj = A(0;j.0,1) = {i ∈ N | pi ∈ (0; j.0, 1i}, kde j = 1, · · · , 10. P
• Ur£íme hodnoty nj = #(Aj ), np (Aj ) = i∈Aj pi = modelem predikovaný po£et pacient· mnoºiny Aj s poopera£ními komplikacemi (viz. (6)), nr (Aj ) = skute£ný po£et pacient· ze skupiny Aj s poopera£ními komplikacemi. Pokud nj = 0, volíme np (Aj ) = 0 a Fj = 1. n (A ) Pro np (Aj ) 6= 0 denujeme Fj = npr (Ajj ) , v p°ípad¥, ºe nr (Aj ) 6= 0, a v p°ípad¥, ºe nr (Aj ) = 0, denujeme Fj = 1 −
np (Aj ) nj .
Poznamenejme, ºe z rovností (1), (6) a faktu, ºe pi = π(xi ) je jasné, ºe n (A ) hodnota np (Aj ) je vºdy ost°e v¥t²í neº 0, a deni£ní vztah Fj = npr (Ajj ) je proto korektní.
• Zji²t¥né hodnoty se°adíme do tabulky. Model je vhodný k popisu výskytu morbidity, jestliºe hodnoty Fj , j = 1, · · · , 10 jsou statisticky blízké hodnot¥ 1 (a v ideálním p°ípad¥ rovny 1). • Pro mnoºiny Aj = A((j−1)0,1;j.0,1) = {i ∈ N | pi ∈ ((j − 1)0, 1; j.0, 1i}, kde j = 1, · · · , 10 m·ºeme dále pouºít obdobný postup. Zjistíme tak, zda vytvo°ený model není zvlá²t¥ vhodný, respektive nevhodný, pro pacienty s pravd¥podobností komplikace z ur£ité mnoºiny.
2.3 Aplikace modikované exponenciální analýzy Pro pot°eby FN Ostrava-Poruba byl vytvo°en model POSSUM popisující pravd¥podobnost komplikací po otev°ených operacích kolorekta. Pro pravd¥podobnost poopera£ní morbidity i-tého pacienta byl logistickou regresí ur£en vztah
131
Sborník konference REQUEST'06
pi = π(P Si , OSi ) =
eg(P Si ,OSi ) , 1 + eg(P Si ,OSi )
(7)
kde
g(P Si , OSi ) = −2, 75257 + 0, 08564.P Si + 0, 0654.OSi .
(8)
Pomocí exponenciální analýzy modikované vý²e uvedeným zp·sobem (a dal²ích test·, viz. [2], [6], [7]) byla ov¥°ována vhodnost tohoto modelu morbidity. Pro srovnání uvedeme výsledky exponenciální analýzy provedené p·vodním zp·sobem (tj. s vyuºitím vztahu (3)) a výsledky modikované exponenciální analýzy (tj. s vyuºitím vztahu (6)). Group (%) (0, 30i (10, 30i (20, 30i (30, 100i (40, 100i (50, 100i (60, 100i (70, 100i (80, 100i (90, 100i (0, 100i
Number 34 34 34 239 150 73 26 7 0 0 274
nr (Aj ) 8 8 8 110 75 43 17 5 0 0 118
np (Aj ) 27 (9,24) 3 (9,24) 7 (9,24) 72 (108,75) 60 (77,52) 37 (42,89) 16 (17,13) 5 (5,10) 0 (0) 0 (0) 99(117,99)
n (A )
Fj = npr (Ajj ) 0,30 (0,87) 2,67 (0,87) 1,14 (0,87) 1,53 (1,01) 1,25 (0,97) 1,16 (1,00) 1,06 (0,99) 1,00 (0,98) nedenováno(1) nedenováno(1) 1,19(1)
Tabulka 1: Tabulka vytvo°ená podle p·vodního algoritmu exponenciální analýzy (hodnoty ur£eny podle vztahu (3) ). V závorkách jsou uvedeny hodnoty vypo£tené podle (6) a zaokrouhleny na dv¥ desetinná místa. Z Tabulky 1 vidíme, ºe algoritmus exponenciální analýzy popsaný v [5] vyhodnocuje model morbidity jako nep°íli² p°esný (hodnoty Fj jsou v n¥kterých p°ípadech relativn¥ vzdálené od jedni£ky). Pokud v²ak pouºijeme
132
R. Briš, P. Jahoda: Korekce exponenciální analýzy při posuzování modelu morbidity.
k výpo£tu hodnoty np (Aj ) p°esn¥j²í postup (tj. pouºijeme vztah (6) namísto (3) ), pak se jiº model morbidity jeví jako pom¥rn¥ p°esný. Pro ilustraci dále uvedeme Tabulku 2, která je provedena postupem popsaným v p°edchozím odstavci. Group (%) (0, 10i (0, 20i (0, 30i (0, 40i (0, 50i (0, 60i (0, 70i (0, 80i (0, 90i (0, 100i
Number 0 0 34 124 201 248 267 274 274 274
nr (Aj ) 0 0 8 43 75 101 113 118 118 118
np (Aj ) 0 0 9,24 40,47 75,10 100,86 112,90 117,99 117,99 117,99
Fj =
nr (Aj ) np (Aj )
1 1 0,87 1,06 1 1 1 1 1 1
Tabulka 2: Tabulka vytvo°ená podle modikovaného algoritmu exponenciální analýzy Exponenciální analýzu je také moºné pouºít pro srovnání pouºitých opera£ních metod. Je otázkou, zda laparoskopické operace jsou z hlediska poopera£ní morbidity srovnatelné s otev°enými operacemi. Odpov¥d¥t se pokusíme následujícím zp·sobem. Z Tabulky 2 je jasné, ºe model pravd¥podobnosti poopera£ních komplikací (7) je pro pom¥rn¥ p°esný. Dále víme, ºe tento model byl vytvo°en pouºitím dat z otev°ených operací kolorekta. Aplikujeme proto model (7) na data obdrºená p°i laparoskopických operacích kolorekta (tj. ur£íme pravd¥podobnosti komplikací pro pacienty, kte°í podstoupili laparoskopickou operaci) a provedeme poté exponenciální analýzu. Sta£í si uv¥domit, ºe hodnoty Fj p°edstavují pom¥r mezi skute£nými a p°edpovídanými po£ty komplikací. Ale model p°edpovídá (a to pom¥rn¥ p°esn¥) po£ty komplikací po otev°ených operacích. Hodnoty Fj tak m·ºeme chápat jako odhad
133
Sborník konference REQUEST'06
pom¥ru mezi po£ty komplikací po laparoskopických operacích a po£ty komplikací, které by nastaly, pokud by se stejní pacienti operovali otev°eným zp·sobem. Pokud exponenciální analýza z°eteln¥ ukáºe, ºe hodnoty Fj jsou (statisticky) men²í, neº 1, pak m·ºeme tento výsledek interpretovat tak, ºe po laparoskopických operacích dochází u pacient· ke komplikacím mén¥ £asto, neº po operacích otev°ených. Group (%) (0, 10i (0, 20i (0, 30i (0, 40i (0, 50i (0, 60i (0, 70i (0, 80i (0, 90i (0, 100i
Number 0 0 39 146 196 221 230 230 230 230
nr (Aj ) 0 0 5 31 46 58 63 63 63 63
np (Aj ) 0 0 10,63 48,07 69,56 83,04 88,82 88,82 88,82 88,82
Fj =
nr (Aj ) np (Aj )
1 1 0,47 0,64 0,66 0,70 0,71 0,71 0,71 0,71
Tabulka 3: Tabulka modikované exponenciální analýzy pro laparoskopické operace. V Tabulkce 3 je jasn¥ vid¥t, ºe tomu tak skute£n¥ je. Predikované a reálné po£ty komplikací jsou stejné pouze u prázdných mnoºin pacient·. Jinak jsou hodnoty Fj významn¥ men²í neº 1. To znamená, ºe po laparoskopických operacích nastalo mén¥ komplikací, neº kdyby stejní pacienti podstoupili otev°enou operaci.
Reference [1] Senagore, A.J., Delaney, C.P., Duepree, H.J., Brady, K.M., Fazio, V.W.: Evaluation of POSSUM and P-POSSUM scoring systems in as-
134
R. Briš, P. Jahoda: Korekce exponenciální analýzy při posuzování modelu morbidity.
sissing outcome after laparoscopic colectomy. Br. J. Surg., 2003, 90, s.1280-1284. [2] Martínek, L.: Aplikace specializovaných skórovacích systém· pro objektivizaci rizik laparoskopických operací kolorekta.Doktorská diserta£ní práce 2006. [3] Copeland, G.P., Jones, D., Walters, M.: POSSUM: a scoring system for surgical audit. Br. J. Surg., 1991, 78, s.356-360. [4] Prytherch, D.R., Whiteley, M.S., Higgins, B., Weaver, P.C., Prout, W.G., Powell, S.J.: POSSUM and Portsmouth POSSUM for predicting mortality. Physiological and operative severity score for the enumeration of mortality and morbidity. Br. J. Surg., 1998, 85, s.1217-1220. [5] Wijesinghe, L.D., Mahmood, T., Scott, D.J.A., Berridge, D.C., Kent, P.J., Kester, R.C.: Comparison of POSSUM and the Portsmouth predictor equation for predicting death following vascular surgery. Br. J. Surg., 1998, 85, s.209-212. [6] Bri², R., Jahoda, P. : Modeling of risk of morbidity after laparoscopic surgeries using logistic regression., ENBIS 06, talk no. 70, 2006 [7] Hosmer, D.W., Lemeshow, S.: Applied Logistic Regression, Wiley 2000, ISBN 0-471-35632-8.
Adresy autor·:
Doc. Ing. Radim Bri², CSc., RNDr. Pavel Jahoda, Ph.D. Vysoká ²kola bá¬ská Technická univerzita Ostrava, fakulta elektrotechniky a informatiky, katedra aplikované matematiky, T°. 17. listopadu 15, 708 33 Ostrava-Poruba. e-mail:
[email protected],
[email protected] Tato práce byla vytvo°ena v rámci projektu MMT 1M06047 - CQR
135
Použitie štatistických tolerančných intervalov v riadení kvality Ivan Janiga, Ivan Garaj
1. Úvod Odhady stredných hodnôt a rozptylov základných súborov alebo parametrov distribučných funkcií nevyčerpávajú všetky odhady, ktoré sú užitočné v praxi. Napríklad pri hromadnej výrobe je výrobný proces nastavený. Výrobca potrebuje zistiť medze, v ktorých kolíše nejaký dôležitý znak kvality výrobku. Odhad strednej hodnoty a rozptylu v tomto prípade nestačí, ale je potrebné poznať medze, ktoré pokryjú podstatnú časť základného súboru t. j. „skoro celý“ základný súbor. Iný podobný príklad je situácia, pri ktorej má výrobca dodávať vopred určitý dohodnutý podiel (napr. 40 %) svojho výrobku na špeciálny účel. Na tento účel je potrebné udržovať hodnoty znaku kvality na čo najvyššej úrovni. Aby sa výrobca presvedčil, ako môže uspokojiť budúce nároky, odhadne medze, ktoré takmer isto pokrývajú 40 % najväščích hodnôt základného súboru. Tak zistí, o aké hodnoty ide, aby vedel, akú kvality môže ponúknuť na špeciálny účel. Stanoviť z náhodného výberu medze, ktoré pokryjú vopred danú časť základného súboru náhodnej premennej, je úloha stanovenia štatistických tolerančných medzí. V tomto článku predpokladáme normálne rozdelenie znaku kvality.
2. Štatistické tolerančné medze pre normálny základný súbor Predpokladajme, že náhodná premenná (meraný znak kvality) X má normálne rozdelenie so strednou hodnotou µ a rozptylom σ 2 , t. j.
X ~ N (µ ,σ 2 ) .
136
I. Janiga, I. Garaj: Použitie štatistických tolerančných intervalov v riadení kvality.
2.1 Stredná hodnota µ a rozptyl σ 2 sú známe Rozdelenie skúmaného znaku kvality je určené jednoznačne, ak stredná hodnota µ a rozptyl σ 2 základného súboru s normálnym rozdelením sú známe. V tomto prípade sa dajú so stopercentnou spoľahlivosťou určiť medze, ktoré pokrývajú podiel p hodnôt základného súboru: napravo od x L = µ − u p σ (jednostranný interval), naľavo od xU = µ + u p σ (jednostranný interval), medzi x L = µ − u (1+ p ) / 2 σ a xU = µ + u (1+ p ) / 2 σ (dvojstranný interval). kde u p je p- kvantil normovaného normálneho rozdelenia. V praxi sa však častejšie vyskytujú prípady, keď je jeden z parametrov µ a σ 2 neznámy (obvykle µ ) alebo obidva parametre sú neznáme. Majme hodnoty náhodného výberu z rozdelenia
x=
1 n
x1 , x 2 , L, x n
N ( µ , σ ) . Z nich vypočítame hodnoty odhadov 2
n
∑ xi ─ parametra µ
a s2 =
(1)
i =1
n
1 ( xi − x ) 2 ─ parametra σ 2 . n − 1 i =1
∑
Budeme hľadať intervaly, ktoré so spoľahlivosťou 1 − α pokrývajú aspoň podiel p hodnôt z rozdelenia N ( µ , σ 2 ) . 2.2 Stredná hodnota µ je neznáma a rozptyl σ 2 je známy Nech parameter µ je neznámy a parameter σ 2 je známy. Jednostranný štatistický tolerančný interval pre neznáme µ a známe σ 2 má tvar
(− ∞, x − k1σ] alebo [x + k1σ, ∞) pričom pre tolerančný činiteľ platí
137
(2)
Sborník konference REQUEST'06
k1 ( n; p; 1 − α) = u p +
u1−α
(3)
n
kde u p a u1−α sú kvantily rozdelenia N (0, 1) . Dvojstranný štatistický tolerančný interval pre neznáme µ a známe σ 2 je interval
[x − k 2 σ, x + k 2 σ]
(4)
v ktorom tolerančný činiteľ k 2 (n; p; 1 − α) je riešením rovnice
u u ⎛ ⎞ ⎛ ⎞ Φ⎜⎜ k 2 + 1−α / 2 ⎟⎟ + Φ⎜⎜ k 2 − 1−α / 2 ⎟⎟ = 1 + p n ⎠ n ⎠ ⎝ ⎝
(5)
2.3 Stredná hodnota µ a rozptyl σ 2 sú neznáme Nech parametre µ a σ 2 sú neznáme. Jednostranný štatistický tolerančný interval má tvar
(− ∞, x − k 3 σ] alebo [x + k 3 σ, ∞ )
(6)
pričom exaktný vzťah pre tolerančný činiteľ je
k 3 (n; p; 1 − α) =
(
t1−α n − 1,u p n
)
n
(7)
kde v čitateli je 100(1 − α ) % kvantil necentrálneho t-rozdelenia so stupňami voľnosti n − 1 s parametrom necentrality u p n . Dvojstranný štatistický tolerančný interval pre jeden súbor meraní má tvar
[x − k 4 σ, x + k 4 σ]
(8)
Treba
vypočítať hodnotu neznámeho tolerančného činiteľa k 4 (n; p; 1 − α) tak, aby príslušný interval s pravdepodobnosťou
1 − α pokryl aspoň podiel p hodnôt z rozdelenia N ( µ , σ 2 ) . Na výpočet použijeme exaktný vzťah (12).
138
I. Janiga, I. Garaj: Použitie štatistických tolerančných intervalov v riadení kvality.
Dvojstranné tolerančné intervaly pre viac nezávislých súborov meraní Majme m náhodných premenných X i s normálnym rozdelením, s rôznymi strednými hodnotami µ i a rovnakým rozptylom σ 2 t. j.
X i ~ N (µ i , σ 2 ) , pričom parametre µ i rozptyl σ
2
(i = 1, 2, ..., m) a spoločný
sú neznáme. Nech (xi1 , xi 2 , L , xin ) sú nezávislé merania
(i = 1, 2, ..., m) . Dostaneme tak m súborov, ktoré obsahujú rovnaký počet n nezávislých meraní. Budeme hľadať intervaly, ktoré so spoľahlivosťou 1 − α ( 0 < α < 1 ) obsahujú aspoň podiel p ( 0 < p < 1 ) hodnôt z rozdelení N (µ i , σ 2 ) . V tomto prípade môžeme vypočítať m dvojstranných tolerančných intervalov. veličiny
Xi
(xi. − k sP ,
xi. + k sP )
(9)
kde
xi. =
1 n ∑ xij je hodnota odhadu parametra µ i , n j =1
sP2 =
m n 1 ( xij − xi. ) 2 ∑∑ m(n − 1) i =1 j =1
(10)
je združený odhad spoločného
(11)
rozptylu σ 2 .
Rovnako ako v predchádzajúcom prípade potrebujeme vypočítať hodnotu tolerančného činiteľa k 4 m (n; p; 1 − α) tak, aby príslušný interval s pravdepodobnosťou 1 − α pokryl aspoň podiel p hodnôt z rozdelenia N (µ i , σ 2 ) . Výpočet dvojstranných tolerančných činiteľov k 4 (n; p; 1 − α) a
k 4 m (n; p; 1 − α) Vo väčšine štatistických tabuliek sú uvedené hodnoty dvostranného tolerančného činiteľa vypočítané použitím nejakej aproximačnej metódy. Jednotlivé aproximačné metódy mali menší alebo väčší význam vtedy, keď výpočtová technika bola iba v začiatočnej fáze. Dnes už tieto aproximácie nevyhovujú. Preto pri revízii
139
Sborník konference REQUEST'06
medzinárodnej normy ISO 16269-6: 2005 (Statistical interpretation of data. Part 6: Detarmination of statistical tolerance intervals) o tolerančných intervaloch sa pristúpilo k výpočtu tolerančných činiteľov k = k ( n, ν, p,1 − α ) pomocou exakného vzťahu, ktorý odvodili nezávisle viacerí autory [5], [6], [7], [8], [9]. Exaktné vzťahy majú tvar integrálnej rovnice
n 2π
∞
∫ F ( x, k ) e
−
nx 2 2 dx
−1+α = 0
(12)
−∞
kde ∞
F ( x, k ) =
∫2
ν
t2
−1 −
e
t 2
ν
dt
ν R ( x) 2 2 Γ ⎛ ν ⎞ ⎜ ⎟ k2
⎝ 2⎠
a R (x ) je riešenie rovnice Φ ( x + R ) − Φ ( x − R ) − p = 0 . tolerančného činiteľa k = k ( n, ν, p,1 − α ) pre rôzne n, ν, p, 1 − α dostaneme ako výsledok riešenia integrálnej rovnice (12). Pri riešení bolo potrebné použiť numerické metódy. Hodnotu
V prípade jedného súboru meraní x1 , x 2 , L , x n sa tolerančné
činitele k 4 = k 4 (n, ν, p,1 − α ) vypočítajú z rovnice (12) tak, že zvolíme ν = n − 1 . Každej hodnote n teda zodpovedá jediná hodnota ν. Keď máme viac nezávislých súborov meraní (xi1 , xi 2 , L , xin ) , kde (i = 1, 2, ..., m) , tolerančné činitele k 4 m = k 4 m (n, ν, p,1 − α ) sa tiež
vypočítajú z rovnice (12) tak, že volíme ν ≠ n − 1 . V tomto prípade každej hodnote n zodpovedajú všetky hodnoty ν , ktoré sú rôzne od n −1 .
140
I. Janiga, I. Garaj: Použitie štatistických tolerančných intervalov v riadení kvality.
3. Štatistické tabuľky tolerančných činiteľov pre normálny základný súbor Či už je niektorý z parametrov µ a σ 2 známy alebo nie, v literatúre môžeme nájsť tabuľky tolerančných činiteľov pre najčastejšie používané hodnoty p , 1 − α a rozsahy výberov n . Pre kombinácie parametrov µ neznáme, σ 2 známe a µ neznáme, σ 2 neznáme je vydaná medzinárodná norma ISO 16269-6: 2005 (Statistical interpretation of data. Part 6: Detarmination of statistical tolerance intervals), kde sú hodnoty k uvedené na 3 desatinné miesta pre p = 0,50 ; 0,75; 0,90; 0,95; 0,99; 0,999, 1 − α = 0,5 ; 0,75; 0,90; 0,95; 0,99; 0,999 a n = 2 (1)20(2)30(5)50(10)100(50)300(100)500. 1000, ∞ V štatistických tabuľkách, ktoré publikoval Odeh [8] sú činitele
k vypočítané na 3 desatinné miesta v prípade dvojstranných štatistických tolerančných medzí pre p = 0,75; 0,90; 0,95; 0,975; 0,99; 0,995; 0,999, 1 − α = 0,5 ; 0,75; 0,90; 0,95; 0,975; 0,99; 0,995 a n = 2(1)100(2)180(5)300(10)400(25)650(50)1000; 1500; 2000; 3000; 5000; 10000, ∞, jednostranných štatistických tolerančných medzí pre p = 0,75; 0,90; 0,95; 0,975; 0,99; 0,999; 0,9999, 1 − α = 0,005; 0,01; 0,025; 0,05; 0,10; 0,25; 0,50; 0,75; 0,90; 0,95; 0,975; 0,99; 0,995 a n = 2(1)100(2)180(5)300(10)400(25)650(50) 1000; 1500; 2000; 3000; 5000; 10000, ∞ . Likeš [23] v štatistických tabuľkách uvádza hodnoty tolerančných činiteľov k na 4 desatinné miesta v prípade jednostranných štatistických tolerančných medzí, keď µ a σ 2 sú neznáme, pre p = 0,50 ; 0,75; 0,90; 0,95; 0,99; 0,999, 1 − α = 0,5 ; 0,75; 0,90; 0,95; 0,99; 0,999 a n = 2 (1)20(2)30(5)50(10)100(50)300.
141
Sborník konference REQUEST'06
dvojstranných štatistických tolerančných medzí, keď µ a σ2 sú neznáme resp. µ je neznáme a σ2 známe, pre rovnaké hodnoty p, 1-α ako pri jednostranných medziach a pre n = 2 (1)20(2)30(5)50(10)100(50)300(50)500(100)1000. Garaj a Janiga uvádzajú v publikáciách [10], [11], [12] hodnoty tolerančných činiteľov k na 4 desatinné miesta iba pre prípad µ a σ2 sú neznáme. Pre jednostranné štatistické tolerančné medze [12] p = 0,525; 0,55(0,05) 0,70; 0,725; 0,75(0,05) 0,90; 0,91(0,01) 0,97; 0,975; 0,98; 0,99; 0,991(0,001) 0,999; 0,9999, 1 − α = 0,001; 0,005; 0,01; 0,025; 0,05; 0,10; 0,25; 0,50; 0,75; 0,90; 0,95; 0,975; 0,99; 0,995; 0,999; 0,9999, n = 2(1)200(5)300(10) 400(25) 1000; 1500; 2000(1000) 5000; 10000. V poslednom riadku (∞ ) sú hodnoty kvantilov normovaného normálneho rozdelenia u p . Pre dvostranné štatistické tolerančné medze rozdelenia jedného súboru [10] p = 0,50(0,05) 0,90; 0,91(0,01) 0,99; 0,991(0,001) 0,999, 0,9991(0,0001) 0,9999 1 − α = 0,50; 0,75; 0,90; 0,95; 0,975; 0,99; 0,995; 0,999, n = n = 2(1) 200; 220(20) 500; 550(50) 1000; 1500(500) 10000; 20000(10000) 100000. V poslednom riadku (∞) sú hodnoty kvantilov rádu
1+ p 2
normovaného normálneho rozdelenia. Špeciálny prípad tvoria štatistické tolerančné medze rozdelení viacej súborov, ktoré majú spoločný rozptyl [12]. Tabuľky 1 až 25 z tabuľkovej časti obsahujú hodnoty tolerančných činiteľov k s presnosťou na štyri desatinné miesta pre všetky kombinácie 1 − α = 0,90; 0,95; 0,99; 0,995; 0,999 koeficientov spoľahlivosti s hodnotami p = 0,90; 0,95; 0,99; 0,995; 0,999. V každej z tabuliek 1 až 25 sú hodnoty k vypočítané pre n = 2(1) 40; 45(5) 100; 200(100) 1000; 5000; 10000, ∞ ν = 1(1) 60(5) 100(100) 1000; 5000; 10000, ∞. V poslednom riadku (∞) boli hodnoty tolerančných činiteľov k vypočítané pre n = 10 6 a v poslednom stĺpci (∞) pre ν = 10 6.
142
I. Janiga, I. Garaj: Použitie štatistických tolerančných intervalov v riadení kvality.
4. Príklady 4.1 Dáta pre príklady Merali sa zaťaženia bavlnenej priadze pri pretrhnutí. Počet pozorovaní n = 12 , ktorý v týchto príkladoch uvažujeme, je podstatne nižší než odporúčaný počet podľa normy ISO 2602. Číselné údaje a výpočty v rôznych príkladoch sa uvádzajú v centinewtonoch. Namerané hodnoty sú: 228,6; 232,7; 238,8; 317,2; 315,8; 275,1; 222,2; 236,7; 224,7; 251,2; 210,4; 270,7 Tieto merania sa získali z dávky 12 000 cievok, vyrobených počas jednej výrobnej zmeny, zabalených v 120 škatuliach, v každej z nich bolo 100 cievok. Z dávky sa náhodne vybralo 12 škatúľ a z každej z týchto škatúľ sa náhodne vybrala jedna cievka. Z priadze na týchto cievkach sa odstrihli skúšobné kusy s dĺžkou 50 cm, pričom boli vo vzdialenosti približne 5 m od voľného konca. Samotné testy sa vykonali na stredných častiach týchto skúšobných kúskov. Predchádzajúce informácie oprávňujú k predpokladu, že zaťaženie pri pretrhnutí má v týchto podmienkach prakticky normálne rozdelenie. W-kritériom [26] bolo potvrdené, že údaje neodporujú predpokladu o normálnom rozdelení. Z nameraných dát sme získali tieto výsledky:
x = 3024,1 / 12 = 252,01
n∑ x 2 − (∑ x )
2
s=
n(n − 1)
=
166772,27 = 1263,4263 = 35,545 12 × 11
4.2 Príklad : Jednostranný štatistický tolerančný interval, známy rozptyl Predpokladajme, že predchádzajúce merania preukázali, že rozptyl medzi jednotlivými dávkami od toho istého dodávateľa je konštantný a reprezentuje ho smerodajná odchýlka σ = 33,150 , pričom stredná hodnota nie je známa. Požaduje sa, aby dolná medza x L bola taká, že pri úrovni spoľahlivosti 1 − α = 0,95 (95 %) sa dá zaistiť, že najmenej 0,95 (95%) zaťažení pri roztrhnutí jednotiek z dávky (meraných za rovnakých podmienok) bude nad hodnotou x L .
143
Sborník konference REQUEST'06
V norme ISO 16269-6 nájdeme hodnotu príslušného tolerančného činiteľa
k1 (12; 0,95; 0,95) = 2,120 odkiaľ
x L = x − k1 (n; p; 1 − α) × σ = 252,01 − 2,120 × 33,150 = 181,732 Ak by sa požadoval väčší podiel základného súboru (napríklad p = 0,99 ) a (alebo) vyššia úroveň spoľahlivosti (napríklad
1 − α = 0,99 ), získala by sa nižšia hodnota dolnej medze x L . 4.3 Príklad : Dvojstranný štatistický tolerančný interval, známy rozptyl Za tých istých podmienok ako v príklade 4.2 predpokladajme, že sa požadujú také medze x L a xU , že pri úrovni spoľahlivosti
1 − α = 0,95 sa dá zaistiť, že aspoň podiel p = 0,90 (90 %) namáhania pri roztrhnutí padne medzi x L a xU . V norme ISO 16269-6 nájdeme hodnotu príslušného tolerančného činiteľa
k 2 (12; 0,90; 0,95) = 1,889 (v Likeš-Laga je k 2 (12; 0,90; 0,95) = 1,8886 ) odkiaľ
x L = x − k 2 (n; p; 1 − α) × σ = 252,01 − 1,889 × 33,150 = 189,390 xU = x + k 2 (n; p; 1 − α) × σ = 252,01 + 1,889 × 33,150 = 314,630 Porovnaním s príkladom 4.2 by malo byť jasné, že zaistenie toho, aby aspoň 90% základného súboru ležalo medzi medzami x L a xU , nie je to isté ako zaistenie, že nie viac ako 5% leží za každou z medzí. 4.4 Príklad : Jednostranný štatistický tolerančný interval, neznámy rozptyl Tu sa predpokladá, že smerodajná odchýlka základného súboru nie je známa a treba ju odhadnúť z výberu. Predpokladajú sa také isté
144
I. Janiga, I. Garaj: Použitie štatistických tolerančných intervalov v riadení kvality.
požiadavky ako v príklade so známou smerodajnou odchýlkou (Príklad 4.2), teda p = 0,95 a 1 − α = 0,95 . V norme ISO 16269-6 nájdeme hodnotu príslušného tolerančného činiteľa
k 3 (12; 0,95; 0,95) = 2,737 (v Likeš-Laga aj v Garaj-Janiga je k 3 (12; 0,95; 0,95) = 2,7364 ) odkiaľ
x L = x − k 3 (n; p; 1 − α) × s = 252,01 − 2,737 × 35,545 = 154,723 4.5 Príklad : Dvojstranný štatistický tolerančný interval, neznámy rozptyl Pri takých istých podmienkach ako v príklade 4.3 predpokladajme, že treba vypočítať medze x L a xU tak, aby sa pri úrovni spoľahlivosti 1α = 0,95 dalo zaistiť, že v časti dávky, ktorá sa rovná najmenej p=0,90, bude hodnota zaťaženia pri roztrhnutí medzi x L a xU . V norme ISO 16269-6 nájdeme hodnotu príslušného tolerančného činiteľa k4(12; 0,90; 0,95)=2,671 (Likeš-Laga: k4(12; 0,95; 0,95)=2,6550; Garaj-Janiga: k4(12; 0,95; 0,95)=2,6703) odkiaľ
x L = x − k 4 (n; p; 1 − α) × s = 252,01 − 2,671× 35,545 = 157,069 xU = x + k 4 (n; p; 1 − α) × s = 252,01 + 2,671 × 35,545 = 346,951 Treba si všimnúť, že hodnota x L je menšia a hodnota xU je väčšia ako v príklade 4.3 (známy rozptyl), pretože použitie s namiesto σ si
vyžaduje väčšiu hodnotu tolerančného činiteľa, aby sa pripustila dodatočná neistota. Treba platiť určitú daň za to, že nie je známa smerodajná odchýlka základného súboru σ a rozšírenie štatistického tolerančného intervalu toto berie do úvahy. Samozrejme, nie je úplne isté, že je správna hodnota σ = 33,150, použitá v príkladoch 4.2 a 4.3. Je preto rozumnejšie použiť odhad s spolu s príslušnými hodnotami tolerančných činiteľov. 4.6 Príklad : Dvojstranné štatistické tolerančné intervaly, neznámy spoločný rozptyl
Na troch strojoch sa vyrábajú súčiastky rovnakého druhu. Namerané hodnoty meranej veličiny na 17-tich súčiastkach od každého stroja sú
145
Sborník konference REQUEST'06
uvedené v nasledovnej tabuľke. Chceme vypočítať 99 %-ný dvojstranný tolerančný interval pre meranú veličinu na prvom, druhom a treťom stroji so spoľahlivosťou 1 − α = 0,95 . W-kritériom [26] bola potvrdená dobrá zhoda s normálnym rozdelením s neznámymi parametrami µ a σ 2 (pre prvý stroj je P hodnota 0,076, pre druhý 0,870 a pre tretí 0,979). Bartletovým testom bola zistená homogenita rozptylov ( H 0 : σ 12 = σ 22 = σ 32 nezamietame, pričom P hodnota je 0,907), preto na odhad spoločného rozptylu môžeme použiť všetkých 52 nameraných hodnôt ( s P2 = 2,1498 a s P = 1,4662 ). Stredné hodnoty sú rôzne ( H 0 : µ1 = µ 2 = µ 3
zamietame). Na odhad stredných hodnôt
môžeme použiť iba 17 meraní z produkcie príslušných strojov. V [11] nájdeme
pre
n = 17
ν = 3(17 − 1) = 48
a
hodnotu
k 43 = 3,2077 . Potom 99 %-ný dvojstranný tolerančný interval so spoľahlivosťou 0,95 je pre 1. stroj:
48,8294 ± 3,2077 ⋅ 2,1498 , t. j. (44,13; 53,53),
2. stroj:
54,0000 ± 3,2077 ⋅ 2,1498 , t. j. (49,30; 58,70),
3. stroj:
59,6706 ± 3,2077 ⋅ 2,1498 , t. j. (54,97; 64,37).
Namerané hodnoty znaku kvality pre tri stroje i
1. stroj
2. stroj
3. stroj
50,5 49,9 48,4 46,1 50,1 50,2 49,1 48,1 50,3 46,6 49,2 46,5
56,2 57,3 54,5 53,6 51,7 55,5 54,1 53,0 52,1 51,3 54,6 55,1
59,0 59,7 58,2 56,7 59,6 60,2 61,5 62,5 61,3 58,5 60,6 61,3
j 1 2 3 4 5 6 7 8 9 10 11 12
146
I. Janiga, I. Garaj: Použitie štatistických tolerančných intervalov v riadení kvality.
13 14 15 16 17
48,0 49,1 49,6 49,6 48,8
53,2 53,8 53,9 54,1 54,0
57,7 59,5 59,6 59,5 59,0
17
∑x
ij
j =1
830,1000
xi .
48,8294
s i2
1,8947
918,0000
1014,4000
54,0000 2,3662
59,6706 2,1885
4.7 Príklad : Štatistická prebierka meraním Pri štatistickej prebierke meraním je obyčajne normou daná dolná tolerančná hranica LSL (Lower Specification Limit), alebo horná tolerančná hranica USL (Upper Specification Limit). Predpokladáme, že merania kvantitatívneho štatistického znaku kvality (x1 , x 2 , L , x n ) sú realizácie normálneho rozdelenia
N ( µ, σ 2 ) , kde neznáme
parametre µ a σ 2 odhadneme pomocou vzťahov (1). V prípade hornej tolerančnej medze USL, dodávku výrobkov prijímame, ak výberovou kontrolou zistíme, že
x + k s ≤ USL . V prípade dolnej tolerančnej medze LSL, dodávku výrobkov prijímame, ak výberovou kontrolou zistíme, že
x − k s ≥ LSL . V oboch prípadoch je k tabelový jednostranný tolerančný činiteľ. Voľba koeficientu spoľahlivosti 1 − α závisí od toho, ako je preberací plán výhodný pre výrobcu, ale aj pre odberateľa. Odberateľ napríklad zvolí 1 − α = 0,05 a p = 0,90 . Pre n = 10 nájdeme v [12] hodnotu štatistického tolerančného činiteľa
k = 0,7116.
V prípade hornej tolerančnej medze USL dodávku výrobkov prijímame, ak
x + 0,7116 s ≤ USL
147
Sborník konference REQUEST'06
a zamietame, ak
x + 0,7116 s > USL Ak táto dodávka obsahuje podiel 100 p % = 90 % meraní pod hranicou USL, pravdepodobnosť, že bude prijatá je 1 − (1 − α ) = 0,95. V prípade dolnej tolerančnej medze LSL dodávku výrobkov prijímame, ak
x − 0,7116 s ≥ LSL a zamietame, ak
x − 0,7116 s < LSL. Ak táto dodávka obsahuje podiel 100 p % = 90 % meraní nad hranicou LSL, pravdepodobnosť že bude prijatá je 1 − (1 − α ) = 0,95.
4.8 Príklad : Prebierka dodávky polyesteru 104 Znak kvality polyesteru 104 je viskozita, meraná v mPa.s (mili Pascalּsekunda) pri teplote 25 °C [25]. Požiadavka normy je, aby horná medza viskozity bola USL = 1 000 cP . Polyester 104 sa dodáva konštantným počtom sudov, ktorých obsah predstavuje jednu výrobnú dávku (operáciu). Výsledky analýz prakticky nie sú zaťažené chybami. Náhodný výber poskytol n = 10 náhodných meraní: 939
945
947
945
948
941
943
944
946 940
W-kritériom [26] bola potvrdená dobrá zhoda s normálnym rozdelením (P hodnota je 0,7385). Rovnako ako v príklade 6 zvoľme 1 − α = 0,05 a p = 0,90 . V [12] nájdeme pre n = 10 hodnotu k 3 (10; 0,90; 0,05) = 0,7116. Z nameraných dát podľa vzťahov (1) vypočítame x = 943,8 a
s = 3,0111 . Pretože
x + k s = 943,8 + 0,7116 ⋅ 3,0111 = 945,94 < 1 000 nie je dôvod dodávku polyesteru 104 zamietnuť.
148
I. Janiga, I. Garaj: Použitie štatistických tolerančných intervalov v riadení kvality.
Ak táto dodávka obsahuje podiel 100 p % = 90 % meraní pod hranicou USL = 1 000 cP , potom bude prijatá s pravdepodobnosťou
1 − (1 − α ) = 1 − 0,05 = 0,95. 4.9 Príklad : Jednostranný štatistický tolerančný interval pro polyester 104 Pre dáta z príkladu 4.3 treba vypočítať pravostranný tolerančný interval (− ∞, x + k s ) so spoľahlivosťou 1 − α = 0,90 tak, aby pokryl podiel p = 0,95 hodnôt z rozdelenia N ( µ, σ 2 ) . V [12] nájdeme pre n = 10 hodnotu k 3 (10; 0,95; 0,90) = 2,5684. Potom
x + k s = 943,8 + 2,5684 ⋅ 3,0111 = 951,53 , t. j. interval
(− ∞, 951,53) s pravdepodobnosťou 0,90 pokryje aspoň podiel 100 p % = 95 % hodnôt z uvedenej výrobnej dávky. Na základe 10 hodnôt z príkladu 4.3 možno s pravdepodobnosťou 0,90 očakávať, že aspoň podiel 95 % meraní z dodávky polyesteru 104 bude mať viskozitu menšiu ako 951,53 mPa.s .
Literatúra [1]
WALD, A., WOLFOWITZ, J. Tolerance Limits for a Normal Distribution, In Annals of Mathematical Statistics, 1946, vol. 17, p. 208-215.
[2]
OWEN, D.B. Handbook of Statistical Tables. Reading, MA., Addison-Wesley Publishing Comp., 1962.
[3]
TAGUTI, G. Tables of tolerance coefficients for normal populations. In Reports of Statistical Application Research, JUSE, 1958, vol. 5, p. 73-118.
149
Sborník konference REQUEST'06
[4]
HOWE, W. G. Two-sided tolerance limits for normal populations. In Journal of the American Statistical Associantion, 1969, vol. 64, p. 610-620.
[5]
JÍLEK, M. Statistické toleranční meze. Praha, SNTL, 1988, 275 s.
[6]
EBERHARDT, K.R., MEE, R.W., REEVE, C.P. Computing factors for exact two-sided tolerance limits for a normal distribution. In Communications in Statistics, 1989, Part B, vol. 18, p. 397-413.
[7]
FUJINO, T. Exact two-sided tolerance limits for a normal distribution. In Japanese Journal of Applied Statistics, 1989, vol. 18, p. 29-36.
[8]
ODEH, R.E., OWEN, D.B. Tables for Normal Tolerance Limits, Sampling Plans, and Screening. New York, Marcel Dekker, 1980. 316 p. ISBN 0-8247-6944-9.
[9]
JANIGA, I., MIKLÓŠ, R. Statistical Tolerance Intervals for a Normal Distribution. In Measurement Science Review. ISSN 13, 2001, vol. 1, no. 1, p. 29-32.
[10] GARAJ, I., JANIGA I. Dvojstranné tolerančné medze pre neznámu strednú hodnotu a rozptyl normálneho rozdelenia. Bratislava: Vydavateľstvo STU, 2002. 147 s. ISBN 80-227-1779-7. [11] GARAJ, I., JANIGA I. Dvojstranné tolerančné medze normálnych rozdelení s neznámymi strednými hodnotami a s neznámym spoločným rozptylom. Two sided tolerance limits of normal distributions with uknown means and uknown common variability. Bratislava,Vydavateľstvo STU, 2004, 218 s. ISBN 80-227-2019-4. [12] GARAJ, I., JANIGA I. Jednostranné tolerančné medze normálneho rozdelenia s neznámou strednou hodnotou a rozptylom. Ono sided tolerance limits of normal distributions with uknown means and uknown common variability. Bratislava,Vydavateľstvo STU, 2004, 214 s. ISBN 80-227-2218-9. [13] JOHNSON, N. L., WELCH, B. L. Applications of the noncentral t-distribution. In Biometrika 1940, Vol. 31, p. 362-389. [14] HOGBEN, D., PINKHAM, R. S., WILK, B. B. The moments of the non-central t-distributions. In Biometrika 1961, Vol. 48, p. 465-468.
150
I. Janiga, I. Garaj: Použitie štatistických tolerančných intervalov v riadení kvality.
[15] BAGUI, S. C. CRC Handbook of Percentiles of Non-Central tDistributions. CRC Press, Boca Raton, Florida, 1993, 400 p. ISBN 0-8493-8669-1. [16] WOLFRAM, S. The Mathematica Book. 3rd ed. Wolfram Media/Cambridge University Press, 1996. 1403 p. ISBN 0-52158889-8. [17] SAHAI, H., OJEDA, M. M. A comparison of approximations to percentiles of the noncental t-distribution. In Revista Investigacion Operacional, 2000, Vol. 21, No. 2, p.121-144. [18] EEDEN, van C. Some approximations to the percentage points of the non-central t-distribution. In Revue de l´ Institut International de Statistique 29, 1961, p. 4-31. [19] WALLIS, W. A. Use of Variables in Acceptance Inspection for Percent Defective. Selected Techniques of Statistical Analysis (EISENHART, C., HASTAY, M. W., WALLIS, W. A. eds.). New York, 1947, McGraw Hill Bokk Company, p. 7-93. [20] JENNETT, W. T., WELCH, B. L. The control of proportion defective as judged by a single quality characteristic varying on a continuous scale. In Journal of the Royal Statistical Society, B 6, 1939, p. 80-88. [21] CORNISH, E. A., FISHER, R. A. Moments and cumulants in the specification of distributions. In Revue de l´ Institut International de Statistique, 5, 1937, p. 307-320. [22] AKAHIRA, M. A higher order aproximation to a percentage point of the non-central t-distribution. In Communications in Statistics, Part B: Simulcition and Computation, 1995, 24(3), p. 595-605. [23] LIKEŠ, J., LAGA, J. Základní statistické tabulky. Praha, SNTL, 1978, 488 s. [24] ODEH, R.E., OWEN, D.B. Tables for Normal Tolerance Limits, Sampling Plans, and Screening. New York, Marcel Dekker, 1980, 316 p. ISBN 0-8247-6944-9. [25] GARAJ, I. Preberací plán meraním pri daných jednostranných tolerančných medziach. In Statistika, 10, 1992, s. 431-437.
151
Sborník konference REQUEST'06
[26] GARAJ, I. W-kritérium a jeho spracovanie na počítači. In 9. medzinárodný seminár Výpočtová štatistika. ISBN 80-88946-09-3, SŠDS 2000, s. 30-32.
Adresy autorů: Doc. RNDr. Ivan Janiga, PhD., Katedra matematiky SjF STU, Nám. slobody 17, 812 31 Bratislava; Katedra aplikovanej matematiky, FPV UCM, Nám. J. Herdu 2, 917 01 Trnava, e-mail:
[email protected] RNDr. Ivan Garaj, PhD., Ústav informatizácie, automatizácie a matematiky, FCHPT STU, Radlinského 9, 812 37 Bratislava, tel.: +421-259325 297, e-mail:
[email protected]
Tento článok vznikol s podporou grantového projektu VEGA č. 1/1247/04 Progresívne štatistické techniky a rozhodovanie v procese zlepšovania kvality,.
152
Analýza experimentu pro robustní návrh Eva Jarošová
1. Úvod V posledních letech je v oblasti navrhování experimentů věno-vána zvýšená pozornost robustnímu návrhu jako prostředku zlepšování jakosti průmyslových procesů. Robustní návrh má původ v Japonsku a je spjat se jménem Taguchiho. Ať už se jakost procesu hodnotí pomocí ztrátové funkce nebo pomocí indexů způsobilosti, její zlepšení spočívá v posunu střední hodnoty směrem k cílové hodnotě a v redukci variability. K identifikaci faktorů, jejichž vhodným nastavením docílíme požadovaných změn, se využívají postupy z oblasti navrhování experimentů. Tradiční přístup spočívá ve vyhledávání faktorů, které mají vliv na úroveň hodnot sledované veličiny. U faktorů, které jsou měřitelnými veličinami, končí analýza stanovením optimálních podmínek, to znamená určením takové kombinace úrovní vlivných faktorů, při níž je střední hodnota sledované odezvy optimální. V normálním procesu může být ovšem udržení některých faktorů na požadované neměnné úrovni příliš náročné nebo dokonce nemožné. Poměrně známý je také model složek rozptylu, který slouží k identifikaci nejdůležitějších zdrojů variability sledované veličiny. V normálním procesu i v experimentu se vyskytuje několik úrovní zkoumaného faktoru a cílem není určení optimální úrovně faktoru, ale provedení takových nápravných opatření, aby rozdíly v hodnotách sledované odezvy při různých úrovních faktoru byly minimální. Tato opatření mohou být neúnosně složitá či ekonomicky náročná. V uvedených případech je možné aplikovat robustní návrh. Hlavní myšlenka spočívá v redukci variability nikoli pomocí náročné regulace faktorů, které jsou jejím zdrojem, ale vhodným nastavením jiných, snadněji ovladatelných faktorů. Ze statistického hlediska jde o identifikaci faktorů, které jsou zdrojem heteroskedasticity. Protože metodika robustního návrhu podle Taguchiho představuje někdy nestandardní postupy, bývá často kritizována. Kritici přicházejí s alternativními postupy, které zachovávají podstatu robustního návrhu, ale využívají běžných metod matematické statistiky, počínaje
153
Sborník konference REQUEST'06
nahrazením poměru signál-šum běžnou charakteristikou variability, tedy výběrovým rozptylem a konče výběrem optimálních podmínek pomocí modelu odezvové plochy. Cílem příspěvku je seznámit čtenáře se dvěma odlišnými přístupy k realizaci robustního návrhu. Pro ukázku byl zvolen příklad, který není z hlediska návrhu úplně typický, neboť rušivými faktory zde nejsou nekontrolovaně kolísající parametry procesu, ale kvalitativní faktory určující pevně polohu leptaných destiček na šestibokém hranolu. Lze si představit, že se jedná o pokračování experimentu, jehož cílem bylo identifikovat hlavní zdroje variability tloušťky epitaxiální vrstvy pomocí modelu složek rozptylu. Jako hlavní zdroj variability byly identifikovány dva faktory související s polohou destiček. Data jsou převzata z [5]. 2. Robustní návrh V průmyslových aplikacích představuje robustní návrh metodologii, jejímž cílem je minimalizovat variabilitu výstupu procesu nebo parametru výrobku kolem cílové hodnoty. Robustnosti se dosáhne nastavením vhodných faktorů na takovou úroveň, aby hodnoty sledované veličiny byly optimální. V robustním návrhu se rozlišují dvě hlavní skupiny faktorů. Řiditelné faktory jsou ovladatelné jak v normálním procesu, tak samozřejmě během experimentování, to znamená, že jejich úrovně je možné po nastavení udržet neměnné. Hodnoty rušivých faktorů se během normálního procesu obvykle mění v čase, případně s polohou, během experimentu jsou však, aspoň do jisté míry, ovladatelné. Poněkud odlišný charakter mají kategoriální faktory, u nichž existuje z principu několik úrovní, jejichž počet nelze redukovat. I tyto faktory mohou být považovány za rušivé. Společnou vlastností měřitelných i kategoriálních rušivých faktorů je to, že existence různých úrovní během normálního procesu je zdrojem nežádoucí variability sledovaného znaku. Původní myšlenka Taguchiho robustního návrhu je následující: do experimentu jsou zahrnuty jak řiditelné, tak rušivé faktory, úrovně rušivých faktorů přitom odpovídají hodnotám těchto faktorů vyskytujícím se v normálním procesu. Pro každou skupinu se uvažuje zvláštní návrh, tzv. vnitřní a vnější pole. Obě pole jsou křížena, což znamená, že v každém bodě vnitřního pole, tj. kombinaci úrovní řiditelných faktorů, se vystřídají všechny body vnějšího pole, tj.
154
E. Jarošová: Analýza experimentu pro robustní návrh.
kombinace úrovní rušivých faktorů. V každém bodě vnitřního pole se z naměřených hodnot sledované veličiny vypočte určitá charakteristika a dále jsou analyzovány hodnoty této souhrnné charakteristiky. Zkoumá se vliv řiditelných faktorů na hodnoty této charakteristiky a cílem je najít takovou kombinaci řiditelných faktorů, při níž je charakteristika optimální. Optimalizace se provádí ve dvou krocích. Nejprve se minimalizuje rozptyl, potom se upravuje střední hodnota procesu. Taguchi navrhuje různé typy charakteristik. Jejich volba závisí na povaze konkrétního řešeného problému. Charakteristiky popisující variabilitu jsou označovány jako poměr signál-šum a jejich optimální hodnoty jsou vždy maximem. Vlivné faktory jsou často vyhledávány jen pomocí grafické metody, v lepším případě se provádí analýza rozptylu nebo analýza průměrů. Před aplikací příslušné metody se však o tvaru modelu, tj. o tom, které faktory a interakce zařadíme, rozhoduje jen na základě posouzení odhadů jednotlivých efektů, případně s využitím dříve získaných informací. Nedostatečné teoretické zdůvodnění se nahrazuje provedením ověřovacího experimentu.
3. Příklad Při výrobě integrovaných obvodů se na leštěných silikonových destičkách nechává růst epitaxiální vrstva. Destičky jsou připevněny na šestibokém hranolu (dvě destičky na každé plošce), který je umístěn pod krycím zvonem, do nějž jsou vstřikovány chemické páry. Proces probíhá určitou dobu a cílová hodnota epitaxiální vrstvy je 14,5 m. Osm faktorů v experimentu je řiditelných se dvěma úrovněmi: způsob rotace válce (A), kód destiček (B), teplota při pokovování (C), doba pokovování (D), rychlost proudění arzénu (E), teplota kyseliny (F), rychlost proudění kyseliny (G) a pozice uzlu (H). Plošky a umístění destičky jsou považovány za úrovně rušivých faktorů. Data publikovaná v [5] jsou redukována, takže jsou k dispozici výsledky pouze ze čtyř plošek. Faktor ploška (M) má tedy jen 4 úrovně, faktor poloha (L) je s dvěma úrovněmi (horní, dolní). Experimentální návrh sestává ze 16 experimentálních bodů tvořených řiditelnými faktory (dílčí faktoriální návrh 28-4). Kombinace úrovní rušivých faktorů jsou považovány za experimentální body úplného faktoriálního experimentu. Při každém nastavení řiditelných faktorů máme tedy 8
155
Sborník konference REQUEST'06
pozorování. Výsledky ve dvou experimentálních bodech jsou uvedeny v tabulce. Úrovně řiditelných faktorů jsou označeny – a +. Rušivý faktor Řiditelné faktory A B C D E F G H
L1 (dolní)
L2 (horní)
M1
M2
M3
M4
M1
M2
M3
M4
- - - + - - -
14.291
14.192
14.271
14.188
15.318
15.428
15.266
15.406
- - - + + + + +
14.803
14.719
14.696
14.764
15.931
14.895
14.921
15.135
M
M
M
M
M
M
M
M
M
4 Metody vyhodnocení 4.1 Vyhodnocení v duchu původního Taguchiho přístupu Mezi řiditelnými faktory se hledají faktory s disperzními efekty, tj. faktory, které ovlivňují charakteristiku variability (a případně i charakteristiku polohy) sledované veličiny, a faktory ovlivňující jen charakteristiku polohy. Uvažují se dva modely, jeden pro charakteristiku polohy, druhý pro charakteristiku variability. Charakteristikou polohy je výběrový průměr vypočtený v jednotlivých bodech vnitřního pole z výsledků získaných při různých kombinacích rušivých faktorů, charakteristikou variability může být výběrový rozptyl resp. jeho logaritmus. Logaritmická transformace má zajistit tři vlastnosti - normalitu, konstantní rozptyl a linearitu. Vnitřní pole pro řiditelné faktory odpovídá dílčímu faktoriálnímu návrhu 28-4, vnější pole pro rušivé faktory představuje úplný faktoriální návrh 4x2.V každém bodě vnitřního pole máme tedy 8 pozorování. Z těchto pozorování vypočteme jednak průměr, jednak logaritmus rozptylu a budeme konstruovat model pro každou charakteristiku zvlášť. Přitom musíme vzít v úvahu směšování efektů, které je pro dílčí faktoriální návrhy typické, a uvažovat jen takové efekty, aby matice návrhu měla plnou hodnost. Schéma směšování efektů je znázorněno v tab.1. Hlavní efekty faktorů jsou smíšeny s třífaktorovými interakcemi, dvoufaktorová interakce AB
156
E. Jarošová: Analýza experimentu pro robustní návrh.
s interakcemi CD, EF a GH atd. I když se v tabulkách a v grafických výstupech objevují jen označení faktorů a interakcí uvedená v prvním sloupci tabulky, je třeba počítat s tím, že v případě významnosti efektu může jít ve skutečnosti o vliv některého z tzv. alias efektů uvedených ve stejném řádku. A - B*C*D + B*E*F + B*G*H + C*E*G + C*F*H - D*E*H - D*F*G B - A*C*D + A*E*F + A*G*H + C*E*H + C*F*G - D*E*G - D*F*H C - A*B*D + A*E*G + A*F*H + B*E*H + B*F*G - D*E*F - D*G*H D - A*B*C - A*E*H - A*F*G - B*E*G - B*F*H - C*E*F - C*G*H E + A*B*F + A*C*G - A*D*H + B*C*H - B*D*G - C*D*F + F*G*H F + A*B*E + A*C*H - A*D*G + B*C*G - B*D*H - C*D*E + E*G*H G + A*B*H + A*C*E - A*D*F + B*C*F - B*D*E - C*D*H + E*F*H H + A*B*G + A*C*F - A*D*E + B*C*E - B*D*F - C*D*G + E*F*G A*B - C*D + E*F + G*H A*C - B*D + E*G + F*H A*D - B*C - E*H - F*G A*E + B*F + C*G - D*H A*F + B*E + C*H - D*G A*G + B*H + C*E - D*F A*H + B*G + C*F - D*E
Tab. 1- Směšování efektů Zařadíme-li do modelu všech 15 odhadnutelných hlavních efektů a interakcí, nezbudou žádné stupně volnosti pro odhad rozptylu náhodné složky. Potom také nemůžeme použít např. F-test analýzy rozptylu k vyhledání významných efektů. Situace se často řeší sloučením nejmenších efektů, které jsou považovány za důsledek náhodného kolísání, a jejich zahrnutím do náhodné složky. Seřadímeli všechny efekty podle velikosti absolutní hodnoty, obvykle zjistíme, že několik efektů je podstatně větších než ostatní. Tyto efekty potom zařadíme do modelu. Výběr efektů usnadňuje použití normálního či půlnormálního pravděpodobnostního grafu, který bývá součástí výstupu příslušných počítačových procedur. Jde o neformální grafickou metodu spočívající ve vizuálním posouzení toho, zda se bod odpovídající zkoumanému efektu dostatečně odchyluje od přímky proložené body znázorňujícími nejmenší efekty. Normální pravděpodobnostní graf pro model průměru a rozptylu je na obr. 1 a 2.
157
Sborník konference REQUEST'06
Normal Probability Plot of the Effects (response is prumer, Alpha = ,05) D
Normal Score
1
0
-1
0,0
0,2
0,4
0,6
0,8
Effect
Obr. 1 – Normální graf efektů, odezva průměr Normal Probability Plot of the Effects (response is ln s2, Alpha = ,05)
Normal Score
1
0
-1 H
-2
-1
0
1
Effect
Obr. 2 – Normální graf efektů, odezva ln s2
Je-li odezvou průměr, ukazuje se jako podstatný efekt faktoru D (obr.1), uvažujeme-li jako odezvu logaritmus rozptylu, můžeme soudit, že vliv má faktor H (obr.2). Robustní odhad směrodatné chyby efektů [4] odstraňuje možnou nejednoznačnost grafické metody. Při ortogonálním návrhu mají
158
E. Jarošová: Analýza experimentu pro robustní návrh.
všechny odhadované efekty γˆ j stejnou směrodatnou chybu. Robustní odhad
PSE = 1,5median{|γˆ j |<2.5 s0 } | γˆ j | ,
s počáteční směrodatnou chybou s0 = 1.5median | γˆ j | , j = 1, 2, ..., J, je za předpokladu normality konzistentním odhadem směrodatné chyby efektu. Cílem ořezávání je odstranění nenulových efektů při odhadu směrodatné chyby, která má zohledňovat pouze náhodné kolísání. Pro identifikaci důležitých řiditelných faktorů se potom použije statistika
t PSE , j =
| γˆ j |
PSE
,
tedy analogie t-testu v lineárním modelu. Kritické hodnoty pro různé hladiny významnosti a počty efektů v modelu jsou tabelovány, např. v [5]. V tabulkách je pro dané uvedena hodnota odpovídající 1kvantilu. Podle aplikace v [5] a podle vybraných hodnot v tabulkách by se dalo soudit, že souhlasí s hladinou významnosti. Na základě analogie s t-testem bychom spíše očekávali 1- /2 kvantil, to znamená, že při hladině významnosti 0,05 bychom hledali kritickou hodnotu odpovídající = 0,025. Tomu také odpovídají výsledky v Minitabu, viz obr.3 a 4. Jelikož jsou tabelovány hodnoty pro = 0,02 a = 0,03, je třeba interpolovat. Pro I = 15 efektů jsou tabelované kritické hodnoty 2,95 a 2,52, interpolací získáme hodnotu 2,735. Vynásobíme-li tuto kritickou hodnotu vypočtenou hodnotou PSE, můžeme s výsledkem přímo porovnávat absolutní hodnoty efektů. model
A
B
C
D
E
F
G
H
průměr
-0,076
0,030
-0,114
0,804
-0,025
0,098
-0,108
0,173
ln s2
1,234
0,209
0,327
0,848
0,054
-0,412
-0,223
-1,959
model
AB
AC
AD
AE
AF
AG
AH
průměr
0,029
-0,093
-0,049
0,028
0,058
-0,021
0,010
-0,280
-0,501
-0,446
-0,699
0,481
-0,057
0,596
ln
s2
Tab.2 – Velikost hlavních efektů a interakcí ve dvou modelech Robustní odhad směrodatné chyby efektů PSE je pro model průměru 0,081, pro model logaritmu rozptylu 0,644. Po vynásobení uvedenou
159
Sborník konference REQUEST'06
kritickou hodnotou dostaneme 0,222 pro model průměru a 1,761 pro model logaritmu rozptylu. Z tab.2 plyne, že příslušnou hodnotu překračuje v řádku pro průměr jen efekt faktoru D, v řádku pro logaritmus rozptylu jen efekt faktoru H. Ke stejnému závěru dojdeme i na základě Paretova diagramu (obr.3 a 4), v němž je vyznačena referenční hodnota pro posuzování důležitosti efektů.
Pareto Chart of the Effects
Pareto Chart of the Effects
(response is ln s2, Alpha = ,05)
(response is prumer, Alpha = ,05)
H
D
A
H C
D
G
AE
F
AH
AC
AC
A
AF
AF
AD
AD
F
B
C
AB
AB
AE
G
E
B
AG
AG E
AH
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0
Obr. 3 – Paretův diagram, odezva průměr
1
2
Obr. 4 – Paretův diagram, odezva ln s2
Zkusíme-li do modelu ANOVA zařadit ještě některé další efekty v pořadí podle Paretova diagramu, pak při hladině významnosti 0,05 dospějeme k následujícím modelům
yˆ prumer ,i = 14, 352 + 0, 4019 xDi + 0, 0867 xHi (0,000)
(0,022)
yˆln s2 ,i = −1,9531 + 0, 6173xAi − 0,9791xHi . (0,018)
(0,001)
Index i značí i-tý bod vnitřního pole (i = 1,2, .., 16). Pod efekty jsou uvedeny příslušné p-hodnoty. 4.2 Model odezvy Alternativním přístupem je modelování hodnot původní sledované proměnné. Do modelu jsou zahrnuty jak řiditelné, tak rušivé faktory a faktory ovlivňují variabilitu odezvy (faktory s disperzními efekty) se identifikují prostřednictvím významných
160
E. Jarošová: Analýza experimentu pro robustní návrh.
interakcí řiditelného a rušivého faktoru. Nezařadíme-li do modelu interakce nejvyšších řádů, můžeme analýzu provést pomocí klasického F-testu analýzy rozptylu nebo pomocí t-testů v obecném lineárním modelu. Pokud bychom zařadili všechny odhadnutelné efekty, museli bychom při posuzování důležitosti efektů postupovat podobně jako v případě 4.1. Zařadíme-li do modelu jen hlavní efekty, odhadnutelné dvoufaktorové interakce a ze třífaktorových interakcí jen ty, které obsahují jeden z rušivých faktorů L nebo M, dostaneme rovnici 14,3520 0,4019 0,0867 0,3296 0,0125 +0,0461 0,0442 0,0316 0,0814 0,2388 0,0016 Řiditelné faktory a rušivý faktor L mají dvě úrovně, proto jim odpovídá vždy jeden sloupec matice návrhu. Rušivý faktor M má čtyři úrovně a proto mu odpovídají tři sloupce matice návrhu, totéž platí pro interakci CM. Index i značí i-tý experimentální bod (i = 1,2, .., 128). P-hodnoty u všech zahrnutých efektů jsou menší než 0,0001. Významné efekty faktoru D a H signalizují, že pomocí těchto faktorů lze ovlivňovat úroveň hodnot odezvy. Významné efekty rušivých faktorů L a M potvrzují, že uvedené faktory jsou podstatným zdrojem nežádoucí variability odezvy. Z interakcí řiditelného a rušivého faktoru se ukázaly být nejvýznamnější dvě, CM a HL. Grafy těchto interakcí jsou uvedeny na obr.5 a 6. 15
15
C-
14 13,5
H+
14,5
y
y
14,5
C+
14
H-
13,5 13
13 1
2
3
1
4
2
L
M
Obr. 5 - Graf interakce CM
Obr. 6 – Graf interakce HL
Podle obr.5 a 6 je vhodné nastavit faktor C na úroveň – a faktor H na úroveň +, neboť můžeme očekávat menší variabilitu v důsledku rozdílu mezi úrovněmi faktoru M resp. L. Interakce CM je méně důležitá než interakce HL, jak plyne nejen z obrázku, ale i z modelu.
161
Sborník konference REQUEST'06
Efekt faktoru H se ukázal být významný i při modelování logaritmu rozptylu, ovšem efekt faktoru C patřil k nejmenším. Naopak efekt faktoru A identifikovaný dříve v modelu logaritmu rozptylu v modelu odezvy nevystupuje. Abychom zjistili příčinu, provedeme diagnostiku reziduí z modelu odezvy. Aplikujeme-li Glejserův test heteroskedasticity, dostaneme model, yˆ|e|,i = 0, 2301 + 0, 0823 x Ai . podle nějž absolutní hodnota reziduí závisí na faktoru A. P-hodnota u efektu A je menší než 0,0001. Heteroskedasticita může být způsobena zahrnutím interakcí vyššího řádu obsahujících faktor A do náhodné složky. Zkusíme-li zařadit různé třífaktorové interakce obsahující faktor A, zjistíme, že u jednoho členu interakce ACM je p-hodnota 0,0008. Model tedy doplníme ještě o interakci ACM 14,3520 0,4019 0,0867 0,3296 0,0125 +0,0461 0,0442 0,0316 0,0814 0,2388 0,0283 0,0016 0,0459 0,00144 Na základě uvedeného modelu lze očekávat, že variabilitu odezvy snížíme vhodným nastavením řiditelných faktorů A, C a H, střední hodnotu potom upravíme vhodnou volbou úrovně faktoru D.
5 Závěr Výrazný vliv faktoru D na úroveň hodnot odezvy se projevil jak v modelu pro průměr, tak v modelu odezvy. Podobně výrazně se od ostatních efektů liší efekt faktoru H v modelu logaritmu rozptylu a efekt interakce HL v modelu odezvy. Vzhledem k tomu, že faktory D a H jsou kvantitativní, neměla by analýza končit výběrem lepší úrovně z vyzkoušených. Experiment by se měl doplnit dalšími zkouškami, aby mohl být zkonstruován model odezvové plochy a teprve pomocí něj nalezeny optimální podmínky. V daném případě ve všech modelech vždy jeden efekt převažoval nad ostatními. Otázkou je, zda při menších rozdílech mezi největšími efekty nebude identifikace významných efektů problematičtější. Pokud jsou zkoumané faktory kvantitativní, bude také pravděpodobně efekt faktoru záviset na vzdálenosti úrovní nastavovaných v experimentu. Neomezíme se proto jen na největší efekty, ale v úvahu bychom měli brát všechny efekty, které se ukázaly
162
E. Jarošová: Analýza experimentu pro robustní návrh.
být významné. Při modelování souhrnných charakteristik lze očekávat menší sílu testu vzhledem k menším rozsahům výběru, navíc logaritmická transformace nemusí plnit funkci, kterou očekáváme (viz výše). Některé nenulové efekty tak mohou zůstat neidentifikovány. V modelu odezvy nastává, jak se ukázalo, problém opačný. Síla testů je díky několikanásobnému rozsahu výběru mnohem větší a významných efektů je více, než je pro praktické řešení užitečné. Postupné zařazování či vypouštění efektů je při větším rozsahu experimentu zdlouhavé. U obecného lineárního modelu nenabízejí statistické programy běžně obdobu metody stepwise známé z regresní analýzy. Minitab umožňuje posoudit významnost jednotlivých efektů pomocí normálního pravděpodobnostního grafu a Paretova diagramu i při uvažování všech odhadnutelných efektů, jak bylo uvedeno výše, v případě dílčího faktoriálního návrhu a následného směšování efektů je však příprava těchto grafů dosti pracná. Literatura [1] Jarošová, E., Zimmermann, P.(2006): Experiment pro robustní návrh. In: Jakost – Quality 2006 [CD-ROM]. Ostrava : Dům techniky, 2006, s. 138–143. [2] Jarošová, E. (2006): Analysis of dispersion effects in experimental design, in: In: AMSE 2006 [CD-ROM]. Praha : VŠE FIS, 2006, 6.s. [3] Daniel, C. (1959): Use of Half-Normal Plots in Interpreting Factorial Two Level Experiments. Technometrics, Vol. 1, 311-340. [4] Lenth, R.V. (1989): Quick and Easy Analysis of Unreplicated Factorials, Technometrics, 31, 469-473. [5] Wu, C.F.J., Hamada, M. (2000): Experiments. Planning, Analysis, and Parameter Design Optimization. J. Wiley & Sons. Adresa autora: Doc. Ing. Eva Jarošová, CSc., Vysoká škola ekonomická v Praze, fakulta informatiky a statistiky, Katedra statistiky a pravděpodobnosti, nám. W. Churchilla 4, 130 67 Praha 3. e-mail:
[email protected]
163
Fuzzy spolehlivost ZdenČk Karpíšek Abstrakt: V pĜíspČvku je pĜehledovou formou popsán matematický model spolehlivosti objektu s vágními dobami do poruchy. Model vychází ze základních charakteristik fuzzy spolehlivosti s fuzzy parametrem a metod výpoþtu fuzzy spolehlivosti systému se vzájemnČ nezávislými dvoustavovými prvky. Pro reálné aplikace byly vytvoĜeny dva modely fuzzy Weibullova rozdČlení pravdČpodobnosti.
1. Motivace PĜi sledování provozní spolehlivosti systémĤ a jejich prvkĤ se þasto setkáváme s rĤznČ nepĜesnými informacemi o dobách do poruchy i podmínkách provozu. Ze zdrojĤ nepĜesnosti lze zejména uvést: zámČrné zkreslení údajĤ uživatelem anebo výrobcem, nízká úroveĖ nebo zkušenost obsluhy, nevhodná údržba, neúplné sledování výrobku v provozu, konstrukþní zmČny výrobku a vliv provozních podmínek. Jednotlivé údaje s rĤznou vČrohodností o dobách do poruch i dobách oprav mĤžeme vyjádĜit pomocí fuzzy reálných þísel. Tento pĜístup umožĖuje modelovat spolehlivost objektu (systému i jeho prvkĤ) pomocí fuzzy spolehlivosti R (t ) , která nabývá fuzzy reálných hodnot. Takový model sice nevede ke zpĜesnČní výsledných informací, ale dovoluje posoudit hodnoty sledovaných charakteristik v celém možném rozsahu vþetnČ stupĖĤ pĜíslušnosti jejich jednotlivých hodnot jako mČr jejich vČrohodnosti. V následujícím textu znaþí \ množinu všech reálných þísel a ` množinu všech pĜirozených þísel. Pro uzavĜený interval užíváme oznaþení >.;.@ a pro polouzavĜený interval ozna-
þení >.;. , resp. .;.@ . 2 Fuzzy stochastický model spolehlivosti
NechĢ X je neprázdná množina prvkĤ x a P A : X o >0;1@ je zobrazení. Fuzzy
množinou A na univerzu X rozumíme uspoĜádanou dvojici X , P A , kde P A je funkce pĜíslušnosti fuzzy množiny A a její hodnota P A x je stupeĖ pĜísluš nosti prvku x k fuzzy množinČ A . Nosiþ fuzzy množiny A je množina Supp A x X P A x ! 0 . Jádro fuzzy množiny A je množina Ker A x X P A x 1 . Fuzzy množina A je normální, jestliže Ker A z .
^
^
164
`
`
Z. Karpíšek: Fuzzy spolehlivost.
Dnásobek fuzzy množiny A , kde D >0;1@ , je fuzzy množina D A s funkcí pĜíslušnosti DP A .
DĜez fuzzy množiny A je množina AD D >0;1@ . Platí, že A
*
D AD .
^x X
`
P A x t D , kde
D>0;1@
Fuzzy reálné þíslo a je normální fuzzy množina \, Pa , jejíž funkce pĜí-
slušnosti Pa je po þástech spojitá a jejíž všechny D-Ĝezy jsou konvexní množi
ny.
m
Fuzzy parametrická funkce f x, S je fuzzy svazek Y X u\ , P f x ,S , tj. fuzzy množina na množinČ funkcí, kde P f x ,S y sup PS s ,
s \ m f x ,s y
fuzzy parametr S je fuzzy množina \ m , PS a f x, s je parametrická funkce m s parametrem s \ , m ` . Bližší informace o fuzzy množinách, inkluzích , , , operacích , ,
, , , fuzzy reálných þíslech a rozšíĜených aritmetických operacích , ,
, lze nalézt v [1]. Fuzzifikace klasické teorie pravdČpodobnosti je založena na následujících pojmech [7]. NechĢ : z je základní prostor elementárních jevĤ. Fuzzy množina A :, P A s borelovsky mČĜitelnou funkcí pĜíslušnosti P A : : o >0;1@ se nazývá fuzzy jev. Neprázdná množina fuzzy jevĤ 6 se nazývá fuzzy borelovské jevové pole na základním prostoru : , jestliže má vlastnosti: 1. A : , D >0;1@ D A 6 .
2. A 6 A 6 . 3. A1 , A2 ,! 6
f
* A 6 j
.
j 1
4. A1 , A1 6 A1 A1 6 . NechĢ 3 je neprázdná množina pravdČpodobnostních mČr P na základním prostoru : \ m , m ` , a 6 je fuzzy borelovské jevové pole na : . NechĢ dále P 3, P P je taková fuzzy funkce (fuzzy svazek) na 3 , že existuje pravdČpodobnostní míra P 3 , pro niž P P P 1 . Pak P se nazývá fuzzy
165
Sborník konference REQUEST'06
pravdČpodobnost na : . Fuzzy pravdČpodobnost fuzzy jevu A fuzzy množina P A >0;1@ , P P A , kde P P A p sup P P P
³
:
pro p >0;1@ a
³P
: m
integrál. Jestliže neexistuje
m
taková míra P 3 , že
\
je
P AdP p
³ znaþí LebesgueĤv-StieltjesĤv
\
A
P
:, P 6
A dP
p , klademe P P A p
0 . UspoĜádaná trojice
, 6, P se nazývá fuzzy pravdČpodobnostní prostor na \ m . Fuzzy pravdČ podobnost P má Ĝadu vlastností podobných jako pravdČpodobnost P [2]. NechĢ & je neprázdná množina náhodných veliþin X na \ , ) je množina jejich distribuþních funkcí a 6 je fuzzy borelovské jevové pole na : \ . NechĢ F ), P F je takový fuzzy svazek distribuþních funkcí F na \ , že existuje distribuþní funkce F ), pro niž P F F 1 pro x \ . Fuzzy mno-
žina X X, P X , kde klademe P X X P F F pro X , se nazývá fuzzy náhodná veliþina a její fuzzy distribuþní funkce je fuzzy svazek F ), P F . UspoĜádaná dvojice X , F se nazývá fuzzy rozdČlení pravdČpodobnosti. Blíže o vlastnostech fuzzy náhodné veliþiny v [3]. Fuzzifikace klasického spolehlivostního modelu je založena na pĜedpokladu, že doba bezporuchového provozu objektu je fuzzy náhodná veliþina T , která má fuzzy rozdČlení pravdČpodobnosti T , F . To vyjadĜuje jednak neurþi tost þasu t pĜechodu od bezporuchového stavu objektu do poruchového stavu, jednak vágnost rozdČlení pravdČpodobnosti doby bezporuchového stavu [4]. Fuzzy spolehlivost objektu definujeme jako fuzzy pravdČpodobnost doby jeho bezporuchového stavu, takže fuzzy spolehlivostní funkce je R t P T t t 1 F t pro t \ . ZĜejmČ je F t 1 R t pro t \ , speciálnČ R t 1 pro t f; 0@ a R f 0 . Dále pĜedpokládáme, že F je taková fuzzy distribuþní funkce, že všechny dF jsou hustodistribuþní funkce F z množiny ) jsou absolutnČ spojité a f dt ty pravdČpodobnosti.
166
Z. Karpíšek: Fuzzy spolehlivost.
P f f P F F , kde f
Fuzzy
O t
intenzita
dF t s funkcí pĜíslušnosti dt
f t
Fuzzy hustota je fuzzy funkce
dF pro F ) a t \ . dt (fuzzy intenzita poruch)
je
fuzzy
funkce
0;+f , P , kde O
PO O
sup P F F
F f O 1- F
pro t >0;+f . NemĤžeme psát O f R nebo O f
R 1 , protože fuzzy funkce f a R jsou závislé. Fuzzy stĜední doba bezporuchového stavu je fuzzy stĜední hodnota E T fuzzy náhodné veliþiny T . Pro fuzzy distribuþní funkci F , kde všechny distri buþní funkce F jsou absolutnČ spojité, je f
³ R t dt >0;+f ; P ,
E T
E T
0
kde pro t >0;+f je
P E T t
PF F .
sup
F f
³ RW dW
t
0
Další fuzzy þíselné charakteristiky doby bezporuchového stavu momentového typu, napĜ. fuzzy rozptyl D T fuzzy náhodné veliþiny T apod., definu jeme analogicky. Fuzzy Pkvantil (fuzzy 100P%kvantil) tP fuzzy náhodné veliþiny T , P (0; 1), je fuzzy reálné þíslo >0;+f ; P tP , kde pro tP >0;+f
P tP tP
sup P F F .
F F (t P )
P
Fuzzifikací klasických spolehlivostních rozdČlení pravdČpodobnosti doby bezporuchového stavu obdržíme fuzzy rozdČlení pro modelování reálných nepĜesných dat dob do poruchy. Jako efektivní se ukazuje fuzzifikovat klasická rozdČlení pomocí parametru [4]. Fuzzy model A je založen na parametrickém systému distribuþních funkcí F x, s . Jestliže nahradíme parametr s \ k , kde k ` , fuzzy parametrem S
\ , P k
S
s jádrem Ker S z , dostaneme fuzzy distribuþní funkci
167
Sborník konference REQUEST'06
s fuzzy parametrem F x, S , kde klademe P F F P S s pro x \ a s \ k . PodobnČ lze postupovat v pĜípadČ parametrického systému hustot f(x, s) , kdy získáme fuzzy hustotu f x, S . Pro tento model pĜedpokládáme, že hodnoty fuzzy náhodné veliþiny T jsou fuzzy reálná þísla t >0;+f , P t a t N t , kde t je pozorovaná hodnota obyþejné náhodné veliþiny T a N je tzv. koeficient nepĜesnosti. Koeficient nepĜesnosti je trojúhelníkové fuzzy reálné þíslo N >0; f , PN , PN 0 1 , a funkcí pĜíslušnosti N N min , N >N min ;1@ , ° 1N min °° PN (N ) ® N N max , N >1;N max @ , ° 1N max ° °¯ 0 jinde, kde 0 N min d 1 d N max a meze N min , N max jsou dány expertním odhadem. Na obr. 1 je znázornČn graf PN (N ) .
Obr. 1 Jestliže náhodná veliþina T má klasické dvouparametrické Weibullovo rozdČlení pravdČpodobnosti W b, G , pak odpovídající fuzzy náhodná veliþina T má s ohledem na koeficient nepĜesnosti N tzv. fuzzy Weibullovo rozdČlení prv ního typu W b, NG s následujícími fuzzy charakteristikami. ª § t ·b º Pro t >0; f je fuzzy distribuþní funkce F (t ) 1 exp « ¨ ¸ » , takže «¬ © NG ¹ »¼ pro D >0;1@ jsou její DĜezy
168
Z. Karpíšek: Fuzzy spolehlivost. FD t
> F1D (t ); F2D (t )@
b b ª ª § ª § · º · ºº t t «1 exp « ¨ ¸ » ;1 exp « ¨ ¸ »» . « «¬ © G [(1 N max )D N max ] ¹ ¼» «¬ © G [(1 N min )D N min ] ¹ »¼ » ¬ ¼
Pro t >0; f je fuzzy spolehlivostní funkce R (t ) pro D >0;1@ jsou její DĜezy RD t
ª § t ·b º exp « ¨ ¸ » , takže «¬ © NG ¹ »¼
> R1D (t ); R2D (t )@
b b ª ª § ª § · ºº · º t t « exp « ¨ ¸ »» . ¸ » ;exp « ¨ « «¬ © G [(1 N max )D N max ] ¹ »¼ » «¬ © G [(1 N min )D N min ] ¹ »¼ ¬ ¼
Pro t >0; f je fuzzy intenzita O (t ) její DĜezy OD t >O1D (t ); O2D (t )@
bt b1 , takže pro D >0;1@ jsou (NG )b
ª º bt b1 bt b1 « ». ; b b ¬« G [(1 N max )D N max ] G [(1 N min )D N min ] ¼» Fuzzy stĜední hodnota fuzzy náhodné veliþiny T je trojúhelníkové fuzzy §1 · reálné þíslo E (T ) NG* ¨ 1¸ s funkcí pĜíslušnosti ©b ¹ §1 · ° t N minG* ¨ b 1¸ © ¹ , t ªN G* § 1 1· ;G* § 1 1· º , ° ¨ ¸» « min ¨ b ¸ §1 · ° 1N © ¹ © b ¹¼ ¬ * 1 G min ¨ ¸ ° ©b ¹ °° P E (T ) t ® §1 · ° t N max G* ©¨ b 1¹¸ ª §1 · § 1 ·º , t «G* ¨ 1¸ ;N max G* ¨ 1¸ » , ° 1 b ¹ © b ¹¼ ° 1 N G* § 1· ¬ © max ¨ ¸ ° ©b ¹ ° 0 jinde. °¯
Fuzzy Pkvantil je pro P >0;1 trojúhelníkové fuzzy reálné þíslo 1
tP
NG > ln(1 P )@ b s funkcí pĜíslušnosti
169
Sborník konference REQUEST'06
P tP t
1 1 1 ° t N min G > ln(1 P )@ b , t ªN G > ln(1 P )@ b ;G > ln(1 P )@ b º , min « » 1 ° ¬ ¼ ° 1 N min G > ln(1 P )@ b ° 1 ® 1 1 ° t N max G > ln(1 P )@ b , t ªG > ln(1 P )@ b ;N G > ln(1 P ) @b º , max « » 1 ° ¬ ¼ b 1 ln(1 ) N G P > @ ° max ° 0 jinde. ¯
Pro znázornČní DĜezĤ RD t fuzzy spolehlivosti s fuzzy Weibullovým rozdČlením prvního typu byl vytvoĜen program FMFF pro PC, jehož výstupní okno je na obr. 2.
Obr. 2 Fuzzy model B je opČt založen na parametrickém systému distribuþních funkcí, avšak fuzzy distribuþní funkce má tvar F x, S F x SK x , kde výraz SK x vyjadĜuje "rozmazání" hlavní hodnoty distribuþní funkce F x . Vlastnosti tohoto modelu jsou popsány v [4].
170
Z. Karpíšek: Fuzzy spolehlivost. Jestliže náhodná veliþina T má klasické dvouparametrické Weibullovo rozdČlení pravdČpodobnosti W b, G , pak odpovídající fuzzy náhodná veliþina T má s ohledem na fuzzy parametr S tzv. fuzzy Weibullovo rozdČlení druhého typu W b, G ; SK (t ) (jde o model B), kde funkce b b °exp( rt ) exp ¬ª ( r q)t ¼º , t >0; f , K (t ) ® 0 jinde, °¯ obsahuje reálné konstanty r ª¬G b ; f , q ª¬0;G b a fuzzy parametr S je fuzzy reálné þíslo S > 1; 1@ , PS , PS 0 1 . Uvedené fuzzy Weibullovo rozdČlení má následující fuzzy charakteristiky. Pro t >0; f je fuzzy distribuþní funkce
ª § t ·b º F t , S 1 exp « ¨ ¸ » SK t ¬« © G ¹ »¼ ª § t ·b º s hlavní hodnotou 1 exp « ¨ ¸ » a funkcí pĜíslušnosti «¬ © G ¹ »¼ § b · ª ª t bº ª º ° ¨ y 1 exp « § t · » ¸ y «1 exp « ¨§ ¸· » K t ; ¨ ¸ ° ¨ «¬ ¬« © G ¹ ¼» «¬ © G ¹ »¼ ¸ °° PS ¨ ¸, P F t ,S y ® ¨ K t º ª § t ·b º ¸ K t 1 exp ° ¨¨ », « » ¨ ¸ ¸¸ ° © »¼ ¹ ¬« © G ¹ ¼» ° 0 jinde, °¯ pro t 0, f . PĜitom pro t f;0@ je P F t ,S 0 1 a P F t ,S y 0 pro y z 0 . Pro D >0;1@ jsou DĜezy fuzzy distribuþní funkce F t , S ª º ª § t ·b º ª § t ·b º FD t , S «1 exp « ¨ ¸ » s1DK t ; 1 exp « ¨ ¸ » s2DK t » , «¬ »¼ ¬« © G ¹ ¼» ¬« © G ¹ ¼» kde > s1D ; s2D @ jsou DĜezy fuzzy parametru S . Analogicky získáme funkci pĜíslušnosti a DĜezy fuzzy spolehlivostní funkce R t , S . Fuzzy intenzitu O t , S nelze obecnČ urþit explicitnČ, avšak její DĜezy mĤžeme vypoþítat numericky pomocí intervalové aritmetiky. Fuzzy stĜední hodnota fuzzy náhodné veliþiny T je §1 · E T G * ¨ 1¸ S\ ©b ¹
171
Sborník konference REQUEST'06
s funkcí pĜíslušnosti § §1 ·· ° ¨ t G * ¨ 1¸ ¸ © b ¹ ¸ , t ªG * § 1 1· \ ; G * § 1 1· \ º , °° PS ¨ ¨b ¸ « ¨b ¸ » P E T t ® ¨ \ ¸ ¹ ¹ © ¬ © ¼ ¨ ¸ ° © ¹ ° jinde , ¯° 0 f
\
³ K (t )dt
r
1/ b
r q
0
1/ b
* §¨© b1 1·¸¹ .
Pro P >0;1 a t >0; f získáme hranice DĜezĤ fuzzy Pkvantilu numerickým Ĝešením nelineárních rovnic vzhledem k t ª § t ·b º ª § t ·b º exp « ¨ ¸ » s1DK t 1 P , exp « ¨ ¸ » s2DK t 1 P . ¬« © G ¹ ¼» ¬« © G ¹ ¼» Jestliže v obou modelech položíme v pĜedcházejících vztazích b 1 , G 1/ O a využijeme toho, že * 2 1 , dostaneme vztahy pro fuzzy funkþní a þíselné charakteristiky tzv. fuzzy exponenciálního rozdČlení prvního a druhého typu. 3 Fuzzy spolehlivost systému
Soubor objektĤ sloužících k vykonávání urþitých požadovaných þinností zpravidla oznaþujeme názvem systém (soustava). Složité systémy se z hlediska sledované þinnosti pĜi analýze obvykle rozkládají na jednodušší funkþní celky (subsystémy), popĜípadČ až na dále nedČlitelné þásti, které nazýváme prvky systému. Strukturu systému pĜi jeho rozkladu na prvky popisujeme nejþastČji pomocí tzv. blokového schématu. PĜedpokládáme dále tzv. dvoustavový model, kdy systém (prvek) je buć v bezporuchovém stavu (logická hodnota 1) anebo v poruchovém stavu (logická hodnota 0). Pro jednoduchost ztotožníme oznaþení systému s logickou promČnnou A , která vyjadĜuje jeho stav a jednotlivé prvky analogicky oznaþíme A1 ,!, An . Strukturu systému lze také vyjádĜit pomocí orientovaného grafu, kdy orientované hrany grafu odpovídají prvkĤm systému a uzly grafu vyjadĜují spojení prvkĤ. Jestliže stav prvku Ak neovlivĖuje stav prvku Al a naopak k z l , pak Ĝíkáme, že prvky Ak , Al jsou nezávislé. V pĜípadČ, že stav libovolné množiny prvkĤ neovlivĖuje stav libovolné jiné množiny prvkĤ téhož systému a obČ množiny jsou disjunktní, pak Ĝíkáme, že prvky systému jsou vzájemnČ nezávislé. Stav prvku (systému) je obecnČ závislý na þase t, takže jeho stav je funkce A(t ) nabývající hodnot 1 a 0, kde t >0; f a A(0) 1 . PĜedpokládáme, že
172
Z. Karpíšek: Fuzzy spolehlivost. stav A(t ) mĤže pĜejít pouze z hodnoty 1 do hodnoty 0 (nikoli naopak), tj. jde o model bez obnovy. Dále pĜedpokládáme, že doba bezporuchového stavu je nezáporná náhodná veliþina T a jeho funkce spolehlivosti (spolehlivost) je R(t ) P T t t P A(t ) 1 . Základní spojení prvkĤ Ai , i 1,!, n , v blokovém schématu je spojení sériové, kdy AS
A1 ! An a paralelní, kdy AP
A1 ! An . PĜitom znaþí
logickou konjunkci a logickou disjunkci a tČmto logickým operacím odpovídají operace prĤniku a sjednocení s náhodnými jevy. Dalším þasto užívaným typem je kombinované spojení, které je vytvoĜeno opakovaným paralelním nebo sériovým zapojením paralelních a sériových subsystémĤ. Jestliže vzájemnČ nezávislé prvky Ai mají fuzzy spolehlivosti Ri t , i 1,!, n , je fuzzy spolehlivost sériového systému RS t R1 t
!
Rn t a fuzzy spolehlivost paralelního systému RP t 1 ª¬ 1 R1 t
!
1 Rn t º¼ , kde
, resp. , znaþí rozšíĜenou operaci násobení, resp. odeþítání, fuzzy reálných þísel [6].
Obr. 3 Fuzzy spolehlivosti prvkĤ systému lze napĜ. modelovat pomocí pomČrnČ flexibilní tĜídy fuzzy mocninných reálných þísel [7]. Pro výpoþet fuzzy spoleh-
173
Sborník konference REQUEST'06
livosti sériového a paralelního systému tvoĜený n prvky s fuzzy spolehlivostmi vyjádĜenými tČmito fuzzy þísly byl vytvoĜen demonstraþní software FM. Ukázka jednoho z výstupních oken je na obr. 3. Fuzzy spolehlivost kombinovaného systému vzájemnČ nezávislých prvkĤ poþítáme jeho fuzzy spolehlivost postupným pĜímým výpoþtem pomocí fuzzy spolehlivosti sériových a paralelních subsystémĤ. To je však možné pouze pro nevelké poþty prvkĤ. NapĜ. pro systém na obr. 4, kde prvek 1 má fuzzy spolehlivost R1 t atd., je jeho fuzzy spolehlivost R t R1 t
ª¬1 1 R2 t
1 R3 t º¼ . 2 1
3
Obr. 4 Pro výpoþet fuzzy spolehlivosti systému byl modifikován tzv. JKalgoritmus výpoþtu spolehlivosti systému, který je založen na spojení tzv. metody seznamu a metody cest [5]. Základem metody seznamu je sestavení množiny všech možných logických událostí v systému, které pak slouží k vlastnímu vypoþtu spolehlivosti systému pomocí disjunktních náhodných jevĤ. Cestou v orientovaném grafu v našem pĜípadČ rozumíme posloupnost hran odpovídajících prvkĤm systému, které spojují uzly mezi vstupním a výstupním uzlem grafu. Pro výpoþet fuzzy spolehlivosti systému vzájemnČ nezávislých prvkĤ Ai požadujeme, aby fuzzy spolehlivosti Ri t byla spojitá fuzzy reálná þísla s DĜezy RiD t ª¬ RiD 1 t ; RiD 2 t º¼ , i 1,..., n . NechĢ náš systém má prostý acyklický orientovaný graf s maticí sousednosti A
m
akl k ,l 1 , pĜiþemž každé-
mu prvku systému Ai odpovídá právČ jedna hrana akl jdoucí z uzlu k do uzlu l, jinak klademe akl 0 . PĜitom 1 znaþí vstupní uzel a m výstupní uzel grafu, a platí 1 d m 1 d n d m 1 m / 2 . Pokud graf systému není prostý (systém obsahuje paralelní subsystém), pĜevedeme jej na prostý napĜ. pĤlením hran [5]. Fuzzy spolehlivost systému mĤžeme pro t >0; f urþit postupnou realizací krokĤ tzv. FJK algoritmu [6]: 1. Vygenerujeme seznam všech možných stavĤ prvkĤ daného systému ve formČ matice V typu
2 , n , jejíž Ĝádky tvoĜí všechny variace n-té tĜídy n
174
Z. Karpíšek: Fuzzy spolehlivost. s opakováním z dvouprvkové množiny {0;1} (jde vlastnČ o dvojková þísla od 0 do 2 n 1 ). 2. Pro každou variaci stavĤ prvkĤ vypoþteme pomocí algebraického doplĖku Dm1 matice D = E A , kde E znaþí jednotkovou matici, stav systému
Sj
sgn Dm1 , j 1,...,2n , pĜiþemž za prvek akl matice sousednosti A do-
sadíme hodnotu stavu odpovídajícího prvku Ai z matice V .
3. DĜez RD t fuzzy spolehlivosti systému R t v þase t urþíme pomocí DĜezĤ RiD t fuzzy spolehlivostí Ri t jednotlivých prvkĤ, i 1,..., n , ze
vztahu n
RD t
ª2 « ®S j «¬ j 1 ¯
n
1 Ai
¦ ¬ª1 R D (t ) R D (t ) 2n
®S j 1¯
i 1
i 1 n
1 Ai
¦ ª¬1 R D (t ) R D (t ) j
Ai
i 1
Ai
i 2
i 2
i 1
½ º¾; ¼¿ ½º º ¾» , ¼ ¿» ¼
0
kde klademe 0 1 . Ze získaného DĜezu RD t pak lze urþit další funkþní a þíselné fuzzy charakteristiky spolehlivosti daného systému. Jestliže napĜ. pro kombinovaný systém o tĜech vzájemnČ nezávislých prvcích z obr. 4 zvolíme fuzzy spolehlivosti jednotlivých prvkĤ všechny stejné a s fuzzy exponenciálním rozdČlením druhého typu [6]
R1 t , S R2 t , S R3 t , S e t S e t e 2 t , pro t >0; f , kde funkce pĜíslušnosti fuzzy parametru S je 1 s pro s > 1;1@ , PS ( s ) ® jinde, ¯ 0 a pro D >0;1@ jsou DĜezy tČchto fuzzy spolehlivostí, i 1,2,3 , RiD t
ª¬ RiD 1 t ; RiD 2 t º¼ ª e t 1 D e t e 2 t ;e t 1 D e t e 2 t º . ¬ ¼ Použitím FJK - algoritmu pak dostaneme DĜez pro t >0; f výslednou fuz-
zy spolehlivost R t systému RD t ª 2 e t (1 D )(e t e 2 t ) «¬
2 e t (1 D )(e t e 2 t )
2
e
2
e
175
t
t
3
(1 D )(e t e 2 t ) ;
3 (1 D )(e t e 2 t ) º . »¼
Sborník konference REQUEST'06
Graf DĜezĤ RiD t , resp. nosiþe fuzzy svazku Ri t , S , pro i 1,2,3 je na obr. 5, resp. 6.
Obr. 5
Obr. 6
Graf DĜezĤ RD t , resp. nosiþe fuzzy svazku R t , S , je na obr. 7, resp. 8.
Obr. 7
Obr. 8
4 ZávČr V obou fuzzy stochastických modelech A a B z oddílu 2 má stanovení funkcí pĜíslušnosti koeficientu nepĜesnosti N i fuzzy parametru S subjektivní charak ter. PĜi aplikaci tČchto modelĤ se vychází z expertního odhadu tČchto funkcí pĜi posouzení stupĖĤ vČrohodnosti pozorovaných dob bezporuchového provozu. Oproti modelu A je v modelu B možno navíc volit konstanty r, q tak, aby norma
176
Z. Karpíšek: Fuzzy spolehlivost. funkce K t mČla vhodnou velikost. Z hlediska praktického použití se jeví vhodnČjší spíše model A než model B, neboĢ více odpovídá aposteriornímu statistickému posouzení vlivu nepĜesnosti pozorovaných dob bezporuchového provozu na parametry rozdČlení. Mimo oblast provozní spolehlivosti je možno oþekávat úspČšné aplikace fuzzy Weibullova rozdČlení také pĜi modelování materiálových charakteristik a životnosti (napĜ. ložisek), jestliže pozorované statistické soubory vykazují nezanedbatelný stupeĖ neurþitosti.
Literatura
[1] Klir, G. J. Yuan, B. Fuzzy Sets and Fuzzy Logic. 1st ed. Prentice Hall, New Jersey, 1995, ISBN 0-13-101171-5.
[2] Karpíšek, Z. Modelling of Fuzzy Probability Distribution. Summer Scho[3] [4] [5]
[6] [7]
ol DATASTAT ´01 Proceedings. Folia Fac. Sci. Nat. Univ. Masarykianae Brunensis, Mathem. 11, Brno, pp. 91-104, 2002, ISBN 80-210-3028-3. Karpíšek, Z. Fuzzy Probability Distribution – Characteristics and Models. Proceedings East West Fuzzy Colloquium 2001. 9th Zittau Fuzzy Colloquium. Zittau, 2001, pp. 36-45, ISBN 3-9808089-0-4. Karpíšek, Z. The Fuzzy Reliability with Weibull Fuzzy Distribution. Proceedings East West Fuzzy Colloquium 2002. 10th Zittau Fuzzy Colloquium. Zittau, 2002, pp. 33-42, ISBN 3-9808089-2-0. Karpíšek, Z., Jelínek, P., Dostál, P., and Doubravský, K. Algoritmus a numerická realizace výpoþtu charakteristik spolehlivosti systému. Sborník z 11. semináĜe Moderní matematické metody v inženýrství 3 mí v Dolní Lomné u Jablunkova 3.6. – 5.6.2002. Ostrava 2002, pp. 74-78. ISBN 80-248-0184-1. Karpíšek, Z., Jelínek, P. Fuzzy stochastické metody modelování spolehlivosti. Sborník celostátního semináĜe Analýza dat 2002/II. LáznČ Bohdaneþ 26.-29.11.2002, pp. 90-103, ISBN 80-239-0204-0. Karpíšek, Z. From Vague Sample to Fuzzy Probability (Od vágního statistického souboru k fuzzy pravdČpodobnosti). In: 3rd International Conference APLIMAT 2004 (part I - plenary lectures). Bratislava 2004, pp. 131-150, ISBN 80-227-1995-1.
Adresa autora: Doc. RNDr. ZdenČk Karpíšek, Csc., Odbor statistiky a optimalizace, Ústav matematiky, Fakulta strojního inženýrství, Vysoké uþení technické v BrnČ, Technická 2, 616 69 Brno E-mail:
[email protected]
Tato práce byla vytvoĜena za podpory projektu MŠMT 1M06047 – CQR.
177
MS Project jako nástroj pro analýzu spolehlivosti Petr Kolář
1. Představení aplikace MS Project Manažeři, kteří koordinují plánování, průběh a hodnocení libovolných projektů, jsou nuceni pracovat s velkým množstvím informací. Neobejdou se bez SW podpory a jedním z nejpoužívanějších nástrojů je MS Project. Aplikace MS Project slouží k plánování, sledování a řízení projektů a ke komunikaci s projektovým týmem. Projekt je standardně chápán jako plán práce, který má na konci nějaký výsledek. Ať už je to marketingová kampaň, uvedení nového produktu, stavba domu, či provádění údržby. Projekt lze rozdělit na malé dílčí části – úkoly. K úkolům se přiřazují zdroje. Ty mohou být buď pracovní, tedy lidé, kteří odvádějí práci a tím posouvají projekt kupředu, nebo materiálové, které se během plnění projektu spotřebovávají (např. olej, mazivo). Ke každému zdroji i úkolu je možno definovat náklady, a to jak fixní tak variabilní. Pomocí tzv. Směrného plánu lze porovnávat plánované a ve skutečnosti realizované údaje včetně kritické cesty a provádět optimalizace. Lze nadefinovat tzv. rezervoár zdrojů, ze kterého lze zdroje čerpat a koordinovat. Pracovníci, kteří se účastní na více projektech, mohou modelovat různé situace změn priorit projektů, změny zdrojů či termínů zahájení nebo dokončení projektu a sledovat, jak by se taková změna promítla v reálu. V této aplikaci lze definovat a používat množství datových polí různých datových typů. Lze mezi nimi definovat výpočty a ověřování. Datová pole jsou databázovým způsobem relačně připojena k úkolům či zdrojům. Jakákoli pole lze zobrazit v uživatelsky nadefinovaných tabulkách, grafech a tiskových pohledech. Všechna data lze jednoduše exportovat do externích databází a aplikací. V příspěvku je ilustrováno, jak lze do MS Project nadefinovat oborové řešení, konkrétně oblast spolehlivosti. Pro uživatele je pak velice výhodné, že má všechna jeho pracovní data uchována a analyzována v jediné SW aplikaci. Konkrétní ukázkou je aplikace
178
P. kolář: MS Project jako nástroj pro analýzu spolehlivosti
metod TESEO, FMEA a jsou předvedeny dvě možnosti použití metody FMECA.
2. Základní definice projektu 2.1. Definice úkolů Základní definování projektu zpravidla obsahuje vyjmenování pracovních úkolů a jejich detailnější popis. Veškeré údaje je možno definovat pomocí různých tabulek a grafických zobrazení. Obr. 1 ilustruje kombinované zobrazení, kde v horním okně je nejběžnější pohled na proces zadávání úkolů. Je použito zobrazení Ganttova diagramu – v horní části okna je jednak Zadávací tabulka a jednak po pravé straně Ganttův graf, v dolní části okna je použito rozdělení okna, konkrétně Zdroje a předchůdci. V Zadávací tabulce jsou zobrazeny nejpoužívanější sloupce datových polí o konkrétních úkolech, další data lze zadávat např. v dialogovém okně Informace o úkolech. V Ganttově grafu jsou zobrazeny grafické pruhy symbolizující časovou alokaci úkolů, jejich dobu trvání a pomocí šipek jsou zobrazeny funkční návaznosti jednotlivých úkolů. U pruhů mohou být zobrazeny různé údaje, v ukázce jsou po levé straně Míra rizika a Rizikové číslo, po pravé straně Iniciály zdroje a Doba trvání úkolu. V dolní části jsou zobrazeny detailnější informace o přiřazení zdrojů na úkol (úkol č. 8) a detailní informace o předchůdcích (úkolech, na který tento navazuje). 2.2. Definice zdrojů Další podstatnou částí je definice zdrojů. Obr. 1 ve spodním okně ilustruje nejběžnější pohled na proces zadávání úkolů. Je použito zobrazení Seznam zdrojů, okno je rozděleno na Zadávací tabulku v horní části obrazovky a v dolní části je zobrazen Plán práce vybraného zdroje. Červená barva u zdroje informuje, že daný zdroj je přetížen, tj. pracuje s větší intenzitou než mu byla přidělena (např. pracuje na více úkolech najednou, nebo přesáhl svoji denní pracovní dobu).
179
Sborník konference REQUEST'06
Obr. 1 – Kombinované zobrazení Ganttova diagramu a seznamu zdrojů Pracovní zdroje je možné definovat jako konkrétní zdroje (jméno a příjmení každého pracovníka) nebo jako obecné zdroje (např. kontrolor, který má určité dovednosti). Při definici úkolů je pak možné definovat konkrétní osobu, která bude na úkolu pracovat, nebo definovat obecně dovednosti, které musí zdroj mít ke splnění úkolu a dosazení konkrétních osob provést později ručně či automaticky z Rezervoáru zdrojů podle dovedností a časové dostupnosti pracovníků. 2.3. Definice nákladů Pro úkoly, zdroje a jejich eventuální chyby lze kompletně nadefinovat fixní a variabilní náklady. Jeden ze způsobů je demonstrován na Obr. 2. V horní části Obr. 2 v prvním okně je použito zobrazení Ganttova diagramu, tabulka Náklady včetně Ganttova grafu, okno je rozděleno a v dolní části okna 1 je rozdělení Náklady zdroje (konkrétně jsou zobrazeny údaje o úkolu č. 8 – „kontrola tlaku vzduchu
180
P. kolář: MS Project jako nástroj pro analýzu spolehlivosti
v soustavě přetlakování hydraulické nádrže“). V tomto okně lze tedy řešit velké množství rozličných ekonomických údajů včetně Toku peněz. V dolní části obrazovky na obrázku Obr. 2 v druhém okně je pak zobrazen Seznam zdrojů, okno je opět rozděleno použitím Nákladů zdrojů.
Obr. 2 - Definice nákladů
3. Pokročilá nastavení projektu 3.1. Definice vlastních datových polí Pro jednotlivé úkoly a zdroje je možno definovat i desítky datových polí všech datových typů, které jsou buď zadávány uživatelem, vybírány ze seznamu připravených hodnot, nebo jsou vypočítávány pomocí vzorců. MS Project má integrováno mnoho algebraických, pojmenovaných, databázových i agregačních funkcí. Ty mohou být použity i pro Souhrnné úkoly, v ukázkách je pro souhrnné úkoly použita funkce maximum.
181
Sborník konference REQUEST'06
Obr. 3 – Defin nice vlastních datových d polí ppro TESEO Jednotliváá datová polee se definují pomocí snadno pochopiitelných dialogový ých oken. Jak ko ukázka je j na Obr. 3 uvedena definice d datového pole pro mettodu TESEO, K1 – Typ činn nosti včetně definice d přednastaavených hodn not, mezi kterrými se je mo ožno při vypllňování konkrétnícch dat přepín nat pomocí rozzbalovacích seeznamů. t 3.2. Definiice vlastních tabulek Flexibility y programu by ylo využito k vytvoření tab bulek pro mettody: •T TESEO - experrtní kvantitatiivní hodnocen ní lidského seelhání •F FMEA - kvalitativní analyttická metoda aplikovaná v tomto p případě na obllast lidského selhání s analytická metoda apliikovaná •F FMEA 1 - kvantitativní k v tomto přípa adě na oblast lidského seelhání – stan ndardní p podoba •F FMEA 2 - kvantitativní k analytická metoda apliikovaná v tomto přípa adě na oblasst lidského selhání – ro ozšířená p podoba Tabulky see definují v jeednoduchých dialogových oknech. Na Obr. O 4 je předveden na definice tab bulek TESEO a FMEA. Tabullky mohou bý ýt použity neejen pro zobraazení požado ovaných datových polí na obraz zovce, ale také jako základ dní seznam daatových polí pro definici Tiskov vých sestav a Exportních sschémat.
182
P. kolář: MS Project jako nástroj pro analýzu spolehlivosti
Při použití MS Project Server lze v rámci definice uživatelských oprávnění mimo jiné nadefinovat, kteří uživatelé mohou zobrazovat jednotlivé pohledy, tabulky, sestavy a zobrazení.
Obr. 4 – Definice vlastních tabulek TESEO a FMEA 3.3. Definice vlastních sestav Všechny informace z MS Project je možno přehledně zobrazit či vytisknout pomocí sestav. Lze vytvořit sestavy kombinující plánovací, ekonomické a personální údaje s údaji o spolehlivosti, rizikovosti a možných chybách. Definování sestavy je opět jednoduché.
4. Pracovní prostor spolehlivostní analýzy Kompletní zobrazení analýz spolehlivosti tedy může vypadat velmi přehledně a systematicky, viz Obr. 5. V horním okně je zobrazena tabulka TESEO včetně Ganttova grafu, ve střední části tabulka FMEA, v dolní části vlevo tabulka FMECA 1 a vpravo tabulka FMECA 2.
183
Sborník konference REQUEST'06
Takové rozvržení pracovní plochy programu MS Project je možno uložit pomocí funkce Uložit pracovní prostor. Všechny tabulky jsou k sobě relačně provázány přes pole ID úkolu, což je primární klíč těchto čtyř tabulek. Typ relace je 1:1, ve všech tabulkách jsou pro snazší orientaci zobrazena tato pole: • ID • Indikátory • Název úkolu Nejpřehlednějším způsobem vytvoření relačního vztahu 1:N je použití některé úrovně osnovy souhrnných úkolů pro konkrétní chyby. Pro každý pracovní úkol je pak možné nadefinovat velké množství konkrétních chyb a pro každou definovat konkrétní data a vlastnosti pomocí tabulek TESEO, FMEA, FMECA 1 a FMECA 2.
Obr. 5 – Pracovní prostor hodnocení spolehlivosti
184
P. kolář: MS Project jako nástroj pro analýzu spolehlivosti
5. Závěr Pracovníci spolehlivosti a manažeři v systému TQM jsou neustále zahlceni nejrůznějšími informacemi. V nich se potřebují dobře orientovat a soustředit se na stěžejní data. V tomto úsilí jim velmi pomůže využití výpočetní techniky a kvalitního programového vybavení. Specializovanou problematikou spolehlivosti je hodnocení lidského faktoru. Analýza lidského selhání a zejména adekvátní reakce na něj je profesně rozmanitou disciplínou. V procesu návrhu pracovních procesů ji může víceméně samostatně řešit technolog např. pomocí metody FMEA návrhu uzpůsobené pro řešení problematiky lidského faktoru. Častěji však k hodnocení a zlepšování pracovních postupů a požadavků na personál dochází díky konkrétním lidským chybám v praxi. Taková selhání řeší s pracovníkem primárně personální pracovník či manažer. Eliminaci možných selhání typu nedodržení doby provedení úkolu dle předdefinovaných normohodin řeší projektový manažer. Tito pracovníci potřebují zakalkulovat spolehlivost a rizika selhání do analýz rizik a kritických cest projektů, což obvykle provádějí pomocí CRM systémů či speciálních aplikací. Velmi často využívaným SW je právě MS Project, a to jednak z důvodu snadného propojení do jiných systémů a jednak pro relativně nízkou cenu tohoto SW. Je tedy nanejvýš efektivní zakomponovat i analýzy spolehlivosti do SW, který již používají.
6. Seznam literatury Normy [1] ČSN EN ISO 9001:2001 Systémy managementu jakosti – Požadavky [2] ČSN IEC 60300-3-1:2003 Management spolehlivosti – Část 3-1: Pokyn k použití – Techniky analýzy spolehlivosti – metodický pokyn Monografie [3] Kolář P.: Statistická analýza se SW podporou výsledků třídicího procesu, [Diplomová práce]. Praha : ČVUT 2003. 66 s. [4] Mykiska A.: Bezpečnost a spolehlivost technických systémů. Praha: ČVUT 2006. ISBN 80-01-02868-2. 206 s.
185
Sborník konference REQUEST'06
[5] Kališ J., Hyndrák K., Tesař V.: Microsoft Project. Praha: Computer Press 2004. ISBN 80-251-0074-X. 616 str. Výzkumné zprávy [6] Dohnal G., Kolář P., Mykiska A.: Upřesňování metod a postupů pro stanovení ukazatelů provozní technologičnosti. Zpráva k řešení projektu FT-TA/026, téma T3 – Výzkum faktorů ovlivňujících provozní technologičnost konstrukčních skupin a systémů letadla. Fakulta strojní ČVUT – VZLÚ, Praha, červen 2005 (43 str.) [7] Dohnal G., Havel M., Kolář P., Mykiska A., Wretzl O.: Návrh struktury SW podpory Metodiky analýzy a stanovení ukazatelů provozní technologičnosti. Zpráva k řešení projektu FT-TA/026, téma T3 – Výzkum faktorů ovlivňujících provozní technologičnost konstrukčních skupin a systémů letadla. Fakulta strojní ČVUT – VZLÚ, Praha, listopad 2005 (58 str.)
Adresa autora: Ing. Bc. Petr Kolář, České vysoké učení technické v Praze, Fakulta strojní, Ústav přístrojové a řídící techniky, Technická 4, 160 00 Praha 6. e-mail:
[email protected]
186
Algebraické metody výpočtu spolehlivosti sítí Miroslav Koucký
Abstrakt: V příspěvku jsou prezentovány základní metody výpočtu spolehlivosti systémů se síťovou strukturou, jejichž model bezporuchovosti je založen na s-t souvislosti. Kromě klasických obecně používaných metod, jsou v příspěvku uvedeny i vybrané algebraické metody – metoda založená na Möbiově větě o inverzi číselných funkcí a metoda lineárně algebraická. Klíčová slova: s-t síť, minimální řez/cesta, souvislost, bezporuchovost, algebraické metody, Möbiova funkce.
1. Problematika výpočtu spolehlivosti systémů se síťovou strukturou Síťové modely reprezentované (ne)orientovanými hranově ohodnocenými grafy, tj. množinou uzlů a hran spojujících zadané uzly, patří mezi nejúspěšněji aplikované matematické struktury. Jejich úspěch spočívá především v tom, že umožňují přirozeným způsobem a velmi názorně modelovat funkci široké třídy reálných systémů. Kromě klasických ukázek jejich využití, jako jsou modely potrubních systémů (ropovody, plynovody), dopravních sítí, telekomunikačních systémů, počítačových a datových sítí, nacházejí uplatnění i v oblastech, které na první pohled síťový charakter nemají. Z matematického hlediska je síť definována jako ohodnocený graf G = (U, H, P, S, T), kde U = {1,..., n} je konečná množina uzlů (vrcholů), H = {h1,..., hm} je konečná množina (orientovaných/neorientovaných) hran reprezentujících vybrané dvojice (uspořádané/neuspořádané) uzlů, P: H → 〈0, 1〉 je pravděpodobnostní ohodnocení, tj. zobrazení, které každé hraně h ∈H přiřazuje pravděpodobnost jejího bezporuchového provozu ph, S ⊆ U je množina uzlů označovaných jako zdroje a T ⊆ U je množina uzlů nazývaných spotřebiče.
187
Sborník konference REQUEST'06
Sítě, kde S a T jsou disjunktní jednoprvkové podmnožiny U, tj. S = {s}, T = {t}, s ≠ t se nazývají jednoduché s-t sítě. V ostatních případech, kdy T ⊆ U \ S se mluví o S-T sítích, resp. o úplných sítích (S = T = U). Hodnocení spolehlivosti je ve všech těchto případech založeno na pojmu souvislost, tj. na existenci (orientovaných, neorientovaných) cest spojujících zdroje a spotřebiče. V případě s-t sítí je pravděpodobnost bezporuchového provozu RG(s,t) definována jako pravděpodobnost, že existuje alespoň jedna „funkční“ cesta ze zdroje s do spotřebiče t (tj. obsahuje pouze provozuschopné hrany). Analogicky pro S-T sítě je pravděpodobnost jejich bezporuchového provozu RG(S,T) definována jako pravděpodobnost, že existuje alespoň jedna „funkční“ cesta mezi libovolnou dvojicí uzlů - zdroj a spotřebič. V případě úplných sítí je pravděpodobnost jejich bezporuchového provozu RG definována jako pravděpodobnost toho, že síť je silně souvislá. Další základní pojmy používané v příspěvku jsou: s-t cesta - posloupnost uzlů s = u0, u1,..., un = t, kde (∀ i ≠ j)(ui ≠ uj) a (ui, ui+1)∈H. ♦ Minimální řez – množina hran, jejichž porucha vede k poruše systému a současně žádná její vlastní podmnožina tuto vlastnost nemá. ♦
2. Obecné metody výpočtu spolehlivosti sítí Metoda vyčíslení stavového prostoru (state-space enumeration) Metoda vyčíslení stavového prostoru vyžaduje analýzu všech možných konfigurací sítě. Výsledná pravděpodobnost bezporuchového provozu RG(s, t) je pak dána vztahem
RG (s, t ) =
∑ Φ( x )Pr( x ) ,
x∈K
kde Φ ( x ) je hodnota strukturní funkce pro konfiguraci x = (x1 ,K , xm ) , m
Pr ( x ) = ∏ pi i (1 − pi ) x
1− xi
je pravděpodobnost výskytu konfigurace x,
i =1
K = {x = ( x1 ,K , xm ) xi ∈ {0,1}} je množina všech konfigurací sítě G.
188
M. Koucký: Algebraické metody výpočtu spolehlivosti sítí.
Princip inkluze a exkluze Princip inkluze a exkluze je založen, stejně jako následující metoda zdisjunktnělého sjednocení, na znalosti množiny všech s-t cest {C1,...,Ck} dané s-t sítě a využívají zřejmou skutečnost, že pro pravděpodobnost bezporuchového provozu platí
⎛ k ⎞ RG (s, t ) = Pr⎜⎜ U Ci ⎟⎟ . ⎝ i =1 ⎠ V případě principu inkluze a exkluze dostáváme
(
) ∑ Pr(C C C ) − K + (− 1) Pr(C KC ) ,
RG (s, t ) = ∑ Pr (Ci ) − ∑ Pr CiC j + i
kde
i< j
Pr (Ci1 KCin ) =
∏
k
i
j
l
1
i < j
k
px . i
xi ∈Ci1 ∪K∪Ci1
Metoda zdisjunktnělého sjednocení (disjoint product) V tomto případě se využívá rozklad k
⎤
⎣í = 2
⎦
⎡
k
U Ci = C1 ∪ ⎢U (C1 KCi −1Ci )⎥ , i =1
který vede ke vztahu
(
)
(
)
(
)
RG (s , t ) = Pr (C1 ) + Pr C1C2 + Pr C1C 2C3 + K + Pr C1C 2 K C k −1C k ,
kde Ci označuje negaci s-t cesty Ci, tj. jev, kdy alespoň jedna její hrana je v neprovozuschopném stavu.
Metoda faktorizace Tato metoda vychází z obecně známé věty o úplné pravděpodobnosti, kde úplnou soustavu jevů tvoří rozklad množiny všech konfigurací na třídy rozkladu určené stavy vhodně zvolené hrany sítě. Ve dvoustavovém případě tak dostáváme RG (s, t ) = pi RG i (s, t ) + (1 − pi )RG − i (s, t ) ,
kde pi je pravděpodobnost bezporuchového provozu zvolené hrany i, RG/i(s, t) je pravděpodobnost bezporuchového provozu sítě vzniklé z G kontrakcí hrany i a RG-i(s, t) je pravděpodobnost bezporuchového provozu sítě vzniklé z G odstraněním hrany i.
189
Sborník konference REQUEST'06
Princip faktorizace tak spočívá v transformaci výpočtu spolehlivosti původní sítě na výpočet spolehlivosti jednodušších sítí vzniklých postupnými redukcemi (kontrakce a odstraňování hran). Během výpočtu jsou pro další zjednodušení struktury sítě průběžně využívány obecně známé sériově-paralelní transformace.
3. Algebraické metody výpočtu spolehlivosti sítí Poměrně snadno lze ukázat, že problematika výpočtu spolehlivosti sítí je #P-úplný problém a tedy s vysokou pravděpodobností neexistuje žádný algoritmus, který by umožňoval v závislosti na velikosti sítě (počet uzlů a hran) v polynomiálně omezeném čase vyčíslit jejich pravděpodobnost bezporuchového provozu. Z těchto důvodů je v současné době věnována značná pozornost speciálním algebraickým metodám využívajících především poznatky z teorie svazů, které jsou schopné řešit tuto úlohu podstatně efektivněji než výše uvedené obecné metody a to i pro relativně rozsáhlé sítě.
Metoda založená na Möbiově inverzi číselných funkcí Tato metoda je založena na faktu, že s-t sítě jsou koherentní (tj. jejich strukturní funkce je netriviální a monotónní) a množina všech jejich st řezů tvoří lokálně konečný svaz, na kterém lze definovat incidenční algebru a následně vhodným způsobem využít Möbiovu větu o inverzi číselných funkcí. Pro pravděpodobnost bezporucho-vého provozu tak lze dostat
RG (s, t ) =
∑U (d )µ(0, d ) ,
d ∈C
kde C je spojový polosvaz generovaný minimálními řezy s-t sítě G, ⎛ ⎞ U (d ) = Pr ⎜⎜ ∏ ( X i = 0)⎟⎟ je sdružená pravděpodobnost toho, že ⎝ i∈d ⎠ všechny hrany řezu d jsou v poruchovém stavu a µ (0, d ) je hodnota Möbiovy funkce definované na C. Je zřejmé, že praktické využití této metody je limitováno možnostmi efektivního vyčíslení hodnot Möbiovy funkce µ, pro kterou nelze
190
M. Koucký: Algebraické metody výpočtu spolehlivosti sítí.
najít ve zcela obecném případě explicitní výraz (pro celou řadu významných systémů to ovšem možné je). V obecném případě je třeba využít skutečnost, že Möbiova funkce je inverzní k Zeta† funkci ζ, tj. platí
(µ ∗ ζ )(c, c ) = 1 pro
c ∈ C a (µ ∗ ζ )(c, d ) = 0 pro c ≠ d ,
kde (µ ∗ ζ ) označuje konvoluci definovanou vztahem
(µ ∗ ζ )(c, d ) = ∑ µ(c, e ) ⋅ ζ(e, d ) . e∈C c⊆e⊆ d
Odtud snadno dostáváme následující rekurentní vztah, který je již vhodný k praktickým výpočtům
µ(0, d ) = − ∑ µ(0, c ) , c∈C c⊂d
s počáteční podmínkou µ(0,0 ) = 1 . Je zřejmé, že Zeta funkci lze reprezentovat Z-maticí Z = (zc, d )c, d ∈C , kde z c , d = ζ (c, d ) a tudíž hledané hodnoty µ (0, c ), c ∈ C tvoří první řádek matice Z-1.
Příklad : Užití této metody je ilustrováno na příkladu s-t sítě z následujícího obr. 1. a
1 s
4 t
3 2
5 b
Obr. 1 – Příklad s-t sítě
†
Zeta funkce je definována vztahem ζ (c, d ) = 1 pro c ⊆ d , ζ (c, d ) = 0 jinde.
191
Sborník konference REQUEST'06
Příslušný spojový polosvaz C je generován minimálními řezy {1, 2}; {4, 5}; {1, 3, 5}; {2, 3, 4} a je zobrazen v podobě Hasseova diagramu na obr. 2.
{1,2,3,4,5} {1,2,3,4,5}
{1,2,4,5} {1,2,4,5}
{1,2}
{1,2,3,5} {1,2,3,5}
{1,3,4,5} 3,4,5} {1,
{1,2,3,4}
{1,3,5}
{4,5}
{2,3,4,5} {2,3,4,5}
{2,3,4}
0 Obr. 2 – Hasseův diagram průsekového polosvazu řezů Z tohoto diagramu a pomocí výše uvedeného rekurentního vztahu pro výpočet hodnot Möbiovy funkce dostáváme µ(0,0 ) = 1 , µ(0, {1,2}) = µ (0, {4,5}) = µ(0, {1,3,5}) = µ (0, {2,3,4}) = −1 , µ(0, {1,2,4,5}) = µ(0, {1,2,3,5}) = µ(0, {1,3,4,5}) = µ(0, {1,2,3,4}) = µ(0, {2,3,4,5}) = 1 , µ (0, {1,2,3,4,5}) = −2 . Odtud již také snadno vypočteme hledanou pravděpodobnost bezporuchového provozu uvažované s-t sítě z obr. 1.
RG (s, t ) = ∑U (d )µ(0, d ) = 1 − Pr(1, 2) − Pr(4, 5) − Pr(1, 3, 5) − Pr(2, 3, 4) + d∈C
+ Pr(1, 2, 4, 5) + Pr(1, 2, 3, 5) + Pr(1, 3, 4, 5) + Pr(1, 2, 3, 4) + Pr(2, 3, 4, 5) − 2 Pr(1, 2, 3, 4, 5) ,
což v případě i.i.d. vede ke vztahu RG (s , t ) = 1 − 2 q 2 − 2q 3 + 5q 4 − 2 q 5 ,
kde q značí pravděpodobnost poruchy hrany. Následující část ilustruje alternativní způsob výpočtu hodnot Möbiovy funkce pomocí invertování Z-matice. Hodnoty µ (0, c ), c ∈ C tvoří první řádek matice Z-1.
192
M. Koucký: Algebraické metody výpočtu spolehlivosti sítí. ⎛1 ⎜ ⎜0 ⎜0 ⎜ ⎜0 ⎜0 Z = ⎜0 ⎜ ⎜0 ⎜0 ⎜ ⎜0 ⎜0 ⎜ ⎝0
1 1 0 0
1 0 1 0
1 0 0 1
1 0 0 0
1 1 1 0
1 1 0 1
1 0 1 1
1 1 0 0
1 0 1 0
0 0 0 0
0 0 0 0
0 0 0 0
1 0 0 0
0 1 0 0
0 0 1 0
0 0 0 1
1 0 0 0
1 0 0 0
1⎞ ⎟ 1⎟ 1⎟ ⎟ 1⎟
1⎟ −1 1⎟ ; Z ⎟ 1⎟ 1⎟
⎟
0 0 0 0 0 0 0 1 0 1⎟ 0 0 0 0 0 0 0 0 1 1⎟ ⎟ 0 0 0 0 0 0 0 0 0 1⎠
⎛ 1 −1 −1 −1 −1 1 1 1 1 1 − 2⎞ ⎟ ⎜ ⎜0 1 0 0 0 −1 −1 0 −1 0 2⎟ ⎜0 0 1 0 0 −1 0 −1 0 −1 2⎟ ⎟ ⎜ 1⎟ ⎜0 0 0 1 0 0 −1 −1 0 0 ⎜ 0 0 0 0 1 0 0 0 − 1 − 1 1⎟ = ⎜ 0 0 0 0 0 1 0 0 0 0 − 1⎟ ⎟ ⎜ ⎜ 0 0 0 0 0 0 1 0 0 0 − 1⎟ ⎜ 0 0 0 0 0 0 0 1 0 0 − 1⎟ ⎟ ⎜ ⎜ 0 0 0 0 0 0 0 0 1 0 − 1⎟ ⎜ 0 0 0 0 0 0 0 0 0 1 − 1⎟ ⎟ ⎜ 1⎠ ⎝0 0 0 0 0 0 0 0 0 0
Metoda založená na řešení soustavy lineárních rovnic Tato metoda využívá teorie svazů a obecně známé skutečnosti, že ze spolehlivostního hlediska lze každou s-t síť G = (U, H, s, t) reprezentovat polynomem Rst(x1,...xm), v m proměnných (m = |H|, reprezentujících jednotlivé hrany sítě), který po dosazení hodnot pravděpodobnosti bezporuchového provozu hran pi za xi vyčísluje pravděpodobnost bezporuchového provozu uvažované s-t sítě G. Tento polynom lze získat jako řešení soustavy rovnic z = (z ⊗ A ) ⊕ e s , kde z = ( z1 ,K , z n ), n = U , jsou neznámé reprezentující jednotlivé uzly
A=
( )
n ai , j i , j =1
es = (
)
n δi , s i =1 ,
sítě, je polynomická matice sousednosti sítě G definovaná vztahem ai,j = xk pro hk = (i, j) ∈H, ai,j = 0 jinde, δi, s je Kroneckerovo delta.
Podstatné je, že veškeré výpočty probíhají nad „svazovou“ strukturou (S, ⊕, ⊗), kde S označuje množinu polynomů generovanou členy xi1,... xik pomocí operací ⊗ a ⊕. Tyto operace jsou definovány následovně: ♦
w(1) ⊗ w(2 ) =
∏ xk
⎛⎜ x ∈w (1) ⎞⎟ ∨ ⎛⎜ x ∈w (2 ) ⎞⎟ ⎝ k ⎠ ⎝ k ⎠
, pro w(1) = xi1 K xik , w(2 ) = x j1 K x jl a
pro obecné polynomy se aplikují distributivní zákony,
193
Sborník konference REQUEST'06
operace ⊕ je pro obecné polynomy definována vztahem f ⊕ g = f + g - (f ⊗ g)†. Poměrně snadno lze ukázat, že výše uvedená soustava má řešení z = e s A∗ ,
♦
n −1 i ⎛ ⎞ kde A∗ = ⊕ ⎜ ⊗ A j ⎟ , A0 = 1 a tudíž i = 0⎝ j = 0 ⎠ Rs ,t (x1,K, xm ) = es A∗etT .
Poznámka - Jednoznačnou a zásadní předností této metody je skutečnost, že na rozdíl od všech výše uvedených metod, nevyžaduje apriorní znalost množiny všech minimálních cest, resp. řezů. Ty jsou postupně generovány „automaticky“ v průběhu řešení. - K řešení soustav z = (z ⊗ A ) ⊕ e s pomocí výpočetní techniky je možné využít iterační metody, zejména zobecněnou GaussSeidelovu, resp. Jacobiho metodu. V tomto případě lze využít jednotlivé iterační kroky jako odhady. Příklad: Využití metody je demonstrováno na příkladu sítě z následujícího obr. 3, kde s = z1 a t = z4.
z2 x1 z1
x5 x3
x4
x2
z4
x6 z3
Obr. 3 – Příklad s-t sítě
†
Např. pro f = x1 + x2 x3 a g = x 2 + x 3 dostáváme f ⊗ g = x1 x 2 + x1 x 3 + x 2 x 3 a f ⊕ g = x1 + x 2 + x 3 − x1 x 2 − x1 x 3 .
194
M. Koucký: Algebraické metody výpočtu spolehlivosti sítí.
V tomto případě má soustava rovnic tvar ⎡ ⎛ 0 x1 x2 0 ⎞⎤ ⎜ ⎟⎥ ⎢ ⎜ 0 0 x3 x5 ⎟⎥ ⎢ (z1 , z2 , z3 , z4 ) = ⎢(z1 , z2 , z3 , z4 ) ⊗ ⎜ ⊕ (1, 0, 0, 0) 0 x4 0 x6 ⎟⎥ ⎜ ⎟ ⎢ ⎜ 0 0 0 0 ⎟⎥ ⎝ ⎠⎦⎥ ⎣⎢ a pro hledaný spolehlivostní polynom dostáváme ⎛ ⎛ 0 x1 x2 0 ⎞ ⎞ ⎜ ⎜ ⎟⎟ 3 ⎜ i 0 0 x x ⎜ 3 5 ⎟⎟ 0 A∗ = ⊕ ⎜ ⊗ ⎜ ⎟⎟, A = 1 i = 0 j =1 0 x 0 x 4 6 ⎟⎟ ⎜ ⎜ ⎜ ⎜ 0 0 0 0⎟⎟ ⎠⎠ ⎝ ⎝
∗
⎛ 0⎞ ⎛ 0 x1 x2 0 ⎞ ⎜ ⎟ ⎟ ⎜ ⎜ 0⎟ ⎜ 0 0 x3 x5 ⎟ kde R1, 4 (x1 ,K, x6 ) = (1, 0, 0, 0) ⊗ ⎜ ⊗⎜ ⎟, ⎟ 0 0 x4 0 x6 ⎟ ⎜ ⎟ ⎜ ⎜1⎟ ⎜ 0 0 0 0⎟ ⎠ ⎝ ⎠ ⎝ Několika zřejmými výpočty dostaneme R1, 4 (x1 ,K , x6 ) = x1 x5 ⊕ x2 x6 ⊕ x1 x3 x6 ⊕ x2 x4 x5 ,
tj. R1, 4 (x1 ,K, x6 ) = x1 x5 + x2 x6 + x1 x3 x6 + x2 x4 x5 − x1 x2 x5 x6 − x1 x3 x5 x6 − x1 x2 x4 x5 − − x1 x2 x3 x6 − x2 x4 x5 x6 + x1 x2 x3 x5 x6 + x1 x2 x4 x5 x6
V případě i.i.d. pak dostáváme polynom R1, 4 ( p ) = 2 p 2 + 2 p 3 − 5 p 4 + 2 p 5 , kde p je pravděpodobnost bezporuchového provozu hrany.
4. Závěr Kromě výše uvedených metod je v současné době věnována značná pozornost speciálním třídám algoritmů označovaným jako pseudopolynomiální algoritmy. Tyto algoritmy jsou schopné řešit úlohu výpočtu pravděpodobnosti bezporuchového provozu s-t sítí v polynomiálním čase, ovšem v závislosti na jiných kvantitativních charakteristikách sítě než je počet uzlů a hran, např. na počtu koster, resp. acyklických podgrafů.
195
Sborník konference REQUEST'06
Literatura [1] Aigner, M.: Combinatorial Theory. Spronger-Verlag, Berlin, 1997. Colbourn, C.: The combinatorics of network reliability. Oxford University Press, New York, 1987. [2] Harm, D.-Kraetzl, M.-Colbourn, C.-Devitt, J.: Network Reliability: Experiments with a Symbolic Algebra Environment. CRC Press, Boca Raton, 1995. [3] Shier, D.-Whited, D.: Algebraic methods applied to network reliability problems. SIAM Journal on Algebraic and Discrete Methods, 8, 1987, 251-262.
Adresa autora: Doc. RNDr. Miroslav Koucký, CSc., Technická univerzita v Liberci, Fakulta pedagogická, Katedra aplikované matematiky, Hálkova 6, 461 17 Liberec 1 e-mail:
[email protected] Tato práce byla vytvořena za podpory projektu MŠMT 1M06047 - CQR
196
SW podpora při řešení projektů s aplikací statistických metod Jan Král, Josef Křepela Úvod Uplatňování statistických metod vyžaduje počítačovou podporu. V současné době je rozšiřována řada vynikajících specialisovaných statistických softwarů, které umožňují řešit velmi široké spektrum statistických úloh. Jejich dalšímu šíření je však často na překážku vysoká pořizovací cena spojená s nedůvěrou v ekonomické přínosy této investice. Cílem této části řešení je vytvořit soubor šablon umožňujících začít s aplikací metody SPC i tam, kde by tomu jinak bránily vzhledem k rozpočtu firmy příliš vysoké vstupní náklady na implementaci metody SPC (pořízení specializovaného SW nahradit použitím standardního a již dostupného kancelářského SW). Uvedený soubor šablon vytváří ucelený návrh ověřeného postupu činností, vedoucích k úspěšné implementaci i osobám, které nemají detailní znalosti z oblasti SPC. Umožnění zavedení statistického řízení výroby bude mít vzhledem k svému prediktivnímu charakteru pozitivní vliv na zvýšení úrovně řízení organizace, zlepšení jakosti, spokojenosti zákazníků, snížení výskytu neshodných jednotek ve výrobě a v celkovém úhrnu zlepšení image podniku na trhu i zvýšení kvalifikace pracovníků podniku.
Popis řešení Jedním z nejrozšířenějších kancelářských programů je Microsoft Excel, který umožňuje podporu celé řadě statistických výpočtů. Tento program je dostupný ve všech podnicích, kancelářích, provozovnách, prakticky všude, kde je třeba využívat některé ze statistických metod. Jeho širšímu využití v této oblasti mnohdy brání pouze nedostatečné znalosti těchto metod a nedostatečné zkušenosti v interpretaci výstupů.
197
Sborník konference REQUEST'06
Námi prezentované řešení v tomto ohledu vykazuje přiměřenou vstřícnost k uživateli tím, že při dodržení zavedených konvencí vede uživatele k požadovanému cíli. V šablonách jsou zavedeny tyto obecné konvence (jednotlivá pole jsou označena barevně):
žlutá pole: do těchto polí se vkládají zadávané hodnoty uživatelem;
zelená, bleděmodrá a šedivá pole: v těchto polích se zobrazují výsledky postupných výpočtů (pole se nesmí editovat), v polích zapsané vzorce by byly přepsány a výpočty zmařeny. Zelená pole obsahují konečné výsledky;
bílá, případně barevně zvýrazněná (modrá) pole obsahují poznámky;.
šedá pole jsou popisná a v odůvodněných případech je lze editovat.
Poznámka: Je-li u jakékoliv buňky červeně zvýrazněn pravý horní roh, obsahuje tato buňka komentář, který je možno vyvolat volbou „zobrazit komentář“ po kliknutí pravým klikem na tuto buňku. Pro úvodní analýzu procesu, vyhodnocení předpokladů pro stanovení způsobilosti a výkonnosti procesu a uplatnění statistické regulace byly vypracovány šablony zahrnující pět pracovních listů, které postupně probereme na příkladu regulačního diagramu pro výběrové průměry a výběrové směrodatné odchylky . 1) List „Data“ Záznam napozorovaných dat a výpočet základních výběrových charakteristik podskupin x bar, Me, s, s2, R . Na listě je možno činit poznámky o případných změnách a zásazích v procesu. Data i poznámky je možno na příkaz vytisknout.
198
J. Král, J. Křepela: SW podpory při řešení projektů s aplikací statistických metod.
Napozorované hodnoty v podskupinách x1
j
x2
x3
x4
x5
x6
Výběrové charakteristiky podskupin x7
x8
x9
x10
x bar
Me
s
s2
R
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31
19,993 20,006 19,958 19,996 19,995 20,009 20,001 20,004 19,986 19,991 19,996 20,002 20,019 20,046 19,996 20,008 20,005 20,010 19,998 20,011 20,019 20,018 20,018 20,000 19,996 19,999 20,000 20,039 19,998 20,013 20,025
19,995 20,010 19,982 20,006 19,998 20,006 20,006 20,002 19,984 20,011 19,996 20,018 19,981 20,039 20,003 19,985 20,018 20,013 19,995 20,026 20,004 20,013 20,005 20,007 20,004 20,007 20,001 20,006 20,005 19,983 20,035
19,997 20,010 19,973 19,988 20,002 20,012 20,006 20,006 20,010 20,006 20,001 20,006 20,005 20,028 20,005 20,005 20,007 19,977 20,013 20,017 20,026 19,998 20,024 20,003 20,009 19,993 20,003 20,019 20,007 19,987 20,055
19,995 20,022 19,985 20,002 20,003 20,007 19,995 19,991 20,001 19,980 20,003 19,987 19,990 20,030 19,997 19,989 19,994 19,999 19,995 19,989 20,004 20,000 19,982 20,001 20,000 20,017 19,998 20,018 20,002 20,021 20,043
19,999 20,002 19,979 20,001 19,998 20,012 20,006 20,005 20,005 20,009 19,996 19,995 20,007 20,021 20,008 20,002 20,028 20,004 20,012 20,015 19,995 20,011 20,003 20,000 19,999 19,990 20,001 20,035 20,008 19,999 20,046
19,99580 20,01000 19,97540 19,99860 19,99920 20,00920 20,00280 20,00160 19,99720 19,99940 19,99840 20,00160 20,00040 20,03280 20,00180 19,99780 20,01040 20,00060 20,00260 20,01160 20,00960 20,00800 20,00640 20,00220 20,00160 20,00120 20,00060 20,02340 20,00400 20,00060 20,04080
19,99500 20,01000 19,97900 20,00100 19,99800 20,00900 20,00600 20,00400 20,00100 20,00600 19,99600 20,00200 20,00500 20,03000 20,00300 20,00200 20,00700 20,00400 19,99800 20,01500 20,00400 20,01100 20,00500 20,00100 20,00000 19,99900 20,00100 20,01900 20,00500 19,99900 20,04300
0,00228 0,00748 0,01069 0,00691 0,00327 0,00277 0,00487 0,00611 0,01161 0,01339 0,00336 0,01167 0,01496 0,00978 0,00517 0,01018 0,01301 0,01426 0,00913 0,01378 0,01258 0,00863 0,01623 0,00295 0,00503 0,01096 0,00182 0,01350 0,00406 0,01633 0,01137
0,00001 0,00006 0,00011 0,00005 0,00001 0,00001 0,00002 0,00004 0,00013 0,00018 0,00001 0,00014 0,00022 0,00010 0,00003 0,00010 0,00017 0,00020 0,00008 0,00019 0,00016 0,00007 0,00026 0,00001 0,00003 0,00012 0,00000 0,00018 0,00002 0,00027 0,00013
0,00600 0,02000 0,02700 0,01800 0,00800 0,00600 0,01100 0,01500 0,02600 0,03100 0,00700 0,03100 0,03800 0,02500 0,01200 0,02300 0,03400 0,03600 0,01800 0,03700 0,03100 0,02000 0,04200 0,00700 0,01300 0,02700 0,00500 0,03300 0,01000 0,03800 0,03000
32
20,025
20,023
19,985
19,989
20,022
20,00880
20,02200
0,01998
0,00040 0,04000
33
19,999
20,009
19,982
20,000
20,016
20,00120
20,00000
0,01279
0,00016 0,03400
34
20,018
20,020
20,002
20,012
20,024
20,01520
20,01800
0,00856
0,00007 0,02200
35
19,993
20,007
20,007
19,997
19,996
20,00000
19,99700
0,00656
0,00004 0,01400
36
20,015
20,012
20,005
20,019
20,006
20,01140
20,01200
0,00594
0,00004 0,01400
2) List „Výpočet regulačních diagramů“ Tento list obsahuje výpočet následujících typů regulačních mezí:
Shewhartových, v souladu s ČSN ISO 8258 když základní hodnoty nejsou dány („přirozené“ regulační meze).
Shewhartových, v souladu s ČSN ISO 8258 když základní hodnoty jsou dány („technické“ regulační meze).
Rozšířené regulační meze vycházející z celkové směrodatné odchylky stot.
Rozšířené regulační meze vycházející ze směrodatné odchylky výběrových průměrů podskupin sx bar.
Rozšířené regulační meze vycházející z rozšíření regulačního pole o ∆ v souladu s přístupem firmy Ford a dalších amerických automobilových firem.
199
Sborník konference REQUEST'06
Hodnoty jednotlivých typů regulačních mezí, jsou zobrazeny v následující přehledné tabulce: Vzorce a výpočet regulačních diagramů při kontrole měřením: A) Základní hodnoty nejsou stanoveny (přirozené regulační meze): Statistika
CL
x bar
x bar bar x bar bar
UCL
x bar bar + A2* R bar x bar bar + A3*s bar
LCL 20,016 20,0165
x bar bar - A2*R bar x bar bar - A3 * s bar
19,993 19,9926
R
R bar
R bar * D4
0,043
R bar * D3
s
s bar
s bar * B4
0,01745
s bar * B3
0,000
Me
Me bar
Me bar + A4 * R bar
20,020
Me bar - A4 * R bar
19,991
B) Základní hodnoty jsou stanoveny (technické regulační meze): Statistika CL TUCL
0,000
TLCL
X0 + A σ0
20,013
X0 - A σ0
19,987
σ0*C4
σ0 *B6
0,020
σ0 *B5
0,000
σ0*d2
σ0 *D2
0,049
σ0 *D1
0,000
x bar
X0
s R
C) Rozšířené regulační meze pro výběrové průměry, s využitím s tot: Statistika
CL
x bar
x bar bar
x bar bar + A3*s tot *C4
UCL 20,021
x bar bar - A3 * s tot * C4
LCL 19,988
x bar
x bar bar
x bar bar + 3*s x bar
20,032
x bar bar - 3*s x bar
19,977
D) Rozšířené regulační meze pro výběrové průměry, s využitím ∆ : Statistika x bar
CL
UCL
x bar bar xbarbar+A3*sbar+∆/2
LCL 20,016
200
xbarbar - A3*sbar - ∆/2
19,993
J. Král, J. Křepela: SW podpory při řešení projektů s aplikací statistických metod.
Barva písma koresponduje s barvou vynesené regulační meze v následujících regulačních diagramech.
201
Sborník konference REQUEST'06
3) List „Způsobilost“ Pro ukazatele způsobilosti Cp, CpU, CpL a Cpk se počítají
odhady; konfidenční intervaly pro zvolenou konfidenční úroveň; statistické pokryvné intervaly.
Tyto ukazatele vycházejí z „krátkodobé“ variability uvnitř podskupin. Předpokládá se normální rozdělení studovaného znaku jakosti a statisticky zvládnutý proces („v užším slova smyslu“) – v čase se nemění ani střední hodnota, ani variabilita. Např. ve výrazu:
Cp = se
odhaduje jako:
s=
USL − LSL 6σ 1 k 1 n ( xij − x j ) 2 ∑ ∑ k i =1 n j =1
.
Pro ukazatele výkonnosti Pp, PpU, PpL a Ppk se počítají:
odhady; konfidenční intervaly pro zvolenou konfidenční úroveň; statistické pokryvné intervaly
Tyto ukazatele vycházejí z „dlouhodobé“ variability v procesu, tj. jak variability uvnitř podskupin, tak mezi podskupinami. Předpokládá se normální rozdělení studovaného znaku jakosti a statisticky zvládnutý proces („v širším slova smyslu“) – v čase se nemění variabilita, ale střední hodnota se může měnit známým způsobem a je neodstranitelná. Např. ve výrazu:
Pp = se stot odhaduje jako:
USL − LSL 6 σ tot
stot =
1 kn ( xi − x tot ) 2 ∑ kn i =1
.
Z dat v listu „Data“ se přenesou základní statistiky, zadají se USL, LSDL a konfidenční úroveň a provedou se následující výpočty:
202
J. Král, J. Křepela: SW podpory při řešení projektů s aplikací statistických metod.
203
Sborník konference REQUEST'06
4) List „Normalita“
Provádí se Kolmogorovův test dobré shody s normálním rozdělením na hladině významnosti a = 0,05; Zakresluje se histogram z napozorovaných hodnot s proloženou křivkou normálního rozdělení.
Pro zakreslení histogramu se automaticky vypočítají meze třídních intervalů. Je ale možno zvolit jak šířku třídních intervalů, tak horní mez prvního třídního intervalu.
204
J. Král, J. Křepela: SW podpory při řešení projektů s aplikací statistických metod.
5) List „Stabilita“
Ověřuje se hypotéza, že všechny podskupiny pocházejí ze základních souborů se stejnou střední hodnotou pomocí ANOVA. Ověřuje se hypotéza, že všechny podskupiny pocházejí ze základních souborů se stejným rozptylem pomocí Bartlettova testu.
Pomocí uvedených šablon získá uživatel základní orientační informaci, zda napozorovaná data jsou rozdělena normálně a zda lze tedy vyhodnocovat způsobilost, resp. výkonnost běžným způsobem, nebo zda je nutno použít postup pro případ nenormálního rozdělení. V praxi se při nerespektování předpokladu normality dochází k zavádějícím, někdy velmi chybným výsledkům. Rovněž při zamítnutí hypotézy o rovnosti středních hodnot (případně rozptylů) základních souborů, ze kterých jsou odebrány podskupiny může vést při aplikaci Shewhartových regulačních diagramů k výraznému překročení rizika planého poplachu, které je v průměru jednou ze 370 kontrolovaných podskupin. To vede k demotivaci operátorů, kteří musí hledat signalizovanou zvláštní příčinu variability, když žádná neexistuje. Šablona na listu s výpočtem rozšířených regulačních mezí umožňuje volit ty, které nejlépe odpovídají analyzovanému procesu. Na tomto listu lze stanovit i tzv. „technické“ regulační meze (základní hodnoty jsou dány) které odpovídají např. požadavku odběratele na hodnotu Pp = Ppk. Na tomto listu lze zakreslit i zóny A, B, a C pro snazší analýzu, zda zakreslená data v regulačním diagramu nevykazují nenáhodná seskupení v souladu s ČSN ISO 8258
205
Sborník konference REQUEST'06
případně s materiálem amerických firem automobilového průmyslu popisující SPC. Ověření nutnosti systematicky analyzovat sledované znaky jakosti v procesech by mělo vést k implementaci vhodného, profesionálního, softwaru podporujícího implementaci statistických metod, ve výše uvažovaném případě, metod statistické regulace.
Literatura: [1] Kotz S., Johnson N. L.: Process Capability Indices. and Hall 1993
Chapman
[2] Michálek J.: Procesy s rozšířenými regulačními Research Report No. 1986 ÚTIA AVČR srpen 2000
mezemi.
[3] Michálek J., Křepela J.: Koeficienty způsobilosti a výkonnosti v případě rozšířených regulačních mezí. Research Report No. 2009, ÚTIA AVČR, leden 2001 [4] Michálek J., Křepela J.: Regulační diagramy s rozšířenými regulačními mezemi. Statistické dny v Brně, CQR, červen 2006 [5] ČSN ISO 8258:1994 Shewhartovy regulační diagramy [6] Daimler Chrysler Corporation, Ford Motor Company a General Motors Corporation: Statistická regulace procesů (SPC). přeložil Michálek J., ČSJ Praha 2006 Adresa autorů: Ing. Jan Král, ISQ PRAHA s.r.o., Pechlátova 19, 150 00 Praha 5. e-mail:
[email protected] Ing. Josef Křepela, České vysoké učení technické v Praze, Fakulta strojní, Ústav strojírenské technologie, Technická 4, 160 00 Praha 6. Karlovo nám. 13, 121 35 Praha 2 e-mail:
[email protected] Tato práce byla vytvořena za podpory projektu MŠMT 1M06047 - CQ
206
Význam systémového přístupu k projektu a zásady projektového řízení jako podmínky pro ekonomické přínosy řešení procesů Otakar Král, Jan Král
1.
Definice pojmu projekt
Význam slova projekt se v dřívější projektové praxi ustálil ve smyslu námět, návrh, plán a komplexní vyřešení zamýšleného zadání i vypracování jeho náležitostí včetně grafického znázornění (map procesů, schémat, grafů, výkresů, vývojových diagramů,...). Toto pojetí směřovalo k závěru, že jde o komplexní dokumentaci, sloužící k posouzení technickoekonomické úrovně a efektivnosti návrhu objektu entity, zadání, i k jeho realizaci. V současnosti se vychází z anglosaského pojetí slova project jako proces plánování a řízení rozsáhlých operací. Nejde tedy jen o výsledek - projektovou dokumentaci, ale o tvůrčí proces. Definic pojmu projekt bychom našli mnoho (v literatuře). Shodněme se na této: „Projekt je cílevědomý návrh na uskutečnění určité inovace v daných termínech zahájení a ukončení.“ Z této definice vyplývá záměr, který má následující charakteristické znaky: • • • • •
sleduje konkrétní cíl, definuje strategii vedoucí k dosažení daného cíle, splnění zadání určuje nezbytně nutné zdroje a náklady včetně očekávaných přínosů z realizace záměru, vymezuje jeho začátek a konec, V pojmu inovace je zahrnuta novost přístupů, řešení, které je zpravidla opřeno o využití teoretických poznatků a vědeckých metod.
207
Sborník konference REQUEST'06
2.
Management jakosti projektu
Je známo, že existují dvě hlediska pro aplikaci managementu jakosti projektů: hledisko procesu projektu a hledisko produktu projektu. Nesplnění kteréhokoli z těchto dvou hledisek může značně ovlivňovat produkt projektu, zákazníka projektu a ostatní zainteresované strany a organizaci projektu. Tato hlediska také zdůrazňují, že dosažení cílů jakosti je odpovědností vrcholového vedení, vyžadující angažovanost pro dosažení cílů jakosti na všech úrovních v organizaci zainteresované na projektu. Každá úroveň v organizaci si však musí ponechat odpovědnost za své vlastní procesy a produkty. Vytvoření a udržení jakosti procesu a produktu v projektu vyžaduje systematický přístup. Cílem tohoto přístupu má být zajištění, že stanovené a předpokládané potřeby zákazníků budou pochopeny a splněny, že budou hodnoceny a pochopeny potřeby ostatních zainteresovaných stran či skupin, které zadávají projekt a že se politika jakosti organizace zadávající projekt vezme v úvahu při uplatňování v managementu projektu. Norma ČSN ISO 10006 je použitelná u projektů různé složitosti, malé nebo velké, krátkodobé nebo dlouhodobé, pro různá prostředí, bez ohledu na druh produktu nebo procesu, což může vyžadovat určitá přizpůsobení návodu tak, aby byl vhodný pro konkrétní projekt. Tato mezinárodní norma není pokynem pro „management projektu” jako takový. Tato mezinárodní norma pojednává o návodu pro jakost procesů managementu projektu. Návod pro jakost v procesech projektu vztahujících se k produktu projektu a pro „procesní přístup“ je obsažen v ISO 9004. Veškeré úsilí při řešení projektu je zaměřeno k cíli být svým realizačním výstupem z projektu konkurenceschopný, splňovat požadavky zákazníka technické, provozní, estetické, bezpečnostní, ekologické, spolehlivostní a především ekonomické. 3.
Předpoklady pro využívání MSM v podnikové praxi
V současném období všechny podniky, které v ČR jsou funkční, jsou organizacemi, kde nelze snadno zlepšovat procesy. Podniky, kde bylo možné při návštěvě vidět výrazné nedostatky, kde bylo nekvalifikované vedení a pracovníci, již v současnosti neexistují.
208
O. Král, J. Král: Význam systémového přístupu k projektu a zásady ...
Přesto stojíme stále před problémem, jak zvyšovat svoji konkurenceschopnost. Japonci proklamovaná zásada „Nejvyšší technickou úroveň za nejnižší cenu v segmentu působnosti“ má stálou platnost. Otázkou tedy je, jak „nejlevněji“ zlepšovat procesy, především minimalizovat ztráty. Pojem „nejlevněji“ neznamená snadno, rychle a nekvalifikovaně. Zaměříme se v dalším textu prioritně na využití matematicko-statistických metod. V této oblasti je na prvý pohled vše již poznané, zdánlivě netřeba tomu věnovat vyšší pozornost. Skutečností však je, že matematicko-statistické metody, shodně jako prostředky a nástroje jiné, selhávají či nedávají očekávané výsledky, pokud jsou implementovány chybně. Prioritními chybami je použití vadných informací při formulaci problému, neadekvátní stanovení postupu prací a výběru řešitelů. Stále platí zásada, že informace pro úspěšné řešení problému musí býti objektivní, úplné, včas doručené stanovenému adresátovi, trvale aktualizované, snadno dostupné uživatelem, chráněné před poškozením či napadením a ekonomicky únosně získávané. Na bázi výše uvedených a naplněných požadavků na informace lze učinit další krok, tj. zjištění a formulace problému, který bude řešen. Zde bývá častou chybou subjektivní přístup, nemožnost ověření nebo i opomenutí ekonomických aspektů řešení (náklady, výnosy, možná ztráta dobrého jména u zákazníka …). Proto až v dalším kroku volíme metodu řešení, za předpokladu kvalitních informací a kvalifikovaného rozhodnutí co, jak, proč, s jakými náklady a přínosy, kdo bude řešitelem a za jakých podmínek (kompetenčních) řešení uskutečněno. V této souvislosti musíme prohlásit, že i nám se v prvých etapách nedařilo, protože některé z výše uvedených podmínek, nebyly plně zvládnuty, naplněny. V této situaci je nezbytné a v našich podmínkách se již stalo metodou práce, že k řešení zadávaných úkolů, již v etapě výběru, přistupujeme jako k řešení projektu. Projekt Management má svá stanovená pravidla, která předchází možnosti výskytu chyb v procesu realizace. Není to záležitost samospasitelná, ale osvědčená metoda. Rádi bychom upozornili, že zásady projektového řízení v podniku, se kterým spolupracujeme jsou již stanovenou metodikou, v souladu s ČSN ISO 10 006 „ Systémy managementu jakosti, směrnice pro management jakosti projektů“.
209
Sborník konference REQUEST'06
4.
Ekonomické Přínosy užití metody DOE v konkrétní podnikové aplikaci
V podmínkách SGSCR Hořovice, který je předním výrobcem autoskel byly v posledních letech dokončeny dva projekty DOE. Je možno potvrdit, že v r. 2005 došlo díky metodě DOE k výraznému zlepšení kvality v lepení držáků zrcátek a dešťových senzorů na předních sklech automobilů. Následující obrázek jasně a průkazně dokumentuje úspěšnost řešení a významný ekonomický přínos. V této souvislosti je nutno říci, že vlastní odpadnutí držáku na skle v podniku je ztrátou řádu 1.000,- Kč. Odpadnutí na hotovém automobilu z linky je záležitost řádu desítek tisíc Kč, vč. vážného narušení důvěry zákazníka (automobilky i nového uživatele automobilu).
U metody DOE bylo uplatněno projektové řízení a lze prohlásit, že výsledky jsou uspokojivé. Proto v implementaci DOE bude v podniku dále pokračováno a je možno již dnes prohlásit, že bude dosaženo v podmínkách SGSCR velmi zajímavých přínosů, řádově milióny Kč/rok. Je nezbytné si pro každé ekonomické posuzování náročné implementace dále uvědomit, že přínosy budou ve dvou rovinách:
210
O. Král, J. Král: Význam systémového přístupu k projektu a zásady ...
1. Přímo vyčíslitelné, kde přínosy stanovujeme, případně odhadujeme na základě reálných předpokladů, doložených doklady, znalostmi a již realizovanými výsledky analogických akcí řešitele. Vyčíslení je v Kč. 2. Nepřímé přínosy: - zvýšení kvalifikace managementu i přímo zúčastněných pracovníků, - navázání kontaktů s renomovanými pracovišti a specialisty s možnostmi dalšího rozšiřování spolupráce, - zvýšení prestiže podniku i managementu uvnitř koncernu i navenek k dodavatelům a odběratelům, - naplňování jednoho z kriteriálních požadavků modelu „Excelence“, evropského modelu EFQM, průkaz způsobilosti pro nejrůznější hodnocení a posuzování podniku v rámci tuzemských i zahraničních kritérií, v rámci Národní politiky jakosti ČR, soutěží a hnutí vedoucích k průkazu a dosahování konkurenceschopnosti. Výše uvedené poznámky jsou uvedeny z důvodu, že řešená problematika je objektivně náročná a dosažené, prověřené poznatky dále prohlubují úroveň poznání pro proces výroby autoskel v SGSČR, s cílem zvýšení produkce a snížení nákladů. V sledovaném období dle dokumentace SGSČR lze zjistit pro přímo vyčíslitelné úspory celkový počet skel s vadami za sledovaných 13 měsíců, který činní 28 930 kusů nespárovaných skel. Za rok lze tedy uvažovat počet skel (PS): -
PS =
28.930 ⋅ 12 = 26.705 ks . 13
Úvaha o možnosti vyčíslení ztráty v důsledku výskytu vad vychází z odhadu možného počtu kompletních párovaných skel (MPS):
MPS =
26.705 = 13.352 ks . 2
Průměrný zisk na jednom kompletně vyrobeném skle Fábia činní 219,78 Kč. vezmeme li tuto cenu jako průměrnou minimální, odhadujeme pro SGS roční ztrátu zisku (RZZ):
RZZ = MPS ⋅ Z = 13.352 ⋅ 219,78 = 2.934.612, -Kč . Úvaha o přínosu v důsledku implementace DOE, tj identifikaci nejvýznamnějších vlivů na výskyt vad. Pokud bychom uvažovali úsporu jen 15 % za rok z RZZ činní tato roční úspora (RU):
211
Sborník konference REQUEST'06
RU = 2.934.612 ⋅ 0,15 = 440.191,- Kč . Tuto úsporu je však nutno snížit o nutné náklady na zjišťování jakostních charakteristik vstupního skla. Odhad ročního nárůstu nákladů činní cca 150 000 Kč. Celková úspora (CU) za rok by tedy znamenala:
CU = RU - 150.000 = 290.191,- Kč . Do přímo vyčíslitelných nákladů a následně úspor je nutno dále započítat náklady na výrobu jednoho páru skla které činní průměrně 78,53 Kč. Náklady na vadné kusy (NVK) činní:
NVK =
26.705 ⋅ 78,53 = 1.048.572, -Kč . 2
Úspora z nevynaložení těchto nákladů (UNN) za 1 rok činní odborným odhadem minimálně cca 15% (dle analogických projektů).
UNN = NVK ⋅ 0,15 = 157.286,- Kč / rok . Úspora z provedeného implementování DOE činní kumulovaně (UK):
UK = CU + UNN = 290.191 + 157.286 = 447.477,- Kč / rok . Celková doba návratnosti ROI nákladů vynaložených implementaci DOE v SGS, při investici I=250.000,- Kč:
ROI =
na
250.000 = 0,559 roku . 447.477
V tomto případě se jedná o tzv. absolutní dobu návratnosti investice, neboť je kratší než 1 rok. Uvedený příklad reálného nasazení vyšší matematicko statistické metody dokládá, že i v náročných podmínkách lze dosahovat zlepšování procesů za podmínek souladu teorie i praxe.
5.
Přínosy užití metody FMEA
Metoda FMEA, „Analýza možnosti vzniku vad a jejich následků“ je účinným nástrojem pro ověřování jakosti výrobků a analýzy pro zlepšování procesů v celém spektru, tj. v oblastech bezpečnosti,
212
O. Král, J. Král: Význam systémového přístupu k projektu a zásady ...
spolehlivosti, technické úrovně, v oblastech konstrukce, technologie, výroby, prodeje, servisu,… Není cílem a ani zde není prostor pro podrobné uvádění významu a metodiky FMEA, to je účastníkům této konference známo. V čem však může spočívat „kámen úrazu“, je podcenění při řešení pomocí metody FMEA přístupu a přípravy řešitelského týmu. V této oblasti jsme si ověřili, že „úspora“ času pro urychlení startu prací na zadaném problému se nevyplatí. Naopak přístupy k řešení FMEA (a nejen ji) je třeba důsledně pojímat jako řešení projektu, a proto v tomto pojetí dodržovat zásady řízení projektu v celé struktuře. Projektové řízení jak je uvedeno v obecné struktuře na následujícím schématu, umožňuje plánovité, organizované, trvale ověřované a efektivní řešení. Nejsou při tomto přístupu nejasné kompetence, termíny ani dosažené výsledky. Metoda FMEA byla v SGSCR aplikována mj. při vývoji a přípravě modelu čelního automobilního skla. Postup, přístup a výsledky jsou uvedeny na následujících obrázcích. Dovolím si v závěru opětovně zdůraznit, že pokud se dopustíme již v etapách formulace cíle, získávání informací, výběru vedoucího a členů týmu, stanovování termínů a nákladů (průběžné objektivní provádění změn je žádoucí optimalizací řešení) chyb, může dojít k deziluzi o možnostech implementace matematicko-statistických metod. Naše dosavadní zkušenosti a dosažené výsledky dokumentují, že MSM jsou účinným nástrojem řízení a zlepšování procesů.
Zdroje informací pro FMEA
Výhody FMEA:
Vývoj nového modelu Q skupina
- Možnost včasného, preventivního a systematického rozpoznávání možných vad - Možnost formulovat vhodná nápravná opatření - Účinek plánovaných a uskutečněných zlepšení se dá měřit kvantitativně - Metoda lze použít ve všech odděleních podniku
FMEA
TOP Audit Problémové hlášení z výroby Technika Reklamace
Interní školení FMEA
Interní školení FMEA
11
213
10
Sborník konference REQUEST'06
Management projektu Zadavatel
Vedoucí týmu
Začátek Vypracování zadání
Tým
Zákazník
Spolupráce na vypracování zadání
Spolupráce na vypracování zadání
NE Je zadání v pořádku? ANO
Vypracování smlouvy s týmem a plánu projektu
Přezkoumání/ revidování plánu
NE
Je plán v pořádku?
ANO
Realizace plánu/ vytváření předmětů plnění/ motivování a přezkoumání rozhodnutí o postupu prací/ metodách
Jsou zapotřebí změny?
ANO
Obdržení konečného předmětu plnění
NE
NE
Je předmět plnění přijat? ANO
Hodnocení projektu
Je zpráva v pořádku? ANO
Hodnocení projektu a příprava závěrečné zprávy
Hodnocení projektu
Projekt dokončen
Projekt předán
NE
Konec
214
O. Král, J. Král: Význam systémového přístupu k projektu a zásady ...
ANALÝZA MOŽNOST Í VZNIKU VAD A JEJICH NÁSLEDKŮ (FMEA PROCESU)
AISA
Název procesu: Výroba čelních skel Model, rok výroby: ŠKODA A 04 Fabia KL,GR ZD emb. Členové teamu: Polák,Andrt,Vaníček,Klimeš/Abrahám
Polák Milan
Zodpovědnost za proces:
Kontrolní místo
5 C 10 AV VSI ZN 01-04
Skvrny barvy na skle
Vzhledové chyby
4 Chyba na sítu
5 C 10 AV VSI ZN 01-04
4 Malá nepotištěná zóna,tisk na broušenou hranu,barva v UV nevytvrdne
5 C 10 AV VSI ZN 01-04
Vzhledové chyby
4 Záměna barvy, závar ne OK
3 C 10 AV SIT ZN 02 C 10 FE PES ZN 04 C10 FE SIT PN 03 C 09 FE SIT PN 10
Životnost lepeného spoje (koheze)
8 Nesprávná tloušťka barvy
8 Záměna barvy, závar ne OK
3 C 10 AV SIT ZN 01 10 FE PES ZN 04 C10 FE SIT PN 03 C 09 FE SIT PN 10 2 C 10 AV SIT ZN 02 10 FE PES ZN 04 C10 FE SIT PN 03
C
Životnost lepeného spoje (koheze)
2 C 10 AV SIT ZN 02 10 FE PES ZN 04 C10 FE SIT PN 03
C
8 Nesprávná viskozita barvy
Nesprávná poloha motivu na skle SC
Neshodný výrobek vzhledová chyba
5 Nepřesné nastavení centrování před tiskem
3 C10 FE SIT ZN 0913,15,17
5 Nepřesně nastavená pryž.maska před tiskem
3 C10 FE SIT ZN 0913,15,17
5 Neshodný motiv na sítě
2 C10 FE SIT ZN 0913,15,17 10 AV VSI ZN 02
Nesprávné údaje v razítku (CC)
Neshodný výrobek
9 Chyba na DIA,špatně zadané 1 C 10 AV SIT ZN 03 DIA
Špatná přilnavost barvy (Tesa test)
Vznik vad potisku
4 Velká rychlost posuvu pásu v UV
6 C10 AV MOD ZN 06 PN …….
4 UV zářič nemá potřebný výkon
6 C10 AV MOD ZN 06 PN …….
4 Větší tloušťka barvy než je předepsaná
3 C 10 AV SIT ZN 01 C10 FE SIT PN 03
C
C
Zodpovědnost
náprav.opatření
termín
3
60
2
40
3
60
2
40
4
48
2
48
5
80
3
48
2
30
2
30
3
30
2
18
3
72
3
72
2
24
MB100 SB60
4 Špatný úhel nastavení těrky a 5 C 09 FE SIT PN 09 přítlaku těrky
Doporučené(á)
/P
SB60
4 Chyba na sítu
MR
d
SB60
Vzhledové chyby
O
SB60
Chyby v rastrových bodech
SB60
procesu
MB120 SB60
Kontroly tendencí
y
MB100 SB60
V
chyby
MB100 SB60
Možná(é) příčina(y)
z
MB120 MB180 MB180 MB180
V
chyby
MB140 MB140
Možný(é) důsledek(ky)
vady
MB120
Možnost vzniku
Požadavky
Světelná propustnost sítotisku
Sedláček M.
153
AV
Výsledky opatření Provedená opatření
V V O z y d
02/003KK 02/013PA
Vyčíslení přípravy modelu před FMEA Úvodní list
Náklady na přípravu nového modelu do sériové výroby Model Výrobní pomůcky, nástroje, režijní práce Vzorové sklo Zkušební šablona K-Lehre K-Originál Phantomlehre Olamovací šablona Diafilm Síto Sítotiskové masky Skelety Hadice Šablona pro vyhřívaná skla Kopyto pro extruzi Dýza Ostatní měrky a přípravky Homologace Režijní práce AV (hod/1 člověk) První vzorek (režie) Náklady na vývojové série Ostatní náklady
L143
Datum výkresu (revize)
Procesní funkce
Sítotisk
FMEA číslo: Strana:
A
Vyhotovil (jméno, odd., telefon): Datum FMEA (revize)
Opel Corsa
Celkové náklady:
Náklady 22 000,00 8 000,00 18 000,00 15 600,00 3 000,00 47 250,00 5 500,00 2 000,00 27 000,00 13 560,00 69 472,47 -
231 382,47 Kč
Předpokládané náklady:
345 000,00 Kč 6.11.2001 Vzorové sklo Zkušební šablona
Kč Kč Kč Kč Kč Kč Kč Kč Kč Kč Kč Kč Kč Kč Kč Kč Kč Kč Kč Kč Kč
K-Lehre K-Originál Phantomlehre Olamovací šablona Diafilm Síto Sítotiskové masky
Skelety Hadice Šablona pro vyhřívaná skla
Kopyto pro extruzi
Dýza Ostatní měrky a přípravky
Homologace Režijní práce AV (hod/1 člověk)
První vzorek (režie) Náklady na vývojové série
Ostatní náklady
Interní školení FMEA
215
15
M R /P
Sborník konference REQUEST'06
Vyčíslení přípravy modelu po aplikaci FMEA Úvodní list
Náklady na přípravu nového modelu do sériové výroby Model
Ford Sierra 83
Výrobní pomůcky, nástroje, režijní práce
Náklady
Vzorové sklo Zkušební šablona K-Lehre K-Originál Phantomlehre Olamovací šablona Diafilm Síto Sítotiskové masky Skelety Hadice Šablona pro vyhřívaná skla Kopyto pro extruzi Dýza Ostatní měrky a přípravky Homologace Režijní práce AV (hod/1 člověk) První vzorek (režie) Náklady na vývojové série Ostatní náklady
Celkové náklady:
148 657,89 Kč
Předpokládané náklady:
458 000,00 Kč 6.11.2001 Vzorové sklo Zkušební šablona
- Kč 3 630,00 Kč 25 000,00 Kč - Kč - Kč - Kč 9 075,00 Kč 15 600,00 Kč 3 000,00 Kč 2 904,00 Kč 5 500,00 Kč - Kč - Kč - Kč 2 000,00 Kč 27 000,00 Kč 15 820,00 Kč 12 000,00 Kč 27 128,89 Kč - Kč - Kč
K-Lehre K-Originál Phantomlehre
Olamovací šablona Diafilm Síto
Sítotiskové masky
Skelety
Hadice
Šablona pro vyhřívaná skla
Kopyto pro extruzi Dýza
Ostatní měrky a přípravky
Homologace Režijní práce AV (hod/1 člověk) První vzorek (režie) Náklady na vývojové série
Ostatní náklady
Interní školení FMEA
Adresa autorů: Ing. Otakar Král, Ph.D., CSc., Ing. Jan Král, ISQ PRAHA s.r.o., Pechlátova 19, 150 00 Praha 5. e-mail:
[email protected],
[email protected] Tato práce byla vytvořena za podpory projektu MŠMT 1M06047 - CQ
216
16
Kvalimetrie. Řízení a plánování jakosti pomocí NN a PLS metod. Karel Kupka
Abstrakt: Příspěvek popisuje principy dvou vybraných predikčních vícerozměrných metod a ukazuje vlastnosti multilineárních modelů PLS (partial least squares) a NN (neuronových sítí, Neural Network) a jejich možnosti při modelování výrobních a technologických procesů a plánování jakosti. Příspěvek je doplněn příklady aplikací z prostředí průmyslu a výzkumu v ČR.
1. Úvod Technologická praxe poskytuje soubory hodnot měřitelných parametrů z různých částí výroby, přípravy a zpracování materiálů, vstupních a výstupních kontrol. Mezi těmito parametry existují často užší, či volnější vztahy fyzikálního, kauzálního, či ekonomického charakteru. Vhodným modelování těchto vztahů je potenciálně možné tyto parametry odhadovat, predikovat ještě dříve, než jsou tyto parametry známy. Tím je za určitých okolností možno včas reagovat na případné problémy dříve, než se přímo projeví, případně je možné využít těchto modelů při designu a optimalizaci technologických postupů modelováním různých technologických podmínek a jejich vlivu na hodnoty výstupních parametrů, např. kvality produktu. Dále je možné využít modelů rovněž ke zpětné predikci vstupních parametrů při daných požadovaných vlastnostech produktu. Pokud je model korektní, lze v omezeném rozmezí hodnot parametrů zlepšovat, optimalizovat, nebo stabilizovat důležité vlastnosti technologie (například náklady, opotřebení, poruchovost, spotřebu energie a surovin), či kvalitu produktu (stabilizace parametrů jakosti, zmetkovitost, shodnost, způsobilost). Pokročilé lineární a nelineární vícerozměrné prediktivní statistické modely jsou spolehlivou cestou ke zlepšování jakosti, plánování jakosti, konkurenčním výhodám a quality excelence, neboť účinně využívá
217
Sborník konference REQUEST'06
všech druhů a úrovní informací a vědomostí v dané technologii, podniku, odvětví.
Relace statistického modelování a řízení jakosti – transformace dat na kvalitu a zisk
218
K. Kupka: Kvalimetrie. Řízení a plánování jakosti pomocí NN a PLS metod.
Příklad informačních datových bází, toky dat a možnosti modelování vztahů ve výrobním subjektu Pokročilé statistické techniky a modely využívající a modelující současně více parametrů a zkoumající vztahy mezi různými skupinami parametrů v oblasti technologií a řízení jakosti za účelem zlepšení jakosti se nazývají metodami kvalimetrie. Lze sem zařadit mnoho vícerozměrných metod, jako techniky vícerozměrné analýzy (metody hlavních komponent, korespondenční a diskriminační analýzu, kanonické korelace), metody zobecněné lineární regrese, logistické regrese, klasifikační a regresní stromy, metody z oblasti Data Mining a KDD. V tomto příspěvku se zabýváme dvěmi metodami – metodou parciálních nejmenších čtverců a neuronovými sítěmi. Cílem metod kvalimetrie z hlediska subjektu je popsat globálně vztahy mezi důležitými parametry v podniku z oblasti surovin, technologie, produktu, obchodu, marketingu, designu a vývoje. Tento popis ve formě statistických modelů je pak bezprostředně použitelný pro podporu rozhodování a plánování a zlepšování jakosti. Některé typické aplikace billineárních modelů PLS a neuronových sítí: Technologické aplikace a QC / QA / QI / QP – Technologie: Procesní parametry ↔ Fyzikální vlastnosti Technologie: Procesní parametry ↔ Fyzikální vlastnosti Proces/chemické složení ↔ Sensoric/Quality parametry Vstupní faktory ↔ Výstupní kval/kvantitativní vlastnosti Procesní podmínky ↔ Výstupní kval/kvantitativní vlastnosti Obecné aplikace – Toxicology: Composition/Structure ↔ Toxicity Health/Pharmaceutics: Chemical Structure ↔ Bioeffects Pollution: Composition ↔ Origin/Source Pollution: Composition ↔ Human health effects Environment: Environmental factors ↔ Species diversity QSAR: Quantitative Structure – Activity Relationship
219
Sborník konference REQUEST'06
Tyto prediktivní metody byly v českých podnicích jako např.:
využity
při
řešení
úloh
-
Plzeňský pivovar/Pilsner Urquell – analýza, predikce a plánování vlastností piva a marketingová analýza produktového portfolia a detekce obchodních příležitostí na globálním trhu v podniku;
-
Jaderná Elektrárna Dukovany: predikce možných statistických nestabilit techologie s následným snížení nákladů na provoz a údržbu;
-
Kaučuk Kralupy – optimalizace vlastností butadienových kopolymerů a analýza produktového portfolia;
-
Třinecké železárny, Mittal Steel Ostrava– budování inteligentních modelů pro plánování parametrů technologie ve slévárenství a optimalizace vlastností produktů s minimalizací nákladů a ztrát, implementace ztrátových funkcí
a při výzkumných úkolech, např. výzkum bioluminiscenční aktivity bakterií pro monitoring životního prostředí, nebo koloristických vlastností anorganických pigmentů.
2. PLS: Parciální nejmenší čtverce – porozumění jakosti v technologii Metoda parciálních nejmenších čtverců (Partial Least Squares) byla intuitivně popsána koncem Hermanem Woldem (1) formou iterativního algoritmu. Matematické pozadí této metody byla objevena teprve později (2). PLS modeluje vztah dvou vícerozměrných veličin. 2.1. Metodika a metody PLS Metody PLS jsou založené na syntéze principu příbuzném metodě hlavních komponent (PCA) a vícenásobné lineární regrese. Tato matematická metoda je využívána v ekonometrii, chemometrii, biometrii a v poslední době se objevují aplikace v kvalimetrii. Cílem metody je odhalit vztahy mezi vícerozměrnými daty v databázích a
220
K. Kupka: Kvalimetrie. Řízení a plánování jakosti pomocí NN a PLS metod.
využít této znalosti k přibližnému výpočtu hodnot jedné skupiny veličin z druhé. 2.2. Podstata Metody PLS Tabulku naměřených hodnot p veličin (sloupců) s n řádky označme jako matici X(n x p), a odpovídající tabulku se stejným počtem řádků n ale s q veličinami označme Y(n x q), Abychom extrahovali maximum informace z p- a q- rozměrných matic do prostoru s nižší dimenzí k, rozložíme X a Y na ortogonální matice T (n x k) a U (n x k), s koeficienty P a Q. X = TP + E Y = UQ + F T (n x k), U (n x k), k ≤ min(p, q). Zajištění maximální relevance Xkomponent pro Y, tyto transformace maximalizují kovariance mezi T a U. Dimenzionalita T a U je typicky menší než X a Y a sloupce T a U jsou ortogonální. To zlepší stabilitu modelu. Šum a irelevantní informace se koncentruje v „popelnicích“ E a F. Je-li k = p, pak E = 0. Dekompozice U = TB (B je čtvercová diagonální matice) poskytuje nástroj pro predikci Y z X: Y = TBQ, T = XPKombinací tohoto a předchozích vztahů je zřejmý vztah (vnitřní lineární vazba mezi X a Y). U = TB BQ = R
X = TP + E Y = TR + F
T se konstruuje z nových dat X. Protože T = XP–, Y = XP–BQ, a tedy P–BQ reprezentuje originální (obecně vychýlené a zkrácené – tedy stabilnější) regresní parametry modelu Y = XA. Na rozdíl od klasické lineární regrese jsou v PLS X a Y rovnocenné, tedy zaměnitelné – je jedno, kterou matici označíme X a kterou Y. Proto lze predikovat Y z X stejně jako X z Y. Je tedy PLS rovněž často používaným nástrojem pro lineární vícerozměrnou kalibraci.
221
Sborník konference REQUEST'06
P X
=
T
+
E
Q Y
=
U
+
PREDIKCE
X
F
Y
Grafické znázornění PLS 2.3. Aplikace PLS pro plánování kvality piva a mapování portfolia produktů v Plzeňském pivovaru Jednou z typických aplikací PLS je modelování vztahů chemické složení – vlastnosti, nebo chemická struktura – vlastnosti. Vlastnostmi se rozumí vlastnosti fyzikální, chemické, biochemické, toxikologické a podobně. V Plzeňském pivovaru byla využita metoda PLS pro modelování vztahu chemické složení – subjektivní chuťové parametry. Subjektivní hodnocení je realizováno skupinou profesionálních panelistů-degustérů. Kromě nalezení vztahu složení – vlastnosti, který mohl být využit pro predikci subjektivních vlastností bez nutnosti ochutnávání, byl pomocí grafické interpretace PLS-Biplot diagnostikována rovněž distribuce jednotlivých značek a produktů na trhu v podprostoru hlavních komponent P a Q, což je důležitý zdroj informace pro případná strategická rozhodnutí vedení firmy. Uvedené grafy jsou pouze ilustrativní a byly mírně pozměněny pro citlivost údajů.
222
K. Kupka: Kvalimetrie. Řízení a plánování jakosti pomocí NN a PLS metod.
Predikční kapacita PLS modelu pro všechny prediktory, grafy predikce
PLS-Biplot distribuce brands v podprostoru prvních dvou komponent matice vlastností Q
2.4. Aplikace PLS pro detekci ztrát, optimalizaci polymerace a identifikaci eficientních tříd produktů v Kaučuku Kralupy Data z technologie a hodnocení jakosti jsou základním zdrojem pro implementované analytické a identifikační postupy. Metodami PLS se podařilo nalézt významné vztahy mezi různými úrovněmi technologie a vlastnostmi produktu – butadienových kopolymerů, které definují jakost produktu. Pomocí Biplot analýzy bylo možné identifikovat a potlačit nestability kvality v řádu desítek procent celkových ztrát technologie. Pomocí inverzního PLS modelu pak je možné vypočítat optimální režimy technologických postupů a izolovat a klasifikovat potenciální nové podskupiny produktů.
Procesní trajektorie s diagnostikou nestabilit a klasifikací úrovní jakosti
223
Sborník konference REQUEST'06
3. NN: Neural Networks 3.1. Podstata neuronových sítí Matematické modely neuronové sítě jsou inspirovány strukturou a funkcí biologického neuronu. Model neuronu lze vyjádřit jako yi = σ * ( ( wij * x j − µi ) , kde xj jsou vstupní hodnoty, wij jsou
∑ j
váhové koeficienty a σ* je aktivační funkce, která transformuje vstupy na výstupní signál neuronu. Aktivační funkce má za úkol rozeznat, zda kombinace úrovně vstupních signálů je dostatečně významná (zda není podprahová, či příliš vysoká), resp. kvantifikovat v určitém rozmezí jejich významnost. Mezi nejjednodušší aktivační funkce patří třeba skoková funkce, která může mít tvar
σ ( x) = 1 pro x ≥ 0 σ (x) = 0 pro x < 0
Skoková aktivační funkce
Schéma neuronu
V neuronových sítích se často se využívá logistická aktivační funkce
σ=
1 , která je případně parametrizována 1-2 parametry. 1 + exp( − x )
Vstupní veličina xi je po normalizaci vážena vahou wji a v neuronu transformována aktivační funkcí σj+1, i (z) = 1/(1 + e – z), kde z je lineární kombinace vstupních veličin, zi = a0 + Σaijzi-1,j. Váhy wji představují vazbu mezi vstupní hodnotou a neuronem. z = xi.wij; σj+1, i (z) = 1/(1 + e – z); zi = a0 + Σaij zi-1,j
224
K. Kupka: Kvalimetrie. Řízení a plánování jakosti pomocí NN a PLS metod.
1
σ
0
0
X
Logistická aktivační funkce Jednovrsvá neuronová síť
3.2. Vícevrstvé neuronové sítě Architektura vícevrstvých neuronových sítí umožňuje řešení lineárně neseparabilních klasifikačních problémů a modelování silně nelineárních systémů. Optimalizace takových sítí je však daleko náročnější na optimalizační algoritmy.
Příklady struktury vícevrstvé neuronové sítě 3.3. Postup použití NN Aplikace NN má obyčejně 3 kroky: • Volba vhodné struktury sítě (architektura) • Trénování sítě na změřených datech (učení) s případnou validací sítě • Predikce pomocí NN Nevýhodou modelů NN je apriorní neexistence statistických atributů, jako intervalů spolehlivosti, obtížná, či nemožná interpretace parametrů, nemožnost testování významnosti vlivu proměnných na výstupní hodnoty. Tyto nedostatky je možné druhotně odstranit
225
Sborník konference REQUEST'06
některými vypočetně-intenzivními technikami, např. bootstrapingem, Monte-Carlo metodami, případně linearizací odpovídajícího regresního modelu a asymptotickým výpočtem statistických parametrů. Poměrně výhodné a intuitivní je vizualizace váhových koeficientů například pomocí tloušťky dentritů ve schématu neuronové sítě. Tlusté čáry pak odpovídají intenzivnějšímu toku informací mezi uzly sítě, případně ze vstupní, či do výstupní proměnné a tak vlastně naznačují i významnost jednotlivých proměnných i vhodnost navržené architektury sítě. Predikční neuronová síť s vyznačenou intenzitou toku informace – použitá při modelování optických vlastností anorganických pigmentů a technologických podmínek pro světové trhy v prostoru L-a-b 3.4. Využití NN pro modelování a předpovědi časových řad. Jedním ze speciálních využití neuronových sítí je modelování časových řad (NN-TS). Lze zde využít nelineární analogie autoregresního (AR) modelu. V autoregresním modelu je posloupnost hodnot xi–m, xi–m+1, ..., xi–1, xi modelována jako lineární kombinace xi = amxi–m + am-1xi–m+1, ..., +a1xi–1 + a0. Použije-li se místo lineárního autoregresního modelu regresní neuronová síť, je možno vytvořit třídu nelineárních autoregresních modelů, jehož podmnožinou jsou i lineární modely. Spojením s vhodnou cross-validací lze popsat širší oblast problémů popsatelných stacionárními časovými řadami. Nestacionární časové řady nelze tímto způsobem modelovat pro lokální povahu neuronové sítě.
226
K. Kupka: Kvalimetrie. Řízení a plánování jakosti pomocí NN a PLS metod.
3.5. Aplikace NN při modelování parametrů jakosti ve Mittal Steel Ostrava Základními parametry kvality a důležitým elementem systému jakosti železáren, oceláren a sléváren jsou vlastnosti sledované zákazníkem, především chemické složení, fyzikální a chemické vlastnosti, homogenita. NN-řízené statistické modelovací postupy aplikované na data procesní a data ze zkušeben vedly ke konstrukci stabilních predikčních modelů a metodik použitelných při optimalizaci stability a snižování vad. Dále je možné těmito modely určit technologické postupy vedoucí k produktu požadovaných vlastností. Procesní predikční modely byly navíc využity při včasné identifikaci nestabilit a chybných taveb, apod.
Ilustrace – jeden z NN-modelů při optimalizaci nákladů a jakosti ocelových produktů 3.6. Aplikace NN-časové řady pro predikci chování dynamických systémů v JE Dukovany Příkladem aplikace NN-TS je použití tohoto modelu pro modelování a předpovědi časového průběhu některých chemických a fyzikálních parametrů média v primárním a sekundárním okruhu jaderné elektrárny Dukovany. Model NN-TS zde predikoval podstatně lépe než klasické modely časové řady AR, resp. ARIMA. Následující obrázek představuje fitovaný průběh naměřených hodnot s předpovědí 15 budoucích měření (silná čára). Této předpovědi validovaného modelu lze využít u kritických veličin k včasné předpovědi případných budoucích výchylek od předpokládaných
227
Sborník konference REQUEST'06
úrovní. Od dchylka od 1-krokové před dpovědi přessahující jistý násobek n reziduálníí směrodatné odchylky preedikce (např. 3σr) může bý ýt navíc diagnosticcky využit jak ko varovná statistická s nesstabilita, Mod del NNTS zde pak k bude sloužiit jako inteligeentní regulačn ní diagram.
Časov vá řada fitova aná neuronovo ou autoregressí s 15-krokov vou předpověd dí (tučně)
Odpovíd dající neurono ová síť se 7 + 3 neurony ve sskrytých vrstv vách a grafem prredikce Adresa au utora: Ing. Karel K Kupka, Ph.D., TriloByte Stattistical Softwarre s.r.o., Jiráskoova 21, 530 02 Parrdubice e-mail:
[email protected] Tento přísppěvek byl vytv vořen na pracoovišti TriloBytte Statistical Software S pomocí sofftware QCExp pert za státníh ího příspěvku „Výzkumné centrum c 1M06047““: CQR, Centru um pro jakost a Spolehlivost.
228
Simulation and recognition of common fabric defects Maroš Tunák, Aleš Linka Abstract: This contribution deals with a procedure of recognition of defects occurred in woven fabric. Fabric as a directional texture is characterised with high-energy frequency components, which are distributed along the straight lines in the Fourier domain image. A set of seven features based on the first-most significant frequency can be extracted from these images. The correlation between the features corresponding to window with no defective structure and features obtained from sliding window is computed. If the value is smaller then the set value the window is considered as the window contains defect.
1. Introduction Woven fabric is normally composed of two sets of mutually perpendicular and interlaced yarns. The weave pattern or basic unit of the weave is periodically repeated throughout the whole fabric area with the exception of the edges. The Fourier theorem says that any periodic function can be described as a sum of sines and cosines of different frequencies and amplitudes. Considering the periodic nature of woven fabric it is possible to monitor and describe the relationship between the regular structure of woven fabric in the spatial domain and its Fourier spectrum in the frequency domain. Presence of defect over the periodical structure of woven fabric causes changes in its Fourier spectrum. In this contribution we especially focus on recognition of common defects associated with change of weaving density or defects that appear as a thick place distributed along the width or high of an image. In this paper we will first describe algorithm for simulation of common fabric defects in plain weave, then we will test algorithm for recognition of simulated defects and finally we will show a few examples of recognition on real samples.
229
Sborník konference REQUEST'06
2. Simulation of a plain weave Convolution of an elementary unit and a pattern of repetition in the spatial domain were used for a plain weave simulation. Let h(x,y), g(x,y) and b(m,n) be the input image, output image and convolution mask, respectively, and convolution is denoted by ⊗ . At each point (x,y), the response of the mask at that point is the sum of products of the filter coefficients and the corresponding neighbourhood pixels in the area spanned by the mask [1], [2], [3]: y
x
g ( x, y ) = b( x, y ) ⊗ h( x, y ) = ∑∑ b(m, n)h( x − m, y − n).
(1)
m =0 n =0
Figure 1(a) displays image of yarn interlacing point. The yarns are represented by white, space among them by black. On the basis of input parameters can be generated warp and weft interlacing point, where pwa, pwe represent warp and weft spacing, and dwa, dwe define warp and weft diameter in pixels. Figures 1(b),(c) display warp and weft interlacing point, resp., with regard to parameter sp.
(a)
(b)
(c)
Fig. 1 (a) Yarn interlacing point, (b) weft interlacing point, (c) warp interlacing point. Woven fabric is composed of two sets of mutually perpendicular and interlaced yarns. The pattern or basic unit of the weave is periodically repeated throughout the whole fabric area with the exception of the edges. The simulated output image of a periodic structure in a plain weave g(x,y) can be simulated as a convolution of an elementary unit (pattern repeat) b(m,n) by a input image of pattern of repetition h(x,y). The result of convolution theorem can be seen in Fig. 2(c), which represents grey level image of plain weave in a spatial domain, the
230
M. Tunák, A. Linka: Simulation and recognition of common fabric defects.
size of image is 200 x 200 pixels. Warp and weft yarn diameter was set to 12 pixels, warp yarn spacing to 16 pixels, weft yarn spacing to 20 pixels and parameter sp to 1 pixel.
⊗
(a)
=
(b)
(c)
Fig. 2 (a) Convolution mask, elementary unit, (b) pattern of repetition, (c) simulated image of a plain weave with parameters in pixels, n = 200, pwa = 16, pwe=20, dwa = dwe= 12 a sp=1.
3. Simulation of common woven fabric defects According to [4] the woven fabric defects can be organized into three basic categories. The weft direction defects, the warp direction defects and defects with no directional dependence. Some of them in the weft direction are: irregular weft density, double pick, broken pick, weft yarn defect, and float; defects in the warp direction are: broken end, double end and warp yarn defect. Defects with no directional dependence involve defects: stain, hole and foreign body. Defected images were modelled by using algebraic operations on simulated images of plain weave structure, in some cases with removing some rows or columns. Position, size and shape of defects were randomly generated from uniform distribution. The algorithm and graphical user interface in MATLAB software language was created for realization. A few examples of simulated common fabric defects in a plain weave can be seen in Figure 3 (b) – (l), Fig. 3 (a) display structure without defect, (b) hole, (c) stain, (d) float, (e),(f) weft and warp yarn defect, (g),(h) double pick, double end, (i) irregular weft density (insufficient), (j) irregular weft density (excessive), (k) broken pick, (l) broken end.
231
Sborník konference REQUEST'06
(a)
(b)
(c)
(d)
(e)
(f)
(g)
(h)
(i)
(j)
(k)
(l)
Fig. 3 Simulated defects in a plain weave.
232
M. Tunák, A. Linka: Simulation and recognition of common fabric defects.
4. Algorithm for defect recognition The Fourier spectrum is useful to describe periodic patterns in grey level images. Information about major structural direction lines in the spatial domain is concentrated in the Fourier domain image as a direction of high-energy peaks. Detecting corresponding high-energy frequency components in Fourier domain image and setting them to zero remove one set of yarns in spatial domain image. Finally, inverse Fourier transforms (FT), back-transformed data to the spatial domain image. Only one set of yarns information remains in the restored image. The structural lines in the spatial domain image and its transformations are mutually perpendicular. A change or presence of a defect in the weft or warp direction in the woven fabric image causes changes of corresponding high-energy frequency components in Fourier domain image. The discrete 2DFT and its inverse is given [1]:
F (u , v ) =
M −1 N −1
∑ ∑ f ( x, y )e
− j 2π ( ux / M + vy / N )
(2)
,
x =0 y =0
f ( x, y ) =
1 MN
M −1 N −1
∑∑ F (u, v)e
j 2π ( ux / M + vy / N )
,
(3)
u =0 v =0
Information about the set of weft yarns appears in the vertical direction (fy) in the Fourier spectrum and warp set of yarns appears in the horizontal direction (fx). Two diagrams along the fx and fy direction (|F(fx,0)| and |F(0,fy)|) were extracted from the Fourier frequency spectrum. A set of seven features based on the first-most significant frequency can be extracted from these diagrams, for more information see [3], [6]: v 1 = | F ( 0 , 0 ) |, v 2 = | F ( f x 1 , 0 ) |,
v 3 = f x1 ,
v4 =
f x1
∑
| F ( f xi , 0 ) |,
f xi = 0
v 5 = | F ( 0 , f y 1 ) |,
v 6 = f y1 ,
v7 =
(4)
f y1
∑ | F (0,
f yi ) |.
f yi = 0
where v1 represents average light intensity. Features v3=fx1 and v6=fy1 correspond to the first most significant harmonic frequency in the fx and fy direction and can be used for weaving density evaluation [7]. Features v2, v3 and v4 are for detecting changes in the warp set of yarns, whereas v5, v6, v7 monitor the weft set of yarns. The features
233
Sborník konference REQUEST'06
v4 and v7 analyse the region between the central peak and first peak. Figure 4(a) shows example of a simulated structure in a plain weave contains weft yarn defect, Fig. 4(d) display Fourier frequency spectrum as an intensity image scaled to 256 grey levels. Two diagrams along the fx and fy direction (|F(fx,0)| and |F(0,fy)|) extracted from the Fourier frequency spectrum can be seen in Fig. 4(b),(e) (the other components in frequency spectrum were setting to zero). Figures 4(c),(f) represent restored images after inverse Fourier transform. As can be seen from restored image in spatial domain in Figure 4(c) central frequency spectrum in fx direction contains sufficient information about the warp set of yarn, whereas frequency spectrum in fy direction about the weft set of yarns and about the defect, imperfection too.
(a)
(b)
(c)
(d)
(e)
(f)
Fig. 4 (a) Simulated structure with weft yarn defect, (d) Fourier frequency spectrum, (b),(e) F(fx,0)|, |F(0,fy)|, (c),(f) restored images after IFT.
234
M. Tunák, A. Linka: Simulation and recognition of common fabric defects.
5. Defect recognition in simulated structures On the base of relations (4) we evaluated a set of seven features for images of structure without defect. We observed correlation coefficient between the features of two randomly placed windows of size 50 x 50 pixels. Correlation between them did not fall under the value 0.996. Then we evaluated correlation coefficient between the features obtained from window without defect and sliding window moved over the whole image. If the correlation coefficient was smaller then the set value the window was considered as the window contains defect. Size of images was set to 501 x 501 pixels; Gaussian noise of mean 0 and variance 0.0025 was added to images. Sliding window of size 50 x 50 pixels was moved by the step of size 25 pixels. Windows with detected defect or imperfection remained in image and were displayed with white colour. Correlation coefficient was setting to 0.975. Total time of detection with the visualisation was about 1 minute, about 10 seconds without visualisation (for these parameters detection involve inspection of 361 windows). Figures 5 (a) – (l) display result of applied algorithm to simulated images of defects from Fig. 3(b) – (l).
(a)
(b)
(c)
(d)
(e)
(f)
235
Sborník konference REQUEST'06
(g)
(h)
(i)
(j)
(k)
(l)
Fig. 5 Result of the applied algorithm on simulated samples, where white window indicate defect, imperfection. As we can see from figures, process is suitable for simulated images of contrast defects.
6. Examples of defect recognition in real structures The samples of a real fabric’s defects in a plain and twill weave were captured by flat scanner with resolution 400 dpi in 256 grey levels and stored in an image matrix of size 501 x 501 pixels. Equalization was used for contrast enhancement. Figures 6 (a) – (g) show a few examples of recognition of defects in real structures. By reason of different structures (weave, density) every structure is sensitive to different value of correlation coefficient. Examples 6 (a) - (c) represent real defects hole, stain and foreign body, size of sliding window was setting to 50 x 50 pixels and correlation coefficient to value 0.7. The size of sliding window 100 x 100 pixels was setting for another examples. The correlation coefficient was 0.7 for examples (e),(f) and 0.85 for defect irregular weft density (insufficient).
236
M. Tunák, A. Linka: Simulation and recognition of common fabric defects.
(a)
(b)
(c)
(e)
(f)
(g)
Fig. 6. Result of the applied algorithm on real samples, where white window indicate defect, imperfection.
7. Conclusion Recognition algorithm based on features extracted from Fourier frequency spectrum is useful for simulated samples of common woven fabric defects. By using this method we can detect defects associated with change of weaving density or defects that appear as a thick place distributed along the width or height of an image and for no directional defects too. Algorithm is also suitable for real samples, but different parameters of recognition (size of sliding window, correlation coefficient) were used according to different structures of fabrics. The advantages of automated visual inspection are objectivity and independence on the human inspectors. This method is relatively fast and it could be used as online visual inspection of quality.
237
Sborník konference REQUEST'06
8. Future work It will be reasonable to devise an optimised method, which define appropriate parameters for given certain structure (size of window, value of correlation). It means that the algorithm will detect the parameters on the training data set and then these parameters will be used for defect detection in real fabric structure. Other approaches (i.e. statistical, structural) can be tested as well.
References [1] Gonzales R. C., Woods R. E.: Digital Image Processing. 2nd edition, Prentice-Hall, 2002. [2] Escofet, J., Millán, M. S. Ralló, M.: Modeling of woven fabric structures based on Fourier image analysis. Applied Optics, Vol. 40, No. 34, December 2001. [3] Chan Chi-ho., Pang G. K. H.: Fabric Defect Detection by Fourier Analysis. IEEE Trans. on Industry Applications, Vol. 36, No. 5, September/October 2000. [4] Catalogue of types of fabric defects in grey goods. 3rd edition, ITS Publishing, Switzerland, 1996. [5] Tsai, D.-M., Huang, T.-Y.: Automated Surface Inspection For Directional Textures. Image and Vision Computing, 18, 49 – 62. 1999. [6] Tunák, M., Linka, A.: Fourier Analysis of Woven Composite Structures. ICCE 12 Proceeding. Tenerife, 2005. [7] Tunák M., Linka A.: Applying spectral analysis to automatic inspection of weaving density. STRUTEX, Liberec, 2004. Author´s address: Doc. RNDr. Aleš Linka, CSc. Technical University in Liberec, Department of Textile Materials; Hálkova 6, Liberec 46117, Czech Republic, e-mail:
[email protected] Ing. Maroš Tunák, Technical University in Liberec, Department of Textile Materials; Hálkova 6, Liberec 46117, Czech Republic, e-mail:
[email protected] Acknowledgement: This work was supported by the project MSMT CR No. 1M06047.
238
Stochastic simulation of deformation in fabrics as composite reinforcement M. Tunák, A. Linka, P. Volf
Abstract: A method for modelling and random simulation of a progressive deformation and defects of a fabric in plain weave is presented. Fabric is modelled as a grid consisting of a set of nodes and connecting flexible (to some extent) arcs, the deformation is caused by an external strength stretching the grid. The objective is to find optimal, stabilized, states of the grid. Optimal configuration can be found with the help of MCMC procedures. Further, in order to model the breaking process of a fabric yarns, the stretching a bundle of fibres is modelled in a similar way. Simultaneously, a stochastic reliability model of a parallel system and its resistance against a stress is utilized. The results are compared with real experimental stress-strength curves. The model is applied for fabric defect simulation. Key words: breaking strength, survival/reliability analysis, fabrics, composites, MCMC methods.
1. Introduction In contrast to metal structures that generally exhibit ductile behaviour, composite materials tend to be brittle. That is important feature, because they can be described by theories based on the weakest link concept. In general, the failure of component depends on the material strength, on loading and the structural behaviour, which also includes interaction between components, boundary conditions and so on. The joint effect of probabilistic description of loading, structural response and material strength is dealt with by reliability analysis of composite material structures (see [4] for review). In the present contribution we first model strength of bundle composed from m fibres as the reliability (survival) of a system
239
Sborník konference REQUEST'06
composed from a set of parallel components. We will consider a model of redistribution of load among the fibres, namely the Daniels load sharing model (see [1] or [2]). In this model it is assumed that the applied load is distributed equally among the surviving (unbroken) fibres and further, the breaking strengths of individual fibres are independent and identically distributed random variables. The model neglects the interactions between fibres, which arise when the fibres are twisted to form a yarn or they are set in matrix to form composite. Daniel's model provide links between the probabilistic theory of brittle materials, such as glass, carbon or Kevlar, and bundles of fibres, tow and strands, which are used as the reinforcement phase in many composites. Thus, the theory allows us for prediction of the characteristic of reinforcing bundles in composite. Second, we will model and simulate some progressive deformation of the fabric in plain weave composed from bundle of fibres as composite reinforcement. The fabric is modelled as grid consisting of a set of nodes and connecting flexible (to some extent) arcs, the deformation and break of arcs are caused by an external strength stretching the grid. The objective is to find optimal, stabilized, states of the grid. Hence, the problem can be reformulated as the problem of optimal configuration of a random field of points with local dependencies, which is one of typical problems solved with the aid of MCMC procedures. To do so, the prior distribution of nodes is given by local conditional distributions, further; the potential function is defined as a tension in grid arcs. Optimal configuration then can be found with the help of Metropolis-Hastings algorithm, possibly accompanied with simulated annealing. The method complements the one described in [3]. Further, stretching a bundle of fibres will be simulated in a similar way, and obtained results compared with real experimental stressstrength curves of sequential breaks of fibres.
2.
The model for counting process of breaks of fibers
Let us imagine that the fibre bundle is stretched by a strength increasing from 0 up to the level breaking the bundle (i.e. all its fibres) - or up to a given maximal strength Smax when the experiment is terminated. This testing experiment is relatively fast, so that the
240
A. Linka, M. Tunák, P. Volf: Stochastic simulation of deformation in fabrics ...
time of duration of the tension does not play any role. Therefore, we use more or less standard survival analysis approach, however, instead the time, the tensile strength is the variable of interest. The global load affecting the bundle is observed. However, as the break of a fibre leads to an immediate redistribution of the force to the other fibres (so that to the abrupt increase of the force affecting each individual fibre), the consequence is the break of several of remaining fibres (not necessarily of all, because their strengthresistance is random). Therefore, in such a case we actually don't know the precise level of the strength causing the break of individual fibres. Moreover, we are not able to register the order in which they broke. So that, in the case of multiple fibres break, we know exact strength causing the break of one fibre (we don’t know which one, but in the case of ‘identical’ and independent fibres it is not important), and intervals of strengths, which caused the breaks of the other fibres. From these considerations it is seen that the part of the data has a complicated interval censored structure. Fortunately, if we observe a sufficient number of breaks, we register also a sufficiently large set of uncensored data (see [1]). Let us first consider one individual fibre and the random variable U - its breaking strength. We assume that it has a continuous distribution on [0, ∞ ) with a distribution function F (u ) , density f (u ) , hazard function h(u ) = f (u ) / (1 − F (u )) defined on u ∈ [0, S ] such
that F (S ) < 1 . By H (t ) =
t
∫ h(u )du 0
we denote cumulative hazard
function. The ‘fate’ of a fibre during the increase of tensile strength u is described by two random processes, by the counting process N 1 (u ) and identificator I 1 (u ) . I 1 (u ) = 1 if the strength u affecting
the fibre is observed, otherwise I 1 (u ) = 0 . Specifically, I 1 (u ) = 0 , if the fibre is already broken, if the experiment is terminated, and also for values of u during an abrupt step-wise increase of the strength. We assume that trajectories of I 1 (u ) are left-continuous. As regards
N 1 (u ) , N 1 (0 ) = 0 and N 1 (u ) jumps to 1 at the strength level ub causing the break of the fibre, provided I 1 (u b ) = 1 .
241
Sborník konference REQUEST'06
2.1 The model for bundle of fibres Let us consider a bundle composed from m fibres. Let us assume, that the survival of fibres is described by independent identically distributed random variables U j , j = 1,...m , with distribution given by f (u ) , F (u ) , h(u ) , H (u ) respectively. Now, we assume that at each moment the applied load is distributed equally among surviving (unbroken) fibres. Observed data has following structure: Let us imagine that the breaks of fibres occurred for three ‘global’ tensile strengths affecting the bundle, 0 < s1 < s 2 < s 3 < S max , that on levels s1, s2 the numbers k1, k2 of fibres broke and, finally, remaining k3 fibres broke on level s3, with k1 + k 2 + k 3 = m . Therefore, just before the first break the strength stretching each fibre was u1 = s1 / m , while
at the moment of the second break it was u 2 = s 2 / (m − k1 ) (naturally affecting only m − k1 remaining fibres) and at the moment of the last break this ‘individual’ strength affecting the last m − k1 − k 2 fibres
was u 3 = s 3 / (m − k1 − k 2 ) = s3 / k 3 . As regards the ‘observed’ breaks (i.e. the breaks caused by a known strength), we actually observed only three, caused by u1, u2 and u3, respectively. Other breaks were caused by unknown (unobserved) strengths from intervals (u1 , u1 = s1 / (m − k1 + 1)), (u 2 , u 2 = s 2 / (m − k1 − k 2 + 1)) and (u 3 , u 3 = s 3 ) ,
respectively
for
k1 − 1, k 2 − 1, k 3 − 1
fibres.
Moreover, if k1 (or k2, or k3)>1, we do not know the order in which the fibres broke. We can assume that the maximal strength Smax is sufficiently large (e.g. Smax > S.m) in order not to terminate experiments too early. Taking into account the assumption that the probability distributions of Uj are continuous, and then there cannot be two breaks at the same level of tensile strength. In other words, fibres break one after another, not simultaneously (though we do not know their order). Then the intervals of breaking strengths can be specified even more precisely than (u k , u k ) above. However, as it has been said, we do not intend to use the information about interval-censored strength values. That is why we are not going to discuss this aspect here.
242
A. Linka, M. Tunák, P. Volf: Stochastic simulation of deformation in fabrics ...
(a)
(b)
Figure 1. (a) Process N(u) of observed breaks and Nstar(u), (b) process I(u) of fibres in risk.
2.2 Estimation of cumulated hazard rate The first objective is to propose an estimator of cumulative hazard function H (u ) of distribution of breaking strength of one bundle. Let us consider that n ‘identical’ and independent bundles are tested. Denote by Uij random variables (survivals), N ij (u ) , I ij (u ) related individual counting and identificator processes for j-th fibre of i-th bundle ( j = 1,2,..., m, i = 1,2,..., n ) . Further, denote m
m
n
n
j =1
j =1
i =1
i =1
N i (u ) = ∑ N ij (u ), I i (u ) = ∑ I ij (u ), N (u ) = ∑ N i (u ), I (u ) = ∑ I i (u ). Based on those data, the most common estimator of cumulative hazard function, namely the Nelson-Aalen one, can be constructed: u ) dN (v ) , H n (u ) = ∫ I (v ) 0
where we set 0 / 0 = 0 . It is seen that the ability of the estimator to approximate well the ‘true’ H (t ) depends on the identificator process, i.e. on observability of counting processes for all values of strength u in the interval of interest [0, S ] . More details on properties of this estimator in considered case can be found in [5].
243
Sborník konference REQUEST'06
2.3 Distribution of breaking strength Let us now consider the ‘reverse’ problem. Namely, let us assume that we know the characteristics of survival distribution of individual fibres and our aim is to derive these characteristics for the whole bundle composed from m identical (and independent) fibres. More precisely, the question is how to estimate or compute the probability that the bundle will not survive the strength s? Let this probability be given by the distribution function FR (s ) = P(R < s ) , where R is the random variable describing the survival of the bundle. If we denote by U (1) < U ( 2 ) < ... < U ( m ) the order statistics created from U 1 , U 2 ,...U m , then evidently,
⎧m −1 s ⎫ P ( R < s ) = ⎨I U ( k ) < ⎬. m−k⎭ ⎩k =0 However, computation is not easy. For instance, for the simplest case we obtain P (R < s ) =
s/2 s s/2 ⎫ ⎧ ⎫ ⎧ s ⎛s⎞ ⎧ ⎫ P ⎨U (1) < , U (2 ) < s ⎬ = 2 ∫ ⎨∫ f (v )dv ⎬ f (u )du = 2⎨ F (s )F ⎜ ⎟ − ∫ F (u ) f (u )du ⎬. 2 ⎝2⎠ 0 ⎩ ⎭ 0 ⎩u ⎭ ⎩ ⎭
Another and a quite simple approach to evaluation of distribution of random variable R consists in the simulation experiments. The following example illustrates such a simulation of survival of the bundle: Example 1 Let us consider the bundle composed from m = 20 fibres and assume that the survival of each fibre (i.e. random variable Uij) has the Weibull distribution, i.e. cumulative hazard function is β
⎛u⎞ H (u ) = ⎜ ⎟ . ⎝θ ⎠ We simulated the breaks of n = 1000 such bundles. The results
observed for one of them are already in Figures 1 (a) and (b). Naturally, the global strength t under which the bundle broke was observed, too. We thus obtained a sample of n = 1000 realizations ti of random variable R - the breaking strength of the bundle. The empirical distribution function
244
A. Linka, M. Tunák, P. Volf: Stochastic simulation of deformation in fabrics ...
) 1 FR (t ) = ∑ I [t i < t ] , n constructed from this sample is displayed in Figure 2 (b). Other empirical characteristics can be easily derived, too. For instance, the estimate of cumulative hazard function is given either as ) − ln 1 − FR (t ) or directly from ordered sample: Let (i) be order of ti
(
)
in t1 , t 2 ,..., t n , then
n ) I [t i < t ] . H R (t ) = ∑ i =1 n − (i ) + 1
It actually is again the Nelson-Aalen estimator.
(a)
(b)
Figure 2. (a) Nelson–Aalen estimator of H(u) and its comparison with the cumulative hazard function of Weibull distribution, (b) empirical distribution function FR(u), estimator of HR(u).
3.
Simulation of a bundle of fibers stretching
While the objective of the preceding part consists in analysing hazard rates of fibres, of the whole bundle, and predicting its survival, the present method is aimed to the simulation of the process of bundle stretching and breaks. The objective is also to select such parameters of simulation algorithm to obtain results
245
Sborník konference REQUEST'06
Figure 3. Development of simulation from initial state to the state with all fibres broken.
Figure 4. Simulated stress – strength curve of 10 C wires.
246
A. Linka, M. Tunák, P. Volf: Stochastic simulation of deformation in fabrics ...
comparable with real cases. Such a comparison is than made through stress-strength curves. For simulation, let us imagine each (horizontal, say) fibre as a set of ‘finite elements’, nodes and arcs. In the simplest case – parallel set of fibres, no vertical connection exists between lines representing individual fibres. Each fibre breaks maximally once, when stretched. In more advanced model we assume a friction between fibres – there is a resistance against shifts of one fibre against another, which actually is also another source of stress, when the whole bundle is stretched. In that case each fibre can break more than once. Moreover, a real yarn is made (twisted) from pieces of fibres, of a random length and beginning, so that fibres are interrupted (it actually gives an effect similar to that of broken fibres sticking together thanks to friction). The random generation proceeds in such a way that the changes of ‘nodes’ are proposed, in horizontal direction only, total stress is the sum of stresses from their extension (as previously) and from friction (e.g. depending linearly on the shift of a fibre with respect to neighbouring ones). If total stress exceeds a certain (again randomised) level, the fibre breaks. Figure 3 shows one such simulated experiment, while Figure 4 displays corresponding stressstrength curve.
4.
Simulations of a defect snag in a plain weave
Figure 5 shows a grid consisting of a set of nodes (representing interlacing points) and flexible arcs, a simple model of fabric in a plain weave. Defect snag appears as the picks displaced out of alignment and sometimes also jammed, a lumpy fault occurs with locally displaced lines of weft yarns, i.e. the picks are not in alignment. The offending warp yarn is either broken or at least highly tensioned. Similarly, a defect hole appears as a several absent yarns varying in form and size. These defects can arise when one or more picks are snagged on a rough or knotted warp and are displaced or broken. We assume that direction of stress is normal to weft set of yarns and borders of simulated grid are held. Stress is redistributed through grid, causes extensions and stresses in grid arcs. When it exceeds a certain (randomised) level, the arc breaks. Additionally, we consider also changes of angles of arcs
247
Sborník konference REQUEST'06
connecting grid nodes and assume that when angle exceeds its critical magnitude, corresponding arc ‘breaks’, too. Different combinations of stress caused by change of length of arcs and by change of their angles, together with critical levels for breaks, enable us to generate cases corresponding to various real situations, different types of strain, and materials with different characters.
Figure 5. Simulation example of consequence of vertical pressure, acting from above to central nodes of a grid, and results when the pressure increases gradually.
5. Conclusion In order to study the process of composite reinforcement deformation we have proposed Monte Carlo experiments simulating the influence of stress to a simplified model of composite reinforcement structure. We examined both the deformation of the fabrics as well as the process of extension and breaks of its fibres. Numerical results were obtained with the help of Markov chain Monte Carlo computation, where joint combined distribution of grid node and grid arc was modelled as Gibbs distribution (Gibbs
248
A. Linka, M. Tunák, P. Volf: Stochastic simulation of deformation in fabrics ...
random field) of a special form. It was shown that a proper adjustment of procedure parameters could yield the results comparable with real cases.
References [1]
[2]
[3]
[4]
[5]
Belyaev Yu. K. and Rydén P., “Non-parametric estimators of the distribution of tensile strengths for wires.” Research report, (1997), University of Umea. Crowder M. J., Kimber A. C, Smith R. L. and Sweeting T. L., Statistical Analysis of Reliability Data. Chapman and Hall, London 1991. Harthelius K., Carstensen J. M., Bayesian grid matching. IEEE Transaction on Pattern Analysis and Machine Intelligence 25, 162-173, 2003. Sutherland L.S., Guedes Soares C., Review of probabilistic models of the strength of composite materials, Reliability Engineering and System Safety 56, 183-196, 1997. Volf P., Linka A., On Reliability of System Composed of Parallel units subject to increasing load. International Journal of Reliability, Quality and Safety Engineering 7, No.4, 271-284, 2000.
Author´s address: Doc. RNDr. Aleš Linka, CSc. Technical University in Liberec, Department of Textile Materials; Hálkova 6, Liberec 46117, Czech Republic, e-mail:
[email protected] Ing. Maroš Tunák, Technical University in Liberec, Department of Textile Materials; Hálkova 6, Liberec 46117, Czech Republic, e-mail:
[email protected] Doc. RNDr. Petr Volf, CSc., Ústav teorie informace a automatizace AV ČR, Oddělení stochastické informatiky, Pod vodárenskou věží 4, 182 08 Praha 8 e-mail:
[email protected] Acknowledgements: The work was supported by the Czech Science Foundation under grant No. 106/03/H150 and by the project of MSMT CR No. 1M06047.
249
Rozdíl rizik zbytečného signálu v regulačním diagramu (I,MR) a (xbar,R) Bohumil Maroš
1. Úvod Regulační diagram je nejefektivnější nástroj pro identifikaci stability, resp. nestability procesu. Vhodně zvolené regulační diagramy pomohou rozhodnout, kdy je vhodná chvíle pro zásah do procesu (seřízení, kontrola vstupní suroviny, přeškolení operátorů …). A naopak zabraňují předčasnému a často škodlivému zásahu. Regulační diagramy představují preventivní přístup k řízení procesů. S jejich pomocí často identifikujeme změnu procesu ještě před tím, než by začaly vznikat neshody. Cílem regulačních diagramů je stabilizovat kolísání procesu a zmenšovat jeho variabilitu tím, že identifikujeme nenáhodné příčiny. Tyto pak můžeme odstranit, nebo alespoň omezit jejich vliv na proces. Pokud budou na proces působit pouze náhodné vlivy, pak je proces stabilizován. Znamená to, že je pak predikovatelný. Nestabilní, a tudíž nepředvídatelné procesy, jsou drahé. Základním předpokladem pro použití klasických Shewhartových regulačních diagramů je předpoklad normálního rozdělení a nekorelovanosti naměřených hodnot z procesu. Častým způsobem aplikace je, že se zvolí při sběru dat rozsah podskupiny n=1 až n=15 a po záznamu k=25 až k=30 podskupin se provede výpočet regulačních mezí pro aritmetický průměr x a rozpětí R. Většinou se volí regulační diagram při použití regulačních mezí pro 3 , tzn. při znalosti a , pro pravděpodobnost zbytečného signálu (chybu I. druhu) =0,0027. Sledovat tuto pravděpodobnost lze pomocí hodnoty průměrného počtu bodů v regulačním diagramu, kdy narazíme na bod, jenž je mimo regulační meze. Tato hodnota se označuje ARL (Average Run Length). Jestliže pozorované hodnoty procesu jsou nekorelované, pak platí jednoduchý vztah pro teoretickou hodnotu 1 1 (1) ARL 0 = = =& 370 . α 0,0027
250
B. Maroš: Rozdíl rizik zbytečného signálu v regulačním diagramu (I,MR) a (xbar,R).
Znamená to, že stabilní proces bude v regulačním diagramu průměrně po 370 podskupinách vykazovat bod mimo regulační meze. Hodnotu 370 musíme brát opatrně, poněvadž náhodná proměnná x=RL, tj. počet bodů (podskupin) za sebou ležících uvnitř regulačních mezí v regulačním diagramu, má geometrické rozdělení s monotónně klesající pravděpodobnostní funkcí x (2) p( x) = p(1 − p) , x = 0, 1, 2, K a parametrem p = α. Směrodatná odchylka σ tohoto rozdělení je přibližně rovna střední hodnotě µ pro malé hodnoty pravděpodobnosti p: 1− p 1 1 (3) µ= , σ= =& . p p p V našem případě je µ =& σ =& 370 . Znamená to, že hodnoty RL velmi hodně kolísají kolem své střední hodnoty. A navíc, geometrické rozdělení je silně nesymetrické rozdělení, což má za následek fakt, že průměrná hodnota není nejlepším reprezentantem náhodné proměnné (lepší by byl medián, jenž má hodnotu 256). Průměr má však v tomto případě jednu důležitou vlastnost, a to tu, že existuje jednoduchý vztah (1) mezi rizikem zbytečného signálu α a průměrnou hodnotou ARL. V regulačním diagramu však při použití regulačních mezí pro 3 σ není pravděpodobnost zbytečného signálu ve skutečnosti rovna vždy přesně teoretické hodnotě 0.0027. Záleží nejen na tom, jestli je splněn předpoklad normálního rozdělení, ale též na dalších okolnostech. Jak se však mění hodnota pravděpodobnosti α, jestliže • podskupina má n=1, tzn. počítáme s individuálními hodnotami • podskupina, z níž počítáme aritmetický průměr x , má jiný rozsah než obvyklých 5, • počet podskupin, z nichž se počítají regulační meze, bude jiný než k=25 či 30? Na všechny tyto otázky se pokusíme dát odpověď. Odpověď nebude jednoduchá, protože se mohou prolínat navzájem všechny naznačené možnosti. Abychom pronikli hlouběji do podstaty věci, musíme být schopni vždy identifikovat, která z možností nastala či kterou jsme použili. A právě k tomu nám bude sloužit dosti silný simulační nástroj – metoda Monte Carlo.
251
Sborník konference REQUEST'06
2.
Aplikace metody Monte Carlo
Nejdříve si musíme ujasnit, co chceme simulovat. Chceme simulovat proces, který bude mít předem dané statistické rozdělení - normální. Velikost podskupiny, z níž počítáme aritmetický průměr x , bude mít postupně rozsah n=1, n=3, n=5, n=10. Pomocí regulačního diagramu (I, MR), tzn. individuálních hodnot a klouzavého rozpětí, resp. ( x , R), chceme dlouhodobě sledovat výrobní proces, přičemž regulační meze se vypočtou z prvních k podskupin dat sledovaného procesu. Většinou se doporučuje volit k=25 až 30. V naší simulaci budeme volit hodnoty k od k=20 až do k=100. po 5 a pak od k=100 do k=1000 po 100. Jinými slovy, budeme sledovat, jaký má vliv na velikost pravděpodobnosti zbytečného signálu α skutečnost, že regulační meze jsme nechali (pro stejná data) vypočíst z prvních k=20, nebo k=25, nebo k=30, atd. počtu podskupin procesu. Abychom dostali věrohodné výsledky, bylo pro jednu zvolenou hodnotu n vygenerováno s daným rozdělením 20 000 n-členných skupin dat. Pro takto získaná data se postupně pro jednotlivé hodnoty k vypočetly příslušné regulační meze a pomocí těchto regulačních mezí se zjišťovalo, kolikrát v celkem 20 000 bodech regulačního diagramu se vyskytnou hodnoty mimo regulační diagram (zvlášť pro x či x a zvlášť pro R či MR). To znamená, že pro různé hodnoty k se zjistily vždy jiné počty přesahu bodů vně regulačního diagramu. Tento postup se opakoval vždy celkem 300krát a pak se určil průměrný počet ARL (již nikoliv teoretický) výskytu sledovaných parametrů ( x či x a R nebo MR) mimo regulační meze. Náhodná veličina RL má směrodatnou odchylku i střední hodnotu podle (3) přibližně 370, a proto průměrná hodnota RL z 20 000 podskupin má směrodatnou odchylku přibližně (jestliže =0,0027)
.
s ARL =
σ RL 20000
µ RL
=
370 370 =& =& 50 ,3 . 20000 54 370
Průměrné hodnoty ze 300 veličin již vykazují normální rozdělení, takže 95%-ní interval spolehlivosti pro ARL je přibližně (za předpokladu =0,0027, tzn. pro vysoké hodnoty k) . 1,968 ARL ± 50,3 =& ARL ± 5,7 299
252
B. Maroš: Rozdíl rizik zbytečného signálu v regulačním diagramu (I,MR) a (xbar,R).
Intervaly spolehlivosti pro ARL se liší nejen pro zvolenou hodnotu k, či pro zvolený rozsah podskupiny n, ale i pro x či rozpětí. Pro každou vybranou hodnotu n (rozsah podskupiny) se určila (pro všechny výše stanovené hodnoty parametru k) příslušná přibližná hodnota pravděpodobnosti zbytečného signálu α =
1 . ARL
Simulací se zjistilo, že směrodatné odchylky průměrné hodnoty α z 20 000 podskupin při 300 násobném opakování se též liší. Jestliže 95%-ní interval spolehlivosti pro průměrnou hodnotu α zapíšeme ve tvaru α ±∆ , (4) tak průměrné hodnoty α pro všechna k se pohybovaly v intervalu od 0,00006 do 0,00041. 3.
Nelineární model
Ze získaných údajů metodou Monte Carlo se ještě pomocí nelineárních optimalizačních iteračních postupů našel empirický model, který umožňuje pro vybraná n vypočíst hodnotu α v závislosti na hodnotě k. Tyto modely mají stejný tvar
α (n, k ) = (b0 + b1 k b
2
)
b3
+ b4
(5)
a liší se regresními konstantami b i , i=0, 1,…, 4 pro různá n, dále podle toho, zda se model týká individuálních hodnot x, nebo aritmetického průměru x , rozpětí R či klouzavého rozpětí MR. Poněvadž grafy všech těchto závislostí jsou ryze monotónně klesající funkce, tak konstanta b 4 ukazuje na hodnotu, k níž se hodnota zbytečného signálu α asymptoticky blíží pro velké hodnoty k. Metodou Monte Carlo a optimalizačními iteračními postupy byly získány tyto hodnoty regresních koeficientů pro nelineární model (5):
253
Sborník konference REQUEST'06
n=1 x
n=3 MR
n=5
n=10
b0
9869,5
R x x x 1248,0 24,7193 10,3328 -300,477 -43,1886 99,4633 72,2512
b1
0,5114
1,2410 15,5615 7,9983
74,3558 19,3510
8,7226 19,0101
b2
4,5089
3,5810
1,0620
1,6683
0,8989
1,1647
b3
-0,3359 -0,3658 -0,9131 -1,0374
-0,6967
-1,1164
-1,1501 -1,0379
0,0027
0,0046
0,0027
b 4 0,00274 0,0098
4.
R
1,2382 0,0027
0,0058
R
1,0792 0,0043
Průběhy chyb zbytečného signálu
Podívejme se nyní na průběhy chyby zbytečného signálu α v závislosti na počtu podskupin k, z nichž se vypočtou regulační meze příslušného regulačního diagramu. Protože při analýze regulačních diagramů se má nejdříve posuzovat diagram pro variabilitu, nejdříve se podíváme na průběh hodnot chyby zbytečného signálu pro rozpětí. Jsou zde uvedeny dva pohledy na tyto průběhy: jeden celkový (i pro vysoké hodnoty k), aby bylo vidět, ke které hodnotě se chyby asymptoticky blíží a druhý detailní (pro k<50), aby se dala z grafu odečíst hodnota chyby zbytečného signálu pro běžně používané hodnoty k=25 či k=30. V následujících dvou grafech je znázorněna chyba α pro individuální hodnoty x z diagramu (I, MR) a pro aritmetický průměr x , jestliže rozsahy podskupin jsou n=3, 5, 10 – opět v celkovém pohledu a v detailu. 5. Závěr Z grafů můžeme přibližně zjistit velikosti hodnot α, resp. je můžeme vypočíst ze vztahu (5) pro hodnoty k a n. V následující tabulce jsou pro vybrané hodnoty k vypočteny:
n=1
n=3 n=5 n=10
k = 25 x MR 0,012 0,023 R x 0,005 0,009 0,004 0,006 0,004 0,005
Hodnoty rizika zbytečného signálu k = 30 k = 100 k = 500 x MR x MR x MR 0,010 0,021 0,0039 0,0120 0,0028 0,0101 R R R x x x 0,004 0,008 0,0031 0,0065 0,0028 0,0059 0,004 0,006 0,0030 0,0050 0,0028 0,0047 0,003 0,005 0,0029 0,0045 0,0028 0,0043
254
k = 1000 x MR 0,0028 0,0099 R x 0,0027 0,0058 0,0028 0,0046 0,0028 0,0043
B. Maroš: Rozdíl rizik zbytečného signálu v regulačním diagramu (I,MR) a (xbar,R).
α 0.025
0.02
0.015
n=1
0.01
n=3
0.005
0,0027 200
400
600
k
800
1000
Obr. 1: Závislost rizika α na velikosti počtu podskupin k pro n=1, 3, 5, 10 pro rozpětí
α
n=1
0.025
0.02
0.015
0.01
n=3
0.005
n=5 n=10 0,0027 15
20
25
30
35
40
Obr. 2: Detail předchozího grafu
255
45
k
50
Sborník konference REQUEST'06
α
n=1 0,0027
k
Obr. 3: Závislost rizika α na velikosti počtu podskupin k pro n=1, 3, 5, 10 pro x či x
α
n=1
n=3 0,0027
k
Obr. 4: Detail předchozího grafu
256
B. Maroš: Rozdíl rizik zbytečného signálu v regulačním diagramu (I,MR) a (xbar,R).
Z grafů i tabulky je vidět, že pro normálně rozdělené pozorované hodnoty je chyba I. druhu pro variabilitu vždy větší než pro hodnoty x či x . Navíc, hodnoty rizika α u variability se ani neblíží k teoretické hodnotě 0,0027 pro velké hodnoty k. Regulační diagram pro individuální hodnoty (I, MR) je vhodný jen tehdy, když se regulační meze určí minimálně z k=100 hodnot. Pokud použijeme méně měření, pak riskujeme velký nárůst zbytečných signálů, které nemusejí odpovídat vymezitelným příčinám ve sledovaném procesu. Tento fakt má ovšem ten následek, že můžeme do stabilního procesu zbytečně zasahovat. Tato záležitost bývá často bagatelizována s poukazem na to, že u tohoto typu se neztrácejí informace o konkrétních pozorovaných hodnotách jako u diagramů ( x , R).
. Literatura [1] Montgomery D. C.: Introduction to Statistical Quality Control, 4th edition, John Wiley&Sons, New York 2001 [2] Tošenovský J., Noskievičová D.: Statistické metody pro zlepšování jakosti, Montanex a.s., Ostrava 2000 [3] Bazaraa, M.S.: Nonlinear Programming, John Wiley&Sons, New York 1992 [4] Wheeler,D.J.: Advanced Topics in Statistical Process Control, Statistical Process Control, Inc., Knoxville 1995 [5] Maroš,B.: Riziko zbytečného signálu v regulačním diagramu, Sborník konference 2. statistické dny, Hradec Králové 2004 [6] Maroš,B.-Trávníček,T.: Nedodržení předpokladu normality v regulačních diagramech, článek ve sborníku, Brno 2005 Adresa autora: Doc. RNDr. Bohumil Maroš, CSc. , Vysoké učení technické v Brně, Fakulta strojního inženýrství, Ústav matematiky, Technická 2, 616 69 Brno e-mail:
[email protected] Tato práce byla vytvořena za podpory projektu MŠMT 1M06047 - CQR
257
Určení kovarianční struktury výstupního procesu systému GI|G|1 Martin Meca Úvod Při zkoumání stochastických modelů systémů hromadné obsluhy bylo věnováno nemalé úsilí studiu výstupního procesu, který tvoří po sobě jdoucí doby mezi odchody zákazníků. Důvodem je hlavně modelování složitějších systémů, tzv. sítí hromadné obsluhy, kdy výstupní proces z jednoho obslužného místa je současně vstupním procesem jiného. Nejdříve byl studován výstupní proces systému M|M|1, v roce 1956 P. J. Burke dokázal. že výstupní proces takovéhoto systému je Poissonův proces se stejnými parametry jako vstupní proces, tj. doby mezi odchody zákazníků jsou vzájemně nezávislé a mají stejné exponencialní rozdělení jako doby mezi příchody zákazníků. Naneštěstí se později ukázalo, že toto je jediný systém s jedním obslužným místem, u něhož můžeme počítat s nezávislostí po sobě jdoucích dob mezi odchody zákazníků. Protože v roce 1959 P. D. Finch dokázal, že výstupní proces systému M|G|1 tvoří proces obnovy právě tehdy, když má doba obsluhy exponenciální rozdělení a konečně v roce 1968 D. J. Daley dokázal, že výstupní proces systému GI|M|1 tvoří proces obnovy právě tehdy, když vstupní proces je Poissonův proces. Navíc se ukazuje, že výpočet analytického vyjádření konečněrozměrných sdružených rozdělení výstupního procesu nebo jeho korelační funkce je i u nejjednodušších systémů (nepočítaje M|M|1) natolik složitý, že je v praxi nerealizovatelný.
Numerický výpočet kovarianční funkce Zajímavou myšlenku, jak určit přibližně korelační strukturu výstupního procesu, publikoval v roce 1994 J.-Q. Hu, který po přidání parametru měřítka do doby obsluhy spočítal McLaurinovy rozvoje
258
M. Meca: Určení kovarianční struktury výstupního procesu systému GI/G/1.
kovariancí po sobě jdoucích dob mezi odchody zákazníků ze stabilizovaného systému. Označme následující náhodné veličiny:
An - doba mezi příchody n-tého a n + 1-ního zákazníka S n - doba obsluhy n-tého zákazníka Tn - doba strávená n-tým zákazníkem v systému Wn - doba čekání n-tého zákazníka ve frontě Dn - doba mezi odchodem n-tého a n + 1-ního zákazníka ze systému Protože předpokládáme, že je systém stabilizovaný, veličiny An nezávisí na čase a mají tedy všechny stejné rozdělení, řekněme jako náhodná veličina A = d An . Obdobně definujme náhodné veličiny
S = d S n , T = d Tn , W = d Wn a D = d Dn ( = d symbolizuje rovnost v distribuci). Dále budeme počítat s dobou obsluhy θ ⋅ S , θ ≥ 0 . Tato
parametrizace způsobí, že momenty všech výše uvedených náhodných veličin, kromě momentů dob mezi příchody zákazníků ( A, A1 , A2 ,K ) budou funkcemi θ. Můžeme se je tedy pokusit pro θ ≥ 0 rozvinout v mocninnou řadu se středem v bodě θ = 0 . Po zpětném dosazení θ = 1 dostanu řadu, jejímž součtem bude původně hledaný moment. Prvním krokem je nalezení rozvojů pro +∞ ET k = ∑ t kmθ m , k! m =0
EW k +∞ = ∑ wkmθ m , k! m =0
Koeficienty těchto rozvojů jsou m
t km = β k
m≤k,
wkm = 0
m=k,
wkm =
m − k −1
∑α j =0
k
t km = ∑ β k − j w j ,m − k + j
m>k,
j =1
kde jsme označili
ES k k! α j = f ( j ) (0 + )
βk =
θ ≥ 0 a k ∈N
k = 0,1, K , j = 0,1, K ,
a f je hustota náhodné veličiny A.
259
t
j k + j +1, m
m>k,
Sborník konference REQUEST'06
Protože
při
t km
výpočtu
potřebuji
wij
pro
í = 1, K , k
a
j = m − k + 1, K , m a při výpočtu wkm potřebuji t ij pro i = k + 1, K , m a j = m , musím tyto koeficienty počítat v pořadí: t11 , t 22 , w12 , t12 , t 33 , w23 , t 23 , w13 , t13 , K , t ii , wi −1,i , t i −1,i , K , w1i , t1i , K Dalším krokem je nalezení rozvojů pro +∞ ET1T2k (12 ) m = ∑ t km θ , k! m =0
+∞ EA1T2k (12 ) m = ∑ a km θ , θ ≥ 0 a k ∈N, k! m =0
jejichž koeficienty jsou (12 ) t km =0
m≤k k
m−k −2
i =1
j =0
(12 ) t km = β k t1,m − k + ∑ β k −i
∑ α (i + j + 2) ⋅ t j
i + j + 2,m − k +i
(12 ) a km =0
m>k
m < k a m = k +1 k
m−k −2
i =1
j =0
(12 ) a km = EA ⋅ β k + ∑ β k −i
∑ α ( j + 1) ⋅ t j
i + j + 2, m −k +i
m = k a m > k +1
Obdobně můžeme spočítat koeficienty rozvojů +∞ +∞ ET1Tnk EA1Tnk (1n ) m (1n ) m = ∑ t km θ , = ∑ a km θ , k! k! m =0 m =0
θ ≥ 0, k ∈N a n > 2
a dostaneme (1n ) t km =0
m≤k k
m−k −2
i =1
j =0
(1n ) t km = β k t1,m − k + ∑ β k −i
∑α
(1, n −1) j i + j +1, m − k + i
t
(1n ) a km =0
m>k m
k
(1n ) a km = EA ⋅ β k + ∑ β k −i
m − k −1
i =1
∑α j =0
j
ai(+1,nj +−11,)m − k +i
Nyní již jednoduše dopočítáme koeficienty rozvojů funkcí +∞
cov(D1 , Dn ) = ∑ d 1(m1n )θ m m =0
260
m≥k
M. Meca: Určení kovarianční struktury výstupního procesu systému GI/G/1.
Protože platí pro n ≥ 2
cov(D1 , Dn ) = cov( A1 + T2 − T1 , An + Tn +1 − Tn ) = cov( A1 , Tn +1 ) − cov( A1 , Tn ) + 2 cov(T1 , Tn ) − cov(T1 , Tn −1 ) − cov(T1 , Tn +1 ) = EA1Tn +1 − EA1Tn + 2 ET1Tn − ET1Tn −1 − ET1Tn +1
dostaneme
) (12 ) (12 ) (13 ) d 1(m12 ) = a1(13 m − a1m + 2t1m − 2t 2 m − t1m
d 1(m1n ) = a1(1m,n +1) − a1(1mn ) + 2t1(1mn ) − t1(1m, n −1) − t1(1m, n +1)
n>2
Výše uvedená procedura předpokládá, že doba obsluhy má všechny momenty konečné a navíc platí ES k ≤ k!⋅c k , kde c > 0 je konstanta a navíc, že hustota doby mezi příchody zákazníků se dá rozvinout v mocninnou řadu pro x ∈ 0; x0 , x0 > 0 se středem v bodě 0. Obě podmínky splňují například PH rozdělení anebo konstantní rozdělení. Naopak první podmínku nesplňuje logaritmicko-normální rozdělení anebo Weibullovo rozdělení s parametrem 0 < β < 1 . Další nevýhodou je určitě vysoká algoritmická i paměťová náročnost výpočtu a hlavně špatná kontrola chyby aproximace, protože v praxi sčítáme pouze několik prvních členů rozvoje.
Určení kovarianční funkce pomocí simulace Mnohdy rychlejší metodou pro určení kovarianční funkce procesu, tvořeného po sobě jdoucími dobami mezi odchody zákazníků ze stabilizovaného systému, je použití simulace. Necháme virtuálně běžet zkoumaný systém hromadné obsluhy a po odchodu předem stanoveného zákazníka začneme zaznamenávat doby mezi odchody zákazníků D1 , D2 , K , Dm . Poté kovariance cov(D1 , D1+ n ) odhadneme pomocí výběrových kovariancí
1 m−n ⎡ 1 m−n ⎤ Di Di + n − ⎢ ∑ ∑ Di ⎥ m − n i =1 ⎣ m − n i =1 ⎦
2
1≤ n < m
n by ovšem v praxi mělo být mnohem menší než m. V příloze je vyobrazen algoritmus simulace dob mezi odchody zákazníků ze systému s jedním obslužným místem. Zaznamenává doby mezi odchody zákazníků do pole Di, i = 1,2,K, n2 − n1 , přičemž
první hodnota je zaznamenána po odchodu n1 + 1 - ního zákazníka a
261
Sborník konference REQUEST'06
simulace se ukončí po odchodu n 2 - tého zákazníka. Číslo n1 bychom měli volit tak, že systém je po odchodu n1 + 1 - ního zákazníka již stabilizován. Významy dalších proměnných jsou: Q k T A S konec
aktuální počet zákazníků v systému počet obsloužených zákazníků akumulovaná doba do odchodu dalšího zákazníka aktuální doba do příchodu dalšího zákazníka aktuální doba do ukončení obsluhy zákazníka indikátor ukončení simulace
Dále algoritmus obsahuje dvě funkce: generA vrací realizaci doby mezi příchody zákazníků (náhodná veličina A) generS vrací realizaci doby obsluhy (náhodná veličina S)
Některé numerické výsledky V následujících příkladech bylo počítáno prvních pět členů kovarianční funkce výstupního procesu a to jak metodou McLaurinova rozvoje, tak odhadem ze simulace. Při použití první metody bylo vždy sečteno prvních 25 členů řady, u simulací se zaznamenávaly odchody 5000-tého až 100 000-tého zákazníka..
cov(D1 , Dn ) pro A ~ Exp(1) , S ~ Exp(2) n McLaurinův rozvoj simulace
2 0 -0.0057
3 0 0.0001
4 0 -0.0002
5 0 0.0002
6 0 -0.0023
5 0.0094 0.0112
6 0.0062 0.0057
cov(D1 , Dn ) pro A ~ Exp(1) , S ~ Const (0.5) n McLaurinův rozvoj simulace
2 0.0533 0.0530
3 0.0259 0.0206
4 0.0150 0.0149
cov(D1 , Dn ) pro A ~ Exp(0.5) , S ~ LN (0,1) N McLaurinův rozvoj simulace
2 0.001⋅10108
3 -0.02⋅10108
4 0.24⋅10108
5 -1.7⋅10108
6 8.5⋅10108
-0.0027
-0.0217
-0.0167
-0.0118
-0.0226
262
M. Meca: Určení kovarianční struktury výstupního procesu systému GI/G/1.
T = 0, Q = 0, k = 0, konec = 0, A = generA
− odchod Q = 0 || A ≤ S + příchod Q = Q + 1, T = T + A −
Q = Q – 1, T = T + S, k = k + 1
− Q>1
k > n1 +
+
S=S-A
Dk – n1 = T
A = generA
A = A – S, T = 0
− Q>0 + S = generS
− k = n2 + konec = 1
− konec = 1 +
Obr. 1: Algoritmus simulace systému hromadné obsluhy s jedním obslužným místem
263
Sborník konference REQUEST'06
Závěr V prvním případě se podařilo pomocí McLaurinova rozvoje spočítat prvních pět kovariancí výstupního procesu ze systému M|M|1 s přesností odpovídající fyzické přesnosti čísel s pohyblivou řádovou čárkou a pomocí simulace s přesností na dvě desetinná místa. Ve druhém případě již nemůžeme jednoduše číselné výsledky zkontrolovat podle teorie, nicméně i zde se hodnoty spočítané oběma metodami, s přihlédnutím k náhodné chybě, shodují. Ovšem ve třetím přikladu vidíme, že nesplnění postačující podmínky pro momenty logaritmicko-normální rozdělení může mít zásadní vliv na konvergenci McLaurinova rozvoje kovariancí. V takovém případě jediným možným způsobem, jak zjistit numerické hodnoty kovariancí, zůstává odhad ze simulace.
Literatura [1]
[2] [3]
Reynolds J. F.: The Covariance Structure of Queues and Related Processes – a Survey of Recent Work, Adv. Appl. Prob. 7, 383-415 (1975) Hu J. Q.: The Departure Process of the GI|G|1 Queue and its MacLaurin Series, Op. res. 5, 810-815 (1996) Devroye L.: Non-Uniform Random Variate Generation, SpringerVerlag 1986
Adresa autora: Ing. Martin Meca, České vysoké učení technické v Praze, Fakulta strojní, Ústav technické matematiky, Karlovo nám. 13, 121 35 Praha 2 e-mail:
[email protected] Tato práce byla vytvořena v rámci projektu MŠMT 1M06047 - CQR
264
Jak správně interpretovat ukazatele způsobilosti a výkonnosti výrobního procesu Jiří Michálek
Ukazatele způsobilosti a výkonnosti Cp, Cpk, Pp, Ppk byly zavedeny ve snaze popsat stav výrobního procesu, resp. chování sledovaného znaku jakosti, pomocí několika čísel bezrozměrného charakteru. Zadáním těchto čísel se vlastně vyjadřuje požadavek na stav procesu, aby očekávaný počet neshodných výrobků odpovídal požadovanému počtu a aby proces byl ve stabilizovaném stavu, tzn. pro praxi v téměř stavu neměnícím se v průběhu času. Nejdříve, asi před 20-25 lety; byly zavedeny do praxe ukazatele způsobilosti Cp, Cpk, jejichž použití vyžaduje po sledovaném znaku jakosti, aby mohl být popsán normálním rozdělením N(µ,σ2), kde µ, je parametr polohy a σ2 je rozptyl sledovaného znaku. Pro úplnost, zde je jejich vzorec
Cp =
USL − LSL , 6σ
⎛ USL − µ µ − LSL ⎞ ⎟. Cpk = ⎜⎜ , 3 σ ⎟⎠ ⎝ 3σ
Jejich zadáním se zcela jednoznačně určuje, jaká má být úroveň tzv. inherentní variability znaku jakosti a dvojrozměrná poloha; tj. střední hodnota sledovaného znaku jakosti, neboť z obou ukazatelů vyplývá pouze míra necentrování procesu od průměru specifikačních mezí, nikoliv to, zdali střední hodnota má být napravo či nalevo od tohoto průměru. Lze tedy zadání dvojice Cp , Cpk chápat tak, že střední hodnota jakostního znaku se muže pohybovat těmito dvěma krajními polohami, aniž by se hodnota Cpk, zmenšovala, protože vždy musí být Cp ≥ Cpk, přičemž rovnost nastává jedině tehdy, když proces je přesně centrován na prostředek specifikačního rozmezí. První problém, se kterým se lze v praxi setkat, je již stanovení hodnot pro Cp a Cpk od konstruktérů či odběratelů produktů z procesu. Mnohdy bohužel tyto hodnoty jsou velice přísné, takže výrobce není schopen se stávající technologií tyto požadavky splnit, protože to mnohdy jednoduše vůbec nejde. Tento problém se často vyskytuje na,př. u plastových výrobků, kde se objevuje druhý problém, a to jak přesně
265
Sborník konference REQUEST'06
získat hodnoty sledovaného znaku jakosti. Stanovení požadavků na Cp a Cpk je jedna strana mince, ale otázka, zdali je vůbec schopen výrobní proces toto splnit, je strana druhá. Aby bylo možno obě strany porovnat. musíme z procesu odebrat nějaké produkty, ty přeměřit a získaná data použít pro zjištění způsobilosti našeho procesu. A to jo třetí problém, protože jsme nuceni zpracovat pouze dílčí informaci obsaženou v odebraných produktech, i kdyby produktů byly tisícovky. Aby nástroje matematické statistiky byly využity adekvátně, je nutno respektovat Splnění některých předpokladů. Je to především normalita získaných dat, kterou je možno ověřit pomocí testů dobré shody a stabilita procesu, což znamená poloha procesu µ (tj. střední hodnota sledovaného znaku) se v čase nemění a rovněž tak i úroveň variability σ2 lze považovat za stálou v čase. Takovému stavu říkáme, že proces je statisticky zvládnut, což je stav, kterého je možno dosáhnout hlavně aplikací regulačních diagramů. Tento stav je nutný proto, abychom mohli spolehlivě odhadnout parametr polohy procesu µ, nejčastěji pomocí aritmetického průměru či výběrového mediánu, a rovněž tak úroveň variability σ2, obvykle pomocí výběrového rozpětí R či výběrové směrodatné odchylky s. Dalším problémem je organizace sběru dat; tj. jak často, zdali jednotlivě či ve skupinách a kolik dat budeme potřebovat pro hodnocení způsobilosti procesu. Některé postupy lze najít v literatuře, např. VDA 4.1. kde se hodnotí způsobilost strojního zařízení. pak předběžná způsobilost v simulování hromadné výroby a pak dlouhodobá při hromadné výrobě, která může zahrnout i několik dní. Měla by být učiněna dohoda mezi výrobcem a odběratelem, který požaduje hodnocení způsobilosti procesu, jak se přesně bude postupovat při sběru dat, protože počet a organizace sběru dat silně ovlivňuje hodnocení způsobilosti procesu, pokud je prováděno správným způsobem. Poučenému odběrateli zdaleka
ˆ je větší nežli požadovaná, hodnota nemůže stačit fakt, že odhad C p
Cp, což je požadavek téměř všude od zákazníků vyžadovaný, protože matematická statistika garantuje, že pokud proces skutečně splňuje požadavek, např. Cp = 1, 33, že přibližně 50 % odhadů tohoto ukazatele je sice nad hodnotou 1,33, ale rovněž druhých 50 % odhadů se musí vyskytovat pod touto hodnotou. Tím, že zákazník požaduje,
266
J. Michálek: Jak správně interpretovat ukazatele způsobilosti výrobního procesu.
ˆ ≥ Cp, nemá vůbec zajištěno; že způsobilost výrobního aby C p procesu je na hodnotě ukazatele Cp, kterou on stanovil.
ˆ či C ˆ sama o sobě nic neříká, Vypočtená hodnota odhadu C p pk
pokud ji nebudeme konfrontovat se stanovenými hodnotami. např. pomocí testování statistických hypotéz. Závěr takového testu silně závisí na stanoveném riziku (tzv. hladině významnosti) a hlavně na počtu dat, s nimiž pracujeme. Pokud jako nulovou hypotézu stanovíme, že proces má být způsobilý např. s Cp = 1,33, stále ještě nezamítnutí této hypotézy proti např. alternativní hypotéze Cp = 1, 50, zdaleka nevylučuje skutečnost, že způsobilost procesu není 1,33, ale jen zhruba 1,25. Pokud mulovou hypotézu zamítneme, jsme na tom s věrohodností závěru obvykle lépe. ale opět úroveň této věrohodnosti závisí na počtu dat. Hodnotit způsobilost procesu např. z pěti údajů, je naprostý hazard jak pro výrobce, tak i pro odběratele. Představme si, že chceme, aby výrobní proces byl nejhůře na úrovni způsobilostí Cp = 1,33, což je velice častý požadavek v automobilovém průmyslu. Pro úplnost to znamená, že při stabilitě střední hodnoty µ na prostředku tolerančního rozpětí se požaduje, aby očekávaná neshodnost výrobků byla na úrovni 60 ppm. Postavme otázku testování způsobilosti takto: nulová hypotéza bude, že Cp < 1,33 a alternativní hypotéza, že Cp > 1,33. Nulovou hypotézou tedy je, že náš proces není způsobilý, alternativou je jeho způsobilost nejhůře na úrovni Cp = 1,33. Abychom hypotézu o nezpůsobilosti zamítli a, měli velikou záruku, že náš proces je způsobilý, musí
ˆ ukazatele CP počítaná např. z 20 podskupin o hodnota odhadu C p
pěti kusech ve skupině při riziku 5 % překročit hodnotu 1,54. U ukazatele Cpk je situace o to komplikovanější, že vstupuje do
ˆ navíc odhad parametru polohy µ. Co se vyžaduje od odhadu C pk
procesu, aby ukazatel Cpk, byl správně chápan? Aplikace tohoto ukazatele vyžaduje nejen, aby úroveň variability byla stálá; ale aby i parametr polohy se v čase neměnil. Jinak totiž nesprávně odhadneme polohu procesu např. pomoci aritmetického průměru ze všech dat. Představme si takovou situaci, kdy během odebírání dat se poloha procesu změnila takovým způsobem (třeba nastavením stroje či použitím jiného materiálu na vstupu procesu), že přibližně polovina dat má parametr polohy
267
Sborník konference REQUEST'06
µ1 =
USL + LSL + δ1 , σ 1 > 0 , 2
µ2 =
USL + LSL −δ2 , σ 2 > 0 , 2
druhá polovina
kde přitom δ1 a δ2 se prakticky neliší. Když spočítáme celkový aritmetický průměr z dat, ten se nebude významně lišit od středu tolerančního rozmezí
USL + LSL , 2 ˆ tím, že ta,to hodnota se nebude což se projeví v hodnosti odhadu C pk ˆ a člověk, který si významně lišit od hodnoty odhadu C p
neprohlédne průběh dat se může domnívat, že proces je velice dobře
ˆ centrovaný. Opět vlastní hodnota odhadu C pk nám nic neříká, pokud není porovnávána se zadanou hodnotou Cpk pomocí testování hypotéz; což má smysl pouze tehdy, když proces je stabilní i v parametru polohy. O tom se lze přesvědčit pomocí statistického nástroje MANOVA. Jedná se vlastně o otázku, zdali všechna data
ˆ potřebná pro odhad C pk pocházejí z jediné populace se střední hodnotou µ.
Když připustíme, že náš proces může v parametru polohy "dýchat", což znamená, že parametr µ není v průběhu výroby fixní, ale může se pohybovat v jistém rozmezí uvnitř tolerančního pásma, např.
µ∈
USL − LSL USL − LSL −δ, +δ , 2 2
kde δ > 0. V metodice Six Sigma se uvažuje, že δ = 1,5σ, kde σ je směrodatná odchylka zkoumaného znaku jakosti. Protože parametr µ není pevný, uvažovat použití ukazatele Cpk v této situaci je nesprávné, protože odhad celkového aritmetického průměru z dat vůbec nic neříká o chování parametru µ. Samozřejmě ihned se naskýtá problém, jak v této situaci hodnotit způsobilost procesu? Odpověď' není zdaleka jednoznačná, protože především závisí na tom, jak se parametr µ chová ve vymezeném intervalu. Pokud bude jeho chování náhodné, které lze popsat nějakým rozdělením pravděpodobnosti, pak by správně pro hodnocení způsobilosti
268
J. Michálek: Jak správně interpretovat ukazatele způsobilosti výrobního procesu.
takového procesu východiskem mělo být rozdělení pravděpodobnosti, které je dáno konvolucí normálního rozdělení N(0,σ2), které charakterizuje zdroj inherentní variability, s rozdělením pravděpodobnosti; které popisuje chování parametru µ. Takováto situace nastává např. při opotřebování nástroje během výrobní operace, kdy se do procesu dostává lineární trend v chování parametru polohy, což koresponduje s rovnoměrným rozdělením na intervalu vymezeném pro pohyb parametru polohy. Dalším případem je taková situace, kdy lze data rozdělit, tj. stratifikovat, do jednotlivých kategorií, které jsou odlišeny různými hodnotami parametru polohy. Tento případ na,stává např. tehdy, když data z jednotlivé kategorie odpovídají novému seřízení stroje či jednotlivým šaržím, kdy nelze přesně dodržet parametr polohy na jednom místě a je nutno počítat s jeho změnou v rámci nějakého intervalu kolem prostředku tolerančního rozmezí. Získaná data potom jsou výsledkem směsi normálních rozdělení nejčastěji se stejnou úrovní inherentní variability, ale s různými středními hodnotami. Pokud dovedeme jednotlivé kategorie dat ve směsi identifikovat podle nějakých příznaků (např. operátor, směna, šarže, seřízení stroje apod.), pak lze hodnotit způsobilost výrobního procesu pomocí ukazatele Ppk následovně. Pro každou kategorii dat, tj. pro každou složku směsi spočítáme odpovídající aritmetické průměry a odhad směrodatné odchylky. Pomocí nich spočítáme odhady
USL − xi PˆpkU = , i = 1, 2, K, k 3 si a odhady
xi − LSL PˆpkL = , i = 1, 2, K, k . 3 si Pak má smysl odhadnout ukazatel Ppk pro celou směs jako
(
)
Pˆpk = min min PˆpkL , min PˆpkU , 1≤i≤k
1≤i≤k
kde k je počet kategorií ve směsi. Takto zavedený odhad má zcela racionální smysl, neboť je založen na složkách směsi, které mají střední hodnoty nejdále od prostředku tolerančního rozmezí. Zatím ale zcela chybí teoretické pozadí, které by dalo odpověď' např. na velikost konfidenčního intervalu či možnost prověřit hodnotu odhadu s požadovanou hodnotou ukazatele Cpk.
269
Sborník konference REQUEST'06
Tento stručný rozbor situace jasně dokazuje, že pokud proces není statisticky zvládnut a sledovaná data nelze popsat normálním rozdělením, pak odhady ukazatelů Cp a Cpk; nemusí vůbec nic vypovídat o způsobilosti procesu. Pokud sebraná data nelze vysvětlit normálním rozdělením, může být sledovaný znak jakosti popsatelný jiným typem rozdělení (např. logaritmicko-normální, Weibull, překlopené normální), a to čistě třeba z fyzikálních důvodů (např. rovinnost, ovalita apod.) a nebo se jedná o zcela neidentifikovatelnou směs z normálních rozdělení. Pak samozřejmě formální výpočet odhadů Cp a Cpk je sice možný, ale nic to neříká, o odhadu neshodných kusů ve výrobním procesu. Jak potom postupovat? Bud' dovedeme najít vhodný tvar rozdělení pravděpodobnosti jako model pro popis sledovaného znaku jakosti, ale toto rozdělení musí být vlastní tvaru procesu v tom smyslu, že každá skupina naměřených hodnot je vysvětlitelná tímto typem rozdělení a definice odpovídajících ukazatelů Cp a Cpk je založena na kvantilovém rozpětí. Tento přístup má svoji velkou slabost právě v odhadu odpovídajících kvantilů, což vyžaduje relativně velký počet, dat pro získání věrohodných závěrů. Druhá možnost je založena na myšlence původní data pomocí vhodné transformace, samozřejmě jedno-jednoznačné převést na nová data. která lze popsat již normálním rozdělením. Vybranou transformací se získají i nové specifikace pro nová data a pro hodnocení způsobilostí se použijí klasické tvary ukazatelů Cp a Cpk založené na specifických vlastnostech normálního rozdělení. V praxi se v tomto případě nejčastěji používá bud' Box-Coxova transformace či třída Johnsonových transformací, která nová data převádí přímo na rozdělení N(0, 1).V následujícím jsou uvedeny dva příklady, které ukazují, že nerespektování předpokladu normality bud' nadhodnotí úroveň způsobilosti procesu či naopak podhodnotí. Na obr.1 je provedeno hodnocení způsobilosti procesu bez respektování předpokladu o normalitě dat. Takto získaná hodnota odhadu nemůže nic vypovídat o skutečné situaci ve výrobním procesu. Jeden z možných správných postupů je ukázán na obr.2, kde je použita vhodná Johnsonova transformace na původní data, která jsou převedena na data, které již požadavek na normalitu dat splňují. Porovnáním obou hodnot odhadů ukazatelů je vidět, že vlastně stav procesu je lepší nežli ukazuje obr.1.
270
J. Michálek: Jak správně interpretovat ukazatele způsobilosti výrobního procesu.
Poznámka: Proces je hodnocen pomocí ukazatelů výkonnosti, které jsou zadefinovány níže, protože se jedná o individuální hodnoty a použitý software Minitab po Johnsonově transformaci ukazatele způsobilosti nepočítá. Process Capability of Warping (using 95,0% confidence) LSL
USL Within Overall
Process Data LSL 0 Target * USL 9 Sample Mean 2,92307 Sample N 100 StDev (Within) 1,68898 StDev (Ov erall) 1,79048
Potential (Within) Cp Lower CL Upper CL CPL CPU Cpk Lower CL Upper CL
Capability 0,89 0,76 1,01 0,58 1,20 0,58 0,47 0,68
Ov erall Capability
0,0 Observ ed Perf ormance PPM < LSL 0,00 PPM > USL 0,00 PPM Total 0,00
1,5
3,0
Exp. Within Perf ormance PPM < LSL 41755,60 PPM > USL 160,35 PPM Total 41915,95
4,5
6,0
7,5
9,0
Exp. Ov erall Perf ormance PPM < LSL 51281,18 PPM > USL 344,38 PPM Total 51625,56
Pp Lower CL Upper CL PPL PPU Ppk Lower CL Upper CL Cpm Lower CL
0,84 0,72 0,95 0,54 1,13 0,54 0,44 0,64 * *
Obr.1 Nesprávný odhad ukazatele způsobilosti Process Capability of Warping Johnson Transformation with SB Distribution Type 0,883 + 0,987 * Log( ( X + 0,133 ) / ( 9,311 - X ) ) (using 95,0% confidence) LSL*
USL*
transformed data
Process Data LSL 0 Target * USL 9 Sample Mean 2,92307 Sample N 100 StDev 1,78597 Shape1 0,882908 Shape2 0,987049 Location -0,132606 Scale 9,44362
Overall Capability Pp 1,26 Lower CL 1,09 Upper CL 1,44 PPL 1,11 PPU 1,41 Ppk 1,11 Lower CL 0,95 Upper CL 1,28 Exp. Overall Performance PPM < LSL 416,36
After Transformation LSL* Target* USL* Sample Mean* StDev*
PPM > USL PPM Total
-3,3136 * 4,21891 0,011196 0,994947
Observed Performance PPM < LSL 0,00 PPM > USL 0,00 PPM Total
0,00
-3
-2
-1
0
1
2
3
4
Obr.2 Hodnocení procesu po transformaci dat
271
11,73 428,09
Sborník konference REQUEST'06
Ne pouze problémy přináší praxe, ale i teorie. Na začátku 90. let se objevují z popudu amerického automobilového průmyslu další dva ukazatele, a to ukazatele výkonnosti Pp a Ppk. Lze ale říci, že jejich zavedení situaci spíše zkomplikovalo nežli zjednodušilo v tom smyslu, že tyto ukazatelé dodají další užitečnou informaci o průběhu výrobního procesu. Jejich vzorce se od vzorců pro Cp a Cpk liší pouze v tom, že ve jmenovateli se místo směrodatné odchylky σ inherentní variability objevuje tzv. totální směrodatná odchylka σTOT. Je doporučováno, aby tyto ukazatele. resp. jejich odhady, byly používány u procesů, které nejsou statisticky zvládnuty. Pokud je
ˆ , a Pˆ by proces zvládnut a data normálně rozdělena, tak odhady C p p se neměly příliš lišit, protože rozdíl v odhadech
σˆ TOT
⎛ 1 k n =⎜ xi j − xi ⎜ kn − 1 ∑∑ i 1 j 1 = = ⎝
(
⎞ ⎟ ⎟ ⎠
)
2
a
σˆ =
R , resp. d2
σˆ =
s C4
by za této stabilizované situace měl být malý. Pokud ale proces není stabilní. úloha ukazatelů Pp a Ppk není jasná, protože nemohou predikovat výkonnost procesu. Problém je v tom, že definice těchto ukazatelů nic nevyžaduje, jakým způsobem vzniká totální variabilita. Tudíž nelze odvodit statistické vlastnosti odhadů těchto ukazatelů a nelze je např. testovat, protože statistika potřebuje model, na jehož základě zkonstruuje přijatelný test. To znamená, že např., pokud nějaký software obsahuje konfidenční intervaly pro tyto ukazatele a není řečeno, z čeho se při jejich výpočtu vycházelo, pak jsou naprosto k ničemu. V monografii [1] je silně argumentováno proti používání těchto ukazatelů a je řečeno. že jejich zavedení je krokem zpět v hodnocení způsobilosti výrobního procesu. Bohužel ve 2. vydání příručky pro dodavatele do amerického automobilového průmyslu z roku 2005, viz [2], se přímo doporučuje použití všech 4 ukazatelů pro charakterizování výrobního procesů na základě normy ANSI Standard Z1 z roku 1996. Na jednoduchém příkladu si dokažme, že skutečně zavedení ukazatele Pp "stojí na vodě" .
272
J. Michálek: Jak správně interpretovat ukazatele způsobilosti výrobního procesu.
Představme si výrobní proces, kde parametr polohy µ sledovaného znaku jakosti silně závisí na vstupu (např. seřízení stroje, různé dávky vstupního materiálu, různí dodavatelé apod.). Uvažujme, že sledujeme výkonnost procesu po takovou dobu, že výsledná data lze popsat jako směs dvou normálních rozdělení N(µi, σ2), i = 1, 2, tedy hustota směsi je h(x) = αf1(x) + (1-α)f2(x), kde fi(·) je hustota normálního rozdělení N(µi, σ2). Předpokládejme, že parametr rozptylu σ2 je pro jednoduchost konstantní v čase, ale parametry polohy µ1 a µ2 a rovněž i parametr směsi α se mohou měnit v čase. Takový proces je zřejmě nestabilní v čase. Jeho střední hodnota a rozptyl jsou
E{X} = αµ1 + (1 − α )µ2 , D{X} = σ2 + α 2µ12 + (1 − α )2 µ2 − (E{X}) , 2
pokud složky směsi budeme považovat za nezávislé, což je v praxi přijatelné. Z tohoto procesu odebereme náhodný výběr x1, x2, ..., xN a budeme sledovat co dělá odhad totální směrodatné odchylky 1/ 2
σˆ TOT
⎛1 N ⎞ = ⎜ ∑ ( xi − x )2 ⎟ ⎜ N j=1 ⎟ ⎝ ⎠
.
Pokud výběr bude složen z podílu [αN] ze složky N(µ1, σ2) a zbytek z druhé složky N(µ2, σ2) a poměr obou složek bude pro každé N zachována, pak lze ukázat, že
σˆ TOT ⎯⎯ ⎯→ D{X}. N→ ∞ Na základě toho by ukazatel výkonnosti procesu Pp měl mít hodnotu
Pp =
USL − LSL . 6 D{X}
Je ale vidět, že jeho hodnota silně závisí α, µ1, µ2 a správně bychom odhadovali jeho hodnotu jedině tehdy, když tyto parametry by byly konstantní v čase a náhodný výběr by respektoval poměr zastoupení složek směsi. Z tohoto jednoduchého příkladu ihned plyne, že vlastně obecně nevíme, co odhad ukazatele Pp říká, protože ve statistické analýze se nemůžeme opřít o nějaký konkrétní model,
273
Sborník konference REQUEST'06
pokud proces nevykazuje stabilitu v čase. Kdy lze tedy ukazatele výkonnosti použít? Mají smysl jedině tehdy, když získaná data bez ohledu na podskupiny lze popsat nějakým rozdělením pravděpodobnosti, např. normálním. Tento předpoklad je důležitý proto, aby bylo možno stanovit např. konfidenční interval pro hodnotu ukazatele nebo provést statistický test nějaké hypotézy o hodnotě ukazatele. Pouze vlastní hodnota odhadu ukazatele výkonnosti bez vhodného statistického modelu neříká de facto nic.
Literatura: [1] Kotz. S., Lovelace C. R.: Process Capability Indices in Theory and Practice. Arnold, London (1998). [2] AIAG - Chrysler, Ford, General Motors. (QS-9000 - Statistical Process Control (2. vydání, 2005). Adresa autora: RNDr. Jiří Michálek, CSc., Ústav teorie informace a automatizace AV ČR Praha, Oddělení stochastické informatiky, Pod vodárenskou věží 4, 182 08 Praha 8. e-mail:
[email protected]
Tato práce byla vytvořena za podpory projektu MŠMT 1M06047 - CQR
274
Complex characterization of cotton fiber quality Jiří Militký
Abstract: There exists a plenty of standard and HVI techniques for characterization of cotton fibers. It is known that there are some differences in the principles of measurements and the results of AFIS and HVI spectrum apparatus. The differences exist between measurements of fiber strengths based on the bundles concept or single fiber concept as well. Despite of these differences it is possible to specify basic cotton fiber properties having potential influence to the cotton quality or spinning ability. The main problem with utilization of these properties for quality characterization is multivariate character of information, various units and lack of proper aggregation to utility scale. According to the general definition, the quality is characterized by several properties expressing the ability of a product to fulfill functions it was designed for. The degree of quality (complex criterion) is often expressed as cotton quality index U. The method for complex evaluation of cotton fiber performance based on this idea is presented. The results of HVI measurements are used as input data. The other empirical complex characteristic of cotton fiber quality is computed as well. The program QCOTTON written in MATLAB is briefly mentioned. The comparison of selected complex criteria is demonstrated on the real data of results of the crop study of 1997 and 1998, which includes 33 sets of cottons.
1. Introduction Quality is very frequent word used in industry as synonym for good product, technologies etc. Strictly speaking this word is frequently misused or misinterpreted. In some cases word “quality” is used for expression maintainability, reliability or economy of production Especially in the textile branch is necessary to define quality very
275
Sborník konference REQUEST'06
tightly because textile products (e.g. weaves) can be used for a lot of various applications (ranged from clothing to wipes). One of general definition of quality is:” Quality express ability to fulfill needs of applicability“. Therefore before speaking about quality it is necessary to specify the potential target application of textiles. The quality of the textile fibers is dependent on the aims of evaluation: • •
•
Fiber producers: quality means the achievement of required technological parameters (geometrical evenness, fineness, shrinkage, mechanical and physical parameters etc.). Textiles producers: quality means the ability to fulfill requirements of technologic operations and process ability (friction, surface properties, cohesion, selected mechanical and physical properties, and evenness). Consumers: fiber quality is hidden in the properties and comfort of fabrics (hand, wearing pleasance, thermal comfort, transport properties etc.).
Natural fibers: controlled changes of properties are very difficult (selection, breeding, gene manipulation) and therefore the quality is oriented to the process ability, yarns characteristics (especially strength) and mixing potency. Chemical and synthetic fibers: by variation of fiber geometry (fineness, cross section profile, texturing) and spinning conditions (rate of production, drawing degree, temperature, forming conditions) is possible to markedly change majority of properties. The chemical modification is another way to change of properties. The general definition of quality according to the aim of utilization can be here used for ranking and classification. According to the general definition, the quality is characterized by several properties expressing the ability of a product to fulfill functions it was designed for. The degree of quality (complex criterion) is often expressed as utility value U (Militký (1980)). Evidently, general quality of textiles is characterized by many of various utility properties Ri (i=1,…m). These are such properties that make it possible for the product to fulfill its function. Utility value U∈<0, 1> aggregates then in some certain way partial quality properties (Arrow (1971), Cerny (1980)).
276
J. Militký: Complex characterization of cotton fiber quality.
The purpose of the paper is to describe cotton fiber quality (cotton quality index results of HVI measurements are used applicability of cotton quality index simulation-based and practical examples. 2.
the complex evaluation of U) based on this idea. The as input information. The is demonstrated on the
Cotton Fiber Quality
In 1907 an international group of cotton industry representatives recommended to establish uniform cotton standards to “eliminate price differences between markets and make the farmers more cognizant of the value of the value of their products”. In response to requirements of standardization the cotton grade standards and cotton classification systems were elaborated and authorized by US Dept. of Agriculture. The cotton classification is now system of standardized procedures for measuring of raw cotton properties (physical attributes) that affect quality of processing (spinning mainly) and quality of products (yarns). The classification system of US cottons is described on the net∗. There exists a plenty of standard and HVI techniques for characterization of cotton fibers. It is known that there are some differences in the principles of measurements and the results of AFIS and HVI spectrum apparatus. The differences exist between measurements of fiber strengths based on the bundles concept or single fiber concept as well (Militký (2004)). Despite of these differences it is possible to specify basic cotton fiber properties having potential influence to the cotton yarn strength (Rasked (2002)): Fiber length (expressed as upper half mean UHM [mm], fiber length uniformity (expressed as uniformity index UI [%]), fiber strength (as bundle strength STR [cN/tex]), fiber elongation ant break (EL [%]) fiber fineness and maturity (expressed by micronaire reading (MIC [-]), short fiber content (SF [%]), thrash content TR [%].
∗
http://www.cottonic.com/CottonClassification
277
Sborník konference REQUEST'06
The importances of these properties are generally dependent on the spinning technology. The relative weight b of above listed properties (as importance percentages divided by 100 and then standardized sum of weights should be one) are given in the Table I. Table I. Contribution of cotton properties to the yarn strength Property/ weight Rotor yarn Ring yarn UI [%] 0.20 0.22 MIC [-] 0.16 0.17 UHM [mm] 0.14 0.24 STR [g/tex] 0.28 0.22 EL [%] 0.09 0.06 SF [%] 0.06 0.06 TR [%] 0.07 0.03 The values in the Table I were derived from pie graphs presented in the work (Rasked (2002)). The main problem with utilization of above-mentioned properties for quality characterization is multivariate character of information, various units and lack of transformation to the utility scale. One of first attempts to create aggregated criterion of cotton fiber quality was fiber quality index (FQI ) expressed by relation (Anonym (1983)) FQI = (fiber strength*length)/fineness
(1)
South India Textile Research Association proposed modified version in the form (see. Majundar et. all (2005))) FQI = (fiber strength*length*uniformity*maturity coefficient)/fineness For HVI results is FQI expressed in the form
FQI =
UHM *UI * STR MIC
(2)
Some other criteria are based on the regression models connecting fiber properties with parameters characterized spinning ability or quality of yarn (characterized by yarn strength). The spinning
278
J. Militký: Complex characterization of cotton fiber quality.
consistency index (SCI) is connected with cotton HVI properties through regression model (Anonym (1999))
SCI =−414.67+2.9*STR+49.1*UHM +4.74*UI −9.32*MIC+.95*Rd +0.36*b (3) where Rd is reflectance degree and b is yellowness of fiber. Based on the regression equation relating fiber properties with yarn strength the premium discount index (PDI) was derived. The PDI expressed in the standardized fiber parameters (see. Majundar et. all (2005)) has the form
PDI = 22.15*STR* − 4.75*EL* − 4.37UHM* +11.9UI* − 20.78*SFC* −7.8*MIC* (4) where superscript (*) denotes the standardized variable (mean value subtraction and division by standard deviation ). The multiplicative analytic hierarchy process (MIA) criterion (see. Majundar et. all (2005)) can be expressed by relation
MIA =
STR 0.27 * EL0.039 *UHM 0.291 *UI 0.145 MIC 0.11 * SFC 0.145
(5)
In the book (Korickij (1983)) so called geometric properties index (IG) was introduced. This index is based on LVI measured properties IG = 0.1*Lm*UI*(1-SF/100)*MAT*(FI)
-0.5
(6)
where Lm is cotton fibers weighted mean length, FI is fiber fineness and MAT is maturity. For HVI measured properties can be IG expressed as
IGa =
UHM *UI *(100 − SF ) 10000* MIC
(7)
or
IG =
UHM *UI *(100 − SF ) * MAT 1000000* FI
279
(8)
Sborník konference REQUEST'06
The relation (7) is very rough because the micronaire is combination of fiber fineness and maturity. Index IG correlates with yarn mass unevenness by empiric relation (Korickij (1983))
CV =
100* A2 Ig TP
(9)
where A2 = 11.7 for long staple cottons and A2 = 14.7 for medium staple cottons. TP is yarn fineness. Index IG correlates with yarn strength variation coefficient CVP by empiric relation (Korickij (1983))
CVP =
100* A3 Ig * 4 T
(10)
P
where A3 = 3.85 for long staple cottons and A3 = 4 for medium staple cottons. Cotton yield during spinning is expressed by relation
B = 95.4 − 2.9* TR
(11)
Complex quality index (IK) expressing the spinning ability of cottons is then defined as combination of IG and B with including of cotton fibers price C.
IK = A4 * B * Ig 4 / C
(12)
where A4 = 0.0108 for long staple cottons and A4 = 0.0141 for medium staple cottons. These relations were derived from Russian cottons and LVI measurements. The main problem with all above mentioned characteristics of cotton fiber quality are: 1. strong dependence on the units for individual cotton properties and methods for their evaluation, 2. utilization of dimensional parameters based on the limited amount of experimental data (from the past crops), 3. no inclusion of individual fiber properties importance for individual spinning technologies.
280
J. Militký: Complex characterization of cotton fiber quality.
4. no possibility to change parameters for new crops without tedious experimentation 5. no defined ranges (limits) for quality indices. 6. no possibility to include the direction of some properties influence to quality indices dependent on their real values (case of micronaire). Our approach based on the utility function concept is more general and be easily modified for the future (the properties of cottons are in dependence on time progressively changed in positive sense due to breeding and genetic manipulation) 3.
Utility Value Concept
Evaluation of quality based on complex criterion (cotton quality index U) is closely related to the well-known problem of complex evaluation of variants (Cerny (1980)). For complex evaluation of variants, the X matrix of the (n x m) order is available containing for individual V1,.....Vn variants ( X matrix rows) the values of selected R1,.......Rm characteristics ( X matrix columns). The xij element of the matrix thus expresses the value of the j - th characteristic of Rj for the i-th variant of Vi. The aim is to sort individual variants in the order of their importance. In economics several different methods are used in this field and most of them are based on preferential relations (Cerny (1980)). A special technique is the so called "useful effect method" or "base variant method". Base variant practically represents an ideal state where individual characteristics get optimum values. By means of oj (j = 1,...m) values for individual characteristics of a base variant, dimensionless standard quantities uij are calculated. If the increase of the Rj characteristic is accompanied by the increase of quality, the standard quantities are calculated according to the relation
uij = min(
xij oj
,1)
(13)
In opposite case, the dividend and the divisor are interchanged. As U(R) = U(u) is aggregating function a suitable weighted average is used. Generally a question may arise whether a suitable aggregating function really exists (Arrow (1971)).
281
Sborník konference REQUEST'06
Modification of this approach for expressing of textiles quality is shown in the work (Militký (1980)). The procedure for prediction of cotton fibers quality from point of view of the yarn strength is described in sequel. Let we have K utility properties R1 ,...,RK (cotton fiber properties selected in the Table I). Based on the direct or indirect measurements it is possible to obtain some quality characteristics x1 ,...,xK (mean value, variance, quantiles etc.). These characteristics represent utility properties. Functional transformation of quality characteristics (based often on the psycho physical laws) lead to partial utility functions ui = f ( xi , L, H ) (14) where L is value of characteristic for just non acceptable cotton (ui = 0.01) and H is value of characteristic for just fully acceptable product (ui = 1). Cotton quality index (U) i.e. utility value is weighted average of ui with weights bi U = ave(ui , bi ) (15) Weight bi corresponds to the importance of given utility property (Dobrov (1977)) and is closely connected with area of cotton application. The weighted geometric mean used as average has following advantages: • For zero value of ui is also U = 0. This means that combinations of other utility properties cannot replace non-acceptable utility property. • Geometric mean is for not constant ui always lower that arithmetic mean. This reflects evaluation based on the concept that the values of utility properties close to unsatisfactory cottons are more important for expressing the quality than those close to optimum cotton. Basic steps of utility function computation are: • Selection of characteristics xi corresponding to utility properties Ri, • Determination of preferential functions u(xi) expressing "partial quality" for chosen utility property, • Assessment of the importance of individual utility properties via weights bi, • Proper aggregation, i.e., determination of the U function. For the cases of cotton fibers quality are utility properties and weights already selected (see. Table I).
282
J. Militký: Complex characterization of cotton fiber quality.
For aggregation the weighted geometric mean can be used and therefore the preferential functions u(xi) have to be proposed only. Partial utility function is in fact psychophysical variable expressing the sensation of quality induced by (measured) characteristic of cotton property. The computation of preferential functions is dependent on the measurement scale and property type. Ordinal characteristics - in this type of scale, classification has been introduced, but differences are not quantified. Grades are awarded by the comparison with etalons. Usually the higher is the grade; the higher is the partial quality. Cardinal characteristics - are usually expressed in physical units. There are two types of cardinal characteristics. One-side bounded characteristics are those where after the Hj value has been exceeded utility does not change any more (fiber strength, length, etc.). After standardization the partial utility function is computed e.g. by using Harrington preference function Two-sides bounded characteristics are those where on both sides from "the optimum" partial utility decreases. (e.g. fiber micronaire) The nonlinear transformation to preference functions for cardinal utility values is given in the work (Militký (1980)). For expressing quality of cotton fibers it is sufficient to replace standardization and nonlinear transformation to the partial utility function by the piecewise linear transformation. For one side bounded properties quality is monotone increasing or decreasing function of quality characteristic x and therefore the piecewise linear transformation has form shown on the Fig. 1. For the case of LB (lower is better) properties were limits selected according to the known ranges published e.g. in (Rasked (2002)) Thrash content TR [%] L=6 H=2 Short fibre content SF [%] L = 18 H=6 For the case UB (upper is better) properties were limits selected according to the known ranges published e.g. in (Rasked (2002)) Strength HVI STR [g/tex] L = 23 H = 31 Length UHM [mm] L = 25 H = 32 Uniformity index UI [%] L =77 H = 85 Elongation EL [%] L=5 H = 7.7
283
Sborník konference REQUEST'06
u(x)
1
0.1 x H Fig. 1 Transformation for one side bounded cotton properties (L is lower limit and H is upper limit) L
For two side bounded properties quality is monotone decreasing function of property value x on both sides from optimal (constant) region and therefore has the piecewise linear transformation form shown on the Fig. 2
u(x)
1
0.1
L1
H1
H1
L2
x Fig. 2 Transformation for two side bounded cotton properties (L1, L2 are lower limits and H1, H2 are upper limits) For this case were limits selected according to the known ranges published e.g. in (Rasked (2002)) Micronaire MIC [-]
L1 = 3.4, H1 = 3.7
L2 = 5, H2 = 4.2
The weighted geometrical average U characterizing cotton fibers quality i.e cotton quality index is then simply calculated by the relation m
U = exp ( ∑ b j *ln ( u j ) ) j=1
284
(16)
J. Militký: Complex characterization of cotton fiber quality.
When forming the aggregating function U from experimentally determined values of individual utility properties, the statistical character of the xj quantities should be considered and the corresponding variance D(U) should be also determined.
4. Program QCOTTON Program QCOTTON written in MATLAB is based on the aboveproposed procedure. The Bootstrap type technique described in (Meloun (1993)) has been applied for computation of the statistical characteristics of cotton quality index. This technique is based on the assumption that for each utility property Rj the mean value xj and variance s2j are determined by standard treatment of the measured data. The procedure of the statistical characteristics of cotton quality index U estimation is divided to the following parts: I.
Generation of x(k)j (j=1,.....m) values having normal distribution with mean values xj and variances s2j. The pseudorandom number generator built in MATLAB is used. II. Calculation of the cotton quality index U(k) using the relation (12). III. The steps I and II are repeated for k=1,.....n (usually n=600 is chosen). IV. Construction of a histogram from the values U(k) (k=1,.....n) and computation of the estimators of E(U), D(U).
5. Simulation Results The influence of micronaire changes and upper half mean changes to the cotton quality index of some ideal cotton fiber is shown on the fig. 3
285
Sborník konference REQUEST'06
Fig. 3 Influence of MIC and UHM on utility value In accordance with expectation leads increase of UHM to better quality expressed by U value. Micronaire influence is more complex because the small values indicate immature cottons and high values are for too coarse cottons. The distribution of U for the idealized case when relative errors of measurement CV are 3 % for all properties are given on the Fig. 4.
Fig. 4 Distribution of U values for measurements with 3 % precision There are visible differences between the U values for rotor and ring yarn weighting coefficients. Complex criterion (weights rotor) : Mean lower limit 0.49 ¨ 0.4.86 Complex criterion (weights ring) : Mean lower limit 0.479 ¨ 0.4.75
286
upper limit 0.494 upper limit 0.484
J. Militký: Complex characterization of cotton fiber quality.
The differences between both types of weights are not so high but the confidence intervals are not overlapped and conclusion is “this cotton is significantly better for rotor yarn production”.
6. Experimental part The results of the crop study of 1997 and 1998, which includes 33 sets of cottons (Majundar et. all (2005)) were used for comparison of U with some other cotton quality indices. For different cotton varieties the International Textile Center (USA) evaluated the all characteristics required to computation of cotton quality index U excluding thrash content (in evaluation of U the value TR = 2 was selected). The quality of data were investigated by multivariate exploration techniques (Meloun, Militký and Forina (1993)).
Mahalanobis distance
25
20
group1 group2
d2
15
10
5
0
0
5
10
15
20
25
30
35
index Fig. 5 Mahalanobis distance for cotton varieties properties The Mahalanobis distance (Meloun, Militký and Forina (1993)) for all cotton varieties are shown on the fig. 5. It is clear that all points are below the limit for highly influential points. Based on the cluster analysis the data were divided into two groups as is shown on the fig
287
Sborník konference REQUEST'06
6a. These groups are visible in the projection into first three principal components. Data projection on the first three principal axes
Cluster 2 groups
group1 group2
group1 group2
2
2
Third principal axis
1.5
STR[g/tex]
1 0.5 0 -0.5 -1 -1.5
15
7 0 3
-1
20 31 18 30 17 2228 5 6 16 1 21 19 24 2725 8 2 29 12
10 13
-2 4
-2 -2.5 4
33
1
14
2 2
MIC[-]
0
-2
4
2
0
-2
UHM[mm]
4 2
0
0
-2
Second principal axis
-2 -4
-4
First principal axis
a) Clustering b) principal component plot Fig. 6 Multivariate exploration of cotton varieties properties from HVI In the smaller group (7 cotton varieties) are cottons having extra high STR, higher UHM and lower SCF i.e. this group contains cotton varieties of higher quality.
7. Results and discussion The cotton quality index U for all cotton varieties are given on the fig. 7. It is visible that according to the cotton quality index are cotton varieties separated into two groups. In the low value of U are cottons with very low UHM (No. 7, 13, 33) or very high micronaire (No. 7, 14, 20, 33). The comparison of U with FQI is shown on the fig. 8a. Corresponding correlation coefficient for ring yarn is r = 0.434 and for rotor yarn is r = 0.408. The comparison of U with SCI is shown on the fig. 8b. Corresponding correlation coefficient for ring yarn is r = 0.692 and for rotor yarn is r = 0.693.
288
J. Militký: Complex characterization of cotton fiber quality.
Cotton quality index
0.9
ring rotor
0.8 0.7
U
0.6 0.5 0.4 0.3 0.2 0.1
1 2 3 4 5 6 7 8 9 101112131415161718192021222324252627282930313233
cotton No Fig. 7 Computed cotton quality indexes (utility values) Comparison of FQI and U 0.9
Comparison of U and SCI
ring rotor
0.8
0.9 0.8
0.7 0.7
0.6
ring rotor
U
U
0.6
0.5 0.4
0.4
0.3
0.3
0.2 0.1 400
0.5
0.2
450
500
550
600
650
700
750
800
850
0.1 100
900
FQI
110
120
130
140
150
160
SCI
a) b) Fig. 8 Computed cotton quality indexes (utility values) The comparison of U with PDI is shown on the fig. 9a. Corresponding correlation coefficient for ring yarn is r = 0.473 and for rotor yarn is r = 0.510. The comparison of U with MIA is shown on the fig. 9b. Corresponding correlation coefficient for ring yarn is r = 0.538 and for rotor yarn is r = 0.530.
289
Sborník konference REQUEST'06 Comparison of PDI and U
0.9
ring rotor
0.8
0.7
0.7
0.6
0.6
0.5
0.5
U
U
0.8
0.4
0.4
0.3
0.3
0.2
0.2
0.1 -100
Comparison of MIA and U
0.9
-80
-60
-40
-20
0
20
40
60
80
0.1 2.8
100
ring rotor
2.9
3
3.1
3.2
3.3
3.4
3.5
3.6
3.7
MIA
PDI
a) b) Fig. 9 Computed cotton quality indexes (utility values) The best correlation exists between U and SCI. Other correlations are highly significant as well. In each cases are visible the outlying points with very low values of U. Main reason of this deviations are higher low limits for UHM (25 mm) and low higher limit for MIC (5) used for computation of U.
8. Conclusion Described procedure for evaluation of cotton quality index (U) can be very simply modified for other selected properties or other set of weights. This is important for future cotton varieties. Based on preliminary results it will be probably necessary to solve problems with some cotton varieties having small micronaire due to fineness and relatively high strength. For these cases will be necessary to add restriction to the L1 and H1.
References [1] Anonym (1983): TRC 19, No 10, June [2] Anonym (1999): Application Handbook of Uster HVI spectrum, Zellweger Uster 1.1-1.9 [3] Arrow K.J. (1971): Community Choice and Individual Values, Praha (in Czech) [4] Cerný M., Gluckhaufová D., Toms M. (1980): Methods for Complex Evaluation of Variants, Academia Praha, (in Czech)
290
J. Militký: Complex characterization of cotton fiber quality.
[5] Dobrov G.M. (1977): Expert Estimates in Scientific Prognoses, Kiev [6] Korickij K.I. (1983): Technological economic estimation and design of textile materials quality, Legkaja Industria, Moscow (in Russian) [7] Majundar A. et all. : Determination of the technology value of cotton, Autex Research Journal, 5, June 2005, pp.71-80 [8] Meloun M., Militký J., Forina M. (1993): Chemometrics in Instrumental Analysis, Ellis Horwood, London [9] Militký J. (1980): Statistical properties of complex quality indices, Proc. Conf. STAQUAREL 80, Praha, (in Czech) [10] Militký J.: (2004): MATLAB Program for Complex Quality Evaluation, National Textile Centre Rept. ,Liberec [11] Militký J., Křemenáková D., Krupincová G., and Ripka J. (2004a) : Proc. 2 nd. Int. Text. Conf, - Magic World of Textiles, Dubrovnik [12] Rasked E.S. (2002): Technical seminar at the 61 plenary meeting of the Int. Cotton Advisory Committee, Cairo, October Author´s address: Prof. Ing. Jiří MILITKÝ, CSc., Technical University of Liberec, Textile Faculty, Department of Textile Materials, Hálkova Street No 6 461 17, Liberec, Czech Republic e-mail:
[email protected] Acknowledgements: This work was supported by the research project “Textile Center” of Czech Ministry of Education 1M4674788501
291
Analýza spolehlivosti tlakové nádoby metodou Monte Carlo Jakub Nedbálek
Abstrakt: Cílem práce je ukázat možnost využití Monte Carlo simulace pro studium úloh z oblasti spolehlivosti. V našem případě máme k dispozici systém, ve kterém se deterministicky vyvíjí procesní proměnná tlak. Časový průběh proměnné vychází z diferenciálních rovnic, jejichž řešení je nám známé. Všechny změny, resp. poruchy komponent považujeme za stochastické události. Vzhledem k dynamice procesu se snažíme vyčíslit pravděpodobnost poruchy vztaženou ke vstupním parametrům a vytvořit funkci pravděpodobnosti poruchy v čase. Pro komplikovanější typy úloh se numerické řešení pomocí metody Monte Carlo zdá být efektivní, nicméně jistou nevýhodou může být časová náročnost řešení díky výpočetní době a konstruování příslušného algoritmu. V naší konkrétní úloze byl čas, potřebný k modelování 2 .106 simulací, menší než 1000 s, což je zanedbatelná hodnota.
1.
Úvod
V této úloze je konkrétně nasimulováno a vyšetřeno chování uzavřeného systému, ve kterém se mění tlak v závislosti na čase. Cílem modelování je určit spolehlivost této soustavy vzhledem ke komponentám, jenž mají za úkol udržet tlak v patřičných mezích. Prostředkem k řešení je metoda Monte Carlo (MC), jako alternativa k analytickému postupu v [1].
292
J. Nedbálek: Analýza spolehlivosti tlakové nádoby metodou Monte Carlo.
2. Popis benchmark procesu Mějme k dispozici systém, v němž je hlavní procesní proměnou x tlak. Předpokládejme, že její počáteční hodnota v čase t0 je x0 a dále že se x vyvíjí exponenciálně. Dosáhle-li tlak úrovně x = l, začne působit komponenta C1, která může s pravděpodobností p0 selhat, s pravd. 1- p0 –p1 pracovat korektně, nebo se spustit částečně chybně s pravd. p1. Poslední dva případy vedou ke snížení x v systému k počáteční hodnotě x0. V případě, že x > L > l, systém považujeme za porouchaný. Situace odpovídá případu, kdy tlak v nádobě je regulován ventilem, který se při hodnotě tlaku l má otevřít, jinak dojde k roztržení nádoby - tlak vzroste nad bezpečnou mez L. Systém je doplněn komponentou C2, která akceleruje růst x, díky čemuž se systém dostane rychleji na úroveň x = l s následným zapojením komponenty C1 podle scénáře podobného předchozímu. Stavovou veličinu je možno popsat následujícími dif. rovnicemi:
ai x, i = 1,4,6 dx ai > 0 ∀i , ={ − ai x, i = 2,3,5 dt
(1)
kdy platí a2 > a3, a4 = a1 + b, a5 = a2 - b, a6 = - a3 + b, a b = 0.15 Intenzitu poruch λ považujme konstantní v celém zledovaném rozmezí < x0,L>. Pro koeficienty dosazujeme následující numerické hodnoty: x0 l
1 3
p0 p1
0.02 0.04
a1 a2
0.2 0.25
a4 a5
0.35 0.1
L
4
λ
4.10-2
a3
0.1
a6
0.05
Pro řešení úlohy předpokládáme, že pro danou možnost se stavová proměnná vyvíjí deterministicky a k případným změnám v průběhu vývoje dochází stochasticky. Protože naším úkolem není rozebírat postup výpočtu (1), podívejme se rovnou, jak vypadá řešení diferenciálních rovnic s příslušnými konstantními koeficienty a1 – a6 :
293
Sborník konference REQUEST'06
Obr. 1. Řešení (1) – vývoj stavové proměnné pro jednotlivé koeficienty
3. Řešení Monte Carlo metodou Úkolem je nalézt funkci pravděpodobnosti poruchy systému. Základem řešení naší testovací studie bude sestavení optimálního algoritmu MC metody. Za prostředí, v němž budeme případ simulovat, zvolme Matlab. Při sestavování algoritmického řešení vycházíme z následujících informací: - vzrůst x nad L - porucha - pokles x na x0 - úspěch - vzrůst x nad l - změna koeficientu a, změna hraničních časů a úrovní - hraniční úrovně x=xf, resp. časy t=tf zjistíme z rovnice x(t)=xe.exp(ae.(t-te)) – řešení vztahu (1) – kde xe a te jsou počáteční (inicializační) hodnoty v simulačním cyklu - uvažujeme, že při jedné simulaci můžou nastat obě poruchy u C1 i C2 – vybíráme dřívější čas
294
J. Nedbálek: Analýza spolehlivosti tlakové nádoby metodou Monte Carlo.
-
-
-
čas T1 je náhodně generován z exponenciálního rozložení s parametrem λ - odpovídá přechodu C2 do poruchy a změně ai o b. pravděpodobnosti p jsou generovány náhodně a platí: s pravděpodobností p0 přejde vývoj do stavu a1, 1- p0 –p1 do stavu a2 a p1 do a3. počáteční hodnoty pro každý cyklus simulace jsou dány te = 0 , xe = x0 = 1 a ai = a1 = 0.2
Algoritmus v Matlabu vypadá následovně: function simstav_x global X por usp m
% globalni promenne
lambda = 0.04; beta = 0.15; %vstupni koeficienty %ze zadani X1 = 1; X2 = 3; X3 = 4; A = [ 0.2 -0.25 -0.1 ]; p0 = 0.02; p1 = 0.04; % -----------------------------------------------------ms = input('pocet milionu simulaci = '); if isempty(ms) ,error('neudano'), end if ms~=round(ms) | ms<1 ,error('neprirozene'), end doba = zeros(ms*1000000,1) ;% doby trvani % odpredu porucha % odzadu uspech MS = length(doba) ; % pocet simulaci usp = 0 ;% pocet uspechu por = 0 ;% pocet poruch while
usp+por < MS
%cyklus pres pocet simulaci
% provedeni jedne simulace T1 = -log(rand)/lambda ; %doba fungovani prvku C2, %generovano nahodne
295
Sborník konference REQUEST'06
if elseif else end
nah = rand ; nah < p0 , nah < p1 , , %
an = A(1) ; an = A(3) ; an = A(2) ; funkce prvku C1
% %provadeni dilcich prechodu pocinaje pocatecnim stavem % tf = 0; xf = X1; af = A(1); %pocatecni inicializace while 1 %dokud neskonci jedna simulace te = tf ; xe = xf ; ae = af ; %dosazeni "hranicniho" casu if T1>te , tf_T = T1 ; else , tf_T = Inf ; end %kdyby pokles|vzrust pres "hranicni" uroven L if ae>0 %nalezeni nejblizsi vyssi urovne pro akci "vzrust" if xe < X2 , xf_X = X2 ; CO = 2 ; else , xf_X = X3 ; CO = 3 ; end else %nalezeni nejblizsi nizsi urovne pro akci "pokles" xf_X = X1 ; CO = 1 ; end %vypocet odpovidajiciho casu pro prislusny stav x tf_X = te + log(xf_X/xe)/ae ; %rozliseni co nastane drive (porucha od C2/zasah C1) if tf_T < tf_X %realizace "prechodove" akce == porucha C2 %dojde k akceleraci rustu tf = tf_T ; an = an + beta ; xf = xe*exp(ae*(tf-te)) ; af = ae + beta ; else % % realizace "vzrustove|poklesove" akce % switch CO case 1 % konec- uspech jak = +1 ; cas = tf_X ; break case 2 % akce zasah C1 tf = tf_X ; xf = xf_X ; af = an ;
296
J. Nedbálek: Analýza spolehlivosti tlakové nádoby metodou Monte Carlo.
case 3 %konec- porucha jak = -1 ; cas = tf_X ; end end %rozliseni co nastane
break
end %provadeni dilcich prechodu (while 1) %dosazeni vysledku jedne simulace %zapis cas uspechu/poruchy if jak>0 , usp = usp + 1 ; doba(MS+1-usp) = cas ; else , por = por + 1 ; doba( por) = cas ; end end %provadeni vsech simulaci % %prezentace simulacniho reseni X = sort(doba(1:por)) ; m = length(X) ; Y = (por/(por+usp))*(0:m)/m ;
%delka vektoru %pro kazde m vypocti %pravdepodobnost
plot([0 X'],Y,'r-' ) title([num2str(por) '+' num2str(usp) ' histories']) %popisy os a grafu ylabel('failure probability') xlabel('time')
Výsledkem je graf pravděpodobnosti poruchy systému. 59260+1940740 histories 0.03
0.025
failure probability
0.02
0.015
0.01
0.005
0
0
5
10
15
20
25
30
35
40
45
time
Obr. 2. Grafický výstup pro 2 .106 simulací MC. (nahoře – poč.poruch + poč.úspěchů)
297
Sborník konference REQUEST'06
4. Závěr Testovací studie byla provedena pro 2 .106 simulací MC metodou. Pro jiný počet simulací v daném řádu se tvar výsledné funkce příliš nemění. Výstup byl konfrontován s výsledkem [1] , kde bylo uvažováno řešení analyticky. Matematický průběh pravděpodobnostní funkce zjištěné MC metodou je v dobré shodě s analytickým výsledkem - MC simulaci můžeme tedy považovat za dostatečně spolehlivou pro naši benchmarkovou studii. Pro 2 .106 cyklů zabralo modelování na počítači PII 0,5GHz, 256 MB RAM čas t<1000s, což je zanedbatelná hodnota.
Literatura [1]
Labeau, E.P.: Pressurisation test-cases for dynamic reliability, Université Libre de Bruxelles, Brussels, 2002
[2]
Virius, M.:Základy výpočetní techniky (Metoda Monte Carlo), ČVUT, Praha, 1985
[3]
Briš R., Praks P.: Special Case of Dynamic Reliability Analysis Based on Time Dependent Acyclic Graph, The International Symposium on STOCHASTIC MODELS in RELIABILITY, SAFETY, SECURITY and LOGISTICS, February 15-17, 2005 Beer Sheva, Israel, ISBN 9984-668-79-7, str. 69-70
Adresa autora: Ing. Jakub Nedbálek, Vysoká škola báňská – Technická univerzita Ostrava, fakulta elektrotechniky a informatiky, katedra aplikované matematiky, Tř.17.listopadu 15, 708 33 Ostrava-Poruba. e-mail:
[email protected] Tato práce byla vytvořena v rámci projektu MŠMT 1M06047 - CQR.
298
Modelování spolehlivosti kompresorové stanice tranzitního plynovodu užitím spojitých markovských procesů Pavel Praks, Josef Chudoba, Radim Briš Abstrakt. Cílem práce je modelování spolehlivosti konkrétní kompresorové stanice tranzitního plynovodu, která se nachází na území ČR. Pro matematické modelování spolehlivosti jsou k dispozici data o vytíženosti stanice, o poruchovosti komponent systému, o režimech oprav komponent systému a expertní informace o metodách řízení stanice dispečerem. V souvislosti s uspokojováním měnících se požadavků zákazníků na objem přepravovaného plynu použitý model zohledňuje i efekt změny hardwarové konfigurace kompresorové stanice, což je v příspěvku rovněž demonstrováno. 1. Úvod Tato práce se zabývá modelováním spolehlivosti konkrétní kompresorové stanice tranzitního plynovodu, která se nachází na území ČR. Práce se skládá ze dvou vzájemně propojených hlavních částí. První část práce se zabývá sestavením matematického modelu kompresorové stanice tranzitního plynovodu markovskými řetězci. Pro modelování je uvažován vícestavový markovský model, neboť řídící systém kompresorové stanice v závislosti na měnící se požadavky dispečera a na případné poruchové stavy komponent stanice přirozeně mění svou systémovou (hardwarovou) konfiguraci (např. zapínání nebo vypínání příslušných kompresorů). Druhá část práce se věnuje matematickému modelování dynamického chování dispečera. Požadavky na změnu systémové konfigurace kompresorové stanice (tj. na změnu tzv. scénáře) přicházejí z dispečinku tranzitního plynovodu v souvislosti s uspokojováním měnících se požadavků zákazníků na objem přepravovaného plynu. K dispozici je databáze změn systémových konfigurací, které proběhly v minulosti, a také soupis pravidel, kterými se řídí jednání dispečera. Například změny v systémové
299
Sborník konference REQUEST'06
konfiguraci jsou vždy postupné, tj. není např. možné, aby v době, kdy je systémová konfigurace stanice v tzv. minimálním energetickém stavu, přišel požadavek dispečera na okamžité zapnutí všech kompresorů. Pro modelování dynamického chování dispečera je využit simulační přístup. Parametry matematického modelu jsou nastaveny na základě statistického vyhodnocení dat z kompresorové stanice a na základě expertních informací z průmyslu. Výsledkem modelování bude statistický odhad pohotovosti stanice ve zvoleném čase. Tento odhad je zajímavý pro hledání „úzkých míst“ v systému a pro případnou změnu politiky údržby, která může implikovat významné finanční úspory provozních nákladů kompresorové stanice tranzitního plynovodu při zachování vysoké kvality a spolehlivosti dodávek tranzitního média v ČR. 2. Formulace úlohy Na základě vhodných předpokladů [7, 13] lze evoluci určitých fyzikálních systémů popsat systémem Chapman-Kolmogorových diferenciálních rovnic:
kde symbol v označuje počáteční hustotu pravděpodobnosti (initial probability distribution). Analytické řešení má tvar w(t) = etAv a reprezentuje hustotu pravděpodobnosti Markovského řetězce. Matice koeficientů představuje infinitezimální generátor řádu n, kde n je počet stavů Markovského řetězce s elementy aij ≥ 0 pro i ≠ j a . Dále, i-tá komponenta vektoru w(t) představuje pravděpodobnost, že fyzikální systém bude v čase t ve stavě označeném symbolem i. Maticovou exponenciálu čtvercové matice A lze sice teoreticky vypočítat pomocí rozvoje , nicméně tento výpočet je numericky nestabilní i pro malé úlohy, viz [7], [13].
300
P. Praks, J. Chudoba, R. Briš: Modelování spolehlivosti kompresorové stanice ...
Pro reálné úlohy je matice A velká a řídká. Přibližné řešení hledáme ve tvaru , pomocí elementů Krylovského podprostoru , kde dimenze Krylovského podprostoru m je rozhodně menší než počet stavů n.
3. Popis modelu Předkládaný model předpokládá 10 výkonových konfigurací kompresorové stanice tranzitního plynovodu. Konfigurace jsou označeny čísly 1, 2, …, 10, viz Obr. 1-20. Veškeré pojistné ventily, ventily, potrubí, … budeme nazývat výrazem „linie“ a obdobně kompresor, turbínu, energetické hospodářství, chladící hospodářství, mazací hospodářství budeme nazývat pod uceleným názvem „turbokompresor“. Linie rozdělujeme na vstupní a výstupní. Odhadujeme intenzitu poruch linií a turbokompresorů v konstantním čase. Například konfigurace 1 označuje nejpravděpodobnější stav, ve kterém jsou požadavky na transfer plynu minimální. V tomto stavu stačí pro bezporuchový provoz kompresorové stanice pouze činnost jedné vstupní linie, jednoho turbokompresoru a jedné výstupní linie, viz Obr. 1. Změna systémové konfigurace kompresorové stanice Požadavky na změnu systémové konfigurace kompresorové stanice přicházejí z dispečinku rozvodné sítě v souvislosti s uspokojováním měnících se požadavků zákazníků na objem přepravovaného plynu. Předkládaný model předpokládá s maximálně jedním požadavkem na změnu výkonu kompresorové stanice za 24 hodin. K častějším požadavkům na změnu výkonu kompresorové stanice v praxi nedochází. Model předpokládá, že číslo konfigurace se může měnit maximálně o dvě. Povolené změny scénáře mohou být např. 1 Æ 2, 2 Æ 3, 3 Æ 2, 1 Æ 3, nikoliv však 1 Æ 10. Tento předpoklad opět vychází z reálného chování kompresorové stanice v praxi.
301
Sborník konference REQUEST'06
Příklady povolených posloupností na změnu systémové konfigu-race kompresorové stanice: 1, 1, 1, 2, 1, 3, 2, 2, 1, 1, …. (celkem 365 čísel za rok provozu) 1, 1, 1, 1, 1, 2, 1, 1, 2, 3, 3, 2, 1, 1, ….. (celkem 365 čísel za rok provozu) Implementační detaily Požadavky na změnu konfigurací (posloupnost 365 čísel reprezentující konfigurace kompresorové stanice během jednoho roku) jsou v modelu generovány náhodně metodou Monte Carlo. Protože v současnosti nemáme k dispozici data o vytíženosti stanice, parametry rozdělení byly odhadnuty na základě předpokládaného chodu stanice. Jak již bylo uvedeno v úvodu, stanice se nejčastěji nachází ve stavu nejmenšího výkonu (konfigurace 1). Pro modelování scénářů byl použit markovovský model, viz Obr. 1 - Obr. 20. Pro snížení počtu stavů markovovského modelu používáme zjednodušených podmínek, ve kterých předpokládáme, že porucha dvou nebo tří linií na vstupu či výstupu vyvolá poruchu celého systému a obdobně porucha pěti a více turbokompresorů vyvolá také poruchu celého systému. Poznámka: Pro automatické generování pravděpodobnosti přechodů bylo použito následujícího značení scénářů. Příklad: Pokud je využito linií jedním směrem 1 druhým směrem 2 a zároveň jsou využity tři kompresory, dostáváme scénář: [1+2,3] = 33. (Zobrazení čísla scénáře a čísla konfigurace je jednoznačné.) Vzorce pro násobící koeficienty intenzit poruch v závislosti na čísle scénáře [dj]. Násobící koeficienty intenzit poruch budou celá kladná čísla. Vstup: číslo aktuálního stavu markovova řetězce [SDJ] (Vstup algoritmu: [dj], [SDJ]) Pro vstupní „linii“: min[3-S,d] Pro „turbokompresory“: min[7-D,j] Pro výstupní „linii“: min[3-J,d] Intenzity oprav jsou pro všechny scénáře shodné. Uvažuje se µ1 pro oba typy „linie“ (tj. µ1= µ3) a µ2 pro „turbokompresory“. (např.
302
P. Praks, J. Chudoba, R. Briš: Modelování spolehlivosti kompresorové stanice ...
přechod 020 do 010 znamená opravu jednoho „turbokompresoru“), a intenzita oprav je µ2. Šipka směrem „vlevo“ znamená opravu, šipka směrem „vpravo“ označuje poruchu. Vzorce pro definování poruchového stavu: Pro každý scénář a pro každý stav tohoto scénáře. (Vstup algoritmu: [dj], [SDJ]) Pro vstupní „linii“: Pokud 3-d-S <0, tak je [SDJ] poruchový Pro „turbokompresory“: Pokud 7-j-D <0, tak je [SDJ] poruchový Pro výstupní „linii“: 3-d-J <0, tak je [SDJ] poruchový Poznámka: Pokud nastane pro libovolně zvolený [SDJ] porucha, je tento stav poruchový. 4. Zpracování výsledků Jeden běh metody Monte Carlo vytvoří jeden soubor výsledků, které se vyhodnocují statisticky v časové závislosti, neboť poruchové stavy závisí na scénáři, tj. i na čase. Pohotovost je (pro opravitelné výrobky) dána součtem pravděpodobností funkčních stavů. Na Obr. 21 je ukázán efekt změny konfigurace kompresorové stanice na pohotovosti. Výpočet byl proveden užitím knihovny pro Markovské řetězce MEXPV, která počítá aproximaci řešení maticové exponenciály užitím Krylovských metod [13]. 5. Závěr Na závěr je třeba zdůraznit důležitost modelování spolehlivosti tranzitních sítí. Stojí za připomenutí, že 25. července trval v České republice celých devět hodin stav elektrické nouze, který byl vyhlášen kvůli mimořádně velkému výpadku proudu, největšímu za posledních 30 let. Přenos média se řídí podobnými zákonitostmi, ať už máme na mysli plyn nebo elektřinu. Jedná se o dálkové přenosy, v nichž ČR je často „jen“ tranzitní zemí. Několik poruch může vyvolat poruchu celého systému.
303
Sborník konference REQUEST'06
VTV VTV PV
PV VTV
PV
1 ze 3
PV
PV
1 ze 7
VTV VTV
1 ze 3
PV
VTV VTV
Obr. 1. Blokový diagram bezporuchovosti (RBD reliability block diagram) kompresorové stanice pro konfiguraci č. 1 – v provozu jedna linie na vstupu a výstupu (PV= potrubí a pojistný ventil) a v provozu jeden turbokompresor (VTV=vstupní ventil, turbokompresor a výstupní ventil. Šipky označují pohotovostní zálohu. V případě poruchy zařízení s pohotovostní zálohou nastartuje a nahradí zařízení s poruchou. Označení „1 ze 3“ znamená, že pro splnění funkce systému je potřeba alespoň jedno zařízení v provozuschopném stavu. Model předpokládá, že komponenta naběhne okamžitě a vždy. Model však umožňuje vzít v úvahu i možnosti selhání funkce zařízení při náběhu.
001
002
012
022
011
021
031
102 101 000
010
201 020
100
111
030
032
131
112 211 121
231 132 051
241
041 221
141
151
122 040
050
042
110
120
130
140
240
200
210
220
230
150
142
Obr. 2. Markovský model kompresorové stanice bez uvažování intenzity přechodů pro konfiguraci č. 1. Tyto intenzity přechodů závisí na konkrétním scénáři. Např. stav 132 reprezentuje poruchu jedné linie na vstupu, 3 turbokompresory v poruše a dvě porouchané linie na výstupu. Červeně jsou označeny poruchové stavy pro konfiguraci 1. V ostatních scénářích jsou poruchové stavy jiné.
304
P. Praks, J. Chudoba, R. Briš: Modelování spolehlivosti kompresorové stanice ...
VTV VTV PV
PV VTV
PV
1 ze 3
PV
PV
2 ze 7
VTV VTV
1 ze 3
PV
VTV VTV
Obr. 3. Blokový diagram bezporuchovosti (RBD reliability block diagram) kompresorové stanice pro konfiguraci č. 2.
001
002
012
022
011
021
031
102 101 000
010
201 020
100
111
030
032
131
112 211 121
231 132 051
241
041 221
141
151
122 040
050
042
110
120
130
140
240
200
210
220
230
150
142
Obr. 4 Markovský model kompresorové stanice bez uvažování intenzity přechodů pro konfiguraci č. 2.
305
Sborník konference REQUEST'06
VTV VTV PV
PV VTV
PV
2 ze 3
PV
PV
2 ze 7
VTV VTV
2 ze 3
PV
VTV VTV
Obr. 5 Blokový diagram bezporuchovosti (RBD reliability block diagram) kompresorové stanice pro konfiguraci č. 3.
001
002
012
022
011
021
031
102 101 000
010
201 020
100
111
030
032
131
112 211 121
231 132 051
241
041 221
141
151
122 040
050
042
110
120
130
140
240
200
210
220
230
150
142
Obr. 6 Markovský model kompresorové stanice bez uvažování intenzity přechodů pro konfiguraci č. 3.
306
P. Praks, J. Chudoba, R. Briš: Modelování spolehlivosti kompresorové stanice ...
VTV VTV PV
PV VTV
PV
2 ze 3
PV
PV
3 ze 7
VTV VTV
2 ze 3
PV
VTV VTV
Obr. 7 Blokový diagram bezporuchovosti (RBD reliability block diagram) kompresorové stanice pro konfiguraci č. 4.
001
002
012
022
011
021
031
102 101 000
010
201 020
100
111
030
032
131
112 211 121
231 132 051
241
041 221
141
151
122 040
050
042
110
120
130
140
240
200
210
220
230
150
142
Obr. 8 Markovský model kompresorové stanice bez uvažování intenzity přechodů pro konfiguraci č. 4.
307
Sborník konference REQUEST'06
VTV VTV PV
PV VTV
PV
2 ze 3
PV
PV
4 ze 7
VTV VTV
2 ze 3
PV
VTV VTV
Obr. 9 Blokový diagram bezporuchovosti (RBD reliability block diagram) kompresorové stanice pro konfiguraci č. 5.
001
002
012
022
011
021
031
102 101 000
010
201 020
100
111
030
032
131
112 211 121
231 132 051
241
041 221
141
151
122 040
050
042
110
120
130
140
240
200
210
220
230
150
142
Obr. 10 Markovský model kompresorové stanice bez uvažování intenzity přechodů pro konfiguraci č. 5.
308
P. Praks, J. Chudoba, R. Briš: Modelování spolehlivosti kompresorové stanice ...
VTV VTV
PV
PV
VTV PV
3 ze 3
PV
PV
3 ze 7
VTV VTV
3 ze 3
PV
VTV VTV
Obr. 11 Blokový diagram bezporuchovosti (RBD reliability block diagram) kompresorové stanice pro konfiguraci č. 6.
001
002
012
022
011
021
031
102 101 000
010
201 020
100
111
030
032
131
112 211 121
231 132 051
241
041 221
141
151
122 040
050
042
110
120
130
140
240
200
210
220
230
150
142
Obr. 12 Markovský model kompresorové stanice bez uvažování intenzity přechodů pro konfiguraci č. 6.
309
Sborník konference REQUEST'06
VTV VTV
PV
PV
VTV PV
3 ze 3
PV
PV
4 ze 7
VTV VTV
3 ze 3
PV
VTV VTV
Obr. 13 Blokový diagram bezporuchovosti (RBD reliability block diagram) kompresorové stanice pro konfiguraci č. 7. Řešený scénář (34).
001
002
012
022
011
021
031
102 101 000
010
201 020
100
111
030
032
131
112 211 121
231 132 051
241
041 221
141
151
122 040
050
042
110
120
130
140
240
200
210
220
230
150
142
Obr. 14 Markovský model kompresorové stanice bez uvažování intenzity přechodů pro konfiguraci č. 7.
310
P. Praks, J. Chudoba, R. Briš: Modelování spolehlivosti kompresorové stanice ...
VTV VTV
PV
PV
VTV PV
3 ze 3
PV
PV
5 ze 7
VTV VTV
3 ze 3
PV
VTV VTV
Obr. 15 Blokový diagram bezporuchovosti (RBD reliability block diagram) kompresorové stanice pro konfiguraci č. 8.
001
002
012
022
011
021
031
102 101 000
010
201 020
100
111
030
032
131
112 211 121
231 132 051
241
041 221
141
151
122 040
050
042
110
120
130
140
240
200
210
220
230
150
142
Obr. 16 Markovský model kompresorové stanice bez uvažování intenzity přechodů pro konfiguraci č. 8.
311
Sborník konference REQUEST'06
VTV VTV
PV
PV
VTV PV
3 ze 3
PV
PV
6 ze 7
VTV VTV
3 ze 3
PV
VTV VTV
Obr. 17 Blokový diagram bezporuchovosti (RBD reliability block diagram) kompresorové stanice pro konfiguraci č. 9.
001
002
012
022
011
021
031
102 101 000
010
201 020
100
111
030
032
131
112 211 121
231 132 051
241
041 221
141
151
122 040
050
042
110
120
130
140
240
200
210
220
230
150
142
Obr. 18 Markovský model kompresorové stanice bez uvažování intenzity přechodů pro konfiguraci č. 9.
312
P. Praks, J. Chudoba, R. Briš: Modelování spolehlivosti kompresorové stanice ...
VTV VTV
PV
PV
VTV PV
3 ze 3
PV
PV
7 ze 7
VTV VTV
3 ze 3
PV
VTV VTV
Obr. 19 Blokový diagram bezporuchovosti (RBD reliability block diagram) kompresorové stanice pro konfiguraci č. 10.
001
002
012
022
011
021
031
102 101 000
010
201 020
100
111
030
032
131
112 211 121
231 132 051
241
041 221
141
151
122 040
050
042
110
120
130
140
240
200
210
220
230
150
142
Obr. 20 Markovský model kompresorové stanice bez uvažování intenzity přechodů pro konfiguraci č. 10.
313
Sborník konference REQUEST'06
Obr. 21 Poh hotovost systém mu ve scénáři 34 po dobu jed dnoho roku se změnou konfigurace v čase t=8760 0 hodin na scén nář 24. V modellu je uvažováno µ = 1/720 a λ = 1/87600.
Literaturaa [1] Briš R.: One Computation C Algorithm for Multiob bjective Mainttenance Optim mization. In Proceedings of European n Safety and Reliability Conference ESREL 20005. Ed. Krrzysztof wrocki, Londo on:Taylor & Francis F Group p, 2005, pg. 249-255, 2 Kolow ISBN 0-415-38340-4 4 [2] Briš R R., Praks P.: Siimulation Ap pproach for M Modeling of Dynamic D Reliab bility using Tiime Dependeent Acyclic Grraph. Special Issue I of the IInternational Journal of Polish Acaademy of Sciences S “Main ntenance and d Reliability” Nr 2(30)/20006. Ed. I. B. Frenkel, F A. Lissnianski, pg. 26-28. 2 ISSN 15507-2711; Also aat http://darm maz.pollub.pll/ein/fultext/ /30.pdf (as of March 13th, 2006). 2
314
P. Praks, J. Chudoba, R. Briš: Modelování spolehlivosti kompresorové stanice ...
[3] Briš R., Praks, P.: Reliability assessment of a parallel system with six reliable components using direct Monte Carlo and Importance Sampling. In 6-th Int. Sci. Conf. Electric Power Engineering 2005. VŠB-TU Ostrava, pg. 1-7, ISBN 80-248-0842-0 [4] Chudoba J.: Evaluation of dependability by using Markov analysis. International Workshop on Electronics, Control, Measurement and Signals. Toulouse, 2005. [5] Chudoba J.: Analysis of the probability of car accidents. In: The second international conference “Reliability, safety and diagnostics of transport structures and means 2005”. Pardubice, 2005. [6] Lisnianski A., Levitin G., Multi-State System Reliability. Assessment, Optimization, Applications. World Scientific, New Jersey, London, Singapore, Hong Kong, 2003 [7] Moler C., Loan C. V.. Nineteen Dubious Ways to Compute the Exponential of a Matrix, Twenty-Five Years Later. SIAM REVIEW 2003; Society for Industrial and Applied Mathematics, Vol. 45, No. 1, pp. 3–49 [8] Praks P., Machala L., Snášel V.: On SVD-free Latent Semantic Indexing for Iris Recognition of Large Databases. In V. A. Petrushin and L. Khan (Eds.) Multimedia Data mining and Knowledge Discovery (Part V, Chapter 24); Springer Verlag. To appear (2006); [invited contribution] [9] Praks P., Konečný P.: Direct Monte Carlo Method vs. improved methods considering applications in designers every day work. Chapter 23 in book: Marek P., Brozzetti J., Guštar M., Tikalsky P. (eds): Probabilistic Assessment of Structures using Monte Carlo Simulation. Basics, Exercises, Software (Sec. edition). ITAM Academy of Sciences of the Czech Republic, 2003, ISBN: 80-86246-19-1 [10] Praks P., Černohorský J., Svátek V., Vacura M.: Human Expert Modelling Using Semantics-Oriented Video Retrieval for Surveillance in Hard Industry. ACM MobiMedia 2006: 2nd International Mobile Multimedia Communications Conference. K-Space special session on Automatic Annotation and Retrieval of Multimedia Content. 18-20 September 2006, Alghero, Sardinia, Italy [11] Praks P., Černohorský J., Briš R.: Linear Algebra for Monitoring of Industrial Processes in Heavy Industry. A one-day meeting in honor of prof. Miroslav Fiedler. J. Rohn et al. (eds). The Institute
315
Sborník konference REQUEST'06
of Computer Science jointly with the Mathematical Institute Academy of Sciences of the Czech Republic, Prague, June 12, 2006, pg. 6-7. Also at http://www.cs.cas.cz/~fiedler80/book.pdf [12] Praus P., Praks P.: Information retrieval in hydrochemical data using the latent semantic indexing approach. Journal of Hydroinformatics. 2007. IWA Publishing, London, UK, ISSN 1464-7141. In print. [13] Roger B. Sidje. Expokit: A Software Package for Computing Matrix Exponentials. In ACM Transactions on Mathematical Software, Vol. 24, No. 1, March 1998, Pages 130-156. [14] Žežula L., Heřmanský B., Praks P.: Methodology for Evaluation of Projects of Nuclear Power Plants Generation III. (Metodika pro hodnocení projektů jaderných elektráren III. generace, in Czech). Report No. UJV Z 1475 T, Nuclear Research Institute Řež plc, December 2005
Adresy autorů: Ing. Pavel Praks, Ph.D., Vysoká škola báňská – Technická univerzita Ostrava, fakulta elektrotechniky a informatiky, katedra aplikované matematiky, Tř.17.listopadu 15, 708 33 Ostrava-Poruba. e-mail:
[email protected] Ing. Josef Chudoba, Technická univerzita v Liberci, Fakulta mechatroniky a mezioborových inženýrských studií, Katedra modelování procesů, Hálkova 6, 461 17 Liberec 1 e-mail:
[email protected] Doc. Ing. Radim Briš, CSc., Vysoká škola báňská – Technická univerzita Ostrava, fakulta elektrotechniky a informatiky, katedra aplikované matematiky, Tř.17.listopadu 15, 708 33 Ostrava-Poruba. e-mail:
[email protected]
Tato práce byla vytvořena v rámci projektu MŠMT 1M06047 - CQR.
316
Příklad použití klasifikačního stromu ve spolehlivosti software – metoda plovoucích mezí Jan A. Strouhal
Abstrakt: Příspěvek se zabývá příkladem konstrukce klasifikačního stromu pro použití ve spolehlivosti software. V první části je popsána základní konstrukce, která počítá s expertním počtem i hodnotami hranic metrik, v další části je popsán příklad vylepšení této základní konstrukce vyhledáním optimálních hranic metrik pomocí programu.
Klasifikační stromy Vezmeme-li části programu (moduly), které máme již otestované, můžeme z jejich vlastností (metrik) zkonstruovat klasifikační strom, kterým pak můžeme klasifikovat netestované části programu, u kterých chceme zjistit, zda je máme či nemusíme testovat. Tento zkonstruovaný strom nám může pomoci zkrátit dobu testování nebo dokonce zvýšit spolehlivost, protože se při testování zaměříme více na části, které jsou skutečně potřeba otestovat a odladit. Postup byl řešen na konferenci ROBUST 2006. Funkce výběru metrik:
F ( pi ; ni ) = −
pi pi ni ni log 2 log 2 − , pi + ni pi + ni pi + ni pi + ni
kde p je počet pozitivních modulů (+ třída), a n je počet negativních modulů v i-tém uzlu. Čím je F menší, tím větší je homogenita v uzlu. Metriku, pro níž je E (C , A) =
v
∑ [w * F ( p , n )] , i
i =1
použijeme jako kořen.
317
i
i
kde wi =
pi + ni C
Sborník konference REQUEST'06
Popis vstupních údajů Dále popsané vstupní údaje jsou z vyvýjeného programu CSC Atlas pro správu domů, kde jednotlivé moduly jsou ucelenými částmi tohoto programu tj. objednávky, faktury, domy, jednotky, nájemci, evidence plateb, atd. Data o těchto modulech byla sbírána v průběhu roku 2005, nově klasifikované moduly taktéž. Základní konstrukce – pevné meze Vstupní údaje U závislé proměnné (metrika: počet chyb) budeme předpokládat, že při počtu chyb větším než 120 je modul náchylný k chybám a tudíž jej budeme řadit do + třídy Modul C D G Metrika A B E F H I J K 125 130 80 Počet chyb 30 20 105 140 12 32 25 14 + + + Třída Nezávislé proměnné (metriky: funkce, propojení dat, počet revizí) Metrika Funkce Propojení dat Počet revizí
A R 90 0
B R 20 7
C F 200 6
D R 150 4
E P 110 3
Modul F G F P 50 0 10 11
H P 170 2
I P 82 5
J P 190 9
K R 70 2
Kódování Vezmeme nezávislé proměnné (metriky: funkce, propojení dat, počet revizí) a pomocí kódování rozdělíme do tří skupin α , β , γ γ α Metrika β Funkce
α =Práce se
soubory (F)
Propojení dat α = 0 ≤ x ≤ 79 Počet revizí α =0≤ x≤3
β =Uživatelské rozhraní (R)
β = 80 ≤ x ≤ 149 β =4≤ x≤8
318
γ =Řízení
procesu (P)
γ = x ≥ 150 γ = x≥9
J. A. Strouhal: Příklad použití klasifikačního stromu ve spolehlivosti software ...
můžeme pak psát Modul A B
Metrika Funkce
β Propojení dat β α Počet revizí
β α β
Třída
-
-
C
α γ β
+
D
E
F
G
H
I
J
K
β
γ β α
+
-
-
+
-
-
-
-
β γ
α α γ
γ α γ
γ γ α
γ β β
γ γ γ
β α α
Příklad výpočtu pro základní kořen – uvažována Metrika „Funkce“ Pomocí metriky „Funkce“ rozdělíme (tučně zvýrazněny pozitivní α - C,F; γ - E,G,H,I,J β - A,B,D,K; třídy): P n Celkem váha F(p,n) Váha*F(p,n) Větev 1 1 1 11 0,182 0,000 0,000 Větev 2 1 3 11 0,364 0,811 0,295 Větev 3 1 4 11 0,455 0,722 0,328 Součet 0,623
Počet revizí
.α (≤3)
.γ (≥9)
β (4÷8)
A, E, H, K (M,R)
Funkce B, C, D, I (N,P,Q,S,T) .α (F)
– .α (≤79) B (N)
Propojení dat
.β (P)
.γ (R)
G
J
+
–
.γ (≥150) C, D (Q)
β (80÷149)
F (O)
I (P,S,T)
–
–
+
–
Obr. 1: Výsledný strom (kurzívou v závorce vyznačeny nově klasifikované moduly)
319
Sborník konference REQUEST'06
Nově klasifikované moduly Pro nová data získaná dalším testováním na dalších modulech získáváme po průchodu stromem jejich výsledné třídy. Průchod je vidět ve stromu z kurzívou označených modulech. Nezávislé proměnné (metriky: funkce, propojení dat, počet revizí) Metrika Funkce Propojení dat Počet revizí Třída
Modul M R 195 2 -
N R 75 4 -
O F 0 11 -
P R 130 8 -
Q P 172 7 +
R F 51 0 -
S P 24 5 -
T P 132 5 -
Závěr: Pro modul Q je vysoká pravděpodobnost více než 120 chyb. Nová metoda – metoda plovoucích mezí Při vytváření klasifikačního stromu předem dané (expertní) hranice metrik nemusí být vždy optimální a mohou způsobovat vytvoření stromu se slepými koncovými listy nebo s koncovými listy, které jsou stále nehomogenní přestože jsou již vyčerpány všechny metriky. Pokud však budeme procházet všechny možné meze (také i počet mezí) můžeme dostat menší hodnoty E() a tím i lepší dělení jednotlivých větví stromu. Tuto metodu nazveme metoda plovoucích mezí. Protože by bylo náročné procházet ručně všechny možné meze a zjišťovat vhodnou metriku a meze vytvořili jsme pomocný program, který propočítává minimum E() přes všechny metriky. Program generuje tyto meze v polovinách mezi všemi naměřenými hodnotami pro danou metriku. Výsledkem (výstupem) programu je vyhledání optimální metriky pro kořen (přes minimum E()). Následně je pak možné vybrat pouze moduly jdoucí určitou větví a znovu určit optimální metriku pro další kořen. Vstupní údaje Pro konstrukci stromu pomocí nové metody jsme opět použili údaje z programu CSC Atlas.
320
J. A. Strouhal: Příklad použití klasifikačního stromu ve spolehlivosti software ...
.α (≤3)
Počet revizí
.β (>3)
B, C, D, I, F, G, J
A, E, H, K
–
.γ (≥86)
Propojení dat
.α (≤10)
C, D, J
G .β <10÷86> B, F, I
–
Funkce
.α (P)
.β (F)
.γ (R)
J
C
D
–
+
+
Obr. 3: Aplikace klasifikačního stromu na nových modulech pro novou metodu Nezávislé proměnné (metriky: funkce, propojení dat, počet revizí) Modul O P Metrika M N Q R S T + + Třída -
321
+
Sborník konference REQUEST'06
Závěr: Pro moduly O a P je vysoká pravděpodobnost více než 120 chyb. Tento výsledek byl potvrzen empiricky a lze tedy konstatovat, že nová metoda se v tomto případě ukázala být lepším odhadem modulů náchylných k chybám. Literatura [1] Strouhal J. A.: Klasifikační stromy ve spolehlivosti software. Sborník příspěvků konference ROBUST 2006, JČMF Praha, ISBN 80-7015-073-4, str. 461-468 [2] Hahn A., Radkova L., Achiemere G., Klement V., Strouhal J.: Evaluation of Our Therapeutic Approach to the Patients Suffering from Chronic Tinnitus. Acta Oto-Laryngologica, zasláno k publikaci [3] Dohnal G.: Markovské modely spolehlivosti software. Sborník příspěvků konference ROBUST 2006, JČMF Praha, ISBN 80-7015-073-4, str. 453-461 Adresa autora: Ing. Jan Adam Strouhal, České vysoké učení technické v Praze, Fakulta strojní, Ústav technické matematiky, Karlovo nám. 13, 121 35 Praha 2 e-mail:
[email protected] Tato práce byla vytvořena v rámci projektu MŠMT 1M06047 - CQR
322
Využití predikce vlastností kompozitů s textilní výztuží pro optimalizaci výrobního procesu Blanka Tomková Abstrakt: V této práci je ukázána problematika predikce materiálových vlastností kompozitů s textilní výztuží a její využití při vývoji kompozitních materiálů a řízení výroby kompozitních dílů pro konkrétní aplikace.
1. Úvod Kompozitní materiály s textilní výztuží patří k nejdynamičtěji se rozvíjející skupině nových materiálů. Jestliže do pryskyřice či plastu přidáme výztuž ve formě vláken, která mají vysokou tuhost, pevnost a teplotní stabilitu, získáme zcela novou, unikátní skupinu materiálů kombinující synergicky vlastnosti výztuže se snadností zpracování polymerů. Tato skupina materiálů se nazývá vláknové polymerní kompozity či vláknové kompozity s polymerními matricemi. Vlastnosti, použití i způsob konstruování těchto materiálů umožňuje současným konstruktérům překonat konstrukční omezení nejrozšířenějších materiálů - kovů, betonu a ostatních tradičních materiálů - a vytvářet nové výrobky zcela unikátních vlastností [1]. V praxi je ovšem třeba kromě výhod pečlivě zvážit i případné nevýhody kompozitů. Některé z nich nejsou skutečnými nevýhodami, spíše vyjadřují významnou odlišnost ve způsobu zpracování kompozitních materiálů v porovnání s materiály tradičními, což může působit jisté komplikace při konstruování nových výrobků. Ve většině případů je totiž kompozitní materiál vyráběn v jednom kroku s konečným produktem (laminace sportovních lodí, navíjení rybářských prutů, tažení profilů, atd.) a je tedy obtížné oddělit vlastnosti materiálu od užitných vlastností výrobku, což je u tradiční konstrukční oceli velmi snadné a podstatně to zjednodušuje optimalizaci a spolehlivost konstrukčních postupů.
323
Sborník konference REQUEST'06
Z tohoto důvodu existuje velmi omezená databáze konstrukčních dat pro samotné kompozity. Proto jsou v technické praxi využívány matematické modely - simulace umožňující predikci vlastností navrhovaných kompozitních systémů na základě znalosti vlastností vyztužujících vláken a polymerních matric, znalosti časově-teplotních režimů vytvrzování matric apod. Do výpočtu dále vstupuje i složitá vnitřní geometrie kompozitního systému, která závisí jednak na technologii přípravy kompozitu, jednak na typu použité textilní výztuže (jednosměrně uložené kabílky, tkaniny, pleteniny, 3D splétané výztuže apod.) Kompozity s textilní výztuží patří mezi heterogenní materiály se složitou, většinou porézní strukturou. Dokonce ani na úrovni mikrostruktury zde nenajdeme homogenní materiál. Proto byl v předložené práci pro výpočet materiálových vlastností kompozitů vytvořen vícestupňový strukturní model, kdy byly struktura a vlastnosti materiálu počítány postupně na nano-, mikro- , mezo- a makroúrovni. Účelem numerické simulace bylo dosažení předpovědi s co možná největší přesností. Taková predikce umožňuje ušetření času a finančních prostředků při řízení, ovládání, vývoji a výrobě kompozitních materiálů pro konkrétní aplikace.
2. Projektování kompozitu 2.1 Predikce vlastností kompozitů Vlastnosti kompozitních materiálů jsou funkcí řady parametrů, mezi nimiž jsou nejdůležitější: vlastnosti matrice a výztuže, délka vláken výztuže, soudržnost matrice a výztuže, objemový podíl a uspořádání vláken výztuže atd. V dnešní době se základním zdrojem strukturních dat staly mikrofotografie kompozitní struktury, které umožňující přímé vyhodnocení morfologie výztuže, matrice i dutin, jak je ukázáno například na obrázku Obr.1. Důkladná analýza mikrostruktury kompozitů je základem pro tvorbu geometrických modelů, které slouží jako vstupní data pro výpočet materiálových vlastností studovaných kompozitů [2,7]. Snaha o zohlednění parametrů reálné struktury ve výpočtových modelech vyvolává následující otázky:
324
B. Tomková: Využití predikce vlastností kompozitů s textilní výstuží ...
• • •
které geometrické parametry měřit jak tato data zapracovat do strukturních modelů jak je využít pro popis vztahu mezi technologií výroby, vlastnostmi materiálu a jeho strukturou
Řešení těchto otázek je hlavní oblastí zájmu současného materiálového výzkumu [2,4,5,10]. 2.2 Vícestupňové strukturní modely Vícestupňové strukturní modely jsou s úspěchem používány pro výpočet vlastností mnoha složitých systémů [4,9]. Na katedře textilních materiálů TU Liberec byl vytvořen vícestupňový strukturní model pro výpočet vlastností tkaninových laminátů [11,12]. Základní strukturní data byla získána pomocí obrazové analýzy stuktury kompozitních laminátů. Tento model byl původně aplikovaný pro simulaci přestupu tepla v kompozitní desce.
Obr.1 Fotografie mikrostruktury kompozitu C/C, rozlišení 1,7 µm/px, 1,2 - výztuž, 3 - matrice, 4 - dutina; Výztuž – Uhlíková tkanina v plátnové vazbě – vlákna Toray T800; Prekurzor matrice – fenolická pryskyřice UMAFORM LE; Pórovitost 25 – 30%
325
Sborník konference REQUEST'06
Obr.2 Schéma vícestupňového strukturního modelu: a) uhlíkový kabílek (1 – podélný řez, 2 – příčný řez), b) strukturní buňka kompozitu, c) kompozitní lamina, d) kompozitní deska Pro řešení diferenciální rovnice vedení tepla byl použit software FEMLab, výpočtový modul HEAT TRANSFER MODE, který umožňuje interaktivní zadání vstupních parametrů materiálových složek, vstupních a okrajových podmínek s ohledem na strukturu a vlastnosti jednotlivých složek studovaného materiálu včetně složitého systému pórů a trhlin [6].
Obr.3 Simulace přenosu tepla v kompozitní desce
326
B. Tomková: Využití predikce vlastností kompozitů s textilní výstuží ...
Získané výsledky vypočtené metodou konečných prvků byly ověřeny experimentálním měřením termofyzikálních parametrů na pracovišti Fyzikálního ústavu SAV v Bratislavě (použití tzv. Impulzní metody) [3] Porovnání vypočtených hodnot s hodnotami zjištěnými experimentálně ukázalo, že vypočtené a simulované hodnoty se liší o méně než 20 % (viz. Tab. 1), což ukazuje na dobrou spolehlivost použitého modelu. Tab.1 Výsledné hodnoty termofyzikálních parametrů kompozitní desky ve směru podélném a kolmém k ploše této desky Termofyzikální parametry
Počítané
Měřené
Tepelná vodivost [W.m-1.K-1]
[8.3; 1.8]
[10; 1.6]
Měrné teplo [J.kg-1.K-1]
970
775
Teplotní vodivost *10-6 [m2.s-1]
[5.9; 1.3]
[6.5; 1.3]
Výhodou tohoto přístupu je aplikovatelnost na širokou škálu materiálů, pokud jsme schopni vytvořit geometrický model studované struktury ať už s použitím mikrofotografií studované struktury nebo na základě teoretických modelů struktury. Dále musíme být schopni stanovit materiálové parametry vstupních složek a zadat počáteční a okrajové podmínky řešené úlohy. Software FemLab umožňuje řešení řady inženýrských úloh v oblasti fyziky, průmyslové chemie, pružnosti a pevnosti, akustiky, elektromagnetismu, prostupu tepla, proudění tekutin, optoelektroniky a dalších. Data získaná simulací vlastností studovaných materiálů mohou sloužit jako zdroj informací při návrhu složení nových materiálů pro konkrétní aplikace. 2.3 Technologie přípravy textilních kompozitů Technologie přípravy kompozitního dílu výrazně ovlivňuje strukturu a vlastnosti finálního produktu, zejména vlastnosti matrice, vlastnosti rozhraní mezi matricí a výztuží, geometrii výztuže apod., neboť jak už bylo uvedeno kompozitní materiál je vyráběn v jednom kroku s konečným produktem a nelze oddělit vlastnosti materiálu od
327
Sborník konference REQUEST'06
užitných vlastností výrobku. Výběr vhodné technologie výroby je tedy nedílnou součástí návrhu nového kompozitního materiálu. Kompozity jsou připravovány mechanickým mísením jednotlivých složek. Tím se liší např. od slitin, které jsou rovněž heterogenním materiálem, kde jednotlivé fáze vznikají fázovými přeměnami např. při tuhnutí. Způsobů výroby kompozitních dílů je velmi mnoho, nejčastěji se setkáváme s dělením výrobních technologií dle typu formy [8]: •
Otevřená (jednodílná) forma
•
Uzavřená (dvoudílná) forma
Výběr kompozitní formy závisí na typu výztuže (krátká vlákna, dlouhá vlákna, 2D textilie apod.) a typu matrice. Z hlediska materiálu polymerní matrice dělíme na termoplastové a termoseto-vé. Nejpoužívanější (a nejlevnější) termoplastové matrice jsou matrice na bázi polypropylénu a polyamidu. O způsobu výroby kompozitu (ohřevu formy) pak rozhoduje pouze teplota měknutí příslušného termoplastu. Použití termosetových pryskyřic je poněkud složitější. Kvalita výsledné matrice je závislá na celé řadě vstupních parametrů, do samotné pryskyřice je přidávána celá řada aditivních přípravků ovlivňujících viskozitu pryskyřice, rychlost vytvrzovací reakce, teplotu vytvrzení pryskyřice apod. Většina těchto látek obsahuje těkavé složky, které negativně ovlivňují pracovní prostředí. Typ formy zde potom rozhoduje např. o způsobu odpařování reaktivních rozpouštědel. Samotné vytvrzování reaktoplastů je proces sestávající z několika etap, které lze popsat pomocí kinetiky vytvrzovacích procesů. Kinetika vytvrzovacího procesu vždy závisí na typu pryskyřice. Každý typ matrice (termoplast, termoset) má určité klady a zápory, k nimž je potřeba při návrhu pojiva kompozitu přihlížet. Rozhodující jsou nejen užitné a technologické vlastnosti matric, ale i cena vstupního materiálu a variabilita jeho použití. Proto je pro návrh technologie výroby nezbytná důkladná znalost vztahu mezi strukturou a vlastnostmi vstupních složek a výsledného kompozitního materiálu.
328
B. Tomková: Využití predikce vlastností kompozitů s textilní výstuží ...
3. Shrnutí Predikce vlastností finálních kompozitních výrobků na základě znalostí parametrů vstupních složek umožňuje ušetření času a finančních prostředků při řízení, ovládání, vývoji a výrobě kompozitních materiálů pro konkrétní aplikace. Vzhledem k tomu, že každý kompozitní materiál vzniká až během zhotovování výrobku, skutečné materiálové vlastnosti jsou silně determinované použitými složkami, skladbou a procesem zpracování. Tyto vlastnosti mohou být stanoveny až ex-post, na hotovém výrobku. Tato primární neurčitost přináší obtíže do jakéhokoliv konstruování a pevnostního návrhu. Pro konstruování kvalitních výrobků z kompozitních materiálů je nezbytné důkladné porozumění anizotropii kompozitních struktur, včetně všech možností jejího uspořádání, znalost vlivu prostředí na vlastnosti kompozitů a namáhání dané konstrukce, včetně vlivu jednotlivých kompozitních složek na její odezvu. Cílem tohoto procesu je vytvořit systém kde materiál, dimenzování, tvarování, technologické zpracování, funkčnost, životnost a bezpečnost jsou uvažovány společně jako nedílné aspekty jediné záležitosti. Takový přístup umožňuje použití pokročilých matematických nástrojů a moderní výpočetní techniky spolu s možností přípravy kompozitních vzorků a testování jejich vlastností . Zvládnutí techniky pro spolehlivou predikci struktury a vlastností složitých kompozitních materiálů umožňuje přípravu velmi individuálních materiálů šitých namíru přesně pro dané účely. Finální výrobek je přesně přizpůsobený předem zadaným požadavkům. Výběr vhodných materiálů složek, spolu se správným tvarováním a dimenzováním součástí a konstrukce umožňuje vytvořit díly s širokým spektrem mechanických, fyzikálních a ostatních výsledných vlastností. Literatura [1]
Agarwal, B.D., Broutman, L.J.: Vláknové kompozity, SNTL, Praha, 1998.
[2]
Bigaud,D. at al.: A geometric modelling software for reinforced textile composites, Sb. konference Euromech 334, Lyon, 1995.
329
Sborník konference REQUEST'06
[3]
Boháč,V.: Měření termofyzikálních vlastností kompozitů C/C, interní zpráva SAV, Bratislava, 2005.
[4]
Cox,B.N., Flanagan,G.: Handbook of Analytical Methods for Textile Composites, NASA Contractor Report 4750, Langley Research Center, Hampton, Viginia, 1997.
[5]
Crookston, J.J., and others: Finite Element Analysisi of Textile Composite Unit Cells Using Conventional and Novel Techniques, Sb. konference 15th ICCM, Durban, South Africa, 2005, 327-328.
[6]
FEMLAB, User’s Guide and Introduction, Verze 2.3, COMSOL AB, 2002.
[7]
Jortner, J.: Microstructure of cloth-reinforced carbon-carbon laminates, Carbon, Vol.30, No.2, 1992, pp. 153-163.
[8]
Kořínek, Z.: Kompozity - skriptum, http://www.volny.cz/zkorinek
[9]
Piat,R., Schnack,E.: Hierarchical material modelling carbon/carbon composites, Carbon, 41, 2003, 2121-2129.
of
[10] Sherburn, M.N., Long A.C., Robitaille, Jones, I.A.: Mechanical Properties of Fibre Assemblies and Textile Unit Cells, Sb. konference 15th ICCM, Durban, South Africa, 2005, 343-344. [11] Tomková, B.: Modeling of Heat Transfer in Porous C/C Composite Reinforced with Woven Fabric, Sb. konference 12th ECCM, Biarritz, Francie, 2006. [12] Tomková, B.: Modelling of Thermophysical Properties of Woven Composites, Disertační práce, TU v Liberci, 2006. Adresa autorky: Ing. Blanka Tomková, Technická univerzita v Liberci, Fakulta textilní, Katedra textilních materiálů, Hálkova 6, 46117 Liberec e-mail:
[email protected] Tato práce byla vytvořena v rámci projektu MŠMT 1M06047 - CQR
330
A Statistical Model of Time-to-Failure Decrease Caused by a Random Shock Petr Volf
Abstract. We consider a time-to-failure of a technical object or
system and a special model of its abrupt degradation caused by a random shock. It is assumed that the consequence of such an event is the shift of 'virtual' age of the object forward, i.e. the reduction of its survival time. We shall present a method of statistical analysis of the case, maximum likelihood estimation and the consistency of the shift estimate under both parametric (e.g. Weibull) and non-parametrized models of time-to-failure. The examples deal with simulated as well as with the real-case data. Keywords: Time to failure, hazard rate, reliability, degradation model.
1 Introduction The contribution deals with the analysis of the time-to-failure of technical objects in the case that there can occur certain events increasing (abruptly) the degradation of the system and thus lowering its survival time. There are several approaches how to model the system degradation and its connection with the survival. For instance, a special model of the degradation growth can be formulated as a random process of a continuous nature (e. g. a Wiener process with a drift) or a step-wise random shocks model (actually a compound point process). The failure can be connected with its directly (failure occurs when the degradation crosses a certain, also randomized, level) or indirectly degradation level is used as a covariate in a regression model of failure intensity. Even the cumulated intensity of failure itself is a natural measure of the wear, the failure occurs when cumulated intensity crosses a random value from the unit exponential distribution. In the present paper a rather simple case is studied: Let us imagine that certain object, at age S , passes a shock which shifts its virtual age
331
Sborník konference REQUEST'06
forward by a shift D, so that from this moment the object behaves (and is more prone to failure) like being of virtual age t + D instead the actual age t. Figure 1 gives a sketch of the relation between an 'ideal' times Texp (expected if there is no shock) and actual Tobs (observed) lifetimes. The level τ is a random number from unit exponential distribution. 100
3.5 τ
90
D
D
Texp
3 80
D
60
2
C.H.R.
virtual time
D
2.5
70
50
1.5 40
30
1
20 0.5 10 S 0
0
20
40 60 Real time
Tobs
S
Texp 80
100
0
0
20
Texp
Tobs
40 60 Age − lifetime
80
100
Figure 1: Fig.1. A scheme of lifetime reduction caused by a shock Notice that the setting is similar to the models of non-perfect repairs (Kijima, 1989), where it is assumed that the repair of an object at age S shifts its virtual age backwards by d·S , d ∈ [0, 1]. In this case, such a choice of shift magnitude is rather natural, d = 1 corresponds to perfect repair, d = 0 to minimal repair. We let, for the present, the problem how to choose the shift in our case open, we assume that the shift is the same constant D for all objects, at each time of shock. We concentrate to a question whether the shift magnitude D is reasonably estimable from the data. The next part will show the MLE of D, its consistency and even asymptotic normality. Then, the method will be illustrated on examples.
2 ML Estimation of shift D It is assumed that the survival times of followed objects are i.i.d. random variables Ti given by a distribution with p.d.f. f (t) and c.d.f. F (t), f (t) with existing derivatives up to the 3-rd. This survival means an ideal survival
332
P. Volf: A statistical model of time-to-failure decrease caused by a random shock.
in the case without any shock. The times Si of shocks (relative, i. e. their times starting from the same zero as Ti ) are also i.i.d. (g(s), G(s)) and independent on Ti − s. Hence, observed data times of real failures, Xi have the following structure: If Ti < Si , then Xi = Ti , we use d1i = 1 as an indicator of such a case, i.e. d1i = 0 otherwise. If Ti > Si + D, then Xi = Ti − D > Si , i. e. underlying Ti = Xi + D, we use indicator d2i = 1. If Si ≤ Ti ≤ Si + D, then Xi = Si and underlying value of Ti is interval censored. For this case let us use the indicator d3i = 1. In last two cases Si is observed, in the rst one values Si are not necessary for the analysis.
2.1 Estimation of D when f (t) is known The likelihood of D, given data Xi , dji (j = 1, 2, 3), Si (at least in the cases 2, 3) is the following:
Ln (D) =
n Y
f (Xi )d1i · f (Xi + D)d2i · (F (Si + D) − F (Si ))d3i .
i=1
Hence, its logarithm and rst two derivatives w.r. to D are `n (D) =
=
n X
{d1i log f (Xi ) + d2i log f (Xi + D) + d3i log(F (Si + D) − F (Si ))} ,
i=1
`0n (D)
=
i
`00n (D)
=
X
f (Si + D) f 0 (Xi + D) , + d3i d2i F (Si + D) − F (Si ) f (Xi + D) "
d2i
i
+
¾
X½
X i
"
d3i
f 00 (Xi + D) − f (Xi + D)
¶ # µ 0 f (Xi + D) 2
f (Xi + D)
f 0 (Si + D) − F (Si + D) − F (Si
333
µ
+
f (Si + D) F (Si + D) − F (Si
¶2 #
.
Sborník konference REQUEST'06
Further, let us also dene the random variables corresponding to these empirical functions, namely, for given variables X, S, dj
`(D) = d1 · log f (X) + d2 · log f (X + D) + d3 · log(F (S + D) − F (S)) · d3 , the score function
U (D) = `0 (D) = d2 · "
U 0 (D) = d2 "
+ d3
f (S + D) f 0 (X + D) + d3 · F (S + D) − F (S) f (X + D)
f 00 (X + D) − f (X + D)
¶ # µ 0 f (X + D) 2
f (X + D)
f 0 (S + D) − F (S + D) − F (S)
µ
+
f (S + D) (F (S + D) − F (S))2
¶2 #
.
The standard way to prove the possibility to obtain a consistent MLE of unknown D is to show that the following conditions hold: 1. E U (D0 ) = 0, where D0 is a `true' value of D (we assume that D0 > 0). Further, let in a neighborhood of D0 hold the following: 2. E U 0 (D) < 0 3. E U 00 (D) ∼ Op (1).
Proposition 1. The conditions 1. and 2. hold. Proof: For each given S , when D = D0 (the true one), it holds that ½
E U (D) = E d2 =
Z ∞ S+D
f (S + D) f 0 (T ) + d3 F (S + D) − F (S) f (T )
f (S + D) f 0 (t) f (t) dt + F (S + D) − F (S) f (t)
Z S+D S
= −f (S + D) + f (S + D) = 0.
334
¾
=
f (t) dt =
P. Volf: A statistical model of time-to-failure decrease caused by a random shock.
Quite similarly, again for each S , D = D0
E
· 00 f (X + D)
f (X + D) 0
¸
d2 +
f 0 (S + D) d3 = F (S + D) − F (S)
hence E U (D0 ) = −E
"µ ¶ f 0 (X + D0 ) 2
f (X + D0 )
µ
+
Z ∞ S+D
f 00 (t) dt + f 0 (S + D) = 0,
f (S + D0 ) F (S + D0 ) − F (S)
¶2 #
<0
for each S , also when integrated through S . It is due the continuity that it holds also in a neighborhood of D0 . Further, let us assume (without any detailed examination) that the Condition 3 holds, too.
Remark: It is seen that there are certain limitations regarding the bound-
edness of p.d.f. f and its derivatives, both behind the proof of Proposition 1 and Condition 3, concerning to integrals of f 0 , f 00 , and also as to the boundedness of the expectations uniformly in O(D0 ).
Theorem 1. With probability tending to 1 (when n → ∞) there exists a ˆ n forming a P -consistent sequence of estimates of D0 . MLE D
Proof: We give here just a sketch, as the result of such a kind is a quite
common consequence of properties 1, 2, 3 and is encountered in many other situations and propositions showing the consistency of the MLE. The proof is based on the Taylor expansion of E `(D) in a neighborhood O(D0 ) of D0 : E `(D) =
= E `(D0 )+(D−D0 ) E U (D0 )+
(D − D0 )3 (D − D0 )2 E U 00 (D∗ ), E U 0 (D0 )+ 6 2
where D∗ is between D and D0 . It is seen that E `(D0 ) > E `(D) in a certain O(D0 ). As, due the L.L.N., n1 `n (D) → E `(D) at each D, from certain n `n (D) should have a local maximum close to D0 . Only problem is a way how to nd the maximizer (e.g. the existence of a solution to `0n (D) = 0) and its uniqueness. The analysis of `n (D) does not
335
Sborník konference REQUEST'06
lead to a denite conclusion on this problem. The data experiments support the conjecture on the existence of a unique maximizer (in examined cases). Do not forget that we assume that the distribution f is known, the situation in the case of unknown distribution will be dierent. Let us now dene the corresponding Fisher information J(D0 ) = (µ 0
= −E U (D0 ) = E
¶2
f 0 (X + D0 ) f (X + D9 )
µ
· d2 +
f (S + D0 ) F (S + D0 ) − F (S)
)
¶2
· d3 .
ˆ n ), which On the basis of Theorem 1, there exists its estimator Jˆn = − n1 `00n (D ˆn is potentially P -consistent (again, in the sense of Theorem 1, provided D is the MLE).
Proposition 2. Asymptotic normality
√1 `0 (D0 ) n n
∼ N (0, J(D0 )) holds.
Proof: Asymptotic normality is here the consequence of the C. L. Th. As
E `0n (D0 ) = 0, the mean of the limit should be zero. As regards the asymptotic variance, we have then ¸2
·
1 var √ `0n (D0 ) n "
µ
f 0 (Xi + D0 ) 1X d2 =E f (Xi + D0 ) n i
1 ∼ E (`0n (D0 ))2 = n µ
¶2
+ d3
f (Si + D0 ) F (Si + D0 ) − F (Si )
¶2 #
which tends to "
E d2
¶ µ 0 f (X + D0 ) 2
f (X + D0 )
µ
+ d3
f (S + D0 ) F (S + D0 ) − F (S)
¶2 #
= J(D0 ).
ˆ n be a P -consistent ML estimator of D0 . Then Theorem 2. Let D √ D ˆ n − D0 ) → n(D N (0, 1/J(D0 )).
336
P. Volf: A statistical model of time-to-failure decrease caused by a random shock.
Proof: The proof again formally follows the same scheme as in other simˆ n ) at D0 : ilar MLE cases. The rst step is the Taylor expansion of `0n (D 2 ˆ ∗ ˆ n ) = `0n (D0 ) + (D ˆ n − D0 ) · `00n (D0 ) + (Dn − D0 ) `000 0 = `0n (D n (D ). 2
Hence,
√ ˆ n − D0 ) = n(D
√1 `0 (D0 ) n n
ˆ n − D0 ) 1 `000 (D∗ ) − n1 `00n (D0 ) − (D 2n n
.
Now, the numerator tends in distribution to N (0, J(D0 )), while the denominator tends, due the boundedness of n1 `000 (D∗ ) in the neighborhood of D0 (assumed condition 3.), to the same limit as
1 − `00n (D0 ) i. e. to n
− E U 0 (D0 ) = −J(D0 ).
It follows that the mean of limiting normal distribution is zero, the variance is J(D0 )/J 2 (D0 ) = 1/J(D0 ).
ˆ n is available, we are able to The consequence is that when the MLE D estimate also the condence intervals of D0 (provided D0 > 0), namely u u ), , Dˆn + q (Dˆn − q nJˆn nJˆn where u is a corresponding standard normal quantile and Jˆn is the approximation of J(D0 ) given by
ˆ n) X f 00 (Xi + D 1 ˆ n) = − 1 − d2i Jˆn = − `0n (D ˆ n) n i n f (Xi + D
+
X i
ˆ n) f 0 (Si + D − d3i ˆ n ) − F (Si ) F (Si + D
337
Ã
Ã
ˆ n) f 0 (Xi + D ˆ n) f (Xi + D
ˆ n) f (Si + D ˆ n ) − F (Si ) F (Si + D
!2 +
!2 .
Sborník konference REQUEST'06
2.2 The case of unknown distribution This situation can be divided to two cases, namely a parametric one (known distribution type and unknown its parameters, e. g. Weibull distribution) and the nonparametric case. In both instances it seems that the joint estimation of distribution (its parameters) and shift D does not fulll desired properties. Namely, the rst one E U = 0 (U is now more-dimensional) is shown easily, however, in general E U 0 need not be negative denite and therefore the case is not regular, a variant of Theorem 1 need not hold. It is easy to show this on the case of exponential distribution. Simulated experiments support such a conjecture. Fortunately, there is (at least) one way how to overcome this problematic behavior of joint estimation. The scheme of observed data (Xi , Si , dji ) actually is rich enough to provide us a consistent estimator of either parameters or nonparametrized distribution of T . The simplest possibility is rst (before taking into account a shift D) to look at the data as at the right-censored data. Namely, we may consider Yi = min(Ti , Si ), δi = d1i . It is a fact that we do not use all information brought by our data, nevertheless, the sample (Yi , δi ) corresponds to the standard scheme of random right censoring and is therefore sucient for a P consistent estimation of distribution parameters, and also of nonparametrized distribution, via the P.L.E. of Kaplan and Meier or the NelsonAalen estimator of C.H.R. For the consistency of such a nonparametric estimator the assumption that sup{s : G(s) < 1} ≥ sup{t : F (t) < 1} is required. The following examples intend to show that the proposed approach is quite successful. Parametric case will deal with the Weibull distribution, nonparametric one will use the estimator of C.H.R. Λ(t) and then smoothed estimator of h.r. λ(t), instead of F (t) = 1 − exp(−Λ(t)), f (t) = λ(t) · (1 − F (t)). Notice also that from the consistency of the estimator of the distribution of T (or its parameˆ n follows (the question of asymptotic normality ters) the consistency of D is, naturally, more complicated).
Remark 1. As it has been said, the proposed approach does not use all
information provided by data. Hence, there is the question how to improve
338
P. Volf: A statistical model of time-to-failure decrease caused by a random shock.
the estimation. Observed reduced data Xi , d1i = 0 are actually also 'censored', however in our model they are reduced by a xed value D, this is not the scheme of independent censoring. Hence, corresponding estimates based on them are not consistent. Attempts with such an approach showed it clearly, the correct distribution was, as a rule, over-estimated.
Remark 2. One of ideas could consist in certain iteration, e. g. several
steps of EM algorithm nature, taking the proposed solution as a starting point. However, one has to be careful, the inconsistency of estimation of D jointly with other distribution parameters indicates that a simple alternating scheme (e.g. estimate parameters, estimate D, improve data by D, re-estimate parameters, re-estimate D,...) is not successful, such experiˆ ∼ 0. ments have tended mostly to D
Remark 3. Notice also that in our assumptions and results there is no
demand of increasing hazard rate. Naturally, an object grows older (C.H.R. increases) for any nonzero hazard rate. Example 3 will deal with a case of decreasing h.r.
3 Examples First examples deal with simulated data. The original values Ti were generated from dierent Weibull distributions shifted from zero, variables Si were generated from normal distributions selected to be wider than the domain of realized Ti . Then the shift parameter D0 has been selected and values Ti transformed to data Xi . The proportion d1 was mostly about 0.5, d2 ∼ 0.4, d3 ∼ 0.05 − 0.1. The extent of samples of examples displayed here was n = 1000.
Example 1. The rst set of gures shows the case where the parameters of Weibull distribution were estimated rst (as from a censored data) and ˆ . Figure 2 shows original values Ti then used in the search for the MLE D with Weibull density estimated from censored data (above), shifted data
339
Sborník konference REQUEST'06
100 80 60 40 20 0 50
100
150
200
250
300
350
400
450
500
450
500
100 80 60 40 20 0 50
100
150 200 250 300 350 400 Original data (above) + estimated Weibull distr., observed data (below)
−80
−100
−120
log−likelihood
−140
−160
−180
−200
−220
−240
−260
−280
0
10
20
30
40
50 D
60
70
80
90
100
Figure 2: Original data, analyzed data and the log-likelihood function of Example 1.
Xi (middle plot), lower subplot displays the value of log-likelihood for different D, in order to show that it really has a maximum. The maximizer ˆ = 48.1, while the "true' value was D0 = 50. We computed also the was D approximation of the 95% condence interval for D0 (taking estimated parameters of Weibull distribution as true parameters), the half-width of this ˆ n was rather CI was about 5.16. The estimate of asymptotic variance of D stable for dierent extent of simulated data. The parameters of Weibull distribution (with survival function exp{−(x/a)b }) estimated from sample censored by Si were a = 269.0, b = 3.45. For comparison, the parameters best tting to original values Ti were a = 267.7, b = 3.36.
Example 2. The second set of gures shows the solution for the data
generated in the same manner as in Example 1, however the nonparametric
340
P. Volf: A statistical model of time-to-failure decrease caused by a random shock.
7 6
CHR
5 4 3 2 1 0
0
100
200
300
400
500
600
0
100
200
300 time
400
500
600
1
distr. fctions
0.8 0.6 0.4 0.2 0
−2900
−3000
log−likel.
−3100
−3200
−3300
−3400
−3500
0
20
40
60
80
100 D
120
140
160
180
200
Figure 3: Estimated C.H.R., estimated.D.F.-s and the log-likelihood of Example 2.
ˆ NelsonAalen estimator Λ(t) of cumulated H.R. computed from censored data is used instead of Weibull distribution. This estimate is shown in Figure 3 above. Instead of histograms of values, in the middle subplot we now compare empirical distribution functions, both from observed Xi (it is ˆ the left one) and from original values Ti , and also Fˆ (t) = 1 − exp(−Λ(t)) - it coincides well with the second one. Figure 3 below again displays the values of log-likelihood for dierent values D, the maximum was achieved ˆ = 48.9. at D
Example 3. This example shows the case with decreasing hazard rate of
underlying variables Ti . They were generated from the Weibull distribution with the shape parameter 0.8 and origin at 100 (Figure 4 above), the analysis was performed in a nonparametric way like in Example 2. The consequence of a shock was simulated as the shift of survival time backwards by D0 = 80.
341
Sborník konference REQUEST'06
250 200 150 100 50 0
0
1000
2000
3000
4000
5000
6000
7000
8000
9000
10000
0
1000
2000
3000
4000
5000
6000
7000
8000
9000
10000
250 200 150 100 50 0
−4400
−4420
log−likel.
−4440
−4460
−4480
−4500
−4520
−4540
0
20
40
60
80
100 D
120
140
160
180
200
Figure 4: Original data, analyzed data and the log-likelihood function of Example 3. Corresponding reduced data Xi are on the middle subplot. The last subplot ˆ = 82.5. again shows the log-likelihood, with maximum achieved at D
3.1 Real-data example Let us describe briey the origin of the data. In 1967, a strike at a Quebec aluminium smelter resulted in the uncontrolled shutdown of electrolytic cells. The company claimed that the shutdown caused the shorter lives of cells operating at the time. The case led to a legal action and initialized a statistical analysis of the data, in order to conrm expected higher degradation of cells after the shutdown and to estimate statistically the losses caused by (eventual) reduced lifetimes. The more details, some statistical studies (see Kalbeisch and Struthers, and Thomas) about the case as well as the complete data were published in Case Studies in Data
342
P. Volf: A statistical model of time-to-failure decrease caused by a random shock.
25 20 15 10 5 0
0
500 1000 1500 2000 2500 Observed survival times and Weibull density fitted to "censored" times
3000
3000 2500
time
2000 1500 1000 500 0
0
50 100 150 200 Observed survival times (points) and times of shocks (o)
250 index of cell
300
−1285
−1290
Log−likel
−1295
−1300
−1305
−1310
0
50
100
150
200 values
250
300
350
D
Figure 5: Observed smelting cells data and the log-likelihood function. Analysis, a section of the Canadian Journal of Statistics, V. 10 (1982). The data are at present also available on the web page of the author (siprint.utia.cas.cz/public/income/volf/data ruzna) as strike.txt le. From other, later analyses, let us mention here the Bayesian and MCMC approach used in Arjas and Liu (1995) and the nonparametric Cox model employed by Volf (2004). The survival of cells was measured in days, the highest observed time to failure was 2 541 days. The installation times diered from 2 287 to only 3 days before the shutdown (no cell installed after the strike is considered). The survival times Xi of all cells are known. The data contains the records on 572 cells, 349 were in circuit at the moment of the shutdown. The cells were of several types, standard as well as experimental, so that also with dierent expected survival times. As an example, we present here the joint analysis of 272 cells of types A1A10, forming together rather homogeneous sample. From them, 170 have d2 = 1 and 5 have d3 = 1. The problem with those data is that
343
Sborník konference REQUEST'06
the values of Si (the age of i-th cell at the moment of its shutdown) are rather concentrated in the middle of the life period of cells. Therefore, the design of censoring by them is more similar to the censoring by a xed value than to the random one. It is seen from Figure 5, middle subplot, where dots denote observed survival times Xi and circles denote the times Si of the shutdown. On the horizontal axis there is the index of the cell, i = 1, .., 272. Hence, the usage of the nonparametric estimator is nonreliable (it is not consistent under such circumstances). We rely therefore on the Weibull distribution tting. The upper subplot shows the histogram of Xi and estimated Weibull density - i.e. computed from Xi censored by Si and estimating the distribution corresponding to 'ideal' values Ti . Finally, the lower subplot of Figure 5 displays the values of log-likelihood function, ˆ = 104.8. The approximation of the 95% the maximum was achieved at D condence interval was rather wide, namely (42.6, 167.0). It should be noted that the t of estimated Weibull distribution to 'ideal' ˆ · d2i was not good (when tested by the Kolmogorov values Ti = Xi + D Smirnov test). It was even possible to nd a better Weibull distribution ˆ was estimated. Probably this bad t was caused by the - after optimal D pattern of values Si , we actually were not able to use a large part of observed data in order to 'catch' the optimal shape of the underlying distribution.
4 Conclusion The contribution presented a rather simple model of time-to-failure decrease caused by an abrupt degradation of followed device, and demonstrated the possibility of reliable statistical analysis of such a situation. A generalization could be connected with further specication of the degradation shift, considering dierent levels of shift, and based on the experience with real situations. We can imagine both a parametric and nonparametric models of the dependence of the age shift on the actual age (and wear) as well as reecting the magnitude of the shock. The other improvement of the method should consist in the better exploitation of the information gathered in observed data.
344
P. Volf: A statistical model of time-to-failure decrease caused by a random shock.
References [1] Arjas, E. and Liu, L. (1995): Assessing the losses caused by an industrial intervention a hiearchical Bayesian approach. J. Royal Statist. Society, ser. C, 44, 357368. [2] Aven, T. and Jensen, U. (1999): Stochastic Models in Reliability. Springer Verlag, Berlin. [3] Finkelstein, M. (2006): On virtual age of degrading systems. In: Proceedings of the Biostat 2006, University of Cyprus, Nicosia, 8792. [4] Kahle, W. (2006): Incomplete preventive maintenance. To appear in: Proceedings of the Prague Stochastics 2006, Prague, CR. [5] Kalbeisch, J. D. and Struthers, C. A. (1982): An analysis of the Reynolds Metals Company data. In Case Studies in Data Analysis, Canad. J. Statist. 10, 237259. [6] Kijima, M. (1989): Some results for repairable systems with general repair.J. Appl. Prob. 26, 89102. [7] Thomas, D. C. (1982): Case analysis using Cox's model. In Case Studies in Data Analysis. Canad. J. Statist. 10, 237259. [8] Volf, P. (2004): Nonparametric Cox Regression Model in Reliability Analysis. Kybernetika 40, 639648.
Author's address:
Doc. RNDr. Petr Volf, CSc., Institute of Information Theory and Automation, Pod vodárenskou v¥ºí 4, Praha 182 08, Czech Republic e-mail:
[email protected]
Acknowledgement: The research is supported by the project of MMT R No 1M06047, The Research Center for the Quality and Reliability.
345
Metódy výpo£tu porovnávacej referen£nej hodnoty v medzilaboratórnych porovnávacích experimentoch Viktor Witkovský
Abstrakt. V príspevku je diskutovaná problematiku medzilabora-
tórných porovnávacích experimentov a uvedieme metódy kon²trukcie intervalových odhadov pre spolo£nú strednú hodnotu v heteroskedastickom modeli jednoduchého triedenia s uvaºovaním moºných systematických chýb merania. Spomenieme metódu navrhnutú v práci Fairweather (Applied Statistics, 1972), ktorá je zaloºená na výpo£te rozdelenia lineárnej kombinácie nezávislých náhodných premenných so Studentovým t rozdelením. Zov²eobecnenie tohto prístupu vedie k problému výpo£tu rozdelenia lineárnej kombinácie náhodných premenných so Studentovým t rozdelením, normálnym rozdelením, rovnomerným rozdelením a trojuholníkovým rozdelením.
1 Úvod V príspevku sa zaoberáme problematikou kombinovania výsledkov merania neznámej (ale rovnakej) veli£iny, meranej nezávisle vo viacerých laboratóriach, alebo pomocou viacerých nezávislých meracích metód:
• Na základe iniciatívy publikovanej v dokumente Mutual Recognition Arrangement (MRA), bol podnietený výskum v oblasti h©adania vhodných metód na sumarizovanie výsledkov medzilaboratórnych porovnávacích pokusov (IC - Interlaboratory Comparisons). • Zo ²tatistického poh©adu, problematika ur£enia tzv. porovnávacej referen£nej hodnoty (CRV - Comparison Reference Value) je príbuzná s problematikou ur£nia spolo£nej strednej hodnoty (Common Mean Problem).
346
V. Witkovský: Metódy výpočtu porovnávacej referenčnej hodnoty ...
• V tomto £lánku sú podrobne prezentované dva postupy na kon²trukciu intervalových odhadov pre spolo£nú strednú hodnotu: ²tatistický a metrologický postup. Z metrologického poh©adu ide o ur£enie porovnávacej referen£nej hodnoty. iadne meranie neumoº¬uje dokonalé ur£enie hodnoty veli£iny, ktorá je meraná (measurand ). Prirodzene vzniká potreba charakterizova´ neistotu merania, ktorú chápeme ako mieru rozloºenia (variability) hodnôt, ktoré nemoºno povaºova´ za neprípustné (nemoºné) v procese merania. V roku 1993 ISO (International Organization for Standardization) vydalo svoju publikáciu o spôsobe vyjadrovania neistôt v meraní Guide to the Expression of Uncertainty in Measurement - ISO GUM, aby tak zabezpe£ila jednotný prístup k vyhodnocovaniu neistôt v meraní. Postupy uvedené v ISO GUM v²ak vyvolávajú u ²tatistikov isté obavy, ke¤ºe kombinujú frekventistické miery a postupy a charakteristiky subjektívnych distribúcii spôsobom, ktorý plne neakceptuje ani frekventistická ²kola ²tatistiky, ani bayesovská ²tatistika, pozri Glesser (Statistical Science, 1998). Glesser v²ak poukázal, ºe tieto odporú£ania moºno povaºova´ za pribliºné rie²enia ur£itých frekventistických a bayesovských problémov ²tatistickej indukcie.
2 Neistoty v meraní pod©a ISO GUM Uvádzame tu stru£ný popis metódy na vyhodnocovanie a vyjadrovanie neistôt v meraní pod©a ISO GUM, pozri publikáciu Essentials of expressing measurement uncertainty, http://www.physics.nist.gov/cuu/Uncertainty/ basic.html: Zaujímavá je situácia, ke¤ veli£ina, ktorá má by´ ur£ená meraním, povedzme Y (measurand), nie je meraná priamo, ale je ur£ená z N ¤al²ích veli£ín, X1 , X2 , . . . , XN pomocou funk£ného vz´ahu f , £asto ozna£ovaného ako rovnica merania :
Y = f (X1 , X2 , . . . , XN ).
347
Sborník konference REQUEST'06
Medzi Xi sú zahrnuté korek£né faktory, ako aj veli£iny, ktoré berú do úvahy iné zdroje variability (napr. rôzny personál, prístroje, výbery, laboratória a podmienky merania). Rovnica merania nevyjadruje len fyzikálny zákon, ale aj proces merania, a má obsahova´ v²etky veli£iny, ktoré prispievajú významne k neistote výsledku merania. Odhad meranej veli£iny Y , ozna£ovaný ako y , sa získa z rovnice merania, ke¤ za vstupné veli£iny funkcie f dosadíme x1 , x2 , . . . , xN odhady veli£ín X1 , X2 , . . . , XN . Teda y = f (x1 , x2 , . . . , xN ).
ISO GUM uvádza ako príklad rovnicu merania: P = f (V, R0 , b, t) = V 2 /R0 [1 + b(t − t0)], kde P je výkon, V napätie, R0 odpor meraný pri teplote t0 , b tepelná kon²tanta odporu, t teplota.
2.1 Klasikácia zloºiek neistoty Neistota výsledku merania y závisí od neistôt u(xi ) (stru£ne ui ) vstupných odhadov xi . Zloºky neistoty moºno kategorizova´ pod©a metódy, pod©a ktorej sa vyhodnonocujú:
• Vyhodnocovanie typu A (Type A evaluation): Metóda vyhodnocovania neistôt pomocou ²tatistickej analýzy série pozorovaní.
• Vyhodnocovanie typu B (Type B evaluation): Metóda vyhodnocovania neistôt pomocou iných metód, neº pomocou ²tatistickej analýzy série pozorovaní.
2.2 Reprezentácia zloºiek neistoty Kaºdú zloºku neistoty (vyhodnotenú ktorýmko©vek spôsobom) reprezentuje odhadnutá ²tandarná odchýlka (ozna£ovaná ako ²tandardná neistota ui ).
348
V. Witkovský: Metódy výpočtu porovnávacej referenčnej hodnoty ...
• tandardná neistota typu A: Zloºka neistoty získana metódou vyhodnocovania typu A. Je reprezentovaná ²tatistickým odhadom ²tandardnej odchýlky si a pridruºenými stup¬ami vo©nosti νi . Pre takú zloºku neistoty platí ui = si .
• tandardná neistota typu B: Zloºka neistoty získana metódou vyhodnocovania typu B je reprezentovaná veli£inou uj , ktorú moºno povaºova´ za zodpovedajúcu ²tandardnú odchýlku predpokladaného pravdepodobnostného rozdelenia zaloºeného na úplnej dostupnej informácii, uj = σj .
2.3 Vyhodnocovanie zloºky neistoty typu A Vyhodnocovanie ²tandardnej neistoty typu A môºe by´ zaloºené na vhodných ²tatistických metódach pre analýzy dát. Príkladom je
• výpo£et ²tandardnej odchýlky pre výberový priemer, zaloºený na nezávislých opakovaných pozorovaniach; • vyuºitie metódy najmen²ích ²tvorcov na odhad parametrov (a ich ²tandardných odchliek) funkcie strednej hodnoty; • vyuºitie metódy analýzy rozptylu (ANOVA) na idenikáciu a kvantikáciu náhodných efektov v ur£itých typoch meraní.
Príklad: Uvaºujme veli£inu Xi , ktorej hodnota má by´ odhadnutá na základe n nezávislých pozorovaní Xi,k veli£iny Xi . Potom odhadom veli£iny Xi je výberový priemer xi so ²tandarnou neistotou u(xi ), n X ¯i = 1 Xi,k , xi = X n k=1
Ã
¯i) = u(xi ) = s(X
349
n X 1 ¯ i )2 (Xi,k − X n(n − 1) k=1
!1/2
.
Sborník konference REQUEST'06
2.4 Vyhodnocovanie zloºky neistoty typu B Vyhodnocovanie ²tandardnej neistoty typu B je zvy£ajne zaloºené na odbornom (vedeckom) úsudku, s vyuºitím v²etkej dostupnej relevantnej informácie, ktorá môºe zah¯¬a´:
• skúsenosti s predchádzajucích meraní, • skúsenosti, alebo v²eobecnú znalos´ o chovaní sa a o vlastnostiach materiálov a prístrojov, • údaje výrobcov prístrojov, • údaje z kalibrá£ných certikátov, alebo iných správ (reports), • neistoty priradené referen£ným údajom zo v²eobecne uznávaných zdrojov (handbooks).
2.5 Výpo£et kombinovanej ²tandardnej neistoty (Zákon ²írenia neistôt) Kombinovaná ²tandardná neistota výsledku merania y , ozna£ovaná ako uc (y), reprezentuje odhadnutú ²tandardnú odchýlku výsledku merania, a jej odhad je ur£ený vz´ahom
u2c (y) =
¶ N µ X ∂f i=1
∂xi
u2 (xi ) + 2
N −1 X
N X ∂f ∂f
i=1 j=i+1
∂xi ∂xj
u(xi , xj ).
• Rovnica je zaloºená na aproximácii prvého rádu pomocou rozvoja rovnice merania Y = f (X1 , X2 , . . . , XN ) do Taylorovho radu. • Parciálne derivácie f pod©a Xi (koecienty citlivosti ) sú po£ítané v bodoch Xi = xi. • u(xi ) sú ²tandardné neistoty prislúchajúce odhadom vstupných veli£ín xi . • u(xi , xj ) sú odhadnuté kovariancie prislúchajúce odhadom vstupných veli£ín xi a xj .
350
V. Witkovský: Metódy výpočtu porovnávacej referenčnej hodnoty ...
2.6 Interpretácia neistoty merania Za predpokladu, ºe pravdepodobnostné rozdelenie charakterizujúce výsledok merania y je pribliºne normálne (gausovské rozdelenie) a kombinovaná neistota uc (y) je spo©ahlivým odhadom ²tandardnej odchýlky výsledku merania y , potom interval
hy − uc (y), y + uc (y)i pokrýva pribliºne 68% rozdelenia hodnôt, ktoré moºno rozumne povaºova´ za hodnoty veli£iny Y , ktorej y je odhadom. Teda, pribliºne so 68% hladinou spo©ahlivosti hodnota veli£iny Y je v䣲ia ako y − uc (y) a men²ia, alebo rovná hodnote y + uc (y), £o sa zvy£ajne zapisuje v tvare Y = y ± uc (y).
2.7 Roz²írená neistota a faktor pokrytia Hoci sa kombinovaná neistota uc pouºíva na vyjadrenie neistoty pre v䣲inu výsledkov merania, pre niektoré komer£né, priemyselné a právne aplikácie (napr. v prípade ochrany zdravia) sa vyºaduje miera neitoty merania, ktorá denuje interval okolo výsledku merania y , kde skuto£ná hodnota meranej veli£iny Y leºí s predpísanou spo©ahlivos´ou. Miera neistoty, ktorá sp¨¬a túto poºiadavku sa ozna£uje ako roz²írená neistota (expanded uncerainty) a ozna£uje sa symbolom U , pri£om
U = k × uc kde k je faktor pokrytia. Teda, Y = y±U , a so stanovenou spo©ahlivos´ou, ktorá prislúcha faktoru pokrytia k , platí, ºe meranej veli£iny Y môºe by´ v䣲ia ako y − U , alebo men²ia (nanajvý² rovná) ako y + U .
Faktor pokrytia: Volí na základe poºadovanej úrovne spo©ahlivosti pokrytia. Typické hodnoty faktora k bývajú v rozsahu 2 aº 3.
351
Sborník konference REQUEST'06
Za predpokladu normálneho rozdelenia, a za predpokaldu, ºe uc je spo©ahlivý odhad neistoty merania y , U = 1.96uc , oby£ajne sa v²ak za faktor pokrytia volí k = 2, teda U = 2uc , 4o denuje pribliºne 95% interval spo©ahlivosti pre Y .
Relatívna roz²írená neistota: Analogicky s relatívnou ²tandardnou neistotou ur a relatívnou kombinovanou ²tandardnou neistotou uc,r sa denuje relatívna roz²írená neistota výsledku merania: U , Ur = |y| pokia© sa y nerovná 0.
2.8 Nekonzistentons´ ISO GUM a ²tatistického prístupu: ISO GUM neozna£uje systematickým spôsobom a nerozli²uje dôsledne:
• parametre rozdelení, • náhodné premenné a ich realizácie, • odhady parametrov a ich realizácie, • teoretické ²tandarndné odchýlky (neistoty), výberové ²tandarné odchýlky a ich realizácie. Tieto pojmy sa vnímajú rôzne pod©a kontextu a v kone£nom dôsledku vedú k problematickej interpretácii navrhovaných postupov.
352
V. Witkovský: Metódy výpočtu porovnávacej referenčnej hodnoty ...
3 Medzilaboratórne porovnávania a k©ú£ová porovnávacia referen£ná hodnota (KCRV) Cie©om porovnávacích experimentov je ur£enie porovnávacej referen£nej hodnoty (CRV - Comparison Reference Value) a jej neistoty. Porovnávacia referen£ná hodnota nie je jednozna£ne denovaná, ale mal by to by´ vhodný odhad (estimator) parametra µ (skuto£nej hodnoty meranej veli£iny) zaloºený na meraniach z jednotlivých laboratórii. CRV je £asto ur£ená ako aritmetický, alebo váºený priemer odhadov hodnôt meranej veli£iny µ jednotlivých ú£astníkov medzilaboratórneho porovnávania. peciálnym prípadom porovnávacích experimentov sú k©ú£ové porovnávania (Key Comparisons), ktoré sa vykonávajú na úrovni národných metrologických ústavov, a ktoré sú denované v dokumente Mutual Recognition Arrangement. KCRV (Key Comparison Reference Value) sa objavuje v kontexte cie©ov denovaných v dokumente MRA z dvoch dôvodov:
• Potreba demon²trova´, ºe národné etalóny nadväzujú na etalóny SI jednotiek a kore²pondujú aj navzájom medzi sebou (traceability). • KCRV je vhodný spôsob prezentovania výsledkov v k©ú£ových porovnávacích experomentov. Metóda zvolená na výpo£et KCRV je záleºitos´ou ú£astníkov v k©ú£ových porovnávaniach (nie je jednozna£ne denovaná), ale v kaºdom prípade, kone£né rozhodnutie musí by´ odsúhlasené pracovnou skupinou daného k©ú£ového porovnávania. KCRV je £asto ur£ené ako aritmetický, alebo váºený priemer odhadov hodnôt meranej veli£iny (measurand) jednotlivých ú£astníkov k©ú£ového porovnávania.
353
Sborník konference REQUEST'06
4 tatistický a metrologický prístup pre analýzu medzilaboratórnych porovnávaní 4.1 tatistický prístup Nech k ≥ 2 ozna£uje po£et nezávislých laboratórii v porovnávacom experimente. Budeme predpoklada´, ºe kaºdé laboratórium opakuje merania rovnakej veli£iny, ktorej skuto£ná hodnota je µ, nezávisle ni -krát, ni ≥ 2, i = 1, . . . , k . Pre kaºdé laboratórium budeme predpoklada´ platnos´ modelu: Yij = (µ + εij ) + Bi , (1) kde
• Yij - výsledky merania neznámej veli£iny (so skuto£nou hodnotou µ) v i-tom laboratóriu, j = 1, . . . , ni , 2 ) - navzájom nezávislé chyby merania i = 1, . . . , k , • εij ∼ N (0, σ(A),i j = 1, . . . , ni , pri£om σ(A),i sú neznáme ²tandardné odchýlky, ktoré moºno odhadnu´ (metódou typu A), 2 • Bi ∼ Di (βi , σ(B),i ) - náhodné premenné reprezentujúce laboratórne systematické chyby, nezávislé od chýb merania εij .
Di ozna£uje typ distribúcie (napr. normálne, rovnomerné, alebo trojuholníkové rozdelenie), so strednou hodnotou βi a ²tandardnou odchýlkou σ(B),i , ktoré moºno ur£i´ metódou typu B, i = 1, . . . , k .
4.2 peciálne prípady modelu (1) • Prípad 1: Model so spolo£nou strednou hodnotou, bez systematických chýb (σ(B),i = 0): Yij = µ + εij ,
354
V. Witkovský: Metódy výpočtu porovnávacej referenčnej hodnoty ...
Metódy kon²trukcie intervalových odhadov pre parameter µ boli pre tento model navrhnuté a analyzované v prácach: Fairweather (Applied Statistics, 1972), Jordan and Krishnamoorthy (Biometrics, 1996), Yu, Sun and Sinha (JSPI, 1999), Krishnamoorthy and Lu (Biometrics, 2003).
• Prípad 2: Model so spolo£nou strednou hodnotou (heteroskedastický model jednoduchého triedenia):
Yij = µ + Bi + εij , (βi = 0 and σ(B),i = σ0 , and Di ≡ N , teda Bi ∼ N (0, σ02 )). Metódy kon²trukcie intervalových odhadov pre parameter µ boli pre tento model navrhnuté a analyzované v prácach: Rukhin and Vangel (JASA, 1998), Hartung, Böckenho and Knapp (JSPI, 2003), Iyer, Wang and Mathew (JASA, 2004).
• Prípad 3: Model so spolo£nou strednou hodnotou a systematickými chybami s rovnomerným rozdelením:
Yij = µ + Bi + εij , (βi = 0 and Di ≡ Ui ). Teda Bi ∼ Ui (−δi , δi ) kde δi =
√ 3σ(B),i .
Metódy kon²trukcie intervalových odhadov pre parameter µ boli pre tento model navrhnuté a analyzované v práci: Iyer, Wang and Mathew (JASA, 2004).
4.3 Metrologický prístup Uvaºujme model:
Yij = µi + εij , kde
355
(2)
Sborník konference REQUEST'06
2 • εij ∼ N (0, σ(A),i ) - navzájom nezávilé chyby merania i = 1, . . . , k , j = 1, . . . , ni , σ(A),i sú neznáme ²tandardné odchýlky, ktoré moºno odhadnú´ (metódou typu A).
• µi = µ + bi , reprezentuje hodnotu meranej veli£iny za´aºenú systematickou chybou i-teho laboratória (bi je realizovaná, ale neznáma, systematická chyba laboratória), i = 1, . . . , k . • Ak by sme poznali skuto£nú hodnotu µi , potom na²a vedomos´ o skuto£nej hodnote meranej veli£iny (teda o µ) je reprezentovaná pravdepodobnostným rozdelením náhodnej premennej µ ˜(i) = µi − Bi , kde 2 Bi ∼ Di (βi , σ(B),i ) reprezentuje na²u vedomos´ o moºnej systematickej chybe i-teho laboratória, pri£om predpokladáme, ºe náhodné premenné Bi sú navzájom nezávislé náhodné premenné a nezávislé od chýb merania. Vidie´, ºe platí E(˜ µ(i) ) = µ + (bi − βi ). Typ a parametre rozdelenia systematických chýb Bi moºno ur£i´ metódou typu B, i = 1, . . . , k . Intervalový odhadov pre parameter µ bol na základe tohto prístupu navrhnutý v práci Witkovský a Wimmer (Probastat, 2006). Podobný prístup pre výpo£et KCRV a jej neistoty moºno nájs´ v práci Kacker, Datla a Parr (Metrologia, 2004). Vhodné výpo£tové metódy moºno nájs´ v práci Witkovský (Compstat, 2004) a Cox a Siebert (Metrologia, 2006).
4.4 Výberové ²tatistiky Výstupom porovnávacieho experimentu sú laboratórne výberové priemery 2 (odhady veli£ín µi = µ+bi ) a výberové rozptyly (odhady parametrov σ(A),i ): ni 1 X ¯ Yij , Yi = ni j=1
n
Si2
i 1 X (Yij − Y¯i )2 . = ni − 1 j=1
Náhodné premenné Y¯i a Si2 , i = 1, . . . , k , sú navzájom nezávislé.
356
(3)
V. Witkovský: Metódy výpočtu porovnávacej referenčnej hodnoty ...
• Za platnosti modelu (1) platí: (Y¯i − µ) ∼ Bi + ε¯i ,
⊥
(ni − 1)Si2 ∼ χ2ni −1 , 2 σ(A),i
(4)
2 2 /ni ) sú navzájom nezávislé. kde Bi ∼ Di (βi , σ(B),i ) a ε¯i ∼ N (0, σ(A),i
• Za platnosti modelu (2) platí: Y¯i − µi √ ∼ tni −1 , Si / ni (5) kde tni −1 ozna£uje náhodnú premennú so Studentovým t-rozdelením s ni − 1 stup¬ami vo©nosti.
(Y¯i − µi ) ∼ ε¯i ,
⊥
(ni − 1)Si2 ∼ χ2ni −1 2 σ(A),i
⇒
4.5 Príklad k©ú£ového porovnávania Na ilustráciu uvádzame výsledky meraní z k©ú£ového porovnávanie medzi 12 národnými metrologickými ústavmi v oblasti vibrácii. Meraná bola citlivos´ akcelerometrov, viac podrobnosti moºno nájs´ v spáve: von Martens et al.: Final report on key comparison CCAUV.V-K1. Metrologia 40, 2003, Tech. Suppl. 09001.
5 Exaktný konden£ný interval pre µ Uvaºujme ²peciálny prípad modelu (1) so spolo£nou strednou hodnotou bez systematických chýb: Yij = µ + εij , Fairweather (Appl.Stat., 1972): Zo vz´ahov (3) a (4) máme
Y¯i − µ ∼ tni −1 , Ti = q Si2 /ni Ozna£me W = 1/V ar(Ti ).
Pk
i=1 ui Ti ,
i = 1, . . . , k.
kde ui sú nenáhodné koecienty, napr. ui =
357
Sborník konference REQUEST'06
No. 1 2 3 4 5 6 7 8 9 10 11 12
Laboratory
Country
PTB BNM-CESTA CSIRO-NML CMI CSIR-NML CENAM NRC KRISS NMIJ VNIIM NIST Nmi-VSL
Germany France Australia Czech Republic South Africa Mexico Canada Korea Japan Russia United States The Netherlands
y¯i
ni
si
σ(B),i
0.12662 0.12690 0.12670 0.12670 0.12710 0.12657 0.12650 0.12659 0.12655 0.12694 0.12640 0.12662
9 5 5 5 5 5 5 6 4 5 5 5
0.0000429 0.0005477 0.0000837 0.0002321 0.0000837 0.0000826 0.0002688 0.0000361 0.0000818 0.0001140 0.0002000 0.0001171
0.0000617 0.0003164 0.0001864 0.0003260 0.0003795 0.0003142 0.0002650 0.0002274 0.0003137 0.0002746 0.0001954 0.0001560
Tabu©ka 1: Výberové priemery, po£et opakovaných meraní a zodpovedajúce neistoty typu A a typu B meraní citlivosti akcelerometrov (charge sensitivity of the back-to-back accelerometer for 500 Hz).
358
V. Witkovský: Metódy výpočtu porovnávacej referenčnej hodnoty ...
Laboratory Sample Means ± 2 ´ Expanded Uncertainty 0.1285
0.128
Charge Sensitivity
0.1275
0.127
0.1265
0.126
0.1255
1
2
3
4
5
6 7 Laboratory
8
9
10
11
12
Obr. 1: Hodnoty výberových priemerov a roz²írené kombinované neistoty: s2 2 )1/2 y¯i ± 2 × ( nii + σ(B),i . Nech q1−α/2 ozna£uje ¤alej (1 − α/2)-kvantil rozdelenia náhodnej premennej W , teda: α Pr(|W | < q1−α/2 ) = 1 − . 2 Odtia©, moºno priamo odvodi´ exaktný (1 − α) × 100% konden£ný interval pre hodnotu µ: Pk
i=1
µ ˆ ± qˆ1−α/2 = Pk
qn
i=1
¯
uY S2 i i i
q in
i Si2
ui
q1−α/2 ± Pk q n i i=1
Si2
ui
,
(6)
Hodnoty kvantilov náhodnej premennej W moºno ur£i´ simula£ne, alebo presným numerickým výpo£tom pomocou algoritmu TDIST. Uvaºujme teraz v²eobecný tvar modelu (1) so spolo£nou strednou hodnotou a systematickými chybami, Yij = µ + Bi + εij , pri£om βi = 0 and
359
Sborník konference REQUEST'06
Bi ∼ Ui (−δi , δi ), kde δi =
√ 3σ(B),i . Ako sme uº ukázali platí:
(Y¯i − µ) ∼ Bi + ε¯i ,
(ni − 1)Si2 ∼ χ2ni −1 , 2 σ(A),i
⊥
σ2
nezávislé náhodné premenné. kde Bi ∼ U(−δi , δi ) a ε¯i ∼ N (0, (A),i ni ) sú √ σ Za dodato£ného predpokladu, ºe δi = 3γi σ(A),i , teda γi = σ(B),i dostá(A),i vame √ ( 3ni γi )Ui + Zi Y¯i − µ s , ∼ Ti∗ = s Qi Si2 ni − 1 ni kde Ui ∼ U(−1, 1), Zi ∼ N (0, 1) a Qi ∼ χ2ni −1 . P Ozna£me W ∗ = ki=1 u∗i Ti∗ , kde u∗i sú nenáhodné koecienty, napr. u∗i = ∗ 1/V ar(Ti∗ ), a nech q1−α/2 ozna£uje (1 − α/2)-kvantil rozdelenia náhodnej ∗ premennej W : α ∗ Pr(|W ∗ | < q1−α/2 )=1− . 2 Odtia©, exaktný (1 − α) × 100% konden£ný interval pre µ je daný ako qn
Pk
µ ˆ±
∗ qˆ1−α/2
i ∗¯ u Y Si2 i i
i=1
= Pk
i=1
qn
i ∗ u Si2 i
∗ q1−α/2
± Pk
i=1
qn
i ∗ u Si2 i
(7)
. P
Teoretická distribu£ná funkcia náhodnej premennej Ti∗ resp. W ∗ = ki=1 u∗i Ti∗ σ je neznáma. Navy²e, závisí od neznámych parametrov γi = σ(B),i , ktoré v²ak σ(B),i
moºno odhadnú´, napr. γˆi = √ moºno odhadnú´ simula£ne.
Si2
(A),i
∗ . Pre dané hodnoty γi ,kvantil q1−α/2
360
V. Witkovský: Metódy výpočtu porovnávacej referenčnej hodnoty ...
6 Intervalový odhad pre µ na základe metrologického prístupu Na základe metrologického prístupu máme:
(Y¯i − µi ) ∼ ε¯i ,
⊥
(ni − 1)Si2 ∼ χ2ni −1 2 σ(A),i
⇒
Y¯i − µi ∼ tni −1 , Ti = r Si2 ni
a potom na²a na²a vedomos´ o skuto£nej hodnote µ je reprezentovaná pravdepodobnostným rozdelením náhodnej premennej µ ˜(i) = µi − Bi , kde Bi ∼ U(−δi , δi ). Parameter µi = µ + bi je neznámy. Av²ak na základe napozorovaných hodnôt y¯i a s2i je na²a vedomos´ o skuto£nej hodnote µi je reprezentovaná pravdepodobnostným rozdelením náhodnej premennej s
µ ˜i = y¯i +
s2i Ti , ni
kde y¯i a s2i sú povaºované za kon²tanty a Ti ∼ tni −1 . Kombináciou týchto vz´ahov dostaneme s
˜˜(i) = µ µ ˜i − Bi ≡ y¯i +
s2i Ti − Bi ≡ y¯i + ni
s
√ s2i Ti − 3σ(B),i Ui , ni
kde Ti ∼ tni −1 a Ui ∼ U(−1, 1) sú nezávislé náhodné premenné. Kombinovaním týchto rozdelení moºno na²u vedomos´ o skuto£nej hodnote veli£iny µ reprezentovan´ pravdepodobnostným rozdelením náhodnej premennej
˜˜ = µ
k X i=1
˜˜(i) = wi µ
k X
wi y¯i +
i=1
k X
s
wi
i=1
√ s2i Ti − 3σ(B),i Ui , ni
Pk
kde wi , i=1 wi = 1, sú vhodne zvolené váhy. Witkovský a Wimmer (Probastat, 2006) navrhli váhy proporcionálne k s
1 prop. ∼ wi
s2i ni
s
s20 ni − 1 2 + σ(B),i , ni ni − 3
361
(8)
Sborník konference REQUEST'06
P
P
kde s20 je kombinovaný (pooled) odhad variancie, s20 = ki=1 (ni −1)s2i /( ki=1 ni − k). Odtia© dostávame pribliºný (1 − α) × 100% konden£ný interval pre µ E
D
(9)
ˆ + q(1− α2 ) , µ ˆ − q(1− α2 ) , µ P
kde µ ˆ = ki=1 wi y¯i je stanovená (vypo£ítaná) k©ú£ová referen£ná porovnávacia hodnota (KCRV) pre meranú veli£inu µ a q(1− α2 ) ozna£uje roz²írenú neistotu pre KCRV (je to 1 − α2 kvantil rozdelenia náhodnej premennej ˜˜ − µ µ ˆ). Na ilustráciu uvádzame výpo£et intervalového odhadu (7) a (9) pre spolo£nú strednú hodnotu µ. Ako vstupné dáta sme vyuºili výsledky meraní z k©ú£ového porovnávania v oblasti vibrácii, uvedené v Tab. 1. Numerické výpo£ty pre 95% konden£né intervaly pre µ dávajú nasledovné výsledky: (i) ²tatistický interval (7) je 0.12664 ± 1.823e-004 (ii) metrologický interval (9) 0.12663 ± 0.946e-004.
7 Algoritmus TDIST V tejto £asti je uvedený popis algoritmu TDIST (MATLAB, R, S-plus), ktorý je vhodný na exaktný numerický výpo£et kritických hodnôt pre konden£ný interval (intmetrol), pozri Witkovský (Compstat, 2004). Uvaºujme P T = ki=1 λi Ti , lineárnu kombináciu nezávislých náhodných premenných so Studentovým t rozdelením s νi stup¬ami vo©nosti. Nech φTi (t) ozna£uje charakteristickú funkciu Ti . Potom charakteristická funkcia náhodnej premennej T je (10)
φT (t) = φT1 (λ1 t) · · · φTk (λk t). kde
φTi (λi t) =
1 νi
2 2 −1 Γ( ν2i )
µ
1 2
½
¶ νi
νi |λi t|
2
K
νi 2
1 2
¾
νi |λi t| ,
(11)
a Kα {z} ozna£uje modikovanú Besselovú funkciu druhého druhu. Characteristická funkcia Studentovej t náhodnej premennej je reálna funkcia.
362
V. Witkovský: Metódy výpočtu porovnávacej referenčnej hodnoty ...
Confidence Intervals for the Comparison Reference Value 0.1285
0.128
Charge Sensitivity
0.1275
0.127
0.1265
0.126
0.1255
1
2
3
4
5
6 7 Laboratory
8
9
10
11
12
Obr. 2: 95% konden£né intervaly pre µ: (i) ²tatistický 0.12664 ± 1.823e004 (£ierne preru²ované £iary)(ii) metrologický 0.12663 ± 0.946e-004 (modré bodko-£iarkované £iary). Kumulatívna distribu£ná funkcia, FT (x) = Pr{T ≤ x}, je pod©a vety o inverznej transformácii pod©a £lánku Gil-Pelaez (Biometrika, 1951) daná ako Z
FT (x) = =
Ã
!
e−itx φT (t) 1 1 ∞ dt = − t 2 π 0 Z 1 1 ∞ sin(tx)φT (t) dt, + t 2 π 0
(12)
a funkcia hustoty fT (x)náhodnej premennej T je daná vz´ahom Z
fT (x) = =
´ 1 ∞ ³ −itx < e φT (t) dt π Z0 1 ∞ cos(tx)φT (t) dt. π 0
(13)
Algoritmus TDIST numericky po£íta (12) a (13) pomocou Gaussovej kvadratúry na reálnom intervale t ∈ (0, 10π), £o vyºaduje výpo£et bázových bodov bij a váh wij , i = 1, . . . , p, j = 1, . . . , m.
363
Sborník konference REQUEST'06
FT (x) ≈
p m X sin(bij x) 1 1X Wij , + bij 2 π j=1 i=1
(14)
p m X 1X cos(bij x)Wij , π j=1 i=1
(15)
fT (x) ≈
kde Wij = wij φT (bij ). Pre výpo£et FT (x) a fT (x) v mnohých rôznych bodoch x, algoritmus vyºaduje len jedno vy£íslenie váh Wij , ktoré priamo závisia od charakteristickej funkcie φT (·) a nezávisia uº od hodnôt x. Algoritmus moºno jednoducho zov²eobecni´ na výpo£et distrib£nej funkcie lineárnej kombinácie iných symetrických distribúcii so známou charakteristickou funkciou: Uvaºujme náhodné premenné Z ∼ N (0, 1) (²tandardné normálne rozdelenie), U ∼ U(−1, 1) (rovnomerné rozdelenie na intervale (−1, 1)), a ∆ ∼ T (−1, 1) (trojuholníkové rozdelenie na intervale (−1, 1)), pri£om (
(λt)2 φZ (λt) = exp − 2
)
,
sin(λt) , λt (2 − 2 cos(λt)) , φ∆ (λt) = (λt)2 φU (λt) =
kde λ je ©ubovo©ný reálny koecient.
364
(16) (17) (18)
V. Witkovský: Metódy výpočtu porovnávacej referenčnej hodnoty ...
Literatúra [1] BIPM IEC IFCC ISO IUPAC OIML. Guide to the expression of uncertainty in measurement, 2nd ed., 1995. [2] CIPM BIPM. Mutual recognition of national measurement standards and of calibration and measurement certicates issued by national metrology institutes with Technical Supplement revised in October 2003. Comité international des poids et mesures (CIPM), Bureau international des poids et mesures (BIPM), Paris, 14 October 1999. [3] NIST. Essentials of expressing measurement uncertainty. http://www. physics.nist.gov/cuu/Uncertainty/basic.html. [4] Cox, M.G. Siebert, B.R.L. The use of a Monte Carlo method for evaluating uncertainty and expanded uncertainty. Metrologia, 43, (2006), S178S188. [5] Fairweather, W.R. A method of obtaining an exact condence interval for the common mean of several normal populations. Applied Statistics, 21, (1972), 229233. [6] Gleser, L.J. Assesing uncertainty in measurement. Statistical Science, 13, (1998), 277290. [7] Gil-Pelaez, J. Note on the inversion theorem. Biometrika 38, (1951), 481482. [8] Hartung, J. Böckenho, A. Knapp, G. Generalized Cochran-Wald statistics in combining of experiments. Journal of Statistical Planning and Inference, 113, (2003), 215237. [9] Iyer, H.K. Wang, C.M.J. Mathew, T. Models and condence intervals for true values in interlaboratory trials. Journal of the American Statistical Association, 99, (2004), 10601071.
365
Sborník konference REQUEST'06
[10] Jordan, S.M. Krishnamoorthy, K. Exact condence intervals for the common mean of several normal populations. Biometrics, 52, (1996), 7786. [11] Kacker, R.N. Datla, R.U. Parr, A.C. Statistical analysis of CIPM key comparisons based on the ISO Guide. Metrologia, 41, (2004), 340352. [12] Krishnamoorthy, K. Lu, Y. Inferences on the common mean of several normal populations based on the generalized variable method. Biometrics, 59, (2003), 237247. [13] Rukhin, A.L. Vangel, M.G. Estimation of a common mean and weighted means statistics. Journal of the American Statistical Association, 93, (1998), 303308. [14] von Martens, H.-J. Elster, C. Link, A. Täubner, A. Wabinski, W. Final report on key comparison CCAUV.V-K1. Metrologia, 40, (2003), Tech. Suppl. 09001. [15] Wang, C.M.J. Iyer, H.K. A generalized condence interval for a measurand in the presence of type-A and type-B uncertainties. Measurement, 39, (2006), 856863. [16] Witkovský, V. Matlab algorithm TDIST: The distribution of a linear combination of Student's t random variables. In Jaromir Antoch (Ed.): COMPSTAT. Proceedings in Computational Statistics. 16th Symposium Held in Prague, Czech Republic, 2004, Physica-Verlag, 1995-2002. [17] Witkovský, V. Wimmer, G. Exact and approximate condence intervals for the comparison reference value. In: PROBASTAT 2006 The Fifth International Conference on Probability and Mathematical Statistics, Abstracts. Smolenice Castle, Slovak Republic, June 5-9, 2006, p.49.
366
V. Witkovský: Metódy výpočtu porovnávacej referenčnej hodnoty ...
[18] Yu, P.L.H. Sun, Y. Sinha, B.K. On exact condence intervals for the common mean of several normal populations. Journal of Statistical Planning and Inference, 81, (1999), 263277.
Adresa autora:
Doc. RNDr. Viktor Witkovský, CSc., Slovenská akadémia vied, Ústav merania, Dúbravská cesta 9, 841 04 Bratislava e-mail:
[email protected]
367
Zefektivnění procesu RCM Jaroslav Zajíček Abstrakt: Čas jsou peníze. To je hlavní myšlenka této práce. Principy metody RCM jsou všeobecně známé, jedná se o nalezení takové údržby, která je z dlouhodobého hlediska pro provozovatele finančně nejvýhodnější. Avšak i tato metoda má své limity – tím je především cena samotné analýzy. V případě, že by analýza byla ekonomicky náročnější než její předpokládaný profit, je třeba se zamyslet, zda analýzu zastavit či změnit její formu. Po více než ročních zkušenostech s aplikací RCM v rafineriích v Kralupech nad Vltavou a v Litvínově přichází potřeba časově-ekonomické optimalizace analýzy. V tomto příspěvku jsou prezentovány 3 možné cesty zefektivnění, každá se svými pozitivy i negativy. Výsledkem je rozhodovací diagram kombinující uvedené možnosti pro zařízení vstupující do analýzy. Individuální hloubka analýzy pro každou položku a účelné rozvržení účasti expertů tak umožní s minimálním nárůstem rizika značnou úsporu času. A čas jsou peníze.
Úvod Dobře známá metodika RCM (údržba zaměřená na bezporuchovost) slouží k nalezení ekonomicky optimální údržby zařízení v dlouhodobém horizontu. Klasická forma RCM, tedy v plné hloubce analýzy, je velmi náročná, a to z hlediska jak znalostí a zkušeností s analyzovaným zařízením, tak z pohledu finančního a časového. Právě z finančních a časových důvodů se v běžné praxi metodika zjednodušuje (například analýza pouze dominantních módů poruch, analýza vybraných zařízení, apod.). Zjednodušení však s sebou přinášejí určitá rizika. Cílem této práce je najít způsob takového zefektivnění analýz, který při snížení časové náročnosti přinese minimální nárůst rizika.
368
J. Zajíček: Zefektivnění procesu RCM.
Motivace Proces RCM je aplikován v rafineriích v Kralupech nad Vltavou a v Litvínově po dobu delší než 1 rok, proto dochází k jeho přezkoumání. Dosud bylo analyzováno 7 provozních jednotek, což je přibližně 20% z celkového počtu. Z hlediska financování, požadavků na plán údržby a obměny provozního zařízení byl vznesen požadavek ze strany managementu na rychlejší průběh analýz.
Analytická část Při analýze pilotní jednotky byli všichni zainteresovaní pracovníci přítomni po celou dobu workshopu, v případě následujících analýz již byli členové týmu zváni podle aktuální potřeby a v případě neplánované nutné konzultace byli dostupní telefonicky. Podklady pro analýzy byly připraveny v dostatečném předstihu před zahájením workshopu, ovšem v průběhu analytické činnosti byly často zjištěny některé jejich nedostatky.
Možnosti zvýšení efektivity Vzhledem k výše konstatovaným nedostatkům lze zvýšit efektivitu procesu RCM pomocí zvýšení kvality vstupních dat, zejména seznamu majetku a výkresové dokumentace. Tento bod je samostatnou cestou zvýšení efektivity a je možné ho kombinovat s dále uvedenými možnostmi optimalizace procesu RCM. Pokud budeme předpokládat, že toto je splněno, existují v podstatě tři možnosti změny vedení workshopů, uvedené v následujících podkapitolách.
369
Sborník konference REQUEST'06
Zlepšení organizace týmů První možností na zefektivnění procesu RCM je odlišné časové plánování účasti jednotlivých členů týmu na workshopech. V praxi se jedná o přístup, kdy pro analýzu položek jedné odbornosti bude přítomen pouze zástupce tohoto odvětví. Tím se sníží časová vytíženost všech členů týmu (kromě facilitátora a operátora, jejichž přítomnost je nezbytná z důvodu správného záznamu scénáře poruchy a nákladů na činnost operátora) a otevře se možnost pro aktuálně „nepotřebné“ zaměstnance pracovat na svých standardních úkolech. Ovšem je nutné upozornit na možná úskalí tohoto přístupu. Jedná se zejména o ztrátu týmové práce, což je v rozporu s metodikou RCM. Existuje možnost, že ten člen týmu, který bude právě přítomen analýze, nedomyslí do všech podrobností důsledky diskutované poruchy, čímž klesá kvalita analýz. Další eventualitou je možnost, že každá odbornost bude sebe považovat za nejdůležitější, tedy např. bude plánovat vyšší počet hodin na obnovu funkce zařízení, než je skutečnost. Po zvážení všech aspektů této varianty zefektivnění procesu RCM vyvstává jako největší problém ztráta práce v týmu, která je zcela proti myšlence RCM.
Typové plány údržby Tato možnost zrychlení analýz vychází z poznatku, že se na rafinerii jako celku vyskytuje velké množství typově podobných nebo dokonce shodných zařízení. Potom by bylo dostačující vytvořit tzv. „typové komponenty“, které by byly v průběhu analýzy pouze dosazovány do pozic podle instrukcí jednotlivých odborností. Podobnou možností je generalizování zařízení s přihlédnutím k jeho kritičnosti, tedy pokud bude kritičnost položky malá, bude s ní nakládáno „typově“, jinak na této položce proběhne standardní RCM. Typickým příkladem zařízení pro typové plány údržby jsou místní měření - manometry, teploměry, průtokoměry apod.. Výše zmíněným dosazováním typových komponent klesne časová náročnost analýzy, potažmo i náklady na její provedení. Existuje však nebezpečí zahrnutí unikátní položky do typových plánů. Mezi nedostatky patří ztráta individuálního přístupu k některým
370
J. Zajíček: Zefektivnění procesu RCM.
vybraným položkám. Dále hrozí možnost přehlédnutí specifického aspektu poruchy takové položky, např. její vliv na odstavení výroby, bezpečnost práce nebo životní prostředí. Podobný problém nastává, pokud budeme typově nakládat s položkami, na které je aplikována mandatorní (zákonem daná) údržba. Proto je nezbytné, aby seznam typových komponent před zahájením analýzy přezkoumal zástupce provozu a technolog, kteří odfiltrují takto nestandardní položky ze seznamu typových zařízení a na tyto proběhne podrobná RCM. S tímto přístupem budou analyzovány všechny komponenty a kritické (resp. všechny kromě vybraných) komponenty budou analyzovány za účasti všech členů týmu. Neproběhne však kompletní revize majetku, výkresové dokumentace a neodhalí se některé kritické položky.
Analýza vybraných komponent Poslední navrhovaná možnost optimalizace procesu RCM spočívá v možnosti vybrat komponenty s vysokou kritičností, případně komponenty s vlivem na bezpečnost práce nebo životní prostředí, eventuálně provést Paretovu analýzu rafinerie a pouze na takto vybraných položkách provést analýzu. Výhodou tohoto přístupu je nižší časová náročnost takového procesu s dosažením výrazných ekonomických úspor. Nedostatkem tohoto přístupu je zejména nemožnost naplánování kompletního systému údržby pro rafinerii, neboť bude analyzováno pouze nepatrné procento ze všech komponent. Další nevýhodou pak je skutečnost, že neproběhne kontrola seznamu majetku a výkresové dokumentace. Z výše uvedeného dále vyplývá, že nebude možné objektivně porovnat náklady na údržbu před a po analýze, protože současné náklady nejsou přiřazeny k jednotlivým zařízením, ale k celé výrobní jednotce. Na základě uvedených předností a nedostatků této možnosti změny procesu se nedoporučuje její uvedení do praxe, spíše se totiž jedná o možnost výběru komponent pro přezkoumání plánu údržby REM, než o metodu urychlení RCM.
371
Sborník konference REQUEST'06
Nový postup analýzy Na základě zhodnocení výhod a nevýhod zjednodušení metodiky uvedených v předcházející kapitole byl navržen nový postup, který je znázorněn na rozhodovacím diagramu. Diagram zcela jedno-značně určuje sled činností a také zachycuje zodpovědnost pracovníků za jednotlivé úkony.
Obr. 1: Rozhodovací diagram 1/3
372
J. Zajíček: Zefektivnění procesu RCM.
Obr. 2: Rozhodovací diagram 2/3 Vyhodnocení Impulsem pro zefektivnění procesu byl požadavek managementu společnosti na zkrácení doby trvání analýzy, úsporu nákladů na proces a uvolnění specialistů pro jiné aktivity. Důležitým faktorem také bylo zachování počtu analyzovaných zařízení kvůli kompletnímu naplnění plánů údržby. Rozhodovací diagram respektuje jak požadavky managementu, tak základní filosofii RCM, kdy týmová práce za účasti všech příslušných členů zůstala zachována u důležitých zařízení. Důležitými zařízeními jsou míněna zařízení s možným vlivem na bezpeč-
373
Sborník konference REQUEST'06
nost práce a životní prostředí, zařízení důležitá z hlediska provozu a zařízení, která vykazují vysoké náklady při poruše či údržbě.
Obr. 3: Rozhodovací diagram 3/3
Adresa autora: Ing. Jaroslav Zajíček, Fakulta mechatroniky a mezioborových inženýrských studií, Technická univerzita v Liberci, Hálkova 6, 461 17 Liberec Email:
[email protected] Tato práce byla vytvořena v rámci projektu MŠMT 1M06047 - CQR
374
Využití expertního systému při odhadu vlastností výrobků Libor Žák Abstrakt. Článek se zabývá možností, jak využít fuzzy expertní systém pro popis vlastností výrobku. Důvodem tohoto přístupu je možnost využití vágních pojmů k popisu parametrů ovlivňujících kvalitu výrobku. Správně definovaný a odladěný fuzzy expertní systém může odhadnout výsledné vlastnosti výrobku pro modifikované vstupní parametry. Tento přístup je ukázán na návrhu fuzzy expertního systému pro odhady pevnostních charakteristik betonových směsí.
1. Úvod Fuzzy Inference System (FIS) jsou jednou z častých aplikací fuzzy množin v praxi. Jejich vyžití je vhodné zejména při modelování neurčitých systémů, kde se předpokládá vliv veličiny, kterou nelze přesně definovat pomocí klasické matematické logiky a konvenčních prostředků systémové analýzy, tj. například diferenciálních nebo diferenčních rovnic nebo nástroji matematické statistiky. Takovým systémem může být i výrobní proces. Výroba může být ovlivňována množstvím parametrů, které nelze jednoznačně vyjádřit. Pro zkoumání kvality výrobku je potřeba najít vztah mezi parametry ovlivňujícími výrobu a konečnými vlastnostmi výrobku. Kromě analytických metod se v poslední době využívají také neuronové sítě a metody založené na fuzzy množinách. Tento článek se zabývá aplikací fuzzy množin a zvláště pak Fuzzy Inference System. Správná činnost FIS závisí na vhodné volbě parametrů, které lze odhadnout na základě předcházejících měření. Pomocí správně odladěného FIS lze odhadnout i vlastnosti takových výrobků, jejichž vstupní charakteristiky byly pozměněny. Tyto údaje pak lze využít při zkvalitnění a zefektivnění výroby.
375
Sborník konference REQUEST'06
2. Proč právě Fuzzy Inference System Jak jsem zmínil v úvodu, existuje více metod odhadu vlastností výrobku. Proč tedy v některých případech je vhodné zvolit právě přístup pomocí Fuzzy Inference Systém. Důvodem je pojem fuzzy. V řadě případů jsou parametry, které ovlivňují vlastnosti výrobku popsané pomocí přibližných nebo zjednodušených pojmů. Při výrobě předpokládáme, že materiál vstupující do výroby má předepsanou kvalitu. V mnoha případech ale nelze v předcházejících krocích výroby dodržet přesně daný parametr. Příkladem může být síla vlákna, které kolísá v určitém rozmezí, nebo ubetonových směsí hrubost štěrku. Tedy parametry materiálu vstupujícího do výroby nelze (v těchto případech) popsat v přesně daných pojmech, ale musíme použít vágnější popis. Právě užití fuzzy množin je výhodné pro popis a počítání s těmito vágními výrazy.
3. Popis Fuzzy Inference System Pro předpověď parametrů výrobku využijeme Fuzzy Inference System (dále jen FIS), který pracuje na základě znalostních pravidel. Tato pravidla jsou definována kombinací možných vzorových vstupů a výstupů. Vzorové vstupy a výstupy se definují pomocí tzv. jazykových proměnných a jejich hodnot. Jazykové hodnoty jsou popsány fuzzy množinami. Vhodné kombinace vstupních a výstupních jazykových hodnot definují znalostní pravidla podle kterých FIS počítá. Každé pravidlo určí vztah mezi zvolenými vstupními a výstupními hodnotami. V teorii fuzzy množin lze FIS považovat za fuzzy relaci. Při hledání vhodného FIS jsme použili typ Mamdani (který odpovídá předcházejícímu popisu) a také typ Sugeno, který má výstupní veličiny ve tvaru konstant nebo lineárních funkcí. 3.1 Fuzzy Inference System (FIS) Prvním krokem při definování FIS je volba počtu vstupních proměnných (n) a výstupních proměnných (m). Pro každou proměnnou zvolíme počet a tvar předdefinovaných vstupních
376
L. Žák: Využití expertního systému při odhadu vlastností výrobků.
hodnot (lze je uvažovat jako vzorové vstupy a výstupy). Na základě předdefinovaných vstupních a výstupních hodnot (které jsou uvažovány ve tvaru fuzzy množin) nadefinujeme pravidla FIS (počet pravidel: r). Každé pravidlo určí vztah mezi zvolenými vstupními a výstupními hodnotami. k k k k ℜk ≡ jestliže x1 je A j ,1 a x2 je A j , 2 a … a xn je A j ,n pak y1 je B j ,1 , y2 je
B kj, 2 ,…, ym je B kj ,m , k kde xi je vstup do FIS, A j ,i je předdefinovaná jazyková hodnota i–té
vstupní jazykové proměnné,
B kj ,s je předdefinovaná jazyková
hodnota s–té výstupní jazykové proměnné odpovídající k-tému pravidlu (i=1,…,n, s=1,…,m, k=1,…,r). Při použití FIS porovnáváme libovolný vstup do FIS s předdefinovanými vstupními hodnotami. Tedy pokud vstup (x1,...,xn) patří do oblasti, která je vymezena k k jazykovými hodnotami A j ,1 až A j ,n , pak výstup je spočítán pomocí
B kj ,s . Na základě tohoto porovnání a pomocí pravidel FIS dostaneme výstup FIS ve tvaru fuzzy množiny. Pokud má být výstupem reálná hodnota, provede se tzv. defuzzikace, kdy fuzzy množinu nahradíme jediným číslem. Takto popsaný FIS se nazývá FIS typu Mamdani. Pro předpověď časových řad se častěji užívá FIS typu Sugeno, který je modifikací typu Mamdani. Uvažuje se pouze jedna výstupní proměnná a vstup do FIS je ve tvaru (x1,...,xn)∈Rn. Vstupní předdefinované hodnoty jsou ve stejném tvaru jako FIS typu Mamdani. Rozdíl je ve výstupních veličinách. Každému pravidlu přísluší funkce n proměnných. k k k ℜk ≡ jestliže x1 je A j ,1 a x2 je A j , 2 a … a xn je A j ,n pak zk = fk(x1,…xn) k kde xi je vstup do FIS, A j ,i je jk –tá předdefinovaná jazyková hodnota
i–té jazykové proměnné odpovídající k-tému pravidlu (i=1,…,n , k=1,…,r). Tedy pokud vstup (x1,...,xn) patří do oblasti, která je k k vymezena jazykovými hodnotami A j ,1 ,…, A j ,n , pak výstup je spočítán pomocí funkce fk. Váha wk výstupu zk je určena mírou shody k k vstupu (x1,...,xn) s jazykovými hodnotami A j ,1 ,…, A j ,n obdobným způsobem jako u FIS typu Mamdani. Pro vstup (x1,..., xn) dostanu pomocí pravidel ℜ1,…,ℜr hodnoty z1,…, zr a váhy w1,…, wr. Pomocí
377
Sborník konference REQUEST'06
váženého průměru dostaneme výslednou výstupní hodnotu z. Ve většině FIS typu Sugeno se funkce f1 až fr definují v jako konstanty: fk(x1,…xn) = αk, nebo v lineární tvaru: fk(x1,…xn) = αk+βk,1x1+βk,2x2+…+βk,nxn. kde αj, βi,j i= 1, 2, …, n, j = 1, 2, …, m jsou vhodné konstanty. Tyto konstanty se často upřesňují až v procesu ladění FIS nad ladicími daty.
3.2 Návrh FIS ze zadaných dat Z výrobního postupu výrobku určíme parametry, které udávají počet vstupních proměnných (n) do FIS. Parametry popisující kvalitu výrobku budou výstupní proměnné ( počet m) FIS. V některých případech je vhodné pro vybrané výstupní parametry odladit samostatný FIS. Předpokládejme tedy, že FIS má n vstupních a m výstupních jazykových proměnných. Dále máme T vzorových vstupů do FIS a k nim T příslušných vzorových výstupů. Označme:
⎛ x1,1 ⎜ ⎜ x 2,1 X =⎜ ... ⎜ ⎜x ⎝ T ,1
x1, 2 x 2, 2 ... xT , 2
... x1,n ⎞ ⎛ y1,1 ⎜ ⎟ ... x 2,n ⎟ ⎜ y 2,1 Y =⎜ ⎟ ... ... ... ⎜ ⎟ ⎜y ... xT ,n ⎟⎠ ⎝ T ,1
y1, 2 y 2, 2 ... yT , 2
y1,m ⎞ ⎟ y 2,m ⎟ ... ⎟ ⎟ ... yT ,m ⎟⎠ ... ... ...
Účelem správného definování FIS je, aby fungoval nad celou oblastí možných vstupů. Proto se před laděním FIS vzorová data rozdělí na dvě části. Na ladicí část: XL, YL a testovací část: XT, YT. Ladicí část – ladicí data – slouží k vytvoření jazykových hodnot, pravidel a k odladění FIS (viz dál). Testovací část – testovací data – slouží ke kontrole FIS. Nechť máme K ladících dat a H testovacích dat, kde T= K+H. Označme:
378
L. Žák: Využití expertního systému při odhadu vlastností výrobků.
⎛ x1L,1 ⎜ L ⎜x L X = ⎜ 2,1 ⎜ ... ⎜ xL ⎝ K ,1
XT
⎛ x1T,1 ⎜ T ⎜x = ⎜ 2,1 ⎜ ... ⎜ xT ⎝ H ,1
x1L, 2 x 2L, 2 ... x KL , 2 x1T, 2 x 2T, 2 ... x HT , 2
⎛ y1L,1 x1L,n ⎞ ⎜ L ⎟ x 2L,n ⎟ ⎜ y 2,1 L ⎟ Y =⎜ ... ... ⎟ ⎜ ... L ⎟ ⎜ yL ... x K ,n ⎠ ⎝ K ,1
... ...
⎛ y1T,1 x1T,n ⎞ ⎜ T ⎟ x 2T,n ⎟ ⎜ y 2,1 T ⎟ Y =⎜ ... ... ⎟ ⎜ ... ⎜ yT ... x HT ,n ⎟⎠ ⎝ H ,1 ... ...
... y KL , 2
y1L,m ⎞ ⎟ y 2L,m ⎟ ⎟ ... ... ⎟ ... y KL ,m ⎟⎠
y1T, 2 y 2T, 2
... ...
y1L, 2 y 2L, 2
... y HT , 2
... ...
y1T,m ⎞ ⎟ y 2T,m ⎟ ⎟ ... ... ⎟ ... y HT ,m ⎟⎠
kde XL, YL jsou data ladicí a XT, YT jsou data testovací. Rozdělení vzorových dat na ladicí a testovací data lze uskutečnit následujícími způsoby: a) Podle pořadí – prvních K se považuje za ladící data a zbytek jsou testovací data. b) Pokud existují různé typy vzorových dat, je vhodné, aby testovací data obsahovala všechny různé typy dat. Z každého typu vzorových dat se vybere alespoň jeden řádek vstupů a výstupů. c) Vybereme náhodně H testovacích dat ze vzorových dat. d) Při výběru testovacích dat lze kombinovat předcházející přístupy. Matice ladicích dat spojíme do jedné matice a označíme ji Z:
⎛ x1L,1 ⎜ L ⎜x XY L = ⎜ 2,1 ⎜ ... ⎜ xL ⎝ K ,1
⎛ ⎜ ⎜ ⎜ ⎜ ⎜ ⎝
... ...
x1L,n x 2L,n
... ... ... x KL ,n
z1,1
K
z 2,1
K
K
K
z K ,1
K
379
y1L,m ⎞ ⎟ y 2L,m ⎟ ⎟ = ... ... ... ⎟ y KL ,1 ... y KL ,m ⎟⎠ z1,n + m ⎞ ⎟ z 2,n + m ⎟ =Z K ⎟ ⎟ z K ,n + m ⎟⎠ y1L,1 y 2L,1
... ...
Sborník konference REQUEST'06
V dalším kroku tvorby FIS musíme pro každou vstupní a výstupní jazykovou proměnnou nadefinovat vzorové jazykové hodnoty. Musíme určit jejich počet a odpovídající tvar ve formě fuzzy množiny. S jejich pomocí pak určíme znalostní pravidla FIS. Existují dva základní přístupy. a) Vychází se ze znalosti problému (obecné znalosti, využití zkušeností konkrétního pracovníka, …), které se převedou na odpovídající hodnoty a pravidla. b) Pomocí matice dat Z se vygenerují možné jazykové hodnoty a pravidla. Každý řádek matice Z lze uvažovat jako bod zi v prostoru En+m . Z lze brát jako K bodů v En+m. Tyto body můžeme uzavřít do n+m rozměrného kvádru o stranách K1, K2,…, Kn+m, kde strany kvádru Ki lze definovat: Kj = min{ z i , j , i = 1,K , K }, max{z i , j , i = 1,K , K } Označme K= K1×K2×…×Kn+m. S pomocí matice Z chceme pro každou vstupní a výstupní jazykovou hodnotu určit počet a tvar jazykových hodnot a pomocí nich definovat pravidla FIS. Hlavní přístup je v rozkladu K na menší oblasti a pro každou oblast nadefinujeme vstupní a výstupní jazykové hodnoty a k nim odpovídající pravidla. Využijeme dva hlavní přístupy k rozkladu ladicích dat: a) Pomocí dělení jednotlivých stran. b) Pomocí shlukovacích metod. Tyto metody lze také kombinovat.
4. Využití naměřených údajů pro nastavení FIS Pomocí výše popsaných metod lze definovat více FIS. Z těchto FIS musíme vybrat ten nejvhodnější. K tomu použijeme testovací část vzorových dat. Pomocí nalezených FIS a vzorových vstupů z testovacích dat provedeme odhady parametrů výrobku a porovnáme je s výstupními hodnotami testovací části. Kvalitu FIS lze posuzovat podle více kritérií. Nejčastěji používanými kritérii jsou: MAPE – velikost průměrné chyby MAX – maximální rozdíl
380
L. Žák: Využití expertního systému při odhadu vlastností výrobků.
Nechť (r1, r2,…, rm ) jsou výstupní hodnoty testovací části a (p1, p2,…, pm ) jsou předpovězené hodnoty. Pak MAPE = 1
⎞ ⎛ K (abs( p h -rh ) rh ) ⎟ ⎜ ∑ K ⎝ h=1 ⎠
MAX = max {abs( p h -rh )} h =1,..., K
Kvalitu předpovědi lze posuzovat i pomocí kombinací těchto (popřípadě i více kritérií). Pro odhad vlastností a kvality výrobku použijeme ten FIS, který má nejlepší shodu předpovězených a testovacích hodnot.
5. Příklad – odhad vlastností betonových směsí Příkladem použití FIS pro odhad vlastností výrobků byla diplomová práce Petra Misáka ( obor Matematické inženýrství). Jeho úkolem bylo popsat FIS a využít ho pro odhady pevnostních charakteristik betonových směsí při použití vybraných plastifikačních přísad a cementů. Tyto FIS budou použity jako doporučující nástroj při návrhu nových cementů a betonových směsí, zejména za účelem snížení počtu laboratorních zkoušek a potažmo i celkových nákladů. Dále je možné jejich využití při posouzení vlivu plastifikačních přísad a cementů na pevnostní charakteristiky betonu. 5.1. Složení betonové směsi Pod pojmem betonová směs rozumíme směs cementu, kameniva, záměsové vody a případně plastifikační přísady. Složení betonových směsí bylo totožné pro všechny zkoumané vzorky, proměnlivé bylo pouze množství přidávané plastifikační přísady. Množství betonové směsi pro vytvoření jednotlivých vzorků vycházelo z předpokladu, že z každého vzorku se má vytvořit šest zkušebních těles. Tři zkušební tělesa byla podrobena zkouškám na pevnost v tahu za ohybu a zkoušce v tlaku po sedmi dnech a další tři zkušební tělesa byla podrobena těmto zkouškám po dvaceti osmi dnech. Pro každou plastifikační přísadu a jeden typ cementu byly tedy vytvořeny celkem tři vzorky s různým procentuálním zastoupením. Dávkování
381
Sborník konference REQUEST'06
vycházelo z maximální, střední a minimální dávky udávané výrobcem. Byla zvolena navážka 900 gramů cementu a 2700 gramů kameniva frakce 0 – 4 mm. Množství záměsové vody bylo konstantní, tedy 495 ml. Aby se ve výsledcích dostatečně projevily vlivy různých typů plastifikačních přísad a cementů, byl použit pro všechny vzorky stejný typ záměsové vody a stejné kamenivo. Formy se zhutnělou betonovou směsí byly uloženy po dobu cca 24 hodin v laboratoři s průměrnou teplotou 20o C. Poté byly vzorky odformovány a uloženy do místnosti pro normální zrání (teplota 20 ± 2 o C, relativní vlhkost 90 ± 2%). Byly použity následující druhy cementů a plastifikačních přísad. Použité druhy cementů • Portlandský struskový cement CEM II/B - S 32,5 R (českomoravský cement a.s. závod Mokrá) • Portlandský cement CEM I - 42,5 R (českomoravský cement a.s. závod Mokrá) • Portlandský cement CEM I - 52,5 (českomoravský cement a.s. závod Mokrá) • Vysokopecní cement CEM III/A - 32,5 R (Cementárny a vápenky Prachovice a.s.) • Portlandský cement CEM I - 42,5 R (Cementárny a vápenky Prachovice a.s.) • Portlandský cement CEM I - 52,5 R (Cementárny a vápenky Prachovice a.s.) Použité plastifikační přísady • Sika Viscocrete - 5 • Sika Plastiment - BV 40 • Sika Sikament - 10 HRB • Sika Sikament - HE 200 • Sika Sikament Multimix - 100 5.2. Ladění FIS Původním záměrem bylo navržení jednoho FIS, který by zahrnoval celou škálu možných vstup, ovlivňujících kvalitu betonové směsi. Z výrobního postupu vyplynulo, že se při přípravě betonové směsi používá pouze jedna plastifikační přísada. Jako výhodné se ukázalo vytvoření samostatných FIS pro každou plastifikační směs. Bylo tedy sestaveno celkem pět FIS pro pět plastifikačních přísad. Pro každou
382
L. Žák: Využití expertního systému při odhadu vlastností výrobků.
plastifikační přísadu byly navrženy FIS se čtyřmi výstupními proměnnými. Těmito proměnnými byla vždy pevnost výsledného betonu v tlaku po 7 a 28 dnech zrání a pevnost výsledného betonu v tahu za ohybu po 7 a 28 dnech zrání. Vstupní proměnné • Měrný povrch • Pevnost cementu v tlaku za 28 dní • Objemová stálost • % plastifikační přísady vzhledem k hmotnosti cementu Výstupní proměnné • Pevnost v tahu za ohybu za 7 dní • Pevnost v tahu za ohybu za 28 dní • Pevnost v tlaku za 7 dní • Pevnost v tlaku za 28 dní Pro vytvoření FIS byly nejprve použity shlukovací metody. V průběhu testování se ukázalo, že pokud vstupní hodnoty jsou blízko vzorových vstupů, dával FIS správné výsledky. Pokud ale odchylka od vzorových dat byla větší, dával FIS nereálné hodnoty. Tato situace byla způsobena tím, že ladicí data byla soustředěna v poměrně malé části oblasti K a shluky a jim odpovídající pravidla úspěšně fungovala na malé části možných vstupů. V další části se pozornost soustředila na FIS definovaný pomocí dělení K na menší části. Tyto FIS nebyly tak citlivé v oblasti shluků, ale pokud se vstupní data více lišila od vzorových dat, dávaly rozumné výsledky. Jednotlivé FIS byly sestaveny a testovány pomocí Fuzzy Toolboxu prostředí MATLAB a poté spojeny do jediného programu, který umožní snadné ovládání pomocí grafického uživatelského rozhraní (GUI). Naměřená data, nutná k sestavení jednotlivých FIS, byla získána pevnostními zkouškami provedenými na FAST VUT v Brně. V další činnosti se předpokládá, že pro správné fungování FIS v celé oblasti možných vstupů se provedou zkoušky a získají se ladicí data pokrývající celou oblast vstupů. Současně s tím se bude dolaďovat FIS, tak aby jím předpovězené hodnoty co nejvíce odpovídaly hodnotám naměřeným. Použitím FIS v této oblasti dosáhneme úspory prostředků a hlavně úspory času (není potřeba čekat na vytvrzení).
383
Sborník konference REQUEST'06
6. Závěr Na závěr bych chtěl ještě jednou zmínit výhody fuzzy přístupu k odhadování vlastností výrobků. Je to možnost pracovat s vágními daty a FIS je založen na fuzzy pravidlech a není (na rozdíl od neuronových sítí) tak „černou skříňkou“. Při zpětném pohledu na odladěné FIS a jejich pravidla lze odhadnout možné vztahy mezi vstupními a výstupními veličinami. Pomocí těchto vztahů máme možnost určení vhodných vstupních parametrů výroby, na jejímž konci bude výrobek s požadovanými vlastnosti. Adresa autora: RNDr. Libor Žák, Ph.D., Vysoké učení technické Brno, Fakulta strojního inženýrství, Ústav matematiky, Technická 2896/2, 616 69 Brno e-mail:
[email protected]
Tato práce byla vytvořena v rámci projektu MŠMT 1M06047 - CQR
384