ÕȘÕ
Alternativy k Shewhartovým regulačním diagramům Ověřování předpokladů Praktické aspekty SPC Diagramy pro vysoce způsobilé procesy Vícerozměrné regulační diagramy Hodnocení způsobilosti a výkonnosti procesu
Armstrong
U Ș Ș |xt ½txuj srÑ xm {xt~ ĘĖĖĖ ā ~wrt}w |}~mrsw kjtjuº|t r wjj~sl vjpr|}n{|t xkx{ ā y{jn srÑ yºr |}~mr~ ā jq{jwrw |}Ñn ā ½r{xt ~yuj}ww jk|xunw}Ë ā x|xkw yº|}~y ā U ȘȘ|xt½txujày{x}xÑnv|uvwj|xsrk~mx~lwx|}
Pokročilejší metody statistické regulace procesu
EvaMichael Jarošová Darja Noskievičová
{x}xÑnv|uv wj|xsrk~mx~lwx|}
POKROČILEJŠÍ METODY STATISTICKÉ REGULACE PROCESU
Eva Jarošová, Darja Noskievičová
Eva Jarošová, Darja Noskievičová
Pokročilejší metody statistické regulace procesu
Grada Publishing
Nakladatelství děkuje za podporu při vydání knihy společnosti Versa Systems s.r.o. www.versasys.cz
Doc. Ing. Eva Jarošová, CSc. Prof. Ing. Darja Noskievičová, CSc.
Pokročilejší metody statistické regulace procesu Kniha je monografie Vydala Grada Publishing, a.s. U Průhonu 22, 170 00 Praha 7 tel.: +420 234 264 401, fax: +420 234 264 400 www.grada.cz jako svou 6075. publikaci Autorský kolektiv: Doc. Ing. Eva Jarošová, CSc. – autorka kapitol 2, 4, 10–12 a oddílů 5.1, 5.4, 8.5–8.7, 9.5 Prof. Ing. Darja Noskievičová, CSc. – autorka kapitol 1, 3, 6, 7 a oddílů 5.2, 5.3, 8.1–8.4, 9.1–9.4 Odborná recenze: Prof. RNDr. Gejza Dohnal, CSc. Prof. Ing. Milan Terek, PhD. Vydání odborné knihy schválila Vědecká redakce nakladatelství Grada Publishing, a.s. Odpovědný redaktor PhDr. Milan Pokorný Grafická úprava a sazba Milan Vokál Návrh a zpracování obálky Jan Dvořák Počet stran 296 První vydání, Praha 2015 Vytiskla tiskárna PowerPrint, s.r.o., Praha © Grada Publishing, a.s., 2015 Cover Photo © fotobanka allphoto ISBN 978-80-247-5884-8 (pdf) ISBN 978-80-247-5355-3 (print) Upozornění pro čtenáře a uživatele této knihy Všechna práva vyhrazena. Žádná část této tištěné či elektronické knihy nesmí být reprodukována a šířena v papírové, elektronické či jiné podobě bez předchozího písemného souhlasu nakladatele. Neoprávněné užití této knihy bude trestně stíháno.
5
Obsah O autorkách . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 Úvod . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 Cíl publikace . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 Stručně k tématu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 Struktura publikace . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 Metodika . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 1. Podstata statistické regulace procesu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 1.1 Základní charakteristika klasického regulačního diagramu . . . . . . . . . . . . . . 18 1.2 Riziko falešného a chybějícího signálu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 1.2.1 Výpočet rizika α pro regulační diagram Shewhartova typu pro průměry . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 1.2.2 Výpočet rizika β pro regulační diagram pro průměry . . . . . . . . . . . 22 1.3 Aplikace regulačního diagramu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 1.4 Hodnocení účinnosti regulačního diagramu . . . . . . . . . . . . . . . . . . . . . . . . . . 24 1.4.1 ARL pro klasické Shewhartovy regulační diagramy . . . . . . . . . . . . . 24 1.4.2 Křivka ARL . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 1.4.3 Operativní charakteristika regulačního diagramu . . . . . . . . . . . . . . 26 Literatura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 2. Předpoklady statistických metod a typy procesů . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 2.1 Předpoklad normality . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 2.1.1 Testy normality . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 2.1.2 Grafické metody . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 2.1.3 Rozhodování o platnosti předpokladu . . . . . . . . . . . . . . . . . . . . . . . . 32 2.2 Nezávislost . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 2.2.1 Testy náhodnosti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 2.2.2 Testy autokorelace . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42 2.3 Shoda středních hodnot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 2.4 Shoda rozptylů . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 2.5 Testy odlehlých pozorování . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 2.6 Typy procesů . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 2.6.1 Procesy typu A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46 2.6.2 Procesy typu B . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47 2.6.3 Procesy typu C . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47 2.6.4 Procesy typu D . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 Literatura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 3. Praktické aspekty implementace SPC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51 3.1 Etapy statistické regulace procesu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
6
3.1.1 Přípravná etapa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51 3.1.2 Etapa zabezpečení statisticky zvládnutého procesu . . . . . . . . . . . . . 52 3.1.3 Etapa analýzy a zabezpečení způsobilosti procesu . . . . . . . . . . . . . . 53 3.1.4 Etapa dlouhodobé regulace procesu . . . . . . . . . . . . . . . . . . . . . . . . . . 53 3.2 Tvorba logických podskupin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 3.3 Velikost výběru a kontrolního intervalu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56 3.4 Volba regulačního diagramu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59 Literatura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62 4. Regulační diagramy s asymetrickými mezemi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 4.1 Konstrukce pravděpodobnostních mezí . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64 4.2 Transformace . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68 Literatura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73 5. Diagramy pro procesy typu C . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75 5.1 Diagram s rozšířenými mezemi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75 5.1.1 Diagram s pásmem pro střední hodnotu . . . . . . . . . . . . . . . . . . . . . . 76 5.1.2 Regulační meze jako hranice kolísání průměrů . . . . . . . . . . . . . . . . 79 5.2 Modifikovaný regulační diagram . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80 5.2.1 Stanovení intervalu přípustné fluktuace střední hodnoty . . . . . . . . 80 5.2.2 Stanovení regulačních mezí . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81 5.2.3 Postup aplikace modifikovaného regulačního diagramu . . . . . . . . . 83 5.3 Přejímací regulační diagram . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86 5.3.1 Návrh přejímacího regulačního diagramu . . . . . . . . . . . . . . . . . . . . . 86 5.3.2 Postup při aplikaci přejímacího regulačního diagramu . . . . . . . . . . 90 5.4 Proces s trendem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92 5.4.1 Využití modifikovaného diagramu . . . . . . . . . . . . . . . . . . . . . . . . . . . 93 5.4.2 Zjednodušený přejímací diagram . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96 5.4.3 Rozšířené meze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96 5.4.4 Regresní regulační diagram . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96 Literatura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100 6. Regulační diagramy pro procesy s nízkým stupněm opakovatelnosti a s krátkými výrobními cykly . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.1 Postupy pro schválení nastavení procesu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.1.1 Předregulace . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.1.2 Wheelerova metoda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.2 Sdružování dat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.2.1 Cílové regulační diagramy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.2.2 Standardizované regulační diagramy . . . . . . . . . . . . . . . . . . . . . . . 6.3 Samostartovací metody . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.3.1 Metody založené na úpravě regulačních mezí . . . . . . . . . . . . . . . . 6.3.2 Q diagramy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.4 Regulace vstupních parametrů . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Literatura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
102 102 103 104 104 105 109 115 115 117 120 120
7
7. Regulační diagramy pro vzájemně závislá data . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.1 Metoda prodloužení kontrolního intervalu . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.2 Přístup založený na modelech časových řad . . . . . . . . . . . . . . . . . . . . . . . . . . 7.2.1 Regulační diagramy pro rezidua modelů ARIMA . . . . . . . . . . . . . 7.2.2 Aproximační postup založený na využití statistiky EWMA . . . . . 7.2.3 Dynamický diagram EWMA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.2.4 Přístup založený na modifikaci regulačních mezí . . . . . . . . . . . . . 7.3 Přístup bez použití modelu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Literatura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
122 123 125 125 132 133 135 139 144
8. Regulační diagramy CUSUM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.1 Princip metody CUSUM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.2 Diagram CUSUM pro regulaci střední hodnoty procesu . . . . . . . . . . . . . . . 8.2.1 Princip a aplikace rozhodovací masky . . . . . . . . . . . . . . . . . . . . . . 8.2.2 Diagram CUSUM s rozhodovacími mezemi . . . . . . . . . . . . . . . . . 8.2.3 Standardizovaný CUSUM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.2.4 Vlastnosti diagramu CUSUM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.2.5 Návrh diagramu CUSUM s rozhodovacími mezemi . . . . . . . . . . 8.2.6 FIR CUSUM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.2.7 Zlepšení detekce větších odchylek . . . . . . . . . . . . . . . . . . . . . . . . . . 8.2.8 Aplikace diagramu CUSUM s rozhodovacími mezemi . . . . . . . . 8.3 Nesplněné předpoklady . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.3.1 Postup při porušení normality . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.3.2 Postup při nepřesném odhadu parametrů procesu . . . . . . . . . . . . 8.3.3 Řešení autokorelace . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.4 CUSUM pro regulaci inherentní variability procesu . . . . . . . . . . . . . . . . . . . 8.5 CUSUM pro počet neshod . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.6 Diagram CUSUM pro počet neshodných . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.7 Diagramy CUSUM pro řídké jevy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Literatura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
146 146 147 148 150 153 153 157 160 163 163 164 164 165 167 168 169 172 175 175
9. Diagramy EWMA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9.1 Základní charakteristika diagramu EWMA . . . . . . . . . . . . . . . . . . . . . . . . . . 9.2 Diagram EWMA pro regulaci střední hodnoty procesu . . . . . . . . . . . . . . . . 9.2.1 Vlastnosti diagramu EWMA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9.2.2 Navrhování optimálního diagramu EWMA . . . . . . . . . . . . . . . . . 9.2.3 FIR EWMA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9.2.4 Kombinované schéma Shewhart – EWMA . . . . . . . . . . . . . . . . . . 9.3 Postupy při nesplnění předpokladů o datech . . . . . . . . . . . . . . . . . . . . . . . . . 9.3.1 Nesplnění normality dat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9.3.2 Autokorelace dat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9.3.3 Vliv chyb při odhadech parametrů . . . . . . . . . . . . . . . . . . . . . . . . . 9.4 EWMA pro variabilitu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9.5 EWMA pro počet neshod . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Literatura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
178 178 179 182 183 187 188 188 188 188 189 190 190 192
8
10. Diagramy pro vysoce způsobilé procesy (atributivní znaky) . . . . . . . . . . . . . . . 10.1 Diagram CCC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.1.1 Popis diagramu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.1.2 Vlastnosti diagramu CCC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.1.3 Konstrukce diagramu CCC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.2 Diagram CCC-r . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.2.1 Popis diagramu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.2.2 Vlastnosti diagramu CCC-r . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.2.3 Konstrukce diagramu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.3 Diagram CCC-CUSUM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.3.1 Popis diagramu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.3.2 Vlastnosti diagramu CCC-CUSUM . . . . . . . . . . . . . . . . . . . . . . . . 10.3.3 Konstrukce diagramu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.4 Diagram CCC-EWMA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.4.1 Popis diagramu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.4.2 Vlastnosti diagramu CCC-EWMA . . . . . . . . . . . . . . . . . . . . . . . . . 10.4.3 Konstrukce diagramu CCC-EWMA . . . . . . . . . . . . . . . . . . . . . . . . 10.5 Diagram CCC-r EWMA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.6 Diagram CQC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Literatura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
195 196 196 199 201 202 203 205 205 206 206 208 209 210 210 212 213 214 216 219
11. Regulační diagramy pro vícerozměrná pozorování . . . . . . . . . . . . . . . . . . . . . . . 11.1 Odhad charakteristik vícerozměrného rozdělení . . . . . . . . . . . . . . . . . . . . . . 11.1.1 Výběr podskupin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.1.2 Individuální pozorování . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.2 Hotellingův diagram T2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.2.1 Popis diagramu pro podskupiny . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.2.2 Interpretace regulačního diagramu . . . . . . . . . . . . . . . . . . . . . . . . . 11.2.3 Popis diagramu pro individuální pozorování . . . . . . . . . . . . . . . . 11.3 Diagram pro monitorování variability . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.4 Vícerozměrné diagramy CUSUM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.4.1 Simultánní schéma CUSUM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.4.2 Vícerozměrný diagram CUSUM (MCUSUM) . . . . . . . . . . . . . . . . 11.5 Vícerozměrný diagram EWMA (MEWMA) . . . . . . . . . . . . . . . . . . . . . . . . . . 11.5.1 Popis diagramu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.5.2 Vlastnosti diagramu MEWMA . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.5.3 Volba parametrů . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Literatura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
222 223 223 224 224 225 227 230 234 236 236 238 239 239 240 240 243
12. Analýza způsobilosti a výkonnosti procesu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12.1 Přípustná a přirozená variabilita . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12.2 Podíl neshodných . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12.3 Ukazatele způsobilosti pro normální rozdělení . . . . . . . . . . . . . . . . . . . . . . . 12.3.1 Ukazatel způsobilosti Cp . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12.3.2 Ukazatele CpkU, CpkL . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12.3.3 Ukazatel Cpk . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
246 248 248 249 249 251 252
9
12.3.4 Odhad ukazatelů způsobilosti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12.3.5 Ukazatele obsahující cílovou hodnotu . . . . . . . . . . . . . . . . . . . . . . 12.4 Ukazatele způsobilosti pro jiná rozdělení . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12.4.1 Kvantilová metoda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12.4.2 Neparametrické metody . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12.4.3 Transformace . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12.4.4 Metoda založená na podílu neshodných . . . . . . . . . . . . . . . . . . . . . 12.5 Ukazatele výkonnosti procesu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12.5.1 Ukazatele pro normální rozdělení . . . . . . . . . . . . . . . . . . . . . . . . . . 12.5.2 Výkonnost procesů typu C . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12.6 Ukazatele způsobilosti pro krátké série . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12.6.1 Transformace původních pozorování . . . . . . . . . . . . . . . . . . . . . . . 12.6.2 Konstrukce konfidenčních mezí . . . . . . . . . . . . . . . . . . . . . . . . . . . 12.7 Způsobilost procesu s autokorelací . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12.7.1 Využití výběrové autokorelační funkce . . . . . . . . . . . . . . . . . . . . . . 12.7.2 Využití modelu časové řady . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12.8 Vícerozměrné ukazatele způsobilosti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12.8.1 Aritmetický průměr jednorozměrných ukazatelů . . . . . . . . . . . . . 12.8.2 Využití hlavních komponent . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12.9 Postup při analýze způsobilosti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12.9.1 Krátkodobá způsobilost, způsobilost stroje . . . . . . . . . . . . . . . . . . 12.9.2 Předběžná způsobilost . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12.9.3 Dlouhodobá způsobilost . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Literatura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
253 255 257 257 259 260 261 264 264 265 270 270 271 272 273 275 276 277 278 280 280 281 282 282
Summary . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 286 Rejstřík . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 287
O autorkách
O autorkách Doc. Ing. Eva Jarošová, CSc.
Eva Jarošová je absolventkou Fakulty elektrotechnické ČVUT, kde v oboru technická kybernetika získala též titul kandidáta věd. Původně pracovala ve Výzkumném ústavu pro stavbu strojů v Běchovicích v oddělení pro spolehlivost energetických zařízení, v letech 1991–2012 působila na Katedře statistiky a pravděpodobnosti na Fakultě informatiky a statistiky Vysoké školy ekonomické. V roce 2004 byla jmenována docentkou pro obor statistika. V současné době učí ve ŠKODA AUTO Vysoké škole. Je místopředsedkyní odborné skupiny pro sta tistické metody České společnosti pro jakost a členkou komise TNK 4 Úřadu pro technickou normalizaci, metrologii a státní zkušebnictví. Její zájmy se soustředí do oblasti statistických metod řízení jakosti, speciálně statistické regulace procesu a navrhování experimentů. Je autorkou dvou publikací věnovaných navrhování experimentů a spoluautorkou dvou knih o statistických metodách.
Prof. Ing. Darja Noskievičová, CSc.
Po absolvování doktorského studia v letech 1984–1985 pracovala jako programátorka odboru nákupu v n. p. NHKG Ostrava-Kunčice. Od roku 1993 působí na Katedře managementu kvality (dříve kontroly a řízení jakosti) na FMMI VŠB-TU Ostrava, kde vyučuje předměty zaměřené na aplikaci statistických metod v managementu kvality a na management procesů. Aktivně spolupracuje s podnikovou sférou, zejména ve formě výuky v rámci postgraduálních a specializačních kurzů. V letech 1994–2011 působila jako členka Akreditovaného certifikačního místa Domu techniky Ostrava. Dlouhodobě se aktivně zapojuje do práce ČSJ – v posledních letech zejména jako členka odborné skupiny pro statistické metody. Je členkou TNK 4 při Úřadu pro technickou normalizaci, metrologii a státní zkušebnictví Praha. Ve své pedagogické a vědeckovýzkumné práci se zaměřuje na aplikace statistických metod v oblasti řízení kvality, především na problematiku komplexního přístupu ke statistické regulaci procesu. Dále se zabývá problematikou moderních manažerských přístupů (Six Sigma, Lean, Agile). Je spoluautorkou pěti monografií.
11
12
Pokročilejší metody statistické regulace procesu
Úvod Cíl publikace Publikace realizuje záměr prezentovat současný stav poznání v oblasti aplikačně přínosných statistických metod řízení kvality, konkrétně v části týkající se statistické regulace procesu (statistical process control – SPC) a analýzy jeho způsobilosti, resp. výkonnosti. Monografie je zaměřena na postupy, které umožňují účinnou regulaci procesu v nových podmínkách výroby a nahrazují tak z různých důvodů nevyhovující klasické Shewhartovy diagramy. Ucelený přehled těchto metod v publikované odborné literatuře dosud chyběl. Cílem publikace je přiblížit různé metody SPC a navazující způsoby výpočtu ukazatelů hodnotících způsobilost nebo výkonnost procesu s důrazem na předpoklady jejich aplikace. Kromě výkladu vlastních metod jsou proto zahrnuty i metody ověřování těchto předpokladů a praktické aspekty SPC. Zařazené metody SPC představují klasický statistický přístup a jsou v praxi realizovatelné pomocí běžného statistického softwaru.
Stručně k tématu Statistická regulace procesu se v průmyslové praxi uplatňuje poměrně často. Regulační diagramy představují jednoduchý a účinný prostředek, jak porozumět sledovanému procesu. Od roku 1924, kdy W. Shewhart z americké firmy Bell Telephone Laboratories sestrojil první regulační diagram a ukázal, že sledováním chování procesu prostřednictvím malých vzorků odebíraných v průběhu výroby lze předejít vzniku problémů s kvalitou, se však v průmyslové výrobě mnohé změnilo a stále častěji se setkáváme s případy, kdy aplikace klasických Shewhartových diagramů účinná není. Jedním z důvodů je automatizované měření a následné vyhodnocování individuálních hodnot, při němž se může více projevit vliv odchýlení od předpokladů, z nichž Shewhartův diagram vychází. V podmínkách agilní výroby, pro kterou je typické velké množství různých produktů vyráběných v malých výrobních sériích, brání aplikaci klasického postupu nedostatečný počet měření. Problémy nastávají také u procesů s vysokou hodnotou ukazatele způsobilosti. Překročení regulačních mezí Shewhartova diagramu není v těchto případech možno automaticky považovat za signál k hledání zvláštní příčiny, protože další odstraňování příčin se po dosažení daného stupně kvality jeví jako neekonomické. Právě v souvislosti se zvyšující se způsobilostí procesů se mění chápání statisticky zvládnutého procesu nebo tzv. procesu pod kontrolou. Za vyhovující se považuje nejen proces, jehož charakteristiky polohy a variability jsou v čase konstantní, ale připouští se i určité kolísání těchto charakteristik v průběhu času. U vysoce způsobilých procesů se sledovaným atributivním znakem se z důvodu řídkého výskytu neshodných jednotek nebo neshod přechází na sledování jiného znaku, než je počet nebo podíl neshodných jednotek či počet neshod.
Úvod
Po Shewhartových diagramech a v padesátých letech navržených diagramech CUSUM a EWMA vznikla řada dalších diagramů, např. diagramy založené na modelování okamžiku změny. Kromě metod využívajících klasický statistický přístup existují metody založené na bayesovském přístupu nebo na fuzzy přístupu. V posledních letech se stalo běžným hodnocení způsobilosti či výkonnosti procesu prostřednictvím různých ukazatelů. Protože hodnocení způsobilosti souvisí se statistickou regulací procesu, objevila se i v této oblasti řada nových způsobů výpočtu ukazatelů způsobilosti, resp. výkonnosti. Na českém knižním trhu dosud chyběla publikace, která by poskytla rozsáhlejší přehled nejrůznějších regulačních diagramů. Cílem autorek bylo napsat knihu, která by posloužila nejen pracovníkům z oblasti řízení kvality a seznámila je s různými modifikacemi či alternativami klasických regulačních diagramů a jejich aplikací, ale která by současně umožnila odborné veřejnosti detailnější pohled na danou problematiku. Pozornost je věnována především alternativám Shewhartových diagramů; předpokládá se, že čtenář je s různými typy Shewhartových diagramů již seznámen. Byly sem zařazeny metody, které jsou v praxi skutečně použitelné a které jsou buď již implementovány ve známých statistických softwarových produktech, nebo jsou realizovatelné pomocí dostupného statistického softwaru. Aby nebyla narušena plynulost výkladu, jsou matematická odvození v knize omezena na minimum, v některých případech jsou dokonce uvedena jen v příloze na webu. Ze stejného důvodu jsou odkazy na další související práce často umístěny ve formě poznámek na konci oddílů či kapitol. S ohledem na použití v praxi jsou v knize nejen popisovány metody konstrukce jednotlivých diagramů, ale pozornost je věnována i často opomíjeným praktickým problémům implementace SPC, protože správný způsob získání dat podmiňuje úspěšnou aplikaci regulačních diagramů. Pro pracovníky z praxe nebo i pro vysokoškolské studenty může být užitečné zařazení metod ověřování různých předpokladů, jež jsou pro účinnou aplikaci nezbytné. Detailní popis těchto metod přesahuje rámec knihy, navíc se ve většině případů předpokládá využití statistického softwaru. Podstatná je především aplikace uvedených metod a interpretace výsledků; ta je zde ilustrována na mnoha příkladech. Zařazením kapitol o ověřování předpokladů a o praktických aspektech SPC se kniha liší od známých zahraničních publikací.
Struktura publikace První tři kapitoly představují obecný základ SPC. V kapitole 1 je vysvětlena podstata statistické regulace procesu a jsou popsány základní charakteristiky klasického regulačního diagramu, jako je riziko falešného a chybějícího signálu nebo průměrný počet přeběhů do výskytu signálu. Kapitola 2 uvádí metody ověřování předpokladů při navrhování regulačních diagramů a také přehled procesů z hlediska jejich chování v průběhu času. Kapitola 3 je věnována praktickým aspektům, jako jsou způsob vytváření logických podskupin a volba rozsahu a frekvence výběrů. Byl sem rovněž zařazen přehled regulačních diagramů, které jsou popisovány v následujících kapitolách, a pro úplnost také rozhodovací strom pro volbu vhodného Shewhartova diagramu, i když těmto diagramům se v knize přímo nevěnujeme. Další čtyři kapitoly obsahují postupy vhodné v případě nesplnění některého z předpokladů: konstrukci asymetrických regulačních mezí při porušení předpokladu normality
13
14
Pokročilejší metody statistické regulace procesu
(kapitola 4), diagram s rozšířenými mezemi, modifikovaný, přejímací a regresní regulační diagram pro procesy s proměnlivou střední hodnotou (kapitola 5), diagramy pro krátké výrobní cykly, kdy v jednotlivých cyklech není k dispozici dostatečný počet dat (kapitola 6) a diagramy pro procesy s autokorelací (kapitola 7). Regulační diagramy CUSUM (kapitola 8) a diagramy EWMA (kapitola 9) představují odlišné přístupy využívající informaci ze všech dosud uskutečněných pozorování, a jsou proto citlivější na menší posuny procesu. Kromě popisu konstrukce diagramu pro regulaci střední hodnoty a některých jeho modifikací jsou uvedeny i diagramy pro kontrolu inherentní variability a diagramy pro atributivní znaky. Kapitola 10 se zabývá různými diagramy vhodnými pro regulaci procesů s vysokou způsobilostí, tedy procesů, v nichž se neshodné jednotky nebo neshody objevují velmi řídce. Patří sem diagramy Shewhartova typu i diagramy CUSUM nebo EWMA, avšak regulovanou veličinou je vzdálenost mezi sledovanými jevy, vyjádřená buď počtem jednotek zkontrolovaných do výskytu neshodné jednotky, nebo například dobou či množstvím materiálu zkontrolovaného do výskytu neshody. Kapitola 11 je věnována regulačním diagramům pro vícerozměrná data a podobně jako předcházející kapitola obsahuje jak diagram Shewhartova typu, nazývaný podle zobrazované statistiky Hotellingův diagram, tak vícerozměrné diagramy CUSUM a EWMA. Se statistickou regulací procesu je spjata analýza způsobilosti (výkonnosti) procesu. V kapitole 12 jsou shrnuty nejpoužívanější ukazatele způsobilosti a způsoby jejich odhadu pro statisticky zvládnuté procesy, způsoby odhadu ukazatelů výkonnosti i různé modifikace přicházející v úvahu při porušení obvyklých předpokladů. Řada příkladů v knize vychází z reálných výrobních procesů. Při jejich řešení byl ve většině případů využit statistický software Minitab, někdy také Statgraphics. Data k příkladům a vzorce či tabulky doplňující některé oddíly jsou dostupné na webových stránkách: http://www.grada.cz/pokrocilejsi-metody-statisticke-regulace-procesu_8465/kniha/ katalog/?dopln=stahuj
Metodika Obsahem knihy jsou metody statistické indukce používané ve statistické regulaci procesu (SPC) a v související analýze způsobilosti procesu. Klasický přístup k SPC jako k pravidelně se opakujícímu výběrovému zjišťování spočívá v rozhodování, zda každý nový výběr odpovídá stejnému pravděpodobnostnímu modelu se známými nebo odhadnutými parametry. Zamítnutí testované hypotézy se považuje za důkaz změny v procesu. Hlavní nástroj SPC – regulační diagram – je grafickým znázorněním testu hypotézy o neznámém parametru uvažovaného modelu pravděpodobnostního rozdělení regulované veličiny. Grafické vyjádření je v SPC žádoucí pro svou názornost a srozumitelnost. V knize se kromě metod vycházejících z předpokladu normálního rozdělení pracuje i s dalšími známými modely, např. s Weibullovým rozdělením, využívají se též Pearsonovy nebo Burrovy křivky a Boxova-Coxova či Johnsonova transformace, z diskrétních rozdělení Poissonovo, binomické, geometrické a negativně binomické rozdělení. Kromě rozhodování na základě jediného výběru se aplikuje také postup známý z analýzy časových řad jako exponenciální vyrovnávání, v SPC nazývaný diagram EWMA. Odlišný
Úvod
přístup k identifikaci posunu procesu představuje diagram CUSUM, vycházející z Waldova sekvenčního testu a založený na testu věrohodnostním poměrem. V knize jsou prezentovány i další metody, které odrážejí změnu v chápání vyhovujícího procesu v souvislosti se zvyšující se způsobilostí procesů. Jde především o uvolnění předpokladu konstantní střední hodnoty regulované veličiny a předpokladu vzájemné nezávislosti pozorování. Kniha obsahuje různé modifikace klasického Shewhartova diagramu, v některých návrzích se využívá i model ANOVA s náhodnými efekty nebo regresní model. Diagramy pro autokorelovaná data vycházejí z modelů ARIMA, používaných v časových řadách. Pro úplnost byly zařazeny také diagramy pro vícerozměrná pozorování, v nichž se využívá především Hotellingova statistika. Kromě metod konstrukce regulačních diagramů jsou do knihy zahrnuty též různé testy sloužící k ověření předpokladů používaných metod. Jde o testy normality, náhodnosti, autokorelace, o analýzu rozptylu (ANOVA), testy heteroskedasticity a testy odlehlých pozorování. Při konstrukci regulačních mezí a při výpočtu ukazatelů způsobilosti či výkonnosti procesu se využívají různé metody odhadu, tedy opět metody statistické indukce, včetně konstrukce konfidenčních intervalů. U některých metod odhadu vícerozměrných ukazatelů se uplatňuje také hřebenová regrese a analýza hlavních komponent. Po třech úvodních kapitolách zabývajících se terminologií, ověřováním předpokladů metod, způsobem realizace SPC a zásadami, jimiž se řídí volba vhodného regulačního diagramu, následují čtyři kapitoly, které jsou věnovány metodám při nesplněném předpokladu normality, proměnlivé střední hodnotě, nedostatečném rozsahu výběru a autokorelovaných datech. Další tři kapitoly obsahují diagramy, které jsou po dosažení určité úrovně způsobilosti procesu vhodnější než Shewhartův diagram. Předposlední kapitola je věnována vícerozměrným diagramům a poslední kapitola ukazuje výpočet ukazatelů způsobilosti nebo výkonnosti v případě různých typů procesů uvažovaných v předcházejících kapitolách. Prezentované metody jsou ilustrovány na příkladech. Pro úsporu místa a pro přehlednost jsou v knize uvedeny jen grafické výstupy a nejdůležitější výsledky spolu s komentářem. Datové soubory a některé výpočty jsou uloženy v příloze na webu, takže čtenář má možnost si postupy a výsledky ověřit. K řešení byl ve většině případů využit statistický software Minitab nebo Statgraphics. Pro zajištění plynulosti výkladu jsou matematická odvození omezena na minimum a čtenář je odkázán na další zdroje, případně na doplňující vzorce v příloze na webu. Různé podrobnější komentáře a odkazy na další modifikace metod jsou ze stejného důvodu umístěny formou poznámek na konci příslušných oddílů. Na konci každé kapitoly se nachází rozsáhlý, abecedně řazený seznam literatury včetně norem, na něž se v textu odkazuje. Kniha vznikla s přispěním interní grantové agentury ŠKODA AUTO Vysoké školy, o. p. s., v rámci projektu číslo IGA 2012/9 Pokročilé metody statistické kontroly procesu.
15
16
Pokročilejší metody statistické regulace procesu
1. Podstata statistické regulace procesu Principy statistické regulace procesu (dále SPC) zformuloval ve dvacátých letech minulého století W. A. Shewhart (Shewhart, 1931), který také poprvé prakticky aplikoval diagramy známé jako klasické Shewhartovy regulační diagramy. Podstatou SPC je bezprostřední, pravidelná a průběžná výběrová kontrola kvality procesů založená na matematicko-statistickém hodnocení kvality. Dává podněty k operativním zásahům do procesu a umožňuje tak okamžitě zlepšit proces, a dokonce předejít nevyhovující kvalitě. Cíli SPC jsou: ■■ ■■ ■■ ■■ ■■ ■■ ■■ ■■ ■■ ■■
předcházení jak přeregulování procesu, tak jeho nedostatečné regulaci; dosažení stavu, kdy je proces statisticky stabilní (zvládnutý); udržování procesu na požadované a stabilní úrovni (tj. ve statisticky zvládnutém stavu); předcházení neshodným produktům; diferencování mezi náhodnými a zvláštními příčinami variability procesu; co nejrychlejší zásah do procesu v případě působení zvláštních příčin; vytvoření podmínek pro hodnocení způsobilosti procesu; vytvoření podmínek pro další zlepšování procesu; dokumentování řízení procesu pro zákazníka; vytvoření podmínek pro omezení klasického způsobu kontroly (např. vstupní kontroly u odběratele).
Teorie SPC vychází z existence variability jako imanentní vlastnosti každého procesu, která způsobuje nedostatek jeho opakovatelnosti. I za relativně stálých podmínek působí na proces a jeho výstupy objektivně řada vlivů, které způsobují, že nelze vyprodukovat dva zcela totožné produkty. Je však potřebné tyto vlivy studovat a vytvářet podmínky pro snižování variability procesu a jeho zlepšování. Snížení variability procesu pak znamená stejnoměrnější výrobu, menší pravděpodobnost výskytu neshodných produktů, menší rozsah kontroly a nižší náklady na kontrolu a zkoušení, nižší náklady vyvolané poruchami procesu, produkováním odpadu a jednotek vyžadujících přepracování a konečně také více spokojených zákazníků. Omezí-li se variabilita vstupů do procesu a sníží-li se variabilita průběhu vlastního procesu, povede to k omezení variability vlastností produktů jako výstupů z procesu. Princip SPC vychází z členění variability na dva druhy: na variabilitu vyvolanou náhodnými (přirozenými) příčinami a variabilitu vyvolanou příčinami zvláštními (neobvyklými, identifikovatelnými, vymezitelnými):
Podstata statistické regulace procesu
1. Náhodné příčiny vytvářejí široký komplex jednotlivě neidentifikovatelných příčin, z nichž každá sama o sobě přispívá k celkové variabilitě malou měrou. Vyvolávají-li variabilitu procesu pouze tyto příčiny, lze ho charakterizovat následovně: ■■ proces je opakovatelný a kvalita jeho výstupů je předvídatelná; ■■ proces je ve statisticky zvládnutém (stabilním) stavu. Znamená to, že typ a parametry rozdělení pravděpodobnosti znaku kvality či parametru procesu, s jehož pomocí hodnotíme variabilitu procesu, jsou známy a nemění se (obrázek 1.1a). Jako příklady náhodných příčin můžeme uvést chvění stroje, vlhkost ovzduší, nestejnorodost materiálu, kolísání teploty chladicí kapaliny, nestejnoměrnost otáčení obrobku. Odstranění vlivu těchto příčin vyžaduje systémové opatření, které je většinou v kompetenci managementu a bývá časově i finančně náročné (změna technologie, nákup nového stroje apod.). 2. Zvláštní příčiny představují vliv zdrojů variability, které za běžných podmínek na proces nepůsobí. Vyvolávají reálné změny procesu projevující se v nepřirozeném kolísání údajů, s jejichž pomocí variabilitu procesu hodnotíme. Působí-li na proces také tyto příčiny, lze jej popsat takto: ■■ proces není reprodukovatelný a kvalita jeho výstupů není předvídatelná; ■■ proces není statisticky zvládnutý (stabilní). To znamená, že typ a parametry rozdělení znaku kvality či parametru procesu, s jehož pomocí hodnotíme variabilitu procesu, se v čase mění (obrázek 1.1b). Odstranění vlivu těchto příčin vyžaduje obvykle pouze lokální zásah osoby přímo zodpovědné za provádění činnosti v rámci daného procesu.
Obr. 1.1 Náhodné a zvláštní příčiny variability
17
18
* metody statistické regulace procesu Pokročilejší
Zvláštní příčiny variability procesu se dále člení na příčiny sporadické a příčiny přetrvávající. Příčiny sporadické vznikají náhle, vyvolávají změny procesu trvající krátkou dobu. Pak se ztrácejí a opět se mohou vyskytnout v budoucnu. Změny procesu vyvolané těmito příčinami bývají větší. Přetrvávající příčiny vyvolávají určitou dobu trvající odchylky v parametrech rozdělení regulované veličiny (znaku kvality či technologického parametru), s jejíž pomocí sledujeme a hodnotíme chování procesu. Jako příklady zvláštních příčin můžeme uvést: poškození nástroje, změnu seřízení stroje či nástroje, změnu materiálu, nezaškolenou obsluhu stroje apod. Chceme-li realizovat neustálé zlepšování procesu, pak je nutné permanentně monitorovat chování procesu s cílem dosáhnout a udržovat statisticky zvládnutý stav cestou zjišťování a odstraňování či alespoň částečné eliminace působení zvláštních příčin. Chování procesu a kvalita jeho výstupů jsou pak předvídatelné a je možné objektivně hodnotit schopnost plnit očekávání zákazníka a dále snižovat přirozenou variabilitu procesu vyvolávanou působením náhodných příčin.
1.1 Základní charakteristika klasického regulačního diagramu Hlavním nástrojem SPC je regulační diagram. Jeho princip a struktura budou vysvětleny v tomto oddílu na regulačním diagramu Shewhartova typu (blíže viz kapitola 3), u kterého se předpokládá nezávislost měřených veličin, jejich normální rozdělení s parametry μ a σ. Kromě toho se předpokládá, že zvláštní (vymezitelná) příčina nastává v jediném okamžiku a okamžitě vyvolává posun sledované charakteristiky. Případům, kdy jsou tyto předpoklady porušeny, jsou věnovány další kapitoly. Základní struktura regulačního diagramu je patrná z obrázku 1.2. Regulační diagram je grafický prostředek zobrazení vývoje variability procesu v čase, využívající principů testování statistických hypotéz. Představuje zobrazení zvolené testové statistiky jako funkce času. Na ose x se vynášejí pořadová čísla časových okamžiků realizace jednotlivých výběrů (prakticky jsou tato čísla chápána jako označení pořadí výběrů), které mají charakter logické podskupiny. Logická podskupina je výběr jednotek produktu provedený tak, že uvnitř tohoto výběru má šanci se projevit pouze variabilita vyvolaná náhodnými příčinami. Rozdíly mezi jednotlivými prvky tohoto výběru pak představují míru inherentní variability procesu. Jinými slovy, začne-li působit na proces nějaká zvláštní příčina, je šance na projev jejího vlivu uvnitř podskupiny minimální, a naopak, mezi podskupinami je maximální. Způsob tvorby výběrů určuje vlastnosti regulačního diagramu, neboť ovlivňuje odhad inherentní variability procesu, který je základem pro stanovení regulačních mezí – kritérií pro posuzování, zda proces je, či není statisticky zvládnutý. Nerespektování konceptu logické podskupiny může vést k významnému nadhodnocení nebo podhodnocení této inherentní variability; regulační meze pak mohou být příliš široké nebo příliš úzké a regulační diagram nemůže plnit svůj účel. Na ose y je pak stupnice pro hodnoty zvolené testové statistiky (výběrového průměru, výběrové směrodatné odchylky, počtu neshod v podskupině…). Hlavní funkcí efektivního využití regulačních diagramů je poskytnout statistický signál, když začne působit zvláštní příčina, a vyhnout se falešnému signálu, když k žádné významné změně v procesu nedošlo.
Podstata statistické regulace procesu
Obr. 1.2 Základní struktura regulačního diagramu Rozhodnutí o tom, zda proces je nebo není statisticky zvládnutý, umožňují tři základní kritéria: centrální přímka CL, dolní regulační mez LCL a horní regulační mez UCL. CL odpovídá tzv. referenční (požadované) hodnotě použité znázorňované charakteristiky. Referenční hodnota může být definována několika způsoby: a) jako odhad z hodnot regulované veličiny získaných v podmínkách statisticky zvládnutého procesu (tento způsob se používá ve druhé etapě SPC – viz oddíl 3.1 –, kdy většinou parametry rozdělení sledované veličiny nejsou známy); b) jako nominální hodnota (např. jmenovitá hodnota nebo hodnota daná technickým předpisem); tento způsob je vhodný v případě, kdy proces lze jednoduše seřídit na tuto hodnotu; c) jako hodnota založená na minulé zkušenosti s daným výrobním procesem (tento způsob je vhodný ve čtvrté etapě SPC (viz oddíl 3.1). Regulační meze UCL a LCL se nazývají také akční meze. Vymezují pásmo působení pouze náhodných příčin variability a jsou základním rozhodovacím kritériem, zda učinit zásah do procesu, či nikoliv. Regulační meze jsou stanoveny statisticky, nelze je zaměňovat s tolerančními mezemi. V klasických Shewhartových regulačních diagramech jsou tyto meze většinou stanoveny ve vzdálenosti 3sigma (směrodatná odchylka) dané výběrové charakteristiky na obě strany od centrální přímky (dále v textu budou takové meze obecně označovány jako 3sigma meze). Ve druhé etapě SPC (viz oddíl 3.1), kdy většinou parametry rozdělení sledované veličiny nejsou známy, se tato směrodatná odchylka odhaduje z variability uvnitř podskupin (viz vzorce v příloze na webu). Ve čtvrté etapě
19
20
Pokročilejší metody statistické regulace procesu
SPC (viz oddíl 3.1) již lze považovat směrodatnou odchylku za známou, a není ji proto většinou nutné odhadovat z minulých naměřených hodnot. V některých aplikacích se zakreslují do regulačního diagramu další meze nazývané výstražné: UWL – horní výstražná mez a LWL – dolní výstražná mez. Pásmo, které vymezují tyto meze, je vždy užší než pásmo mezi akčními mezemi, nejčastěji ±2sigma dané výběrové charakteristiky od CL.
1.2 Riziko falešného a chybějícího signálu Statistickou regulaci procesu lze chápat jako opakované (sekvenční) testování statistické hypotézy. Toto pojetí SPC umožňuje posoudit, resp. porovnat účinnost regulačních diagramů. Pro regulovanou veličinu, tj. sledovaný znak kvality nebo technologický parametr jako náhodnou veličinu, se zformuluje hypotéza o hodnotách parametrů jejího pravděpodobnostního rozdělení. Tato nulová hypotéza by měla být sestavena tak, aby při její platnosti proces splňoval požadavky na kvalitu, tj. aby byl hodnocen jako proces ve statis ticky zvládnutém stavu. Nulová hypotéza se pak opakovaně testuje na základě pravidelně opakovaných výběrů. Zamítnutí nulové hypotézy (body vně regulačních mezí, trendy či jiná nenáhodná seskupení) je signálem o tom, že proces vybočil z předpokládaného vyhovujícího stavu (tj. není ve statisticky zvládnutém stavu) a je nutný regulační zásah do procesu. Regulačním zásahem rozumíme proces identifikace a částečné či úplné eliminace působení zvláštní příčiny, která vyvolala signalizovanou nežádoucí změnu chování procesu. SPC je spojeno se dvěma druhy rizik: rizikem chyby prvního druhu α, nazývaným rizikem falešného signálu (někdy označovaným také jako riziko zbytečného signálu), což je pravděpodobnost zbytečného vyhledávání zvláštní příčiny na základě signálu z regulačního diagramu o tom, že proces není ve statisticky zvládnutém stavu (např. bod mimo akční meze), i když ve skutečnosti k žádné významné změně procesu nedošlo. S tímto nesprávným závěrem jsou spojeny náklady na pokus najít příčinu neexistujícího problému. Pravděpodobnost chyby druhého druhu β se v SPC nazývá riziko chybějícího signálu a je to pravděpodobnost, že regulační diagram neodhalí změnu procesu určité velikosti včas (všechny body dané testové statistiky leží uvnitř akčních mezí ani netvoří žádné nenáhodné seskupení). S tímto nesprávným závěrem jsou zase spojeny náklady vyvolané tím, že se do procesu včas nezasáhlo. Hodnota (1 – β), tj. hodnota silofunkce testu, zde vyjadřuje pravděpodobnost detekce změny procesu, která má být včas odhalena. Na obrázku 1.3 jsou zachycena rizika α a β ve vazbě na regulační diagram pro výběrové průměry. Při aplikaci tohoto diagramu se vlastně testuje nulová hypotéza H0: μ = μ0 oproti alternativní hypotéze H1: μ ≠ μ0, kde μ0 je cílová (požadovaná) úroveň střední hodnoty procesu odpovídající statisticky zvládnutému procesu. V grafu 1.3a je zobrazeno riziko falešného signálu a, tj. pravděpodobnost, s jakou regulační diagram vydá signál o změně střední hodnoty procesu, i když ve skutečnosti proces zůstává centrován na μ0. V grafu 1.3b a 1.3c jsou zobrazeny situace pro posun střední hodnoty procesu z μ0 na μ = μ0 +δσ, resp. z μ0 na μ = μ0 – δσ. Na tento posun je vázána hodnota rizika chybějícího signálu β.
Podstata statistické regulace procesu
Obr. 1.3 Riziko falešného signálu α a riziko chybějícího signálu β Velikost změny střední hodnoty procesu lze vyjádřit také ve tvaru normované diference
(1.1)
V dalších odstavcích bude ukázán postup stanovení rizika α a β pro klasický Shewhartův regulační diagram pro výběrové průměry.
1.2.1 Výpočet rizika α pro regulační diagram Shewhartova typu pro průměry Obecně riziko stanovujeme tak, abychom s co nejmenší četností zamítali hypotézu H0 (tj. aby regulační diagram co nejméně signalizoval, že proces není v ustáleném a požadovaném stavu, i když ve skutečnosti v něm je). Za předpokladu normálního rozdělení výběrové charakteristiky, se kterou daný regulační diagram pracuje, lze riziko falešného signálu určit dle vzorce
(1.2)
Pro klasický Shewhartův regulační diagram s 3sigma mezemi (L = 3) je α = 1 – 0,9973 = = 0,0027. Chceme-li zvýšit citlivost klasického regulačního diagramu na odchylky parametru procesu, je možné toho dosáhnout zúžením pásma mezi regulačními mezemi, a to zmenšením hodnoty L, například na hodnotu 2. Pak α = 1 – 0,9545 = 0,0455. To zname-
21
22
Pokročilejší metody statistické regulace procesu
ná, že snížení rizika chybějícího signálu β je dosaženo za cenu výrazného zvýšení rizika falešného signálu. Pokud však hodnotu L ponecháme rovnu 3 a pásmo mezi regulačními mezemi zúžíme tím, že zvýšíme rozsah logické podskupiny n, pak dosáhneme zvýšení citlivosti regulačního diagramu, aniž hodnotu rizika falešného signálu změníme.
1.2.2 Výpočet rizika β pro regulační diagram pro průměry Riziko β závisí na velikosti rozdílu mezi skutečností a testovanou hypotézou H0. Při výpočtu rizika β je tedy nutné vyjít ze znalosti velikosti posunu průměrné úrovně z μ0 na μ = μ0 + δσ, resp. z μ0 na μ = μ0 – δσ. Jak velkou odchylku od μ0 chceme signalizovat v regulačním diagramu, závisí na tom, jak blízko jsou přirozené meze procesu tolerančním mezím a jaké jsou náklady na vícepráci či odpad. Tyto úvahy mají hlavní význam ve čtvrté etapě SPC (viz oddíl 3.1), kdy jsou velké změny parametrů procesu již eliminovány a je třeba identifikovat změny střední a malé velikosti. Nechť směrodatná odchylka procesu σ je známá a konstantní. Jestliže se střední hodnota procesu posune z hodnoty odpovídající statisticky zvládnutému procesu μ0 na úroveň μ = μ0 +δσ (viz obrázek 1.3), pak pravděpodobnost, že tento posun nebude odhalen při následujícím výběru, tj. riziko chybějícího signálu β, lze vyjádřit jako
(1.3)
a (viz obrázek 1.3), kde L Protože x ~N(μ, σ2 / n), vyjadřuje násobek směrodatné odchylky výběrových průměrů a charakterizuje vzdálenost regulačních mezí od centrální přímky CL, lze β stanovit jako
μ Lσ / n ( μ0 δσ ) μ Lσ / n ( μ0 δσ ) β Φ 0 (1.4) Φ 0 / / σ n σ n
kde Φ značí distribuční funkci normovaného normálního rozdělení. Po úpravě dostaneme
(1.5)
Je-li n > 1, vztahuje se výpočet rizika β na regulační diagram pro průměry. Pokud dosadíme n = 1, pak počítáme riziko β pro regulační diagram pro individuální hodnoty. Riziko β pro posun z μ0 na μ = μ0 – δσ se počítá zcela analogicky.
I Příklad 1.1 Mějme běžný Shewhartův regulační diagram pro průměr s obvyklými 3sigma mezemi a rozsah výběru n = 5 jednotek. Máme určit pravděpodobnost odhalení posunu střední hodnoty procesu z μ0 na μ = μ0+ 1,5σ při prvním výběru odebraném po tom, co změna dané velikosti nastala. Dosadíme do vztahu pro výpočet rizika chybějícího signálu (1.5)
Podstata statistické regulace procesu
1 – β = 1 – 0,36 = 0,64 Pravděpodobnost odhalení posunu střední hodnoty procesu o velikosti 1,5σ při prvním výběru je 0,64.
1.3 Aplikace regulačního diagramu Regulační diagram se nejčastěji aplikuje v následujících krocích: ■■ V pravidelných kontrolních intervalech se ze sledovaného procesu realizují výběry velikosti n, které mají charakter logické podskupiny. ■■ Z každé n-tice zjištěných hodnot ve výběru se vypočte hodnota zvolené testové charakteristiky (výběrový průměr, výběrová směrodatná odchylka, výběrový medián, výběrové rozpětí, počet neshodných jednotek v podskupině, počet neshod na jednotku v podskupině apod.). Pro n = 1 představují hodnoty testové statistiky jednotlivé naměřené hodnoty sledovaného znaku kvality. ■■ Tyto hodnoty testové statistiky se chronologicky zakreslují do regulačního diagramu. ■■ Zda je proces statisticky zvládnutý, je pak posuzováno dle polohy bodů v regulačním diagramu vůči UCL, LCL, CL. Pokud leží body uvnitř regulačních mezí a jsou rozloženy náhodně, lze považovat proces za statisticky zvládnutý. Pokud se nějaký bod či více bodů vyskytuje mimo regulační meze nebo body uvnitř mezí vytvářejí nenáhodná seskupení, nelze proces považovat za statisticky zvládnutý. Potom je nutné vyhledat zvláštní (neobvyklou) příčinu a její působení omezit či plně odstranit. Nenáhodná seskupení představují dodatečná kritéria pro posouzení, zda je či není proces statisticky zvládnutý, navržená s cílem snížit riziko chybějícího signálu β. Definice nenáhodných seskupení a s nimi spojených testů se poprvé objevila ve Statistical Quality Control Handbook (1956) společnosti Western Electric. Tato pravidla byla různými autory modifikována a vznikla řada dalších souborů pravidel (viz Nelson, 1984; Trietsch, 1999; ČSN ISO 2859, 1994; D1-9000-1, 2000; AIAG SPC-3, 2005). Detailnější srovnání různých souborů nenáhodných seskupení lze najít u Noskievičové (2013). Identifikace nenáhodných seskupení v současné době již není problémem, neboť většina statistických softwarových balíků obsahujících metody SPC je schopna standardní typy nenáhodných seskupení identifikovat. Některé programy (např. Statgraphics, Statistica, Minitab) umožňují navíc standardní testy nenáhodných seskupení z hlediska délky seskupení modifikovat. Problémem často bývá stanovení příčin identifikovaných nenáhodných seskupení, které vyžaduje vysokou míru zkušeností a hluboké znalosti analyzovaného procesu. Přehled základních testů působení zvláštních příčin pro Shewhartovy regulační diagramy pro výběrové průměry a rozpětí včetně možných zvláštních příčin je uveden v příloze na webu. Aplikace diskutovaných doplňkových kritérií vede ke zvýšení citlivosti regulačních diagramů, což znamená, že jejich použití umožňuje odhalit menší změny procesu mnohem rychleji než při použití jen základního kritéria (tj. při identifikaci bodů mimo regulační meze). Simultánní aplikaci těchto doplňkových kritérií je však třeba věnovat vážnou po-
23
24
Pokročilejší metody statistické regulace procesu
zornost, neboť čím více testů je aplikováno najednou, tím vyšší je riziko falešného signálu (Trietsch, 1999). Někteří autoři (Montgomery, 2013) však doporučují, aby doplňková kritéria nebyla k dosažení vyšší citlivosti regulačních diagramů na malé změny procesu používána, a doporučují dát přednost metodě CUSUM (podrobně viz kapitola 8) nebo regulačnímu diagramu EWMA (kapitola 9). Kromě testů nenáhodných seskupení se mohou jako další kritéria pro posouzení, zda je proces statisticky zvládnutý, použít výstražné meze UWL a LWL s tímto postupem: 1. Pokud některý bod leží uvnitř výstražných mezí, lze předpokládat, že proces je ve statisticky zvládnutém stavu a není třeba žádného zásahu. 2. Některý bod leží mezi UWL a UCL, resp. mezi LWL a LCL. V této situaci se doporučuje postupovat následovně: ihned bez ohledu na kontrolní interval se provede další výběr. Jestliže nový bod, odpovídající tomuto bezprostřednímu výběru, leží mezi výstražnými mezemi, není třeba do procesu zasahovat. Jestliže však i tento nový bod leží mimo výstražné meze, je to signál, že na proces s velkou pravděpodobností působí zvláštní příčina a je nutné provést regulační zásah.
1.4 Hodnocení účinnosti regulačního diagramu Účinností regulačního diagramu je myšlena jeho schopnost odhalit změnu parametru procesu určité velikosti. Pro posouzení, popřípadě srovnání této účinnosti se využívá ukazatel ARL (average run length), křivka ARL nebo operativní charakteristika. Tyto úvahy mají hlavní smysl ve čtvrté etapě SPC (viz oddíl 3.1), kdy již byly zvláštní příčiny vyvolávající velké změny parametru procesu odstraněny a zájem je soustředěn na střední a malé změny.
1.4.1 ARL pro klasické Shewhartovy regulační diagramy ARL (průměrná délka přeběhu) představuje průměrný počet výběrů vedoucí k signálu. ARL je střední hodnota rozdělení náhodné proměnné RL (délky přeběhu), což je počet výběrů vedoucí k signálu. Jsou-li data vzájemně nezávislá a parametry rozdělení sledované veličiny jsou známy, pak ARL pro Shewhartovy regulační diagramy lze obecně vyjádřit jako
ARL = 1 / p (1.6)
kde p je pravděpodobnost, s jakou bude vydán signál o tom, že proces není statisticky zvládnutý. Proměnná RL má geometrické rozdělení s parametrem p a se střední hodnotou 1 / p. To vyvolává určité problémy, neboť směrodatná odchylka RL je dost velká a geometrické rozdělení je silně zprava zešikmené, takže střední hodnota ARL nepředstavuje právě typickou hodnotu RL. Někteří autoři proto pracují s percentily rozdělení RL namísto ARL. Je-li proces statisticky zvládnutý, pak ARL se značí ARL(0). Mezi ARL(0) a rizikem falešného signálu α platí vztah
ARL(0) = 1 / α
protože k falešnému signálu dojde v průměru po 1 / α výběrech.
(1.7)
Podstata statistické regulace procesu
Průměrný počet výběrů mezi okamžikem vzniku odchylky v procesu o normované velikosti δ a okamžikem jejího odhalení v regulačním diagramu se značí ARL(δ). Mezi ARL(δ) a rizikem chybějícího signálu β je vztah ARL(δ) = 1 / (1 − β) (1.8) neboť k signálu, že došlo k odchylce o normované velikosti δ, dojde v průměru po 1 / (1 − β) výběrech od okamžiku vzniku této odchylky. Obecně je při navrhování regulačního diagramu snaha požadovat ARL(0) co největší, aby ztráty spojené se zbytečným vyhledáváním příčin neexistujících odchylek nebo se zbytečným seřizováním procesu byly minimální. Při stanovení žádoucí hodnoty ARL(0) je třeba zohlednit také směnnost a frekvenci měření (blíže viz kapitola 8). Naopak ARL(δ) se požaduje co nejmenší, aby se minimalizovaly ztráty spojené s pozdním odhalením dané odchylky. Pokud se ukazatel ARL vyjádří v časových jednotkách, dostaneme ukazatel ATS, vyjadřující průměrnou dobu do signálu. ATS se určí dle vztahu
ATS = ARL · h
(1.9)
kde h je délka kontrolního intervalu. Vezmeme-li v potaz velikost výběru n, dostaneme ukazatel I, představující průměrný počet jednotek kontrolovaného produktu, které musí být vybrány ke kontrole, než je signalizována změna parametru procesu
I = n · ARL (1.10)
kde n je rozsah výběru. Uvedený jednoduchý způsob stanovení ARL je použitelný pouze pro Shewhartovy regulační diagramy. Například pro diagramy CUSUM a EWMA je výpočet ARL mnohem složitější (viz kapitoly 8 a 9). Ukazatel ARL je vhodný pro situace, kdy rozsahy výběrů i délka kontrolního intervalu jsou konstantní. V řadě aplikací tyto předpoklady nelze splnit. Například při použití diagramů CCC nebo CCC-r, kde se pracuje s počtem shodných jednotek do výskytu jedné neshodné, resp. r neshodných jednotek, zcela určitě nebude tento počet kontrolovaných jednotek konstantní. Proto byl navržen ukazatel ANOS, který vyjadřuje průměrný počet jednotek kontrolovaných do výskytu bodu mimo regulační mez (blíže kapitola 10).
1.4.2 Křivka ARL Tento graf zobrazuje závislost průměrné délky přeběhu na velikosti odchylky parametru procesu. Na obrázku 1.4 je znázorněna křivka ARL pro Shewhartův regulační diagram pro průměry (s 3sigma mezemi a výběrem o velikosti n = 3).
25
26
Pokročilejší metody statistické regulace procesu
Obr. 1.4 Ukázka křivky ARL pro regulační diagram pro průměry Postup konstrukce křivky ARL lze popsat následovně: Na osu x vynášíme zvolené hodnoty velikosti změny parametru procesu, kterou si přejeme odhalit ihned při prvním následujícím výběru (vyjádřenou jako počet směrodatných odchylek procesu δ). Na osu y se vynáší hodnoty ARL(δ) pro zvolené hodnoty δ. Hodnoty ARL(δ) se vypočtou dle vzorce (1.7) a (1.8).
1.4.3 Operativní charakteristika regulačního diagramu Dalším grafem, který vyjadřuje schopnost regulačního diagramu odhalit změnu parametru procesu určité velikosti, je operativní charakteristika (dále OC). Na obrázku 1.5 je zachycena OC pro Shewhartův regulační diagram pro průměry (s 3sigma mezemi a výběrem o velikosti n = 3). Postup konstrukce OC lze popsat následovně: Na osu x vynášíme zvolené hodnoty velikosti změny parametru procesu, kterou si přejeme odhalit ihned při prvním následujícím výběru (vyjádřenou jako počet směrodatných odchylek procesu δ). Na osu y vynášíme hodnoty rizika β, že odchylka dané velikosti nebude odhalena při prvním výběru následujícím po vzniku této změny. Riziko β vypočteme pro zvolené hodnoty odchylky δ dle vztahu (1.5).
Podstata statistické regulace procesu
Obr. 1.5 Ukázka OC pro regulační diagram pro průměry
Literatura AIAG SPC-3. Dostupné z: http:\\www.techstreet.com/products/1209346, 2005. ČSN ISO 8258. Shewhartovy regulační diagramy. ČSNI, Praha 1994. D1-9000-1. AQS Tools. Boeing Com, Chicago 2000. Montgomery, D. C. Introduction to Statistical Quality Control. J. Wiley & Sons, New York 2013. Nelson, L. S.The Shewhart Control Chart. Tests for Special Causes. Journal of Quality Technology, 1984, roč. 16, č. 4, s. 337−339. Noskievičová, D. Complex Control Chart Interpretation. International Journal of Engineering Business Management, 2013, roč. 5, č. 13, s. 1–7. Shewhart, W. A. Economic Control of Quality of Manufactured Product. Van Nostrand, New York 1931. Trietsch, D. Statistical Quality Control. A Loss Minimization Approach. World Scientific, London 1999. Western Electric. Statistical Quality Control Handbook. Western Electric Corporation, Indianapolis 1956.
27
28
Pokročilejší metody statistické regulace procesu
2. Předpoklady statistických metod a typy procesů Při odvozování vlastností diagramů nebo při hodnocení způsobilosti procesu se vychází z určitých předpokladů o rozdělení regulované veličiny. U klasických regulačních diagramů měřením se předpokládají nekorelovaná (nezávislá) pozorování, která mají identické normální rozdělení se střední hodnotou μ a rozptylem σ2. Ověřování konstantní střední hodnoty a konstantního rozptylu je přímo podstatou regulačních diagramů, splnění předpokladů normality a nekorelovanosti je třeba posoudit zvlášť. V současné době se využívá i řada dalších rozdělení, kromě toho se připouští také určité kolísání střední hodnoty, a v důsledku toho i existence autokorelace. K metodám podrobnější analýzy procesu proto patří kromě metod pro ověřování shody se zvoleným teoretickým rozdělením nebo testů autokorelace také test rovnosti středních hodnot (ANOVA), test rovnosti rozptylů nebo test odlehlých pozorování. V této kapitole se budeme věnovat především metodám ověřování normality a nekorelovanosti, další metody budou zmíněny podle potřeby v dalších kapitolách. Je nutné poznamenat, že ověřování předpokladů má smysl u procesu, který je statisticky zvládnutý. Jestliže během sběru dat, která analyzujeme, působily zvláštní příčiny, mohou jimi být závěry analýzy ovlivněny.
2.1 Předpoklad normality Z předpokladu normálního rozdělení vychází řada metod statistické regulace procesu. Nejde přitom jen o diagramy používané při regulaci měřením, kdy se, jak plyne z názvu, sleduje měřitelný, tedy spojitý znak, ale také o diagramy pro atributivní znaky, kde se často využívá aproximace binomického či Poissonova rozdělení rozdělením normálním. Obecně platí, že při porušení předpokladů nemá použitá metoda očekávané vlastnosti. Při větší odlišnosti rozdělení sledovaného znaku od normálního rozdělení může být například riziko falešného signálu v klasickém diagramu vyšší než očekávané, to znamená, že dochází příliš často k falešným signálům. Jiným příkladem je odhad ukazatele způsobilosti Cp; uvažovaný interval délky 6σ neobsahuje v případě jiného rozdělení předpokládaných 99,73 % hodnot sledovaného znaku, a představa o způsobilosti procesu je proto zkreslena. Spojitá náhodná veličina je teoretickým pojmem; v praxi se vzhledem k omezené přesnosti měření setkáváme vždy s diskrétními daty. Za splněný předpoklad normality tak považujeme situaci, kdy se skutečné rozdělení sledované veličiny od normálního rozdělení příliš neliší. V takovém případě můžeme aplikovat postupy založené na tomto předpokladu. Nevyhovují-li data předpokladu normálního rozdělení, je třeba rozlišit, o který ze dvou následujících případů jde:
Předpoklady statistických metod a typy procesů
■■ Normální rozdělení sledovaného znaku kvality lze očekávat, ale během sběru dat působily zvláštní příčiny. ■■ Sledovaný znak kvality má jiné než normální rozdělení, i když žádné zvláštní příčiny nepůsobí. Do první skupiny patří směs několika normálních rozdělení, která může být důsledkem občasných změn vstupů či okolního prostředí, seřízení stroje apod., normální rozdělení kontaminované několika odlehlými hodnotami, ale také výskyt stejných hodnot vlivem nedostatečné způsobilosti systému měření nebo zaokrouhlování. V takových případech nemá smysl hledat model výsledného rozdělení; je třeba buď odstranit příčinu porušení normality, nebo použít neparametrický přístup. Mezi aplikace s jiným než normálním rozdělením patří měření excentricity, tloušťky povrchové úpravy, kapacity, izolačního odporu, množství nečistot v materiálu, doby do poruchy atd. Zde musíme odlišný tvar rozdělení zohlednit, ať už volbou vhodné transformace dat, nebo použitím jiné metody (viz kapitola 4). Atributivní znaky, jako je počet (podíl) neshodných jednotek nebo počet neshod v kontrolovaném vzorku, jsou rovněž veličiny s jiným než normálním rozdělením. Za určitých podmínek lze však jejich rozdělení normálním rozdělením aproximovat, viz např. diagram p, diagram c apod. K ověření předpokladu normality slouží jednak různé statistické testy, jednak grafické nástroje. Výhodou statistického testu by měla být objektivnost závěru o splnění či nesplnění předpokladu. Protože však různé testy normality vycházejí z různých principů a mají různou sílu (tj. účinnost), může se stát, že některý test normalitu zamítne a jiný nikoliv. Kromě toho síla testu obecně roste s rozsahem výběru, takže v případě velkého výběru mohou být odhaleny i drobnější odchylky od normality, které následnou analýzu dat podstatně neovlivní. Výsledek testu normality je proto často chápán spíše orientačně. Alternativou je grafické znázornění, které naznačí i charakter případné odlišnosti od normálního rozdělení a umožní posoudit závažnost odchylek od normality. Doporučuje se použít vždy více testů normality a zároveň některý z grafických nástrojů. Konkrétní výběr je obvykle dán nabídkou používaného softwaru. Někdy jsou tyto metody součástí bloku pro analýzu způsobilosti, jindy mohou být uvedeny pod nástroji průzkumové analýzy dat.
2.1.1 Testy normality Vzhledem k zaměření knihy uvedeme jen nejpoužívanější testy normality. Nebudeme podrobně popisovat konstrukci testových statistik; zmíníme jen základní principy a zaměříme se především na interpretaci výsledků. Na příkladech ukážeme různé vlastnosti testů a naznačíme, jak se orientovat v případě, kdy výsledky několika testů vedou k rozdílným závěrům. Podrobnosti o jednotlivých testech lze nalézt v některých odkazech uvedených v poznámkách na konci oddílu 2.1. Nulová hypotéza vyjadřuje předpoklad, že posuzovaná data tvoří náhodný výběr z normálního rozdělení. Není-li nulová hypotéza zamítnuta, pokládáme předpoklad normality za splněný. V aplikacích týkajících se regulačních diagramů či analýzy způsobilosti nebývá model normálního rozdělení specifikován, jde tedy pouze o ověření tvaru normálního rozdělení. Parametry rozdělení nejsou předem dány a odhadují se ze zkoumaných dat.
29
30
Pokročilejší metody statistické regulace procesu
O zamítnutí nulové hypotézy obvykle rozhodujeme na základě p-hodnoty, která bývá v počítačových výstupech uvedena spolu s vypočtenou hodnotou testové statistiky. Lze také použít klasický postup testování hypotéz, ten však u většiny uvedených testů vyžaduje znalost kritických hodnot, které je nutno hledat ve speciálních tabulkách. Testy normality vycházejí z různých principů. Kolmogorovův-Smirnovův test, resp. jeho modifikace při neznámých parametrech rozdělení podle Lillieforse, Andersonův-Darlingův test nebo Cramérův-von Misesův test jsou založeny na porovnání empirické distribuční funkce Fn(x) s distribuční funkcí normálního rozdělení F(x), a jsou proto označovány jako testy dobré shody. Empirická distribuční funkce Fn(x) přitom představuje podíl pozorování menších nebo rovných hodnotě x. Statistika Kolmogorovova-Smirnovova (Lillieforsova) testu měří maximální vzdálenost mezi empirickou a teoretickou distribuční funkcí, další dvě statistiky jsou založeny na čtvercové vzdálenosti uvedených distribučních funkcí, přičemž Andersonova-Darlingova statistika navíc obsahuje váhy. Velké hodnoty statistik svědčí proti nulové hypotéze. K testům dobré shody se řadí také chí-kvadrát test. Zde se porovnávají empirické četnosti v k intervalech, do nichž jsou pozorované hodnoty roztříděny, s očekávanými četnostmi vycházejícími z modelu normálního rozdělení. Při dostatečně obsazených intervalech (očekávaná četnost v jednotlivých intervalech by měla být větší než 5) má testová statistika přibližně chí-kvadrát rozdělení s k – 3 stupni volnosti. Shapirův-Wilkův test (Shapiro, Wilk, 1965; Shapiro, Francia, 1972) souvisí s regresním modelem závislosti vzestupně seřazených naměřených hodnot x(i)1 na odpovídajících kvantilech normovaného normálního rozdělení u(i) = Φ–1(i/n). Je-li předpoklad normálního rozdělení oprávněný, měly by body [u(i), x(i)] ležet v blízkosti proložené přímky. Hodnota testové statistiky vyjadřuje, jak těsně přiléhají data v grafu k přímce. Menší hodnoty svědčí proti nulové hypotéze, ale protože je rozdělení statistiky W značně zešikmené, může být nulová hypotéza zamítnuta i při zdánlivě velké hodnotě W (kolem 0,9). Na podobném principu je založen výpočetně jednodušší Ryanův-Joinerův test. Další skupinu tvoří testy využívající výběrovou šikmost a špičatost. Šikmost a špičatost jsou charakteristiky tvaru rozdělení náhodné veličiny. Šikmost normálního rozdělení je nulová, špičatost je rovna 3. Místo špičatosti se proto většinou používá koeficient špičatosti, který je u normálního rozdělení nulový. Hodnoty výběrové šikmosti a výběrového koeficientu špičatosti blízké nule tedy svědčí pro normální rozdělení. K testu normality se využívají standardizované hodnoty těchto charakteristik, které mají přibližně normované normální rozdělení. Kromě testů založených zvlášť na výběrové šikmosti nebo špičatosti existují testy, jejichž testová statistika zahrnuje obě tyto charakteristiky, tzv. omnibus testy, například test, který navrhli Jarque a Bera (1987) nebo D’Agostinův-Pearsonův test (D’Agostino, 1971). Statistiky obou testů mají přibližně chí-kvadrát rozdělení s dvěma stupni volnosti.
2.1.2 Grafické metody Výsledky měření se často zobrazují v podobě histogramu. K ověřování tvaru rozdělení se tento nástroj popisné statistiky příliš nehodí; rozhodování o podobnosti s křivkou hustoty 1
Indexem v závorce značíme pořadí hodnoty.
Předpoklady statistických metod a typy procesů
normálního rozdělení je, zvláště v případě nedostatečného počtu hodnot, nespolehlivé. Lepší možnost poskytují Q-Q graf nebo P-P graf, u nichž je problém rozhodování o tvaru rozdělení převeden na posouzení, zda vynesené body leží v přímce, či nikoli.
Q-Q graf
Podstatou kvantil-kvantilového grafu je: 1. seřazení pozorovaných hodnot podle velikosti, takže platí x(1) ≤ x(2) ≤ … ≤ x(n); 2. výpočet empirické distribuční funkce pro každou hodnotu x(i), i = 1, 2, …, n, nejčastěji podle vzorce Fn(x(i)) = (i – 0,375) / (n + 0,25) nebo Fn(x(i)) = (i – 0,5) / n; 3. výpočet kvantilů normálního rozdělení, které jsou v případě normovaného normálního rozdělení určeny vztahem u(i) = Φ–1(pi), kde pi = Fn(x(i)). Existují různé varianty zobrazení. Kvantily normovaného normálního rozdělení u(i), případně kvantily obecného normálního rozdělení N(μ, σ2), se vynášejí proti pozorovaným hodnotám x(i) nebo hodnotám vzniklým jejich standardizací, tj. (x(i) – μ) / σ. Pokud nejsou parametry μ a σ specifikovány, odhadnou se z pozorovaných hodnot. Je-li normální rozdělení vhodným modelem, budou vynesené body ležet přibližně v přímce. Některé statistické programy zobrazují kromě vynesených bodů i přímku, na níž by body teoreticky měly ležet. Používají se přitom různé způsoby konstrukce: ■■ Přímka prochází bodem [x0,5; 0,5], kde x0,5 je medián odhadnutý z naměřených hodnot. Potom je její směrnice odvozena z kvartilového rozpětí. Znamená to, že se zohledňuje především 50 % prostředních hodnot. ■■ Parametry přímky se odhadnou metodou nejmenších čtverců. Uvažuje se závislost Φ–1(pi) na x(i). ■■ Z naměřených hodnot se metodou maximální věrohodnosti odhadnou parametry μ a σ a pro každé pi se určí očekávaná hodnota kvantilu normálního rozdělení N(μ, σ2). V posledních dvou případech lze také zobrazit dvojici křivek, které představují meze konfidenčních intervalů. Leží-li všechny zobrazené body mezi těmito křivkami, považujeme shodu naměřených hodnot s normálním rozdělením za dobrou. Často se také setkáme s pojmem „pravděpodobnostní graf “. Souřadnice bodů jsou stejné jako v Q-Q grafu, na ose odpovídající kvantilům normálního rozdělení je však použita nelineární stupnice. Místo hodnoty kvantilu je uvedena příslušná hodnota distribuční funkce, například místo u(i) hodnota Φ(u(i)), často vyjádřená v procentech. V některých statistických programech však není popsané rozlišení respektováno a pojmy „Q-Q graf “ a „pravděpodobnostní graf “ se zaměňují.
P-P graf
První dva kroky jsou stejné jako u Q-Q grafů, ve třetím kroku se místo kvantilů určuje hodnota distribuční funkce F(x(i)) normálního rozdělení N(μ, σ2). Hodnoty empirické distribuční funkce se vynášejí proti hodnotám teoretické distribuční funkce. Stejně jako předtím platí, že v případě oprávněného předpokladu normálního rozdělení budou vynesené body ležet přibližně v přímce (procházející počátkem a se směrnicí rovnou 1).
31
32
Pokročilejší metody statistické regulace procesu
Zásadní rozdíl v konstrukci Q-Q a P-P grafů tedy spočívá v tom, že v prvním případě odpovídají souřadnice vynesených bodů hodnotám kvantilů, v druhém případě hodnotám distribuční funkce. Kvantily mohou být vyjádřeny buď v původních fyzikálních jednotkách, nebo jsou po standardizaci bezrozměrné (potom se většina hodnot bude vyskytovat v intervalu od –3 do 3). Hodnoty distribuční funkce jsou vždy v intervalu 0 až 1. P-P grafy lépe odhalují odchylky od normality v oblasti kolem střední hodnoty, Q-Q grafy lépe identifikují odlišný tvar konců rozdělení.
2.1.3 Rozhodování o platnosti předpokladu Jak už bylo řečeno, pro ověřování předpokladu normality je vhodné zvolit více nástrojů. Za nejvhodnější kombinaci lze považovat některý z testů dobré shody, např. Andersonův-Darlingův test, dále Shapirův-Wilkův nebo Ryanův-Joinerův test, test šikmosti a špičatosti a Q-Q nebo P-P graf (nebo pravděpodobnostní graf). Je-li k dispozici jediný test, musí být doplněn důkladnější analýzou průběhu bodů v grafu. Při aplikaci metod statistické regulace procesu bývají k dispozici rozsahy výběrů 100 či větší (máme zde na mysli celkový počet hodnot, pro něž se normalita ověřuje, nikoli rozsah podskupin při regulaci procesu); v takovém případě obvykle použijeme hladinu významnosti α = 0,05 a hypotézu o normalitě zamítneme, je-li p-hodnota menší než 0,05. Někdy se však můžeme rozhodnout pro alternativní hypotézu i při p-hodnotě vyšší než 0,05, naznačuje-li to grafické znázornění. Pokud jsou výsledky všech testů konzistentní, je rozhodnutí snadné (příklady 2.1 a 2.2). Důkladnější rozbor je třeba provést v případě, kdy se závěry plynoucí z různých testů neshodují. Například Andersonův-Darlingův test je citlivý jednak na odlehlé hodnoty, jednak na výskyt shodných hodnot. Vyjde-li tedy tento test významný a Shapirův-Wilkův (Ryanův-Joinerův) test nebo test šikmosti či špičatosti nikoli, rozhodneme spíš ve prospěch normálního rozdělení (viz příklad 2.4). V případě zamítnutí navíc hledáme důvod prostřednictvím Q-Q grafu, P-P grafu nebo také pomocí histogramu či grafu časové řady naměřených hodnot (viz příklad 2.3).
I Příklad 2.1 Histogram na obrázku 2.1 znázorňuje rozdělení 200 hodnot tahového napětí (v MPa), získaných při kontrole kvality v průběhu výroby drátu (viz soubor v příloze na webových stránkách). Výsledky testů normality (tabulka 2.1) a pravděpodobnostní graf (obrázek 2.2) svědčí o porušení předpokladu normality; důvodem je především šikmost rozdělení, jak je patrné jak z histogramu na obrázku 2.1, tak z posledních dvou testů v tabulce 2.1.
Předpoklady statistických metod a typy procesů
Obr. 2.1 Histogram, tahové napětí
Obr. 2.2 Pravděpodobnostní graf, tahové napětí X Tab. 2.1 Výsledky testů normality Test
Testová statistika
P-hodnota
Zdroj Minitab
Kolmogorov-Smirnov
0,089
< 0,01
Anderson-Darling
1,955
< 0,005
Minitab
Cramér-von Mises
0,329
0,0002
Statgraphics
Chí-kvadrát
29,602
0,0294
Statgraphics
Shapiro-Wilk
0,950
0,0000
Statgraphics
Ryan-Joiner
0,983
< 0,01
Minitab
Šikmost
2,658
0,0079
Statgraphics
Špičatost
0,847
0,3971
Statgraphics
33
Pokročilejší metody statistické regulace procesu
I Příklad 2.2 Data znázorněná histogramem na obrázku 2.3 (soubor v příloze na webu) představují jednu z funkčních měr karoserie osobního automobilu, kontrolovanou na 100 po sobě vyrobených kusech. 25
20
Četnost
15
10
5
0 1351,0
1351,5
1352,0
1352,5
1353,0
X
Obr. 2.3 Histogram, funkční míra X Výsledky testů svědčí vesměs o normalitě rozdělení (tabulka 2.2). Stejný závěr vyplývá také z pravděpodobnostního grafu na obrázku 2.4; průběh bodů je přibližně lineární. 99,9 99 95 90
Procenta
34
80 70 60 50 40 30 20 10 5 1 0,1 1351,0
1351,5
1352,0 X
Obr. 2.4 Pravděpodobnostní graf, funkční míra X
1352,5
1353,0
1353,5
Předpoklady statistických metod a typy procesů
Tab. 2.2 Výsledky testů normality Test Kolmogorov-Smirnov
Testová statistika
P-hodnota
Zdroj
0,048
> 0,15
Minitab
Anderson-Darling
0,195
0,8888
Minitab
Cramér-von Mises
0,031
0,8282
Statgraphics
Chí-kvadrát
0,048
0,9746
Statgraphics
Shapiro-Wilk
0,983
0,6629
Statgraphics
Ryan-Joiner
0,998
> 0,10
Minitab
Šikmost
0,263
0,7922
Statgraphics
– 0,594
0,5524
Statgraphics
Špičatost
I Příklad 2.3 Na obrázku 2.5 jsou znázorněny odchylky od jmenovité hodnoty jiné z funkčních měr naměřené v období, během nějž došlo k posunu střední hodnoty procesu (viz soubor v příloze na webu). Obrázek 2.6 znázorňuje příslušný Q-Q graf.
Obr. 2.5 Proces s posunem střední hodnoty
Obr. 2.6 Q-Q graf, proces s posunem
Zakřivený průběh bodů v Q-Q grafu svědčí o porušení předpokladu normality. Z obrázku 2.5 je zřejmé, že kolem 65. pozorování došlo ke zvýšení střední hodnoty procesu. Neplatnost předpokladu je patrná také z histogramu na obrázku 2.7, který odpovídá směsi dvou normálních rozdělení. Vlevo je normální zobrazení histogramu, vpravo jsou znázorněny obě části směsi doplněné modelem rozdělení. Odchylka od normality je zde způsobena vymezitelnou příčinou a lze předpokládat, že tato příčina bude odhalena a odstraněna. O porušení předpokladu normality informují také výsledky většiny testů (tabulka 2.3). Všechny p-hodnoty s výjimkou testu založeného na šikmosti jsou menší než 0,01.
35
Pokročilejší metody statistické regulace procesu
16
2,0
14 1,5
12 10
Hustota
Četnost
36
8 6 4
1,0 0,5
2 0
0,0 0,0
0,3
0,6
0,9 1,2 Odchylka
1,5
1,8
0,0
0,3
0,6
0,9 1,2 Odchylka
1,5
1,8
Obr. 2.7 Histogram, proces s posunem Tab. 2.3 Výsledky testů normality, proces s posunem Test
Testová statistika
P-hodnota
Zdroj Statgraphics
Kolmogorov-Smirnov
1,2896
< 0,01
Anderson-Darling
2,1766
0,0000
Minitab
Cramér-von Mises
0,3763
0,0000
Statgraphics
Chí-kvadrát
39,2
0,0093
Statgraphics
Shapiro-Wilk
0,9174
0,0000
Statgraphics
Ryan-Joiner
0,972
< 0,01
Minitab
Šikmost
1,0806
0,2799
Statgraphics
Špičatost
–4,6338
0,0000
Statgraphics
I Příklad 2.4 Při periodickém sledování způsobilosti obráběcího stroje jsou v pravidelných intervalech kontrolovány díly podobného tvaru (soubor v příloze na webu). Na každém dílu se v deseti předepsaných bodech souřadnicovým měřicím zařízením s rozlišením 0,01 mm měří odchylka od jmenovitého rozměru (obrázek 2.8).
Obr. 2.8 Odchylky od jmenovité hodnoty
Obr. 2.9 Q-Q graf
Předpoklady statistických metod a typy procesů
V Q-Q grafu (obrázek 2.9) je nápadný opakovaný výskyt stejných hodnot, ale na základě celkového přibližně lineárního průběhu se předpoklad normality jeví spíše jako splněný. Aplikujeme-li různé testy normality, dostaneme nejednoznačné výsledky (tabulka 2.4). Výsledky testů založených na šikmosti a špičatosti a výsledky Shapirova-Wilkova testu nebo Ryanova-Joinerova testu odpovídají grafickému znázornění, to znamená, že normalitu nezamítají. P-hodnoty u prvních čtyř testů v tabulce jsou vesměs menší než 0,01, tj. na základě těchto testů bychom hypotézu o výběru z normálního rozdělení zamítli. Odporující si závěry testů jsou důsledkem opakovaně se vyskytujících naměřených hodnot. Opět zde existuje vymezitelná příčina; měřicí zařízení nemá dostatečnou citlivost, a proto se při větším počtu měření znaku, který nabývá hodnot v relativně úzkém intervalu, výsledky nutně opakují. Při použití přesnějšího měřicího zařízení by se normalita zřejmě prokázala i pomocí prvních čtyř testů. Další postup záleží na cíli analýzy procesu. Rozhodně nemá smysl hledat nějakou normalizující transformaci či jiný model rozdělení. Chceme-li zvýšit způsobilost procesu měření, musíme zvolit zařízení s lepší rozlišitelností. Pokud jde o analýzu samotného procesu obrábění, například o výpočet ukazatelů způsobilosti, nepovažujeme takové porušení předpokladu normality za podstatné. Tab. 2.4 Výsledky testů normality, malá rozlišitelnost přístroje P-hodnota
Zdroj
Kolmogorov-Smirnov
1,3106
< 0,01
Statgraphics
Anderson-Darling
1,1530
0,0050
Minitab
Cramér-von Mises
0,2106
0,0040
Statgraphics
Chí-kvadrát
420,04
0,0000
Statgraphics
Shapiro-Wilk
0,9753
0,0610
Statgraphics
Ryan-Joiner
0,998
> 0,1
Minitab
Šikmost
1,1257
0,2603
Statgraphics
Špičatost
–0,3390
0,7346
Statgraphics
Test
Testová statistika
Poznámky
yy Testy dobré shody slouží k ověření, zda data pocházejí z populace s určitým rozdělením. Model rozdělení může být plně specifikován (parametry rozdělení jsou známy), nebo jde jen o tzv. rodinu rozdělení a parametry se odhadují na základě dat. K testu lze použít obecný tvar testové statistiky, někdy se však hodnota testové statistiky ještě násobí určitou konstantou, která se pro různá rozdělení liší. Tato konstanta také závisí na rozsahu výběru. Pro stejné ověřované rozdělení mohou tedy existovat různé modifikace. Kritické hodnoty i p-hodnoty používané pro rozhodování závisejí na tom, zda se používá původní, či modifikovaná verze, případně na konkrétní modifikaci. Podrobnosti o modifikaci testů lze nalézt v článku Stephense (1974) nebo v publikaci D’Agostina (1986). yy Výhodou Kolmogorovova-Smirnovova testu je možnost použití stejných kritických hodnot pro různé modely rozdělení, to však platí pouze v případě, kdy je model plně specifikován, tj. kdy jsou známy také parametry rozdělení. Tyto kritické hodnoty tabelovali například Likeš a Laga (1978). Více informací o testech vhodnosti modelu normálního rozdělení včetně tabelovaných kritických hodnot pro případ obou odhadovaných parametrů lze nalézt v publikacích Hebáka a kol. (2013), Lillieforse (1967) nebo Dallala a Wilkinsona (1986).
37
38
Pokročilejší metody statistické regulace procesu
yy Cramérův-von Misesův test a Andersonův-Darlingův test jsou silnější než Kolmogorovův-Smirnovův test, to znamená, že hypotéza o normálním rozdělení je častěji zamítnuta (příslušná p-hodnota bude často nižší než u Kolmogorovova-Smirnovova testu). Andersonův-Darlingův test (1952) dává větší váhu koncům rozdělení, a rozhodnutí je tedy více ovlivněno odlehlými hodnotami. Je ovšem citlivý na výskyt stejných hodnot při nedostatečné přesnosti měření. Pro stejné rozdělení existují různé modifikace. Kritické hodnoty jsou uvedeny např. u Pearsona a Hartleyho (1976), D’Agostina (1986) nebo Csörgőho a Farawaye (1996). yy Výhodou chí-kvadrát testu je možnost aplikace na data roztříděná do intervalů nebo dostupnost kritických hodnot (jde o kvantily chí-kvadrát rozdělení, které lze najít například pomocí Excelu). Nevýhodou je skutečnost, že hodnota testové statistiky závisí na konkrétním roztřídění hodnot. Rozsah výběru musí být dostatečně velký (aspoň 100), aby aproximace rozdělení testové statistiky chí-kvadrát rozdělením byla platná (blíže viz např. Hebák a kol., 2013). yy Shapirův-Wilkův test je doporučován v ČSN 01 0225 (1981) nebo v ČSN ISO 5479 (1998). Test je vhodný i pro malé rozsahy výběrů, formálně jej lze použít již pro n = 3. Podrobnosti o tomto testu lze nalézt např. u Roystona (1992), Shapira a Wilka (1965) nebo Shapira a Francii (1972). Ryanův-Joinerův test je dostupný v Minitabu, bližší informace viz Ryan a Joiner (1973). yy Testy založené na šikmosti a špičatosti jsou uvedeny v ČSN ISO 5479 (1998) nebo v publikaci Hebá ka a kol. (2013), omnibus testy v článcích D’Agostina (1971), D’Agostina, Belangera a D’Agostina (1990) nebo Jarquea a Bery (1987). Test šikmosti vyžaduje aspoň 8 hodnot, test špičatosti nebo omnibus test aspoň 20 hodnot.
2.2 Nezávislost Konstrukce klasického regulačního diagramu předpokládá, že hodnoty statisticky zvládnutého procesu kolísají zcela náhodně kolem pevné střední hodnoty μ; velikost tohoto kolísání je popsána směrodatnou odchylkou σ. Hodnotu sledovaného znaku v okamžiku t můžeme vyjádřit pomocí modelu
xt = μ + εt pro t = 1, 2, …
(2.1)
kde náhodná složka εt má střední hodnotu 0 a rozptyl σ2. Předpoklad náhodného kolísání můžeme formulovat jako předpoklad identického rozdělení a nezávislosti v čase, často se ale redukuje na předpoklad nekorelovanosti. Nekorelovanost znamená absenci lineární závislosti členů časové posloupnosti; závisejí-li hodnoty xt lineárně na předcházejících hodnotách xt–1, xt–2, atd., mluvíme o autokorelaci. Jsou-li data nekorelovaná, má náhodná složka εt vlastnosti bílého šumu, tj. platí E(εt) = 0, D(εt) = σ2 a cov(εt, εt+k) = 0 pro každé t a k ≠ 0. Nekorelovanost je užším pojmem než nezávislost; neexistuje-li lineární vztah, nemusí to nutně znamenat nezávislost, protože může existovat nějaká nelineární asociace. Jen v případě normálního rozdělení plyne z nekorelovanosti zároveň nezávislost. Při splnění předpokladu normality a nekorelovanosti platí pro sledovaný znak kvality Pokud se z procesu odebírají podskupiny o rozsahu n a sledují se průměry těchto podskupin, platí Za uvedeného předpokladu časová řada hodnot xt nebo průměrů neobsahuje žádné systematické složky. Jakákoliv nenáhodnost v průběhu časové řady znamená porušení uvedeného předpokladu a naznačuje existenci zvláštní příčiny.
Předpoklady statistických metod a typy procesů
Autokorelace je typická pro procesy „spojité“ výroby, kde se zpracovávají či vyrábějí dávky materiálu, tj. např. v chemickém nebo metalurgickém průmyslu; v poslední době se však často objevuje i v procesech „diskrétní“ výroby v souvislosti s automatickými kontrolními postupy, které umožňují v průběhu výroby měřit každou jednotku vyráběné série. Pozitivní autokorelace se projevuje nápadným shlukováním sousedních hodnot (tj. sousední hodnoty jsou si podobné), vzniká jako důsledek existence jisté setrvačnosti v procesu a projeví se především tehdy, je-li interval mezi pozorováními relativně krátký. Negativní autokorelace se projevuje střídáním hodnot vyšších a nižších než průměr; vzniká například při snaze o regulaci procesu, kdy zásahy místo přiblížení se k cílové hodnotě vedou opakovaně k překmitnutí na druhou stranu od cílové hodnoty. Autokorelaci lze také očekávat v případě existence zvláštní příčiny, tj. při viditelné změně střední hodnoty, ať už jde o náhlou přechodnou, či přetrvávající změnu nebo o trend či cyklické kolísání. Nerespektování existence autokorelace vede ke zkreslenému odhadu rozptylu. Při pozitivní autokorelaci je odhad rozptylu prováděný běžným způsobem podhodnocen, regulační meze klasického diagramu jsou příliš blízko, což se projeví častějšími falešnými signály. Při negativní autokorelaci je odhad rozptylu naopak nadhodnocen, meze jsou příliš vzdálené a regulace procesu není tak účinná. Přítomnost autokorelace samozřejmě také ovlivní hodnotu ukazatele způsobilosti procesu. Autokorelace se nejvíc projevuje u diagramů individuálních hodnot, kde se k odhadu směrodatné odchylky σ používají klouzavá rozpětí. Pro regulaci procesu jsou výhodnější podskupiny s rozsahem n > 1, a to nejen z důvodu menší autokorelace (s rostoucím rozsahem podskupin navíc autokorelace klesá). Při interpretaci regulačního diagramu on-line využíváme k odhalení nenáhodností jednoduchá pravidla (viz oddíl 1.3), v rámci hlubší retrospektivní analýzy procesu je vhodné aplikovat některý ze statistických testů. Použitelné testy lze rozdělit do dvou skupin. První skupinu tvoří tzv. testy náhodnosti, kdy ověřujeme hypotézu o identickém rozdělení a nezávislosti v čase, do druhé skupiny patří testy autokorelace.
2.2.1 Testy náhodnosti Testy náhodnosti jsou neparametrické testy. Mezi nejznámější patří test založený na počtu iterací nad a pod mediánem a test iterací nahoru a dolů. Předpokládá se posloupnost hodnot ze spojitého rozdělení. U prvně jmenovaného testu se určí medián a původní posloupnost hodnot se nahradí kladnými a zápornými znaménky (hodnoty rovné mediánu se vynechají); hodnotám větším než medián se přiřadí znaménko +, ostatním hodnotám znaménko –. U druhého testu se kladné znaménko přidělí v případě xi+1 > xi, záporné znaménko v případě xi+1 < xi (pokud jsou sousední hodnoty stejné, ponechá se jediná). Posloupnost stejných znamének se nazývá iterace. V případě platnosti hypotézy o náhodnosti by se počet iterací neměl příliš lišit od střední hodnoty, která souvisí s celkovým počtem pozorování. Tabulky kritických hodnot jsou uvedeny např. v publikaci Likeše a Lagy (1978). Statistické programy obvykle využívají aproximaci testové statistiky normálním rozdělením a zobrazují příslušnou asymptotickou p-hodnotu. Hypotézu o náhodnosti zamítneme, je-li
39
40
Pokročilejší metody statistické regulace procesu
p-hodnota menší než hladina významnosti 0,05. Volba testu je dána možnostmi používaného statistického softwaru. Testy náhodnosti bývají součástí modulů pro časové řady.
I Příklad 2.5 Uvažujeme znovu data z příkladu 2.2, tedy hodnoty sledovaného rozměru zjištěné na 100 po sobě vyrobených kusech (viz soubor v příloze na webu). Data v časové posloupnosti jsou znázorněna na obrázku 2.10, výsledky testů náhodnosti jsou uvedeny v tabulce 2.5.
Obr. 2.10 Proces z příkladu 2.2 Na obrázku 2.10 nejsou patrné žádné projevy nenáhodnosti. Tomu odpovídají výsledky obou testů. Pozorovaný počet iterací je v obou případech blízký střední hodnotě, p-hodnota je blízká jedné, to znamená, že hypotézu o náhodnosti pozorování nezamítáme. Tab. 2.5 Testy náhodnosti, Statgraphics Počet
Střední hodnota
Statistika
P-hodnota
Iterace nad a pod mediánem
52
51
0,1005
0,9200
Iterace nahoru a dolů
67
66,3333
0,0399
0,9682
Test