´ Uvod do navrhov´ an´ı a anal´ yzy pr˚ umyslov´ ych experiment˚ u Gejza Dohnal
Vˇenov´ ano Aleˇsi Linkovi
Tento text byl vytvoˇren za podpory projektu OP VK 3P – Praxe pro praxi“, reg. ˇc. CZ.1.07/2.2.00/15.0097 ”
Obsah 1 Z´ aklady navrhov´ an´ı experiment˚ u
1
1.1
Historie ˇr´ızen´ı kvality
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1
1.2
Historie DOE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2
1.3
Z´akladn´ı pojmy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3
1.4
N´avrh a anal´ yza experimentu v pˇeti kroc´ıch . . . . . . . . . . . . . . . . . . . . .
5
1.4.1
Anal´ yza procesu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5
1.4.2
N´ avrh experimentu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6
1.4.3
Proveden´ı zkouˇsek . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9
1.4.4
Anal´ yza v´ ysledk˚ u. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10
1.4.5
Z´ avˇery . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
11
2 Stochastick´ e repetitorium . . . 2.1
2.2
2.3
13
N´ahodn´ a veliˇcina . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
14
2.1.1
Rozdˇelen´ı n´ ahodn´e veliˇciny . . . . . . . . . . . . . . . . . . . . . . . . . .
14
2.1.2
Charakteristiky n´ ahodn´ ych veliˇcin . . . . . . . . . . . . . . . . . . . . . .
16
2.1.3
Norm´ aln´ı rozdˇelen´ı pravdˇepodobnosti N (µ, σ 2 ). . . . . . . . . . . . . . . .
19
Testov´ an´ı statistick´ ych hypot´ez . . . . . . . . . . . . . . . . . . . . . . . . . . . .
22
2.2.1
Test statistick´e hypot´ezy . . . . . . . . . . . . . . . . . . . . . . . . . . . .
22
2.2.2
Testy o parametrech norm´aln´ıho rozdˇelen´ı . . . . . . . . . . . . . . . . .
24
2.2.3
Testy dobr´e shody . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
28
2.2.4
Nˇekter´e neparametrick´e testy . . . . . . . . . . . . . . . . . . . . . . . . .
30
Regresn´ı anal´ yza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
31
2.3.1
Regresn´ı z´ avislost
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
31
2.3.2
Jednoduch´ a pˇr´ımkov´ a regrese . . . . . . . . . . . . . . . . . . . . . . . . .
33
3 Jednofaktorov´ e experimenty 3.1
37
Dvou´ urovˇ nov´e jednofaktorov´e experimenty . . . . . . . . . . . . . . . . . . . . . .
38
3.1.1
39
Nez´ avisl´ a mˇeˇren´ı . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . i
OBSAH
3.2
3.3
OBSAH 3.1.2
Z´ avisl´ a pozorov´ an´ı . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
42
3.1.3
Uspoˇr´ ad´ an´ı do blok˚ u . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
44
Jednofaktorov´e experimenty s v´ıce u ´rovnˇemi . . . . . . . . . . . . . . . . . . . . .
45
3.2.1
Ordin´ aln´ı odezva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
45
3.2.2
Nomin´ aln´ı odezva
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
47
3.2.3
Latinsk´e ˇctverce . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
48
Regresn´ı experimenty 3.3.1
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
48
Jednoduch´ a pˇr´ımkov´a regrese . . . . . . . . . . . . . . . . . . . . . . . . .
50
4 V´ıcefaktorov´ e experimenty
53
4.1
Dvoufaktorov´e experimenty . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
54
4.2
Vyhodnocen´ı v´ıcefaktori´ aln´ıch experiment˚ u . . . . . . . . . . . . . . . . . . . . .
57
4.3
V´ıcefaktori´ aln´ı experimenty . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
58
4.4
Smˇeˇsov´ an´ı ve v´ıcefaktori´ aln´ıch n´avrz´ıch . . . . . . . . . . . . . . . . . . . . . . .
58
4.5
V´ yznamn´e body experimentu . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
61
5 Taguchiho robustn´ı n´ avrhy
63
5.1
Designov´e matice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
65
5.2
ˇ ızen´e a ˇsumov´e faktory . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . R´
66
6 DOE v MINITABu
69
6.1
Program MINITAB . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
69
6.2
Vytvoˇren´ı n´ avrhu experimentu . . . . . . . . . . . . . . . . . . . . . . . . . . . .
71
6.3
Vstup dat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
72
6.4
Vyhodnocen´ı v´ ysledku experimentu . . . . . . . . . . . . . . . . . . . . . . . . . .
74
6.5
ˇ sen´ Reˇ y pˇr´ıklad z praxe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
76
6.5.1
N´ avrh experimentu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
76
6.5.2
Pˇr´ıprava vzork˚ u a mˇeˇren´ı . . . . . . . . . . . . . . . . . . . . . . . . . . .
79
6.5.3
Anal´ yza v´ ysledk˚ u. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
80
6.5.4
Z´ avˇer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
87
´ Uvod Vˇetˇsina naˇsich znalost´ı o okoln´ım svˇetˇe je z´ısk´av´ana na z´akladˇe experimentov´an´ı. Mal´e dˇeti experimentuj´ı s vˇecmi kolem sebe, s chov´ an´ım lid´ı, zv´ıˇrat, zkouˇsej´ı co se stane kdyˇz ... Jako dospˇel´ı pouˇz´ıv´ame experiment k ovˇeˇren´ı naˇsich pˇredstav, teori´ı a logick´ ych u ´vah. K tomu vyuˇz´ıv´ame znalost´ı a zkuˇsenost´ı, z´ıskan´ ych tak´e na z´akladˇe v´ ysledk˚ u experimentov´an´ı ostatn´ıch lid´ı. Experiment´aln´ı ovˇeˇrov´ an´ı pˇredpoklad˚ u a rozv´ıjen´ ych teori´ı je jednou ze z´akladn´ıch ˇcinnost´ı ve vˇedeck´em zkoum´ an´ı. Experiment je ˇcasto jedin´ ym zdrojem informace v situaci, kdy teoretick´e
jakosti znalosti nestaˇc´ı nebo je nelze pouˇz´ıt vzhledem ke sloˇzit´ yHistorie m re´aln´ ymřízení podm´ınk´ am. Experiment m˚ uˇze prob´ıhat r˚ uzn´ ym zp˚ usobem. Zˇrejmˇe nejstarˇs´ım a nejˇcastˇeji pouˇz´ıvan´ ym pˇr´ıstupem je tak-
Přřemýšlení o problému
zvan´a metoda pokusu a omylu. Tato metoda je v´ ysledkem spont´ann´ıho chov´ an´ı a je nejm´enˇe efektivn´ı. M˚ uˇze b´ yt u ´spˇeˇsn´a poze tehdy, je-li spojena se zkuˇsenost´ı a intuic´ı. Lze ji
• funguje v jednotlivých
Cosi zkusíme
přřípadech a jen s něěk málo lidmi
• ččasto ččekáme velmi na výsledek
pouˇz´ıt pouze v jednotliv´ ych pˇr´ıpadech a v omezen´em okruhu aplikac´ı, pˇriˇcemˇz v´ ysledek je nejist´ y a m˚ uˇze se dostavit aˇz za
Typický "starý" přř k řřešení problému
Přřemýšlýme dále ...
• vyžaduje zkušenost a • lze jej využít pouze v
velmi dlouhou dobu. Se st´ale modernˇejˇs´ımi technologick´ ymi postupy se st´avaj´ı
Zkusíme něěco jiného ...
i v´ yrobky a procesy st´ ale v´ıce komplikovan´e. Vzhledem
.. .
k tomu, ˇze n´aklady na experimentov´ an´ı se prudce zvyˇsuju´ı, čtvrtek, 23. února 12
pro analytika, kter´ y m´ a omezen´e finanˇcn´ı zdroje a ˇcas, se
Obr´azek 1: Postup metodou post´av´a nemoˇzn´e, aby prozkoumal mnoˇzstv´ı faktor˚ u, kter´e
kusu a omylu.
ovlivˇ nuj´ı tyto sloˇzit´e procesy pomoc´ı metody pokusu a omylu. Proto je tˇreba vyuˇz´ıvat techniky, kter´e identifikuj´ı vliv d˚ uleˇzit´ ych faktor˚ u t´ım nejefektivnˇejˇs´ım zp˚ usobem a ˇr´ıd´ı proces nejlepˇs´ıho nastaven´ı tˇechto d˚ uleˇzit´ ych faktor˚ u pro uspokojen´ı st´ale rostouc´ı popt´avky po zlepˇsen´ı kvality a zv´ yˇsen´ı produktivity. Techniky pl´ anov´ an´ı experiment˚ u poskytuj´ı v´ ykonn´e a u ´ˇcinn´e metody k dosaˇzen´ı uveden´ ych c´ıl˚ u.
iii
omezeném okruhu a
´ Uvod
iv
Systematick´ y pˇr´ıstup k ˇreˇsen´ı probl´em˚ u pˇredpokl´ad´a t´ ymovou pr´aci a objektivn´ı pl´anov´an´ı jednotliv´ ych krok˚ u. Tento text se zamˇeˇruje na navrhov´an´ı experiment˚ u pˇredevˇs´ım ve stroj´ırenstv´ı a technick´em v´ yzkumu. Experiment budeme ch´apat jako s´erii zkouˇsek prov´adˇen´ ych systematick´ ym zp˚ usobem za u ´ˇcelem lepˇs´ıho porozumˇen´ı st´avaj´ıc´ım proces˚ um, nebo k prozkoum´an´ı nov´eho produktu ˇci procesu. N´ astroj pro vytv´aˇren´ı takov´eho zp˚ usobu experimentov´an´ı se oznaˇcuje zkratkou DOE z anglick´eho ”Design Of Experiments”. Vyhodnocen´ı v´ ysledk˚ u zkouˇsek se prov´ad´ı pomoc´ı matematicko-statistick´ ych metod. Proto se DOE ˇcasto povaˇzuje za jednu z oblast´ı aplikovan´e statistiky. Experimenty jsou velmi ˇcasto d˚ uleˇzit´ ym n´astrojem pˇri ˇr´ızen´ı kvality a jsou jednou z hlavn´ıch ˇcinnost´ı pˇri zlepˇsov´an´ı proces˚ u v souvislosti s aplikac´ı z´asad Six Sigma. Z to-
Historie řízení hoto d˚ uvodu jsoujakosti i souˇc´ ast´ı managementu kvality. N´avrh experimentu se snaˇz´ı o z´ısk´an´ı maxim´aln´ıho Vymezení faktorůů, analýza vlivůů a závislostí
mnoˇzstv´ı informac´ı s minimem vynaloˇzen´ ych zdroj˚ u.
k řřešení problému:
Pro u ´spˇeˇpráce sn´ y n´ avrh a vyhodnocen´ı experimentu je a společčné • týmová rozhodování
Popis provedení experimentůů
nutn´a spolupr´ace jak expert˚ u z v´ yroby, tak i tech• vyžaduje být aktivní a objektivněě nik˚ u design´eplánovat r˚ u a odborn´ık˚ u z oblasti aplikovan´e maexperimenty
tematick´ statistiky. Pro u ´spˇeˇsnou realizaci experije vždy plán • prvním ekrokem Vedení experimentůů
Predikce procesu na základěě analýzy výsledkůů
experimentu
mentu je nezbytn´a i podpora vrcholov´eho veden´ı • experimenty jsou prováděěny v náhodném pořřadí firmy. Aˇckoli podstata DOE spoˇc´ıv´a v efektivn´ım • zahrnuje přředvídání a vyhodnocen´ ı pomˇernˇe mal´eho mnoˇzstv´ı zkouˇsek, ověěřřování oččekávaných výsledkůů přřed provedením
pˇresto m˚ uˇze b´ yt proveden´ı cel´eho experimentu velmi experimentu Verifikace, potvrzení (ověěřřovací experimenty) čtvrtek, 23. února 12
Obr´azek 2: Systematick´e kroky pˇri n´avrhu experimentu.
důůraz na optimalitu •akladnou n´ z´aleˇzitost´ı. To je tak´e – spolu s oba-
vou o zhorˇsen´ı kvality produkce po dobu experimentov´an´ı – jedn´ım z nejˇcastˇejˇs´ıch d˚ uvod˚ u odm´ıt´an´ı tˇechto metod v praktick´em provozu. Proto zde hraje kl´ıˇcovou roli rozhodnut´ı odpovˇedn´ ych manaˇzer˚ u
podniku, kteˇr´ı na z´ akladˇe ekonomick´e rozvahy naˇr´ıd´ı potˇrebn´e kroky. Z hlediska ˇr´ızen´ı kvality je navrhov´an´ı a vyhodnocov´an´ı experiment˚ u nikdy nekonˇc´ıc´ı pˇr´ıbˇeh“. ” V´ ysledky pˇredchoz´ıch experiment˚ u jsou ˇcasto vstupn´ımi informacemi pro dalˇs´ı, navazuj´ıc´ı experimenty, kter´e zpˇresˇ nuj´ı modely z´avislost´ı mezi odezvou a faktory, zpˇresˇ nuj´ı poˇcet p˚ usob´ıc´ıch faktor˚ u a jejich sledovan´ ych u ´rovn´ı. Je d˚ uleˇzit´e m´ıt tento proces pod kontrolou, nebot’ jen tak lze zajistit jeho efektivitu a dos´ ahnout poˇzadovan´ ych u ´spor pˇri v´ yrobˇe. Znalost z´akladn´ıch z´asad pˇri navrhov´ an´ı a vyhodnocov´ an´ı experiment˚ u patˇr´ı k z´akladn´ım dovednostem a je d˚ uleˇzit´a jak pro ty, kteˇr´ı experimenty sami prov´adˇej´ı, tak i pro ty, kteˇr´ı vyuˇz´ıvaj´ı jejich v´ ysledk˚ u, tedy i pro pracovn´ıky ve veden´ı firmy.
´ Uvod
v
Prov´adˇen´ı a vyhodnocen´ı pr˚ umyslov´ ych experiment˚ u je dnes uˇz nepˇredstaviteln´e bez softwarov´e podpory. Existuje ˇrada programov´ ych produkt˚ u, kter´e usnadn´ı n´avrh a umoˇzn´ı anal´ yzu v´ ysledk˚ u experimentu. Nicm´enˇe i zde plat´ı pravidlo, ˇze tyto relativnˇe mocn´e n´astroje mus´ı ˇr´ıdit odborn´ık, kter´ y v´ı co a jak spr´ avnˇe v urˇcit´e situaci pouˇz´ıt. Pokud tyto n´astroje pouˇz´ıv´a laik, m˚ uˇze doj´ıt k chybn´emu vyhodnocen´ı pˇredpoklad˚ u, v´ ybˇeru nevhodn´e metody a v neposledn´ı ˇradˇe k chybn´e interpretaci v´ ysledk˚ u. Tento uˇcebn´ı text si klade za c´ıl sezn´ amit ˇcten´aˇre se z´akladn´ımi principy navrhov´an´ı experiment˚ u a vyhodnocen´ı jejich v´ ysledk˚ u. Pro snazˇs´ı porozumˇen´ı se pˇredpokl´ad´a alespoˇ n ˇc´asteˇcn´a znalost z´akladn´ıch statistick´ ych pojm˚ u, jako jsou: n´ahodn´a veliˇcina, stochastick´a nez´avislost, rozdˇelen´ı pravdˇepodobnosti, distribuˇcn´ı funkce, hustota, stˇredn´ı hodnota, rozptyl a dalˇs´ı. Proto ˇ aˇri, kteˇr´ı tyto metody znaj´ı jej moje v prvn´ı kapitole zaˇrazeno Statistick´e repetitorium“. Cten´ ” hou klidnˇe pˇresloˇcit. Pˇr´ıklady v textu uveden´e jsou zpravidla zjednoduˇsen´e. D˚ uvodem je snaha o jejich lepˇs´ı a n´azornˇejˇs´ı v´ yklad. Skuteˇcn´e re´ aln´e u ´lohy b´ yvaj´ı ˇcasto mnohem sloˇzitˇejˇs´ı a jejich ˇreˇsen´ı pˇresahuje r´amec tohoto textu. Pro ˇreˇsen´ı nˇekter´ ych pˇr´ıklad˚ u jsme pouˇzili statistick´ y program MINITAB, kter´ y obsahuje ˇradu n´ astroj˚ u urˇcen´ ych pˇr´ımo pro DOE. Kromˇe tohoto programu existuje i ˇrada dalˇs´ıch, v´ıce ˇci m´enˇe sloˇzit´ ych softwarov´ ych produkt˚ u, umoˇzn ˇuj´ıc´ıch v podstatˇe tot´eˇz. Nejjednoduˇsˇs´ım n´astrojem pro vyhodnocen´ı v´ ysledk˚ u experimentu m˚ uˇze b´ yt i tabulkov´ y procesor typu MS Excel, kter´ y tak´e v nˇekter´ ych pˇr´ıpadech pouˇzijeme.
Kapitola 1
Z´ aklady navrhov´ an´ı experiment˚ u 1.1
Historie ˇ r´ızen´ı kvality
Stoj´ıme-li pˇred u ´lohou prov´est v´ ybˇer z nˇekolika stejn´ ych ˇci podobn´ ych v´ yrobk˚ u kter´e se nab´ızej´ı za stejnou ˇci podobnou cenu, rozhodneme se na z´akladˇe jejich kvality. Je tedy pˇrirozen´e, ˇze s rozvojem obchodu a hromadn´e v´ yroby se st´ale ˇcastˇeji objevuje pojem kvalita. Obsah tohoto pojmu je pˇritom velmi ˇsirok´ y a silnˇe z´ avis´ı na individualitˇe z´akazn´ıka. S nar˚ ustaj´ıc´ım mnoˇzstv´ım nab´ızen´eho zboˇz´ı vˇsak poˇzadavky na jeho kvalitu dost´avaj´ı st´ale v´ıce objektivn´ı charakter. V dneˇsn´ım pojet´ı je kvalita v´ yrobku charakterizov´ana souborem objektivnˇe mˇeˇriteln´ ych znak˚ u a je definov´ana v normˇe. To umoˇzn ˇuje jej´ı sledov´an´ı, kontrolu a ˇr´ızen´ı. Rozvoj pr˚ umyslov´e v´ yroby na konci 19. a poˇc´atku 20. stolet´ı pˇrin´aˇs´ı potˇrebu zajiˇstˇen´ı kvality v´ yroby ve velk´em“, tedy nikoli kvality jednotliv´ ych v´ yrobk˚ u pˇri kusov´e v´ yrobˇe, ale kvalitu ” velk´eho mnoˇzstv´ı v´ yrobk˚ u v s´eriov´e v´ yrobˇe. K dosaˇzen´ı kvalitn´ı v´ yroby vedly dvˇe cesty: jednak zajiˇstˇen´ı kvality technologick´ ymi prostˇredky a v´ ybˇerem materi´alu, jednak kontrola kvality, kter´a by vylouˇcila z produkce nevyhovuj´ıc´ı v´ yrobky. Druh´a cesta znamenala rozvoj takzvan´e statistick´e pˇrej´ımky“. ” Rozvoj statistick´ ych teori´ı pouˇziteln´ ych pro pr˚ umyslovou praxi pˇrinesl r˚ ust v´ yroby po prvn´ı svˇetov´e v´alce v minul´em stolet´ı. Americk´ y profesor W. A. Shewhart ve tˇric´at´ ych letech poloˇzil z´aklady kontroly v´ yrobn´ıch proces˚ u pomoc´ı statistick´ ych metod ve sv´e knize Statistical Method ” from the Viewpoint of Quality Control“. Druh´ y v´ yrazn´ y skok v rozvoji statistick´ ych n´astroj˚ u pro kontrolu kvality nastal v obdob´ı druh´e svˇetov´e v´alky a v ranˇe pov´aleˇcn´em obdob´ı pˇredevˇs´ım d´ıky zbrojn´ımu pr˚ umyslu. Pozornost v´ yrobc˚ u se soustˇredila na vlastn´ı v´ yrobu a technickou kontrolu vstup˚ u a v´ ystup˚ u. Od poloviny minul´eho stolet´ı zaˇcaly v´ yraznˇe nar˚ ustat poˇzadavky z´akazn´ık˚ u na v´ yrobky a 1
1.2. Historie DOE
2
jejich kvalitu. Bylo zˇrejm´e, ˇze v´ yrobek, kter´ y pouze pln´ı technologick´e parametry, nemus´ı b´ yt na trhu u ´spˇeˇsn´ y a ˇze z´ akazn´ıci zohledˇ nuj´ı i dalˇs´ı krit´eria jako hezk´ y vzhled, spolehlivost, u ´spornost, komfort pˇri uˇz´ıv´ an´ı apod. Souˇcasnˇe se stupˇ novaly poˇzadavky na prodejn´ı a poprodejn´ı servis a n´avazn´e sluˇzby. Novou situaci a klima na svˇetov´ ych trz´ıch plnˇe pochopili japonˇst´ı strat´egov´e a manaˇzeˇri. Ti jako prvn´ı docenili teorii W. E. Deminga o komplexn´ım pˇr´ıstupu k ˇr´ızen´ı kvality a s pomoc´ı jeho metod prok´ azali, ˇze toto ch´ap´an´ı kvality je nejen konkurenˇcn´ı v´ yhodou, ale i u ´ˇcinn´ ym n´astrojem na cestˇe k prosperitˇe. S v´ yvojem ˇr´ızen´ı kvality je spojena ˇrada v´ yznamn´ ych osobnost´ı, k nimˇz patˇr´ı Walter A. Shewhart, William E. Deming, Joseph M. Juran, Armand V. Feigenbaum, Kaoru Ishikawa, Yoshi Tsurumi, Philip B. Crosby.
1.2
Historie DOE
• Klasick´ y pˇr´ıstup - R. A. Fisher (20. l´eta 20. stolet´ı). N´avrh experiment˚ u (DOE) je zaloˇzen na statistick´ ych metod´ ach, studiu spoleˇcn´ ych efekt˚ u nˇekolika promˇenn´ ych vliv˚ u urˇcen´ım kombinace hodnot faktor˚ u pro optim´aln´ı v´ ysledek • Taguchiho pˇr´ıstup (40. l´eta 20. stolet´ı) standardizoval a zjednoduˇsil pouˇzit´ı technik DOE, navrhl koncept zlepˇsov´ an´ı kvality ve vˇsech f´az´ıch n´avrhu a v´ yroby • K v´ yznamn´emu rozˇs´ıˇren´ı metody DOE v USA a Evropˇe doˇslo aˇz v 80. letech 20. stolet´ı
3
Kap. 1: Z´aklady navrhov´an´ı experiment˚ u
1.3
Z´ akladn´ı pojmy
Aby nedoch´azelo k nedorozumˇen´ım a nepˇresn´ ym v´ yklad˚ um, zavedeme si nˇekolik z´akladn´ıch pojm˚ u, kter´e se v souvislosti s navrhov´ an´ım experiment˚ u pouˇz´ıvaj´ı. Tyto pojmy definuje i norma ˇ CSN ISO 3534-3 (viz [9]).
Proces je posloupnost operac´ı ˇci dˇej˚ u, kter´e systematicky pˇretv´aˇrej´ı vstupy na v´ ystupy. Podle ˇ normy CSN EN ISO 9000:2006 charakterizov´an jako soubor vz´ajemnˇe souvisej´ıc´ıch nebo vz´ajem” nˇe p˚ usob´ıc´ıch ˇcinnost´ı, kter´ y pˇremˇen ˇuje vstupy na v´ ystupy“. V´ yrobn´ı proces tedy pˇredstavuje posloupnost po sobˇe jdouc´ıch ˇcinnost´ı, kde se snaˇz´ıme za pomoci lidsk´eho zdroje, technick´ ych prostˇredk˚ u a technologie vytvoˇrit produkt nebo sluˇzbu, t´ım ˇze pˇremˇen ˇujeme vstupn´ı prvky na v´ ystupn´ı produkty. V´ yrobn´ı proces m˚ uˇzeme tak´e definovat jako ˇcinnost, pˇri n´ıˇz se uskuteˇcn ˇuje soubor pracovn´ıch, technologick´ ych a pˇr´ırodn´ıch proces˚ u, kter´ y mˇen´ı tvar a jakost vstupn´ıho materi´alu.
Experiment je test nebo s´erie test˚ u (pokus˚ u), proveden´a za u ´ˇcelem zv´ yˇsen´ı kvality produktu nebo procesu, pˇr´ıpadnˇe zv´ yˇsen´ı jejich efektivity. Slouˇz´ı ke • stanoven´ı charakteristik procesu a jeho optimalizace • vyhodnocen´ı vlastnost´ı materi´ al˚ u • n´avrh a v´ yvoj produkt˚ u • stanoven´ı tolerance komponent a vstupn´ıch veliˇcin Vˇsechny experimenty jsou navrˇzen´e experimenty, nˇekter´e dobˇre, jin´e ˇspatnˇe.
N´ avrh experimentu • zkracuje dobu pro n´ avrh a v´ yvoj nov´ ych produkt˚ u • zlepˇsuje fungov´ an´ı st´ avaj´ıc´ıch proces˚ u • zvyˇsuje spolehlivost a zlepˇsuje kvalitu v´ yrobk˚ u • zvyˇsuje robustnost v´ yrobk˚ u a proces˚ u • umoˇzn ˇuje vyhodnocen´ı r˚ uzn´ ych variant, v´ ybˇer komponent, nastaven´ı parametr˚ u a syst´emov´ ych toleranc´ı
1.3. Z´ akladn´ı pojmy
4
Odezva – v´ ystupn´ı veliˇcina, kter´ a je mˇeˇriteln´a, zpravidla spojit´a. N´ ahodn´ y vliv – nezn´ ame jeho pˇr´ıˇciny, nelze jej odstranit. Zp˚ usobuje variabilitu, kterou lze mˇeˇrit (experiment´ aln´ı chyba) a lze jej pˇredv´ıdat. Snaha je co nejv´ıce jej sn´ıˇzit. Systematick´ y vliv – je zp˚ usoben zn´am´ ymi vlivy (vymeziteln´ ymi pˇr´ıˇcinami). Projevuje se napˇr´ıklad trendem, periodicitou, posunut´ım. Snaˇz´ıme se jej popsat a kvantifikovat. Faktory – vstupn´ı veliˇciny, kter´e mohou b´ yt kvalitativn´ı (kategori´aln´ı) nebo kvantitativn´ı (diskr´etn´ı, spojit´e). Rozliˇsujeme hlavn´ı, vedlejˇs´ı a blokov´e. Interakce – souˇcasn´e p˚ usoben´ı nˇekolika (alespoˇ n dvou) faktor˚ u. Replikace – opakov´ an´ı zkouˇsek za (pˇribliˇznˇe) stejn´ ych podm´ınek (´ urovn´ı faktor˚ u). Umoˇzn ˇuj´ı mˇeˇrit n´ ahodnou variabilitu a oddˇelit ji od variability celkov´e. Zn´ ahodnˇ en´ı – stanoven´ı poˇrad´ı zkouˇsek podle n´ahodn´eho zam´ıch´an´ı“. Do jist´e m´ıry m˚ uˇze ” eliminovat vedlejˇs´ı vlivy a zajiˇst’uje vyˇsˇs´ı m´ıru nez´avislosti“ jednotliv´ ych pokus˚ u. ” Uspoˇ r´ ad´ an´ı do blok˚ u – slouˇz´ı ke sniˇzov´an´ı n´ahodn´e variability (variability n´ahodn´e sloˇzky). V r´amci bloku prob´ıhaj´ı zkouˇsky za pˇribliˇznˇe stejn´ ych experiment´aln´ıch podm´ınek (ale pˇri r˚ uzn´ ych kombinac´ıch u ´rovn´ı faktor˚ u). Blok ˇcasto pˇredstavuje jednu repliku experimentu.
5
Kap. 1: Z´aklady navrhov´an´ı experiment˚ u
1.4
N´ avrh a anal´ yza experimentu v pˇ eti kroc´ıch
Hlavn´ım c´ılem experimentu je odhalen´ı z´ avislost´ı a vztah˚ u mezi r˚ uzn´ ymi veliˇcinami, pˇr´ıpadnˇe optim´aln´ı (z urˇcit´eho hlediska) nastaven´ı vstupn´ıch parametr˚ u procesu tak, aby jeho v´ ystupy splˇ novaly poˇzadovan´ı kriteria. Poˇzadavek na proveden´ı experimentu obvykle pˇrich´az´ı z vlastn´ı v´ yroby, kde je potˇreba vyˇreˇsit probl´emy spojen´e s nestabilitou, sn´ıˇzenou kvalitou v´ yrobk˚ u, potˇrebou prov´est optimalizaci, nastaven´ı parametr˚ u a dalˇs´ı. Naˇs´ım c´ılem je obvykle nal´ezt pˇr´ıˇciny
Úvod do plánování experimentů
neshod nebo zjistit optim´ aln´ı nastaven´ı v´ yrobn´ıch podm´ınek. Poˇzadavky mohou pˇrich´azet tak´e z oddˇelen´ı marketingu ˇci hodnocen´ı kvality. N´avrh a anal´ yzu experimentu obvykle prov´ad´ıme v pˇeti na sebe navazuj´ıc´ıch kroc´ıch: • Anal´ yza procesu
Vymezení faktorůů, analýza vlivůů a závislostí
• Analýza procesu
Popis provedení experimentůů
• Návrh experimentu
Vedení experimentůů
• Provedení zkoušek
• N´avrh experimentu • Proveden´ı zkouˇsek • Anal´ yza v´ ysledk˚ u • Z´avˇery
Predikce procesu na základěě analýzy výsledkůů Verifikace, potvrzení (ověěřřovací experimenty)
čtvrtek, 23. února 12 Tyto kroky by mˇely b´ yt provedeny vˇzdy vˇsechny
ˇ a v dan´em poˇrad´ı. Casto se tyto kroky cyklicky opa- Obr. 1.1: N´avrh a anal´yza experimentu kuj´ı a experiment se prov´ ad´ı v´ıcestupˇ novˇe. V prvn´ım v pˇeti kroc´ıch. kole provedeme hrubou anal´ yzu a vyˇclen´ıme nejvlivnˇejˇs´ı faktory a pozdˇeji n´ avrh zjemˇ nujeme upˇresˇ nov´an´ım okruhu vlivn´ ych faktor˚ u a hled´an´ım jemnˇejˇs´ıch z´avislost´ı.
1.4.1
Anal´ yza procesu
N´avrh a anal´ yza experiment˚ u spoˇc´ıv´ a v pochopen´ı vlivu r˚ uzn´ ych promˇenn´ ych na ostatn´ı promˇenn´e. C´ılem je nal´ezt vztah mezi pˇr´ıˇcinami a n´ asledkem, v matematick´e terminologii je to vztah mezi nez´avisl´ ymi promˇenn´ ymi a z´ avislou promˇennou, kter´a n´as zaj´ım´a. Z´avisle promˇennou zde budeme naz´ yvat odezvou a nez´ avisle promˇenn´e se naz´ yvaj´ı faktory. K urˇcen´ı nejvhodnˇejˇs´ı odezvy a identifikaci moˇzn´ ych vlivn´ ych faktor˚ u by mˇel b´ yt vytvoˇren t´ ym sloˇzen´ y z odborn´ık˚ u v r˚ uzn´ ych oborech, t´ ykaj´ıc´ıch se produktu nebo procesu. T´ ymov´ y pˇr´ıstup podporuje synergii, kter´a d´av´a bohatˇs´ı soubor podnˇet˚ u ke studiu, a tedy i komplexnˇejˇs´ı experiment.
• Analýza výsledkůů
• Závěěry
•
Definice procesu
• Volba odezvy
1.4. N´ avrh a anal´ yza experimentu v pˇeti kroc´ıch
6
vstupy
proces
výstupy
odezvy
faktory
kontrolovatelné parametry
nekontrolovatelné parametry čtvrtek, 23. února 12
Obr. 1.2: Schematick´e zn´azornˇen´ı v´ yrobn´ıho procesu.
K identifikaci d˚ uleˇzit´ ych faktor˚ u, kter´e ovlivˇ nuj´ı syst´em se pouˇz´ıvaj´ı takzvan´e screeningov´e experimenty. Tyto pokusy jsou prov´adˇeny na z´akladˇe v´ yzkumu a s vyuˇzit´ım pˇredchoz´ı znalosti syst´emu. Z velk´e skupiny potenci´ aln´ıch faktor˚ u vyˇcleˇ nuj´ı d˚ uleˇzit´e faktory a zamˇeˇruj´ı pozornost na kl´ıˇcov´e faktory, kter´e vyˇzaduj´ı dalˇs´ı podrobnou anal´ yzu.
1.4.2
N´ avrh experimentu
Pr˚ ubˇeh experimentu je d˚ uleˇzit´e peˇclivˇe napl´anovat jeˇstˇe pˇred zaˇc´atkem vlastn´ıho testov´an´ı a sbˇerem dat. V t´eto f´ azi je tˇreba m´ıt zformulovan´e d˚ ukladn´e a pˇresn´e urˇcen´ı c´ıl˚ u, jak´a je tˇreba prov´est vyˇsetˇren´ı, vyhodnocen´ı potˇrebn´eho ˇcasu a zdroj˚ u k dosaˇzen´ı c´ıle a integrovat pˇredchoz´ı znalosti k proveden´ı vlastn´ıch experiment˚ u. Peˇclivˇe pl´anovan´e experimenty vˇzdy vedou k lepˇs´ımu pochopen´ı produktu nebo procesu. Experimenty prob´ıhaj´ı pˇri r˚ uzn´ ych hodnot´ach faktor˚ u, tzv. u ´rovn´ıch. Pˇri kaˇzd´e proveden´e zkouˇsce budeme sledovat odezvu na nˇejakou, ˇcasto pˇredem stanovenou, kombinaci u ´rovn´ı sledovan´ ych faktor˚ u. Tyto zvolen´e kombinace u ´rovn´ı sledovan´ ych faktor˚ u se oznaˇcuj´ı jako oˇsetˇren´ı“. ” Pokud je pro kaˇzd´e oˇsetˇren´ı proveden stejn´ y poˇcet pozorov´an´ı odezvov´e veliˇciny, oznaˇcujeme n´avrh experimentu jako homogenn´ı. Opakovan´a pozorov´an´ı pˇri stejn´em oˇsetˇren´ı jsou potom oznaˇcov´ ana jako replikace. Poˇcet oˇsetˇren´ı experimentu je stanoven na z´akladˇe poˇctu u ´rovn´ı sledovan´eho faktoru v experimentu. Napˇr´ıklad, pokud prov´ ad´ıme experiment, v nˇemˇz sledujeme dva faktory, kaˇzd´ y s koneˇcn´ ym poˇctem u ´rovn´ı. Bude-li m´ıt prvn´ı faktor r u ´rovn´ı a druh´ ysu ´rovn´ı, potom bude zˇrejmˇe potˇreba prov´est pozorov´ an´ı pˇri r × s kombinac´ıch. Pokud jsou pozorov´any vˇsechny moˇzn´e kombinace u ´rovn´ı faktor˚ u, budeme experiment oznaˇcovat jako u ´pln´y faktori´ aln´ı. Pokud pozorujeme pouze nˇekter´e kombinace u ´rovn´ı faktor˚ u, ˇrekneme ˇze experiment je d´ılˇc´ı faktori´ aln´ı. V pˇr´ıpadˇe u ´pln´ ych faktori´ aln´ıch n´ avrh˚ u experiment˚ u je tˇreba provˇeˇrit vˇsechny faktory a jejich vz´ajemn´e interakce, zat´ımco u d´ılˇc´ıch faktori´ aln´ıch n´ avrh˚ u experiment˚ u nˇekter´e nebo vˇsechny interakce chyb´ı, protoˇze ne vˇsechny kombinace jsou pozorov´any. D´ılˇc´ı faktori´aln´ı n´avrhy se ˇcasto pouˇz´ıvaj´ı jako screenin-
7
Kap. 1: Z´aklady navrhov´an´ı experiment˚ u
gov´e experimenty na poˇc´ atku experimentov´an´ı. V tomto st´adiu m´ame na z´akladˇe u ´vodn´ı anal´ yzy procesu vyˇclenˇen´ y velk´ y poˇcet moˇzn´ ych vliv˚ u na odezvu a mus´ıme rozhodnout o v´ yznamnosti jejich vlivu. Pˇritom oˇcek´ av´ ame, ˇze vˇetˇsina hlavn´ıch efekt˚ u a jejich interakc´ı bude nev´ yznamn´a a pro dalˇs´ı experimenty je budeme moci vylouˇcit. Obecnˇe lze ˇr´ıci, ˇze vˇetˇs´ı poˇcet faktor˚ u l´epe popisuje model a m˚ uˇzeme zkoumat vliv v´ıce interakc´ı, na druhou stranu se n´ avrh komplikuje velk´ ym mnoˇzstv´ım mˇeˇren´ı kter´a vedou ke sloˇzit´e a nepˇrehledn´e anal´ yze. ˇ Norma CSN ISO 3534/3 (Navrhov´ an´ı experiment˚ u, 1993) rozliˇ suje tyto z´ akladn´ı typy experiment˚ u: • Jednofaktorov´e experimenty ´ • Upln´ e v´ıcefaktori´ aln´ı experimenty (zn´ahodnˇen´ı, uspoˇr´ad´an´ı do blok˚ u) • Sn´ıˇzen´ı poˇctu zkouˇsek (latinsk´e, ˇreckolatinsk´e ˇctverce pro vylouˇcen´ı vlivu ruˇsiv´ ych faktor˚ u) • D´ılˇc´ı faktori´ aln´ı n´ avrh (poˇc´ ateˇcn´ı vyhled´av´an´ı vlivn´ ych faktor˚ u) • Hierarchick´ y n´ avrh (vyhled´ an´ı nejvˇetˇs´ıch zdroj˚ u variability) • Optim´aln´ı n´ avrhy (optim´ aln´ı odezvov´e plochy) • Taguchiho ortogon´ aln´ı n´ avrhy (robustn´ı n´avrhy) Jednofaktorov´ e experimenty To jsou n´avrhy, kde je pˇredmˇetem ˇsetˇren´ı pouze jedin´ y faktor a c´ılem je urˇcit, zda se odezva liˇs´ı v´ yznamnˇe pˇri r˚ uzn´ ych u ´rovn´ıch tohoto faktoru. Faktor m˚ uˇze b´ yt bud’ kvalitativn´ı nebo kvantitativn´ı. V pˇr´ıpadˇe kvalitativn´ıch faktor˚ u (napˇr. r˚ uzn´ı dodavatel´e, r˚ uzn´e materi´aly, apod.) nen´ı moˇzn´a extrapolace a testov´ an´ı se prov´ad´ı na jednotliv´ ych u ´rovn´ıch. Vliv na odezvu m˚ uˇze b´ yt urˇcen pouze pro tyto u ´rovnˇe. Na druhou stranu, je-li faktorem kvantitativn´ı veliˇcina (jako je teplota, napˇet´ı, zat´ıˇzen´ı, atd.), pro v´ ypoˇcet efekt˚ u je zpravidla k dispozici vˇzdy dostatek u ´daj˚ u, nebot’ lze vyuˇz´ıt odhady a pˇredpovˇedi. K vyhodnocen´ı lze pouˇz´ıt modely v´ıcen´asobn´e line´arn´ı regrese a dalˇs´ı statistick´e metody. ´ Upln´ e v´ıcefaktori´ aln´ı n´ avrhy Ve u ´pln´em v´ıcefaktori´ aln´ım experimentu je pˇri kaˇzd´e zkouˇsce uvaˇzov´an vliv nˇekolika faktor˚ u souˇcasnˇe. Stejnˇe jako v jednofaktorov´em experimentu, i zde rozliˇsujeme kvalitativn´ı a kvantitativn´ı faktory. C´ılem tˇechto n´ avrh˚ u je identifikovat faktory, kter´e maj´ı v´ yznamn´ y vliv na odezvu,
1.4. N´ avrh a anal´ yza experimentu v pˇeti kroc´ıch
8
stejnˇe jako zkoumat vliv vˇsech jejich interakc´ı (v z´avislosti na pouˇzit´e konstrukci experimentu). Kaˇzd´ y kaˇzd´ y faktor m˚ uˇze m´ıt r˚ uzn´ y poˇcet u ´rovn´ı.
Dvou´ urovˇ nov´ eu ´ pln´ e faktori´ aln´ı n´ avrhy Z hlediska volby poˇctu u ´rovn´ı sledovan´ ych faktor˚ u je nejjednoduˇsˇs´ım (a tak´e nejˇcastˇejˇs´ım) pˇr´ıpadem dvou´ urovˇ nov´ y experiment, kdy uvaˇzovan´e faktory sledujeme pouze ve dvou u ´rovn´ıch. Takov´ ymito experimenty jsme vˇsak schopni odhalit pouze line´arn´ı z´avislosti, ale uˇz ne z´avislosti sloˇzitˇejˇs´ı. M´ ame-li pochybnosti o line´arn´ı z´avislosti odezvy a faktoru, vol´ıme tˇri u ´rovnˇe, vyj´ımeˇcnˇe v´ıce, nebot’ potom se n´ avrh st´ av´ a velmi komplikovan´ y a vyˇzaduje velmi mnoho mˇeˇren´ı.
D´ılˇ c´ı faktori´ alov´ e experimenty Zat´ımco v u ´pln´ ych experimentech je pˇri vˇetˇs´ım poˇctu faktor˚ u a jejich u ´rovn´ı poˇcet sledovan´ ych kombinac´ı zpravidla vysok´ y, tyto d´ılˇc´ı n´avrhy dovoluj´ı sn´ıˇzit poˇcet kombinac´ı u ´rovn´ı faktor˚ u na zlomek poˇctu, potˇrebn´eho pˇri u ´pln´em n´avrhu. V takov´ ych pˇr´ıpadech vˇsak nejsme schopni vyhodnotit efekty vˇsech moˇzn´ ych interakc´ı.
Taguchiho ortogon´ aln´ı n´ avrhy Taguchiho ortogon´ aln´ı experimenty jsou relativnˇe jednoduch´e konstrukce. Pouˇz´ıvaj´ı se k odhadu hlavn´ıch efekt˚ u s pouˇzit´ım jen nˇekolika kombinac´ı u ´rovn´ı faktor˚ u. Tyto n´avrhy jsou urˇceny jak pro dvou´ urovˇ nov´e faktori´ aln´ı experimenty, tak i pro prozkoum´an´ı hlavn´ıch u ´ˇcink˚ u faktor˚ u s v´ıce neˇz dvˇemi u ´rovnˇemi bez interakc´ı. Taguchiho postup umoˇzn ˇuje nastaven´ı tˇechto faktor˚ u k dosaˇzen´ı poˇzadovan´eho c´ıle. V z´avislosti na produktu nebo procesu, kter´ y je pˇredmˇetem ˇsetˇren´ı tohoto c´ıle m˚ uˇze b´ yt bud’ maximalizovat, minimalizovat nebo dosaˇzen´ı c´ılov´e hodnoty odezvy.
Optim´ aln´ı odezvov´ e plochy Jedn´a se o speci´ aln´ı n´ avrhy, kter´e se pouˇz´ıvaj´ı k nastaven´ı u ´rovn´ı faktor˚ u pro dosaˇzen´ı optim´aln´ı hodnoty odezvy.
Spolehlivostn´ı DOE Jedn´a se o zvl´ aˇstn´ı kategorii, zahrnuj´ıc´ı klasick´e typy experiment˚ u, jako jsou napˇr´ıklad dvou´ urovˇ nov´e experimenty, v kombinaci se spolehlivostn´ımi metodami. C´ılem je zkoumat vliv r˚ uzn´ ych faktor˚ u na ˇzivotnost pˇr´ıstroje. Ve spolehlivostn´ım DOE je odezvou d´elka ˇzivota zkouman´eho objektu
9
Kap. 1: Z´aklady navrhov´an´ı experiment˚ u
(napˇr. vˇek, m´ıle, cykly, atd.). Data mohou obsahovat cenzorovan´a pozorov´an´ı (z´avˇesy, interval data).
1.4.3
Proveden´ı zkouˇ sek
Sebelepˇs´ı n´avrh je bez peˇcliv´eho a d˚ usledn´eho proveden´ı vlastn´ıch zkouˇsek a mˇeˇren´ı samo´ uˇceln´ y. Pro jeho u ´spˇeˇsnou realizaci je potˇreba vˇenovat velkou pozornost pˇredevˇs´ım • dodrˇzen´ı zachov´ an´ı stejn´ ych podm´ınek okoln´ıho prostˇred´ı (mˇeˇren´ı v bloc´ıch), • pˇresn´e nastaven´ı kombinac´ı u ´rovn´ı sledovan´ ych faktor˚ u, • respektovat navrˇzen´e zn´ ahodnˇen´ı v experimentu, i za cenu jist´ ych komplikac´ı (napˇr´ıklad pˇri opakovan´em nastavov´ an´ı u ´rovn´ı nˇekter´eho z faktor˚ u), • maxim´aln´ımu vylouˇcen´ı ˇsumov´ ych faktor˚ u, jako je napˇr´ıklad vnˇejˇs´ı teplota, denn´ı doba, lidsk´ y faktor a dalˇs´ı. Zvl´aˇstˇe pˇri velk´em poˇctu mˇeˇren´ı je ˇcasto nemoˇzn´e prov´est vˇsechna v jednom dni a za naprosto stejn´ ych podm´ınek. Pokud n´ avrh experimentu s touto situac´ı explicitnˇe nepoˇc´ıt´a (napˇr´ıklad rozdˇelen´ım mˇeˇren´ı do blok˚ u), je tˇreba vˇenovat velkou pozornost zachov´an´ı alespoˇ n pˇribliˇznˇe stejn´ ych podm´ınek. D˚ uleˇzit´ a je randomizace. Ta m´a za c´ıl pr´avˇe minimalizaci vlivu nesledovan´ ych potenci´aln´ıch faktor˚ u, kter´e nav´ıc ˇcasto nem˚ uˇzeme ani ovlivnit. Randomizace neboli zn´ahodnˇen´ı stanov´ı pˇresnˇe poˇrad´ı mˇeˇren´ı a mus´ı b´ yt souˇc´ast´ı pl´anu experimentu. Samozˇrejmost´ı je dodrˇzen´ı z´ akladn´ıch metrologick´ ych z´asad. Sem patˇr´ı aplikace anal´ yzy metrologick´eho syst´emu (MSA) pˇred zah´ ajen´ım vlastn´ıch zkouˇsek. T´ımto krokem zajist´ıme, ˇze metrologick´e prostˇredky i uˇzit´e metody mˇeˇren´ı jsou vhodn´e pro mˇeˇren´ı sledovan´ ych faktor˚ u a odezvy v´ yrobn´ıho procesu. 1. Ovˇeˇr´ıme, zda veˇsker´e metrologick´e prostˇredky jsou ˇr´adnˇe vedeny v r´amci metrologick´eho ˇr´adu organizace. T´ım m´ ame na mysli, ˇze metrologick´e prostˇredky podl´ehaj´ı ˇr´adn´e evidenci a periodick´e kontrole, v jej´ımˇz pr˚ ubˇehu jsou ovˇeˇrov´any, respektive rekalibrov´any. 2. Dalˇs´ım krokem je ovˇeˇren´ı syst´emu mˇeˇren´ı. V pr˚ ubˇehu tohoto kroku ovˇeˇrujeme, zda pˇri pouˇzit´ı zvolen´eho mˇeˇridla a metody mˇeˇren´ı v konkr´etn´ım prostˇred´ı pro r˚ uzn´e oper´atory z´ısk´av´ame namˇeˇren´e hodnoty s minim´aln´ı odchylkou od hodnoty konvenˇcnˇe spr´avn´e. Metodika MSA ovˇeˇruje r˚ uzn´e vlivy na variabilitu mˇeˇren´ı a v nˇekter´ ych pˇr´ıpadech dok´aˇze popsat pˇr´ıspˇevky jednotliv´ ych sloˇzek variability. Tyto sloˇzky obvykle dˇel´ıme na pˇr´ıspˇevek oper´atora, mˇeˇridla, metody a prostˇred´ı.
1.4. N´ avrh a anal´ yza experimentu v pˇeti kroc´ıch
1.4.4
10
Anal´ yza v´ ysledk˚ u
Vzhledem k tomu, ˇze hodnoty odezvy pˇri r˚ uzn´ ych kombinac´ıch u ´rovn´ı sledovan´ ych faktor˚ u nikdy dopˇredu nezn´ ame, povaˇzujeme odezvu vˇzdy za n´ahodnou veliˇcinu. Jednotliv´a mˇeˇren´ı si m˚ uˇzeme pˇredstavit jako jak´ ysi n´ ahodn´ y v´ ybˇer“ z moˇzn´ ych realizac´ı. K anal´ yze v´ ysledk˚ u mˇeˇren´ı potom ” pouˇz´ıv´ ame metody matematick´e statistiky. Tyto metody je tˇreba volit jednak v z´avislosti na charakteru odezvy, jednak na jej´ım pravdˇepodobnostn´ım chov´an´ı. Zde m´ame na mysli pˇredevˇs´ım jej´ı pˇredpokl´ adan´e rozdˇelen´ı pravdˇepodobnosti. Zjednoduˇsenˇe lze volbu metody pro vyhodnocen´ı v´ ysledk˚ u navrˇzen´ ych experiment˚ u zobrazit v rozhodovac´ım stromˇe (viz Obr. 1.3):
kvalitativní
odezva
chí-kvadrát test homogenity, kontingenční tabulka
kvantitativní
ano
ano
regrese, t-test, ANOVA
normální
spojitá
ne
ne
GLIM, K-W
regrese, Wilcoxon Kruskal-Wallis Friedman
Obr. 1.3: Volba metody pro vyhodnocen´ı v´ ysledk˚ u mˇeˇren´ı v experimentu.
Stanoven´ı metody pro anal´ yzu v´ ysledk˚ u mˇeˇren´ı je souˇc´ast´ı n´avrhu experimentu. Pro n´avrh´aˇre experimentu a pro experiment´ atora je d˚ uleˇzit´e zn´at tyto metody a pˇredevˇs´ım pˇredpoklady pro jejich pouˇzit´ı. Z´ aroveˇ n je d˚ uleˇzit´e uvˇedomit si, co znamen´a poruˇsen´ı tˇechto pˇredpoklad˚ u pro koneˇcn´e z´ avˇery. Z´ akladn´ı pˇrehled nˇekter´ ych matematicko-statistick´ ych metod je pˇredmˇetem jin´eho kurzu a zde je uveden v pˇr´ıloze. Aplikaci tˇechto metod zpravidla prov´ad´ıme prostˇrednictv´ım poˇc´ıtaˇcov´eho programu, coˇz ovˇsem neznamen´a, ˇze nemus´ıme tˇetmo metod´am rozumˇet a zn´at jejich principy. Naopak, mechanick´e pouˇz´ıv´an´ı softwarov´ ych prostˇredk˚ u bez znalosti v nich obsaˇzen´ ych metod je velmi nebezpeˇcn´e“ a m˚ uˇze b´ yt zav´adˇej´ıc´ı. Nav´ıc, tyto znalosti uplatn´ıme pˇri interpre” taci v´ ysledk˚ u.
11
1.4.5
Kap. 1: Z´aklady navrhov´an´ı experiment˚ u
Z´ avˇ ery
Tato posledn´ı f´ aze zahrnuje potvrzen´ı nejlepˇs´ıho nastaven´ı faktor˚ u. M˚ uˇze pˇredstavovat nˇekolik navazuj´ıc´ıch experiment˚ u pro potvrzen´ı, ˇze syst´em funguje podle pˇr´an´ı a vˇsechny c´ıle byly splnˇeny.
1.4. N´ avrh a anal´ yza experimentu v pˇeti kroc´ıch
12
Kapitola 2
Stochastick´ e repetitorium . . .
Jednou ze z´akladn´ıch vlastnost´ı pˇr´ırody a svˇeta kolem n´as je variabilita. Variabilita zp˚ usobuje, ˇze provedeme-li dvakr´ at po sobˇe stejnou ˇcinnost, pokaˇzd´e bude jej´ı v´ ysledek trochu jin´ y. Dokonce budeme-li pozorovat opakovanˇe tent´ yˇz jev, dostaneme odliˇsn´e v´ ysledky. Odchylky se vyskytuj´ı v pˇr´ırodˇe, at’ uˇz jde o pevnost v tahu urˇcit´eho v´ yrobku z oceli, obsah kofeinu v energetick´ ych n´apoj´ıch, nebo vzd´ alenost, kterou uraz´ı vaˇse vozidlo za den. Variabilitu lze tak´e zaznamenat pˇri mˇeˇren´ı r˚ uzn´ ych pr˚ ubˇeh˚ u procesu, prob´ıhaj´ıc´ıch za stejn´ ych podm´ınek, pˇri stejnˇe nastaven´ ych parametrech a za stejn´eho p˚ usoben´ı vnˇejˇs´ıch faktor˚ u. Pˇrirozen´e zmˇeny, kter´e se vyskytuj´ı v procesu, pˇrestoˇze jsou vˇsechny podm´ınky zachov´ any na stejn´e u ´rovni, ˇcasto naz´ yv´ame n´ ahodn´ym ˇsumem. Pˇri prov´adˇen´ı experiment˚ u, pˇri nichˇz zkoum´ame vliv r˚ uzn´ ych faktor˚ u na proces, je d˚ uleˇzit´e dok´azat odliˇsit zmˇeny v procesu zp˚ usoben´e tˇemito faktory od zmˇen zp˚ usoben´ ych n´ahodn´ ym ˇsumem. K tomuto u ´ˇcelu lze pouˇz´ıt ˇradu statistick´ ych metod. Proto je i v t´eto uˇcebnici vˇenov´ana velk´a ˇc´ast pr´avˇe n´ ahodn´ ym veliˇcin´ am, pravdˇepodobnostn´ımu rozloˇzen´ı a statistick´ ym metod´am testov´an´ı hypot´ez. Je d˚ uleˇzit´e z´ıskat jasnou pˇredstavu o pravdˇepodobnostn´ım chov´an´ı sledovamn´ ych veliˇcin (faktor˚ u), abychom mohli urˇcit, zda jejich vliv na odezvu je v´ yznamn´ y ˇci nikoliv. Proto klademe d˚ uraz na testov´ an´ı hypot´ez kter´e najde pˇr´ım´e pouˇzit´ı pˇri anal´ yze a vyhodnocen´ı navrˇzen´ ych experiment˚ u. Pˇri vyhodnocov´ an´ı zp˚ usobu ovlivnˇen´ı odezvy sledovan´ ymi faktory a kvantifikaci tohoto vlivu se uplatn´ı metody regresn´ı anal´ yzy, kter´a je tak´e souˇc´ast´ı tohoto repetitoria. 13
2.1. N´ ahodn´ a veliˇcina
2.1 2.1.1
14
N´ ahodn´ a veliˇ cina Rozdˇ elen´ı n´ ahodn´ e veliˇ ciny
Pod pojmem (re´ aln´ a) n´ ahodn´ a veliˇ cina budeme rozumˇet re´alnou veliˇcinu X, kterou jsme schopni pozorovat nebo mˇeˇrit, ale jej´ıˇz hodnoty nejsme schopni urˇcit pˇred konkr´etn´ım mˇeˇren´ım ˇci pozorov´ an´ım. V jist´em smyslu si n´ahodnou veliˇcinu m˚ uˇzeme pˇredstavovat jako ˇc´ıselnou reprezentaci v´ ysledk˚ u n´ ahodn´eho pokusu. Pˇri aplikaci matematicko-statistick´ ych metod rozliˇsujeme mezi vlastn´ı n´ ahodnou veliˇcinou, kterou zpravidla oznaˇcujeme velk´ ymi p´ısmeny a jej´ımi realizacemi, kter´e oznaˇcujeme obvykle mal´ ymi p´ısmeny. Hodnoty n´ahodn´e veliˇciny X nezn´ame a pouze o nich v´ıme, ˇze leˇz´ı v nˇejak´e zn´ am´e mnoˇzinˇe, zat´ımco jej´ı realizace x jsou konkr´etn´ı namˇeˇren´e ˇci napozorovan´e hodnoty. Pr´ ace s n´ahodn´ ymi veliˇcinami se tak v´ yraznˇe odliˇsuje od pr´ace s matematick´ ymi funkcemi jako je sinus, exponenciela nebo mocnina. Na rozd´ıl od matematick´ ych funkc´ı nelze napˇr´ıklad nakreslit graf n´ahodn´e veliˇciny. Nelze stanovit jej´ı pr˚ ubˇeh nebo limitu. Lze pouze stanovit jej´ı pravdˇ epodobnostn´ı charakteristiky. Budeme-li n´ ahodnou veliˇcinu mˇeˇrit ˇci pozorovat opakovanˇe za pˇribliˇznˇe stejn´ ych podm´ınek, m˚ uˇze tato nab´ yvat r˚ uzn´ ych hodnot re´aln´ ych ˇc´ısel. M´ıru oˇcek´av´an´ı, ˇze hodnota n´ahodn´e veliˇciny bude leˇzet v intervalu I, naz´ yv´ ame pravdˇepodobnost´ı tohoto intervalu a budeme ji zapisovat formul´ı P (X ∈ I). Pravdˇepodobnost splˇ nuje nˇekolik z´akladn´ıch pravidel, takzvan´ ych axiom˚ u: • P (X ∈ ∅) = 0, kde ∅ je pr´ azdn´a mnoˇzina, • Jsou-li A a B dva disjunktn´ı intervaly, potom P (X ∈ A ∪ B) = P (X ∈ A) + P (X ∈ B), • P (X ∈ AC ) = 1 − P (X ∈ A), kde AC je doplnˇek intervalu A v mnoˇzinˇe re´aln´ ych ˇc´ısel.
Uvaˇzujme dvˇe n´ ahodn´e veliˇciny X a Y . Je-li P (Y = y) > 0 pro nˇejak´e y ∈ R, potom v´ yraz
P (X = x | Y = y) =
P (X = x ∧ Y = y) P (Y = y)
nazveme podm´ınˇenou pravdˇepodobnost´ı toho, ˇze veliˇcina X nabyde hodnoty x za podm´ınky, ˇze veliˇcina Y nabyla hodnoty y. Pomoc´ı podm´ınˇen´e pravdˇepodobnosti definujeme tzv. stochastickou nez´ avislost dvou n´ ahodn´ ych veliˇcin: veliˇciny X a Y jsou stochasticky nez´avisl´e pr´avˇe kdyˇz pro libovoln´e hodnoty x, y ∈ R plat´ı P (X = x ∧ Y = y) = P (X = x).P (Y = y). Stochastick´ a nez´ avislost n´ ahodn´ ych veliˇcin je d˚ uleˇzitou podm´ınkou ˇrady matematicko-statistick´ ych metod a postup˚ u. Jej´ı diagnostika vˇsak b´ yv´a ˇcasto velmi sloˇzit´a a obt´ıˇzn´a.
15
Kap. 2: Stochastick´e repetitorium . . . Funkce F (x) definovan´ a vztahem
F (x) = P (X ≤ x)
se naz´ yv´a distribuˇ cn´ı funkce n´ ahodn´e veliˇciny X. (Tento z´apis je zjednoduˇsen vynech´an´ım sloˇzen´e z´avorky u jevu {X ≤ x}.) Z´ akladn´ı vlastnosti t´eto funkce jsou shrnuty v n´asleduj´ıc´ım v´ yˇctu: (1) 0 ≤ F (x) ≤ 1 pro kaˇzd´e x ∈ R, (2) limx→−∞ F (x) = 0, lim x → ∞F (x) = 1, (3) limh→0+ F (x + h) = F (x), tj. F je zprava spojit´a1 , (4) je-li x1 ≤ x2 , potom F (x1 ) ≤ F (x2 ), tj. F je neklesaj´ıc´ı. Tyto vlastnosti jsou t´eˇz postaˇcuj´ıc´ı pro to, aby dan´a funkce F (x) byla distribuˇcn´ı funkc´ı ˇ nˇejak´e n´ahodn´e veliˇciny. Casto se pouˇz´ıv´ a dalˇs´ı vlastnost: pro re´aln´a ˇc´ısla a ≤ b plat´ı
P (a < X ≤ b) = P ({X ≤ b} ∩ {X > a}) = P ({X ≤ b} − {X ≤ a}) = P (X ≤ b) − P (x ≤ a) = F (b) − F (a).
Distribuˇcn´ı funkce F (x) se naz´ yv´ a diskr´ etn´ı, existuje-li koneˇcn´a nebo spoˇcetn´a posloupnost P bod˚ u {xi } a posloupnost kladn´ ych ˇc´ısel pi splˇ nuj´ıc´ıch i pi = 1 takov´e, ˇze X
F (x) =
pi
i:xi ≤x
pro libovoln´e re´ aln´e ˇc´ıslo x ∈ R. Diskr´etn´ı distribuˇcn´ı funkce m´a schodovit´ y tvar, se skoky velikosti pi v bodech xi . M´ a-li n´ ahodn´ a veliˇcina X diskr´etn´ı distribuˇcn´ı funkci, tj. pi = P (X = xi ), ˇr´ık´ame, ˇze X m´ a diskr´ etn´ı rozdˇ elen´ı pravdˇ epodobnosti, struˇcnˇe diskr´ etn´ı rozdˇ elen´ı.
Distribuˇcn´ı funkce F (x) se naz´ yv´ a absolutnˇ e spojit´ a, jestliˇze existuje spojit´a nez´aporn´a funkce f (x) naz´ yvan´ a hustota pravdˇ epodobnosti, struˇcnˇe hustota, takov´a, ˇze Z
x
F (x) =
f (t)dt −∞
1 V nˇ ekter´ ych uˇ cebnic´ıch se m˚ uˇ zete setkat s ponˇ ekud jinou definic´ı distribuˇ cn´ı funkce: F (x) = P (X < x) (s ostrou nerovnost´ı). Takov´ ato distribuˇ cn´ı funkce potom bude spojit´ a zleva.
2.1. N´ ahodn´ a veliˇcina
16
pro kaˇzd´e x ∈ R. M´ a-li n´ ahodn´ a veliˇcina X absolutnˇe spojitou distribuˇcn´ı funkci, ˇr´ık´ame, ˇze X m´a spojit´ e rozdˇ elen´ı pravdˇ epodobnosti, struˇcnˇe spojit´ e rozdˇ elen´ı. Hustota pravdˇepodobnosti f (x) mus´ı splˇ novat rovnost
R R
f (x)dx = 1. Existuje-li derivace F 0
distribuˇcn´ı funkce bodˇe x, potom je F 0 (x) = f (x). Pro a, b ∈ R, a < b, plat´ı b
Z P (a < X ≤ b) = F (b) − F (a) =
f (t)dt a
Tedy pravdˇepodobnost toho, ˇze spojit´a n´ahodn´a veliˇcina bude m´ıt hodnoty v nˇejak´em intervalu ha, bi je tedy plocha pod kˇrivkou hustoty nad intervalem ha, bi. Pravdˇepodobnostn´ı vlastnosti n´ahodn´e veliˇciny jsou plnˇe pops´any jej´ı distribuˇcn´ı funkc´ı. Pomoc´ı distribuˇcn´ı funkce lze urˇcit rozdˇelen´ı pravdˇepodobnosti {pi }∞ r´ıpadˇe diskr´etn´ı n´ahodn´e i=1 v pˇ veliˇciny nebo hustotu f (x) v pˇr´ıpadˇe spojit´e n´ahodn´e veliˇciny. To plat´ı i obr´acenˇe: zn´ame-li rozdˇelen´ı pravdˇepodobnosti {pi }∞ uˇzeme naj´ıt distribuˇcn´ı funkci F (x). i=1 nebo hustotu f (x), m˚
2.1.2
Charakteristiky n´ ahodn´ ych veliˇ cin
Kromˇe z´ akladn´ıch pravdˇepodobnostn´ıch charakteristik n´ahodn´e veliˇciny, kter´ ymi je jej´ı rozdˇelen´ı pravdˇepodobnosti, distribuˇcn´ı funkce ˇci hustota, se ˇcasto pouˇz´ıvaj´ı i dalˇs´ı, odvozen´e charakteristiky. Mezi nˇe patˇr´ı pˇredevˇs´ım momenty a kvantily. Z momentov´ ych charakteristik jsou nejzn´amˇejˇs´ı stˇredn´ı hodnota jako m´ıra polohy a rozptyl (resp. smˇerodatn´ a odchylka) jako m´ıra rozpt´ ylenosti, ˇsikmost a ˇspiˇcatost. Z kvantil˚ u jsou nejzn´ amˇejˇs´ı minimum a maximum, doln´ı a horn´ı decily, kvartily, medi´an. Z kvantil˚ u jsou odvozeny i kritick´e hodnoty pro r˚ uzn´e testy statistick´ ych hypot´ez. Stˇ redn´ı hodnota E(X) n´ ahodn´e veliˇciny X s diskr´etn´ım resp. spojit´ ym rozdˇelen´ım je hodnota
E(X) =
∞ X i=1
Z xi p i ,
∞
resp. E(X) =
xf (x)dx. −∞
ˇ Casto budeme ps´ at struˇcnˇeji pouze EX (bez z´avorek). Stˇredn´ı hodnota je ve skuteˇcnosti prvn´ı obecn´ y moment n´ ahodn´e veliˇciny X a ˇcasto b´ yv´a tak´e oznaˇcov´ana jako oˇcek´ avan´ a hodnota. Rozptyl V ar(X) n´ ahodn´e veliˇciny X (s diskr´etn´ım nebo spojit´ ym rozdˇelen´ım) je hodnota
V ar(X) = E(X − E(X))2 .
Druh´ a odmocnina rozptylu je naz´ yv´ana smˇ erodatnou odchylkou n´ahodn´e veliˇciny X a bu-
17
Kap. 2: Stochastick´e repetitorium . . .
deme ji obvykle oznaˇcovat σ(X). Rozptyl je ve skuteˇcnosti tzv. druh´y centr´ aln´ı moment n´ ahodn´e veliˇciny X. V pˇr´ıpadˇe, ˇze nezn´ ame rozdˇelen´ı pravdˇepodobnosti n´ahodn´e veliˇciny, odhadujeme tyto charakteristiky pomoc´ı namˇeˇren´ ych hodnot pˇri n´ahodn´em v´ ybˇeru2 . M´ame-li k dispozici n mˇeˇren´ı n´ahodn´e veliˇciny X, tedy hodnoty x1 , x2 , . . . , xn , potom stˇredn´ı hodnotu nejl´epe odhadneme pomoc´ı aritmetick´eho pr˚ umˇeru (tzv. v´ybˇerov´eho pr˚ umˇeru): n
E(X) = x ¯=
1X xi . n i=1
Pro odhad rozptylu pouˇz´ıv´ ame zpravidla dvˇe varianty: v´ybˇerov´y rozptyl s2 pˇri mal´ ych rozsaz´ıch v´ ybˇeru (pro mal´ a n) nebo odhad rozptylu z´ akladn´ıho souboru σ ˆ 2 pro ve+¡+ˇe¡lk´a n:
s2X =
n n X 1 X 1 (xi − x ¯)2 = x2i − n¯ x2 , n − 1 i=1 n − 1 i=1
n
resp. σ ˆ2 =
n
1X 1X 2 (xi − x ¯ )2 = x −x ¯2 . n i=1 n i=1 i
ˇ Vztah mezi stˇredn´ı hodnotou a rozptylem popisuje takzvan´a Cebyˇ sevova nerovnost“: ” ˇ Cebyˇ sevova nerovnost: Pro n´ ahodnou veliˇcinu X s koneˇcnou stˇredn´ı hodnotou µ a rozptylem σ 2 plat´ı pro libovoln´e re´ aln´e ˇc´ıslo > 0 nerovnost V ar(X) P |X − E(X)| ≥ ≤ . 2
(2.1)
ˇ Casto se pracuje s takzvan´ ymi normovan´ ymi momenty. Jsou to vlastnˇe obecn´e momenty normovan´ e n´ ahodn´ e veliˇ ciny U =
X−E(X) σ(X) .
Z tˇechto moment˚ u jsou d˚ uleˇzit´e ν3 a ν4 , kter´e
popisuj´ı tvar jej´ıho rozdˇelen´ı. Normovan´ y moment ν3 se naz´ yv´a koeficient ˇ sikmosti a je m´ırou symetrie rozdˇelen´ı. Koeficient ˇsikmosti je roven nule napˇr´ıklad pro n´ahodn´e veliˇciny, jejichˇz rozdˇelen´ı pravdˇepodobnosti je symetrick´e kolem stˇredn´ı hodnoty, je kladn´ y pro jednovrcholov´e hustoty ˇsikm´e zprava (obr.2.1), naopak z´ aporn´ y pro jednovrcholov´e hustoty ˇsikm´e zleva. Normovan´ y moment ν4 je naz´ yv´ an koeficientem ˇ spiˇ catosti nebo tak´e kurtoze a je m´ırou toho, jak rychle kles´ a pravdˇepodobnost extr´emn´ıch hodnot (smˇerem k −∞ nebo do +∞). Pˇri studiu chov´ an´ı n´ ahodn´e veliˇciny si zpravidla klademe ot´azku: jak´ a je pravdˇepodobnost ˇ α, ˇze sledovan´ a n´ ahodn´ a veliˇcina X nepˇrekroˇc´ı pˇredem danou hodnotu x? Casto je vˇsak kladena i opaˇcn´a ot´ azka: jakou hodnotu x nepˇrekroˇc´ı sledovan´ a n´ ahodn´ a veliˇcina s pˇredem danou pravdˇepodobnost´ı α? Odpovˇed’ n´ am d´ avaj´ı kvantily rozdˇ elen´ı n´ ahodn´ e veliˇ ciny, kter´e tvoˇr´ı 2 N´ ahodn´ y v´ ybˇ er znamen´ a, ˇ ze mˇ eˇr´ıme sledovanou veliˇ cinu opakovanˇ e, za pˇribliˇ znˇ e stejn´ ych podm´ınek a nez´ avisle na pˇredchoz´ıch mamˇ eˇren´ ych hodnot´ ach. T´ım by mˇ ela b´ yt zajiˇstˇ ena tzv. reprezentativnost, tedy zastoupen´ı jednotliv´ ych hodnot ve v´ ybˇ eru odpov´ıdaj´ıc´ı nezn´ am´ emu rozdˇ elen´ı pravdˇ epodobnosti.
2.1. N´ ahodn´ a veliˇcina
18
Obr´ azek 2.1: Hustoty nesymetrick´ ych rozdˇelen´ı a jejich koeficienty ˇsikmosti. dalˇs´ı d˚ uleˇzitou skupinou charakteristik n´ahodn´e veliˇciny. Mˇejme nˇejak´e 0 < α < 1. Potom α-kvantilem n´ahodn´e veliˇciny X naz´ yv´ame takovou nejvˇetˇs´ı hodnotu xα , pro kterou je P (X ≤ xα ) ≤ α. M´a-li n´ ahodn´ a veliˇcina X absolutnˇe spojitou distribuˇcn´ı funkci F (x), kter´a je rostouc´ı pro ta x, pro kter´ a 0 < F (x) < 1, potom existuje xα takov´e, ˇze P (X ≤ xα ) = α a je xα = F −1 (α), kde R xα F −1 je inverzn´ı funkce k F . Vyj´ adˇreno pomoc´ı hustoty f je −∞ f (x)dx = α, viz obr.2.2.
Obr´ azek 2.2: Vztah mezi pravdˇepodobnost´ı α a α-kvantilem xα .
Pravdˇepodobnost se ˇcasto vyjadˇruje v procentech. Potom budeme hovoˇrit o 100α%-kvantilu n´ahodn´e veliˇciny. Podobnˇe jako v pˇr´ıpadˇe moment˚ u i zde plat´ı tvrzen´ı, ˇze zn´ame-li vˇsechny α-kvantily n´ ahodn´e veliˇciny X pro vˇsechna α ∈ h0, 1i, potom m´ame u ´plnou informaci o jej´ım pravdˇepodobnostn´ım chov´ an´ı.
19
Kap. 2: Stochastick´e repetitorium . . . Mezi vˇsemi kvantily m´ a v´ yznamn´e postaven´ı 50%-kvantil, kter´ y budeme oznaˇcovat x0,5 a
budeme jej naz´ yvat medi´ an M e(X) n´ ahodn´e veliˇciny X. Medi´an se tak´e nˇekdy naz´ yv´a prostˇredn´ı hodnota z hlediska pravdˇepodobnosti, nebot’ pravdˇepodobnost, ˇze n´ahodn´a veliˇcina X nabyde hodnoty menˇs´ı neˇz M e(X) je rovna 0,5 coˇz je stejn´a hodnota jako pravdˇepodobnost, ˇze X bude m´ıt hodnotu vˇetˇs´ı neˇz M e(X). Vedle stˇredn´ı hodnoty je to dalˇs´ı takzvan´a charakteristika polohy n´ahodn´e veliˇciny X.
Pˇri anal´ yze dat se ˇcasto pouˇz´ıvaj´ı takzvan´e kvartily. To jsou 25%, 50% a 75% kvantily. Pˇritom 25%-kvantil se naz´ yv´ a doln´ı kvartil, 50%-kvantil je jiˇz zm´ınˇen´ y medi´an a 75%-kvantil je horn´ı kvartil. Spolu s minimem a maximem se tˇemto charakteristik´am ˇr´ık´a pˇet Tukeyho charakteristik podle zakladatele takzvan´e pr˚ uzkumov´e anal´ yzy dat“, americk´eho statistika Johna ” Tukeye. Ve statistice se d´ ale pracuje s takzvan´ ym horn´ım a doln´ım 5%-kvantilem. To jsou 5%- a 95%-kvantily. Podobnˇe se m˚ uˇzete setkat i s pojmem horn´ı nebo doln´ı decil – tedy 10%- nebo 90%-kvantil.
2.1.3
Norm´ aln´ı rozdˇ elen´ı pravdˇ epodobnosti N (µ, σ 2 ).
Model norm´aln´ıho rozdˇelen´ı m´ a bohatou historii. Postupnˇe byl objevov´an a opˇet zapom´ın´am, aˇz se trvale dostal do poˇred´ı z´ ajmu teorie pravdˇepodobnosti a pˇredevˇs´ım matematick´e statistiky. Prvn´ı, kdo popsal zvonovou kˇrivku hustoty norm´aln´ıho rozdˇelen´ı byl A. Moivre3 v roce 1733. K norm´aln´ımu modelu se dostal zobecnˇen´ım binomick´eho modelu pˇri h´azen´ı minc´ı. V t´e dobˇe mu nikdo nevˇenoval zvl´ aˇstn´ı pozornost a kˇrivka i rovnice upadly v zapomenut´ı. Aˇz na pˇrelomu 18. a 19. stolet´ı ji znovu objevili“ Gauss4 a Laplace5 pˇri zkoum´an´ı astronomick´ ych mˇeˇren´ı. ” Byli postaveni pˇred u ´lohu z mnoha mˇeˇren´ı, zat´ıˇzen´ ych chybou, urˇcit hodnotu, kter´a se bude co nejv´ıce bl´ıˇzit skuteˇcnosti. Odtud z´ıskal tento model pˇr´ıvlastek model rozdˇelen´ı chyb mˇeˇren´ı“ a ” odpov´ıdaj´ıc´ı kˇrivka hudtoty se nˇekdy t´eˇz naz´ yv´a Gaussova“. Tˇret´ı, kdo tento model objevil a ” z´aroveˇ n prvn´ı, kdo jej nazval norm´ aln´ım“, byl Qu´etelet6 v roce 1835. Norm´aln´ı kˇrivku dostal ” 3 Abraham
de Moivre (1667–1754) byl francouzsk´ y matematik ˇ zij´ıc´ı vˇ etˇs´ı ˇ c´ ast sv´ eho ˇ zivota v Anglii. Friedrich Gauss (1777–1855)byl jeden z nejvˇ etˇs´ıch matematik˚ u a fyzik˚ u vˇsech dob. Zab´ yval se teori´ı ˇ c´ısel, matematickou anal´ yzou, geometri´ı, geod´ ezi´ı, magnetismem, astronomi´ı, optikou. Nˇ ekdy b´ yv´ a oznaˇ cov´ an za kn´ıˇ zete matematiky“ nebo nejvˇ etˇs´ıho matematika od dob antiky“ – silnˇ e ovlivnil vˇ etˇsinu oblast´ı sv´ eho oboru. ” 5 ” Pierre Simon de Laplace (1749–1827) byl francouzsk´ y matematik, fyzik, astronom a politik; ˇ clen Francouzsk´ e akademie vˇ ed, kr´ alovsk´ e spoleˇ cnosti v Lond´ ynˇ e a Komise pro m´ıry a v´ ahy. Laplace je pr´ avem povaˇ zov´ an za jednoho z nejvˇ etˇs´ıch vˇ edc˚ u v˚ ubec. Zanechal monument´ aln´ı d´ılo jiˇ z sv´ ym rozsahem. Zab´ yval se matematickou anal´ yzou, teori´ı pravdˇ epodobnosti, nebeskou mechanikou, teori´ı potenci´ alu, zavedl pojem Laplaceovy transformace, uˇ zil tzv. Laplace˚ uv oper´ ator (v parci´ aln´ı diferenci´ aln´ı rovnici pro potenci´ al silov´ eho pole). Je autorem teorie o vzniku sluneˇ cn´ı soustavy z rotuj´ıc´ı mlhoviny (Kantova-Laplaceova teorie) a mnoha dalˇs´ıch teori´ı a metod s mnoha aplikacemi 6 Lambert Adolphe Jacques Q´ etelet (1796–1874). Belgick´ y vˇ edec, jeden ze zakladatel˚ u Kr´ alovsk´ e statistick´ e spoleˇ cnosti v Lond´ ynˇ e 4 Carl
2.1. N´ ahodn´ a veliˇcina
20
v souvislosti s mˇeˇren´ım obvodu prsou 5738 skotsk´ ych voj´ak˚ u a pˇredstavou jak´ehosi norm´aln´ıho“, ” neboli pr˚ umˇern´eho jedince. Od t´e doby si model norm´aln´ıho rozdˇelen´ı zaˇcal budovat svoji pevnou pozici ve vˇsech oblastech vˇedy.
Obr´ azek 2.3: Distribuˇcn´ı funkce a hustota norm´aln´ıho rozdˇelen´ı.
Hustota pravdˇepodobnosti: f (x) =
2 exp − (x−µ) , x∈R 2 2σ
Distribuˇcn´ı funkce
f (t)dt, x ∈ R
F (x)
√1 σ 2π Rx = −∞
Z´ akladn´ı charakteristiky : E(X) = µ V ar(X) = σ 2 Ponˇekud nepˇr´ıjemn´e v tomto modelu je to, ˇze distribuˇcn´ı funkci, kter´a je d´ana v´ yˇse uveden´ ym integr´ alem, nelze vyj´ adˇrit koneˇcnou analytickou formul´ı; jej´ı hodnoty se poˇc´ıtaj´ı pomoc´ı distribuˇcn´ı funkce takzvan´eho normovan´eho norm´aln´ıho rozdˇelen´ı (viz d´ale). V souˇcasn´e dobˇe to vˇsak nen´ı z´ asadn´ı omezen´ı, nebot’ ˇrada program˚ u (vˇcetnˇe tabulkov´eho procesoru MS Excel) umˇej´ı distribuˇcn´ı funkci norm´ aln´ıho rozdˇelen´ı spoˇc´ıtat s dostateˇcnou pˇresnost´ı.
Obr´ azek 2.4: Vliv parametr˚ u µ a σ norm´aln´ıho rozdˇelen´ı na tvar kˇrivky. Parametry norm´ aln´ıho rozdˇelen´ı lze interpretovat jako parametr polohy EY = µ a parametr mˇeˇr´ıtka V arY = σ 2 , vzhledem k symetrii rozdˇelen´ı je µ t´eˇz medi´anem i modem. V´ yznam smˇerodatn´e odchylky σ je ilustrov´ an obr. 2.4, kde je zn´azornˇena pravdˇepodobnost toho, ˇze Y se
21
Kap. 2: Stochastick´e repetitorium . . .
liˇs´ı od stˇredn´ı hodnoty µ v absolutn´ı hodnotˇe o m´enˇe neˇz kσ, k = 1, 2, 3. ˇ Casto v praktick´ ych v´ ypoˇctech pouˇz´ıv´ame n´asleduj´ıc´ı vlastnost norm´aln´ıho rozdˇelen´ı: M´ali n´ahodn´a veliˇcina X norm´ aln´ı rozdˇelen´ı pravdˇepodobnosti se stˇredn´ı hodnotou µ a rozptylem σ 2 (X ≈ N (µ, σ 2 )), potom pro libovoln´e konstanty a, b ∈ R, a > 0 m´a veliˇcina Y = 2 X−b opˇet norm´ aln´ı rozdˇelen´ı se stˇredn´ı hodnotou µ − b a rozptylem σa , neboli pat´ı (Y ≈ a 2 N µ − b, σa ). N´ahodn´a veliˇcina Z m´ a normovan´ e norm´ aln´ı rozdˇ elen´ı, nebo t´eˇz standardn´ı norm´ aln´ı rozdˇ elen´ı, (Z ≈ N (0, 1)), je-li jej´ı hustota rovna φ(z) =
2
z √1 e− 2 2π
, z ∈ R. Pˇr´ısluˇsn´a distribuˇcn´ı
funkce se oznaˇcuje obvykle symbolem Φ a lze ji vyj´adˇrit jako
Φ(z) =
1 2π
Z
z
t2
e− 2 dt.
−∞
Hodnoty t´eto funkce se poˇc´ıtaj´ı rozvojem v ˇradu a integrac´ı ˇclen po ˇclenu, nebo jsou uvedeny v takzvan´ ych Statistick´ ych tabulk´ ach“. ” n-t´ y obecn´ y moment pro lich´e n = (2k − 1) je vˇzdy roven nule; tedy je EZ (2k−1) = 0, k ∈ N . q R 2 z2 ∞ Pro n sud´e, n = 2k je EZ 2k = π2 0 z 2k e− 2 dz. Po substituci z2 = t dostaneme7 r EZ
2k
=
2 π
Z
∞
(2t)
2k−1 2
0
2k 1 e−t dt = p Γ(k + ) = (2k − 1)!! = 1.3.5 . . . (2k − 1) 2 (π)
Toto rozdˇelen´ı se pouˇz´ıv´ a napˇr´ıklad tehdy, je-li tˇreba porovnat vlastnosti v´ıce n´ahodn´ ych veliˇcin s r˚ uzn´ ym norm´ aln´ım rozdˇelen´ım. S takzvanou normalizac´ı n´ahodn´e veliˇciny jsme se uˇz setkali pˇri definici normovan´ych moment˚ u v odstavci 1.2. Jestliˇze m´a n´ahodn´a veliˇcina X obecn´e norm´aln´ı rozdˇelen´ı (X ≈ N (µ, σ)), vytvoˇr´ıme normalizovanou n´ahodnou veliˇcinu Z =
X−µ σ .
Tato
veliˇcina m´a normovan´e norm´ aln´ı rozdˇelen´ı (Z ≈ N (0, 1)). Vztah mezi hustotou f (x) veliˇciny X a hustotou φ(z) veliˇciny Z je n´ asleduj´ıc´ı:
f (x) =
(x−µ)2 z2 1 1 1 √ e− 2σ2 = √ e− 2 = φ(z). σ σ 2π σ 2π
neboli f (x) =
1 φ σ
x−µ σ
.
Distribuˇcn´ı funkci F (x) veliˇciny X lze vyj´ adˇrit podobnˇe pomoc´ı Φ(z), nebot’ plat´ı
F (x) = Φ( 7 Symbol
x−µ ). σ
(2k − 1)!! se pouˇ z´ıv´ a k vyj´ adˇren´ı lich´ eho“ faktori´ alu, tedy souˇ cinu vˇsech lich´ ych ˇ c´ısel od 1 do (2k − 1). ”
2.2. Testov´ an´ı statistick´ ych hypot´ez
22
To lze snadno ovˇeˇrit, dosad´ıme-li do integr´alu pro F (x) substituci
x−µ σ
= z, dx = σdz.
Praktick´ y v´ yznam norm´ aln´ıho rozdˇelen´ı vypl´ yv´a i z takzvan´e centr´aln´ı limitn´ı vˇety“. ”
2.2 2.2.1
Testov´ an´ı statistick´ ych hypot´ ez Test statistick´ e hypot´ ezy
Pod pojmem statistick´ e hypot´ ezy si budeme pˇredstavovat jak´ekoli tvrzen´ı o jevu statistick´e povahy. Napˇr´ıklad tvrzen´ı o d´elce ˇzivotnosti v´ yrobku, o nez´avislosti v´ ysledku na pouˇzit´e metodˇe, tvrzen´ı o pravdˇepodobnostn´ım rozdˇelen´ı sledovan´e veliˇciny a podobnˇe. Ovˇeˇrov´an´ı, zda hypot´eza plat´ı ˇci nikoli, je pˇredmˇetem statistick´eho testov´an´ı. Toto prov´ad´ıme na z´akladˇe pozorov´an´ı (mˇeˇren´ı) nˇejak´eho v´ ybˇeru (experimentu). Test statistick´ e hypot´ ezy H proti alternativn´ı hypot´ eze A je rozhodovac´ı pravidlo, podle nˇehoˇz na z´ akladˇe realizace n´ ahodn´eho v´ ybˇeru rozhodujeme mezi dvˇema tvrzen´ımi - sledovanou hypot´ezou a doplˇ nkovou, tzv. alternativn´ı hypot´ ezou A. V´ ysledkem naˇseho rozhodov´an´ı je bud’ zam´ıtnut´ı hypot´ezy H ve prospˇech alternativy A ˇci jej´ı nezam´ıtnut´ı. Skuteˇcnost, ˇze hypot´ezu nezam´ıt´ ame, neznamen´ a, ˇze namˇeˇren´a data tto hypot´ezu potvrzuj´ı, ale pouze to, ˇze ji nevyvracej´ı. Toto rozhodovac´ı pravidlo je urˇceno testovou statistikou T (X) a mnoˇzinou ν, kter´e ˇr´ık´ ame kritick´ y obor. Vlastn´ı rozhodov´an´ı potom prob´ıh´a pomoc´ı indik´atorov´e funkce
Iν (T (X)) =
1
pokud T (X) ∈ ν,
0
pokud T (X) ∈ / ν.
Pokud je hodnota indik´ atorov´e funkce rovna 1, tedy T (X) ∈ ν potom hypot´ezu H zam´ıt´ame. V opaˇcn´em pˇr´ıpadˇe ˇr´ık´ ame, ˇze hypot´ezu nelze zam´ıtnout. Naˇse u ´sil´ı pˇritom zamˇeˇr´ıme na konstrukci testu, to znamen´ a na urˇcen´ı testov´e statistiky T a kritick´eho oboru ν, pomoc´ı nichˇz budeme moci co nejl´epe rozhodnout o zam´ıtnut´ı hypot´ezy. Pˇ r´ıklad 2.2.1 Pˇri dod´ avce rezistor˚ u je pro n´ as z hlediska pouˇzitelnosti rozhoduj´ıc´ı velikost odporu souˇc´ astky. V´yrobce ud´ av´ a nomin´ aln´ı hodnotu, od n´ıˇz se vˇsak vˇetˇsina namˇeˇren´ych hodnot liˇs´ı. Jak rozhodnout, zda je pro n´ as dod´ avka pˇrijateln´ a. ˇ sen´ı: Naˇse mˇeˇren´ı vˇsak m˚ Reˇ uˇze podl´ehat n´ahodn´ ym vliv˚ um. Kontrola dod´avky spoˇc´ıv´a ve stanoven´ı rozhodovac´ıho pravidla, kter´ ym chceme otestovat hypot´ezu, ˇze skuteˇcn´ y odpor je roven nomin´ aln´ı hodnotˇe.
23
Kap. 2: Stochastick´e repetitorium . . . Pˇri v´ yˇse popsan´em rozhodovac´ım pravidle se m˚ uˇzeme dopustit chyby dvˇema zp˚ usoby. Bud’
budeme pˇr´ıliˇs pˇr´ısn´ı a zam´ıtneme hypot´ezu, kter´a plat´ı - to je chyba prvn´ıho druhu - nebo naopak tuto hypot´ezu nezam´ıtneme, i kdyˇz je nespr´avn´a - v tomto pˇr´ıpadˇe se jedn´a o chybu druh´ eho druhu. Obˇe mohou m´ıt nepˇr´ıjemn´e d˚ usledky, a proto budeme zˇrejmˇe za lepˇs´ı“ test ” povaˇzovat ten test, pˇri kter´em bude pravdˇepodobnost obou chyb co nejmenˇs´ı. Pˇritom zpravidla ˇc´ım menˇs´ı bude pravdˇepodobnost chyby 1. druhu, t´ım vˇetˇs´ı bude pravdˇepodobnost chyby 2. druhu a naopak. V takov´em pˇr´ıpadˇe nelze nal´ezt test minimalizuj´ıc´ı obˇe chyby souˇcasnˇe. Proto postupujeme n´ asleduj´ıc´ım zp˚ usobem. Pˇri kontrukci testu poˇzadujeme, aby pravdˇepodobnost chyby 1. druhu byl menˇs´ı nebo rovna dan´emu ˇc´ıslu α, kter´emu ˇr´ık´ ame hladina v´ yznamnosti testu. Pˇritom obvykle vol´ıme α = 0, 05; 0, 01 apod. Potom hled´ ame testovou statistiku T (X) a kritick´ y obor να , tak aby
P (T (X)) ∈ να |Hplati) ≤ α
P (T (X)) ∈ / να |H neplat´ı) byla minim´ aln´ı. Kritick´ y obor je zpravidla interval, ohraniˇcen´ y tzv. kritick´ ymi hodnotami. Test potom prob´ıh´a tak, ˇze spoˇcteme hodnotu testov´e statistiky, porovn´ame ji s kritick´ ymi hodnotami, odpov´ıdaj´ıc´ımi hladinˇe v´ yznamnosti α, a rozhodneme o zam´ıtnut´ı ˇci nezam´ıtnut´ı hypot´ezy. V nˇekter´ ych pˇr´ıpadech - pˇredevˇs´ım pˇri testov´an´ı pomoc´ı poˇc´ıtaˇce - se pouˇz´ıv´a jin´ y postup. Spoˇcte se hodnota testov´e statistiky a k n´ı nejmenˇs´ı kritick´ y obor, pˇri kter´em bychom jeˇstˇe mohli na z´akladˇe t´eto hodnoty zam´ıtnout hypot´ezu proti dan´e alternativˇe. Hladina v´ yznamnosti, odpov´ıdaj´ıc´ı tomuto kritick´emu oboru, se naz´ yv´a p-hodnota. Kdybychom volili hladinu v´ yznamnosti vˇetˇs´ı, neˇz je tato hodnota, mohli bychom jeˇstˇe hypot´ezu zam´ıtnout. Je-li tato p-hodnota pˇr´ıliˇs mal´a, hypot´ezu zam´ıt´ ame. Napˇr´ıklad, spoˇcteme-li pro dan´a data p-hodnotu rovnou 0, 005 znamen´a to, ˇze pro jak´ekoliv α vˇetˇs´ı neˇz 0, 005 bychom mˇeli hypot´ezu zam´ıtnout. Konkr´etnˇe pro α = 0, 01 uˇz hypot´ezu zam´ıt´ ame. ˇ Sirokou tˇr´ıdu test˚ u tvoˇr´ı testy hypot´ez o parametrech pravdˇepodobnostn´ıho rozdˇelen´ı. V tomto pˇr´ıpadˇe pˇredpokl´ ad´ ame, ˇze pravdˇepodobnostn´ı rozdˇelen´ı je urˇcit´eho typu a z´avis´ı na nezn´am´ ych parametrech. Pˇredpokl´ adejme, ˇze nezn´ am´ y parametr θ m˚ uˇze nab´ yvat hodnot z nˇejak´e mnoˇziny Θ. Uvaˇzujme hypot´ezu H : θ = θ0 . Alternativn´ı hypot´eza m˚ uˇze b´ yt bud’ A : θ 6= θ0 , takzvan´a oboustrann´ a alternativa pˇri t´eto alternativˇe mluv´ıme o oboustrann´ em testu), nebo A1 : θ ≤ θ0 ˇci A2 : θ ≥ θ0 tzv. jednostrann´ e alternativy (jimˇz odpov´ıdaj´ı tzv. jednostrann´ e testy).
2.2. Testov´ an´ı statistick´ ych hypot´ez
24
Funkci Pν (θ), kter´ a kaˇzd´e hodnotˇe parametru θ ∈ Θ pˇriˇrad´ı pravdˇepodobnost P (T (X) ∈ ν|θ) naz´ yv´ ame silofunkc´ı testu. Je to vlastnˇe pravdˇepodobnost zam´ıtnut´ı hypot´ezy H, m´a-li parametr hodnotu θ. Hodnotu silofunkce v bodˇe θ = θ1 naz´ yv´ame silou testu vzhledem k alternativˇ e θ = θ1 a pouˇz´ıv´ ame ji k pro hodnocen´ı kvality testu.
2.2.2
Testy o parametrech norm´ aln´ıho rozdˇ elen´ı
V prvn´ı ˇc´ asti tohoto odstavce uvedeme nˇekolik parametrick´ ych test˚ u, kter´e se pouˇz´ıvaj´ı pˇri v´ ybˇeru X = X1 , . . . , Xn z rozdˇelen´ı N (µ, σ 2 ). Tyto testy se zab´ yvaj´ı hypot´ezami o parametrech µ a σ. Pˇritom rozliˇsujeme nˇekolik pˇr´ıpad˚ u: Pˇredpokl´ adejme, ˇze hodnotu σ zn´ame. Budeme testovat nulovou hypot´ezu H : µ = µ0 proti √ ¯ alternativˇe A : µ 6= µ0 na hladinˇe v´ yznamnosti α. Test zaloˇz´ıme na statistice X−µ n, kter´a m´a, σ za pˇredpokladu platnosti hypot´ezy, rozdˇelen´ı N (0, 1). Kritick´ y obor je potom urˇcen nerovnost´ı ¯ − µ| √ α |X n > u(1 − ) σ 2 kde u(1 − α2 ) je (1 − α2 )-kvantil rozdˇelen´ı N (0, 1). Pokud bude hodnota v´ ybˇerov´eho pr˚ umˇeru P n x ¯ = n1 i=1 xi z´ıskan´ a z pozorov´ an´ı x1 , . . . , xn leˇzet v intervalu σ α σ α ¯ < µ0 + √ u(1 − ) µ0 − √ u(1 − ) < x 2 2 n n hypot´ezu nezam´ıtneme na hladinˇe v´ yznamnosti α. V opaˇcn´em pˇr´ıpadˇe hypot´ezu zam´ıt´ame. Pozn´ amka: Srovnejte tento v´ ysledek s
intervalem spolehlivosti v
VI.3.2. Hypot´ezu H ne-
zam´ıtneme tehdy, kdyˇz hypotetick´ a hodnota µ0 bude leˇzet v 100(1 − α)% intervalu spolehlivosti, zkonstruovan´em na z´ akladˇe pozorov´an´ı x1 , . . . , xn . Pˇri jednostrann´e alternativˇe A1 : µ < µ0 resp. A2 : µ > µ0 bude kritick´ y obor urˇcen nerovnost´ı x ¯ − µ0 √ x ¯ − µ0 √ n ≤ u(α), resp. n ≥ u(1 − α) σ σ
Jednov´ ybˇ erov´ y t-test. Nejˇcastˇejˇs´ım pˇr´ıpadem je test hypot´ezy H : µ = µ0 proti alternativˇe A : µ 6= µ0 na hladinˇe v´ yznamnosti α pˇri nezn´am´e hodnotˇe σ. Nezn´amou hodnotou σ nahrazujeme √ 0 jej´ım odhadem S a test zaloˇz´ıme na statistice x¯−µ n. Plat´ı-li hypot´eza H, m´a tato statistika S Studentovo t-rozdˇelen´ı o (n − 1) stupn´ıch volnosti (viz V.4.6). Kritick´ y obor je potom urˇcen nerovnost´ı |¯ x − µ0 | √ α n > tn−1 (1 − ) § 2
25
Kap. 2: Stochastick´e repetitorium . . .
kde tn−1 (1 − α2 ) je (1 − α2 )-kvantil rozdˇelen´ı t o n − 1 stupn´ıch volnosti. Pro jednostrann´e testy proti alternativ´am µ < µ0 resp. µ > µ0 bude kritick´ y obor urˇcen nerovnostmi x ¯ − µ0 √ x ¯ − µ0 √ n ≤ −tn−1 (1 − α) n ≥ tn−1 (1 − α) § § Pro v´ ybˇery o velk´em rozsahu n lze t-test pouˇz´ıt (pˇribliˇznˇe) i bez pˇredpokladu normality ¯ v limitˇe pro n → v´ ybˇeru. Podle centr´ aln´ı limitn´ı vˇety IV.2.4 m´a totiˇz v´ ybˇerov´ y pr˚ umˇer X √ 0 ∞ norm´aln´ı rozdˇelen´ı N (µ, σ 2 ) a tedy statistika x¯−µ n m´a pˇribliˇznˇe Studentovo t-rozdˇelen´ı § o (n − 1) stupn´ıch volnosti. Chceme-li testovat hypot´ezu o rozptylu H : σ 2 = σ02 proti alternativˇe A : σ 2 6= σ02 na hladinˇe v´ yznamnosti α, m˚ uˇzeme pouˇz´ıt statistiku
(n−1)S 2 , σ2
kter´a m´a za platnosti hypot´ezy (viz V.4.6)
rozdˇelen´ı χ o n − 1 stupn´ıch volnosti. Oznaˇcme s2 hodnotu v´ ybˇerov´eho rozptylu s2 =
1 n−1 Σ( i
=
1)n (xi − x ¯), z´ıskanou z pozorov´ an´ı x1 , . . . , xn . V tomto pˇr´ıpadˇe je kritick´ y obor pro oboustrannou alternativu A : σ 2 6= sigma20 urˇcen nerovnostmi s2 <
2 χ( n − 1)2 ( α2 )σ02 χ( n − 1)2 ( 1−α 2 )σ0 a < s2 n−1 n−1
zat´ımco pro jednostrann´e alternativy A1 : σ 2 < σ02 resp. A2 : σ 2 > σ02 dostaneme kritick´e obory s2 <
χ( n − 1)2 (1 − α)σ02 χ( n − 1)2 (α)σ02 resp. < s2 , n−1 n−1
symbol χ( n − 1)2 (α) zde oznaˇcuje α-kvantil ch´ı-kvadr´at rozdˇelen´ı o (n − 1) stupn´ıch volnosti. P´ arov´ y t-test. Sledujeme-li na jednom objektu dva podobn´e znaky z´aroveˇ n, pouˇz´ıv´ame n´ahodn´ y v´ ybˇer dvojic n´ ahodn´ ych veliˇcin {(X1 , Y1 ), . . . , (Xn , Yn )}. O veliˇcin´ach Xi a Yi pˇredpokl´ad´ame, ˇze jsou p´ arovˇ e z´ avisl´ e. Napˇr´ıklad mˇeˇren´ı vlastnosti materi´alu pˇred tepeln´ ym zpracov´an´ım a po nˇem na vybran´ ych n vzorc´ıch. Pˇredpokl´adejme, ˇze {X1 , . . . , Xn } je n´ahodn´ y v´ ybˇer z norm´aln´ıho rozdˇelen´ı N (µX , σ 2 ) a Y1 , . . . , Yn je n´ ahodn´ y v´ ybˇer z rozdˇelen´ı N (µY , σY2 ). Veliˇciny Xi a Yi mohou b´ yt p´arovˇe z´avisl´e. Budeme testovat hypot´ezu o rovnosti stˇredn´ıch hodnot H : µX = µY proti alternativˇe A : µX 6= µY na hladinˇe v´ yznamnosti α. V tomto pˇr´ıpadˇe budeme m´ısto p˚ uvodnˇe sledovan´ ych veliˇcin (X1 , Y1 ), . . . , (Xn , Yn ) pracovat s veliˇcinami Z1 , . . . , Zn , kde Zi = Yi − Xi , i = 1, . . . , n. Protoˇze Xi a Yi maj´ı norm´ aln´ı rozdˇelen´ı, bude se i veliˇcina Z ˇr´ıdit norm´aln´ım rozdˇelen´ım se stˇredn´ı 2 hodnotou µZ = µY − µX a rozptylem σZ , o jehoˇz vztahu k rozptyl˚ um σX a σY nelze vzhledem
k moˇzn´e z´avislosti nic pˇredpokl´ adat. Rovnost stˇredn´ıch hodnot X a Y je ekvivalentn´ı nulovosti
2.2. Testov´ an´ı statistick´ ych hypot´ez
26
stˇredn´ı hodnoty rozd´ılu Z. Pro aritmetick´ y pr˚ umˇer plat´ı z¯ = x ¯ − y¯ a hodnotu v´ ybˇerov´eho rozptylu s2Z spoˇcteme podle vztahu s2Z =
1 Σn (xi − yi − x ¯ + y¯)2 . n − 1 n=1
K testu hypot´ezy H : µZ = 0 na hladinˇe v´ yznamnosti α pouˇzijeme jednov´ ybˇerov´ y t-test (viz VII.2.2), tedy pˇri oboustrann´e alternativˇe A : µ 6= 0 hypot´ezu H zam´ıtneme, pokud α α sZ sZ z¯ = − √ tn−1 (1 − ) nebo √ tn−1 (1 − ) < z¯. 2 2 n n
Jsou-li veliˇciny X a Y nez´ avisl´e, pouˇz´ıv´ame pro srovn´an´ı stˇredn´ıch hodnot dvou v´ ybˇer˚ u 2 dvouv´ ybˇ erov´ y t-test. Necht’ X1 , . . . , Xn je v´ ybˇer z rozdˇelen´ı N (µX , σX ) a Y1 , . . . , Ym je v´ ybˇer
z rozdˇelen´ı N (µY , σY2 ) a tyto v´ ybˇery jsou na sobˇe nez´avisl´e. Rozliˇsujeme dva pˇr´ıpady:
2 (1) Oba v´ ybˇery maj´ı stejn´ e rozptyly σX = σY2 . Potom statistika
¯ − Y¯ r mn X T = , S m+n kde S2 =
n 1 ¯ 2 + Σm ¯ 2 Σ (Xi − X) j=1 (Yj − Y ) m + n − 2 i=1
m´ a za platnosti nulov´e hypot´ezy H : µX = µY Studentovo t-rozdˇelen´ı o m + n − 2 stupn´ıch volnosti. Test uveden´e hypot´ezy proti oboustrann´e alternativˇe A : µX 6= µY na hladinˇe v´ yznamnosti α lze tedy zaloˇzit na nerovnosti y¯ − x ¯ S
r
mn 1 ≥ tm+n−2 (1 − α). m+n 2
Test hypot´ezy H proti jednostrann´ ym alternativ´am A1 : µX ≤ µY , resp. A2 : µX ≥ µY na hladinˇe v´ yznamnosti α je zaloˇzen na nerovnostech r mn y¯ − x ¯ S m+n r y¯ − x ¯ mn S m+n
≥ tm+n−2 (1 − α), ≥ tm+n−2 (α) = −tm+n−2 (α)(1 − α)
2 (2) Oba v´ ybˇery maj´ı r˚ uzn´ e rozptyly σX 6= σY2 . Potom pouˇzijeme pˇribliˇzn´ y test, zaloˇzen´ y na
statistice
27
Kap. 2: Stochastick´e repetitorium . . .
¯ − Y¯ X 1 1 Te = , kde Se2 = s2X + s2Y . e n m S Test hypot´ezy H : µX = µY proti oboustrann´e alternativˇe na hladinˇe v´ yznamnosti α lze zaloˇzit na nerovnosti 1 1 2 α 1 2 α |¯ y−x ¯| ≥ sX tn−1 (1 − ) + sY tm−1 (1 − ) 2 m 2 Se Se2 n na nerovnosti 1 1 2 y¯ − x ¯ 1 ≥ sX tn−1 (1 − α) + s2Y tm−1 (1 − α) m Se Se2 n pˇri jednostrann´e alternativˇe A1 : µX ≤ µY a na 1 1 2 y¯ − x ¯ 1 2 ≤− sX tn−1 (1 − α) + sY tm−1 (1 − α) m Se Se2 n pˇri alternativˇe A2 : µX ≥ µY . Pˇ r´ıklad 2.2.2 Pˇri zpracov´ an´ı je tˇreba materi´ al zahˇr´ at na vysokou teplotu. Pˇred zpracov´ an´ım bylo vybr´ ano n´ ahodnˇe 10 vzork˚ u a zmˇeˇrena jejich tvrdost. Po zpracov´ an´ı bylo opˇet vybr´ ano n´ ahodnˇe jin´ych 10 vzork˚ u, na nichˇz byla zmˇeˇrena tvrdost. Namˇeˇren´e hodnoty jsou v n´ asleduj´ıc´ı tabulce: pˇred
3,15
2,98
3,00
2,75
3,21
3,33
2,95
2,81
3,26
2,88
po
3,21
2,99
3,11
2,91
3,22
3,28
3,09
3,00
3,28
2,99
Testujte hypot´ezu, ˇze se tvrdost materi´ alu vlivem zpracov´ an´ı nemˇen´ı. ˇ sen´ı: Je m = n = 10. Spoˇcteme x Reˇ ¯ = 3, 032, y¯ = 3, 108, s2x = 0, 03875, s2y = 0, 018. Za pˇredpokladu, ˇze rozptyl pˇred i po zpracov´an´ı z˚ ust´av´a stejn´ y (namˇeˇren´ y rozd´ıl je nev´ yznamn´ y), pouˇzijeme postup, popsan´ y v VII.2.6.a). Dostaneme hodnotu s2 = 0, 02838 a testov´e statistiky T = 1, 009. Pˇri hladinˇe v´ yznamnosti α = 0, 05 je t1 8(0, 975) = 2, 101 a tedy hypot´ezu nelze zam´ıtnout. Pˇ r´ıklad 2.2.3 Uvaˇzujme stejnou u ´lohu jako v pˇredchoz´ım pˇr´ıkladu, pouze s t´ım rozd´ılem, ˇze sledovan´ a veliˇcina je mˇeˇrena pˇred i po zpracov´ an´ı na 10 vzorc´ıch, kter´e byly n´ ahodnˇe vybr´ any pˇred zaˇc´ atkem experimentu. Namˇeˇren´ a data z˚ ust´ avaj´ı stejn´ a. ˇ sen´ı: V tomto pˇr´ıpadˇe je tˇreba vz´ıt do u Reˇ ´vahy z´avislost, kter´a zde m˚ uˇze b´ yt zp˚ usobena dalˇs´ımi vlastnostmi vzork˚ u. Proto pouˇzijeme p´ arov´ y t-test. Dost´av´ame z¯ = x ¯−¯ y = −0, 076, sz = 0, 07777. Testov´a statistika zde bude m´ıt hodnotu T = 3, 09, kterou budeme srovn´avat s ˇc´ıslem t9 = (0, 975) = 2, 262. V tomto pˇr´ıpadˇe hypot´ezu zam´ıtneme. Uveden´e pˇr´ıklady ukazuj´ı, jak´ y vliv na
2.2. Testov´ an´ı statistick´ ych hypot´ez
28
v´ ysledek m˚ uˇze m´ıt tzv. n´ avrh experimentu. Druh´ y pˇr´ıpad l´epe vystihuje skuteˇcnost, ˇze namˇeˇren´a data nejsou nez´ avisl´ a a bere do u ´vahy dalˇs´ı moˇzn´e vlivy, plynouc´ı z individuality vzork˚ u. 2 Uvaˇzujme dva nez´ avisl´e v´ ybˇery: X1 , . . . , Xn z rozdˇelen´ı N (µX , σX ) a Y1 , . . . , Yn z rozdˇelen´ı
N (µY , σY2 ) m˚ uˇzeme prov´est tzv. test shody rozptyl˚ u neboli F-test. K testu hypot´ezy H : 2 σX = σY2 lze pouˇz´ıt napˇr´ıklad statistiku
F =
2 SX SY2
Rozdˇelen´ı statistiky F je podle V.4.6 a V.4.9 za pˇredpokladu H rozdˇelen´ım F o (n − 1) a (m − 1) 2 stupn´ıch volnosti. Kritick´ y obor pro test hypot´ezy H proti oboustrann´e alternativˇe A : σX 6= σY2
na hladinˇe v´ yznamnosti α je urˇcen nerovnostmi s2X α s2X α 1 ≥ F (1 − )a 2 ≤ Fn−1,m−1 ( ) = n−1,m−1 2 sY 2 sY 2 Fn−1,m−1 (1 − α2 ) kde Fn,m (α) je α-kvantil rozdˇelen´ı F (n, m). Tedy hypot´ezu zam´ıt´ame pro mal´a F bl´ızk´a nule a pro velk´ a F (pˇri platnosti hypot´ezy by mˇelo b´ yt F bl´ızk´e 1). Kritick´e obory pro test hypot´ezy 2 2 yznamnosti α jsou urˇceny ≤ σY2 na hladinˇe v´ ≥ σY2 A2 : σX H proti alternativ´ am A1 : σX
nerovnostmi s2X s2X 1 ≥ F (1 − α)resp. ≤ Fn−1,m−1 (α) = (1 − α) n−1,m−1 2 2 sY sY Fn−1,m−1
2.2.3
Testy dobr´ e shody
Pˇri vyhodnocen´ı v´ ysledk˚ u experimentu velmi ˇcasto pˇredpokl´ad´ame, ˇze namˇeˇren´e hodnoty jsou realizacemi n´ ahodn´ ych veliˇcin s norm´aln´ım rozdˇelen´ım. K provˇeˇren´ı hypot´ezy o typu rozdˇelen´ı, z nˇehoˇz byl v´ ybˇer poˇr´ızen pouˇz´ıv´ ame takzvan´e testy dobr´ e shody. Jedn´a se tedy o hypot´ezy o shodˇe teoretick´eho a empirick´eho rozdˇelen´ı. Test hypot´ezy, ˇze n´ ahodn´ y v´ ybˇer poch´az´ı z rozdˇelen´ı se spojitou zn´amou distribuˇcn´ı funkc´ı F0 (x), m˚ uˇzeme prov´est pomoc´ı takzvan´eho Kolmogorov-Smirnovova testu. Tento test je zaloˇzen na statistice D = supx∈R |Fn (x) − F0 (x)| , kde empirick´ a distribuˇcn´ı funkce Fn (x) je definov´ana v paragrafu V.3.6. Pomoc´ı t´eto definice
29
Kap. 2: Stochastick´e repetitorium . . .
lze statistiku D zapsat tak´e ve tvaru i − 1 i D = max1≤i≤n max F0 (X(i) ) − , F0 (X(i) ) − n n Hypot´eza H : F (x) = F0 (x) bude zam´ıtnuta na hladinˇe v´ yznamnosti α ve prospˇech alternativy A : F (x) 6= F0 (x) alespoˇ n pro jedno x, jestliˇze D ≤ Dn (1 − α), pˇriˇcemˇz hodnoty Dn (1 − α) jsou mal´a n tabelov´ any viz [Ja]) a pro velk´a n(n > 100) lze pouˇz´ıt aproximaci (viz [Zv]) Dn (1 − α) ∼ =
r −
1 α ln . 2n 2
Tento test lze spr´ avnˇe pouˇz´ıt pouze pro takov´e hypot´ezy, kter´e urˇcuj´ı funkci F0 , jednoznaˇcnˇe, vˇcetnˇe jej´ıch parametr˚ u. χ2 -test dobr´ e shody vych´ az´ı z tˇr´ıdn´ıho rozdˇelen´ı n´ahodn´eho v´ ybˇeru. Nejprve tedy provedeme rozklad namˇeˇren´ ych hodnot do disjunktn´ıch tˇr´ıdn´ıch interval˚ u pomoc´ı zvolen´eho dˇelen´ı a0 < a1 < a2 < · · · < ak a spoˇcteme ˇcetnosti ni (viz V.2.1). D´ale spoˇcteme hypotetick´e pravdˇepodobnosti pi = F0 (ai ) − F0 (ai−1 ). Pˇri volbˇe tˇr´ıdn´ıch interval˚ u se doporuˇcuje dodrˇzet z´asadu aby teoretick´e ˇcetnosti npi pro vˇsechna i byly vˇetˇs´ı nebo alespoˇ n rovny ˇc´ıslu 5. Hypot´ezu, ˇze v´ ybˇer je z rozdˇelen´ı s distribuˇcn´ı funkc´ı F0 (x) potom testujeme pomoc´ı statistiky χ2 = Σki=1
(ni − npi )2 npi
Pˇri tomto postupu je tˇreba rozliˇsit dva pˇr´ıpady: a) Hypot´ezu urˇcuje distribuˇcn´ı funkci jednoznaˇcnˇe, vˇcetnˇe parametr˚ u. Potom m´a statistika χ2 asyptoticky, to znamen´ a pˇribliˇznˇe pro velk´a n, rozdˇelen´ı χ2 (k − 1). Bude-li tedy
χ2 ≥ χ2k−1 (1 − α) kde χ2k−1 (1−α) je (1−α)-kvantil rozdˇelen´ı χ2 (k−1) zam´ıtneme nulovou hypot´ezu H : X1 , . . . , Xn poch´ az´ı z rozdˇelen´ı s distribuˇcn´ı funkc´ı F0 (x) proti alternativˇe A :toto rozdˇelen´ı je jin´e, na hladinˇe v´ yznamnosti α b) Teoretick´e ˇcetnosti pi z´ avis´ı na l nezn´ am´ ych parametrech. V takov´em pˇr´ıpadˇe pouˇzijeme pˇri v´ ypoˇctu pi odhady tˇechto parametr˚ u. Pˇritom se sn´ıˇz´ı poˇcet stupˇ n˚ u volnosti rozdˇelen´ı statistiky χ2 pr´avˇe o poˇcet odhadnut´ ych parametr˚ u na (k − 1 − l). Kritick´ y obor pˇri hladinˇe v´ yznamnosti α potom bude d´ an nerovnost´ı χ2 ≥ χ2k−1−l (1 − α)
2.2. Testov´ an´ı statistick´ ych hypot´ez
30
K ovˇeˇren´ı pˇredpokladu norm´ aln´ıho rozdˇelen´ı lze pouˇz´ıt testy normality zaloˇzen´e na v´ ybˇerov´ ych koeficientech ˇ sikmosti A3 a ˇ spiˇ catosti A4 . Pro tyto statistiky (viz. V.3.4) plat´ı n´asleduj´ıc´ı vztahy: E(A3 ) = 0, V ar(A3 ) =
6(n−2) (n+1)(n+3)
24n(n−2)(n−3) 6 E(A4 ) = − n+1 , V ar(A4 ) = (n+1) 2 (n+3)(n+5) √ √ y na ˇsikmosti pˇriˇcemˇz nA3 a nA4 maj´ı pˇri n → ∞ pˇribliˇznˇe norm´aln´ıho rozdˇelen´ı. Test zaloˇzen´
zam´ıtnˇe hypot´ezu o normalitˇe, pokud |A3 | p
V ar(A3 )
≥ u(1 −
α ) 2
test zaloˇzen´ y na ˇspiˇcatosti zam´ıtne hypot´ezu o normalitˇe, pokud α |A4 − E(A4 )| p ≥ u(1 − ) 2 V ar(A4 ) yznamnosti obou test˚ u je asymptoticky kde u(1− α2 ) je (1− α2 )-kvantil rozdˇelen´ı N (0, 1). Hladina v´ rovna α. Pˇri ovˇeˇrov´ an´ı normality je vhodn´e prov´est oba testy. Hypot´ezu nezam´ıtneme teprve tehdy, pokud ji nelze zam´ıtnout obˇema testy z´aroveˇ n. Tyto testy jsou v nˇekter´ ych pˇr´ıpadech citlivˇejˇs´ı na poruˇsen´ı normality neˇz χ2 test, podrobnˇejˇs´ı informace nalezne ˇcten´aˇr v [An].
2.2.4
Nˇ ekter´ e neparametrick´ e testy
Znam´ enkov´ y test je test o hodnotˇe medi´anu (viz V.3.7). Pˇredpokl´ad´ame, ˇze v´ ybˇer X1 , . . . , Xn je z rozdˇelen´ı se spojitou distribuˇcn´ı funkc´ı F (x). Budeme testovat hypot´ezu H : xf 50 = x0 proti alternativˇe xf e v´ yznamnosti α. Vytvoˇr´ıme posloupnost rozd´ıl˚ u X1 −x0 , . . . , Xn − 50 6= x0 na hladinˇ x0 . Oznaˇcme Z poˇcet ˇclen˚ u t´eto posloupnosti s kladn´ ym znam´enkem a m poˇcet nenulov´ ych rozd´ıl˚ u. Z je n´ ahodn´ a veliˇcina s binomick´ ym rozdˇelen´ım (viz II.3.2) s parametry m a
1 2.
Pro
mal´a m lze tedy stanovit kritick´ y obor pro dan´e α urˇcen´ım cel´eho ˇc´ısla c tak, aby byly splnˇeny nerovnosti c m X m 1 i=1
i
2
c+1 m α X m 1 ≤ < 2 i 2 i=1
Hypot´ezu H potom zam´ıtneme, pokud Z < c nebo m − c < Z. Pro vˇetˇs´ı m lze vyuˇz´ıt aproximace binomick´eho rozdˇelen´ı rozdˇelen´ım norm´aln´ım (viz vˇeta v IV.2.1) a kritick´ y obor vyj´adˇrit pomoc´ı (1 −
α 2 )-kvantilu
rozdˇelen´ı N (0, 1) nerovnost´ı
|2Z−m| √ m
≥ u(1 −
α 2 ).
Pro jednostrann´e alternativy
vytvoˇr´ıme kritick´ y obor analogicky jako v VII.2.1. Jednov´ ybˇ erov´ y Wilcoxon˚ uv test. Pˇredpokl´ad´ame, ˇze {X1 , . . . , Xn } je v´ ybˇer z rozdˇelen´ı se spojitou distribuˇcn´ı funkc´ı F (x), kter´a je symetrick´a kolem medi´anu xf f 50 (neboli F (x 50 − x) =
31
Kap. 2: Stochastick´e repetitorium . . .
1 − F (xf et testovat hypot´ezu H : (xf e (xf 50 + x). Budeme opˇ 50 = x0 ) proti alternativˇ 50 6= x0 ) na hladinˇe v´ yznamnosti α. Podobnˇe jako v VII.4.l i v tomto pˇr´ıpadˇe vytvoˇr´ıme posloupnost rozd´ıl˚ u X1 − x0 , . . . , Xn − x0 a d´ ale budeme poˇc´ıtat pouze s nenulov´ ymi rozd´ıly, jejichˇz poˇcet oznaˇc´ıme m. Tuto posloupnost uspoˇr´ ad´ ame vzestupnˇe podle absolutn´ıch hodnot a oznaˇc´ıme Ri+ poˇrad´ı n´ahodn´e veliˇciny |Xi − x0 |. Seˇcteme-li poˇrad´ı Ri+ pro vˇsechny ˇcleny, pro kter´e je Xi − x0 > 0 a tento souˇcet oznaˇc´ıme S + , dostaneme statistiku, pro kterou za platnosti hypot´ezy plat´ı
E(S + ) =
m(m + 1) m(m + 1)(2m + 1) , V ar(S + ) = 4 24
a pro velk´a m je jej´ı rozdˇelen´ı pˇribliˇznˇe norm´aln´ı. Proto budeme pracovat radˇeji s normovanou +
+
veliˇcinou V = S√ −E(S+ ) . Hypot´ezu tedy zam´ıtneme, pokud |V | ≥ v(1 − V ar(S )
α 2 ).
Pro mal´e hodnoty
m jsou kritick´e hodnoty v(1 − α2 ) tabelov´ any, pro velk´a m lze pouˇz´ıt kvantily rozdˇelen´ı N (0, 1). Dvouv´ ybˇ erov´ y Wilcoxon˚ uv test slouˇz´ı k testov´an´ı hypot´ezy o shodˇe distribuˇcn´ıch funkc´ı dvou v´ ybˇer˚ u. Necht’ {X1 , . . . , Xn } a {Y1 , . . . , Ym } jsou dva nez´avisl´e v´ ybˇery ze dvou spojit´ ych rozdˇelen´ı. Za platnosti hypot´ezy jsou tato rozdˇelen´ı totoˇzn´a a spojen´ y v´ ybˇer {X1 , . . . , Xn , Y1 , . . . , Ym } lze povaˇzovat za v´ ybˇer z jednoho rozdˇelen´ı. Oznaˇcme RiX poˇrad´ı veliˇcin Xi ve spojen´em v´ ybˇeru, P n uspoˇr´adan´em podle velikosti a necht’ RX = i=1 RiX . Potom je E(RX ) =
m(m + n + 1) mn(m + n + 1) , V ar(RX ) = 2 12
Test lze zaloˇzit pˇr´ımo na statistice RX a kritick´ y obor je potom urˇcen nerovnost´ı RX ≥ wm,n (1 − α 2 ),
kde kritick´e hodnoty wm,n (1 − α2 ) jsou tabelov´any (viz napˇr. [An], [Sk], [Zv]). Pro pˇribliˇzn´ y X
X
test pouˇzijeme normovanou veliˇcinu W = R√−E(RX
D(R )
)
, kter´a m´a za platnosti hypot´ezy pro velk´e
rozsahy m a n pˇribliˇznˇe rozdˇelen´ı N (0, 1). Oba uveden´e testy - znam´enkov´ y i Wilcoxon˚ uv - jsou ˇcastou pouˇz´ıv´any jako testy p´ arov´ e nam´ısto p´arov´eho t-testu.
2.3
Regresn´ı anal´ yza
2.3.1
Regresn´ı z´ avislost
V matematice vyjadˇrujeme z´ avislost hodnot jedn´e promˇenn´e na hodnot´ach druh´e promˇenn´e funkˇcn´ım vztahem. V praktick´ ych u ´loh´ ach je vˇsak situace sloˇzitˇejˇs´ı. Pˇri mˇeˇren´ı hodnot sledovan´e veliˇciny, pˇri jej´ıˇz realizaci p˚ usob´ı ˇrada dalˇs´ıch (n´ahodn´ ych) vliv˚ u, dost´av´ame soubor namˇeˇren´ ych hodnot, kter´e vykazuj´ı ˇcasto jist´e odchylky proti hodnot´am, kter´e bychom oˇcek´avali
2.3. Regresn´ı anal´ yza
32
z teoretick´eho rozboru sledovan´eho jevu nebo z jak´esi oˇcek´avan´e pravidelnosti.
Pˇ r´ıklad 2.3.1 Pˇri soustruˇzen´ı vznik´ a v m´ıstˇe obr´ abˇen´ı na n´ astroji teplota, z´ avisl´ a na rychlosti posuvu n´ astroje. Mezi teplotou θ mˇeˇrenou ve stupn´ıch Celsia a rychlost´ı posuvu v v metrech za minutu byl odvozen teoretick´y vztah θ = αv β , kde α a β jsou konstanty, z´ avisej´ıc´ı na dalˇs´ıch podm´ınk´ ach experimentu. Hodnoty, kter´e byly namˇeˇreny pˇri laboratorn´ım mˇeˇren´ı, vˇsak tomuto vztahu odpov´ıdaj´ı jen velmi pˇribliˇznˇe, jak lze vidˇet z grafu. Pˇredpokl´ adejme, ˇze sledovanou n´ahodnou veliˇcinu Y lze vyj´adˇrit jako funkci (zpravidla nen´ahodn´ ych) veliˇcin X1 , . . . , Xr a n´ ahodn´e odchylky jako
Y = f (X1 , . . . , Xr ; θ1 , . . . , θs ) + .
Funkce f se naz´ yv´ a regresn´ı funkce a θ1 , . . . , θs naz´ yv´ame parametry regrese. O n´ahodn´e veliˇcinˇe , kter´ a se ˇcasto naz´ yv´ a nepr´avem chybou“, pˇredpokl´ad´ame, ˇze m´a symetrick´e rozdˇelen´ı ” se stˇredn´ı hodnotou 0 a rozptylem σ 2 . Obvykl´ y je pˇredpoklad norm´aln´ıho rozdˇelen´ı N (0, σ 2 ). Uveden´ y vztah se naz´ yv´ a regresn´ı model. Podle druhu z´avislosti regresn´ı funkce na nezn´am´ ych parametrech θ1 , . . . , θs potom hovoˇr´ıme bud’ o line´ arn´ım regresn´ım modelu nebo o neline´ arn´ım regresn´ım modelu. Nad´ ale se budeme zab´ yvat pouze line´arn´ım modelelm. Stˇredn´ı hodnota E(Y ) je potom funkc´ı hodnot veliˇcin X1 , . . . , Xr a nezn´am´ ych parametr˚ u θ1 , . . . , θs . Tuto vlastnost vyj´ adˇr´ıme vztahem
E(Y ) = f (x1 , . . . , xr ; θ1 , . . . , θs ),
kde x1 , . . . , xr jsou namˇeˇren´e hodnoty veliˇcin X1 , . . . , Xr a θ1 , . . . , θs jsou parametry. N´ ahodn´e veliˇcinˇe Y se ˇr´ık´ a vysvˇ etlovan´ a promˇ enn´ a, veliˇcin´am X1 , . . . , Xr budeme ˇr´ıkat vysvˇ etluj´ıc´ı promˇ enn´ e. Podle tvaru regresn´ı funkce budeme mluvit o pˇ r´ımkov´ e, exponenci´ aln´ı, kvadratick´ e, polynomick´ e a jin´ ych regres´ıch. V pˇr´ıpadˇe pˇr´ımkov´e regrese rozliˇsujeme podle poˇctu vysvˇetluj´ıc´ıch promˇenn´ ych tzv. jednoduchou regresi s jednou vysvˇetluj´ıc´ı promˇennou a v´ıcen´ asobnou regresi s v´ıce vysvˇetluj´ıc´ımi promˇenn´ ymi. V z´ asadˇe zde m´ ame dva probl´emy: urˇcit tvar (typ) regresn´ı funkce a Pˇri vyˇsetˇrov´an´ı regresn´ı z´avislosti je regresn´ı funkce zpravidla zn´ama (vypl´ yv´a z teoretick´ ych vztah˚ u) nebo se jej´ı tvar odhaduje (opticky, napˇr´ıklad podle X-Y grafu rozpt´ ylenosti). Proto se v dalˇs´ım textu omez´ıme na u ´lohu odhadu regresn´ıch parametr˚ u pˇredpokl´adan´e regresn´ı funkce. K tomu nejˇcastˇeji pouˇz´ıv´ame tzv. metodu nejmenˇ s´ıch ˇ ctverc˚ u. Tato metoda spoˇc´ıv´a v proveden´ı n nez´avisl´ ych mˇeˇren´ı
33
Kap. 2: Stochastick´e repetitorium . . .
hodnot veliˇcin Y, X1 , . . . , Xr a v nalezen´ı hodnot θˆ1 , . . . , θˆs , pˇri nichˇz funkce 2 n X S(θ1 , . . . , θs ) = yi − f (x1i , . . . , xri ; θ1 , . . . , θs ) i=1
nab´ yv´a sv´eho minima. Vektory yi , x1i , . . . , xri oznaˇcuj´ı i-t´e pozorov´an´ı vektoru Y, X1 , . . . , Xr , i = 1, . . . , n. Nejsme-li si jisti a rozhodujeme-li se mezi nˇekolika modely, potom zpravidla vol´ıme ten, v nˇemˇz je hodnota funkce S(θ1 , . . . , θs ) – takzvan´ y rezidu´ aln´ı souˇ cet ˇ ctverc˚ u – nejmenˇs´ı. V pˇr´ıpadˇe line´ arn´ı regresn´ı funkce f (x, α, β) = α+βx budeme minimalizovat funkci S(α, β) = Pn 2 ınkou pro extr´em funkce dvou promˇenn´ ych je nulovost obou i=1 (yi − α − βxi ) . Nutnou podm´ parci´aln´ıch derivac´ı ∂S ∂α
= −2
n X (yi − α − βxi ) = 0 i=1
n X = −2 (yi − α − βxi )xi = 0,
∂S ∂β
i=1
coˇz vede k takzvan´e soustavˇ e norm´ aln´ıch rovnic
nα + β α
n X i=1
xi + β
n X i=1 n X
xi x2i
i=1
= =
n X i=1 n X
yi yi xi
i=1
jej´ımˇz ˇreˇsen´ım dostaneme bodov´e odhady a a b parametr˚ uαaβ Pn (xi − x)yi b = Pi=1 n 2 i=1 (xi − x) Pn (xi − x)yi x = y − bx a = y − Pi=1 n 2 i=1 (xi − x) kde x =
1 n
Pn
i=1
xi , y =
1 n
Pn
i=1
yi . Podm´ınku postaˇcuj´ıc´ı nen´ı tˇreba vyˇsetˇrovat, nebot’ funkce
S(α, β) je ryze konvexn´ı.
2.3.2
Jednoduch´ a pˇ r´ımkov´ a regrese
Velmi ˇcast´ ym pˇr´ıpadem regresn´ı z´ avislosti je pˇ r´ımkov´ a regrese. Pˇredpokl´adejme regresn´ı vztah Y = α + βX + , kde X je n´ ahodn´ a veliˇcina a je n´ahodn´a veliˇcina s norm´aln´ım rozdˇelen´ım N (0, σ 2 ). Bodov´e odhady a a b parametr˚ u α a β z´ısk´ame metodou nejmenˇs´ıch ˇctverc˚ u ve tvaru uve-
2.3. Regresn´ı anal´ yza
34
den´em v pˇr´ıkladˇe VIII.1.6. Namˇeˇren´e hodnoty y1 , . . . , yn lze povaˇzovat za hodnoty realizac´ı nez´avisl´ ych n´ ahodn´ ych veliˇcin Y1 , . . . , Yn s norm´aln´ım rozdˇelen´ım N (a + bxi , σ 2 ). Z tohoto hlediska jsou bodov´e odhady a a b odhadov´ ymi statistikami, a tedy n´ahodn´ ymi veliˇcinami. Hodnoty ei = yi −a−bxi , i = 1, . . . , n se naz´ yvaj´ı rezidua a lze je povaˇzovat za odhady hodnot chybov´eho ˇ ıslo yˆi = a + bxi je odhadem hodnoty n´ahodn´e veliˇciny Yi . ˇclenu . C´ Oznaˇcme SR = S(a, b) takzvan´ y rezidu´ aln´ı souˇ cet ˇ ctverc˚ u
SR =
n X
e2i =
i=1
n X
yi − a − bxi 2 =
i=1
n X i=1
yi2 − a
n X
yi − b
i=1
n X
xi yi .
i=1
Bodov´ y odhad s2 rozptylu σ 2 chybov´eho ˇclenu je potom d´an vztahem s2 =
SR (n−2)
a naz´ yv´a se
rezidu´ aln´ı rozptyl. Pomoc´ı s2 lze vyj´ adˇrit odhady rozptylu obou regresn´ıch parametr˚ u
Sa2 =
Statistiky Tα =
(a−α) Sa
n
Pn s2 i=1 x2i s2 Pn , Sb2 = Pn 2 2 2 2 i=1 xi − ( i=1 xi ) i=1 xi − nx
Pn
a Tβ =
(b−β) Sb
maj´ı Studentovo t-rozdˇelen´ı o (n − 2) stupn´ıch volnosti.
Intervalov´e odhady pro parametry α a β jsou potom d´any nerovnostmi
a − Sa tn−2 (1 −
γ γ ) ≤ α ≤ a + Sa tn−2 (1 − ) 2 2
b − Sb tn−2 (1 −
γ γ ) ≤ β ≤ b + Sb tn−2 (1 − ) 2 2
kde (1−γ) je koeficient spolehlivosti a tn−2 (1− γ2 ) je (1− γ2 )-kvantil t-rozdˇelen´ı o (n−2) stupn´ıch volnosti. V nˇekter´ ych pˇr´ıpadech n´ as zaj´ım´a, zda hodnota nˇekter´eho z parametr˚ u se liˇs´ı v´ yznamnˇe od nulov´e hodnoty nebo ne a zda jej lze tud´ıˇz v regresn´ı funkci vynechat. Oboustrann´e testy nulovosti regresn´ıch koeficient˚ u lze zaloˇzit na odhadov´ ych statistik´ach Ta =
a Sa
resp. Tb =
b Sb
a
jim odpov´ıdaj´ıc´ım kritick´ ym obor˚ um tak, ˇze pˇri splnˇen´ı nerovnosti
|Ta | ≥ tn−2 (1 −
γ γ ), resp. |Tb | ≥ tn−2 (1 − ), 2 2
zam´ıtneme hypot´ezu o nulovosti parametru α, resp. β, na hladinˇe v´ yznamnosti γ. Regresn´ım modelem se snaˇz´ıme vysvˇetlit zmˇeny - variabilitu - vysvˇetlovan´e veliˇciny Y pomoc´ı zmˇen vysvˇetluj´ıc´ı veliˇciny X. Pod´ıl ˇc´asti variability Y vysvˇetlen´e modelem ku celkov´e variabilitˇe
35
Kap. 2: Stochastick´e repetitorium . . .
Y , zpravidla vyj´ adˇren´ y v procentech, se naz´ yv´a koeficient determinace R2 a je d´an vztahy Pn (a + bxi − y)2 SR i=1 Pn R = = 1 − Pn , 2 2 i=1 (yi − y) i=1 (yi − y 2
kde SR je rezidu´ aln´ı souˇcet ˇctverc˚ u. K u ´pln´e regresn´ı anal´ yze patˇr´ı i anal´ yza rezidu´ı. Pˇredevˇs´ım by mˇely vyhovovat pˇredpokladu normality, za kter´eho byly vˇsechny pˇredchoz´ı v´ ysledky odvozeny. Pokud tomu tak nen´ı, nelze v´ ysledky povaˇzovat za d˚ uvˇeryhodn´e. K ovˇeˇren´ı shody hodnot rezidu´ı s norm´aln´ım rozdˇelen´ım lze pouˇz´ıt nˇekter´ y z test˚ u, uveden´ ych v odstavci VII.3, nebo pravdˇepodobnostn´ı pap´ır, kter´ y je pops´an v kapitole X. Z anal´ yzy rezidu´ı lze detekovat i takzvan´a odlehl´ a pozorov´ an´ı. To znamen´a ty hodnoty, kter´e byly chybnˇe namˇeˇreny nebo indikuj´ı nesrovnalosti v modelu, a jimˇz je tˇreba vˇenovat zvl´ aˇstn´ı pozornost. Ke zjiˇst’ov´an´ı tˇechto hodnot lze pouˇz´ıt napˇr´ıklad krabicov´e gragy, popsan´e v kapitole X. Model line´ arn´ı regrese lze pouˇz´ıt i v nˇekter´ ych pˇr´ıpadech, kdy z´avislost mezi veliˇcinami X a Y nen´ı line´ arn´ı. Jsou to pˇr´ıpady, kdy lze prov´est takzvanou linearizaci modelu. Vhodnou transformac´ı pˇrevedeme neline´ arn´ı z´ avislost na line´arn´ı a pouˇzijeme line´arn´ı regresn´ı model. Pˇritom vˇsak mus´ıme b´ yt velmi opatrn´ı, nebot’ vˇse, co bylo odvozeno pro line´arn´ı regresn´ı model za pˇredpokladu normality chybov´eho ˇclenu plat´ı pouze pro ”linearizovan´ y model”, nikoli pro model p˚ uvodn´ı, a to opˇet za pˇredpokladu, ˇze n´ahodn´a veliˇcina, odpov´ıdaj´ıc´ı transformovan´emu chybov´emu ˇclenu v linearizovan´em modelu, m´a norm´aln´ı rozdˇelen´ı. Pˇ r´ıklad 2.3.2 Z´ avislost mezi teplotou θ a rychlost´ı posuvu v v pˇr´ıkladu 3.3.1. lze povaˇzovat za regresn´ı z´ avislost ve tvaru θ = α.v β ., kde α a β jsou regresn´ı koeficienty a je n´ ahodn´ a veliˇcina se stˇredn´ı hodnotou 1. Provedeme-li transformaci Y = lnθ, X = lnv, a = lnα, e = lnab = β, dostaneme Y = a + bX + e, tedy line´ arn´ı vztah. Podobnˇe jako v pˇredchoz´ım pˇr´ıkladu lze linearizovat i jin´e modely, napˇr. logaritmick´ y, tj. Y = ln(α + β.X), reciprok´ yY =
1 α+β.X
a dalˇs´ı.
2.3. Regresn´ı anal´ yza
36
Kapitola 3
Jednofaktorov´ e experimenty Z pˇredchoz´ıho textu je zˇrejm´e, ˇze velikost experiment se rychle zvyˇsuje s mnoˇzstv´ım faktor˚ u, nebo poˇctem jejich u ´rovn´ı. Napˇr´ıklad, pokud m´ ame sledovat dva faktory ve tˇrech u ´rovn´ıch, je v pˇr´ıpadˇe u ´pln´eho experimentu poˇzadov´ ano pozorov´ an´ı 9 (tedy 3 × 3) r˚ uzn´ ych kombinac´ı. Pˇrid´ame-li tˇret´ı faktor se tˇremi u ´rovnˇemi, poˇcet kombinac´ı naroste na 27 (3 × 3 × 3). Pˇri ˇctvrt´em faktoru se tˇremi u ´rovnˇemi uˇz je to 81 kombinac´ı. Pouˇzijeme-li pouze dvˇe u ´rovnˇe pro kaˇzd´ y faktor, pak v pˇr´ıpadˇe ˇctyˇr faktor˚ u potˇrebujeme jen 16 (2 × 2 × 2 × 2) kombinac´ı. Z tohoto d˚ uvodu se ˇcasto n´avrh experimentu omezuje na dvˇe u ´rovnˇe. Dalˇs´ıho sn´ıˇzen´ı poˇctu pozorovan´ ych kombinac´ı lze dos´ahnout pˇri d´ılˇc´ıch (ne´ upln´ ych) faktori´ aln´ıch n´avrz´ıch experiment˚ u. V t´eto kapitole budeme uvaˇzujme situaci, kdy pˇredpokl´ad´ame, ˇze na odezvu p˚ usob´ı pouze jedin´ y faktor. Tento pˇredpoklad je ˇcasto zjednoduˇsen´ım re´aln´eho stavu, ale z praktick´eho hlediska je pomˇernˇe dobˇre uchopiteln´ y, realizovateln´ y a snadno pochopiteln´ y. Pˇ r´ıklad 3.0.3 Spotˇreba nit´ı v krejˇcovsk´e v´yrobˇe se m˚ uˇze liˇsit pˇri pouˇzit´ı r˚ uzn´ych typ˚ u ˇsic´ıch stroj˚ u. Uvaˇzujme dva pouˇz´ıvan´e typy: stroje s asynchronn´ım motorem a stroje se servomotorem. Je prokazateln´y vliv typu ˇsic´ıho stroje na spotˇrebu? Pˇ r´ıklad 3.0.4 Pro tiˇstˇen´ı vodiv´ych drah na textili´ıch nebo celkovou u ´pravu textili´ı vedouc´ı k elektrick´e vodivosti textilie se nab´ız´ı vyuˇzit´ı recyklovan´ych uhl´ıkov´ych vl´ aken v pruˇzn´ych kompozitn´ıch materi´ alech. Vzorky kompozitn´ıch materi´ al˚ u byly zhotoveny z nanoˇca ´stic C-vl´ aken v pomˇerech 50%, 70%, 80% a 90% s disperzn´ım lepidlem. Je zkoum´ an vliv koncentrace uhl´ıkov´ych vl´ aken na povrchovou rezistivitu vzork˚ u. Pˇ r´ıklad 3.0.5 Odolnost bakelitov´eho krytu sp´ınaˇce z´ avis´ı na teplotˇe, pˇri kter´e doch´ az´ı k jeho vytvrzov´ an´ı. Jak´ a je optim´ aln´ı teplota pro dosaˇzen´ı nejlepˇs´ı pevnosti? 37
3.1. Dvou´ urovˇ nov´e jednofaktorov´e experimenty
38
Pˇ r´ıklad 3.0.6 M´ ame rozhodnout, kter´ a metoda je vhodnˇejˇs´ı pro mˇeˇren´ı z´ atrhovosti textili´ı. Testujeme 20 vzork˚ u r˚ uzn´ych textili´ı a porovn´ av´ ame namˇeˇren´e hodnoty jednotliv´ymi metodami na kaˇzd´em vzorku. Pˇ r´ıklad 3.0.7 Pˇredmˇetem experimentu je porovn´ an´ı v´yparn´eho odporu na r˚ uzn´ych druz´ıch hasiˇcsk´ych uniforem pˇred a po pran´ı. Pro mˇeˇren´ı bylo vybr´ ano pˇet vzork˚ u r˚ uzn´ych v´yrobc˚ u. V´ysledkem jsou dvˇe hodnoty v´yparn´eho odporu pro kaˇzd´y vzorek, kter´e indikuj´ı vliv pran´ı. Zaj´ım´ a n´ as, kter´y v´yrobce dod´ av´ a v´yrobky vhodnˇejˇs´ı z hlediska komfortn´ıch vlastnost´ı, mezi nˇeˇz v´yparn´y odpor patˇr´ı. Pˇet uveden´ ych pˇr´ıklad˚ u m´ a jedno spoleˇcn´e: vˇzdy se jedn´a o pˇredpokl´adanou z´avislost odezvy na jedin´em ovlivˇ nuj´ıc´ım faktoru. Rozd´ıl je v tom, ˇze v prvn´ım pˇr´ıpadˇe faktor nab´ yv´a pouze dvou u ´rovn´ı (dva typy ˇsic´ıch stroj˚ u), ve druh´em pˇr´ıpadˇe rozliˇsujeme ˇctyˇri u ´rovnˇe, zat´ımco ve tˇret´ım pˇr´ıpadˇe m˚ uˇze faktor, kter´ ym je teplota, nab´ yvat teoreticky nekoneˇcnˇe mnoha hodnot (´ urovn´ı) z nˇejak´eho pˇr´ıpustn´eho intervalu (dan´eho technologick´ ym postupem). Ve ˇctvrt´em a p´at´em pˇr´ıpadˇe se jedn´ a o pozorov´ an´ı ”po dvojic´ıch”, kdy na jednom vzorku namˇeˇr´ıme vˇzdy dvˇe r˚ uzn´e odezvy za r˚ uzn´ ych u ´rovn´ı ovlivˇ nuj´ıc´ıho faktoru. V tˇechto pˇr´ıpadech m˚ uˇze hodnota odezvy z´aviset i na dalˇs´ıch vlastnostech jednotliv´ ych vzork˚ u. Tyto rozd´ıly samozˇrejmˇe ovlivn´ı zp˚ usob navrˇzen´ı experimentu a pˇredevˇs´ım anal´ yzu jejich v´ ysledk˚ u. V dalˇs´ım textu si pop´ıˇseme nˇekter´e z´akladn´ı pˇr´ıstupy k ˇreˇsen´ı podobn´ ych u ´loh.
3.1
Dvou´ urovˇ nov´ e jednofaktorov´ e experimenty
Uvaˇzujme nyn´ı situace, kdy faktor nab´ yv´a pouze dvou u ´rovn´ı. V takov´em pˇr´ıpadˇe potˇrebujeme prov´est mˇeˇren´ı ˇci pozorov´ an´ı pˇri kaˇzd´e z tˇechto u ´rovn´ı. Dostaneme tak dvˇe skupiny hodnot odezvy, kter´e mezi sebou budeme porovn´avat. Pˇri n´ avrhu takov´eho experimentu mus´ıme rozhodnout n´asleduj´ıc´ı ot´azky: • kolik budeme prov´ adˇet replikac´ı (mˇeˇren´ı)? • jak vybereme jednotliv´e pˇr´ıpady? • budeme sdruˇzovat mˇeˇren´ı do blok˚ u? • jak´e metody pouˇzijeme pro vyhodnocen´ı v´ ysledk˚ u? Pˇ r´ıklad 3.1.1 Kolikr´ at je tˇreba zmˇeˇrit fyzik´ aln´ı veliˇcinu jej´ıˇz pˇresn´ a hodnota je m, abychom mohli s pravdˇepodobnost´ı 0, 96 tvrdit, ˇze pr˚ umˇer tˇechto mˇeˇren´ı se liˇs´ı od m o m´enˇe neˇz 2? Je zn´ amo, ˇze smˇerodatn´ a odchylka mˇeˇric´ı metody je σ = 4.
39
Kap. 3: Jednofaktorov´e experimenty
ˇ sen´ı: Pˇresn´ Reˇ a hodnota m pˇredstavuje stˇredn´ı hodnotu mˇeˇren´ı Xi , i = 1, . . . , n, DXi = σ 2 = 16. Pn ˇ Pro Sn = i=1 je ESn = nm, DSn = 16n, pouˇzit´ım Cebyˇ sevovy nerovnosti (viz 2.1) a centr´aln´ı limitn´ı vˇety (viz ??) dost´ av´ ame √ √ Sn − nm Sn n n √ P − m < 2 = P < ≈ 2Φ − 1. n 2 2 4 n ´ Posledn´ı v´ yraz m´ a b´ yt roven alespoˇ n 0, 96. Upravou t´eto nerovnosti je √ √ n n 2Φ ≥ 1, 96 a tedy ≥ Φ−1 (0, 96) = 2, 055, 2 2 tedy poˇcet mˇeˇren´ı mus´ı b´ yt alespoˇ n 17. Pˇr´ıklad pˇredstavuje u ´lohu pl´anov´an´ı experimentu na z´akladˇe poˇzadavk˚ u na pˇresnost.
3.1.1
Nez´ avisl´ a mˇ eˇ ren´ı
Jsou-li veliˇciny X a Y nez´ avisl´e, pouˇz´ıv´ ame pro srovn´an´ı stˇredn´ıch hodnot dvou v´ ybˇer˚ u dvouv´ ybˇ erov´ y 2 t-test. Necht’ X1 , . . . , Xn je v´ ybˇer z rozdˇelen´ı N (µX , σX ) a Y1 , . . . , Ym je v´ ybˇer z rozdˇelen´ı
ybˇery jsou na sobˇe nez´ avisl´e. Rozliˇsujeme dva pˇr´ıpady: N (µY , σY2 ) a tyto v´ 2 = σY2 . Potom statistika (1) Oba v´ ybˇery maj´ı stejn´ e rozptyly σX
¯ − Y¯ r mn X T = , S m+n kde S2 =
n 1 ¯ 2 + Σm ¯ 2 Σi=1 (Xi − X) j=1 (Yj − Y ) m+n−2
m´a za platnosti nulov´e hypot´ezy H : µX = µY Studentovo t-rozdˇelen´ı o m + n − 2 stupn´ıch volnosti. Test uveden´e hypot´ezy proti oboustrann´e alternativˇe A : µX 6= µY na hladinˇe v´ yznamnosti α lze tedy zaloˇzit na nerovnosti y¯ − x ¯ S
r
mn 1 ≥ tm+n−2 (1 − α). m+n 2
Test hypot´ezy H proti jednostrann´ ym alternativ´am A1 : µX ≤ µY , resp. A2 : µX ≥ µY na hladinˇe v´ yznamnosti α je zaloˇzen na nerovnostech r y¯ − x ¯ mn S m+n r y¯ − x ¯ mn S m+n
≥ tm+n−2 (1 − α), ≥ tm+n−2 (α) = −tm+n−2 (α)(1 − α)
3.1. Dvou´ urovˇ nov´e jednofaktorov´e experimenty
40
2 (2) Oba v´ ybˇery maj´ı r˚ uzn´ e rozptyly σX 6= σY2 . Potom pouˇzijeme pˇribliˇzn´ y test, zaloˇzen´ y na
statistice
¯ − Y¯ 1 X 1 Te = , kde Se2 = s2X + s2Y . e n m S Test hypot´ezy H : µX = µY proti oboustrann´e alternativˇe na hladinˇe v´ yznamnosti α lze zaloˇzit na nerovnosti 1 1 2 α 1 α |¯ y−x ¯| ≥ sX tn−1 (1 − ) + s2Y tm−1 (1 − ) 2 m 2 Se Se2 n na nerovnosti 1 y¯ − x ¯ 1 1 2 sX tn−1 (1 − α) + s2Y tm−1 (1 − α) ≥ m Se Se2 n pˇri jednostrann´e alternativˇe A1 : µX ≤ µY a na 1 1 2 1 y¯ − x ¯ ≤− sX tn−1 (1 − α) + s2Y tm−1 (1 − α) m Se Se2 n pˇri alternativˇe A2 : µX ≥ µY . Pˇ r´ıklad 3.1.2 Pˇri zpracov´ an´ı je tˇreba materi´ al zahˇr´ at na vysokou teplotu. Pˇred zpracov´ an´ım bylo vybr´ ano n´ ahodnˇe 10 vzork˚ u a zmˇeˇrena jejich tvrdost. Po zpracov´ an´ı bylo opˇet vybr´ ano n´ ahodnˇe jin´ych 10 vzork˚ u, na nichˇz byla zmˇeˇrena tvrdost. Namˇeˇren´e hodnoty jsou v n´ asleduj´ıc´ı tabulce: pˇred
3,15
2,98
3,00
2,75
3,21
3,33
2,95
2,81
3,26
2,88
po
3,21
2,99
3,11
2,91
3,22
3,28
3,09
3,00
3,28
2,99
Testujte hypot´ezu, ˇze se tvrdost materi´ alu vlivem zpracov´ an´ı nemˇen´ı. ˇ sen´ı: Je m = n = 10. Spoˇcteme x Reˇ ¯ = 3, 032, y¯ = 3, 108, s2x = 0, 03875, s2y = 0, 018. Za pˇredpokladu, ˇze rozptyl pˇred i po zpracov´an´ı z˚ ust´av´a stejn´ y (namˇeˇren´ y rozd´ıl je nev´ yznamn´ y), pouˇzijeme postup, popsan´ y v VII.2.6.a). Dostaneme hodnotu s2 = 0, 02838 a testov´e statistiky T = 1, 009. Pˇri hladinˇe v´ yznamnosti α = 0, 05 je t1 8(0, 975) = 2, 101 a tedy hypot´ezu nelze zam´ıtnout. Pˇ r´ıklad 3.1.3 Uvaˇzujme stejnou u ´lohu jako v pˇredchoz´ım pˇr´ıkladu, pouze s t´ım rozd´ılem, ˇze sledovan´ a veliˇcina je mˇeˇrena pˇred i po zpracov´ an´ı na 10 vzorc´ıch, kter´e byly n´ ahodnˇe vybr´ any pˇred zaˇc´ atkem experimentu. Namˇeˇren´ a data z˚ ust´ avaj´ı stejn´ a. ˇ sen´ı: V tomto pˇr´ıpadˇe je tˇreba vz´ıt do u Reˇ ´vahy z´avislost, kter´a zde m˚ uˇze b´ yt zp˚ usobena dalˇs´ımi vlastnostmi vzork˚ u. Proto pouˇzijeme p´arov´ y t-test. Dost´av´ame z¯ = x ¯−¯ y = −0, 076, sz = 0, 07777.
41
Kap. 3: Jednofaktorov´e experimenty
Testov´a statistika zde bude m´ıt hodnotu T = 3, 09, kterou budeme srovn´avat s ˇc´ıslem t9 = (0, 975) = 2, 262. V tomto pˇr´ıpadˇe hypot´ezu zam´ıtneme. Uveden´e pˇr´ıklady ukazuj´ı, jak´ y vliv na v´ ysledek m˚ uˇze m´ıt tzv. n´ avrh experimentu. Druh´ y pˇr´ıpad l´epe vystihuje skuteˇcnost, ˇze namˇeˇren´a data nejsou nez´ avisl´ a a bere do u ´vahy dalˇs´ı moˇzn´e vlivy, plynouc´ı z individuality vzork˚ u. 2 Uvaˇzujme dva nez´ avisl´e v´ ybˇery: X1 , . . . , Xn z rozdˇelen´ı N (µX , σX ) a Y1 , . . . , Yn z rozdˇelen´ı
N (µY , σY2 ) m˚ uˇzeme prov´est tzv. test shody rozptyl˚ u neboli F-test. K testu hypot´ezy H : 2 σX = σY2 lze pouˇz´ıt napˇr´ıklad statistiku
F =
2 SX SY2
Rozdˇelen´ı statistiky F je podle V.4.6 a V.4.9 za pˇredpokladu H rozdˇelen´ım F o (n − 1) a (m − 1) 2 stupn´ıch volnosti. Kritick´ y obor pro test hypot´ezy H proti oboustrann´e alternativˇe A : σX 6= σY2
na hladinˇe v´ yznamnosti α je urˇcen nerovnostmi s2X α s2X α 1 ≥ F (1 − )a 2 ≤ Fn−1,m−1 ( ) = n−1,m−1 2 sY 2 sY 2 Fn−1,m−1 (1 − α2 ) kde Fn,m (α) je α-kvantil rozdˇelen´ı F (n, m). Tedy hypot´ezu zam´ıt´ame pro mal´a F bl´ızk´a nule a pro velk´a F (pˇri platnosti hypot´ezy by mˇelo b´ yt F bl´ızk´e 1). Kritick´e obory pro test hypot´ezy 2 2 yznamnosti α jsou urˇceny ≤ σY2 na hladinˇe v´ ≥ σY2 A2 : σX H proti alternativ´ am A1 : σX
nerovnostmi s2X s2X 1 ≥ F (1 − α)resp. ≤ Fn−1,m−1 (α) = (1 − α) n−1,m−1 2 2 sY sY Fn−1,m−1
V praxi se ˇcasto pouˇz´ıv´ a tzv. pˇredpokladu normality, t.j., ˇze n´ahodn´ y v´ ybˇer poch´az´ı z norm´aln´ıho rozdˇelen´ı s urˇcitou stˇredn´ı hodnotou a nˇejak´ ym, bl´ıˇze neurˇcen´ ym rozptylem. K ovˇeˇren´ı tohoto pˇredpokladu lze pouˇz´ıt testy normality zaloˇzen´e na v´ ybˇerov´ ych koeficientech ˇ sikmosti A3 a ˇ spiˇ catosti A4 . Pro tyto statistiky (viz. V.3.4) plat´ı n´asleduj´ıc´ı vztahy: E(A3 ) = 0, V ar(A3 ) =
6(n−2) (n+1)(n+3)
6 E(A4 ) = − n+1 , V ar(A4 ) =
pˇriˇcemˇz
24n(n−2)(n−3) (n+1)2 (n+3)(n+5)
√ √ nA3 a nA4 maj´ı pˇri n → ∞ pˇribliˇznˇe norm´aln´ıho rozdˇelen´ı. Test zaloˇzen´ y na ˇsikmosti
zam´ıtnˇe hypot´ezu o normalitˇe, pokud |A3 | p
V ar(A3 )
≥ u(1 −
α ) 2
3.1. Dvou´ urovˇ nov´e jednofaktorov´e experimenty
42
test zaloˇzen´ y na ˇspiˇcatosti zam´ıtne hypot´ezu o normalitˇe, pokud α |A4 − E(A4 )| p ≥ u(1 − ) 2 V ar(A4 ) kde u(1− α2 ) je (1− α2 )-kvantil rozdˇelen´ı N (0, 1). Hladina v´ yznamnosti obou test˚ u je asymptoticky rovna α. Pˇri ovˇeˇrov´ an´ı normality je vhodn´e prov´est oba testy. Hypot´ezu nezam´ıtneme teprve tehdy, pokud ji nelze zam´ıtnout obˇema testy z´aroveˇ n. Tyto testy jsou v nˇekter´ ych pˇr´ıpadech citlivˇejˇs´ı na poruˇsen´ı normality neˇz χ2 test, podrobnˇejˇs´ı informace nalezne ˇcten´aˇr v [An]. Pˇ r´ıklad 3.1.4 Pomoc´ı test˚ u ˇsikmosti a ˇspiˇcatosti testujte normalitu dat z pˇr´ıkladu V.2.3. ˇ sen´ı: Pro v´ Reˇ ybˇerov´e koeficienty ˇsikmosti a ˇspiˇcatosti dost´av´ame hodnoty A3 = −0, 005364, E(A3 ) = 0, D(A3 ) = 0, 129325, A4 = −0, 393762, E(A4 ) = −0, 146341, D(A4 ) = 0, 414962. Testov´a statistika pro test zaloˇzen´ y na ˇsikmosti n´am d´av´a hodnotu 0,015 a statistika pro test zaloˇzen´ y na ˇspiˇcatosti je rovna 0, 384. Porovn´ an´ım s 0, 975-kvantilem standardn9ho norm´aln´ıho rozdˇelen´ı u(0, 975) = 1, 96 tedy nelze zam´ıtnout hypot´ezu o normalitˇe na hladinˇe v´ yznamnosti α = 0, 05 ani jedn´ım z test˚ u. Dvouv´ ybˇ erov´ y Wilcoxon˚ uv test slouˇz´ı k testov´an´ı hypot´ezy o shodˇe distribuˇcn´ıch funkc´ı dvou v´ ybˇer˚ u. Necht’ {X1 , . . . , Xn } a {Y1 , . . . , Ym } jsou dva nez´avisl´e v´ ybˇery ze dvou spojit´ ych rozdˇelen´ı. Za platnosti hypot´ezy jsou tato rozdˇelen´ı totoˇzn´a a spojen´ y v´ ybˇer {X1 , . . . , Xn , Y1 , . . . , Ym } lze povaˇzovat za v´ ybˇer z jednoho rozdˇelen´ı. Oznaˇcme RiX poˇrad´ı veliˇcin Xi ve spojen´em v´ ybˇeru, P n uspoˇr´ adan´em podle velikosti a necht’ RX = i=1 RiX . Potom je E(RX ) =
m(m + n + 1) mn(m + n + 1) , V ar(RX ) = 2 12
Test lze zaloˇzit pˇr´ımo na statistice RX a kritick´ y obor je potom urˇcen nerovnost´ı RX ≥ wm,n (1 − α 2 ),
kde kritick´e hodnoty wm,n (1 − α2 ) jsou tabelov´any (viz napˇr. [An], [Sk], [Zv]). Pro pˇribliˇzn´ y X
X
test pouˇzijeme normovanou veliˇcinu W = R√−E(RX
D(R )
)
, kter´a m´a za platnosti hypot´ezy pro velk´e
rozsahy m a n pˇribliˇznˇe rozdˇelen´ı N (0, 1).
3.1.2
Z´ avisl´ a pozorov´ an´ı
P´ arov´ y t-test. Sledujeme-li na jednom objektu dva podobn´e znaky z´aroveˇ n, pouˇz´ıv´ame n´ahodn´ y v´ ybˇer dvojic n´ ahodn´ ych veliˇcin {(X1 , Y1 ), . . . , (Xn , Yn )}. O veliˇcin´ach Xi a Yi pˇredpokl´ad´ame, ˇze jsou p´ arovˇ e z´ avisl´ e. Napˇr´ıklad mˇeˇren´ı vlastnosti materi´alu pˇred tepeln´ ym zpracov´an´ım a po nˇem na vybran´ ych n vzorc´ıch.
43
Kap. 3: Jednofaktorov´e experimenty Pˇredpokl´adejme, ˇze {X1 , . . . , Xn } je n´ahodn´ y v´ ybˇer z norm´aln´ıho rozdˇelen´ı N (µX , σ 2 ) a
Y1 , . . . , Yn je n´ ahodn´ y v´ ybˇer z rozdˇelen´ı N (µY , σY2 ). Veliˇciny Xi a Yi mohou b´ yt p´arovˇe z´avisl´e. Budeme testovat hypot´ezu o rovnosti stˇredn´ıch hodnot H : µX = µY proti alternativˇe A : µX 6= µY na hladinˇe v´ yznamnosti α. V tomto pˇr´ıpadˇe budeme m´ısto p˚ uvodnˇe sledovan´ ych veliˇcin (X1 , Y1 ), . . . , (Xn , Yn ) pracovat s veliˇcinami Z1 , . . . , Zn , kde Zi = Yi − Xi , i = 1, . . . , n. Protoˇze Xi a Yi maj´ı norm´ aln´ı rozdˇelen´ı, bude se i veliˇcina Z ˇr´ıdit norm´aln´ım rozdˇelen´ım se stˇredn´ı 2 hodnotou µZ = µY − µX a rozptylem σZ , o jehoˇz vztahu k rozptyl˚ um σX a σY nelze vzhledem
k moˇzn´e z´avislosti nic pˇredpokl´ adat. Rovnost stˇredn´ıch hodnot X a Y je ekvivalentn´ı nulovosti stˇredn´ı hodnoty rozd´ılu Z. Pro aritmetick´ y pr˚ umˇer plat´ı z¯ = x ¯ − y¯ a hodnotu v´ ybˇerov´eho rozptylu s2Z spoˇcteme podle vztahu s2Z =
1 Σn (xi − yi − x ¯ + y¯)2 . n − 1 n=1
K testu hypot´ezy H : µZ = 0 na hladinˇe v´ yznamnosti α pouˇzijeme jednov´ ybˇerov´ y t-test (viz VII.2.2), tedy pˇri oboustrann´e alternativˇe A : µ 6= 0 hypot´ezu H zam´ıtneme, pokud sZ α sZ α z¯ = − √ tn−1 (1 − ) nebo √ tn−1 (1 − ) < z¯. 2 2 n n Dalˇs´ı dva uveden´e testy - znam´enkov´ y a Wilcoxon˚ uv - jsou ˇcastou pouˇz´ıv´any jako testy p´arov´e nam´ısto p´arov´eho t-testu. Znam´ enkov´ y test je test o hodnotˇe medi´anu . Pˇredpokl´ad´ame, ˇze v´ ybˇer X1 , . . . , Xn je z rozdˇelen´ı se spojitou distribuˇcn´ı funkc´ı F (x). Budeme testovat hypot´ezu H : xf 50 = x0 proti alternativˇe xf e v´ yznamnosti α. Vytvoˇr´ıme posloupnost rozd´ıl˚ u X1 −x0 , . . . , Xn − 50 6= x0 na hladinˇ x0 . Oznaˇcme Z poˇcet ˇclen˚ u t´eto posloupnosti s kladn´ ym znam´enkem a m poˇcet nenulov´ ych rozd´ıl˚ u. Z je n´ ahodn´ a veliˇcina s binomick´ ym rozdˇelen´ım (viz II.3.2) s parametry m a
1 2.
Pro
mal´a m lze tedy stanovit kritick´ y obor pro dan´e α urˇcen´ım cel´eho ˇc´ısla c tak, aby byly splnˇeny nerovnosti c m X m 1 i=1
i
2
c+1 m α X m 1 ≤ < 2 i 2 i=1
Hypot´ezu H potom zam´ıtneme, pokud Z < c nebo m − c < Z. Pro vˇetˇs´ı m lze vyuˇz´ıt aproximace binomick´eho rozdˇelen´ı rozdˇelen´ım norm´ aln´ım (viz vˇeta v IV.2.1) a kritick´ y obor vyj´adˇrit pomoc´ı (1 −
α 2 )-kvantilu
rozdˇelen´ı N (0, 1) nerovnost´ı
|2Z−m| √ m
≥ u(1 −
α 2 ).
Pro jednostrann´e alternativy
vytvoˇr´ıme kritick´ y obor analogicky jako v VII.2.1. Jednov´ ybˇ erov´ y Wilcoxon˚ uv test. Pˇredpokl´ad´ame, ˇze {X1 , . . . , Xn } je v´ ybˇer z rozdˇelen´ı se spojitou distribuˇcn´ı funkc´ı F (x), kter´ a je symetrick´a kolem medi´anu xf f 50 (neboli F (x 50 − x) =
3.1. Dvou´ urovˇ nov´e jednofaktorov´e experimenty
44
1 − F (xf et testovat hypot´ezu H : (xf e (xf 50 + x). Budeme opˇ 50 = x0 ) proti alternativˇ 50 6= x0 ) na hladinˇe v´ yznamnosti α. Podobnˇe jako v VII.4.l i v tomto pˇr´ıpadˇe vytvoˇr´ıme posloupnost rozd´ıl˚ u X1 − x0 , . . . , Xn − x0 a d´ ale budeme poˇc´ıtat pouze s nenulov´ ymi rozd´ıly, jejichˇz poˇcet oznaˇc´ıme m. Tuto posloupnost uspoˇr´ ad´ ame vzestupnˇe podle absolutn´ıch hodnot a oznaˇc´ıme Ri+ poˇrad´ı n´ahodn´e veliˇciny |Xi − x0 |. Seˇcteme-li poˇrad´ı Ri+ pro vˇsechny ˇcleny, pro kter´e je Xi − x0 > 0 a tento souˇcet oznaˇc´ıme S + , dostaneme statistiku, pro kterou za platnosti hypot´ezy plat´ı
E(S + ) =
m(m + 1) m(m + 1)(2m + 1) , V ar(S + ) = 4 24
a pro velk´ a m je jej´ı rozdˇelen´ı pˇribliˇznˇe norm´aln´ı. Proto budeme pracovat radˇeji s normovanou +
+
veliˇcinou V = S√ −E(S+ ) . Hypot´ezu tedy zam´ıtneme, pokud |V | ≥ v(1 − V ar(S )
α 2 ).
Pro mal´e hodnoty
m jsou kritick´e hodnoty v(1 − α2 ) tabelov´any, pro velk´a m lze pouˇz´ıt kvantily rozdˇelen´ı N (0, 1).
3.1.3
Uspoˇ r´ ad´ an´ı do blok˚ u
Oˇcek´ av´ ame-li, ˇze se experiment´ aln´ı podm´ınky budou bˇehem zkouˇsek mˇenit (samozˇrejmˇe kromˇe c´ılen´ ych zmˇen zkouman´eho faktoru), je vhodn´e uspoˇr´adat zkouˇsky v bloc´ıch. V r´amci kaˇzd´eho bloku se, pokud je to moˇzn´e, vystˇr´ıdaj´ı vˇsechny u ´rovnˇe zkouman´eho faktoru. Poˇrad´ı stˇr´ıd´an´ı u ´rovn´ı faktoru je uvnitˇr kaˇzd´eho bloku n´ahodn´e. Takov´ ym blok˚ um se ˇr´ık´a u ´pln´e zn´ahodnˇen´e bloky. Nen´ı-li moˇzn´e v r´ amci bloku vystˇr´ıdat vˇsechny u ´rovnˇe zkouman´eho faktoru (ne´ upln´e bloky), je pl´ anov´ an´ı experimentu sloˇzitˇejˇs´ı. T´ımto pˇr´ıpadem se zde ale nebudeme zab´ yvat. Pˇ r´ıklad 3.1.5 Pomoc´ı experimentu zkoum´ ame vliv pouˇzit´eho katalyz´ atoru na v´ytˇeˇzek chemick´eho procesu a chceme vybrat nejvhodnˇejˇs´ı ze ˇctyˇr typ˚ u. Odezvou je v´ytˇeˇzek chemick´eho procesu, tj. mnoˇzstv´ı vyr´ abˇen´e l´ atky, zkouman´y faktor, katalyz´ ator, m´ a ˇctyˇri u ´rovnˇe. Pˇredpokl´ adejme, ˇze m˚ uˇzeme prov´est dvacet ˇctyˇri zkouˇsek, pˇri vyv´ aˇzen´em n´ avrhu to znamen´ a vˇzdy ˇsest zkouˇsek se stejn´ym katalyz´ atorem. Jedna v´ arka vstupn´ı suroviny ovˇsem staˇc´ı jen na proveden´ı ˇctyˇr zkouˇsek. Pˇri pl´ anov´ an´ı experimentu je tˇreba poˇc´ıtat s t´ım, ˇze kvalita vstupn´ı suroviny bude v r˚ uzn´ ych v´ark´ach kol´ısat a pˇrisp´ıvat tak k vˇetˇs´ı experiment´aln´ı chybˇe. Proto je vhodn´e volit uspoˇr´ad´an´ı do blok˚ u. Ty budou tvoˇreny jednotliv´ ymi v´arkami vstupn´ı suroviny. Pˇri jedn´e v´arce vstupn´ı suroviny vystˇr´ıd´ ame vˇsechny u ´rovnˇe zkouman´eho faktoru (katalyz´atoru). Jejich poˇrad´ı se pro kaˇzd´ y blok vol´ı n´ ahodnˇe. V´ ysledky zkouˇsek jsou uvedeny v tabulce a zn´azornˇeny bodov´ ym diagramem. ´ Pˇ r´ıklad 3.1.6 Ukolem je zjistit, zdali 4 r˚ uzn´e typy ostˇr´ı produkuj´ı r˚ uzn´e z´ aznamy pˇri zjiˇst’ov´ an´ı tvrdost´ı materi´ alu. Zkuˇsebn´ı stroj provede vryp do testovan´eho materi´ alu a podle hloubky vrypu se usuzuje na tvrdost materi´ alu.
45
Kap. 3: Jednofaktorov´e experimenty
´ Uroveˇ n A1 A2 A3 A4
1 87 93 88 88
2 79 84 80 77
V´arka 3 4 82 89 89 96 84 91 83 90
5 83 86 83 82
6 78 87 82 79
Tab. 3.1: Vliv pouˇzit´eho katalyz´atoru Zde existuje pouze jeden faktor – druh ostˇr´ı. Hloubka vrypu m˚ uˇze ovˇsem kromˇe typu ostˇr´ı z´aviset do jist´e m´ıry i na materi´ alu, z nˇehoˇz je vzorek zhotoven. Vzorky totiˇz nemus´ı b´ yt zcela homogenn´ı, nebot’ mohou b´ yt r˚ uznˇe tvrd´e. T´ım se do n´avrhu pokusu vn´aˇs´ı dalˇs´ı vedlejˇs´ı faktor, a to variabilita zp˚ usoben´ a r˚ uzn´ ymi etalony ze zkuˇsebn´ıho materi´alu. Takˇze variabilita mˇeˇren´ı obsahuje jeˇstˇe variabilitu zp˚ usobenou r˚ uzn´ ymi etalony. Abychom tutu z´ avislost eliminovali, rozhodneme se mˇeˇrit na kaˇzd´em etalonu vrypy vˇsech ˇctyˇr typ˚ u ostˇr´ı. To znamne´ a, ˇze provedeme nejm´enˇe 4 × 4 = 16 pokus˚ u. K tomu je zapotˇreb´ı tedy celkem 16 vzork˚ u, ˇctyˇri z kaˇzd´eho etalonu. Mˇeˇren´ı uspoˇr´ad´ame do ˇctyˇr blok˚ u, kde blokem bude etalon, na nˇemˇz se provedou vˇzdy mˇeˇren´ı s kaˇzd´ ym typem ostˇr´ı, tj. 4 vrypy. Protoˇze v kaˇzd´em bloku budeme m´ıt vˇsechny typy ostˇr´ı, hovoˇr´ıme o u ´pln´em blokov´em n´avrhu. Kdyˇz poˇrad´ı pokus˚ u v r´ amci kaˇzd´eho bloku budeme prov´adˇet n´ahodnˇe, m´ame n´avrh experimentu typu u ´pln´ ych zn´ ahodnˇen´ ych blok˚ u.
3.2 3.2.1
Jednofaktorov´ e experimenty s v´ıce u ´ rovnˇ emi Ordin´ aln´ı odezva
Pro vˇetˇs´ı poˇcet uvaˇzovan´ ych u ´rovn´ı p˚ usob´ıc´ıho faktoru lze pro vyhodnocen´ı jeho vlivu pouˇz´ıt takzvan´e jednofaktorov´e anal´ yzu rozptylu“. Zkoum´ame z´avislost odezvy Y na faktoru X, re” prezentovan´em diskr´etn´ımi hodnotami (´ urovnˇemi) x1 , x2 , . . . , xk . Jednofaktorov´ a anal´ yza rozptylu d´ av´ a odpovˇed’ na ot´azku, zda lze urˇcit´ ym faktorem X vysvˇetlovat r˚ uznost kvantitativn´ı odezvy Y . Pˇredpokl´ad´a proveden´ı k nez´avisl´ ych n´ahodn´ ych v´ ybˇer˚ u hodnot znaku Y o rozsaz´ıch n1 , n2 , . . . , nk pˇri u ´rovn´ıch x1 , x2 , . . . , xk faktoru X. To jest Pk celkem n = i=1 ni mˇeˇren´ı. Z´ akladn´ım pˇredpokladem pouˇzit´ı anal´ yzy rozptylu je, ˇze kaˇzd´ yz k nez´avisl´ ych v´ ybˇer˚ u znaku Y poch´ az´ı z norm´aln´ıho rozdˇelen´ı N (µi , σ 2 ) se stejn´ ym rozptylem σ 2 . Z´ısk´av´ame tedy celkem n pozorov´ an´ı n´ahodn´e veliˇciny Y rozdˇelen´ ych do k skupin, kaˇzd´a o rozsahu ni , i = 1, . . . , k. V anal´ yze rozptylu testujeme hypot´ezu H0 : µ1 = µ2 = · · · = µk oproti alternativn´ı hypot´eze, ˇze alespoˇ n dvˇe hodnoty µ jsou r˚ uzn´e. Anal´ yza rozptylu srovn´ av´ a variabilitu uvnitˇr k skupin s variabilitou mezi skupinami, charak-
3.2. Jednofaktorov´e experimenty s v´ıce u ´rovnˇemi
46
terizovanou variabilitou jejich stˇredn´ıch hodnot. Jako m´ıra variability zde slouˇz´ı stˇredn´ı souˇcty kvadratick´ ych odchylek uvnitˇr a mezi skupinami. Souˇcet kvadratick´ ych odchylek uvnitˇr k-t´e skupiny je SSj =
nj X (yij − y¯j )2 , j = 1, . . . k, i=1
kde y¯j =
1 nj
Pnj
i=1
yij . Variabilita uvnitˇr skupin se potom pod´ıl´ı na celkov´em souˇctu kvadratick´ ych
odchylek v experimentu hodnotou
SSE =
nj k X X (yij − y¯j )2 . j=1 i=1
Oznaˇc´ıme-li celkov´ y pr˚ umˇer v modelu jako y¯ =
1 n
Pk
j=1
Pnj
i=1
yij , potom souˇcet kvadratick´ ych
odchylek mezi skupinami se na celkov´em souˇctu kvadratick´ ych odchylek v experimentu pod´ıl´ı touto ˇc´ ast´ı SSF =
k X (¯ yj − y¯)2 . j=1
Plat´ı tedy, ˇze nj k X X (yij − y¯)2 = SSF + SSE . SST = j=1 i=1
Tyto dvˇe ˇc´ asti celkov´e variability maj´ı r˚ uzn´e stupnˇe volnosti“, tedy jsou sloˇzeny z r˚ uzn´eho ” poˇctu nez´ avisl´ ych sˇc´ıtanc˚ u. SSF m´a poˇcet stupˇ n˚ u volnosti k − 1 (coˇz odpov´ıd´a k skupin´am pro Pk jednotliv´e u ´rovnˇe faktoru), SSE m´a n˚ u volnosti (nj − 1 v kaˇzd´e j=1 (nj − 1) = n − k stupˇ skupinˇe). Odtud dostaneme tzv. stˇredn´ı souˇcty ˇctverc˚ u“ ” M SSF =
SSF k−1
a M SSE =
SSE . n−k
Pokud by platila hypot´eza H0 , mˇely by b´ yt vˇsechny skupinov´e pr˚ umˇery pˇribliˇznˇe stejn´e, tedy s t´emˇeˇr nulovou variabilitou mezi nimi. Potom by M SSF mˇelo b´ yt zanedbateln´e vzhledem k M SSE . Budeme tedy testovat pomˇer
F =
M SSF . M SSE
Pokud jsou splnˇeny pˇredpoklady pro pouˇzit´ı t´eto metody, tedy pokud • mˇeˇren´e veliˇciny jsou stochasticky nez´avisl´e a • mˇeˇren´e veliˇciny maj´ı norm´ aln´ı rozdˇelen´ı se stejn´ ym rozptylem σ 2 , potom m´ a veliˇcina F zn´ am´e rozdˇelen´ı pravdˇepodobnosti, naz´ yvan´e F -rozdˇelen´ı s parametry k −1
47
Kap. 3: Jednofaktorov´e experimenty
a n − k. To ˇze je zn´ am´e znamen´ a, ˇze um´ıme nal´ezt tzv. kritickou hodnotu f (k − 1, n − k), kterou n´ahodn´a veliˇcina s t´ımto rozdˇelen´ım pˇrekroˇc´ı jen s danou pravdˇepodobnost´ı α. Rozhodovac´ı pravidlo pro zam´ıtnut´ı hypot´ezy H0 je potom F ≥ f (k − 1, n − k).
3.2.2
Nomin´ aln´ı odezva
Velmi ˇcasto odezva nem´ a ordin´ aln´ı charakter, coˇz znamen´a, ˇze jej´ı uspoˇr´ad´an´ı jej´ıch hodnot (pokud je m´ame vyj´ adˇreny ˇc´ıseln´ ymi hodnotami) nem´a smysl. Napˇr´ıklad je-li odezvou pohlav´ı, barva l´atky, druh omaku a podobnˇe. Pˇredpokl´adejme, ˇze odezva m˚ uˇze nab´ yvat m hodnot, ovlivˇ novan´ ych jedn´ım kvalitativn´ım faktorem, kter´ y m˚ uˇze nab´ yvat k r˚ uzn´ ych u ´rovn´ı, u nichˇz m˚ uˇze ale nemus´ı m´ıt uspoˇr´ad´an´ı smysl. V takov´em pˇr´ıpadˇe prov´ ad´ıme pˇri n replikac´ıch N = n.k.m pozorov´an´ı a budeme sledovat ˇcetnosti v´ ysledk˚ u nij kdy pˇri i-t´e u ´rovni faktoru nastala j-t´a u ´roveˇ n odezvy. V´ ysledky budeme zapisovat do takzvan´e kontingenˇcn´ı tabulky. Kontingenˇcn´ı tabulka je tabulka o k ˇr´adc´ıch a m sloupc´ıch Pˇ r´ıklad 3.2.1 Ovlivˇ nuje barva oˇc´ı Rh faktor? Provedeme 400 pozorov´ an´ı, jejichˇz v´ysledky jsou v Tab. 3.?? a chceme testovat hypot´ezu o tom, ˇze barva oˇc´ı neovlivˇ nuje Rh faktor. barva oˇc´ı modr´ a hnˇed´ a souˇcet
Rh+ 35 94 129
Rh− 65 206 271
souˇcet 100 300 400
Tab. 3.2: Zjiˇstˇen´e ˇcetnosti kombinac´ı Za pˇredpokladu nez´ avislosti by (podle margin´aln´ıch souˇct˚ u) mˇelo platit: barva oˇc´ı modr´ a hnˇed´ a souˇcet
Rh+ 32,25 96,75 129
Rh− 67,75 203,25 271
souˇcet 100 300 400
Tab. 3.3: Odhadnut´e ˇcetnosti kombinac´ı Pro test nez´ avislosti v kontingenˇcn´ı tabulce pouˇzijeme testovou statistiku ve tvaru
T =
X (pozorovan´ a ˇcetnost − oˇcek´avan´a ˇcetnost)2 oˇcek´avan´a ˇcetnost
Testov´a statistika m´ a ch´ı-kvadr´ at rozdˇelen´ı o (k − 1) × (m − 1) stupˇ n˚ u volnosti
χ2 =
2 X 2 X (nij − mij )2 mij i=1 j=1
3.3. Regresn´ı experimenty
48
V naˇsem pˇr´ıkladu je konkr´etnˇe
χ2 =
(35 − 32, 25)2 (65 − 67, 75)2 (94 − 96, 75)2 (206 − 203, 25)2 . + + + = 0, 2289 32, 25 67, 75 96, 75 203, 25
Tuto hodnotu budeme srovn´ avat s kritickou hodnotou ch´ı-kvadr´at rozdˇelen´ı s jedn´ım stupnˇem volnosti χ21 (0, 05) = 3, 84. Tedy hypot´ezu o nez´avislosti nezam´ıt´ame.
3.2.3
Latinsk´ eˇ ctverce
Uvaˇzujme modelovou situaci, kdy pˇredpokl´ad´ame z´avislost hodnoty odezvy na jedin´em faktoru, kter´ y m˚ uˇze m´ıt celkem k u ´rovn´ı. Nicm´enˇe, experiment nelze prov´est izolovanˇe od okoln´ıch podm´ınek, kter´e mohou v´ ysledek tak´e ovlivnit. V tomto pˇr´ıpadˇe hovoˇr´ıme o tzv. vedlejˇs´ıch faktorech. Pokud tyto vedlejˇs´ı faktory mohou nab´ yvat tak´e k u ´rovn´ı, m˚ uˇzeme pro n´avrh experimentu pouˇz´ıt sch´ema, naz´ yvan´e latinsk´y ˇctverec. Latinsk´ y ˇctverec je ˇctvercov´ a tabulka k × k, jej´ıˇz ˇr´adky odpov´ıdaj´ı u ´rovn´ım jednoho z vedlejˇs´ıch faktor˚ u, ˇr´ adky odpov´ıdaj´ı hodnot´am u ´rovn´ı druh´eho z vedlejˇs´ıch faktor˚ u. V buˇ nk´ach tabulky jsou velk´ ymi latinsk´ ymi p´ısmeny1 vyznaˇceny u ´rovnˇe uvaˇzovan´eho hlavn´ıho faktoru. Interpretace takov´e tabulky je n´ asleduj´ıc´ı: za p˚ usoben´ı kaˇzd´e z k u ´rovn´ı vedlejˇs´ıho faktoru provedeme k mˇeˇren´ı, v nichˇz se vystˇr´ıdaj´ı vˇsechny u ´rovnˇe druh´eho z vedlejˇs´ıch faktor˚ u a vˇsechny u ´rovnˇe hlavn´ıho faktoru. C´ılem je prov´est k replikac´ı mˇeˇren´ı s maxim´aln´ım vylouˇcen´ım vliv˚ u vedlejˇs´ıch faktor˚ u.
1 2 3 4 5
1 A E D C B
2 B A E D C
3 C B A E D
4 D C B A E
5 E D C B A
Tab. 3.4: Pˇr´ıklad latinsk´eho ˇctverce 5 × 5.
3.3
Regresn´ı experimenty
V matematice vyjadˇrujeme z´ avislost hodnot jedn´e promˇenn´e na hodnot´ach druh´e promˇenn´e funkˇcn´ım vztahem. V praktick´ ych u ´loh´ach je vˇsak situace sloˇzitˇejˇs´ı. Pˇri mˇeˇren´ı hodnot sledovan´e veliˇciny, pˇri jej´ıˇz realizaci p˚ usob´ı ˇrada dalˇs´ıch (n´ahodn´ ych) vliv˚ u, dost´av´ame soubor namˇeˇren´ ych hodnot, kter´e vykazuj´ı ˇcasto jist´e odchylky proti hodnot´am, kter´e bychom oˇcek´avali z teoretick´eho rozboru sledovan´eho jevu nebo z jak´esi oˇcek´avan´e pravidelnosti. 1 Odtud
n´ azev latinsk´ y“ ˇ ctverec ”
49
Kap. 3: Jednofaktorov´e experimenty
Pˇ r´ıklad 3.3.1 Pˇri soustruˇzen´ı vznik´ a v m´ıstˇe obr´ abˇen´ı na n´ astroji teplota, z´ avisl´ a na rychlosti posuvu n´ astroje. Mezi teplotou θ mˇeˇrenou ve stupn´ıch Celsia a rychlost´ı posuvu v v metrech za minutu byl odvozen teoretick´y vztah θ = αv β , kde α a β jsou konstanty, z´ avisej´ıc´ı na dalˇs´ıch podm´ınk´ ach experimentu. Hodnoty, kter´e byly namˇeˇreny pˇri laboratorn´ım mˇeˇren´ı, vˇsak tomuto vztahu odpov´ıdaj´ı jen velmi pˇribliˇznˇe, jak lze vidˇet z grafu.
Pˇredpokl´adejme, ˇze sledovanou n´ ahodnou veliˇcinu Y lze vyj´adˇrit jako funkci (zpravidla nen´ahodn´ ych) veliˇcin X1 , . . . , Xr a n´ ahodn´e odchylky jako
Y = f (X1 , . . . , Xr ; θ1 , . . . , θs ) + .
Funkce f se naz´ yv´ a regresn´ı funkce a θ1 , . . . , θs naz´ yv´ame parametry regrese. O n´ahodn´e veliˇcinˇe , kter´ a se ˇcasto naz´ yv´ a nepr´ avem chybou“, pˇredpokl´ad´ame, ˇze m´a symetrick´e rozdˇelen´ı ” 2 se stˇredn´ı hodnotou 0 a rozptylem σ . Obvykl´ y je pˇredpoklad norm´aln´ıho rozdˇelen´ı N (0, σ 2 ). Uveden´ y vztah se naz´ yv´ a regresn´ı model. Podle druhu z´avislosti regresn´ı funkce na nezn´am´ ych parametrech θ1 , . . . , θs potom hovoˇr´ıme bud’ o line´ arn´ım regresn´ım modelu nebo o neline´ arn´ım regresn´ım modelu. Nad´ ale se budeme zab´ yvat pouze line´arn´ım modelelm. Stˇredn´ı hodnota E(Y ) je potom funkc´ı hodnot veliˇcin X1 , . . . , Xr a nezn´am´ ych parametr˚ u θ1 , . . . , θs . Tuto vlastnost vyj´ adˇr´ıme vztahem
E(Y ) = f (x1 , . . . , xr ; θ1 , . . . , θs ),
kde x1 , . . . , xr jsou namˇeˇren´e hodnoty veliˇcin X1 , . . . , Xr a θ1 , . . . , θs jsou parametry. N´ahodn´e veliˇcinˇe Y se ˇr´ık´ a vysvˇ etlovan´ a promˇ enn´ a, veliˇcin´am X1 , . . . , Xr budeme ˇr´ıkat vysvˇ etluj´ıc´ı promˇ enn´ e. Podle tvaru regresn´ı funkce budeme mluvit o pˇ r´ımkov´ e, exponenci´ aln´ı, kvadratick´ e, polynomick´ e a jin´ ych regres´ıch. V pˇr´ıpadˇe pˇr´ımkov´e regrese rozliˇsujeme podle poˇctu vysvˇetluj´ıc´ıch promˇenn´ ych tzv. jednoduchou regresi s jednou vysvˇetluj´ıc´ı promˇennou a v´ıcen´ asobnou regresi s v´ıce vysvˇetluj´ıc´ımi promˇenn´ ymi.
V z´asadˇe zde m´ ame dva probl´emy: urˇcit tvar (typ) regresn´ı funkce a Pˇri vyˇsetˇrov´an´ı regresn´ı z´avislosti je regresn´ı funkce zpravidla zn´ ama (vypl´ yv´a z teoretick´ ych vztah˚ u) nebo se jej´ı tvar odhaduje (opticky, napˇr´ıklad podle X-Y grafu rozpt´ ylenosti). Proto se v dalˇs´ım textu omez´ıme na u ´lohu odhadu regresn´ıch parametr˚ u pˇredpokl´adan´e regresn´ı funkce. K tomu nejˇcastˇeji pouˇz´ıv´ame tzv. metodu nejmenˇ s´ıch ˇ ctverc˚ u. Tato metoda spoˇc´ıv´a v proveden´ı n nez´avisl´ ych mˇeˇren´ı
3.3. Regresn´ı experimenty
50
hodnot veliˇcin Y, X1 , . . . , Xr a v nalezen´ı hodnot θˆ1 , . . . , θˆs , pˇri nichˇz funkce 2 n X S(θ1 , . . . , θs ) = yi − f (x1i , . . . , xri ; θ1 , . . . , θs ) i=1
nab´ yv´ a sv´eho minima. Vektory yi , x1i , . . . , xri oznaˇcuj´ı i-t´e pozorov´an´ı vektoru Y, X1 , . . . , Xr , i = 1, . . . , n. Nejsme-li si jisti a rozhodujeme-li se mezi nˇekolika modely, potom zpravidla vol´ıme ten, v nˇemˇz je hodnota funkce S(θ1 , . . . , θs ) – takzvan´ y rezidu´ aln´ı souˇ cet ˇ ctverc˚ u – nejmenˇs´ı. V pˇr´ıpadˇe line´ arn´ı regresn´ı funkce f (x, α, β) = α+βx budeme minimalizovat funkci S(α, β) = Pn 2 ınkou pro extr´em funkce dvou promˇenn´ ych je nulovost obou i=1 (yi − α − βxi ) . Nutnou podm´ parci´ aln´ıch derivac´ı ∂S ∂α
= −2
n X (yi − α − βxi ) = 0 i=1
n X = −2 (yi − α − βxi )xi = 0,
∂S ∂β
i=1
coˇz vede k takzvan´e soustavˇ e norm´ aln´ıch rovnic
nα + β α
n X i=1
xi + β
n X i=1 n X
xi x2i
i=1
= =
n X i=1 n X
yi yi xi
i=1
jej´ımˇz ˇreˇsen´ım dostaneme bodov´e odhady a a b parametr˚ uαaβ Pn (xi − x)yi Pi=1 n 2 i=1 (xi − x) Pn (xi − x)yi a = y − Pi=1 x = y − bx n 2 i=1 (xi − x) b =
kde x =
1 n
Pn
i=1
xi , y =
1 n
Pn
i=1
yi . Podm´ınku postaˇcuj´ıc´ı nen´ı tˇreba vyˇsetˇrovat, nebot’ funkce
S(α, β) je ryze konvexn´ı.
3.3.1
Jednoduch´ a pˇ r´ımkov´ a regrese
Velmi ˇcast´ ym pˇr´ıpadem regresn´ı z´ avislosti je pˇ r´ımkov´ a regrese. Pˇredpokl´adejme regresn´ı vztah Y = α + βX + , kde X je n´ ahodn´a veliˇcina a je n´ahodn´a veliˇcina s norm´aln´ım rozdˇelen´ım N (0, σ 2 ). Bodov´e odhady a a b parametr˚ u α a β z´ısk´ame metodou nejmenˇs´ıch ˇctverc˚ u ve tvaru uve-
51
Kap. 3: Jednofaktorov´e experimenty
den´em v pˇr´ıkladˇe VIII.1.6. Namˇeˇren´e hodnoty y1 , . . . , yn lze povaˇzovat za hodnoty realizac´ı nez´avisl´ ych n´ ahodn´ ych veliˇcin Y1 , . . . , Yn s norm´aln´ım rozdˇelen´ım N (a + bxi , σ 2 ). Z tohoto hlediska jsou bodov´e odhady a a b odhadov´ ymi statistikami, a tedy n´ahodn´ ymi veliˇcinami. Hodnoty ei = yi −a−bxi , i = 1, . . . , n se naz´ yvaj´ı rezidua a lze je povaˇzovat za odhady hodnot chybov´eho ˇ ıslo yˆi = a + bxi je odhadem hodnoty n´ahodn´e veliˇciny Yi . ˇclenu . C´ Oznaˇcme SR = S(a, b) takzvan´ y rezidu´ aln´ı souˇ cet ˇ ctverc˚ u
SR =
n X i=1
e2i =
n X
yi − a − bxi 2 =
i=1
n X i=1
yi2 − a
n X
yi − b
i=1
n X
xi yi .
i=1
Bodov´ y odhad s2 rozptylu σ 2 chybov´eho ˇclenu je potom d´an vztahem s2 =
SR (n−2)
a naz´ yv´a
se rezidu´ aln´ı rozptyl. Pomoc´ı s2 lze vyj´ adˇrit odhady rozptylu obou regresn´ıch parametr˚ u
Sa2
Statistiky Tα =
Pn s2 i=1 x2i s2 2 P P = Pn , S = n n b 2 2 n i=1 x2i − ( i=1 xi )2 i=1 xi − nx
(a−α) Sa
a Tβ =
(b−β) Sb
maj´ı Studentovo t-rozdˇelen´ı o (n − 2) stupn´ıch volnosti.
Intervalov´e odhady pro parametry α a β jsou potom d´any nerovnostmi
a − Sa tn−2 (1 −
γ γ ) ≤ α ≤ a + Sa tn−2 (1 − ) 2 2
b − Sb tn−2 (1 −
γ γ ) ≤ β ≤ b + Sb tn−2 (1 − ) 2 2
kde (1−γ) je koeficient spolehlivosti a tn−2 (1− γ2 ) je (1− γ2 )-kvantil t-rozdˇelen´ı o (n−2) stupn´ıch volnosti. V nˇekter´ ych pˇr´ıpadech n´ as zaj´ım´ a, zda hodnota nˇekter´eho z parametr˚ u se liˇs´ı v´ yznamnˇe od nulov´e hodnoty nebo ne a zda jej lze tud´ıˇz v regresn´ı funkci vynechat. Oboustrann´e testy nulovosti regresn´ıch koeficient˚ u lze zaloˇzit na odhadov´ ych statistik´ach Ta =
a Sa
resp. Tb =
b Sb
a
jim odpov´ıdaj´ıc´ım kritick´ ym obor˚ um tak, ˇze pˇri splnˇen´ı nerovnosti
|Ta | ≥ tn−2 (1 −
γ γ ), resp. |Tb | ≥ tn−2 (1 − ), 2 2
zam´ıtneme hypot´ezu o nulovosti parametru α, resp. β, na hladinˇe v´ yznamnosti γ. Regresn´ım modelem se snaˇz´ıme vysvˇetlit zmˇeny - variabilitu - vysvˇetlovan´e veliˇciny Y pomoc´ı zmˇen vysvˇetluj´ıc´ı veliˇciny X. Pod´ıl ˇc´ asti variability Y vysvˇetlen´e modelem ku celkov´e variabilitˇe
3.3. Regresn´ı experimenty
52
Y , zpravidla vyj´ adˇren´ y v procentech, se naz´ yv´a koeficient determinace R2 a je d´an vztahy Pn (a + bxi − y)2 SR i=1 Pn R = = 1 − Pn , 2 2 i=1 (yi − y) i=1 (yi − y 2
kde SR je rezidu´ aln´ı souˇcet ˇctverc˚ u. K u ´pln´e regresn´ı anal´ yze patˇr´ı i anal´ yza rezidu´ı. Pˇredevˇs´ım by mˇely vyhovovat pˇredpokladu normality, za kter´eho byly vˇsechny pˇredchoz´ı v´ ysledky odvozeny. Pokud tomu tak nen´ı, nelze v´ ysledky povaˇzovat za d˚ uvˇeryhodn´e. K ovˇeˇren´ı shody hodnot rezidu´ı s norm´aln´ım rozdˇelen´ım lze pouˇz´ıt nˇekter´ y z test˚ u, uveden´ ych v odstavci VII.3, nebo pravdˇepodobnostn´ı pap´ır, kter´ y je pops´ an v kapitole X. Z anal´ yzy rezidu´ı lze detekovat i takzvan´a odlehl´ a pozorov´ an´ı. To znamen´ a ty hodnoty, kter´e byly chybnˇe namˇeˇreny nebo indikuj´ı nesrovnalosti v modelu, a jimˇz je tˇreba vˇenovat zvl´ aˇstn´ı pozornost. Ke zjiˇst’ov´an´ı tˇechto hodnot lze pouˇz´ıt napˇr´ıklad krabicov´e gragy, popsan´e v kapitole X. Model line´ arn´ı regrese lze pouˇz´ıt i v nˇekter´ ych pˇr´ıpadech, kdy z´avislost mezi veliˇcinami X a Y nen´ı line´ arn´ı. Jsou to pˇr´ıpady, kdy lze prov´est takzvanou linearizaci modelu. Vhodnou transformac´ı pˇrevedeme neline´ arn´ı z´avislost na line´arn´ı a pouˇzijeme line´arn´ı regresn´ı model. Pˇritom vˇsak mus´ıme b´ yt velmi opatrn´ı, nebot’ vˇse, co bylo odvozeno pro line´arn´ı regresn´ı model za pˇredpokladu normality chybov´eho ˇclenu plat´ı pouze pro ”linearizovan´ y model”, nikoli pro model p˚ uvodn´ı, a to opˇet za pˇredpokladu, ˇze n´ahodn´a veliˇcina, odpov´ıdaj´ıc´ı transformovan´emu chybov´emu ˇclenu v linearizovan´em modelu, m´a norm´aln´ı rozdˇelen´ı. Pˇ r´ıklad 3.3.2 Z´ avislost mezi teplotou θ a rychlost´ı posuvu v v pˇr´ıkladu 3.3.1. lze povaˇzovat za regresn´ı z´ avislost ve tvaru θ = α.v β ., kde α a β jsou regresn´ı koeficienty a je n´ ahodn´ a veliˇcina se stˇredn´ı hodnotou 1. Provedeme-li transformaci Y = lnθ, X = lnv, a = lnα, e = lnab = β, dostaneme Y = a + bX + e, tedy line´ arn´ı vztah. Podobnˇe jako v pˇredchoz´ım pˇr´ıkladu lze linearizovat i jin´e modely, napˇr. logaritmick´ y, tj. Y = ln(α + β.X), reciprok´ yY =
1 α+β.X
a dalˇs´ı.
Kapitola 4
V´ıcefaktorov´ e experimenty Ve vˇetˇsinˇe pˇr´ıpad˚ u p˚ usob´ı na odezvu v´ıce neˇz pouze jedin´ y faktor. Potom je tˇreba prov´est n´avrh v´ıcefaktorov´eho experimenmtu. Jeho n´ avrh je komplikovanˇejˇs´ı, vyˇzaduje zpravidla v´ıce mˇeˇren´ı a omezen´ı poˇctu sledovan´ ych u ´rovn´ı p˚ usob´ıc´ıch faktor˚ u. Takto navrˇzen´e experimenty jsou vˇsak mnohem efektivnˇejˇs´ı neˇz experimenty zkoumaj´ıc´ı faktory po jednom v ˇcase, kter´e zahrnuj´ı studium zmˇeny jedin´eho faktoru v danou chv´ıli a jejich vliv na v´ yrobek nebo proces. Zat´ımco jednofaktorov´e experimenty jsou snadno pochopiteln´e, neumoˇzn ˇuj´ı vyˇsetˇrov´an´ı toho, jak tento faktor ovlivˇ nuje produkt nebo proces v pˇr´ıtomnosti dalˇs´ıch faktor˚ u. Vztah, pˇri kter´em se mˇen´ı vliv jednoho faktoru na v´ yrobek nebo postup v z´avislosti na jednom nebo v´ıce dalˇs´ıch faktorech, ˇ se naz´ yv´a interakce. Casto jsou vz´ ajemn´e u ´ˇcinky faktor˚ u d˚ uleˇzitˇejˇs´ı neˇz vliv jednotliv´ ych faktor˚ u. To proto, ˇze v prostˇred´ı, v nˇemˇz se v´ yrobek nebo proces realizuje, p˚ usob´ı mnoho faktor˚ u dohromady a ne izolovan´e v´ yskyty jednotliv´ ych faktor˚ u v r˚ uzn´ ych ˇcasech. Vezmˇeme si pˇr´ıklad interakce mezi dvˇema faktory pˇri chemick´em procesu, kde napˇr´ıklad teplota zvyˇsuje v´ ytˇeˇznost jen m´ırnˇe a z´aroveˇ n zv´ yˇsen´ı tlaku samo o sobˇe nem´a ˇz´adn´ y vliv na v´ ynos. Nicm´enˇe, pokud roste teplota i tlak souˇcasnˇe, v´ ynos rychle roste. Potom ˇr´ık´ame, ˇze existuje interakce mezi tˇemito dvˇema faktory, kter´e ovlivˇ nuj´ı chemickou reakci. Metodika DOE zajiˇst’uje, ˇze vˇsechny faktory a jejich interakce jsou systematicky zkoum´any. Proto informace z´ıskan´e z anal´ yzy DOE jsou mnohem spolehlivˇejˇs´ı a u ´plnˇejˇs´ı, neˇz v´ ysledky z jednofaktorov´eho experimentu, kter´e ignoruj´ı interakci a mohou v´est k chybn´ ym z´avˇer˚ um. Faktori´aln´ı experiment slouˇz´ı ke zkoum´an´ı v´ıce faktor˚ u najednou a umoˇzn ˇuje studovat neaditivn´ı chov´an´ı faktor˚ u, tj. interakce. V u ´pln´em faktori´aln´ım experimentu se vystˇr´ıdaj´ı vˇsechny moˇzn´e kombinace u ´rovn´ı zkouman´ ych faktor˚ u, v d´ılˇc´ım faktori´aln´ım experimentu jsou nˇekter´e kombinace vynech´ any. Faktory zahrnut´e do experimentu mohou m´ıt dvˇe nebo v´ıce u ´rovn´ı. Uvaˇzujeme-li v experimentu dva faktory, jeden napˇr. s dvˇema a druh´ y se tˇremi u ´rovnˇemi, exis53
4.1. Dvoufaktorov´e experimenty
54
tuje ˇsest kombinac´ı u ´rovn´ı tˇechto faktor˚ u. Z oznaˇcen´ı experimentu 2x3 je vidˇet, kolik faktor˚ u a s jak´ ym poˇctem u ´rovn´ı se zkoum´a a kolik se provede zkouˇsek pˇri jedn´e replikaci. Protoˇze se poˇcet zkouˇsek s rostouc´ım poˇctem u ´rovn´ı faktor˚ u rychle zvˇetˇsuje, je v´ yhodn´e, hlavnˇe v prvn´ı f´azi experimentov´ an´ı, kdy je poˇcet N zaˇrazen´ ych faktor˚ u velk´ y, volit u vˇsech faktor˚ u jen dvˇe u ´rovnˇe. Experimenty potom oznaˇcujeme 2N. Kromˇe toho se pˇri velk´em poˇctu faktor˚ u poˇcet zkouˇsek zkracuje na polovinu, ˇctvrtinu atd. (d´ılˇc´ı faktori´aln´ı experiment). Nˇekdy se u vˇsech faktor˚ u vol´ı tˇri u ´rovnˇe. Pokud je ovˇsem nˇekter´ y z faktor˚ u kategori´aln´ı, pouˇzije se podle potˇreby i vyˇsˇs´ı poˇcet u ´rovn´ı. Faktori´ aln´ı experimenty s faktory o dvou u ´rovn´ıch maj´ı nav´ıc velkou v´ yhodu v jednoduch´em vyhodnocen´ı. Tyto experimenty se tak´e v praxi nejˇcastˇeji pouˇz´ıvaj´ı. V jedn´e replice experimentu se kaˇzd´a kombinace u ´rovn´ı objev´ı jen jednou. Pro rozhodov´an´ı o existenci vlivu faktor˚ u je vˇsak lepˇs´ı, provedou-li se alespoˇ n dvˇe repliky experimentu. Rozhodnemeli se pro v´ıce replikac´ı, dodrˇzujeme pˇritom z´asadu vyv´aˇzen´eho n´avrhu, to znamen´a, ˇze poˇcet opakov´ an´ı je ve vˇsech experiment´aln´ıch bodech (tj. u vˇsech kombinac´ı) stejn´ y. To tak´e znamen´a, ˇze r˚ uzn´ ym u ´rovn´ım jednoho faktoru odpov´ıd´a stejn´ y poˇcet v´ ysledk˚ u. V´ yhody vyv´aˇzen´eho n´avrhu byly jiˇz zm´ınˇeny v u ´vodu kapitoly 2. Podobnˇe jako v pˇr´ıpadˇe jedin´eho zkouman´eho faktoru m˚ uˇzeme volit u ´plnˇe zn´ ahodnˇen´ y n´avrh nebo uspoˇr´ad´an´ı do blok˚ u. Moˇznost snadn´eho vyhodnocen´ı v´ ysledk˚ u ocen´ıme v pˇr´ıpadˇe, kdy nem´ame k dispozici statistick´ y software, kter´ y by umoˇznil prov´est anal´ yzu rozptylu pro v´ıce neˇz dva faktory. Existuj´ı-li alespoˇ n dvˇe repliky experimentu, lze pˇri vyhodnocen´ı pouˇz´ıt t-test. V pˇr´ıpadˇe jedn´e repliky se doporuˇcuje grafick´a metoda spoˇc´ıvaj´ıc´ı ve vynesen´ı vypoˇcten´ ych efekt˚ u do pravdˇepodobnostn´ıho grafu. M´ame-li statistick´ y software, napˇr. Statgraphics, Statisticu nebo Minitab, je nejjednoduˇsˇs´ı pouˇz´ıt k vyhodnocen´ı anal´ yzu rozptylu. Pro zkoum´ an´ı vlivu dvou faktor˚ u postaˇc´ı n´astroj v Excelu. Pˇr´ıpady se tˇremi a v´ıce faktory by se daly samozˇrejmˇe ˇreˇsit s pouˇzit´ım pˇr´ısluˇsn´ ych vzorc˚ u, z´apis se vˇsak st´av´a ponˇekud nepˇrehledn´ y a proto se zde, pokud p˚ ujde o anal´ yzu rozptylu pro tˇri a v´ıce faktor˚ u, omez´ıme jen na interpretaci v´ ystup˚ u z poˇc´ıtaˇce
4.1
Dvoufaktorov´ e experimenty
V t´eto ˇc´ asti budeme pˇredpokl´ adat, ˇze na odezvu p˚ usob´ı dva mˇeˇriteln´e faktory. Experiment uspoˇr´ ad´ ame tak, ˇze zvol´ıme dvˇe u ´rovnˇe u kaˇzd´eho z faktor˚ u a provedeme jedno mˇeˇren´ı za p˚ usoben´ı kaˇzd´e ze vˇsech moˇzn´ ych kombinac´ı u ´rovn´ı tˇechto faktor˚ u. Oznaˇc´ıme-li u ´rovnˇe faktoru A jako A1 a A2 , u ´rovnˇe faktoru B jako B1 a B2 , potom odpov´ıdaj´ıc´ı mˇeˇren´ı budeme oznaˇcovat yij , kde i a j jsou u ´rovnˇe faktoru A a B. Vyuˇzijeme-li vˇsechny moˇzn´e kombinace u ´rovn´ı faktor˚ u, m˚ uˇzeme n´ avrh experimentu zn´ azornit pomoc´ı takzvan´e matice n´ avrhu experimentu, kter´a
55
Kap. 4: V´ıcefaktorov´e experimenty
vypad´a takto (Tab. 4.1): mˇeˇren´ı 1 2 3 4
A – + – +
B – – + +
y y11 y21 y12 y22
Tab. 4.1: Designov´ a matice dvoufaktorov´eho n´avrhu se dvˇema u ´rovnˇemi bez interakc´ı. V tabulce znam´enko minus (–) oznaˇcuje niˇzˇs´ı ze dvou u ´rovn´ı, znam´enko plus (+) potom vyˇsˇs´ı ˇ adky matice odpov´ıdaj´ı jednotliv´ ze dvou zvolen´ ych u ´rovn´ı1 . R´ ym mˇeˇren´ım v r´amci experimentu. Pokud pro kaˇzdou kombinaci u ´rovn´ı faktor˚ u provedeme v´ıce replikac´ı mˇeˇren´ı, bude v kaˇzd´em ˇr´adku ve sloupci y tolik hodnot, kolik bude replikac´ı. To, co n´as zpravidla v takov´em experimentu zaj´ım´a, je vliv jednotliv´ ych faktor˚ u na velikost odezvy. Proto zav´ ad´ıme pojem efektu faktoru:
Efekt faktoru = pr˚ umˇern´a zmˇena odezvy pˇri zmˇenˇe u ´rovnˇe faktoru Velikost efektu vyjadˇrujeme jako velikost zmˇeny odezvy pˇri zmˇenˇe u ´rovnˇe odpov´ıdaj´ıc´ıho faktoru. V naˇsem pˇr´ıpadˇe pro vyj´ adˇren´ı velikosti efektu faktoru A spoˇcteme pr˚ umˇernou hodnotu odezvy pˇri vyˇsˇs´ı u ´rovni faktoru y¯A2 = 12 (y21 + y22 ) a pr˚ umˇernou hodnotu odezvy pˇri niˇzˇs´ı u ´rovni y¯A1 = 21 (y11 + y12 ). Efekt faktoru A potom vyj´adˇr´ıme jako jejich rozd´ıl y21 + y22 y11 + y12 y21 + y22 − y11 − y12 Aˆ = y¯A2 − y¯A1 = − = . 2 2 2 Podobnˇe pro efekt faktoru B dost´ av´ ame ˆ = y¯B − y¯B = y12 + y22 − y11 + y21 = y12 + y22 − y11 − y21 . B 2 1 2 2 2 Bystr´ y ˇcten´aˇr si ihned vˇsimne, ˇze znam´enka u yij ve zlomc´ıch napravo odpov´ıdaj´ı znam´enk˚ um v matici n´avrhu experimentu pro odpov´ıdaj´ıc´ı faktory. Srovn´an´ı vlivu jednotliv´ ych faktor˚ u lze prov´est tak´e graficky. Na n´asleduj´ıc´ım Obr. 4.1 jsou zn´azornˇeny pr˚ umˇern´e hodnoty odezvy pˇri r˚ uzn´ ych u ´rovn´ıch faktor˚ u A a B. Vˇetˇs´ı efekt m´a ten faktor, pro nˇejˇz m´ au ´seˇcka spojuj´ıc´ı tyto pr˚ umˇern´e odezvy vˇetˇs´ı sklon (m´a v absolutn´ı hodnotˇe vyˇsˇs´ı smˇernici). Na tomto obr´ azku je to faktor A. Je-li rozd´ıl v hodnotˇe odezvy mezi dvˇema u ´rovnˇemi jednoho faktoru v´ yraznˇe jin´ y pˇri r˚ uzn´ ych u ´rovn´ıch druh´eho faktoru, napˇr. y21 − y11 a y22 − y12 , hovoˇr´ıme o takzvan´e interakci: 1 V nˇ ekter´ ych pˇr´ıpadech se nam´ısto znam´ enka – pouˇ z´ıv´ a ˇ c´ıslice 0 a nam´ısto znam´ enka + ˇ c´ıslice 1. To lze s v´ yhodou pouˇ z´ıt v pˇr´ıpadˇ e v´ıce´ urovˇ nov´ ych experiment˚ u, kdy n´ am uˇ z pouze dvˇ e znam´ enka nestaˇ c´ı.
4.1. Dvoufaktorov´e experimenty
56 y¯A2
6
y¯B1 XX
XXX y¯B2 X
y¯A1
A1
A2
B1
B2
Obr. 4.1: Grafick´e zn´azornˇen´ı vlivu jednotliv´ ych faktor˚ u.
Interakce mezi faktory = spoleˇcn´e p˚ usoben´ı dvou ˇci v´ıce faktor˚ u na velikost odezvy Na Obr. 4.2 vlevo je pˇr´ıklad situace, kdy efekty faktor˚ u neinteraguj´ı, napravo je situace typick´ a pro silnou interakce mezi faktory.
6 y11 y12
6
y21 y22
y11 y12
y22 PP P PPP y 21
-
-
A1 A2 bez interakce
A1 A2 s interakc´ı
Obr. 4.2: Grafick´e zn´azornˇen´ı vlivu jednotliv´ ych faktor˚ u.
V matici n´ avrhu experimentu interakci oznaˇc´ıme dvojic´ı p´ısmen AB. Odpov´ıdaj´ıc´ı znam´enka pro interakci dostaneme ze znam´enek faktor˚ u A a B tak, ˇze tato znam´enka spolu vyn´asob´ıme“, ” tedy dvojice stejn´ ych znam´enek d´a znam´enko plus, dvojice r˚ uzn´ ych znam´enek d´a znam´enko minus (viz Tab. 4.2). Interpretace tohoto pravidla m˚ uˇze b´ yt napˇr´ıklad takov´a, ˇze pokud interakce existuje, jej´ı vyˇsˇs´ı vliv bude pˇri stejn´e u ´rovni (n´ızk´e nebo vysok´e) obou faktor˚ u. Naopak, n´ızk´a u ´roveˇ n interakce bude oˇcek´ av´ ana pˇri rozd´ıln´ ych u ´rovn´ıch faktor˚ u A a B. mˇeˇren´ı 1 2 3 4
A – + – +
B – – + +
AB + – – +
y y11 y21 y12 y22
Tab. 4.2: Designov´ a matice u ´pln´eho dvoufaktorov´eho n´avrhu se dvˇema u ´rovnˇemi.
Nyn´ı m˚ uˇzeme vyj´ adˇrit velikost efektu interakce AB podobnˇe jako efekty pro jednotliv´e faktory: je to rozd´ıl pr˚ umˇern´e odezvy pˇri spoleˇcn´em p˚ usoben´ı obou faktor˚ u y¯AB+ =
1 2 (y11
+ y22 ) a
57
Kap. 4: V´ıcefaktorov´e experimenty
pr˚ umˇern´e odezvy pˇri rozd´ıln´em p˚ usoben´ı obou faktor˚ u y¯AB− = 21 (y21 + y12 ), tedy d = y¯AB − y¯AB = y11 + y22 − y21 + y12 = y11 + y22 − y21 − y12 . AB + − 2 2 2 Cviˇ cen´ı: Uvaˇzujme experiment, v nˇemˇz byly provedeny dvˇe replikace pro kaˇzd´e mˇeˇren´ı. To znamen´a, ˇze bylo provedeno celkem 2 × 2 × 2 mˇeˇren´ı. Odvod’te vzorce pro efekty jednotliv´ ych faktor˚ u a interakce. ˇ sen´ı: Experimentu odpov´ıd´ Reˇ a n´ asleduj´ıc´ı matice n´avrhu: mˇeˇren´ı 1 2 3 4
A – + – +
B – – + +
AB + – – +
y y11,1 , y11,2 y21,1 , y21,2 y12,1 , y12,2 y22,1 , y22,2
Tab. 4.3: Designov´ a matice u ´pln´eho dvoufaktorov´eho n´avrhu se dvˇema u ´rovnˇemi pˇri dvou replikac´ıch.
Odpov´ıdaj´ıc´ı efekty spoˇcteme podle n´ asleduj´ıc´ıch vztah˚ u (s vyuˇzit´ım znam´enek z tabulky): y21,1 + y21,2 + y22,1 + y22,2 − y11,1 − y11,2 − y12,1 − y12,2 , Aˆ = y¯A2 − y¯A1 = 4 ˆ = y¯B − y¯B = y12,1 + y12,2 + y22,1 + y22,2 − y11,1 − y11,2 − y21,1 − y21,2 , B 2 1 4 y11,1 + y11,2 + y22,1 + y22,2 − y21,1 − y21,2 − y12,1 − y12,2 d AB = y¯AB+ − y¯AB− = . 4
4.2
Vyhodnocen´ı v´ıcefaktori´ aln´ıch experiment˚ u
Statistick´ y model pro dva faktory A, B:
yij = µ + αi + βj + αβ
ij
+ ij
kde yij je odezva, µ je spoleˇcn´ au ´roveˇ n pro oba faktory, αi oznaˇcuje vliv i-t´e u ´rovnˇe faktoru A, βj oznaˇcuje vliv j-t´e u ´rovnˇe faktoru B, αβ ij je vliv interakce i-t´e a j-t´e u ´rovnˇe faktor˚ u A a B, ij pˇredstavuje n´ ahodnou chybu pˇri i-t´e a j-t´e u ´rovni faktor˚ u A a B.
4.4. V´ıcefaktori´ aln´ı experimenty
4.3
58
V´ıcefaktori´ aln´ı experimenty
Statistick´ y model pro tˇ ri faktory A, B a C:
yijk = µ + αi + βj + γk + αβ
ij
+ αγ
ik
+ βγ
jk
+ αβγ
ijk
+ ijk
kde yijk je odezva, µ je spoleˇcn´ au ´roveˇ n pro oba faktory, αi , βj , γk oznaˇcuje vlivy u ´rovn´ı i, j, k faktor˚ u A, B, C, u αβ ij , αγ ik , βγ jk oznaˇcuje vlivy interakc´ı druh´eho ˇr´adu, tedy interakc´ı dvojic faktor˚ AB, AC, BC pˇri odpov´ıdaj´ıc´ıch u ´rovn´ıch i, j, k, u dohromady αβγ ijk oznaˇcuje vlivy interakce tˇret´ıho ˇr´adu, tedy interakce vˇsech tˇr´ı faktor˚ pˇri odpov´ıdaj´ıc´ıch u ´rovn´ıch i, j, k, ij pˇredstavuje n´ ahodnou chybu pˇri i-t´e a j-t´e u ´rovni faktor˚ u A a B. test 1 2 3 4 5 6 7 8
A – + – – + + – +
B – – + – + – + +
C – – – + – + + +
AB + – – + + – – +
AC + – + – – + – +
BC + + – – – – + +
ABC – + + + – – – +
Tabulka 4.1: Designov´ a matice u ´pln´eho tˇr´ıfaktorov´eho n´avrhu se dvˇema u ´rovnˇemi
4.4
Smˇ eˇ sov´ an´ı ve v´ıcefaktori´ aln´ıch n´ avrz´ıch
S rostouc´ım poˇctem faktor˚ u vzr˚ ust´a v u ´pln´em faktori´aln´ım experimentu rychle poˇcet zkouˇsek. Proto se ˇcasto z u ´sporn´ ych d˚ uvod˚ u prov´ad´ı d´ılˇc´ı faktori´aln´ı experiment. Ukazuje se totiˇz, ˇze v mnoha pˇr´ıpadech lze poˇzadovanou informaci z´ıskat na z´akladˇe vhodnˇe vybran´e ˇc´asti u ´pln´eho faktori´aln´ıho experimentu. Experiment 2N pro N faktor˚ u s dvˇema u ´rovnˇemi lze zkr´atit na polovinu, ˇctvrtinu atd. p˚ uvodn´ıho rozsahu. Znaˇc´ıme jej potom 2N −1 , 2N −2 atd. Zkoum´ame st´ale vˇsech N faktor˚ u, do experimentu vˇsak zahrneme pouze nˇekter´e kombinace u ´rovn´ı faktor˚ u, takˇze celkov´ y poˇcet zkouˇsek bude 2N /2, 2N /4 atd. Zkr´acen´ı experimentu znamen´a ztr´atu ˇc´asti informace. To se projev´ı pˇri vyhodnocen´ı v´ ysledk˚ u. Po vynech´an´ı ˇc´asti zkouˇsek nebudeme moci odhadnout velikost vˇsech efekt˚ u, kter´e by pˇrich´azely v u ´vahu v u ´pln´em faktori´aln´ım experimentu. Avˇsak
59
Kap. 4: V´ıcefaktorov´e experimenty
vzhledem k tomu, ˇze nˇekter´e ze zkouman´ ych faktor˚ u se nakonec uk´aˇz´ı jako ned˚ uleˇzit´e a ˇze interakce vyˇsˇs´ıho ˇr´ adu b´ yvaj´ı zanedbateln´e, tato skuteˇcnost pˇr´ıliˇs nevad´ı. Zkracovat lze i experimenty s faktory o v´ıce u ´rovn´ıch, pomˇernˇe ˇcast´e, zejm´ena u Taguchiho pˇr´ıstupu, jsou d´ılˇc´ı faktori´aln´ı experimenty s faktory o tˇrech u ´rovn´ıch. Znaˇc´ı se 3N −1 , 3N −2 atd. V tˇechto skriptech se vˇsak omez´ıme jen na d´ılˇc´ı faktori´ aln´ı experimenty s dvˇema u ´rovnˇemi faktor˚ u, kter´e jsou nejbˇeˇznˇejˇs´ı. N´asleduj´ıc´ı sch´ema pˇredstavuje uk´ azku zkr´acen´ı na ˇsestn´actinu zkouˇsek. M´ısto 27 = 128 zkouˇsek se provede jen 8 zkouˇsek napˇr. pˇri vyznaˇcen´ ych kombinac´ıch. V´ ybˇer kombinac´ı se tedy neprov´ ad´ı n´ ahodnˇe, ale tak, aby d˚ usledky zkr´acen´ı experimentu z hlediska u ´ˇcinnosti vyhodnocen´ı byly co nejmenˇs´ı. Po vynech´an´ı ˇc´asti kombinac´ı u ´rovn´ı faktor˚ u z˚ ustane zachov´ ana podstatn´ a vlastnost, ortogonalita, kter´a zjednoduˇsuje anal´ yzu v´ ysledk˚ u a usnadˇ nuje interpretaci. V literatuˇre zab´ yvaj´ıc´ı se navrhov´an´ım experiment˚ u i v pˇr´ısluˇsn´em softwaru jsou vˇsechny n´ avrhy zkr´ acen´ ych faktori´aln´ıch experiment˚ u k dispozici a uˇzivatel tedy nemus´ı kombinace u ´rovn´ı faktor˚ u s´ am urˇcovat. Pˇri v´ ybˇeru vhodn´eho n´avrhu a stupnˇe zkr´acen´ı experimentu je ovˇsem tˇreba rozumˇet urˇcit´ ym sch´emat˚ um a z´apis˚ um a proto zde bude na nˇekolika nejjednoduˇsˇs´ıch pˇr´ıkladech podstata zkracov´an´ı vysvˇetlena. Uvaˇzujme n´ avrh 23 s 8 kombinacemi u ´rovn´ı faktor˚ u (´ upln´ y n´avrh). Z nˇejak´ ych d˚ uvod˚ u je tˇreba sn´ıˇzit poˇcet mˇeˇren´ı na polovinu - vytvoˇr´ıme ”d´ılˇc´ı”faktori´aln´ı experiment 23−1 . Podobnˇe jako pˇri dˇelen´ı na bloky, pouˇzijeme k tomu posledn´ı sloupec ABC (viz Tab. 4.4.2). Interakci ABC budeme naz´ yvat gener´ atorem pl´ anu. test 1 a b c ab ac bc abc
A – + – – + + – +
B – – + – + – + +
C – – – + – + + +
AB + – – + + – – +
AC + – + – – + – +
BC + + – – – – + +
ABC – + + + – – – +
Tabulka 4.2: Designov´ a matice u ´pln´eho tˇr´ıfaktorov´eho n´avrhu se dvˇema u ´rovnˇemi Experiment zkr´ acen´ y na polovinu oznaˇcujeme 2N −1 , kde N je poˇcet faktor˚ u. V pˇr´ıpadˇe tˇr´ı zkouman´ ych faktor˚ u (N = 3) to znamen´ a, ˇze ze vˇsech moˇzn´ ych kombinac´ı u ´rovn´ı faktor˚ u A, B, C, kter´ ych je osm, vyb´ır´ ame ˇctyˇri. Pˇri zkracov´an´ı experimentu na polovinu vych´az´ıme ze znam´enek interakce nejvyˇsˇs´ıho ˇr´ adu, v naˇsem pˇr´ıpadˇe ze znam´enek interakce ABC. Jak je vidˇet v tabulce, v polovinˇe pˇr´ıpad˚ u m´ a interakce ABC kladn´e znam´enko, v polovinˇe pˇr´ıpad˚ u z´aporn´e znam´enko. Pro experiment 23−1 vybereme ˇctyˇri kombinace u ´rovn´ı vedouc´ı ke stejn´emu znam´enku ABC, tedy bud’ kombinace ve st´ınovan´ ych ˇr´ adc´ıch, kdy m´a interakce ABC znam´enko + nebo naopak
4.4. Smˇeˇsov´ an´ı ve v´ıcefaktori´ aln´ıch n´avrz´ıch
60
kombinace ve zbyl´ ych ˇr´ adc´ıch, kdy m´a interakce ABC znam´enko –. Zaved’me pro sloupce designov´e matice operaci .“ jako logick´e and“, pro kter´e plat´ı ” ” + . − = −, + . + = +, − . − = +,
potom zˇrejmˇe plat´ı
A.B = AB, A.C = AC, B.C = BC, A.B.C = ABC.
Oznaˇcme I znaˇc´ı sloupec sam´ ych +“. Potom zˇrejmˇe ” A.A = A2 = B.B = B 2 = C.C = C 2 = I, A.I = A, B.I = B, C.I = C.
Podm´ınku v´ ybˇeru potom m˚ uˇzeme oznaˇcit symbolicky ABC = I. Vyn´asoben´ım“ t´eto rovnosti ” sloupcem A, B nebo C dost´ av´ ame
A(ABC) = IA,
B(ABC) = BI,
C(ABC) = CI,
IBC = A,
IAC = B,
ABI = C,
BC = A,
AC = B,
AB = C.
Jak tyto rovnosti interpretovat n´am uk´aˇz pohled na n´asleduj´ıc´ı tabulku. test a b c abc
A + – – +
B – + – +
C – – + +
AB – – + +
AC – + – +
BC + – – +
ABC + + + +
y y1 y2 y3 y4
Tabulka 4.3: Designov´ a matice d´ılˇc´ıho tˇr´ıfaktorov´eho n´avrhu se dvˇema u ´rovnˇemi Protoˇze jsou ve sloupci ABC d´ılˇc´ıho xperimentu vˇsechna znam´enka stejn´a, nem˚ uˇzeme odhadnout efekt interakce ABC. Porovn´ame-li znam´enka ve sloupc´ıch A a BC, zjist´ıme, ˇze sloupce jsou totoˇzn´e. Znamen´ a to, ˇze pomoc´ı vztahu y1 + y4 y2 + y3 − 2 2 kde y1 aˇz y4 jsou hodnoty odezvy namˇeˇren´e pˇri dan´ ych kombinac´ıch u ´rovn´ı, urˇcujeme vlastnˇe souˇcet efektu faktoru A a efektu interakce BC, tedy A+BC. Z tohoto d˚ uvodu nepozn´ame, zda je
61
Kap. 4: V´ıcefaktorov´e experimenty
rozd´ıl mezi pr˚ umˇery v´ ysledk˚ u zp˚ usoben zmˇenou u ´rovnˇe faktoru A nebo zmˇenami u ´rovn´ı faktoru B a C. Tomuto jevu ˇr´ık´ ame smˇeˇsov´ an´ı efekt˚ u a efekty faktoru A a interakce BC oznaˇcujeme nˇekdy jako alias efekty. K podobn´emu zjiˇstˇen´ı dojdeme porovn´an´ım sloupc˚ u B a AC nebo C a AB. Hlavn´ı efekt faktoru B je sm´ıˇsen s efektem interakce AC a hlavn´ı efekt C s interakc´ı AB.
4.5
V´ yznamn´ e body experimentu
Pˇri n´avrhu experimentu rozliˇsujeme tˇri druhy takzvan´ ych v´ yznamn´ ych bod˚ u. Jsou to vlastnˇe navrˇzen´a mˇeˇren´ı, liˇs´ıc´ı se v nastaven´ı r˚ uzn´ ych u ´rovn´ı faktor˚ u. V pˇr´ıpadˇe kdy kaˇzd´ y z faktor˚ u bude v experimentu vystupovat ve dvou u ´rovn´ıch, m˚ uˇzeme tyto oznaˇcit hodnotami -1 = niˇzˇs´ı u ´roveˇ n, +1 = vyˇsˇs´ı u ´roveˇ n. Pˇriˇrad’me nyn´ı kaˇzd´emu mˇeˇren´ı vektor, jehoˇz jednotliv´e sloˇzky budou odpov´ıdat faktor˚ um a jejich hodnoty u ´rovn´ım tˇechto faktor˚ u. V´ yznamn´e body n´ avrhu: • krychlov´e body • centr´aln´ı body • hvˇezdicov´e body Krychlov´ e body: jsou v pl´ anu vˇzdy a je jich 2k−p . Maj´ı souˇradnice ±1. Sledujeme-li napˇr´ıklad vliv tˇr´ı faktor˚ u, dost´ av´ ame 8 bod˚ u o souˇradnic´ıch (±1, ±1, ±1)). Nakresl´ıme-li tyto body do kart´ezsk´e soustavy souˇradnic, dostaneme vrcholy krychle se stˇredem v poˇc´atku a d´elce strany 2 (viz obr. Obr. 4.3). Krychlov´e body slouˇz´ı k v´ ypoˇctu efekt˚ u faktor˚ u nebo koeficient˚ u v line´arn´ım modelu.
Obr. 4.3: V´ yznamn´e body experimentu pro dva faktory (vlevo) a pro tˇri faktory (napravo)
4.5. V´ yznamn´e body experimentu
62
Centr´ aln´ı body: se doplˇ nuj´ı do n´avrhu experimentu dodateˇcnˇe a zpravidla se pouˇz´ıvaj´ı k odhadu rozptylu σ 2 . To je uˇziteˇcn´e zvl´aˇstˇe v pˇr´ıpadˇe, kdy mˇeˇren´ı odpov´ıdaj´ıc´ı centr´aln´ım bod˚ um nejsou replikov´ ana, nebo poˇcet jejich replikac´ı je velmi mal´ y a nelze z nich odhadnout rozptyl σ 2 . Doporuˇcovan´ y poˇcet tˇechto bod˚ u je 3 – 5). Centr´aln´ı body maj´ı v naˇsem zobrazen´ı nulov´e souˇradnice (pro 3 faktory je centr´ aln´ı bod (0, 0, 0)). To odpov´ıd´a dalˇs´ı u ´rovni sledovan´ ych faktor˚ u, kter´a je nˇekde mezi doln´ı a horn´ı uvaˇzovanou u ´rovn´ı (nemus´ı b´ yt nutnˇe uprostˇred). Centr´aln´ı body se nepouˇz´ıvaj´ı k v´ ypoˇctu efekt˚ u faktor˚ u, ale z rezidu´ı v centr´aln´ıch bodech m˚ uˇzeme spoˇc´ıtat ˇcistou chybu mˇeˇren´ı. Hvˇ ezdicov´ e body: Pro odhad koeficient˚ u v line´arn´ım modelu pouˇzijeme v´ ysledky mˇeˇren´ı, odpov´ıdaj´ıc´ı krychlov´ ym bod˚ um. Pro odhad koeficient˚ u v u ´pln´em kvadratick´em modelu vˇsak potˇrebujeme dalˇs´ı mˇeˇren´ı. Ta jsou reprezentov´ana hvˇezdicov´ ymi body. Nejl´epe si je m˚ uˇzeme zn´azornit na trojrozmˇern´em obr´ azku xxx. Pˇredstavme si kulovou plochu se stˇredem v poˇc´atku a proch´ azej´ıc´ı vrcholy krychle. Hvˇezdicov´e body leˇz´ı na pr˚ useˇc´ıc´ıch t´eto kulov´e plochy se souˇradn´ ymi osami. V trojrozmˇern´em pˇr´ıpadˇe je jejich poˇcet 6 (2 na kaˇzd´e ose), obecnˇe jich je 2k. Souˇradnice pro tˇri faktory jsou (±α, 0, 0), (0, ±α, 0), (0, 0, ±α). Symbol ±α zde charakterizuje dalˇs´ı u ´rovnˇe sledovan´ ych faktor˚ u, kter´e jsou pod niˇzˇs´ı nebo nad vyˇsˇs´ı u ´rovnˇemi. Hvˇezdicov´e body nav´ıc jeˇstˇs zpˇresˇ nuj´ı odhady regresn´ıch koeficient˚ u.
Kapitola 5
Taguchiho robustn´ı n´ avrhy Robustn´ı n´avrh je dalˇs´ı moˇznost´ı, jak zlepˇsit jakost pr˚ umyslov´ ych proces˚ u. Hlavn´ı myˇslenka spoˇc´ıv´a v redukci variability procesu nikoli pˇr´ımo pomoc´ı n´aroˇcn´e regulace veliˇcin, kter´e ji zp˚ usobuj´ı, ale vhodn´ ym nastaven´ım jin´ ych, snadnˇeji ovladateln´ ych faktor˚ u. Variabilitu procesu zp˚ usobuje jednak promˇenlivost r˚ uzn´ ych mˇeˇriteln´ ych veliˇcin, jako jsou napˇr. zmˇeny teploty olejov´e l´aznˇe bˇehem ˇcasu pˇri zuˇslecht’ov´ an´ı oceli, jednak rozd´ıly mezi jednotkami vyr´abˇen´ ymi soubˇeˇznˇe na nˇekolika stroj´ıch, na nˇekolika pozic´ıch apod., napˇr. rozd´ıly mezi destiˇckami um´ıstˇen´ ymi na r˚ uzn´ ych stran´ ach ˇsestibok´eho hranolu pˇri v´ yrobˇe integrovan´ ych obvod˚ u. V norm´aln´ım procesu m˚ uˇze b´ yt udrˇzen´ı teploty l´ aznˇe na poˇzadovan´e nemˇenn´e u ´rovni pˇr´ıliˇs n´aroˇcn´e nebo dokonce nemoˇzn´e. Zjist´ıme-li vˇsak, ˇze na variabilitu pr˚ uhybu pruˇziny zp˚ usobenou kol´ıs´an´ım teploty m´a vliv doba zahˇr´ıv´ an´ı pruˇzin bˇehem tepeln´eho zpracov´an´ı, m´ısto n´aroˇcn´e regulace teploty se zamˇeˇr´ıme na zajiˇstˇen´ı vhodn´e doby zahˇr´ıv´an´ı. Variabilitu jednotek vyr´abˇen´ ych na nˇekolika stroj´ıch m˚ uˇzeme sn´ıˇzit peˇcliv´ ym seˇr´ızen´ım stroj˚ u, avˇsak odstranˇen´ı rozd´ıl˚ u mezi jednotkami odeb´ıran´ ymi z r˚ uzn´ ych pozic ˇsestibok´eho hranolu ve zm´ınˇen´em pˇr´ıkladu se zd´a b´ yt pˇri st´avaj´ıc´ı konstrukci zaˇr´ızen´ı nemoˇzn´e. Ovˇeˇr´ıme-li, ˇze na variabilitu tlouˇst’ky vrstvy vytv´aˇren´e na povrchu kˇrem´ıkov´ ych destiˇcek v r˚ uzn´ ych pozic´ıch hranolu, na nˇemˇz jsou um´ıstˇeny, m´a vliv poloha trysky, z n´ıˇz proud´ı chemick´ a p´ ara, soustˇred´ıme se na vyhled´an´ı optim´aln´ı polohy t´eto trysky. Uveden´e pˇr´ıklady naznaˇcuj´ı, ˇze v popˇred´ı z´ ajmu je variabilita odezvy, kterou se snaˇz´ıme sn´ıˇzit. C´ılem robustn´ıho n´avrhu je sn´ıˇzit citlivost sledovan´e veliˇciny na kol´ıs´an´ı ruˇsiv´ ych veliˇcin. Popsan´ y probl´em lze ˇreˇsit r˚ uzn´ ymi zp˚ usoby. Existuj´ı rozd´ıly jak v pˇr´ıpravˇe experimentu, tak ve vyhodnocen´ı v´ ysledk˚ u experimentu. Abychom mohli pouˇz´ıvan´e postupy popsat, rozˇs´ıˇr´ıme dosud pouˇz´ıvanou terminologii o dalˇs´ı pojmy. V robustn´ım n´avrhu se rozliˇsuj´ı dvˇe hlavn´ı skupiny ˇ faktor˚ u. Riditeln´ e faktory jsou ovladateln´e jak v norm´aln´ım procesu, tak bˇehem experimentov´an´ı, to znamen´a, ˇze jejich u ´rovnˇe je moˇzn´e po nastaven´ı udrˇzet nemˇenn´e. Hodnoty ruˇsiv´ ych faktor˚ u se 63
5.1.
64
bˇehem norm´ aln´ıho procesu obvykle mˇen´ı v ˇcase, pˇr´ıpadnˇe s polohou, bˇehem experimentu je vˇsak m˚ uˇzeme, aspoˇ n do jist´e m´ıry, udrˇzet na konstantn´ı hodnotˇe. Za ruˇsiv´e faktory povaˇzujeme i kategori´aln´ı faktory, napˇr. faktor pˇredstavuj´ıc´ı pozici v peci. Spoleˇcnou vlastnost´ı mˇeˇriteln´ ych i kategori´aln´ıch ruˇsiv´ ych faktor˚ u je to, ˇze existence r˚ uzn´ ych u ´rovn´ı bˇehem norm´aln´ıho procesu je zdrojem neˇz´ adouc´ı variability sledovan´eho znaku. Pˇredpokl´ad´a se, ˇze chov´an´ı mˇeˇriteln´ ych ruˇsiv´ ych veliˇcin v norm´ aln´ım procesu aspoˇ n pˇribliˇznˇe zn´ame. Jsou-li ruˇsiv´e faktory mˇeˇriteln´ ymi veliˇcinami, vol´ı se obvykle dvˇe jejich u ´rovnˇe, napˇr. ve vzd´alenosti smˇerodatn´a odchylka od pˇredpokl´adan´e stˇredn´ı hodnoty. Do experimentu jsou tedy zahrnuty jak ˇriditeln´e, tak ruˇsiv´e faktory. Myˇslenka robustn´ıho n´ avrhu m´a p˚ uvod v Japonsku a jej´ım autorem je Taguchi. Princip robustn´ıho n´ avrhu je vˇseobecnˇe uzn´av´an, Taguchiho metody anal´ yzy experiment´aln´ıch v´ ysledk˚ u jiˇz m´enˇe. Z pohledu statistik˚ u jde ˇcasto o teoreticky nepodloˇzen´e postupy nebo o postupy m´alo u ´ˇcinn´e, to znamen´ a, ˇze k rozpozn´ an´ı vlivu faktoru je tˇreba prov´est vˇetˇs´ı poˇcet zkouˇsek. Metody vˇsak pro svou zd´ anlivou jednoduchost z´ıskaly v praxi znaˇcnou oblibu a staly se souˇc´ast´ı nˇekter´ ych statistick´ ych paket˚ u obsahuj´ıc´ıch modul pro navrhov´an´ı experiment˚ u (napˇr. Minitab). Vymezen´ y rozsah skript neumoˇzn ˇuje zab´ yvat se danou problematikou v cel´e ˇs´ıˇri. Omez´ıme se zde proto na n´avrh experimentu pouˇz´ıvan´ y v origin´aln´ım pˇr´ıstupu, uk´aˇzeme zde vˇsak nejen Taguchiho zp˚ usob vyhodnocen´ı, ale tak´e jednu z dalˇs´ıch moˇznost´ı.
Optimalizace
Jakmile je pozornost z´ uˇzena na d˚ uleˇzit´e faktory ovlivˇ nuj´ıc´ı proces, dalˇs´ım krokem je urˇcit nejlepˇs´ı nastaven´ı tˇechto faktor˚ u k dosaˇzen´ı poˇzadovan´eho c´ıle. V z´avislosti na produktu nebo procesu, kter´ y je pˇredmˇetem ˇsetˇren´ı tohoto c´ıle m˚ uˇze b´ yt bud’ maximalizovat, minimalizovat nebo dosaˇzen´ı c´ılov´e hodnoty odezvy.
Testov´ an´ı robustnosti
Jakmile je hotovo optim´ aln´ı nastaven´ı faktor˚ u, kter´e byly stanoveny, je d˚ uleˇzit´e zjistit citlivost produktu nebo procesu na zmˇeny, kter´e by mohly nastat v oblasti aplikaˇcn´ıho prostˇred´ı. Tyto zmˇeny vypl´ yvaj´ı ze zmˇen faktor˚ u, kter´e mohou ovlivnit proces, ale jsou mimo kontrolu analytika. Takov´e faktory jako vlhkost, teplota okol´ı, zmˇeny v materi´alu, apod. se oznaˇcuj´ı jako ˇsumov´e (vedlejˇs´ı) faktory. Je d˚ uleˇzit´e identifikovat zdroje takov´ ych zmˇen a pˇrijmout opatˇren´ı, kter´a by eliminovala jejich vlivy (napˇr´ıklad rozdˇelen´ım experimentu do blok˚ u).
65
Kap. 5: Taguchiho robustn´ı n´avrhy
5.1
Designov´ e matice
Taguchiho experimenty vych´ azej´ı z tzv. ortogon´aln´ıch oblast´ı ˇci seskupen´ı, kter´e tvoˇr´ı sloˇzen´e designov´e matice. Obvykle se tyto ortogon´aln´ı oblasti oznaˇcuj´ı p´ısmenem Lk , kde index k znamen´a celkov´ y poˇcet pozorov´ an´ı v r´ amci experimentu. Nejz´akladnˇejˇs´ımi oblastmi jsou L4 , L8 , L16 , a L32 . Vlastnˇe se jedn´ a o d´ılˇc´ı faktori´ aln´ı n´avrhy typu 2k−1 , kde k = 3; 4; 5 a 6, kde jsou pouze jinak seˇrazeny sloupce a nam´ısto oznaˇcen´ı pro verze faktor˚ u +“ ˇci -“ je pouˇzito ˇc´ıslic 1 a 2. ” ” L4 1 2 3 4
A 1 1 2 2
B 1 2 1 2
C 1 2 2 1
Tab. 5.1: Designov´a matice n´avrhu L4
L4 1 2 3 4 5 6 7 8
A 1 1 1 1 2 2 2 2
B 1 1 2 2 1 1 2 2
C 1 1 2 2 2 2 1 1
D 1 2 1 2 1 2 1 2
E 1 2 1 2 2 1 2 1
F 1 2 2 1 1 2 2 1
G 1 2 2 1 2 1 1 2
Tab. 5.2: Designov´a matice n´avrhu L8 Pro Tguchiho designov´e matice se pouˇz´ıv´a oznaˇcen´ı Ln (X y ), kde n = poˇcet ˇr´ adek v n´ avrhu, X = poˇcet u ´rovn´ı faktor˚ u, y = poˇcet sloupc˚ u v n´ avrhu = poˇcet faktor˚ u. Mezi z´akladn´ı typy designov´ ych matic v Taguchiho pˇr´ıstupu patˇr´ı • L4 (23 ) – dvou´ urovˇ nov´ y n´ avrh pro 2–3 faktory • L8 (27 ) – dvou´ urovˇ nov´ y n´ avrh pro 3–7 faktor˚ u urovˇ nov´ y n´ avrh pro 4–11 faktor˚ u • L12 (211 ) – dvou´ • L16 (215 ) – dvou´rovˇ nov´ y n´ avrh pro 4–15 faktor˚ u • L9 (34 ) – tˇr´ı´ urovˇ nov´ y n´ avrh pro 2–4 faktory • L18 (21 37 ) – n´ avrh pro 1 faktor se 2 u ´rovnˇemi a 3–7 faktor˚ u o tˇrech u ´rovn´ıch • L16 (45 ) – ˇctyˇru ´rovˇ nov´ y n´ avrh pro 2–5 faktor˚ u
ˇ ızen´e a ˇsumov´e faktory 5.2. R´
5.2
66
ˇ ızen´ R´ eaˇ sumov´ e faktory
V p˚ uvodn´ım pˇr´ıstupu se pro kaˇzdou skupinu faktor˚ u uvaˇzuje zvl´aˇstn´ı n´avrh, tzv. vnitˇrn´ı a vnˇejˇs´ı pole. Vnitˇrn´ı pole je tvoˇreno kombinacemi ˇriditeln´ ych faktor˚ u, vnˇejˇs´ı pole ruˇsiv´ ymi faktory. ˇ ızen´e • ˇriditeln´e (ˇr´ızen´e) faktory jsou takov´e, u nichˇz jsme schopni nastavit jejich u ´rovnˇe. R´ faktory tvoˇr´ı tzv. vnitˇrn´ı ortogon´aln´ı sestavu“ ” • ruˇsiv´e (neˇr´ızen´e, ˇsumov´e) faktory lze pouze mˇeˇrit. Nejsme schopni nastavit jejich u ´rovnˇe, ani je nijak ovlivˇ novat. Tyto faktory tvoˇr´ı tzv. vnˇejˇs´ı ortogon´aln´ı sestavu“. ” Kombinace u ´rovn´ı faktor˚ u odpov´ıdaj´ı faktori´aln´ımu ˇci d´ılˇc´ımu faktori´aln´ımu n´avrhu. Obˇe pole jsou kˇr´ıˇzena, coˇz znamen´ a, ˇze v kaˇzd´em bodˇe vnitˇrn´ıho pole, tj. pˇri dan´e kombinaci u ´rovn´ı ˇriditeln´ ych faktor˚ u, se vystˇr´ıdaj´ı vˇsechny body vnˇejˇs´ıho pole, tj. kombinace u ´rovn´ı ruˇsiv´ ych faktor˚ u. Prov´ ad´ı se tolik replikac´ı, kolik je kombinac´ı u ´rovn´ı ve vnˇejˇs´ı sestavˇe. V kaˇzd´em bodˇe vnitˇrn´ıho pole se z namˇeˇren´ ych hodnot sledovan´e veliˇciny vypoˇctou urˇcit´e charakteristiky a d´ale jsou analyzov´ any hodnoty tˇechto souhrnn´ ych charakteristik. Jednou z charakteristik je pr˚ umˇer, druh´ a charakteristika mˇeˇr´ı variabilitu hodnot odezvy. Taguchi pouˇz´ıv´a charakteristiku sign´ al/ˇsum“ ” S/N =
s´ıla sign´alu (citlivost)2 µ2 = = . s´ıla ˇsumu (variabilita)2 σ2
Charakteristik typu sign´ al/ˇsum existuje cel´a ˇrada, nejbˇeˇznˇejˇs´ı jsou vˇsak n´asleduj´ıc´ı ˇctyˇri, pouˇz´ıvan´e pˇri statick´em n´ avrhu, kdy sledovan´a veliˇcina (v´ ystup procesu) by mˇela b´ yt konstantn´ı (na rozd´ıl od dynamick´eho n´ avrhu, kdy se sledovan´a veliˇcina mˇen´ı v z´avislosti na sign´alu). Odhady stˇredn´ı hodnoty a rozptylu z´ısk´ame z dat:
µ ˆ = y¯i =
p M M 1 X 1 X 1X y¯ij = yijk , M j=1 M j=1 p k=1
σ ˆ2
= S–i2 =
1 Mp
p M X X
(yijk − y¯i )2 .
j=1 k=1
Pˇritom hodnoty yijk znaˇc´ı pozorov´an´ı k-t´e replikace v i-t´em bodˇe vnitˇrn´ıho pole pˇri j-t´e kombinaci ruˇsiv´ ych faktor˚ u, y¯i je pr˚ umˇer vypoˇcten´ y ze vˇsech pozorov´an´ı v i-t´em bodˇe a Si2 znaˇc´ı v´ ybˇerov´ y rozptyl. Chceme-li v procesu dos´ ahnout co nejmenˇs´ı stˇredn´ı hodnoty (a z´aroveˇ n co nejmenˇs´ı variability), pouˇzijeme charakteristiku zvanou menˇs´ı je lepˇs´ı“, danou vzorcem ” M
zi = −10 log10
p
1 XX 2 yijk . M p j=1 k=1
67
Kap. 5: Taguchiho robustn´ı n´avrhy
Toto lze pouˇz´ıt v pˇr´ıpadˇe, kdy hodnoty responzn´ı veliˇciny jsou kladn´e a c´ılov´a hodnota je nula. Naopak, chceme-li dos´ ahnout co nejvˇetˇs´ı stˇredn´ı hodnoty, pouˇzijeme krit´erium vˇetˇs´ı je lepˇs´ı“, ” dan´e vztahem p M 1 XX 1 zi = −10 log10 2 . M p j=1 yijk k=1
I v tomto pˇr´ıpadˇe musej´ı b´ yt hodnoty responzn´ı veliˇciny kladn´e. Jakousi oboustrannou varian” tou“, kdy poˇzadujeme, aby stˇredn´ı hodnota byl rovna nˇejak´e pˇredem dan´e noimin´aln´ı hodnotˇe, pˇredstavuje krit´erium zaloˇzen´e na v´ yrazu
zi = −10 log10
y¯i2 . Si2
Pˇri hled´an´ı robustn´ıho n´ avrhu ˇreˇs´ıme dvˇe u ´lohy. Nejdˇr´ıve zkoum´ame, kter´e ˇriditeln´e faktory maj´ı vliv na charakteristiku variability (at’ uˇz jde o pomˇer sign´al/ˇsum ˇci logaritmus rozptylu) a urˇcujeme u ´rovnˇe vlivn´ ych faktor˚ u, pˇri nichˇz bude variabilita redukov´ana. V dalˇs´ım kroku zkoum´ame vliv ˇriditeln´ ych faktor˚ u na pr˚ umˇer a oˇcek´av´ame, ˇze najdeme aspoˇ n jeden faktor, kter´ y nem´a z´aroveˇ n vliv na variabilitu. Pomoc´ı nastaven´ı tohoto faktoru, pˇr´ıpadnˇe dalˇs´ıch, uprav´ıme stˇredn´ı hodnotu procesu. Vzhledem k tomu, ˇze pro vnitˇrn´ı pole se ˇcasto vyuˇz´ıv´a d´ılˇc´ı faktori´aln´ı n´avrh, doch´az´ı ke smˇeˇsov´ an´ı nˇekter´ ych efekt˚ u. Taguchi obch´az´ı tento probl´em t´ım, ˇze pˇredem pˇredpokl´ad´a existenci pouze vybran´ ych interakc´ı (nebo naopak ˇz´adn´e interakce nepˇredpokl´ad´a) a pˇriˇrazen´ı sloupc˚ u matice n´ avrhu jednotliv´ ych faktor˚ um ˇci interakc´ım prov´ad´ı tak, aby ke sm´ıˇsen´ı vybran´ ych efekt˚ u nedoch´ azelo. To znamen´a, ˇze se vych´az´ı z urˇcit´e pˇredbˇeˇzn´e znalosti procesu. Taguchiho pˇr´ıstup se d´ a bez rizika pouˇz´ıt tam, kde jsme si jisti, ˇze interakce mezi faktory jsou zanedbateln´e ˇci dokonce neexistuj´ı. Anal´ yza rozptylu je silnˇe zaloˇzena na pˇredpokladu normality, coˇz veliˇcina s2 nesplˇ nuje. Pˇresto ale aplikovan´a anal´ yza rozptylu na s2 m˚ uˇze cokoliv objevit pro sniˇzov´an´ı u ´rovnˇe variability podle u ´rovn´ı ˇr´ızen´ ych i neˇr´ızen´ ych faktor˚ u. Aplikace Taguchiho n´avrh˚ u je v praxi mezi inˇzen´ yry hodnˇe obl´ıben´a, i kdyˇz ze strany matematick´ ych statistik˚ u je silnˇe jeho pˇr´ıstup kritizov´ an, ˇze nen´ı zcela korektn´ı a hlavnˇe neum´ı vyhodnotit pˇr´ıpadn´e interakce mezi ˇriditeln´ ymi a ruˇsiv´ ymi faktory, coˇz lze v r´ amci faktori´aln´ıch n´avrh˚ u napˇr. ˇreˇsit pomoc´ı n´ahodn´ ych faktor˚ u zapojen´ ych do experimentu.
ˇ ızen´e a ˇsumov´e faktory 5.2. R´
68
Kapitola 6
DOE v MINITABu 6.1
Program MINITAB
Minitab je poˇc´ıtaˇcov´ y program urˇcen´ y pro statistickou anal´ yzu dat. Byl vyvinut na Pensylv´ansk´e st´atn´ı universitˇe (Pensylvania State University) t´ ymem vˇedc˚ u v roce 1972. Program byl p˚ uvodnˇe byl urˇcen pro podporu v´ yuky statistiky, nicm´enˇe je urˇcen pro uˇzivatele jak z oblasti praxe, tak z vysok´ ych ˇskol. Software nab´ız´ı ˇreˇsen´ı pro uˇzivatele vˇsech u ´rovn´ı znalost´ı statistiky. Jeho v´ ykon a jednoduchost pouˇz´ıv´ an´ı z nˇeho uˇcinily vedouc´ı software na svˇetˇe v oblasti v´ yuky statistiky, anal´ yzy dat a v neposledn´ı ˇradˇe i v oblasti zlepˇsov´an´ı kvality. Souˇcasn´a verze Minitab 16 obsahuje prostˇred´ı pro pr´aci s daty (ve formˇe tabulkov´eho editoru), pro z´akladn´ı popisnou statistickou anal´ yzu, pro tvorbu model˚ u, pro pr´aci s ˇcasov´ ymi ˇradami, n´avrhy experiment˚ u a mnoho dalˇs´ıch funkc´ı. Velkou podporu m´a grafick´e zn´azornˇen´ı dat a v´ ysledk˚ u anal´ yz. Program umoˇzn ˇuje export dat a v´ ysledk˚ u anal´ yz do program˚ u Microsoft Office (Excel, PowerPoint a Word). Kromˇe moˇznosti pr´ace s vlastn´ımi daty nab´ız´ı i mnoho pˇredpˇripraven´ ych komentovan´ ych pˇr´ıklad˚ u a cviˇcen´ı. Zde je struˇcn´ y pˇrehled nˇekter´ ych funkc´ı a vlastnost´ı, kter´e v Minitabu naleznete: Spr´ ava dat a soubor˚ u Aplikace Minitab pˇrij´ım´a data v mnoha form´atech soubor˚ u a uchov´av´a Vaˇsi pr´aci v jedin´em, automaticky uspoˇr´ adan´em souboru projektu. Nejmodernˇ ejˇ s´ı grafy s moˇ znost´ı editace Jasn´e a pˇrehledn´e grafy se snadno vytv´aˇrej´ı pro ´ jak´ ykoliv u ´ˇcel. Upravy se prov´ ad´ı intuitivnˇe pomoc´ı myˇsi. ˇ Popisn´ a statistika Sirok´ a nab´ıdka jednoduch´ ych, ale v´ ykonn´ ych n´astroj˚ u, kter´e v´am pomohou s prov´adˇen´ım rychl´ ych vyhodnocen´ı a srovn´an´ı. 69
6.1. Program MINITAB
70
Regresn´ı anal´ yza Line´ arn´ı, polynomick´a, logistick´a a dalˇs´ı regresn´ı modely pom´ahaj´ı nal´ezt a popsat vztahy mezi odezvou a jedn´ım nebo v´ıce prediktory. Anal´ yza rozptylu Srozumiteln´ a sada n´astroj˚ u obsahuj´ıc´ı n´astroje ANOVA, GLM, anal´ yzu stˇredn´ıch hodnot a dalˇs´ı. Statistick´ eˇ r´ızen´ı proces˚ u Z´ıskejte kontrolu nad sv´ ymi procesy pomoc´ı sady regulaˇcn´ıch diagram˚ u a dalˇs´ıch n´ astroj˚ u. N´ astroje ˇ r´ızen´ı kvality D´ıky n´ astroj˚ um pro anal´ yzu zp˚ usobilosti proces˚ u, Paretovˇe grafu a dalˇs´ım v´ ykonn´ ym n´ astroj˚ um budou procesy odpov´ıdat Vaˇsim oˇcek´av´an´ım. Anal´ yza syst´ emu mˇ eˇ ren´ı Anal´ yza opakovatelnosti a reprodukovatelnosti mˇeˇren´ı (Gage R&R) a dalˇs´ı souvisej´ıc´ı n´ astroje zajiˇst’uj´ı kvalitu vaˇsich dat, kter´a analyzujete. ˇ Pl´ anovan´ e experimenty Sirok´ a nab´ıdka dostupn´ ych experiment´aln´ıch pl´an˚ u, nyn´ı vˇcetnˇe pl´an˚ u D-optimal a pl´ an˚ u na b´ azi vzd´alenosti. Anal´ yza spolehlivosti/anal´ yza pˇ reˇ zit´ı Spoˇc´ıtejte si ˇzivotnost V´ami pouˇz´ıvan´ ych ˇci prod´avan´ ych produkt˚ u, pˇredpov´ıdejte ˇcetnost poruch, nastavte si parametry z´aruky atd. S´ıla testu a rozsah vzork˚ u Sb´ırejte spr´avn´e mnoˇzstv´ı dat pro danou situaci. Umoˇzn ˇuje pouˇz´ıt Power kˇrivky k vizualizaci vztahu mezi rozsahem vzorku a s´ılou testu. Multivarianˇ cn´ı anal´ yza Anal´ yza hlavn´ıch komponent, anal´ yza klastr˚ u a dalˇs´ı v´ıcerozmˇern´e n´astroje. ˇ Casov´ eˇ rady a pˇ redpovˇ edi Rozs´ahl´a sb´ırka anal´ yz souvisej´ıc´ıch s ˇcasem, napˇr´ıklad anal´ yza trend˚ u a dekompozice. Nyn´ı s auto, ˇc´asteˇcnou nebo cross korelac´ı. Neparametrick´ a statistika Umoˇzn ˇuje prov´adˇen´ı nezbytn´ ych anal´ yz i s daty, kter´a nemaj´ı norm´ aln´ı rozdˇelen´ı. Tabulky Ch´ı-kvadr´ at, Fisher a dalˇs´ı n´astroje na b´azi tabulek. Simulace a rozdˇ elen´ı Generujte n´ahodn´a ˇc´ısla, vyb´ırejte n´ahodn´e vzorky a mnohem v´ıc. Makra a pˇ rizp˚ usobitelnost M˚ uˇzete automatizovat anal´ yzy, kter´e prov´ad´ıte pravidelnˇe, pˇrizp˚ usobovat nab´ıdky a nastaven´ı nebo dokonce integrovat jin´e programy pomoc´ı objekt˚ u Minitab COM.
71
Kap. 6: DOE v MINITABu
6.2
Vytvoˇ ren´ı n´ avrhu experimentu
N´astroje pro vytv´ aˇren´ı faktori´ aln´ıch n´ avrh˚ u experiment˚ u najdeme ve funkci Stat hlavn´ı nab´ıdky, v podnab´ıdce DOE > Factorial > Create Factorial Design. V Obr. 6.6.2 jsou vidˇet i dalˇs´ı moˇznosti (napˇr. Taguchiho experimenty). Pro faktori´aln´ı n´avrhty lze nastavit poˇcet faktor˚ u a poˇcet jejich u ´rovn´ı.
Obr. 6.1: Vytvoˇren´ı faktori´aln´ıho n´avrhu
Vytvoˇren´ı d´ılˇc´ıho experimentu m˚ uˇzeme prov´est stisknut´ım tlaˇc´ıtka Designs.... Po nˇem se n´ y´am objev´ı nab´ıdkov´e okno, v nˇemˇz lze vybrat kromˇe typu experimentu (´ upln´ y nebo d´ılˇc´ı) tak´e poˇcet replikac´ı, poˇcet centr´ aln´ıch bod˚ u a pˇr´ıpadn´e bloky.
Obr. 6.2: Nastaven´ı typu experimentu
Nastaven´ı typu a vlastnost´ı navrhovan´eho experimentu m´a za n´asledek pˇreddefinov´an´ı sloupc˚ u a ˇr´adk˚ u v tabulkov´em editoru pro vstup dat.
6.3. Vstup dat
6.3
72
Vstup dat
Po odsouhlasen´ı v´ ybˇeru typu experimentu a jeho vlastnost´ı (stiskem tlaˇc´ıtka OK na panelu viz. Obr. 6.6.2) se ve v´ ysledkov´em oknˇe objev´ı z´akladn´ı informace o navrhovan´em experimentu:
Obr´ azek 6.1: Z´akladn´ı informace o experimentu
a v doln´ı ˇc´ asti obrazovky najdeme pˇredvyplnˇenou ˇc´ast ˇr´adk˚ u v tabulkov´em editoru, slouˇz´ıc´ı pro vstup dat. Navrˇzen´ a mˇeˇren´ı obsahuj´ı vˇsechny kombinace moˇzn´ ych u ´rovn´ı z´ uˇcastnˇen´ ych faktor˚ u, pˇriˇcemˇz kaˇzd´ y ˇr´ adek vlastn´ıho n´ avrhu je zde zastoupen tolikr´at, jak´ y je poˇzadovan´ y poˇcet replikac´ı. Pˇritom kombinace u ´rovn´ı faktor˚ u jsou zde jiˇz zn´ahodnˇeny, coˇz je zˇrejm´e z prvn´ıho sloupce p˚ uvodn´ıch poˇrad´ı (v uspoˇr´ adan´e matici n´avrhu) a druh´ y sloupec ud´av´a, v jak´em poˇrad´ı by se mˇela mˇeˇren´ı postupnˇe uskuteˇcn ˇovat.
Obr´azek 6.2: Vstup dat
Namˇeˇren´e hodnoty budeme zapisovat do sloupce C8, pˇr´ıpadnˇe C9 a dalˇs´ıch. Data lze do programu MINITAB tak´e importovat ze souboru, vytvoˇren´eho napˇr´ıklad v MS
73
Vícefaktoriální návrhy experimentů
Kap. 6: DOE v MINITABu
Příklad:
Obr´ azek 6.3: Vstup dat a jejich zobrazen´ı ve formˇe krychle
Excelu nebo z datab´ aze pˇres rozhran´ı ODBC. Vlastnˇe lze importovat data z jak´ehokoli programu, pokud budou v textov´em form´ atu a oddˇelovaˇcem ;.
Obr´ azek 6.4: Vstup dat a jejich zobrazen´ı ve formˇe krychle
6.4. Vyhodnocen´ı v´ ysledku experimentu
6.4
Vyhodnocen´ı v´ ysledku experimentu
Obr´ azek 6.4: Hodnocen´ı kontroln´ıch diagram˚ u
Obr´ azek 6.5: Hodnocen´ı kontroln´ıch diagram˚ u
74
75
Kap. 6: DOE v MINITABu
Obr´ azek 6.6: Hodnocen´ı kontroln´ıch diagram˚ u
Obr´ azek 6.7: Hodnocen´ı kontroln´ıch diagram˚ u
ˇ sen´ 6.5. Reˇ y pˇr´ıklad z praxe
76
ˇ sen´ Reˇ y pˇ r´ıklad z praxe
6.5
V t´eto ˇc´ asti si uk´ aˇzeme konkr´etn´ı postup pˇri n´avrhu a vyhodnocen´ı experimentu pomoc´ı programu Minitab. V dalˇs´ım textu se omez´ıme pouze na ˇcinnosti, spojen´e s pouˇzit´ım tohoto programu. To znamen´ a, ˇze zde nebudeme popisovat vˇsechny kroky n´avrhu experimentu, jako je napˇr´ıklad anal´ yza procesu ˇci detailn´ı proveden´ı zkouˇsek.
´ cinnost a odolnost antibakteri´ Uˇ aln´ıho u ´ˇ cinku na upraven´ ych textili´ıch.
6.5.1
N´ avrh experimentu
C´ılem experimentu je sledov´ an´ı u ´bytku u ´ˇcinnosti antibakteri´aln´ıch u ´prav textili´ı v z´avislosti na poˇctu cykl˚ u pran´ı. Na z´ akladˇe anal´ yzy procesu byly vytvoˇreny z´akladn´ı hypot´ezy, kter´e by mˇel experiment potvrdit ˇci vyvr´ atit: • u ´ˇcinnost antibakteri´ aln´ı u ´pravy m˚ uˇze b´ yt r˚ uzn´a na r˚ uzn´ ych antibakteri´aln´ıch u ´prav´ach. • u ´ˇcinnost se zˇrejmˇe mˇen´ı s poˇctem prac´ıch cykl˚ u.
Z´aroveˇ n byly pˇri anal´ yze vybr´ any ˇctyˇri druhy materi´alu, na kter´ ych bude experiment prob´ıhat. Jako vhodn´ y se uk´ azal n´ avrh 2-faktorov´eho experimentu, v nˇemˇz • prvn´ı faktor je typ materi´ alu. Jsou uvaˇzov´any 4 typy materi´al˚ u, liˇs´ıc´ı se sloˇzen´ım (pomˇerem bavlny a umˇel´ ych vl´ aken SeaCell, TreviraBioactive) nebo impregnac´ı antibakteri´aln´ım pˇr´ıpravkem. • druh´ ym faktorem je poˇcet cykl˚ u pran´ı. Mˇeˇren´ı bude prov´adˇeno pˇred pran´ım (0 cykl˚ u), po 1 vypr´ an´ı, po 25 cyklech a po 40 cyklech pran´ı. • od kaˇzd´eho typu materi´ alu budou pˇripraveny 2 vzorky pro kaˇzd´ y ze ˇctyˇr uvaˇzovan´ ych poˇct˚ u prac´ıch cykl˚ u. Tedy celkem budeme m´ıt 32 vzork˚ u. Souˇc´ast´ı n´ avrhu je i zp˚ usob pˇr´ıpravy vzork˚ u a proveden´ı jednotliv´ ych mˇeˇren´ı. N´ aˇs vytvoˇren´ y n´ avrh experimentu nyn´ı vloˇz´ıme do programu Minitab, v nˇemˇz bude prob´ıhat i vyhodnocen´ı. Spust´ıme program Minitab a budeme postupovat podle Obr. 6.6.2: v hlavn´ı nab´ıdce vybereme funkci statistiky (Stat), v n´ı metodu DOE, d´ale faktori´aln´ı n´avrh (Factorial) a jeho vytvoˇren´ı (Create Factorial Design ...).
77
Kap. 6: DOE v MINITABu Nyn´ı budeme pracovat s nab´ıdkou v oknˇe Create Factorial Design. Nejprve zaˇskrtneme
moˇznost General full fractional design, nebot’ uvaˇzujeme v´ıce neˇz dvou´ urovˇ nov´ y n´avrh. Po volbˇe tlaˇc´ıtka Designs ... se n´ am otevˇre ok´enko, v nˇemˇz m˚ uˇzeme nastavit n´azvy faktor˚ u (zvolili jsme Material a prani) a poˇcty jejich u ´rovn´ı (v naˇsem pˇr´ıpadˇe jsou 4 pro oba faktory). Poˇcet replikac´ı (Number of replicates) nastav´ıme na hodnotu 2.
Obr´ azek 6.8: Vytvoˇren´ı faktori´aln´ıho n´avrhu
Volba Factors ... n´ am dovol´ı oznaˇcit hodnoty jednotliv´ ych u ´rovn´ı faktor˚ u. Zde jsme oznaˇcili jednotliv´e druhy materi´ al˚ u velk´ ymi p´ısmeny: A (60% Bavlna, 20% SeaCell active, 20% SeaCell pure), B (50% Bavlna, 50% TreviraBioactive), C (50% Bavlna, 30% Smartcell sensitive, R SeaCell pure) a D (100% Bavlna impregnovan´a antibakteri´aln´ım prostˇredkem SILVERPLUS
protection), poˇcty cykl˚ u pran´ı potom hodnotami 0, 1, 25 a 40.
Obr´ azek 6.9: Nastaven´ı faktor˚ u
D´ale zvol´ıme randomizaci n´ avrhu. To proto, abychom vylouˇcili moˇznou z´avislost mˇeˇren´ı danou poˇrad´ım vzork˚ u nebio poˇcty cykl˚ u pran´ı. Randomizaci nastav´ıme zaˇskrtnut´ım pol´ıˇcka v oknˇe
ˇ sen´ 6.5. Reˇ y pˇr´ıklad z praxe
78
Options .... Jeˇstˇe pouˇzijeme volbu Results ..., v n´ıˇz nastav´ıme moˇznosti v´ ystupu v´ ysledk˚ u na Summary table and design table. V tomto form´atu se n´am v´ ysledky uk´aˇz´ı na ploˇse sessions a bude moˇzn´e je tak i vytisknout ˇci uloˇzit. Nyn´ı ukonˇc´ıme n´avrh stiskem tlaˇc´ıtka OK. Vz´apˇet´ı se n´am uk´ aˇze tabulka n´ avrhu jak v poli sessions, tak i v tzv. Worksheetu. Do nˇeho budeme zapisovat v´ ysledky mˇeˇren´ı, postupnˇe ˇr´adek po ˇr´adku. Zn´ahodnˇen´e poˇrad´ı se zde projevuje t´ım, ˇze jednotliv´e ˇr´ adky ve worksheetu jsou uˇz oznaˇceny u ´rovnˇemi faktor˚ u (ve sloupc´ıch Matreri´ al a prani v n´ ahodn´em poˇrad´ı.
Obr´azek 6.10: Worksheet
79
Kap. 6: DOE v MINITABu
6.5.2
Pˇ r´ıprava vzork˚ u a mˇ eˇ ren´ı
Vzorky, kter´e budou proch´ azet prac´ım cyklem, budou vypr´any podle doporuˇcen´eho prac´ıho poˇ stupu v souladu s normou CSN EN ISO 6330 (80 0821). Po pran´ı budou testov´ any zmˇeny antibakteri´aln´ıch vlastnost´ı antibakteri´alnˇe upraven´ ych textili´ı. Pˇripraven´e a vypran´e vzorky budou vystaveny vlivu kvasn´eho roztoku a bude sledov´an proces fermentace. Bˇehem procesu fermentace kvasinky pˇremˇen ˇuj´ı jednoduch´e cukry (glukosa, fruktosa) na ethanol (alkohol) a CO2 (oxid uhliˇcit´ y), kter´ y uch´az´ı do okoln´ıho vzduchu. Princip experimentu je zaloˇzen na sledov´ an´ı doby fermentace, po kterou se uvolˇ nuje oxid uhliˇcit´ ya odpov´ıd´a aktivitˇe kvasinek. Do t´eto tabulky zap´ıˇseme namˇeˇren´e hodnoty do sloupce C7, kter´ y nav´ıc oznaˇc´ıme jako doba.
Obr´ azek 6.11: Namˇeˇren´e hodnoty doby fermentace
ˇ sen´ 6.5. Reˇ y pˇr´ıklad z praxe
6.5.3
80
Anal´ yza v´ ysledk˚ u
Nyn´ı pˇrikroˇc´ıme k anal´ yze v´ ysledk˚ u experimentu. V hlavn´ı nab´ıdce pouˇzijeme opˇet cestu Stat → DOE → Factorial. Zde se n´ am objevily dalˇs´ı dvˇe pˇr´ıstupn´e funkce: Analyze Factorial Design ... a Factorial Plots ....
Obr´ azek 6.12: Vyhodnocen´ı experimentu
Pod´ıvejme se nejprve na grafy efekt˚ u hlavn´ıch faktor˚ u. Vybereme funkci Factorial Plots .... Zde m´ ame moˇznost zaˇskrtnout jednu nebo obˇe moˇznosti: • graf hlavn´ıch efekt˚ u (Main effects) zobrazuj´ıc´ı stˇredn´ı hodnoty odezvy pˇri jednotliv´ ych u ´rovn´ıch hlavn´ıch faktor˚ u. M˚ uˇzeme si nav´ıc vybrat, zda chceme stˇredn´ı hodnoty pˇr´ımo z namˇeˇren´ ych dat nebo odhadnut´e stˇredn´ı hodnoty z modelu. • graf interakc´ı (Interaction) zobrazuj´ıc´ı hodnoty stˇredn´ıch hodnot odezvy pro r˚ uzn´e u ´rovnˇe druh´eho faktoru ve ˇctyˇrech kˇrivk´ach, kaˇzd´e pro jednu hodnotu prvn´ıho faktoru.
Obr´ azek 6.13: Grafy hlavn´ıch efekt˚ u a interakc´ı
D´ ale je tˇreba nastavit odezvu a faktory. K tomu slouˇz´ı funkce Setup .... Zde v´ ybˇerem ze
81
Kap. 6: DOE v MINITABu
seznamu promˇenn´ ych zvol´ıme, kter´ a bude odezvou (doba), kter´e hlavn´ımi faktory (Mereni, prani) a pro ktere kombinace faktoru chceme zobrazit interakce. Po stisku tlaˇc´ıtka OK dostaneme zaˇskrtnut´e grafy, z nichˇz lze vyˇc´ıst vlivy hlavn´ıch faktor˚ u, pˇr´ıpadnˇe pˇr´ıtomnost vlivu interakc´ı. Tyto grafy neposkytuj´ı kvantitativn´ı u ´daje a tud´ıˇz na jejich z´akladˇe lze pouze z´ıskat dojem“ o vlivu jednotliv´ ych faktor˚ u ˇci interakc´ı. Nicm´enˇe, jako vod´ıtko ” pro dalˇs´ı anal´ yzu jsou uˇziteˇcn´e.
Obr´ azek 6.14: Hlavn´ı efekty faktor˚ u a interakce
Z grafu nalevo je zˇrejm´e, ˇze vliv materi´ alu je pomˇernˇe velk´ y, pˇriˇcemˇz nejlepˇs´ı v´ ysledky vykazuje materi´al D a nejhorˇs´ı materi´ al A. V pˇr´ıpadˇe materi´alu A odolnost v´ yraznˇe kles´a s poˇctem prac´ıch cykl˚ u na rozd´ıl od ostatn´ıch tˇr´ı materi´al˚ u, jak lze vidˇet na Obr. 6.13 napravo. Tento v´ yrazn´ y trend ovlivˇ nuje zˇrejmˇe i graf hlavn´ıch efekt˚ u v prav´e ˇc´asti lev´eho grafu. Z pˇredchoz´ıch graf˚ u je zˇrejm´e, ˇze hlavn´ı faktory i jejich interakce maj´ı vliv na odezvu. Jak velk´ y a v´ yznamn´ y, to n´ am pov´ı kvantitativn´ı anal´ yza. Tu vyvol´ame volbou funkce Analyze Factorial Design ....
Obr´ azek 6.15: Analyze Factorial Design ...
ˇ sen´ 6.5. Reˇ y pˇr´ıklad z praxe
82
Panel pro anal´ yzu v´ ysledk˚ u experimentu nab´ız´ı nˇekolik funkc´ı: • Terms ... pro nastaven´ı stupnˇe interakce. V naˇsem pˇr´ıpadˇe lze volit 1 (bez interakce) nebo 2 (interakce mezi dvˇema uvaˇzovan´ ymi faktory) • Covariates ... je panel pro v´ ybˇer kovari´at v modelu. Tyto kovari´aty musej´ı b´ yt uloˇzeny jako sloupec v pracovn´ım seˇsitˇe. • Graphs ... umoˇzn ˇuje nastaven´ı v´ ystupn´ıch graf˚ u v´ ybˇerem z nˇekolika moˇznost´ı • Results ... nastavuje tvar v´ ystupu. Pokud nezvol´ıme nic (Do not display), je z´akladem tabulka anal´ yzy rozptylu (ANOVA Table) a k n´ı lze vybrat dalˇs´ı informace (covariate, coefficients, unusual observations) • Storage ... pro uloˇzen´ı rezidu´ı, odhad˚ u, parametr˚ u modelu a dalˇs´ıch informac´ı. Tyto u ´daje budou uloˇzeny jako sloupce tabulky v pracovn´ım seˇsitu (Worksheet). • Weights ... je panel pro v´ ybˇer vah pro v´aˇzen´ y odhad odezvy. Tyto v´ahy musej´ı b´ yt uloˇzeny jako sloupec v pracovn´ım seˇsitˇe. V naˇsem pˇr´ıpadˇe pouze nastav´ıme typ v´ ystupu s rezidui a stiskneme OK (odezva a faktory spolu s interakcemi uˇz m´ ame nastaveny z pˇredchoz´ıho kroku (nastaven´ı pro grafy hlavn´ıch efekt˚ u a interakc´ı). Pot´e dostaneme pˇrehled v´ ysledk˚ u kvantitativn´ı anal´ yzy. General Linear Model: doba versus Material; prani
Factor
Type
Levels
Values
Material
fixed
4
A; B; C; D
prani
fixed
4
0; 1; 25; 40
N´aˇs model uvaˇzujeme ve tvaru
yij = µ + αi + βj + αβ
ij
+ ij
kde yij je doba fermentace pro i-tou u ´roveˇ n faktoru materi´al a j-tou u ´roveˇ n poˇctu cykl˚ u pran´ı, µ je spoleˇcn´ au ´roveˇ n pro oba faktory, αi oznaˇcuje vliv i-t´e u ´rovnˇe faktoru material, βj oznaˇcuje vliv j-t´e u ´rovnˇe faktoru prani, αβ ij je vliv interakce i-t´e a j-t´e u ´rovnˇe faktor˚ u a ij pˇredstavuje n´ahodnou chybu pˇri i-t´e a j-t´e u ´rovni odpov´ıdaj´ıc´ıch faktor˚ u (reziduum). Statistickou v´ yznamnost vlivu faktor˚ u a jejich interakce vyhodnot´ıme pomoc´ı anal´ yzy rozptylu:
83
Kap. 6: DOE v MINITABu
Analysis of Variance for doba, using Adjusted SS for Tests
Source
DF
Seq SS
Adj SS
Adj MS
F
P
Material
3
24804,0
24804,0
8268,0
4724,57
0,000
prani
3
1983,3
1983,3
661,1
377,76
0,000
Material*prani
9
15232,2
15232,2
1692,5
967,13
0,000
Error
16
28,0
28,0
1,8
Total
31
42047,5
S = 1,32288
R-Sq = 99,93%
R-Sq(adj) = 99,87%
Z tabulky anal´ yzy rozptylu je vidˇet, ˇze vliv obou faktor˚ u i jejich interakce jsou statisticky v´ yznamn´e. O tom svˇedˇc´ı prakticky nulov´e p-hodnoty v posledn´ım sloupci. Hodnoty koeficientu determinace R−Sq jsou bl´ızk´e jedn´e, coˇz vypov´ıd´a o tom, ˇze n´aˇs model vysvˇetluje t´emˇeˇr vˇsechnu variabilitu namˇeˇren´ ych dat a tedy je dobr´ ym modelem. Odhady jednotliv´ ych efekt˚ u (koeficient˚ u modelu) jsou v dalˇs´ı ˇc´ asti textov´eho v´ ystupu: Term
Coef
SE Coef
T
P
223,125
0,234
954,12
0,000
A
-30,5000
0,4050
-75,30
0,000
B
-23,0000
0,4050
-56,78
0,000
C
16,5000
0,4050
40,74
0,000
0
4,2500
0,4050
10,49
0,000
1
7,1250
0,4050
17,59
0,000
25
1,8750
0,4050
4,63
0,000
Constant Material
prani
Material*prani A
0
32,6250
0,7016
46,50
0,000
A
1
30,7500
0,7016
43,83
0,000
A
25
-4,5000
0,7016
-6,41
0,000
B
0
-14,3750
0,7016
-20,49
0,000
B
1
-16,7500
0,7016
-23,88
0,000
B
25
7,5000
0,7016
10,69
0,000
C
0
-3,8750
0,7016
-5,52
0,000
ˇ sen´ 6.5. Reˇ y pˇr´ıklad z praxe
84
C
1
-6,7500
0,7016
-9,62
0,000
C
25
-1,0000
0,7016
-1,43
0,173
Zde Constant odpov´ıd´ a spoleˇcn´emu efektu µ, material A, B, C odpov´ıd´a efekt˚ um α1 , α2 , α3 , prani 0, 1, 25 odpov´ıd´ a efekt˚ um β1 , β2 , β3 a ve spodn´ı polovinˇe tabulky jsou hodnoty efekt˚ u interakc´ı. Vˇsimnˇeme si, ˇze v´ ysledkov´a tabulka neobsahuje hodnoty efekt˚ u pro materi´al D a poˇcet P4 P4 cykl˚ u pran´ı 40. Tyto efekty lze snadno dopoˇc´ıtat z podm´ınky i=1 αi = 0 a j=1 βj = 0. Odtud dost´av´ ame α4 = 37, 000 a β4 = −13, 250. N´ asleduj´ıc´ı odhady stˇredn´ıch hodnot odezvy pro jednotliv´e u ´rovnˇe faktor˚ u a pro interakce jsme uˇz vidˇeli graficky zn´ azornˇen´e v Obr. 6.14: Least Squares Means for doba
Material
Mean
SE Mean
A
192,6
0,4677
B
200,1
0,4677
C
239,6
0,4677
D
260,1
0,4677
0
227,4
0,4677
1
230,3
0,4677
25
225,0
0,4677
40
209,9
0,4677
prani
Material*prani A
0
229,5
0,9354
A
1
230,5
0,9354
A
25
190,0
0,9354
A
40
120,5
0,9354
B
0
190,0
0,9354
B
1
190,5
0,9354
B
25
209,5
0,9354
B
40
210,5
0,9354
C
0
240,0
0,9354
C
1
240,0
0,9354
C
25
240,5
0,9354
85
Kap. 6: DOE v MINITABu
C
40
238,0
0,9354
D
0
250,0
0,9354
D
1
260,0
0,9354
D
25
260,0
0,9354
D
40
270,5
0,9354
Volba Graphs ... n´ am nab´ız´ı ˇradu graf˚ u zobrazuj´ıc´ıch pˇredevˇs´ım rezidua. Zvol´ıme ˇctyˇri v jed” nom“ (Four in one) obsahuj´ıc´ı: norm´ aln´ı pravdˇepodobnostn´ı pap´ır pro rezidua (Normal Probability Plot of the Residuals), graf rezidu´ı pro odhadnut´e hodnoty (Residuals Versus the Fitted Values), histogram rezidu´ı (Histogram of the Residuals) a graf rezidu´ı pro jednotliv´a mˇeˇren´ı (Residuals Versus the Order of the Data). V´ ystup je na Obr. 6.16.
Obr´ azek 6.16: Anal´ yza rezidu´ı
Z histogramu vid´ıme, ˇze v krajn´ıch hodnot´ach zjiˇsen´ ych rezidu´ı (v bodech -2 a +2) existuje v´ıce pozorov´an´ı, neˇz by odpov´ıdalo norm´ an´ımu rozdˇelen´ı. V prav´em doln´ım grafu na obr. 6.16 je vidˇet, ˇze existuj´ı ˇctyˇri mˇeˇren´ı v nichˇz rezidua v naˇsem modelu nab´ yvj´ı extr´emn´ıch hodnot. Tato mˇeˇren´ı jsou identifikov´ ana v textov´em v´ ystupu jako neobvykl´ a pozorov´ an´ı (unusual observations): Unusual Observations for doba
Obs
doba
Fit
SE Fit
Residual
St Resid
5
258,000
260,000
0,935
-2,000
-2,14 R
9
262,000
260,000
0,935
2,000
2,14 R
ˇ sen´ 6.5. Reˇ y pˇr´ıklad z praxe
86
25
236,000
238,000
0,935
-2,000
-2,14 R
28
240,000
238,000
0,935
2,000
2,14 R
R denotes an observation with a large standardized residual.
Grafy na Obr. 6.16 n´ am ukazuj´ı, ˇze by mohl b´ yt probl´em s normalitou rezidu´ı. Provedeme tedy jeˇstˇe test normality rezidu´ı. Uloˇz´ıme nejprve rezidua do datov´e tabulky nastaven´ım funkce Storage ... v panelu anal´ yzy faktori´ aln´ıho experimentu:
Obr´ azek 6.17: Uloˇzen´ı rezidu´ı a predikce
Vybrali jsme uloˇzen´ı odhadovan´ ych hodnot (Fits), rezidu´ı (Residuals) a standardizovan´ ych rezidu´ı (Standardized Residuals). Spoˇcten´a data se uloˇz´ı do sloupc˚ u tabulky pod n´azvy FITS1, RESI1 a SRES1. Test normality nalezneme v hlavn´ı nab´ıdce pod poloˇzkou Stat → Basic statistics. Zde m˚ uˇzeme vybrat bud’ funkci Normality test ...nebo Graphicel Summary .... Normality test ... nab´ız´ı nˇekolik test˚ u normality: Anderson-Darling˚ uv test, test Ryan-Joiner (obdoba Shapiro-Wilkova testu) a Kolmogorov-Smirnov˚ uv test. V naˇsem pˇr´ıpadˇe, kdy nezn´ame stˇredn´ı hodnotu ani rozptyl, je nejvhodnˇejˇs´ı pouˇz´ıt Anderson-Darling˚ uv test. Jeho v´ ysledek je zobrazen na Obr. 6.18 vpravo. Funkce Graphical Summary ... n´ am poskytne podobn´ y v´ ysledek pouze s t´ım rozd´ılem, ˇze data zobrazuje v histogramu a krabicov´em grafu (viz Obr. 6.18 vlevo). Z v´ ysledk˚ u je zˇrejm´e, ˇze hypot´ezu o normalitˇe nelze zam´ıtnout na hladinˇe v´ yznamnosti 7,5%.
87
Kap. 6: DOE v MINITABu
Obr´ azek 6.18: Test normality
6.5.4
Z´ avˇ er
C´ılem experimentu bylo sledov´ an´ı u ´bytku u ´ˇcinnosti antibakteri´aln´ıch u ´prav textili´ı v z´avislosti na poˇctu cykl˚ u pran´ı. Na z´ akladˇe v´ ysledku mˇeˇren´ı lze konstatovt, ˇze u ´ˇcinnost antibakteri´aln´ıch u ´prav se v´ yraznˇe liˇs´ı v z´ avislosti na pouˇzit´ ych materi´alech. Pokles u ´ˇcinnosti v z´avislosti na poˇctu prac´ıch cykl˚ u je pouze optick´ a“ (viz Obr. 6.14 vlevo). Zde se projevuje siln´ y vliv interakce ” materi´ al*pran´ı. Pokles u ´ˇcinnosti s poˇctem prac´ıch cykl˚ u je v´ yrazn´ y pouze v pˇr´ıpadˇe materi´alu A (60% Bavlna, 20% SeaCell active, 20% SeaCell pure). U ostatn´ıch pouˇzit´ ych materi´al˚ u je tomu sp´ıˇse naopak (viz Obr. 6.14 vpravo).
ˇ sen´ 6.5. Reˇ y pˇr´ıklad z praxe
88
Literatura ˇ , 1998 [1] Jaroˇsov´a, E.: Navrhov´ an´ı experiment˚ u, VSE ˇ a spoleˇcnost pro jakost, 2007 [2] Jaroˇsov´a, E..: Navrhov´ an´ı experiment˚ u a jejich anal´ yza, Cesk´ [3] Likeˇs, J.: Navrhov´ an´ı pr˚ umyslov´ ych experiment˚ u, SNTL, 1968 [4] Mich´alek, J., Kˇrepela, J.: DOE – Navrhov´an´ı a vyhodnocov´an´ı statistick´ ych experiment˚ u, ˇ CSJ, 2009 [5] Montgomery, D. C.: Design and Analysis of Experiments , 5th ed., J.Wiley, 2002 [6] Roy, R.K.: Design of experiments using the Taguchi aproach. J.Wiley&Sons, New York, 2001 [7] Ryan, P. R.: Modern Experiment Design, J. Wiley, 2007 ˇ [8] Toˇsenovsk´ y, J.: Pl´ anov´ an´ı experiment˚ u, VSB-TU Ostrava, 2012 ˇ ˇ ast 3: Navrhov´an´ı experiment˚ [9] CSN ISO 3534-3:2001 Statistika – Slovn´ık a znaˇcky – C´ u (01 0216)
89