´ UCEN ˇ ´I TECHNICKE ´ V BRNE ˇ VYSOKE BRNO UNIVERSITY OF TECHNOLOGY
ˇ YRSTV´ ´ FAKULTA STROJN´ıHO INZEN ı ´ USTAV MATEMATIKY FACULTY OF MECHANICAL ENGINEERING INSTITUTE OF MATHEMATICS
´ METODY PRO VYHODNOCOVAN ´ ´I STATISTICKE ´ SENZORICKYCH DAT STATISTICAL METHODS FOR EVALUATION OF SENSORIAL DATA
´ PRACE ´ DIPLOMOVA MASTER’S THESIS
´ AUTOR PRACE
´ Bc. MAGDA KOZIELOVA
AUTHOR
´ VEDOUC´I PRACE SUPERVISOR
BRNO 2009
´ doc. RNDr. JAROSLAV MICHALEK, CSc.
Abstrakt T´ematem t´eto diplomov´e pr´ace je statistick´e vyhodnocov´an´ı dat z´ıskan´ ych pˇri senzorick´e anal´ yze potravin. Pˇrin´aˇs´ı v´ ybˇer vhodn´ ych statistick´ ych test˚ u, jejich podrobnou anal´ yzu a srovn´an´ı dle pr˚ ubˇehu jednotliv´ ych silofunkc´ı pro dan´e parametry. D˚ uleˇzitou souˇc´ast´ı pr´ace je naprogramov´an´ı uˇzivatelsk´e aplikace pˇr´ımo urˇcen´e ke zpracov´an´ı senzorick´ ych dat. Summary The thesis deals with the statistical evaluation of data gained by the sensory analysis of the foodstuff. It brings a selection of the suitable statistical tests, a detailed analysis of these tests and their comparision based on the particular power functions for given parameters. As an important part of the thesis, there is a creating of custom software for the evaluating of sensorial data. Kl´ıˇ cov´ a slova statistick´e metody, senzorick´a anal´ yza, silofunkce, s´ıla testu Keywords statistical methods, sensory analysis, power function, power of test
´ M.Statistick´e metody pro vyhodnocov´an´ı senzorick´ych dat . Brno: Vysok´e KOZIELOVA, uˇcen´ı technick´e v Brnˇe, Fakulta strojn´ıho inˇzen´ yrstv´ı, 2009. 77 s. Vedouc´ı doc. RNDr. Jaroslav Mich´alek, CSc.
ˇ Cestnˇ e prohlaˇsuji, ˇze jsem diplomovou pr´aci Statistick´e metody pro vyhodnocov´an´ı senzorick´ych dat vypracovala samostatnˇe pod veden´ım doc. RNDr. Jaroslava Mich´alka, CSc. s pouˇzit´ım materi´al˚ u uveden´ ych v seznamu literatury. Bc. Magda Kozielov´a
T´ımto bych chtˇela podˇekovat vedouc´ımu m´e diplomov´e pr´ace panu doc. RNDr. Jaroslavu Mich´alkovi, CSc. za odborn´e rady a cenn´e pˇripom´ınky, kter´e pˇrispˇely ke zd´arn´emu zpracov´an´ı zadan´eho t´ematu. Bc. Magda Kozielov´a
Obsah ´ Uvod
3
1 Z´ akladn´ı pojmy 1.1 Z´akladn´ı statistick´e pojmy . . . . . . . . . . . . . . . . . 1.2 Vybran´a rozdˇelen´ı . . . . . . . . . . . . . . . . . . . . . . 1.2.1 Binomick´e rozdˇelen´ı . . . . . . . . . . . . . . . . . 1.2.2 Beta rozdˇelen´ı . . . . . . . . . . . . . . . . . . . . 1.2.3 Rozdˇelen´ı Fisherovo-Snedecorovo F . . . . . . . . 1.3 Souvislost mezi rozdˇelen´ım F a binomick´ ym rozdˇelen´ım . 1.4 Aproximace binomick´eho rozdˇelen´ı norm´aln´ım rozdˇelen´ım 1.5 Transformace stabilizuj´ıc´ı rozptyl . . . . . . . . . . . . . 1.5.1 Arcussinov´a transformace v binomick´em rozdˇelen´ı 1.6 Testov´an´ı hypot´ez . . . . . . . . . . . . . . . . . . . . . . 1.7 Intervalov´e odhady . . . . . . . . . . . . . . . . . . . . . 2 Senzorick´ a anal´ yza 2.1 Rozliˇsovac´ı metody . . . . . . . . . . . . . 2.1.1 P´arov´a porovn´avac´ı zkouˇska . . . . 2.1.2 Zkouˇska duo-trio . . . . . . . . . . 2.1.3 Troj´ uheln´ıkov´a zkouˇska . . . . . . . 2.2 Poˇradov´e metody . . . . . . . . . . . . . . 2.3 Hodnocen´ı s pouˇzit´ım ordin´aln´ıch stupnic .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
3 Testy hypot´ ez o parametru π binomick´ eho rozdˇ elen´ı 3.1 Kritick´ y obor testu o parametru binomick´eho rozdˇelen´ı . . . . . . . . . . 3.2 S´ıla testu o parametru π binomick´eho rozdˇelen´ı . . . . . . . . . . . . . . 3.3 Explicitn´ı vyj´adˇren´ı intervalu spolehlivosti pro parametr π binomick´eho rozdˇelen´ı . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.4 S´ıla testu vyuˇz´ıvaj´ıc´ıho Fisherovy kvantily . . . . . . . . . . . . . . . . . 3.5 Test zaloˇzen´ y na norm´aln´ı aproximaci . . . . . . . . . . . . . . . . . . . . 3.6 S´ıla testu zaloˇzen´eho na norm´aln´ı aproximaci . . . . . . . . . . . . . . . . 3.7 Testy zaloˇzen´e na arcussinov´e transformaci . . . . . . . . . . . . . . . . . 3.8 S´ıla test˚ u zaloˇzen´ ych na arcsin-transformaci . . . . . . . . . . . . . . . . 3.9 Volba rozsahu v´ ybˇeru n . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . .
5 5 6 6 6 7 7 9 9 10 11 12
. . . . . .
13 13 13 13 13 14 14
15 . 15 . 16 . . . . . . .
4 Srovn´ an´ı test˚ u o parametru π binomick´ eho rozdˇ elen´ı 5 Statistick´ e metody v senzorick´ e anal´ yze 5.1 Vyhodnocen´ı rozliˇsovac´ıch metod . . . . 5.1.1 P´arov´a porovn´avac´ı zkouˇska . . . 5.1.2 Zkouˇska duo-trio . . . . . . . . . 5.1.3 Troj´ uheln´ıkov´a zkouˇska . . . . . . 5.2 Vyhodnocen´ı poˇradov´ ych metod . . . . . 1
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
18 20 22 23 31 31 37 41
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
49 49 49 50 51 52
5.3
Vyhodnocen´ı stupnicov´ ych metod . . . . . . . . . . . . . . . . . . . . . . . 53 5.3.1 Hodnocen´ı jednoho senzorick´eho znaku v r´amci jednoho v´ yrobku . . 53 5.3.2 Srovn´an´ı senzorick´eho znaku dvou a v´ıce v´ yrobk˚ u . . . . . . . . . . 54
6 Software pro zpracov´ an´ı senzorick´ ych dat 6.1 Senzorick´a anal´ yza . . . . . . . . . . . . . 6.1.1 Rozliˇsovac´ı zkouˇsky . . . . . . . . . 6.1.2 Poˇradov´e zkouˇsky . . . . . . . . . . 6.1.3 Stupnicov´e zkouˇsky . . . . . . . . . 6.2 Anal´ yza jednorozmˇern´ ych dat . . . . . . . 6.2.1 Z´akladn´ı zpracov´an´ı dat . . . . . . 6.2.2 Srovn´an´ı souboru s pˇredpokladem . 6.2.3 Srovn´an´ı dvou nez´avisl´ ych soubor˚ u 6.2.4 Srovn´an´ı dvou z´avisl´ ych soubor˚ u . 7 Pˇ r´ıklad senzorick´ eho experimentu 7.1 P´arov´a porovn´avac´ı zkouˇska . . . . . . . . 7.2 Poˇradov´a zkouˇska . . . . . . . . . . . . . . 7.3 Hodnocen´ı s pouˇzit´ım ordin´aln´ıch stupnic . 7.4 Shrnut´ı v´ ysledk˚ u senzorick´eho experimentu
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . .
57 57 58 59 61 61 62 62 62 64
. . . .
67 67 68 68 70
Z´ avˇ er
71
Literatura
73
Seznam z´ akladn´ıch pouˇ zit´ ych zkratek a symbol˚ u
75
Seznam pˇ r´ıloh
77
2
´ Uvod C´ılem t´eto diplomov´e pr´ace je vybrat a d˚ ukladnˇe popsat statistick´e testy vhodn´e pro vyhodnocov´an´ı dat z´ıskan´ ych pˇri senzorick´e anal´ yze potravin. D´ale vyˇsetˇrit silofunkce tˇechto test˚ u a na z´akladˇe jejich pr˚ ubˇehu stanovit doporuˇcen´ı t´ ykaj´ıc´ı se jejich vyuˇzit´ı. Dalˇs´ım z c´ıl˚ u je tak´e vybrat vhodn´e programovac´ı prostˇred´ı a v nˇem prov´est programovou implementaci. Jej´ı funkˇcnost je pak nezbytn´e ovˇeˇrit na re´aln´ ych ˇci simulovan´ ych datech. V prvn´ı kapitole jsou uvedeny z´akladn´ı d´ale pouˇz´ıvan´e pojmy z matematick´e statistiky, testov´an´ı hypot´ez a tak´e nˇekter´e z´avislosti nezbytn´e pro lepˇs´ı orientaci v dalˇs´ım textu. Druh´a kapitola seznamuje s problematikou metod senzorick´e anal´ yzy, obsahuje struˇcnou charakteristiku jednotliv´ ych typ˚ u senzorick´ ych zkouˇsek a popis jejich prov´adˇen´ı. Tˇret´ı kapitola popisuje pˇet test˚ u vybran´ ych pro vyhodnocov´an´ı senzorick´ ych dat. Jsou zavedeny jednotliv´e testovac´ı statistiky a tak´e jsou zde odvozeny analytick´e vztahy pro pˇresn´e i aproximovan´e silofunkce test˚ u. Souˇc´ast´ı je rozbor test˚ u zaloˇzen´ y na zkoum´an´ı tvar˚ u silofunkc´ı, kter´e byly vykresleny pomoc´ı novˇe naprogramovan´ ych funkc´ı v MATLABu. Jedn´a se o programy, kter´e graficky zn´azorˇ nuj´ı pr˚ ubˇeh jednotliv´ ych silofunkc´ı, jak pro teoreticky odvozen´e vztahy, tak pro simulovan´a data. D˚ uleˇzitou ˇc´ast´ı t´eto kapitoly je tak´e odstavec t´ ykaj´ıc´ı se volby rozsahu v´ ybˇeru pro optimalizaci experimentu. Je zde pops´ano stanoven´ı minim´aln´ıho rozsahu v´ ybˇeru grafick´ ym zp˚ usobem a tak´e v´ ypoˇctem pomoc´ı analyticky odvozen´ ych vztah˚ u. N´asleduj´ıc´ı ˇctvrt´a kapitola pˇrin´aˇs´ı srovn´an´ı jednotliv´ ych vybran´ ych test˚ u na z´akladˇe pr˚ ubˇehu jejich silofunkc´ı. Poukazuje na vhodnost volby test˚ u pro r˚ uzn´e parametry a tak´e varuje pˇred jejich neuv´aˇzen´ ym pouˇz´ıv´an´ım. P´at´a kapitola popisuje vyuˇzit´ı jednotliv´ ych vybran´ ych test˚ u pro zpracov´an´ı senzorick´ ych dat a d´ale nastiˇ nuje vyhodnocov´an´ı dat z´ıskan´ ych dalˇs´ımi senzorick´ ymi zkouˇskami. V r´amci t´eto diplomov´e pr´ace byla autorem v prostˇred´ı Delphi naprogramov´ana uˇzivatelsk´a aplikace SMSA (verze 1.09) slouˇz´ıc´ı k pˇr´ım´emu vyhodnocov´an´ı senzorick´ ych experiment˚ u zaloˇzen´em na pˇredem teoreticky popsan´ ych zp˚ usobech. Tento software a moˇznosti jeho praktick´eho pouˇzit´ı vˇcetnˇe ilustruj´ıc´ıch obr´azk˚ u je pops´an v kapitole ˇsest. Z´avˇereˇcn´a sedm´a kapitola pˇrin´aˇs´ı uk´azku senzorick´eho experimentu. Tento aplikaˇcn´ı pˇr´ıklad je vyˇreˇsen pomoc´ı programu SMSA.
3
4
1
Z´ akladn´ı pojmy
1.1
Z´ akladn´ı statistick´ e pojmy
Definice 1. Necht’ Ω 6= ∅ je prostor element´arn´ıch jev˚ u, A syst´em jev˚ u definovan´ ych na Ω. Pˇredpokl´adejme, ˇze plat´ı 1. A 6= ∅ , 2. A ∈ A ⇒ A¯ ∈ A , 3. Ai ∈ A, i = 1, 2, . . . ⇒
T∞
i=1
Ai ∈ A .
Pak syst´em A naz´ yv´ame jevovou σ-algebrou. Dvojici (Ω, A) naz´ yv´ame jevov´e pole. Definice 2. Necht’ (Ω, A) je jevov´e pole, n je poˇcet opakov´an´ı pokus˚ u, A je n´ahodn´ y jev a mn (A) je ˇcetnost nastoupen´ı jevu A v n pokusech. Pak fn (A) = mnn(A) je relativn´ı ˇcetnost A. Definice 3. Necht’ (Ω, A) je jevov´e pole. Necht’ P je mnoˇzinov´a funkce definovan´a na A s oborem hodnot R = (−∞, ∞) a s vlastnostmi: 1. P (A) ≥ 0, A ∈ A . S P∞ 2. Necht’ Ai ∈ A, Ai ∩ Aj = ∅, i 6= j, i, j = 1, 2, · · · ⇒ P ( ∞ i=1 Ai ) = i=1 P (Ai ) .
3. P (Ω) = 1 .
Pak mnoˇzinovou funkci P : A → R naz´ yv´ame pravdˇepodobnost´ı na (Ω, A). Pro n´ahodn´ y jev A ∈ A pak ˇc´ıslo P (A) naz´ yv´ame pravdˇepodobnost´ı jevu A. Trojici (Ω, A, P ) naz´ yv´ame pravdˇepodobnostn´ı prostor. Definice 4. Necht’ (Ω, A, P ) je pravdˇepodobnostn´ı prostor. Pak zobrazen´ı X : Ω → R nazveme n´ ahodnou veliˇcinou (vzhledem k jevov´emu poli (Ω, A)), kdyˇz pro kaˇzd´e x ∈ R plat´ı: {ω : X(ω) ≤ x} ∈ A. Definice 5. Necht’ (Ω, A, P ) je pravdˇepodobnostn´ı prostor a X : Ω → R n´ahodn´a veliˇcina vzhledem k A. Pak funkci F (x) = P ({ω : X(ω) ≤ x}) , x ∈ R, naz´ yv´ame distribuˇcn´ı funkc´ı n´ahodn´e veliˇciny X. Oznaˇcen´ı: F (x) = P ({ω : X(ω) ≤ x}) = P ([X ≤ x]) = P (X ≤ x) . Definice 6. Necht’ X je n´ahodn´a veliˇcina na (Ω, A, P ), B je Borelovsk´a σ-algebra. Pak mnoˇzinovou funkci PX : B → R definovanou vztahem PX (B) = P (X ∈ B), B ∈ B, naz´ yv´ame rozdˇelen´ım pravdˇepodobnost´ı n´ahodn´e veliˇciny X. Definice 7. Necht’ F (x) je distribuˇcn´ı funkce n´ahodn´e veliˇciny X. Pak funkci F −1 (u) = inf x {x : F (x) ≥ u}, u ∈ (0, 1), naz´ yv´ame kvantilovou funkc´ı n´ahodn´e veliˇciny X nebo t´eˇz kvantilovou funkc´ı pˇr´ısluˇsnou k distribuˇcn´ı funkci F (x). Pro dan´e ˇc´ıslo γ ∈ (0, 1) naz´ yv´ame ˇc´ısla xγ = F −1 (γ) γ-kvantilem distribuˇcn´ı funkce F (γ-kvantilem rozdˇelen´ı pravdˇepodobnosti n´ahodn´e veliˇciny X) . 5
Definice 8. Necht’ X je n´ahodn´a veliˇcina definovan´a na pravdˇepodobnostn´ Pım prostoru (Ω, A, P ) a M nejv´ yˇse spoˇcetn´a mnoˇzina re´aln´ ych ˇc´ısel takov´a, ˇze plat´ı x∈M P (X = x) = 1 . Pak ˇrekneme, ˇze n´ahodn´a veliˇcina X je diskr´etn´ıho typu (m´a diskr´etn´ı rozdˇelen´ı pravdˇepodobnosti), M se naz´ yv´a obor hodnot X a funkce p (x) definovan´a vztahy p (x) = P (X = x) , x ∈ M p (x) = 0 ,x∈ /M
se naz´ yv´a pravdˇepodobnostn´ı funkc´ı n´ahodn´e veliˇciny X . Oznaˇcen´ı X ∼ (M, p) znamen´a, ˇze n´ahodn´a veliˇcina X m´a diskr´etn´ı rozdˇelen´ı pravdˇepodobnosti s oborem hodnot M a pravdˇepodobnostn´ı funkc´ı p . Pozn´ amka. Pro diskr´etn´ı rozdˇelen´ı s pravdˇepodobnostn´ı funkc´ı p (x) na M staˇc´ı distribuˇcn´ı funkci zadat v bodech z M . T´eto skuteˇcnosti budeme d´ale vyuˇz´ıvat. ˇ Definice 9. Rekneme, ˇze n´ahodn´a veliˇcina X m´a rozdˇ R ∞ elen´ı pravdˇepodobnosti spojit´eho typu, kdyˇz existuje nez´aporn´a funkce f (x), x ∈ R, −∞ f (x)dx = 1, a distribuˇcn´ı funkci F (x) n´ahodn´e veliˇciny X lze pomoc´ı f (x) zapsat ve tvaru Z x F (x) = f (t)dt −∞
Funkci f pak naz´ yv´ame hustotou n´ahodn´e veliˇciny X .
1.2
Vybran´ a rozdˇ elen´ı
1.2.1
Binomick´ e rozdˇ elen´ı
Uvaˇzujme n´ahodnou veliˇcinu X, kter´a m´a binomick´e rozdˇelen´ı Bi(n, π) s parametry n ∈ N , π ∈ (0, 1). Ozn. X ∼ Bi(n, π). Pak jej´ı pravdˇepodobnostn´ı funkce je µ ¶ n t (1.1) π (1 − π)n−t , x = 0, 1, ..., n. p(x) = P (X = x) = t Stˇredn´ı hodnota je tvaru EX = nπ a rozptyl DX = nπ(1 − π). Je-li n = 1, jedn´a se o tzv. alternativn´ı rozdˇelen´ı A(π).
1.2.2
Beta rozdˇ elen´ı
N´ahodn´a veliˇcina X m´a beta rozdˇelen´ı Be(p, q) s parametry p, q > 0, je-li hustota pravdˇepodobnosti tvaru ( 1 xp−1 (1 − x)q−1 pro x ∈ (0, 1), B(p,q) f (x) = (1.2) 0 pro x ∈ / (0, 1), R1 kde B(p, q) = 0 xp−1 (1 − x)q−1 dx je tzv. beta funkce. Ozn. X ∼ Be(p, q). Distribuˇcn´ı funkce ( R x p−1 1 t (1 − t)q−1 dt pro x > 0, B(p,q) 0 F (x) = (1.3) 0 pro x ≤ 0, rozdˇelen´ı beta je tzv. ne´ upln´ a beta funkce.
6
1.2.3
Rozdˇ elen´ı Fisherovo-Snedecorovo F
N´ahodn´a veliˇcina X m´a rozdˇelen´ı F o stupn´ıch volnosti ν1 , ν2 ≥ 0, je-li hustota pravdˇepodobnosti ³ ´ ν21 ν ³ ´− ν1 +ν 2 2 1 −1 ν1 ν1 1 2 x pro x > 0, 1 + ν2 x fν1 , ν2 (x) = B ( ν21 , ν22 ) ν2 (1.4) 0 pro x ≤ 0.
Ozn. X ∼ F (ν1 , ν2 ). Distribuˇcn´ı funkce F rozdˇelen´ı se znaˇc´ı jako Fν1 , ν2 (x) a α-kvantil jako Fα (ν1 , ν2 ).
1.3
Souvislost mezi rozdˇ elen´ım F a binomick´ ym rozdˇ elen´ım
Vˇ eta 1.3.1. Distribuˇcn´ı funkci F (x) binomick´eho rozdˇelen´ı lze vyj´adˇrit pomoc´ı ne´ upln´e beta funkce, tedy Z 1−π x µ ¶ X 1 n t n−t = z n−x−1 (1 − z)x dz . (1.5) F (x) = π (1 − π) B(n − x, x + 1) t 0 t=0 D˚ ukaz. Vˇeta se dok´aˇze postupnou integrac´ı per partes (viz [9]).
Vˇ eta 1.3.2. Distribuˇcn´ı funkci F (x) binomick´eho rozdˇelen´ı Bi(n, π) lze vyj´adˇrit pomoc´ı distribuˇcn´ı funkce Fν1 , ν2 (x) rozdˇelen´ı F o ν1 , ν2 stupn´ıch volnosti ve tvaru ¶ µ x µ ¶ X x+1 1−π n t n−t , · F (x) = = Fν1 , ν2 π (1 − π) n−x π t t=0
(1.6)
kde ν1 = 2(n − x), ν2 = 2(x + 1). D˚ ukaz. Vyjdeme ze vztahu (1.5) a v uveden´em integr´alu provedeme substituci z=
y x+1 , kde a = . a+y n−x
Pak dz =
a dy . (a + y)2
D´ale urˇc´ıme meze integr´alu. Pro z =1−π 7
(1.7)
dostaneme y =a· a pro
z 1−π =a· 1−z π z=0
dostaneme y = a · 0 = 0. Po t´eto substituci z (1.5) po u ´pravˇe dostaneme x µ ¶ X n t=0
t
π t (1 − π)n−t =
1 = B(n − x, x + 1)
Z
1 = B(n − x, x + 1)
Z
1 = B(n − x, x + 1)
a· 1−π π
0
Z
a· 1−π π
0 a· 1−π π
0 a· 1−π π
¶x a y dy 1− a+y (a + y)2 µ ¶x a a n−x−1 x+1−n y (a + y) dy a+y (a + y)2 µ
y a+y
¶n−x−1 µ
y n−x−1 ·
ax a dy (a + y)n (a + y)
an ax a · dy (a + y)n (a + y) an 0 ¶n+1 µ Z a· 1−π π 1 a n−x−1 y ax−n dy = B(n − x, x + 1) 0 a+y µ ¶n−x Z a· 1−π ³ π 1 1 y ´−n−1 n−x−1 y dy = 1+ B(n − x, x + 1) a a 0 1 = B(n − x, x + 1)
Z
y n−x−1 ·
Poloˇz´ıme ν1 = 2(n − x), ν2 = 2(x + 1). Odtud po dosazen´ı ze vztahu (1.7) za a = dost´av´ame 1 F (x) = ν1 ν2 B( 2 , 2 )
µ
ν1 ν2
¶ ν21 Z
ν2 1−π · π ν1
y
ν1 −1 2
0
Coˇz je distribuˇcn´ı funkce Fν1 ,ν2 rozdˇelen´ı F v bodˇe F (x) = Fν1 ,ν2
µ
µ
x+1 n−x
ν1 1+ y ν2 ·
1−π π
x+1 1−π · n−x π
8
¶
.
¶− ν1 +ν 2 2
. Tedy
dy .
x+1 n−x
=
ν2 ν1
(1.8)
1.4
Aproximace binomick´ eho rozdˇ elen´ı norm´ aln´ım rozdˇ elen´ım
Vˇ eta 1.4.1 (Moivreova-Laplaceova). Necht’ Xn ∼ Bi(n, π). Pak X − nπ X − EX =p U= √ DX nπ(1 − π)
m´ a asymptoticky norm´aln´ı rozdˇelen´ı N (0, 1), a tedy
lim P (U < u) = Φ(u) , −∞ < u < ∞ ,
n→∞
kde Φ(u) je distribuˇcn´ı funkce normovan´eho norm´aln´ıho rozdˇelen´ı N(0,1). Pn D˚ ukaz. Bud’ Xn = aln´ı limitn´ı vˇety plyne, ˇze Xn i=1 Ii , kde Ii ∼ A(θ). Pak z centr´ konverguje v distribuci k N (0, 1). Z vˇety 1.4.1 plyne, ˇze pˇri dostateˇcnˇe velk´em rozsahu v´ ybˇeru n lze distribuˇcn´ı funkci binomick´eho rozdˇelen´ı aproximovat distribuˇcn´ı funkc´ı norm´aln´ıho rozdˇelen´ı.
1.5
Transformace stabilizuj´ıc´ı rozptyl
Necht’ X je n´ahodn´a veliˇcina s rozdˇelen´ım z´avisej´ıc´ım na parametru θ. Pˇredpokl´adejme, ˇze plat´ı EX = θ. Na parametru θ z´avis´ı tak´e rozptyl veliˇciny X, tedy DX = σ 2 (θ). Stabilizac´ı rozptylu rozum´ıme nalezen´ı vhodn´e netrivi´aln´ı transformaˇcn´ı funkce g takov´e, aby n´ahodn´a veliˇcina Y = g(X) mˇela rozptyl nez´avisej´ıc´ı na θ. Funkce g se z´ısk´a pomoc´ı aproximace z Taylorova vzorce g(X) ≈ g(θ) + (X − θ)g ′ (θ) , tedy Eg(X) ≈ g(θ) Dg(X) ≈ [g ′ (θ)]2 σ 2 (θ) ,
(1.9)
Poˇzadavek na nez´avislost rozptylu g(X) na parametru θ lze vyj´adˇrit jako g ′ (θ)σ(θ) = c , kde c je vhodnˇe zvolen´a konstanta. Odtud dost´av´ame ˇreˇsen´ı Z dθ . g(θ) = c σ(θ)
(1.10)
Z´ıskan´a transformaˇcn´ı funkce g(θ) v´ yraznˇe stabilizuje rozptyl, tedy Dg (X) z´avis´ı na θ jen velmi m´alo. Nav´ıc rozdˇelen´ı n´ahodn´e veliˇciny Y b´ yv´a jiˇz velmi bl´ızk´e norm´aln´ımu, aˇckoli samotn´e rozdˇelen´ı veliˇciny X m˚ uˇze b´ yt v´ yraznˇe nenorm´aln´ı.
9
1.5.1
Arcussinov´ a transformace v binomick´ em rozdˇ elen´ı
Necht’ X je n´ahodn´a veliˇcina s binomick´ ym rozdˇelen´ım Bi(n, π). Relativn´ı ˇcetnost u ´spˇech˚ u v n nez´avisl´ ych pokusech je X Z= n o stˇredn´ı hodnotˇe EZ = π a rozptylu π(1 − π) X 1 = 2 DX = n n n (plyne z odstavce 1.2.1). Dle (1.10) je Z Z √ dπ dπ =c n p . g(π) = c σ(π) π(1 − π) DZ = D
√ −1 Zvol´ıme-li konstantu c = (2 n ) , dostaneme arcussinovou transformaci r X , Y = g(Z) = arcsin(Z) = arcsin n
(1.11)
pˇriˇcemˇz dle (1.9) m´a transformovan´a veliˇcina Y stˇredn´ı hodnotu √ EY = Eg(Z) ≈ g(π) = arcsin π a rozptyl ′
2
2
DY = Dg(X) ≈ (g (π)) σ (π) =
µ
1 1 1 √ · ·√ π 1−π 2
¶2
π(1 − π) 1 = . n 4n
Jak bylo uvedeno v´ yˇse, veliˇcina Y m´a rozdˇelen´ı bl´ızk´e norm´aln´ımu. Standardizac´ı se odvod´ı asymptoticky norm´aln´ı n´ahodn´a veliˇcina à ! r √ √ Y − EY X = 2 n arcsin − arcsin π0 . U1 = √ (1.12) n DY V [6] je uvedeno, ˇze arcussinov´a transformace s s 3 Z + 8n X + 38 Y = g(Z) = arcsin = arcsin 3 1 + 4n n + 34 o stˇredn´ı hodnotˇe EY ≈ arcsin a rozptylu DY ≈
s
3 π + 8n 3 1 + 4n
1 4n + 2
10
(1.13)
je stabilnˇejˇs´ı. V´ yhodou t´eto transformace oproti (1.11) je menˇs´ı rozptyl. Z (1.13) lze opˇet z´ıskat asymptoticky norm´aln´ı statistiku à ! r r √ 8X + 3 8nπ0 + 3 U2 = 4n + 2 arcsin . (1.14) − arcsin 8n + 6 8n + 6
1.6
Testov´ an´ı hypot´ ez
Necht’ n´ahodn´ y v´ ybˇer X = (X1 , . . . , Xn ) m´a rozdˇelen´ı o distribuˇcn´ı funkci F (x, θ), kde parametr θ je z parametrick´eho prostoru Θ, a necht’ X je obor hodnot n´ahodn´eho v´ ybˇeru X. Definujme nulovou hypot´ezu H0 : θ ∈ Θ1 ⊂ Θ a alternativn´ı hypot´ezu H1 : θ ∈ Θ¯1 = Θ − Θ1 . Je-li mnoˇzina Θ1 jednobodov´a, pak H0 se naz´ yv´a jednoduch´a nulov´a hypot´eza. Je-li Θ−Θ1 jednobodov´a mnoˇzina, pak se H1 naz´ yv´a jednoduchou alternativn´ı hypot´ezou. Na z´akladˇe n´ahodn´eho v´ ybˇeru X z rozdˇelen´ı o distribuˇcn´ı funkci F (x, θ) je potˇreba rozhodnout o platnosti H0 nebo H1 . Statistick´y test je pravidlo, kter´e kaˇzd´e hodnotˇe n´ahodn´eho v´ ybˇeru pˇriˇrad´ı jedno ze dvou moˇzn´ ych rozhodnut´ı: hypot´eza H0 se zam´ıt´a, nebo se H0 nezam´ıt´a. Pokud se zam´ıtne hypot´eza H0 , pˇrestoˇze je spr´avn´a, dojde k chybˇe I. druhu. Jestliˇze se naopak hypot´eza H0 nezam´ıtne, aˇckoli neplat´ı, dojde k chybˇe II. druhu. Test se konstruuje tak, aby pravdˇepodobnost chyby I. druhu byla nejv´ yˇse rovna α. Za t´eto podm´ınky se pak minimalizuje pravdˇepodobnost chyby II. druhu β. Test se prov´ad´ı pomoc´ı tzv. kritick´eho oboru. Kritick´ y obor Wα ⊂ X se zav´ad´ı pomoc´ı testovac´ı statistiky ym kritick´ ym oborem vedouc´ım na T a pomoc´ı kritick´e hodnoty kα ∈ R. Pravostrann´ jednostrann´ y test se rozum´ı Wα = {x ∈ X : T = T (x) > kα } , levostrann´ y kritick´ y obor m´a tvar Wα = {x ∈ X : T = T (x) < kα } , na oboustrann´ y test pak vede oboustrann´ y kritick´ y obor Wα = {x ∈ X : T < kα′ , nebo T > kα′′ }, Wα = {x ∈ X : |T | > kα′′′ } , kde kα′ , kα′′ , kα′′′ jsou kritick´e hodnoty. Plat´ı-li x ∈ Wα , pak se hypot´eza H0 zam´ıt´a, pokud ale x ∈ / Wα , hypot´eza H0 se nezam´ıt´a. Horn´ı hranice pro pravdˇepodobnost chyby I. druhu α = sup P (x ∈ Wα ) θ
11
ˇ ıslo se naz´ yv´a hladina v´yznamnosti testu. C´ βα = 1 − β se naz´ yv´a s´ıla testu. S´ılou testu v bodˇe θ se rozum´ı silofunkce testu βα (θ), coˇz je pravdˇepodobnost, ˇze hypot´eza H0 se zam´ıt´a, kdyˇz hodnota parametru je θ. Aby byla splnˇena podm´ınka, ˇze pravdˇepodobnost chyby I. druhu nem´a b´ yt vˇetˇs´ı neˇz hladina v´ yznamnosti α, mus´ı platit βα (θ) ≤ α pro θ ∈ Θ1 . Problematika testov´an´ı hypot´ez je podrobnˇeji pops´ana v [12].
1.7
Intervalov´ e odhady
Definice 10. Necht’ X = (X1 , · · · , Xn ) je n´ahodn´ y v´ ybˇer z rozdˇelen´ı o distribuˇcn´ı funkci ’ F (x, θ), τ (θ) je dan´a parametrick´a funkce. Necht TD = TD (X) a TH = TH (X) jsou yv´ame 100(1 − α)% oboustrann´ym intervalem spolehlivosti statistiky. Pak hTD , TH i naz´ pro τ (θ), kdyˇz P (TD < τ (θ) < TH ) ≥ 1 − α . D´ale interval h−∞, TH i naz´ yv´ame 100(1 − α)% pravostrann´y interval spolehlivosti pro τ (θ), kdyˇz P (τ (θ) < TH ) ≥ 1 − α . Koneˇcnˇe interval hTD , ∞i naz´ yv´ame 100(1 − α)% levostrann´y interval spolehlivosti pro τ (θ), kdyˇz P (TD < τ (θ)) ≥ 1 − α . Je-li h−∞, TH i, resp. hTD , ∞i pravostrann´ y, resp. levostrann´ y interval spolehlivosti pro yv´ame horn´ı, resp. doln´ı odhad τ (θ) s rizikem α. τ (θ), pak TH , resp. TD naz´
12
2
Senzorick´ a anal´ yza
Senzorick´a anal´ yza je jedn´ım z prostˇredk˚ u hodnocen´ı jakosti potravin. Patˇr´ı mezi tzv. psychometrick´e metody, jej´ı pomoc´ı se tedy nezjiˇst’uje sloˇzen´ı potravin, ale posuzuje se existence ˇci intenzita urˇcit´eho vjemu. Urˇcuj´ı se organoleptick´e vlastnosti, tedy vlastnosti vn´ımateln´e lidsk´ ymi smysly (chut’, v˚ unˇe apod.). Mezi metody senzorick´e anal´ yzy patˇr´ı: rozliˇsovac´ı metody, poˇradov´e metody a hodnocen´ı s pouˇzit´ım stupnic. Pˇri prov´adˇen´ı anal´ yzy se obvykle vyuˇz´ıv´a jejich kombinace. Senzorick´a anal´ yza je podrobnˇeji pops´ana vˇcetnˇe test˚ u v [11].
2.1
Rozliˇ sovac´ı metody
Pomoc´ı rozliˇsovac´ıch metod se stanovuje, zda mezi dvˇema hodnocen´ ymi v´ yrobky existuje rozd´ıl ve sledovan´em senzorick´em znaku. Po posuzovatel´ıch se vyˇzaduje tzv. vynucen´a odpovˇed’, hodnotitel tedy mus´ı vybrat jednu z nab´ıdnut´ ych formulac´ı. Podle zp˚ usobu prov´adˇen´ı posuzov´an´ı se rozliˇsuj´ı tyto metody: p´arov´a porovn´avac´ı zkouˇska, zkouˇska duotrio, troj´ uheln´ıkov´a zkouˇska.
2.1.1
P´ arov´ a porovn´ avac´ı zkouˇ ska
Posuzovatel´e obdrˇz´ı dva za stejn´ ych podm´ınek pˇripraven´e vzorky A a B zkouman´ ych v´ yrobk˚ u. Jejich u ´kolem je odpovˇedˇet, kter´ y vzorek je intenzivnˇejˇs´ı pˇri zkouˇsce rozd´ılu v intenzitˇe ˇci kter´emu ze vzork˚ u d´avaj´ı pˇrednost u preferenˇcn´ıch zkouˇsek. Pro vyhodnocen´ı p´arov´e porovn´avac´ı zkouˇsky se pouˇz´ıvaj´ı testy o parametru binomick´eho rozdˇelen´ı. Zkoum´a-li se rozd´ılnost v´ yrobk˚ u jako takov´ ych, pouˇzije se pro vyhodnocen´ı obostrann´ ych test˚ u. Je-li ˇz´adouc´ı zjistit smˇer t´eto rozd´ılnosti, vyuˇzij´ı se testy jednostrann´e.
2.1.2
Zkouˇ ska duo-trio
Pˇri zkouˇsce duo-trio jsou posuzovatel˚ um pˇredloˇzeny celkem tˇri vzorky. Prvn´ı se naz´ yv´a tzv. referenˇcn´ı, pod´av´a se jako standard. Dalˇs´ı dva jsou tzv. experiment´aln´ı a jsou pˇredloˇzeny anonymnˇe. Jeden z tˇechto dvou vzork˚ u poch´az´ı ze stejn´eho v´ yrobku jako standard. Hodnotitel m´a pak za u ´kol rozhodnout, kter´ y vzorek ze dvou experiment´aln´ıch je ve sledovan´em znaku shodn´ y se standardem a kter´ y je odliˇsn´ y.
2.1.3
Troj´ uheln´ıkov´ a zkouˇ ska
Hodnotitel pˇri troj´ uheln´ıkov´e zkouˇsce obdrˇz´ı ˇradu tˇr´ı n´ahodnˇe uspoˇr´adan´ ych, avˇsak za stejn´ ych podm´ınek pˇripraven´ ych vzork˚ u, z nichˇz dva poch´azej´ı ze stejn´eho v´ yrobku a tˇret´ı ´ je odliˇsn´ y. Ukolem posuzovatele je oznaˇcit vzorek, kter´ y se od ostatn´ıch dvou liˇs´ı.
13
2.2
Poˇ radov´ e metody
C´ılem poˇradov´e zkouˇsky je roztˇr´ıdˇen´ı skupiny v´ yrobk˚ u, jejich seˇrazen´ı podle intenzity senzorick´eho znaku, podle preferenc´ı spotˇrebitel˚ u, nebo sledov´an´ı vlivu urˇcit´eho faktoru na organoleptick´e vlastnosti a senzorickou jakost v´ yrobku. Posuzovateli je pˇredloˇzena skupina vzork˚ u v n´ahodn´em poˇrad´ı a jeho u ´kolem je seˇradit vzorky podle dan´eho ukazatele (preference ˇci intenzity znaku). I zde je doporuˇcov´ana nucen´a volba, tzn. na jedno m´ısto v poˇrad´ı by nemˇelo b´ yt pˇriˇrazeno v´ıce vzork˚ u.
2.3
Hodnocen´ı s pouˇ zit´ım ordin´ aln´ıch stupnic
Existuj´ı r˚ uzn´e typy stupnic, v senzorick´e anal´ yze se vˇsak nejˇcastˇeji vyuˇz´ıvaj´ı tzv. ordin´aln´ı stupnice. Mˇeˇrit na ordin´aln´ı stupnici znamen´a pˇriˇradit jednotliv´ ym variant´am odpovˇed´ı ˇc´ısla vyjadˇruj´ıc´ı vˇetˇs´ı nebo menˇs´ı u ´roveˇ n sledovan´eho senzorick´eho znaku. V mnoˇzinˇe uspoˇr´adan´e podle stupnice tohoto typu nelze stanovit, jak´a je tzv. vzd´alenost mezi dvˇema sousedn´ımi objekty. Ordin´aln´ı stupnice lze d´ale dˇelit na stupnice intenzitn´ı, tj. zkoumaj´ıc´ı intenzitu dan´eho znaku, a h´edonick´e, zkoumaj´ıc´ı pˇr´ıjemnost, pˇrijatelnost apod. Stupnici lze konstruovat jako tzv. stupnici prvn´ıho stupnˇe, tj. prvn´ı kategorie je vyhrazena pro nepatrnou intenzitu vlastnosti a posledn´ı kategorie pro nejvˇetˇs´ı intenzitu resp. nejlepˇs´ı jakost, nebo lze smˇer hodnot definovat obr´acenˇe a vytvoˇrit tak tzv. stupnici druh´eho druhu. Pˇr´ıkladem intenzitn´ı ordin´aln´ı stupnice prvn´ıho druhu m˚ uˇze b´ yt posloupnost vyjadˇruj´ıc´ı slanost vzorku: naprosto neslan´ y, velmi m´alo slan´ y, m´alo slan´ y, . . . , nesm´ırnˇe slan´ y. Samotn´a zkouˇska prob´ıh´a tak, ˇze zaˇskolen´ y hodnotitel obdrˇz´ı protokol s uveden´ ymi senzorick´ ymi znaky, kter´e bude u vzork˚ u hodnotit, a stupnice, podle kter´ ych bude vzorek zaˇrazovat. Pot´e pˇredloˇzen´ y vzorek objektivnˇe posoud´ı a v souladu se stupnic´ı zap´ıˇse sv´e hodnocen´ı. Toto provede u kaˇzd´eho vzorku a znaku.
14
3
Testy hypot´ ez o parametru π binomick´ eho rozdˇ elen´ı
D´ale bude pozornost zamˇeˇrena na podrobn´ y rozbor test˚ u hypot´ez o parametru π binomick´eho rozdˇelen´ı, kter´e jsou vhodn´e pro vyhodnocov´an´ı senzorick´ ych dat z´ıskan´ ych rozliˇsovac´ımi zkouˇskami.
3.1
Kritick´ y obor testu o parametru binomick´ eho rozdˇ elen´ı
Necht’P X1 , . . . , Xn je n´ahodn´ y v´ ybˇer z alternativn´ıho rozdˇelen´ı A(π), pak n´ahodn´a veliˇcina n X = i=1 Xi m´a binomick´e rozdˇelen´ı Bi(n, π). Testujme hypot´ezu H0 : π = π0 proti oboustrann´e alternativˇe H1 : π 6= π0 , kde π0 je pevn´a hodnota z intervalu (0, 1). Test zaloˇz´ıme na kritick´em oboru je Wα = {x ∈ {0, 1, · · · , n} : x ≤ c1 , x ≥ c2 }, tj. hled´ame nejvˇetˇs´ı cel´e ˇc´ıslo c1 , pro kter´e pˇri dan´em α plat´ı Pπ0 (X ≤ c1 ) = Pπ0 (X ≤ c1 + 1) =
c1 µ ¶ X n t=0 cX 1 +1 µ t=0
t
π0t (1 − π0 )n−t ≤
α , 2
¶ n t α π0 (1 − π0 )n−t > , 2 t
(3.1)
a nejmenˇs´ı cel´e ˇc´ıslo c2 splˇ nuj´ıc´ı pro dan´e α n µ ¶ X α n t Pπ0 (X ≥ c2 ) = π0 (1 − π0 )n−t ≤ , t 2 t=c2 µ ¶ n X n t α π0 (1 − π0 )n−t > . Pπ0 (X ≥ c2 − 1) = t 2 t=c −1
(3.2)
2
V pˇr´ıpadˇe testov´an´ı hypot´ezy H0 : π = π0 proti pravostrann´e alternativˇe H1 : π > π0 , ym oborem mnoˇzina Wα = {X = kde π0 je pevn´a hodnota z intervalu (0, 1), je kritick´ x; x ≥ c}, pˇriˇcemˇz c splˇ nuje nerovnosti n µ ¶ X n t Pπ0 (X ≥ c) = π0 (1 − π0 )n−t ≤ α , t t=c n µ ¶ X n t Pπ0 (X ≥ c − 1) = π0 (1 − π0 )n−t > α . t t=c−1
15
(3.3)
Testuje-li se hypot´eza H0 : π = π0 proti levostrann´e alternativˇe H1 : π < π0 , kde π0 je pevn´a hodnota z intervalu (0, 1), urˇc´ıme kritick´ y obor jako mnoˇzinu Wα = {X = x; x ≤ ≤ c}, kde c splˇ nuje Pπ0 (X ≤ c) = Pπ0 (X ≤ c + 1) =
c µ ¶ X n
t
t=0
c+1 µ ¶ X n
t
t=0
π0t (1 − π0 )n−t ≤ α , (3.4) π0t (1 − π0 )n−t > α .
ˇ ısla c1 a c2 se spoˇc´ıtaj´ı jako C´ c1 = x α2 − 1 ,
(3.5)
c2 = x1− α2 + 1 ,
(3.6)
kde x α2 , x1− α2 jsou pˇr´ısluˇsn´e kvantily binomick´eho rozdˇelen´ı. Tyto z´avislosti vych´azej´ı ze vztah˚ u (3.1) a (3.2) a definice kvantil˚ u. U jednostrann´ ych test˚ u ˇc´ıslo c spoˇcteme analogicky. V pˇr´ıpadˇe pravostrann´eho testu m´ame c = x1−α + 1 ,
(3.7)
c = xα − 1 .
(3.8)
v pˇr´ıpadˇe levostrann´eho testu pak
V´ ypoˇcet ˇc´ısel c1 a c2 (resp. c) lze tedy prov´est pomoc´ı kvantil˚ u binomick´eho rozdˇelen´ı, lze vˇsak tak´e vyuˇz´ıt souvislosti binomick´eho rozdˇelen´ı s Fisherov´ ym (viz (1.6)) a situaci t´ım zjednoduˇsit. Tento pˇr´ıpad je rozebr´an v odstavci 3.3.
3.2
S´ıla testu o parametru π binomick´ eho rozdˇ elen´ı
Silofunkce testu zaloˇzen´eho na kritick´em oboru popsan´em v odstavci 3.1 m´a dle odstavce 1.6 tvar pro oboustrann´ y test tvar c1 µ ¶ n µ ¶ X X n t n t n−t π (1 − π)n−t , π 6= π0 , βα (π) = + (3.9) π (1 − π) t t t=0 t=c 2
pro pravostrann´ y test βα (π) =
n µ ¶ X n
π t (1 − π)n−t , π > π0 ,
(3.10)
c µ ¶ X n
π t (1 − π)n−t , π < π0 .
(3.11)
t=c
t
pro levostrann´ y test βα (π) =
t=0
t
16
Jsou-li zn´ama ˇc´ısla c1 , c2 (resp. ˇc´ıslo c), kter´a zaruˇcuj´ı dodrˇzen´ı hladiny v´ yznamnosti, lze spoˇc´ıtat hodnotu s´ıly pro libovoln´e π. Pˇ r´ıklad: Mˇejme n´ahodn´y v´ybˇer rozsahu n = 100 z rozdˇelen´ı A(π). Testujme hypot´ezu H0 : π = π0 proti oboustrann´e alternativˇe H1 : π 6= π0 pro π0 = 0, 5 na hladinˇe v´yznamnosti α = 0, 05. Ze vztah˚ u (3.5) a (3.6) se spoˇc´ıt´a, ˇze c1 = 39, c2 = 61, ˇc´ımˇz se zaruˇc´ı splnˇen´ı nerovnic (3.1) a (3.2): α P0,5 (x ≤ 39) = P0,5 (x ≥ 61) = 0, 0176 < 0, 025 = , 2 α P0,5 (x ≤ 40) = P0,5 (x ≥ 60) = 0, 0284 > 0, 025 = . 2 Pn Kritick´ y obor zaloˇzen´ y na statistice X = i=1 Xi (viz odstavec 3.1) je pak tvaru Wα = {x =
n X i=1
xi ; x ≤ 39, x ≥ 61} ,
Hodnoty silofunkce tohoto testu spoˇcten´e dle vzorce (3.9) jsou pro n´azornost uvedeny v tabulce 3.1. Silofunkce je zn´azornˇena na obr´azku 3.1. Analogick´ y postup se provede u jednostrann´ ych test˚ u. V pˇr´ıpadˇe pravostrann´e alternativy je dle (3.7) kritick´ y obor Wα = {x =
n X i=1
xi ; x ≥ 59}
(obr´azek 3.2(a)), u testov´an´ı levostrann´e alternativy pak dle (3.8) Wα = {x =
n X i=1
xi ; x ≤ 41}
(obr´azek 3.2(b)). H : π = π = 0.5, H : π ≠ π , α = 0.05, n = 100 0
0
1
0
1 0.9 0.8 0.7
β( π )
0.6 0.5 0.4 0.3 0.2 0.1 0.0352 0 0.1
0.2
0.3
0.4
0.5 π
0.6
0.7
0.8
0.9
Obr. 3.1: Silofunkce oboustrann´eho testu
17
Tabulka 3.1: Hodnoty silofunkce oboustrann´eho testu H0 : π = π0 = 0, 5, H1 : π 6= π0 na hladinˇe v´ yznamnosti α = 0, 05 π β(π)
0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.000 1.000 0.979 0.4621 0.0352 0.4621 0.979 1.000 1.000 H 0 : π = π 0= 0.5, H 1 : π ≠ π 0, α = 0.05, n = 100 1
0.9
0.9
0.8
0.8
0.7
0.7
0.6
0.6 β( π )
β( π )
H 0 : π = π 0= 0.5, H 1 : π ≠ π 0, α = 0.05, n = 100 1
0.5
0.5
0.4
0.4
0.3
0.3
0.2
0.2
0.1
0.1
0.0443 0 0.1
0.0443 0 0.1
0.2
0.3
0.4
0.5 π
0.6
0.7
0.8
0.9
(a) Pravostrann´ y test
0.2
0.3
0.4
0.5 π
0.6
0.7
0.8
0.9
(b) Levostrann´ y test
Obr. 3.2: Silofunkce jednostrann´ ych test˚ u
3.3
Explicitn´ı vyj´ adˇ ren´ı intervalu spolehlivosti pro parametr π binomick´ eho rozdˇ elen´ı
Test hypot´ezy o parametru π binomick´eho rozdˇelen´ı se d´a prov´est pomoc´ı intervalu spolehlivosti pro π. Oznaˇcme tento test d´ale jako F-test. Vˇ eta 3.3.1. Necht’ n´ahodn´ a veliˇcina X ∼ Bi(n, π). Pak 100(1−α)-procentn´ım intervalem spolehlivosti pro parametr π je interval πD < π < πH , kde πH = πD =
(X + 1)F1−α1 ( 2(X + 1) , 2(n − X)) , n − X + (X + 1)F1−α1 (2(X + 1) , 2(n − X))
(3.12)
X , (n − X + 1)F1−α2 ( 2(n − X + 1), 2X) + X
(3.13)
pˇriˇcemˇz F1−α1 (ν 1 , ν 2 ) je (1 − α1 )-kvantil F-rozdˇelen´ı o ν 1 = 2(X + 1), ν 2 = 2(n − X) stupn´ıch vonosti a F1−α2 (ν 3 , ν 4 ) je (1 − α2 )-kvantil F-rozdˇelen´ı o ν 3 = 2(n − X + 1), ν 4 = 2X stupn´ıch volnosti.
18
D˚ ukaz. Krajn´ı meze πD a πH intervalu se naleznou ˇreˇsen´ım rovnic x µ ¶ X n t πH (1 − πH )n−t = α1 t t=0 a
n µ ¶ X n t=x
t
t πD (1 − πD )n−t = α2 , kde α1 + α2 = α .
(3.14)
(3.15)
Z d˚ ukazu vˇety 1.3.2 je zn´amo, ˇze ¶ µ x µ ¶ X n t x + 1 1 − πH n−t · , kde Y ∼ F ( 2(n−x), 2(x+1)) . πH (1−πH ) =P Y < α1 = n − x π t H t=0 Za vyuˇzit´ı kvantil˚ u F-rozdˇelen´ı lze tedy po n´asleduj´ıc´ıch u ´prav´ach vyj´adˇrit horn´ı krajn´ı bod intervalu spolehlivosti ve tvaru (3.12). x + 1 1 − πH 1 · = Fα1 (2(n − x), 2(x + 1)) = n−x πH F1−α1 (2(x + 1) , 2(n − x)) 1 x + 1 − xπH − πH = (n − x)πH F1−α1 (2(x + 1) , 2(n − x)) πH x + 1 − (x + 1)πH = n−x F1−α1 (2(x + 1) , 2(n − x)) F1−α1 (2(x + 1) , 2(n − x)) · (x + 1) − F1−α1 (2(x + 1) , 2(n − x)) · (x + 1)πH = πH (n − x) F1−α1 (2(x + 1) , 2(n − x)) · (x + 1) = πH (n − x + F1−α1 (2(x + 1) , 2(n − x)) · (x + 1)) (x + 1)F1−α1 (2(x + 1) , 2(n − x)) πH = n − x + (x + 1)F1−α1 (2(x + 1) , 2(n − x)) Doln´ı krajn´ı bod nalezneme obdobnˇe. Nejdˇr´ıve se rovnice (3.15) pˇrevede na tvar x−1 µ ¶ X n t πD (1 − πD )n−t = 1 − α2 . t t=0
D´ale se vyuˇzije vztah (1.4) pro distribuˇcn´ı funkci rozdˇelen´ı F v µ ¶ X n t πD (1 − πD )n−t = t t=0 ¶−n−1 µ µ ¶n−v Z v+1 · 1−πD n−v πD 1 n−v n−v n−v−1 y 1+ = y dy B(n − v, v + 1) v + 1 v+1 0 Dosazen´ım substituce v = x − 1 se dostane x−1 µ ¶ X n t πD (1 − πD )n−t = t t=0 ¶−n−1 µ ¶n−x+1 Z x · 1−πD µ n−x+1 πD 1 n−x+1 n−x+1 n−x y dy. y = 1+ B(n − x + 1, x) x x 0 19
Porovn´an´ım se vztahem (1.4) pro hustotu F rozdˇelen´ı se z´ısk´a vyj´adˇren´ı ¶ µ x−1 µ ¶ X 1 − πD n t x n−t · , πD (1 − πD ) 1 − α2 = =P Y < n − x + 1 π t D t=0 kde Y ∼ F 2(n−x+1),2x . Tedy x 1 − πD = F1−α2 (2(n − x + 1), 2x) · n−x+1 πD (n − x + 1) · πD · F1−α2 (2(n − x + 1), 2x) = x − xπD , odkud po u ´pravˇe se dostane tvar (3.15) doln´ıho krajn´ıho bodu intervalu spolehlivosti binomick´eho rozdˇelen´ı x . πD = (n − x + 1)F1−α2 (2(n − x + 1), 2x) + x Platnost hypot´ezy H0 : π = π0 se proti oboustrann´e alternativˇe ˇci jednostrann´ ym alternativ´am testuje na z´akladˇe pˇr´ısluˇsnosti parametru π0 k uveden´emu intervalu spolehlivosti hπD , πH i dle odstavce 1.7. Je moˇzn´e tak´e pouˇz´ıt upravenou verzi tohoto testu, kdy se v pˇr´ıpadˇe oboustrann´e alternativy H1 : π 6= π0 testuje, zda 1 − π0 X · ≥ F1− α2 (2(n − X + 1), 2X) n−X +1 π0
(3.16)
nebo
X + 1 1 − π0 · ≤ F α2 (2(n − X), 2(X + 1)) . n−X π0 U pravostrann´e alternativy H1 : π > π0 se pak zjiˇst’uje, zda 1 − π0 X ≥ F1−α (2(n − X + 1), 2X) , · n−X +1 π0
(3.17)
(3.18)
a u levostrann´e alternativy H1 : π < π0 se hodnot´ı nerovnost X + 1 1 − π0 · ≤ Fα (2(n − X), 2(X + 1)) . n−X π0
3.4
(3.19)
S´ıla testu vyuˇ z´ıvaj´ıc´ıho Fisherovy kvantily
N´asleduj´ıc´ı v´ ysledky byly z´ısk´any pomoc´ı opakovan´ ych test˚ u na simulovan´ ych v´ ybˇerech pˇr´ımo generovan´ ych z binomick´eho rozdˇelen´ı, pˇriˇcemˇz hodnoty silofunkc´ı byly urˇceny jako pod´ıl zam´ıtnut´ ych hypot´ez H0 ku celkov´emu poˇctu opakov´an´ı pˇri dan´e hodnotˇe π a ych π0 . Pˇr´ısluˇsn´e funkce pro simulace i pro vykreslov´an´ı silofunkc´ı dle teoreticky odvozen´ 20
H 0 : π = π 0 = 0.5, H 1 : π ≠ π 0, α = 0.05 1 0.9 0.8 0.7
β( δ )
0.6 0.5 0.4 n = 10 n = 15 n = 20 n = 25 n = 30 n = 50 n = 100
0.3 0.2 0.1 0 −0.4
−0.3
−0.2
−0.1
0 0.1 δ=π−π0
0.2
0.3
0.4
0.5
Obr. 3.3: Silofunkce oboustrann´eho F -testu pro r˚ uzn´a n Tabulka 3.2: Hodnoty silofunkc´ı oboustrann´eho F -testu pro r˚ uzn´a n, H0 : π = π0 = 0, 5, yznamnosti α = 0, 05 H1 : π 6= π0 na hladinˇe v´
β(π)
π n = 10 n = 15 n = 20 n = 25 n = 30 n = 50 n = 100
0.1 0.732 0.960 0.987 0.996 1.000 1.000 1.000
0.2 0.376 0.669 0.801 0.881 0.926 0.991 1.000
0.3 0.153 0.296 0.415 0.515 0.595 0.785 0.985
0.4 0.049 0.091 0.098 0.147 0.176 0.248 0.429
0.5 0.029 0.036 0.044 0.044 0.034 0.035 0.035
0.6 0.036 0.097 0.117 0.166 0.177 0.252 0.476
0.7 0.141 0.281 0.412 0.511 0.595 0.766 0.976
0.8 0.383 0.651 0.798 0.889 0.926 0.996 1.000
0.9 0.748 0.922 0.988 0.999 1.000 1.000 1.000
vzorc˚ u naprogramovan´e v prostˇred´ı MATLAB jsou uvedeny v pˇr´ıloze P2 (toto bude platit i d´ale). Nejprve se zab´ yvejme srovn´an´ım silofunkc´ı testu pro r˚ uzn´e rozsahy v´ ybˇer˚ u n. Testujme yznamnosti hypot´ezu H0 : π = π0 = 0, 5 proti alternativˇe H1 : π 6= π0 na hladinˇe v´ α = 0, 05. Volme rozsah v´ ybˇeru n = 10, 15, 20, 25, 30, 50 a 100. Z obr´azku 3.3, kde jsou silofunkce z´ıskan´e simulacemi vyznaˇceny teˇckovanˇe a teoretick´e silofunkce spoˇc´ıtan´e dle kapitoly 3.2 zakreslen´e plnou ˇcarou, je patrn´a dobr´a shoda obou tˇechto typ˚ u silofunkc´ı. D´ale je zˇrejm´e i z tabulky 3.2, ˇze nejvˇetˇs´ıch hodnot silofunkce β(π) dosahuje test pˇri volbˇe rozsahu n = 100, kdy β(π) nab´ yv´a hodnot bl´ızk´ ych 1 jiˇz pˇri π = 0, 3 a π = 0, 7, u rozsahu n = 50 toto nast´av´a aˇz u π = 0, 2 a π = 0, 8. Je zde patrn´a obecn´a vlastnost silofunkc´ı, a to, ˇze s rostouc´ım n roste i s´ıla testu. Tak´e se uk´azalo, 21
H : π = π , H : π ≠ π , α = 0.05, n = 100 0
0
1
0
1 0.9 0.8 0.7
β( δ )
0.6 0.5 0.4 π = 0.1 0
0.3
π = 0.2 0
π = 0.3
0.2
0
π = 0.4 0
0.1
π = 0.5 0
0
0
0.05
0.1
0.15 δ=π−π
0.2
0.25
0.3
0
Obr. 3.4: Silofunkce oboustrann´eho F -testu pro r˚ uzn´a π0 ˇze test je pro vˇsechna n podhodnocen´ y, tj. hodnota β(π0 ) nedosahuje stanoven´e hladiny v´ yznamnosti α = 0, 05. Tento fakt je zp˚ usoben t´ım, ˇze jsou v´ ybˇery z diskr´etn´ıho rozdˇelen´ı, distribuˇcn´ı funkce nen´ı spojit´a. Nejv´ıce se hodnota silofunkce bl´ıˇz´ı k hladinˇe v´ yznamnosti α = 0, 05 pro rozsah n = 20 a n = 25, kdy β(0, 5) = 0, 044, nejm´enˇe pak pro n = 10, kdy β(0, 5) = 0, 029. Nyn´ı pro stejn´ y test zad´ame pevn´ y rozsah n = 100 a pro hypot´ezu H0 : π = π0 proti alternativˇe H1 : π 6= π0 vol´ıme parametr π0 = 0, 1; 0, 2; 0, 3; 0, 4 a 0, 5. Z obr´azku 3.4 je patrn´e, ˇze s´ıla testu z´avis´ı rovnˇeˇz na volbˇe parametru π0 . Uk´azalo se, ˇze nejsilnˇejˇs´ı je test pro π0 = 0, 1 a ˇze s rostouc´ım parametrem π0 jeho s´ıla kles´a. Rozd´ıl je zˇrejm´ y tak´e z tabulky 3.3, odkud lze vyˇc´ıst, ˇze pro parametr π = π0 + 0, 1 je hodnota β(π) rovna 0, 823 u volby π0 = 0, 1, pˇriˇcemˇz u volby π0 = 0, 5 je jiˇz s´ıla rovna jen 0, 504. Test je opˇet podhodnocen´ y, tzn. hodnota β(π0 ) ani v jednom pˇr´ıpadˇe nedosahuje hladiny v´ yznamnosti α = 0, 05.
3.5
Test zaloˇ zen´ y na norm´ aln´ı aproximaci
Jako dalˇs´ı testovac´ı kriterium lze dle odstavce 1.4 pouˇz´ıt statistiku X − nπ0 U=p . nπ0 (1 − π0 )
(3.20)
Testujeme-li hypot´ezu H0 : π = π0 proti oboustrann´e alternativˇe H1 : π 6= π0 , kritick´ ym oborem jsou vˇsechna U , pro nˇeˇz plat´ı |U | ≥ u1− α2 , kde u1− α2 je kvantil normovan´eho 22
Tabulka 3.3: Hodnoty silofunkc´ı oboustrann´eho F -testu pro r˚ uzn´a π0 , n = 100, H0 : π = yznamnosti α = 0, 05 π0 , H1 : π 6= π0 na hladinˇe v´ π0 π0 β(π) π0 π0 π0
= = = = =
π 0.1 0.2 0.3 0.4 0.5
0.1 0.033 0.716 1.000 1.000 1.000
0.2 0.823 0.036 0.543 0.989 1.000
0.3 0.998 0.633 0.041 0.549 0.979
0.4 1.000 0.994 0.533 0.041 0.467
0.5 1.000 1.000 0.986 0.459 0.029
0.6 1.000 1.000 1.000 0.972 0.504
0.7 1.000 1.000 1.000 1.000 0.981
0.8 1.000 1.000 1.000 1.000 1.000
0.9 1.000 1.000 1.000 1.000 1.000
norm´aln´ıho rozdˇelen´ı. V pˇr´ıpadˇe pravostrann´e alternativy H1 : π > π0 zam´ıt´ame hypot´ezu H0 pˇri platnosti U ≥ u1−α , u levostrann´e alternativy H1 : π < π0 zam´ıt´ame hyy na aproximaci norm´aln´ım pot´ezu H0 , je-li U ≤ −u1−α . Oznaˇcme d´ale tento test zaloˇzen´ rozdˇelen´ım jako U -test. Jako testovac´ı kriterium pro oboustrann´ y test lze tak´e vyuˇz´ıt upravenou statistiku U ∗ = |U | − sπ , kde
1 1 sπ = √ = p 2 DX 2 nπ(1 − π)
je korekce na spojitost (viz [7]). Pak je tedy testovac´ı kriterium tvaru |X − nπ0 | − 12 U∗ = p . nπ0 (1 − π0 )
(3.21)
V pˇr´ıpadˇe jednostrann´ ych test˚ u se vyuˇz´ıv´a statistika
X − nπ0 − 12 . U = U − sπ = p nπ0 (1 − π0 ) ∗
(3.22)
Kritick´e obory se stanov´ı analogicky jako u testovac´ı statistiky U . Oznaˇcme tento test s korekc´ı na spojitost jako U ∗ -test.
3.6
S´ıla testu zaloˇ zen´ eho na norm´ aln´ı aproximaci
Vˇ eta 3.6.1. Silofunkce kritick´eho oboru testu vyuˇz´ıvaj´ıc´ıho statistiku U (viz (3.20)) m´a pˇresn´y tvar pro oboustrann´y test j k √ u1− α nπ0 (1−π0 ) +nπ0 −1 µ ¶ 2 X n x βα (π) = π (1 − π)n−x , π 6= π0 , (3.23) l m x √ x= u α 2
nπ0 (1−π0 ) +nπ0 +1
23
pro pravostrann´y test βα (π) =
n X
l √ x= u α nπ0 (1−π0 ) +nπ0 +1 2
µ ¶ n x π (1 − π)n−x , π < π0 , m x
(3.24)
pro levostrann´y test k j √ u1− α nπ0 (1−π0 ) +nπ0 −1 µ 2
βα (π) =
X x=0
¶ n x π (1 − π)n−x , π > π0 . x
(3.25)
D˚ ukaz. D˚ ukaz vˇety je zaloˇzen na vyuˇzit´ı vyj´adˇren´ı silofunkce pro test o parametru binomick´eho rozdˇelen´ı: b−1 µ ¶ X n x βα (π) = 1 − Pπ (a < X < b) = π (1 − π)n−x , π 6= π0 x x=a+1 βα (π) = Pπ (U ≥ u1− α2 ) Ã ! X − nπ0 ≥ u1− α2 = Pπ p nπ0 (1 − π0 ) ! Ã X − nπ0 = 1 − Pπ u α2 < p < u1− α2 nπ0 (1 − π0 ) ³ p ´ p α α = 1 − Pπ u 2 nπ0 (1 − π0 ) + nπ0 < X < u1− 2 nπ0 (1 − π0 ) + nπ0 j k √ u1− α nπ0 (1−π0 ) +nπ0 −1 µ ¶ 2 X n x = π (1 − π)n−x l m x √ x= u α 2
nπ0 (1−π0 ) +nπ0 +1
24
Pozn´ amka. Silofunkci kritick´eho oboru testu vyuˇz´ıvaj´ıc´ıho statistiku U lze kv˚ uli zjednoduˇsen´ı i aproximovat. Po jednoduch´em v´ ypoˇctu (viz [15]) dostaneme βα (π) = Pπ (U ≥ u1− α2 ) Ã ! X − nπ0 ≥ u1− α2 = Pπ p nπ0 (1 − π0 ) Ã ! X − nπ0 = 1 − Pπ u α2 < p < u1− α2 nπ0 (1 − π0 ) µ p π0 (1 − π0 ) n(π − π0 ) X − nπ −p
Tedy pro oboustrann´ y test obdrˇz´ıme aproximaci ve tvaru s à ! √ π0 (1 − π0 ) π − π0 . n + u α2 βα (π) = Φ p π(1 − π) π(1 − π) s ! à π0 (1 − π0 ) π0 − π √ , π 6= π0 , +Φ p n + u α2 π(1 − π) π(1 − π)
(3.26)
pro pravostrann´ y test
. βα (π) = Φ
π0 (1 − π0 ) π(1 − π)
!
, π < π0 ,
(3.27)
s
π0 (1 − π0 ) π(1 − π)
!
, π > π0 ,
(3.28)
π − π0 √ p n + uα π(1 − π)
Ã
π −π √ p 0 n + uα π(1 − π)
pro levostrann´ y test . βα (π) = Φ
s
Ã
kde Φ(x) je distribuˇcn´ı funkce standardizovan´eho norm´aln´ıho rozdˇelen´ı N (0, 1). 25
V dalˇs´ım textu bude pouˇz´ıv´ano oznaˇcen´ı teoretick´e silofunkce pro tvary silofunkc´ı z´ıskan´e aproximac´ı. Testujme hypot´ezu H0 : π = π0 = 0, 5 proti alternativˇe H1 : π 6= π0 na hladinˇe v´ yznamnosti α = 0, 05. Rozsah n´ahodn´eho v´ ybˇeru volme n = 20, 30, 40, 50, 60, 80 a 100. V obr´azku 3.5 jsou zakresleny plnou ˇcarou teoretick´e silofunkce spoˇc´ıtan´e pomoc´ı v´ yˇse uveden´ ych vzorc˚ u a pteˇckovanˇe silofunkce z´ıskan´e simulacemi. Ze zm´ınˇen´eho obr´azku a tabulky 3.4 je patrn´e, ˇze s rostouc´ım n roste i s´ıla testu pro dan´ y parametr π, z´aroveˇ n se ale rozd´ıly mezi silami zmˇenˇsuj´ı. Hodnot bl´ızk´ ych 1 dosahuj´ı silofunkce pro rozsahy n > 30 v bodech π = 0, 2 a π = 0, 8, pro rozsahy n > 60 jiˇz v bodech π = 0, 3 a π = 0, 7. Pro vˇsechny volby n je hodnota silofunkce β(π0 ) velmi bl´ızk´a hladinˇe v´ yznamnosti α = 0, 05. H 0 : π = π 0 = 0.5, H 1 : π ≠ π 0, α = 0.05 1 0.9 0.8 0.7
β( π )
0.6 0.5 0.4 n = 20 n = 30 n = 40 n = 50 n = 60 n = 80 n = 100
0.3 0.2 0.1
−0.3
−0.2
−0.1
0 0.1 δ=π−π
0.2
0.3
0.4
0.5
0
Obr. 3.5: Silofunkce oboustrann´eho U -testu pro r˚ uzn´a n
Tabulka 3.4: Hodnoty silofunkc´ı oboustrann´eho U -testu pro r˚ uzn´a n, H0 : π = π0 = 0, 5, yznamnosti α = 0, 05 H1 : π 6= π0 na hladinˇe v´
β(π)
π n = 20 n = 30 n = 40 n = 50 n = 60 n = 80 n = 100
0.1 0.987 1.000 1.000 1.000 1.000 1.000 1.000
0.2 0.813 0.937 0.982 0.998 0.996 1.000 1.000
0.3 0.410 0.579 0.703 0.853 0.898 0.968 0.981
0.4 0.128 0.178 0.202 0.352 0.337 0.426 0.582
26
0.5 0.045 0.050 0.037 0.048 0.048 0.058 0.053
0.6 0.125 0.177 0.220 0.316 0.345 0.452 0.538
0.7 0.419 0.624 0.710 0.847 0.899 0.961 0.98
0.8 0.810 0.949 0.984 0.998 1.000 1.000 1.000
0.9 0.992 1.000 1.000 1.000 1.000 1.000 1.000
Nyn´ı porovn´ame silofunkce stejn´eho testu pro r˚ uznou volbu parametru π0 hypot´ezy y v´ ybˇer z binomick´eho rozdˇelen´ı o rozsahu n = 100 a necht’ π0 = H0 . Mˇejme n´ahodn´ 0, 1; 0, 2; 0, 3; 0, 4 a 0, 5. V´ ysledky simulac´ı jsou zn´azornˇeny v obr´azku 3.6 a tabulce 3.5. Test je pro vˇsechny volby π0 (aˇz na π0 = 0, 4) nadhodnocen´ y, tj. hodnota silofunkce yznamnosti α = 0, 05, nejvˇetˇs´ı rozd´ıl je u parametru v dan´em bodˇe π0 pˇrevyˇsuje hladinu v´ π0 = 0, 1 , kdy β(π0 ) je rovna 0, 07. Tabulka 3.5: Hodnoty silofunkc´ı oboustrann´eho U -testu pro r˚ uzn´a π0 , n = 100, H0 : π = yznamnosti α = 0, 05 π0 = 0, 5, H1 : π 6= π0 na hladinˇe v´ π0 π0 β(π) π0 π0 π0
= = = = =
π 0.1 0.2 0.3 0.4 0.5
0.1 0.070 0.812 1.000 1.000 1.000
0.2 0.876 0.065 0.654 0.997 1.000
0.3 0.999 0.707 0.061 0.537 0.988
0.4 1.000 0.993 0.607 0.05 0.555
0.5 1.000 1.000 0.989 0.544 0.062
0.6 1.000 1.000 1.000 0.981 0.541
0.7 1.000 1.000 1.000 1.000 0.989
0.8 1.000 1.000 1.000 1.000 1.000
0.9 1.000 1.000 1.000 1.000 1.000
H : π = π , H : π ≠ π , α = 0.05, n = 100 0
0
1
0
1 0.9 0.8 0.7
β( π )
0.6 0.5 0.4 π = 0.1 0
0.3
π = 0.2 0
π = 0.3
0.2
0
π = 0.4 0
0.1 0
π = 0.5 0
0
0.05
0.1
0.15 δ=π−π
0.2
0.25
0.3
0
Obr. 3.6: Silofunkce oboustrann´eho U -testu pro r˚ uzn´a π0 Vˇ eta 3.6.2. Silofunkce kritick´eho oboru testu vyuˇz´ıvaj´ıc´ıho statistiku U ∗ (viz (3.22)) m´a pˇresn´y tvar pro oboustrann´y test k j √ u1− α nπ0 (1−π0 ) +nπ0 + 12 −1 µ ¶ 2 X n x βα (π) = π (1 − π)n−x , π 6= π0 , (3.29) l m x √ x= u α 2
nπ0 (1−π0 ) +nπ0 + 12 +1
27
pro pravostrann´y test βα (π) =
n X
l √ x= u α nπ0 (1−π0 ) +nπ0 + 12 +1 2
µ ¶ n x π (1 − π)n−x , π < π0 , m x
(3.30)
pro levostrann´y test k j √ u1− α nπ0 (1−π0 ) +nπ0 + 12 −1 µ 2
βα (π) =
X x=0
¶ n x π (1 − π)n−x , π > π0 . x
(3.31)
D˚ ukaz. Vˇeta se dok´aˇze analogicky jako vˇeta 3.6.1. Pozn´ amka. Aproximace silofunkce kritick´eho oboru testu vyuˇz´ıvaj´ıc´ıho statistiku U ∗ m´a pro oboustrann´ y test tvar s à ! nπ − nπ0 − 12 π0 (1 − π0 ) βα (π) =Φ p + u α2 π(1 − π) nπ(1 − π) s (3.32) ! à nπ0 − nπ − 12 π0 (1 − π0 ) , π 6= π0 , + u α2 +Φ p π(1 − π) nπ(1 − π) pro pravostrann´ y test
βα (π) = Φ
Ã
nπ − nπ0 − 12 p + uα nπ(1 − π)
s
π0 (1 − π0 ) π(1 − π)
!
, π < π0 ,
(3.33)
Ã
nπ0 − nπ − 12 p + uα nπ(1 − π)
s
π0 (1 − π0 ) π(1 − π)
!
, π > π0 ,
(3.34)
pro levostrann´ y test βα (π) = Φ
kde Φ(x) je distribuˇcn´ı funkce standardizovan´eho norm´aln´ıho rozdˇelen´ı N (0, 1). Pro srovn´an´ı silofunkc´ı zopakujeme u testu vyuˇz´ıvaj´ıc´ıho upravenou testovac´ı statisy postup simulac´ı jako dˇr´ıve. Mˇejme tedy hypot´ezu H0 : π = π0 = 0, 5 proti tiku U ∗ stejn´ yznamnosti α = 0, 05. Volme opˇet rozsah souboru alternativˇe H1 : π 6= π0 na hladinˇe v´ n = 20, 30, 40, 50, 60, 80 a 100. Jak dokazuje tabulka 3.6 i obr´azek 3.7, kde jsou teoretick´e silofunkce zakresleny opˇet plnou ˇcarou, test je pro vˇsechna n > 30 velmi podhodnocen´ y, napˇr´ıklad pro n = 60 je hodnota silofunkce β(π0 ) rovna pouze 0, 021. Test je tedy vhodn´ y pro mal´e rozsahy n. Velk´a podhodnocennost testu se nemˇen´ı, ani kdyˇz vol´ıme r˚ uzn´e hodnoty parametru π0 , ybˇeru n = 100 (viz tabulka 3.7, tedy π0 = 0, 1; 0, 2; 0, 3; 0, 4 a 0, 5 pˇri fixn´ım rozsahu v´ obr´azek 3.8). 28
H : π = π = 0.5, H : π ≠ π , α = 0.05 0
0
1
0
1 0.9 0.8 0.7
β( π )
0.6 0.5 0.4 n = 20 n = 30 n = 40 n = 50 n = 60 n = 80 n = 100
0.3 0.2 0.1 0
−0.3
−0.2
−0.1
0 0.1 δ=π−π
0.2
0.3
0.4
0.5
0
Obr. 3.7: Silofunkce oboustrann´eho U ∗ -testu pro r˚ uzn´a n uzn´a n, H0 : π = π0 = 0, 5, Tabulka 3.6: Hodnoty silofunkc´ı oboustrann´eho U ∗ -testu pro r˚ yznamnosti α = 0, 05 H1 : π 6= π0 na hladinˇe v´
β(π)
π n = 20 n = 30 n = 40 n = 50 n = 60 n = 80 n = 100
0.1 0.993 1.000 1.000 1.000 1.000 1.000 1.000
0.2 0.802 0.946 0.985 0.995 0.998 1.000 1.000
0.3 0.418 0.564 0.696 0.782 0.831 0.959 0.978
0.4 0.116 0.165 0.224 0.234 0.243 0.371 0.454
0.5 0.041 0.046 0.034 0.024 0.021 0.032 0.032
0.6 0.133 0.178 0.188 0.251 0.267 0.362 0.441
0.7 0.433 0.570 0.691 0.784 0.849 0.933 0.979
0.8 0.790 0.945 0.984 0.992 0.998 1.000 1.000
0.9 0.996 0.999 1.000 1.000 1.000 1.000 1.000
Tabulka 3.7: Hodnoty silofunkc´ı oboustrann´eho U ∗ -testu pro r˚ uzn´a π0 , n = 100, H0 : π = yznamnosti α = 0, 05 π0 = 0, 5, H1 : π 6= π0 na hladinˇe v´ π0 π0 β(π) π0 π0 π0
= = = = =
π 0.1 0.2 0.3 0.4 0.5
0.1 0.027 0.708 0.999 1.000 1.000
0.2 0.809 0.033 0.555 0.989 1.000
0.3 0.999 0.606 0.025 0.461 0.989
0.4 1.000 0.989 0.532 0.026 0.468
29
0.5 1.000 1.000 0.978 0.471 0.038
0.6 1.000 1.000 1.000 0.978 0.453
0.7 1.000 1.000 1.000 1.000 0.974
0.8 1.000 1.000 1.000 1.000 1.000
0.9 1.000 1.000 1.000 1.000 1.000
H : π = π , H : π ≠ π , α = 0.05, n = 100 0
0
1
0
1 0.9 0.8 0.7
β( π )
0.6 0.5 0.4 π = 0.1 0
0.3
π 0 = 0.2 π = 0.3
0.2
0
π = 0.4 0
0.1
π = 0.5 0
0
0
0.05
0.1
0.15 δ=π−π
0.2
0.25
0
Obr. 3.8: Silofunkce oboustrann´eho U ∗ -testu pro r˚ uzn´a π0
Srovn´an´ı testu vyuˇz´ıvaj´ıc´ıho statistiku U a testu s upravenou statistikou U ∗ je pro r˚ uzn´a n demonstrov´ano na obr´azku 3.9, kde jsou pomoc´ı simulac´ı vykresleny silofunkce pro testov´an´ı hypot´ezy H0 : π = π0 = 0, 5 proti oboustrann´e alternativˇe na hladinˇe v´ yznamnosti α = 0, 05. Silofunkce U -testu je zn´azornˇena plnou ˇcarou a silofunkce U ∗ pomoc´ı teˇcek. Uk´azalo se, ˇze tyto dvˇe varianty testu zaloˇzen´eho na aproximaci norm´aln´ım rozdˇelen´ım se neliˇs´ı pro n ≤ 49, ovˇsem u volby rozsahu n = 50 jsou jiˇz patrn´e rozd´ıly. Jak lze vyˇc´ıst z tabulky 3.8 (kde ∗ oznaˇcuje druhou variantu testu), nejv´ıce se tyto dva testy liˇs´ı pro parametr π = 0, 5, kdy je hodnota silofunkce β(0, 5) U -testu rovna 0, 067 a U ∗ -testu jen 0, 029. Je zˇrejm´e, ˇze je l´epe vyuˇz´ıvat upraven´e statistiky U ∗ , protoˇze tento test je st´ale na pˇredepsan´e hladinˇe v´ yznamnosti α = 0, 05, na rozd´ıl od testu zaloˇzen´eho na statistice U . Tabulka 3.8: Hodnoty silofunkc´ı U -testu a U ∗ -testu pro r˚ uzn´a n, H0 : π = π0 = 0, 5, yznamnosti α = 0, 05 H1 : π 6= π0 na hladinˇe v´ π n = 50 β(π) n = 100 n∗ = 50 n∗ = 100
0.1 1.000 1.000 1.000 1.000
0.2 1.000 1.000 0.996 1.000
0.3 0.855 0.988 0.777 0.981
0.4 0.345 0.566 0.253 0.484
30
0.5 0.067 0.062 0.029 0.037
0.6 0.331 0.522 0.240 0.442
0.7 0.853 0.989 0.765 0.980
0.8 0.995 1.000 0.992 1.000
0.9 1.000 1.000 1.000 1.000
H 0 : π = π 0 = 0.5, H 1 : π ≠ π 0 1 0.9 0.8 0.7
β( π )
0.6 U:
0.5
n = 30 n = 40 n = 49 n = 50 n = 100 n = 30 n = 40 n = 49 n = 50 n = 100
0.4 0.3
U*:
0.2 0.1 0 −0.4
−0.3
−0.2
−0.1
0
0.1 δ=π−π0
0.2
0.3
0.4
0.5
uzn´a n, H0 : Obr. 3.9: Srovn´an´ı silofunkc´ı oboustrann´e varianty U -testu a U ∗ -testu pro r˚ yznamnosti α = 0, 05 π = π0 = 0, 5, H1 : π 6= π0 na hladinˇe v´
3.7
Testy zaloˇ zen´ e na arcussinov´ e transformaci
Pro testy hypot´ez o parametru π binomick´eho rozdˇelen´ı lze vyuˇz´ıt tak´e statistiky z´ıskan´e arcussinovou transformac´ı (viz odstavec 1.5.1) r µ ¶ √ √ x U1 = 2 n arcsin − arcsin π0 , (3.35) n à ! r r √ 8x + 3 8nπ0 + 3 . (3.36) − arcsin U2 = 4n + 2 arcsin 8n + 6 8n + 6 Vyhodnocen´ı oboustrann´ ych (popˇr. jednostrann´ ych) test˚ u (ozn. U1 -test, U2 -test) se provede analogicky jako v odstavci 3.5.
3.8
S´ıla test˚ u zaloˇ zen´ ych na arcsin-transformaci
Vˇ eta 3.8.1. Silofunkce kritick´eho oboru testu vyuˇz´ıvaj´ıc´ıho statistiku U1 (viz (3.35)) m´a pˇresn´y tvar pro oboustrann´y test — „u α « 1− √ n sin2 2√n2 +arcsin π0 −1
βα (π) =
X
µ ¶ n x π (1 − π)n−x , π 6= π0 , ı x
n X
µ ¶ n x π (1 − π)n−x , π < π0 , ı x
‰ „ uα « √ x= n sin2 2√2n +arcsin π0 +1
(3.37)
pro pravostrann´y test βα (π) =
« „ uα ‰ √ x= n sin2 2√2n +arcsin π0 +1
31
(3.38)
pro levostrann´y test — „u α « 1− √ n sin2 2√n2 +arcsin π0 −1
X
βα (π) =
x=0
µ ¶ n x π (1 − π)n−x , π > π0 . x
(3.39)
D˚ ukaz. D˚ ukaz vˇety se provede analogicky jako u vˇety 3.6.1, tedy ! à ! à r √ √ X − arcsin π0 ≥ u1− α2 βα (π) = Pπ 2 n arcsin n µ µ α ¶ µ ¶¶ u2 u1− α2 √ √ 2 2 √ + arcsin π0 < X < n sin √ + arcsin π0 = 1 − Pπ n sin 2 n 2 n — „u α « 1− √ n sin2 2√n2 +arcsin π0 −1
=
X
µ ¶ n x π (1 − π)n−x ı x
‰ „ uα « √ x= n sin2 2√2n +arcsin π0 +1
Pozn´ amka. Silofunkci kritick´eho oboru testu vyuˇz´ıvaj´ıc´ıho statistiku U1 lze vyj´adˇrit tak´e v aproximovan´em tvaru. Jednoduch´ ym odvozen´ım dostaneme βα (π) = Pπ (U1 ≥ u1− α2 |π = π0 ) à à ! ! r √ √ X = Pπ 2 n arcsin − arcsin π0 ≥ u1− α2 n à à ! ! r √ √ X = 1 − Pπ u α2 < 2 n arcsin − arcsin π0 < u1− α2 n √ ¡ √ √ ¢ = 1 − Pπ (u α2 − 2 n arcsin π − arcsin π0 à ! r √ √ X < 2 n arcsin − arcsin π n √ √ √ < u1− α2 − 2 n(arcsin π − arcsin π0 )) √ √ √ = 1 − (Φ(u1− α2 − 2 n(arcsin π − arcsin π0 )) √ √ √ − Φ(u α2 − 2 n(arcsin π − arcsin π0 ))) √ √ √ = Φ(u α2 + 2 n(arcsin π − arcsin π0 )) √ √ √ + Φ(u α2 + 2 n(arcsin π0 − arcsin π)) Tedy aproximac´ı obdrˇz´ıme pro oboustrann´ y test tvar ¡ √ ¡ √ √ ¢¢ β(π) = Φ u α2 + 2 n arcsin π − arcsin π0 + ¡ √ ¢¢ √ ¡ √ + Φ u α2 + 2 n arcsin π0 − arcsin π , π 6= π0 , 32
(3.40)
pro pravostrann´ y test ¡ √ ¡ √ √ ¢¢ β(π) = Φ uα + 2 n arcsin π − arcsin π0 , π < π0 ,
(3.41)
pro levostrann´ y test
¡ √ ¡ √ ¢¢ √ β(π) = Φ uα + 2 n arcsin π0 − arcsin π , π > π0 ,
(3.42)
kde Φ(x) je distribuˇcn´ı funkce standardizovan´eho norm´aln´ıho rozdˇelen´ı N (0, 1). Testujme hypot´ezu H0 : π = π0 = 0, 5 proti alternativˇe H1 : π 6= π0 na hladinˇe v´ yznamnosti α = 0, 05 pomoc´ı testovac´ı statistiky U1 . Rozsah n´ahodn´eho v´ ybˇeru volme n = 20, 30, 40, 50, 60, 80 a 100. V´ ysledn´e silofunkce z´ıskan´e pomoc´ı simulac´ı jsou zakresleny teˇckovanˇe v obr´azku 3.10, teoretick´e silofunkce jsou zn´azornˇeny plnou ˇcarou. Hodnoty silofunkc´ı v bodˇe π0 se pohybuj´ı nad i pod hladinou v´ yznamnosti α. Nejv´ıce podhodnocen´ y a z´aroveˇ n nejslabˇs´ı je test v´ ybˇeru o rozsahu n = 20, kdy hodnota silofunkce β(π) v bodˇe π = 0, 2 je rovna 0, 799, zat´ım co pro rozsah n = 30 je jiˇz β(0, 2) = 0, 954. H : π = π = 0.5, H : π ≠ π , α = 0.05 0
0
1
0
1 0.9 0.8 0.7
β( π )
0.6 0.5 0.4 n = 20 n = 30 n = 40 n = 50 n = 60 n = 80 n = 100
0.3 0.2 0.1 0 −0.4
−0.3
−0.2
−0.1
0 0.1 δ=π−π0
0.2
0.3
0.4
0.5
Obr. 3.10: Silofunkce oboustrann´eho U1 -testu pro r˚ uzn´a n Pro porovn´an´ı z´avislosti silofunkc´ı na volbˇe parametru π0 zafixujme rozsah n´ahodn´eho v´ ybˇeru na hodnotˇe n = 100 a testujme hypot´ezu H0 : π = π0 proti alternativˇe H1 : π 6= yznamnosti α = 0, 05 pro parametr π0 = 0, 1; 0, 2; 0, 3; 0, 4 a 0, 5. π0 na hladinˇe v´ Jak lze vyˇc´ıst z obr´azku 3.11 i tabulky 3.10, silofunkce testu si jsou velmi podobn´e pro volbu parametru π0 = 0, 3; 0, 4; 0, 5, nejv´ıce se pak odliˇsuje silofunkce z´ıskan´a volbou y zejm´ena v bodˇe π = π0 + 0, 1, kdy se hodnota silofunkce π0 = 0, 1. Tento rozd´ıl je patrn´ β(π) pro volby parametru π0 = 0, 3; 0, 4; 0, 5 pohybuje v rozmez´ı od 0, 518 do 0, 633, 33
Tabulka 3.9: Hodnoty silofunkc´ı oboustrann´eho U1 -testu pro r˚ uzn´a n, H0 : π = π0 = 0, 5, yznamnosti α = 0, 05 H1 : π 6= π0 na hladinˇe v´
β(π)
π n = 20 n = 30 n = 40 n = 50 n = 60 n = 80 n = 100
0.1 0.987 1.000 1.000 1.000 1.000 1.000 1.000
0.2 0.799 0.954 0.980 0.998 1.000 1.000 1.000
0.3 0.433 0.580 0.702 0.865 0.896 0.978 0.988
0.4 0.139 0.184 0.213 0.341 0.367 0.458 0.546
0.5 0.039 0.046 0.046 0.068 0.048 0.058 0.065
0.6 0.127 0.169 0.208 0.325 0.368 0.464 0.555
0.7 0.413 0.543 0.700 0.866 0.894 0.959 0.987
0.8 0.822 0.943 0.985 0.997 1.000 1.000 1.000
0.9 0.991 0.999 1.000 1.000 1.000 1.000 1.000
zat´ım co pro volbu π0 = 0, 1 je β(π) = 0, 813. Ovˇsem jiˇz v bodˇe π = π0 + 0, 2 se hodnoty β(π) pro vˇsechny volby parametru π0 bl´ıˇz´ı k hodnotˇe 1 tak, ˇze pravdˇepodobnosti 1 − β chyby II. druhu pro jednotliv´e volby parametru se liˇs´ı maxim´alnˇe jen o 2, 2%. Tak´e je patrn´e, ˇze s´ıla testu v bodˇe π0 se s roustouc´ım π0 zvˇetˇsuje. H 0 : π = π 0, H 1 : π ≠ π 0, α = 0.05,n = 100 1 0.9 0.8 0.7
β( π )
0.6 0.5 0.4 π = 0.1 0
0.3
π = 0.2 0
π = 0.3
0.2
0
π = 0.4 0
0.1 0
π = 0.5 0
0
0.05
0.1
0.15 δ=π−π0
0.2
0.25
Obr. 3.11: Silofunkce oboustrann´eho U1 -testu pro r˚ uzn´a π0 Vˇ eta 3.8.2. Silofunkce kritick´eho oboru testu vyuˇz´ıvaj´ıc´ıho statistiku U2 (viz (3.36)) m´a pˇresn´y tvar pro oboustrann´y test —
βα (π) =
8n+6 8
sin2
„u
1− α 2 +arcsin √ 4n+2
q
8nπ0 +3 8n+6
« − 38 −1
X
µ ¶ n x π (1 − π)n−x , π 6= π0 , ı x
„ uα « ‰ q 8nπ0 +3 2 − 38 +1 x= 8n+6 sin2 √4n+2 +arcsin 8 8n+6
34
(3.43)
Tabulka 3.10: Hodnoty silofunkc´ı oboustrann´eho U1 -testu pro r˚ uzn´a π0 , n = 100, H0 : yznamnosti α = 0, 05 π = π0 = 0, 5, H1 : π 6= π0 na hladinˇe v´ π0 π0 β(π) π0 π0 π0
= = = = =
π 0.1 0.2 0.3 0.4 0.5
0.1 0.041 0.809 1.000 1.000 1.000
0.2 0.813 0.043 0.647 0.991 1.000
0.3 0.998 0.633 0.058 0.536 0.986
0.4 1.000 0.989 0.552 0.056 0.532
0.5 1.000 1.000 0.987 0.540 0.060
0.6 1.000 1.000 1.000 0.968 0.518
0.7 1.000 1.000 1.000 1.000 0.990
0.8 1.000 1.000 1.000 1.000 1.000
0.9 1.000 1.000 1.000 1.000 1.000
pro pravostrann´y test n X
βα (π) =
‰ „ uα « q 8nπ0 +3 2 x= 8n+6 sin2 √4n+2 +arcsin − 38 +1 8 8n+6
µ ¶ n x π (1 − π)n−x , π < π0 , x ı
(3.44)
pro levostrann´y test —
8n+6 8
sin2
βα (π) =
„u
1− α 2 +arcsin √ 4n+2
q
8nπ0 +3 8n+6
« − 38 −1
X x=0
µ ¶ n x π (1 − π)n−x , π > π0 . x
(3.45)
D˚ ukaz. D˚ ukaz vˇety se provede analogicky jako u vˇety 3.8.1. Pozn´ amka. Aproximace silofunkce kritick´eho oboru testu vyuˇz´ıvaj´ıc´ıho statistiku U2 m´a tvar pro oboustrann´ y test s s à !! à 3 3 √ π + 8n π0 + 8n + β(π) = Φ u α2 + 4n + 2 arcsin 3 − arcsin 3 1 + 4n 1 + 4n s s (3.46) à !! à 3 3 √ π0 + 8n π + 8n , π 6= π0 , + Φ u α2 + 4n + 2 arcsin 3 − arcsin 3 1 + 4n 1 + 4n pro pravostrann´ y test s s à à !! 3 3 √ π + 8n π0 + 8n β(π) = Φ u α2 + 4n + 2 arcsin , π < π0 , 3 − arcsin 3 1 + 4n 1 + 4n pro levostrann´ y test Ã
s s !! Ã 3 3 √ π0 + 8n π + 8n β(π) = Φ u α2 + 4n + 2 arcsin , π > π0 , 3 − arcsin 3 1 + 4n 1 + 4n
kde Φ(x) je distribuˇcn´ı funkce standardizovan´eho norm´aln´ıho rozdˇelen´ı N (0, 1). 35
(3.47)
(3.48)
Provedeme-li opˇet testov´an´ı hypot´ezy H0 : π = π0 = 0, 5 proti alternativˇe H1 : π 6= π0 na hladinˇe v´ yznamnosti α = 0, 05 pro r˚ uzn´e volby rozsahu v´ ybˇeru n tentokr´at ovˇsem pomoc´ı statistiky U2 (situaci ilustruje obr´azek 3.12 a tabulka 3.11), z´ısk´ame obdobn´e v´ ysledky jako v pˇr´ıpadˇe pouˇzit´ı statistiky U1 . Hodnoty silofunkc´ı β(π = π0 ) se pohybuj´ı nad i pod hladinou v´ yznamnosti α = 0, 05. H : π = π = 0.5, H : π ≠ π , α = 0.05 0
0
1
0
1 0.9 0.8 0.7
β( π )
0.6 0.5 0.4 n = 20 n = 30 n = 40 n = 50 n = 60 n = 80 n = 100
0.3 0.2 0.1 0
−0.3
−0.2
−0.1
0 0.1 δ=π−π0
0.2
0.3
0.4
0.5
Obr. 3.12: Silofunkce oboustrann´eho U2 -testu pro r˚ uzn´a n
Tabulka 3.11: Hodnoty silofunkc´ı oboustrann´eho U2 -testu pro r˚ uzn´a n, H0 : π = π0 = 0, 5, yznamnosti α = 0, 05 H1 : π 6= π0 na hladinˇe v´
β(π)
π n = 20 n = 30 n = 40 n = 50 n = 60 n = 80 n = 100
0.1 0.989 1.000 1.000 1.000 1.000 1.000 1.000
0.2 0.818 0.930 0.981 0.999 0.999 1.000 1.000
0.3 0.411 0.618 0.688 0.862 0.896 0.964 0.988
0.4 0.128 0.183 0.195 0.337 0.333 0.451 0.562
0.5 0.037 0.046 0.030 0.066 0.050 0.065 0.065
0.6 0.121 0.186 0.218 0.324 0.362 0.453 0.564
0.7 0.407 0.566 0.726 0.858 0.899 0.973 0.988
0.8 0.779 0.940 0.979 0.996 1.000 1.000 1.000
0.9 0.987 1.000 1.000 1.000 1.000 1.000 1.000
Obr´azek 3.13 a tabulka 3.12 demonstruj´ı simulace testu vyuˇz´ıvaj´ıc´ıho statistiku U2 pro r˚ uznou volbu parametru π0 . Silofunkce pro volby π0 = 0, 3; 0, 4; 0, 5 si jsou opˇet velmi yrazn´ y rozd´ıl je v bodˇe π = π0 + 0, 1, ovˇsem bl´ızk´e. Nejsilnˇejˇs´ı je test pˇri volbˇe π0 = 0, 1, v´ silofunkce v bodˇe π = π0 + 0, 2 pro vˇsechny volby parametru π0 se jiˇz bl´ıˇz´ı hodnotˇe 1. 36
H : π = π , H : π ≠ π , α = 0.05, n = 100 0
0
1
0
1 0.9 0.8 0.7
β( π )
0.6 0.5 0.4 π 0 = 0.1
0.3
π = 0.2 0
0.2
π 0 = 0.3 π 0 = 0.4
0.1 0
π 0 = 0.5 0
0.05
0.1
0.15 δ=π−π
0.2
0.25
0.3
0
Obr. 3.13: Silofunkce oboustrann´eho U2 -testu pro r˚ uzn´a π0 Tabulka 3.12: Hodnoty silofunkc´ı oboustrann´eho U2 -testu pro r˚ uzn´a π0 , n = 100, H0 : yznamnosti α = 0, 05 π = π0 = 0, 5, H1 : π 6= π0 na hladinˇe v´ π0 π0 β(π) π0 π0 π0
3.9
= = = = =
π 0.1 0.2 0.3 0.4 0.5
0.1 0.045 0.827 0.999 1.000 1.000
0.2 0.805 0.047 0.683 0.997 1.000
0.3 1.000 0.631 0.060 0.552 0.987
0.4 1.000 0.990 0.543 0.057 0.540
0.5 1.000 1.000 0.986 0.530 0.041
0.6 1.000 1.000 1.000 0.987 0.544
0.7 1.000 1.000 1.000 1.000 0.988
0.8 1.000 1.000 1.000 1.000 1.000
0.9 1.000 1.000 1.000 1.000 1.000
Volba rozsahu v´ ybˇ eru n
V r´amci pl´anov´an´ı senzorick´eho experimentu je nutn´e stanovit minim´aln´ı vhodn´ y rozsah souboru n odpov´ıdaj´ıc´ı pˇredem stanoven´ ym poˇzadavk˚ um, kter´e zahrnuj´ı dodrˇzen´ı pˇredepsan´e chyby II. druhu. Vˇ eta 3.9.1. Uvaˇzujme test jednoduch´e hypot´ezy H0 : π = π0 proti jednoduch´e alternativˇe H1 : π = π1 na dan´e hladinˇe v´yznamnosti α pomoc´ı testovac´ı statistiky U viz (3.20). Pak rozsah v´ybˇeru n, pˇri nemˇz je pravdˇepodobnost chyby II. druhu nejv´yˇse rovna pˇredem dan´e hodnotˇe β, mus´ı splˇ novat nerovnost
n≥
q ³ ´2 0 (1−π0 ) + u1−β u1− α2 ππ(1−π) (π − π0 )2 37
π(1 − π) .
(3.49)
Pˇri vyuˇzit´ı upraven´e testovac´ı statistiky U ∗ viz (3.21) je rozsah n urˇcen vztahem p nu + n2u − (π − π0 )2 n≥ , kde 2(π − π0 )2 s à !2 π0 (1 − π0 ) + u1−β + |π − π0 | . nu = π(1 − π) u1− α2 π(1 − π)
(3.50)
D˚ ukaz. Podm´ınka pro volbu rozsahu n m´a tvar 1 − βα (π) ≤ β, tedy à ! X − nπ0 ≥ u1− α2 ≤ β 1 − Pπ p nπ0 (1 − π0 ) s ! à π0 (1 − π0 ) π − π0 √ X − nπ n ≥1−β ≥ u1− α2 Pπ p −p π(1 − π) nπ(1 − π) π(1 − π) s π0 (1 − π0 ) π − π0 √ u1− α2 −p n = uβ π(1 − π) π(1 − π)
´ Upravou dostaneme v´ yraz pro minim´aln´ı hodnotu rozsahu v´ ybˇeru
n=
³
u1− α2
q
π0 (1−π0 ) π(1−π)
+ u1−β
(π − π0 )2
´2
π(1 − π) .
Vzorec (3.50) ud´avaj´ıc´ı minim´aln´ı rozsah souboru pro test vyuˇz´ıvaj´ıc´ı upravenou statistiku U ∗ se odvod´ı analogicky. Dan´ y probl´em lze ˇreˇsit tak´e graficky (popˇr. numericky). Vykresl´ı se teoretick´e silofunkce pro dan´ y test pro r˚ uzn´a n na zadan´e hladinˇe v´ yznamnosti α a zjist´ı se, ke kter´e z tˇechto silofunkc´ı m´a zadan´ y bod o souˇradnic´ıch [π − π0 ; βα (π − π0 )] nejbl´ıˇze. Pˇ r´ıklad: Poˇzadujme, aby pro U -test hypot´ezy H0 : π = π0 = 0, 5 na hladinˇe v´ yznamnosti α = 0, 05 byla pravdˇepodobnost chyby II. druhu pˇri alternativˇe H1 : π = π1 = 0, 8 menˇs´ı neˇz β = 0, 2, tj. aby s´ıla testu v bodˇe δ = π − π0 = 0, 8 byla vˇetˇs´ı neˇz 0, 8. Pak dle vzorce 3.49 lze spoˇc´ıtat, ˇze je nutno volit rozsah souboru n ≥ 19.261, tedy vhodn´ y minim´aln´ı rozsah je n = 20. Danou hodnotu lze tak´e odvodit graficky. Na obr´azku 3.14(b) jsou v detailu zakresleny teoreticky spoˇc´ıtan´e silofunkce pro zadanou hladinu α a danou alternativu H1 . Bod o souˇradnic´ıch [π − π0 ; β0,05 (π − π0 )] = [0, 3; 0, 8] leˇz´ı mezi silofunkcemi pro rozsah n = 19 a n = 20, coˇz odpov´ıd´a spoˇc´ıtan´e hodnotˇe n. Chceme-li tento pˇr´ıpad pro danou alternativu a hladinu v´ yznamnosti za stejn´e podm´ınky t´ ykaj´ıc´ı se s´ıly testovat pomoc´ı testovac´ı statistiky U ∗ , pouˇzijeme ke stanoven´ı minim´aln´ıho doporuˇcen´eho rozsahu vztah 3.50. V´ ypoˇctem z´ısk´ame hodnotu n ≥ 22, 471, pro U ∗ -test tedy potˇrebujeme pro dosaˇzen´ı stejn´e s´ıly pˇri stejn´e hladinˇe v´ yznamnosti a alternativˇe soubor o vˇetˇs´ım rozsahu neˇz u U -testu (viz srovn´an´ı silofunkc´ı tˇechto dvou 38
H 0 : π = π 0 = 0.5, H 1 : π ≠ π 0, α = 0.05 1 0.9 0.8 0.7
β( δ)
0.6 0.5 0.4 0.3 n = 17 n = 18 n = 19 n = 20 n = 21
0.2 0.1 0 −0.4
−0.3
−0.2
−0.1
0 0.1 δ=π−π
0.2
0.3
0.4
0
(a) Silofunkce oboustrann´eho U -testu H 0 : π = π 0 = 0.5, H 1 : π ≠ π 0, α = 0.05 H : π = π = 0.5, H : π ≠ π , α = 0.05 0
0.84
0.81
0.8
0.8
β( π )
β( π )
0.82
0.78 n = 17 n = 18 n = 19 n = 20 n = 21
0.76
0.74
0
1
0
0.79
0.78
0.77
n = 19 n = 20 n* = 22 n* = 23
0.76
0.26
0.28
0.3 δ=π−π
0.32
0.34
0.36
0.27
0
0.28
0.29
0.3 δ=π−π
0.31
0.32
0
(b) Detail silofunkc´ı U -testu
(c) Detail silofunkc´ı U -testu a U ∗ -testu
Obr. 3.14: Hled´an´ı minim´aln´ıho rozsahu pomoc´ı silofunkc´ı oboustrann´eho U -testu a U ∗ testu uzn´a n, H0 : Tabulka 3.13: Hodnoty silofunkc´ı oboustrann´eho U -testu a U ∗ -testu pro r˚ π = π0 = 0, 5, H1 : π = π1 na hladinˇe v´ yznamnosti α = 0, 05 n β(0, 8) β ∗ (0, 8)
18 19 20 21 22 23 0.768 0.794 0.817 0.838 0.857 0.874 0.669 0.703 0.734 0.762 0.789 0.812
test˚ u pro r˚ uzn´a n v detailu na obr´azku 3.14(c)). Pro n´azornost jsou uvedeny hodnoty
39
silofunkce β(π1 ) v bodˇe π1 = 0, 8 tak´e v tabulce 3.13, pˇriˇcemˇz silofunkce U ∗ -testu je znaˇcena β ∗ . Vˇ eta 3.9.2. Mˇejme test hypot´ezy H0 : π = π0 proti zadan´e alternativˇe H1 : π = π1 na urˇcen´e hladinˇe v´yznamnosti α zaloˇzen´y na testovac´ı statistice U1 viz (3.35). Pak pro ¢2 u1− α2 + u1−β √ n≥ √ 4(arcsin π − arcsin π0 )2 ¡
(3.51)
plat´ı, ˇze pravdˇepodobnost chyby II. druhu je menˇs´ı rovna dan´e hodnotˇe β. D˚ ukaz. Vˇeta se dok´aˇze analogicky jako vˇeta 3.9.1, tedy 1 − βα (π) ≤ β à !! à r √ √ X ≤β 1 − Pπ 2 n arcsin − arcsin π0 n à à ! ! r √ √ √ √ √ X Pπ 2 n arcsin − arcsin π ≥ u1− α2 − 2 n(arcsin π − arcsin π0 ) ≥ 1 − β n √ √ √ u1− α2 − 2 n(arcsin π − arcsin π0 ) = uβ ¡ ¢2 u1− α2 + u1−β √ n= . √ 4(arcsin π − arcsin π0 )2 Pozn´ amka. Nerovnice (3.49), (3.50) a (3.51) urˇcuj´ıc´ı potˇrebn´ y minim´aln´ı rozsah v´ ybˇeru n jsou odvozeny aproximac´ı, jedn´a se tedy pouze o pˇribliˇzn´e v´ ypoˇcty rozsahu. Vr´at´ıme-li se k pˇr´ıkladu a spoˇc´ıt´ame-li pro zadan´e hodnoty minim´aln´ı rozsah v´ ybˇeru podle vzorce 3.51, dostaneme v´ ysledek n ≥ 18, 954, tedy pro dodrˇzen´ı s´ıly β ≥ 0, 8 v bodˇe π1 = 0, 8 je zapotˇreb´ı souboru o rozsahu n ≥ 19. Vztah pro v´ ypoˇcet minim´aln´ıho rozsahu v´ ybˇeru n splˇ nuj´ıc´ıho dan´e podm´ınky nen´ı pro U2 -test (viz (3.36)) ani pro testov´an´ı pomoc´ı intervalu hπD , πH i, tedy F -testu, snadn´e analyticky vyj´adˇrit, probl´em n´avrhu experimentu se tedy ˇreˇs´ı graficky nebo numericky. Pro v´ yˇse uveden´ y pˇr´ıklad byla z´ısk´ana grafickou metodou pro oba tyto testy hodnota minim´aln´ıho rozsahu n = 20.
40
4
Srovn´ an´ı test˚ u o parametru π binomick´ eho rozdˇ elen´ı
Uvaˇzujme pˇet v´ yˇse popsan´ ych test˚ u: F-test zaloˇzen´ y na pouˇzit´ı kvantil˚ u Fisherova rozdˇelen´ı v intervalu spolehlivosti (viz odstavec 3.3), U -test vyuˇz´ıvaj´ıc´ı statistiku (3.20) z´ıskanou aproximac´ı norm´aln´ım rozdˇelen´ım, U ∗ -test s upravenou statistikou (3.22), d´ale pak arcussinovou transformac´ı odvozen´ y U1 -test se statistikou (3.35) a U2 -test vyuˇz´ıvaj´ıc´ı statistiku (3.36). Testujme hypot´ezu H0 : π = π0 proti alternativˇe π 6= π0 na hladinˇe v´ yznamnosti α = 0, 05. Tuto formulaci testu budeme uvaˇzovat pro vˇsechny n´asleduj´ıc´ı rozbory v t´eto kapitole, nebot’ α = 0, 05 je v praxi nejuˇz´ıvanˇejˇs´ı volbou. Nejprve volme parametr binomick´eho rozdˇelen´ı π0 = 0, 5. Pomoc´ı simulac´ı se snadno dok´aˇze, ˇze F-test pro rozsah v´ ybˇeru n ≤ 5 nikdy hypot´ezu H0 nezam´ıt´a. Nelze totiˇz naj´ıt takov´a c1 a c2 (viz (3.9)), aby β(π0 ) ≤ α, jak je patrn´e z tabulky 4.1. V programu pro Tabulka 4.1: Srovn´an´ı hodnot c1 , c2 , β(π0 ) pˇri π0 = 0, 5 n c1 c2 β(π0 )
4 5 6 7 -1 -1 0 0 5 6 6 7 0,125 0,063 0,031 0,016
vykreslov´an´ı teoretick´ ych silofunkc´ı F-testu (viz pˇr´ıloha P2) je tato skuteˇcnost oˇsetˇrena podm´ınkami. Necht’ je tedy n = 6. Na obr´azku 4.1 lze vidˇet, ˇze ani F-test, ani U ∗ -test nedosahuj´ı H : π = π = 0.5, H : π ≠ π , α = 0.05, n = 6 0
0
1
0
1 F−test U−test U*−test U −test
0.9 0.8
1
0.7
U −test 2
β( δ )
0.6 0.5 0.4 0.3 0.2 0.1 0 −0.5
−0.4
−0.3
−0.2
−0.1
0 0.1 δ=π−π
0.2
0.3
0.4
0.5
0
Obr. 4.1: Srovn´an´ı test˚ u pro π0 = 0, 5 a n = 6 41
stanoven´e hladiny v´ yznamnosti, pˇriˇcemˇz v´ıce podhodnocen´ y je U ∗ -test. Nejvˇetˇs´ı s´ıly dosahuje U1 -test pro δ ∈ h−0, 47; 0, 47i, tedy pro π ∈ h0, 03; 0, 97i. Pouˇzit´ı testovac´ı statistiky U ∗ nen´ı pro dan´e parametry vhodn´e, napˇr. silofunkce β(π) v bodˇe π = 0, 1 je u U ∗ -testu rovna pouze 0.248, zat´ımco pro U1 -test je β(0, 1) = 0, 6223. Z grafu je d´ale patrn´e, ˇze silofunkce F-testu nab´ yv´a vˇetˇs´ıch hodnot neˇz silofunkce U -testu v rozmez´ı π ∈ h0, 03; 0, 18i ∪ h0, 82; 0, 97i. Ve srovn´an´ı s U2 -testem je F-test silnˇejˇs´ı do bodu π = 0, 11, resp. od bodu π = 0, 89. Zat´ımco s´ılu U1 -testu pˇrevyˇsuje do bodu π = 0, 02, yv´a vyˇsˇs´ıch hodnot neˇz silofunkce U -testu resp. od bodu π = 0, 98. Silofunkce U2 -testu nab´ do bodu π = 0, 08, resp. od bodu π = 0, 92. Do (resp. od) tohoto bodu je vhodnˇejˇs´ı pouˇz´ıt y F-test. jeden z test˚ u vyuˇz´ıvaj´ıc´ıch statistiky U1 , U nebo pˇresn´ Na obr´azku 4.2 je zn´azornˇena situace pro volbu rozsahu v´ ybˇeru n = 10. F-test a U ∗ -test H : π = π = 0.5, H : π ≠ π , α = 0.05, n = 10 0
0
1
0
1 F−test U−test U*−test U1−test
0.9 0.8 0.7
U2−test
β( δ )
0.6 0.5 0.4 0.3 0.2 0.1 0 −0.5
−0.4
−0.3
−0.2
−0.1
0 0.1 δ=π−π0
0.2
0.3
0.4
0.5
Obr. 4.2: Srovn´an´ı test˚ u pro π0 = 0, 5 a n = 10 jsou opˇet podhodnocen´e, u obou je totiˇz s´ıla v bodˇe π = π0 rovna 0, 0228, coˇz je m´enˇe neˇz je stanoven´a hladina v´ yznamnosti α = 0, 05. Silofunkce F-testu dosahuje vyˇsˇs´ıch hodnot ∗ neˇz silofunkce U -testu pro π ∈ h0, 04; 0, 35i ∪ h0, 65; 0, 96i. Celkovˇe nejm´enˇe vhodn´ ym yhodn´e pouze testem pro parametr π ∈ h0, 05; 0, 95i je U ∗ -test. Pouˇzit´ı t´eto statistiky je v´ pro velk´a δ (|δ| ≥ 0, 45). Do bodu π = 0, 05, resp. od bodu π = 0, 95 je nejslabˇs´ı U2 -test. Nejsilnˇejˇs´ım testem na intervalu π ∈ h0, 09; 0, 91i je test vyuˇz´ıvaj´ıc´ı statistiku U1 . Pro π do 0, 09, resp. od 0, 91 je v´ yhodnˇejˇs´ı pouˇzit´ı U -testu. Testy pouˇz´ıvaj´ıc´ı statistiky U a U2 se v´ yraznˇe liˇs´ı do bodu π = 0, 16, resp. od bodu π = 0, 84. Je-li n = 15, jak je vidˇet z obr´azku 4.3, v´ ysledky jsou podobn´e pˇredch´azej´ıc´ı situaci. S´ıla v bodˇe π = π0 je pro F-test rovna 0, 0352 a pro U ∗ -test je to 0, 0265, oba testy jsou tedy opˇet podhodnocen´e. U ∗ -test je celkovˇe nejm´enˇe vhodn´ ym testem pro volbu parametru π ∈ h0, 1; 0, 9i. Do bodu π = 0, 1, resp. od bodu π = 0, 9 nab´ yv´a nejniˇzˇs´ıch hodnot silofunkce U2 -testu. Pro vyˇsˇs´ı δ, tj. |δ| ≥ 0, 4 je naopak jednou z nejlepˇs´ıch variant pouˇzit´ı pr´avˇe U ∗ -testu. Nejsilnˇejˇs´ım testem na intervalu π ∈ h0, 15; 0, 85i je test vyuˇz´ıvaj´ıc´ı statisyv´a nejvyˇsˇs´ıch hodnot U -test. tiku U1 . Pro π do 0, 15, resp. od 0, 85 nab´ S rostouc´ım rozsahem v´ ybˇeru n (viz obr´azek 4.4), roste s´ıla U ∗ -testu v bodˇe π = π0 smˇerem k hodnotˇe pˇredepsan´e hladiny α, ovˇsem nikdy j´ı nedos´ahne. D´ale tak´e doch´az´ı 42
H : π = π = 0.5, H : π ≠ π , α = 0.05, n = 15 0
0
1
0
1 F−test U−test U*−test U −test
0.9 0.8
1
0.7
U −test 2
β( δ )
0.6 0.5 0.4 0.3 0.2 0.1 0 −0.5
−0.4
−0.3
−0.2
−0.1
0 0.1 δ=π−π0
0.2
0.3
0.4
0.5
Obr. 4.3: Srovn´an´ı test˚ u pro π0 = 0, 5 a n = 15 H : π = π = 0.5, H : π ≠ π , α = 0.05, n = 50 0
1
H : π = π = 0.5, H : π ≠ π , α = 0.05, n = 90
0
0
1
0.9
0.9
0.8
0.8
0.7
0.7
0.6
0.6 β( δ )
β( δ )
0
1
0.5 0.4
0
1
0
0.5 0.4
0.3 0.2
F−test U−test U*−test U −test
0.3
U −test
0.1
0.2
1
1
0.1
F−test U−test U*−test U −test U2−test
2
0 −0.4
−0.3
−0.2
−0.1
0 δ=π−π
0.1
0.2
0.3
0 −0.3
0.4
0
−0.2
−0.1
0 δ=π−π
0.1
0.2
0
Obr. 4.4: Srovn´an´ı test˚ u pro π0 = 0, 5 a n = 50, 90 k z´ uˇzen´ı intervalu pro volbu parametru π, pro nˇejˇz je nejsilnˇejˇs´ım testem U1 -test, z´aroveˇ n k z´ uˇzen´ı intervalu, na nˇemˇz je nevhodn´e pouˇz´ıt testovac´ı statistiku U ∗ . Rozd´ıly mezi testy U , U1 a U2 se v´ıcem´enˇe vytr´acej´ı. ubec naj´ıt vhodn´e ˇc´ıslo c1 (viz tabulka 4.2) pro Necht’ π0 = 0, 3. Pak pro n ≤ 10 nelze v˚ F-test. Na obr´azku 4.5 je zn´azornˇeno srovn´an´ı test˚ u pro minim´aln´ı rozsah, tedy n = 11. Jak je patrn´e, silofunkce vˇsech pˇeti test˚ u maj´ı asymetrick´ y tvar, pˇriˇcemˇz nejv´ıce anom´aln´ı ∗ situace nast´av´a pˇri pouˇzit´ı statistiky U pro δ < 0, tj. π < π0 . U ∗ -test je obecnˇe nejslabˇs´ı pro volbu parametru π z intervalu h0; 0, 93i. V bodˇe π = π0 = 0, 3 je s´ıla tohoto testu rovna 0, 0221, pro F-test je β(π0 ) = 0, 0414, testy jsou tedy podhodnocen´e. Od bodu π = 0, 93 dosahuje nejniˇzˇs´ıch hodnot silofunkce U2 -testu. Jako nejsilnˇejˇs´ı test pro π < π0 se chov´a U1 -test, pro π > π0 je pak nejvhodnˇejˇs´ı pouˇz´ıt testovac´ı statistiku U , kterou ovˇsem pro π < π0 nelze doporuˇcit. 43
Tabulka 4.2: Srovn´an´ı hodnot c1 , c2 , β(π0 ) pˇri π0 = 0, 3 n c1 c2 β(π0 )
8 9 10 11 -1 -1 -1 0 6 7 7 7 0,069 0,045 0,039 0,041 H : π = π = 0.3, H : π ≠ π , α = 0.05, n = 11 0
0
1
0
1 0.9 0.8 0.7
β( δ )
0.6 0.5 0.4 F−test U−test U*−test U −test
0.3 0.2
1
0.1 0 −0.3
U −test 2
−0.2
−0.1
0
0.1
0.2 0.3 δ=π−π
0.4
0.5
0.6
0
Obr. 4.5: Srovn´an´ı test˚ u pro π0 = 0, 3 a n = 11 Na obr´azku 4.6 jsou vykresleny silofunkce test˚ u pro volbu n = 15. S´ıla F-testu v bodˇe H : π = π = 0.3, H : π ≠ π , α = 0.05, n = 15 0
0
1
0
1 0.9 0.8 0.7
β( δ )
0.6 0.5 0.4 F−test U−test U*−test U −test
0.3 0.2
1
0.1
U −test 2
0 −0.3
−0.2
−0.1
0
0.1
0.2 0.3 δ=π−π
0.4
0.5
0.6
0
Obr. 4.6: Srovn´an´ı test˚ u pro π0 = 0, 3 a n = 15 π = π0 dosahuje pouze hodnoty 0, 0199, u U ∗ -testu se jedn´a o hodnotu 0, 0249, oba jsou tedy opˇet podhodnocen´e. Zmˇena nast´av´a v tom, ˇze u ´lohu nejslabˇs´ıho testu pˇreb´ır´a na 44
intervalu π ∈ h0, 31; 0, 75i F-test. Stejnˇe jako v pˇredeˇsl´e situaci je nejsilnˇejˇs´ım testem pro yraznˇe U -test. π < π0 U1 -test, pro π > π0 je to v´ S rostouc´ım n (viz obr. 4.7) se vytr´ac´ı asymetrick´e chov´an´ı silofunkc´ı. Zmenˇsuj´ı se rozd´ıly H : π = π = 0.3, H : π ≠ π , α = 0.05, n = 30 0
1
H : π = π = 0.3, H : π ≠ π , α = 0.05, n = 60
0
0
1
0.9
0.9
0.8
0.8
0.7
0.7
0.6
0.6 β( δ )
β( δ )
0
1
0.5 0.4
1
0
0.5 0.4
F−test U−test U*−test U1−test
0.3 0.2 0.1 0 −0.3
0
0.2
1
0.1
U2−test −0.2
−0.1
0
0.1 δ=π−π
0.2
0.3
F−test U−test U*−test U −test
0.3
0 −0.3
0.4
U2−test −0.2
−0.1
0
0 0.1 δ=π−π
0.2
0.3
0
Obr. 4.7: Srovn´an´ı test˚ u pro π0 = 0, 3 a n = 30, 60 mezi U ∗ -testem, F-testem a rovnˇeˇz mezi U1 -testem a U2 -testem. U -test z˚ ust´av´a nad´ale dominantn´ı pro π > π0 . Je-li π0 = 0.1, F-test zam´ıt´a hypot´ezu H0 oboustrannˇe aˇz od n = 36, pro niˇzˇs´ı n v˚ ubec nelze naj´ıt vhodn´a ˇc´ısla c1 (viz tabulka 4.3). Na obr´azku 4.8 je zn´azornˇeno srovn´an´ı silofunkc´ı test˚ u pro n = 36. Tabulka 4.3: Srovn´an´ı hodnot c1 , c2 , β(π0 ) pˇri π0 = 0, 1 n c1 c2 β(π0 )
34 35 36 37 -1 -1 0 0 8 8 8 9 0,045 0,045 0,46 0,030
Pokud chceme prov´adˇet F-test pro π0 = 0.05 je zapotˇreb´ı volit n ≥ 72, nebot’ pro menˇs´ı rozsahy tento test zam´ıt´a pouze jednostrannˇe, pˇriˇcemˇz nelze v˚ ubec naj´ıt vhodn´e c1 (viz tabulka 4.4). Srovn´an´ı silofunkc´ı test˚ u je ilustrov´ano obr´azkem 4.9. Je zapotˇreb´ı poznamenat, ˇze nen´ı vhodn´e prov´adˇet testov´an´ı dan´e hypot´ezy pomoc´ı yˇse doporuˇcen´e rozsahy v´ ybˇeru pro F-test. Testy statistik U , U ∗ , U1 , U2 pro menˇs´ı neˇz v´ totiˇz pro mal´e rozsahy zam´ıtaj´ı pouze jednostrannˇe ˇci asymetricky. Nˇekter´e z nich dokonce vykazuj´ı urˇcit´e dalˇs´ı nedostatky. Konkr´etnˇe silofunkce U -testu pro π0 = 0, 3, n = 5 ubˇehy. Tyto a silofunkce U ∗ -testu pro π0 = 0, 5, n = 5 a π0 = 0, 3, n = 10 maj´ı anom´aln´ı pr˚ 45
H 0 : π = π 0 = 0.1, H 1 : π ≠ π 0, α = 0.05, n = 36 1 0.9 0.8 0.7
β( δ )
0.6 0.5 0.4 F−test U−test U*−test U1−test
0.3 0.2 0.1 0 −0.1
U2−test 0
0.1
0.2 δ=π−π
0.3
0.4
0
Obr. 4.8: Srovn´an´ı test˚ u pro π0 = 0, 1 a n = 36 Tabulka 4.4: Srovn´an´ı hodnot c1 , c2 , β(π0 ) pˇri π0 = 0, 05 n c1 c2 β(π0 )
70 71 72 73 -1 -1 0 0 8 9 9 9 0,051 0,035 0,035 0,034 H : π = π = 0.05, H : π ≠ π , α = 0.05, n = 72 0
0
1
0
1 0.9 0.8 0.7
β( δ )
0.6 0.5 0.4 F−test U−test U*−test U1−test
0.3 0.2 0.1 0 −0.05
U2−test 0.05 δ=π−π0
0.15
Obr. 4.9: Srovn´an´ı test˚ u pro π0 = 0, 05 a n = 72 pˇr´ıklady ilustruj´ı obr´azky 4.10, 4.11 a 4.12. Pˇr´ısluˇsn´e hodnoty jsou uvedeny v tabulk´ach 4.5, 4.6 a 4.7.
46
H : π = π = 0.3, H : π ≠ π , α = 0.05, n = 5 0
0
1
0
1 0.9 0.8 0.7
β( δ )
0.6 0.5 0.4 0.3 0.2 0.1 0
−0.2 −0.1
0
0.1 0.2 0.3 δ=π−π0
0.4
0.5
0.6
Obr. 4.10: Anom´alie u U -testu pro π0 = 0, 3, n = 5 Tabulka 4.5: Anom´alie u U -testu pro π0 = 0, 3, n = 5 0,01 0,03 0,05 0,1 0,15 0,18 0,2 0,0060 0,0422 0,0598 0,0664 0,0578 0,0518 0,0484 H 0 : π = π 0 = 0.5, H 1 : π ≠ π 0, α = 0.05, n = 5 0.2 0.18 0.16 0.14 0.12 β( δ )
π β(π)
0.1 0.08 0.06 0.04 0.02 0 −0.5 −0.4 −0.3 −0.2 −0.1 0 0.1 δ=π−π0
0.2
0.3
0.4
0.5
Obr. 4.11: Anom´alie u U ∗ -testu pro π0 = 0, 5, n = 5
47
Tabulka 4.6: Anom´alie u U ∗ -testu pro π0 = 0, 5, n = 5 π β(π)
0,01 0,015 0,02 0,03 0,04 0,05 0,08 0,1 0,1391 0,1636 0,1760 0,1855 0,1859 0,1826 0,1648 0,1514 H : π = π = 0.3, H : π ≠ π , α = 0.05, n = 10 0
0
1
0
1 0.9 0.8 0.7
β( δ )
0.6 0.5 0.4 0.3 0.2 0.1 0
−0.2 −0.1
0
0.1 0.2 0.3 δ=π−π0
0.4
0.5
0.6
Obr. 4.12: Anom´alie u U ∗ -testu pro π0 = 0, 3, n = 10 Tabulka 4.7: Anom´alie u U ∗ -testu pro π0 = 0, 3, n = 10 π β(π)
0,01 0,02 0,03 0,05 0,1 0,15 0,2 0,3 0,0809 0,1112 0,1176 0,1114 0,0789 0,0516 0,0324 0,0212
48
5
Statistick´ e metody v senzorick´ e anal´ yze
5.1
Vyhodnocen´ı rozliˇ sovac´ıch metod
Senzorick´a data z´ıskan´a pˇri rozliˇsovac´ıch zkouˇsk´ach se vyhodnocuj´ı pomoc´ı test˚ u hypot´ez o parametru π binomick´eho rozdˇelen´ı popsan´ ych v kapitole 3.
5.1.1
P´ arov´ a porovn´ avac´ı zkouˇ ska
Necht’ π je pravdˇepodobnost, ˇze posuzovatel zvol´ı v´ yrobek A jako intenzivnˇejˇs´ı. Pak mˇejme yrobky nelze rozliˇsit, tedy π = 12 , proti oboustrann´e alternativˇe H1 : hypot´ezu H0 : v´ u, z toho nA posuzov´ yrobky jsou rozd´ıln´e, tj. π 6= 12 . Hodnocen´ı provedlo n posuzovatel˚ u se vyslovilo pro vzorek B, tedy n = nA + nB . vatel˚ u oznaˇcilo vzorek A a nB hodnotitel˚ Test lze prov´est za vyuˇzit´ı statistik : 1. F1 = a
nA n − nA + 1
(5.1)
nA + 1 (5.2) n − nA vych´azej´ıc´ıch z (3.16) a (3.17), pˇriˇcemˇz hypot´eza H0 se zam´ıt´a, plat´ı-li na dan´e hladinˇe v´ yznamnosti α ³ ³α´ α´ nebo F2 ≤ Fν3 ,ν4 , F1 ≥ Fν1 ,ν2 1 − 2 2 ¡ ¡ ¢ ¢ kde Fν1 ,ν2 1 − α2 a Fν3 ,ν4 α2 jsou kvantily Fisherova rozdˇelen´ı s ν1 = 2(n − nA + 1), ν2 = 2nA a ν3 = 2(n − nA ), ν4 = 2(nA + 1) stupni volnosti, F2 =
2. U=
2nA − n √ n
(5.3)
zaloˇzen´e na statistice (3.20), pˇriˇcemˇz hypot´eza H0 se zam´ıt´a, plat´ı-li |U | ≥ u1− α2 , kde u1− α2 je kvantil rozdˇelen´ı N (0, 1), 3. U∗ =
|2nA − n| − 1 √ n
dle (3.21), pˇriˇcemˇz hypot´eza H0 se zam´ıt´a, plat´ı-li U ∗ ≥ u1− α2 , kde u1− α2 je kvantil rozdˇelen´ı N (0, 1), 49
(5.4)
4.
à r ! r √ nA 1 U1 = 2 n arcsin − arcsin n 2
(5.5)
odvozen´e z (3.35), H0 se zam´ıt´a, plat´ı-li |U1 | ≥ u1− α2 , kde u1− α2 je kvantil rozdˇelen´ı N (0, 1), 5. U2 =
√
Ã
4n + 2 arcsin
r
8nA + 3 − arcsin 8n + 6
r
4n + 3 8n + 6
!
,
(5.6)
viz (3.36), H0 se zam´ıt´a, plat´ı-li |U2 | ≥ u1− α2 , kde u1− α2 je kvantil rozdˇelen´ı N (0, 1). Diskuze, kdy je kterou z tˇechto uveden´ ych testovac´ıch statistik vhodnˇejˇs´ı pouˇz´ıt, je pops´ana v pˇredeˇsl´e kapitole 4. V pˇr´ıpadˇe jednostrann´eho testu formulujeme k hypot´eze H0 : v´ yrobky nelze rozliˇsit, tj. π = 12 , alternativu H1 : vlastnost v´ yrobku A je intenzivnˇejˇs´ı neˇz u v´ yrobku B, tj. π > 12 . Jako testovac´ı kriterium se pouˇzije (5.1), H0 se zam´ıt´a, pokud F ≥ F1−α (ν1 , ν2 ) , kde F1−α (ν1 , ν2 ) je kvantil Fisherova rozdˇelen´ı s ν1 = 2(n − nA + 1) a ν2 = 2nA stupni volnosti. Je moˇzno pouˇz´ıt tak´e statistiku U∗ =
2nA − n − 1 √ , n
(5.7)
hypot´eza H0 se zam´ıt´a, plat´ı-li U ∗ ≥ u1−α , kde u1−α je kvantil rozdˇelen´ı N (0, 1). D´ale se vyuˇz´ıvaj´ı statistiky (5.3), (5.5) a (5.6), pomoc´ı nichˇz se test vyhodnot´ı stejnˇe jako v pˇr´ıpadˇe (5.7).
5.1.2
Zkouˇ ska duo-trio
Test pro zkouˇsku duo-trio se formuluje obdobnˇe jako v odstavci 5.1.1. Pro vyhodnocen´ı se pouˇzij´ı testovac´ı statistiky stejn´e jako u jednostrann´eho testu pˇri p´arov´e porovn´avac´ı zkouˇsce. Zde se ovˇsem jedn´a o jednostrann´ y test pouze z technick´eho hlediska, v´ ysledkem nen´ı urˇcen´ı smˇeru rozd´ılnosti, ale pouze jej´ı existence. 50
5.1.3
Troj´ uheln´ıkov´ a zkouˇ ska
Necht’ π je pravdˇepodobnost, ˇze posuzovatel zvol´ı vzorek A jako odliˇsn´ y od ostatn´ıch. Protoˇze se jedn´a o volbu jednoho vzorku ze tˇr´ı, pravdˇepodobnost spr´avn´e kombinace je π = 13 . Mˇejme tedy hypot´ezu H0 : v´ yrobky nelze rozliˇsit, tj. π = 13 , proti oboustrann´e yrobky jsou rozd´ıln´e, tj. π > 13 . Hodnocen´ı provedlo n posuzovatel˚ u, alternativˇe H1 : v´ u rozpoznalo spr´avnou kombinaci. Rozd´ıl ve sledovan´e vlastnosti z toho nA posuzovatel˚ bude zˇrejm´ y, pokud spr´avnou kombinaci uvede v´ıce neˇz tˇretina posuzovatel˚ u, tj. nA > n2B , za platnosti n = nA + nB . Jako testov´e kriterium vyuˇzijeme statistiky 1. F =
2nA n − nA + 1
(5.8)
yznamnosti odvozenou z (3.16), pak se hypot´eza H0 zam´ıt´a, plat´ı-li na dan´e hladinˇe v´ α F1 ≥ F1−α (ν1 , ν2 ) , kde F1−α (ν1 , ν2 ) je kvantil Fisherova rozdˇelen´ı s ν1 = 2(n − nA + 1), ν2 = 2nA stupni volnosti. 2. U=
3nA − n √ , 2n
(5.9)
viz (3.20), pˇriˇcemˇz hypot´eza H0 se zam´ıt´a, plat´ı-li U ≥ u1−α , kde u1−α je kvantil rozdˇelen´ı N (0, 1), 3. U∗ =
6nA − 2n − 3 √ 8n
(5.10)
dle (3.21), hypot´eza H0 se zam´ıt´a, plat´ı-li U ∗ ≥ u1−α , kde u1−α je kvantil rozdˇelen´ı N (0, 1), 4.
à r ! r √ nA 1 U1 = 2 n arcsin − arcsin n 3 odvozen´e z (3.35), hypot´eza H0 se opˇet zam´ıt´a, plat´ı-li U1 ≥ u1−α , kde u1−α je kvantil rozdˇelen´ı N (0, 1),
51
(5.11)
5. U2 =
√
4n + 2 arcsin
r
8nA + 3 − arcsin 8n + 6
s
z´ıskan´e z (3.36), pˇriˇcemˇz hypot´eza H0 se zam´ıt´a, plat´ı-li
n+3 8n + 6
8 3
(5.12)
U2 ≥ u1−α , kde u1−α je kvantil rozdˇelen´ı N (0, 1), Pomoc´ı tˇechto jednostrann´ ych test˚ u stejnˇe jako u zkouˇsky duo-trio pouze odhadujeme, zda se v´ yrobky liˇs´ı ˇci nikoli, ale nelze takto zjistit smˇer rozd´ılu. Pro tento u ´ˇcel je vhodn´e vyuˇzit´ı p´arov´e porovn´avac´ı zkouˇsky. Vhodnost pouˇzit´ı test˚ u je diskutov´ana v kapitole 4.
5.2
Vyhodnocen´ı poˇ radov´ ych metod
Poˇradov´a zkouˇska se nejˇcastˇeji vyhodnocuje Friedmanov´ ym testem. Poˇrad´ı vzork˚ u od jednotliv´ ych hodnotitel˚ u se zap´ıˇsou do tabulky a n´aslednˇe se spoˇc´ıtaj´ı souˇcty poˇrad´ı yznamn´e rozd´ıly ve slejednotliv´ ych vzork˚ u. Mˇejme hypot´ezu H0 : mezi vzorky nejsou v´ ymi vzorky je alespoˇ n jeden, kter´ y se dovan´em znaku, proti alternativˇe H1 : mezi zkouman´ yt souˇcty poˇrad´ı teoreticky stejn´e. od jin´eho ˇci jin´ ych odliˇsuje. Pokud plat´ı H1 , mˇely by b´ Jako testov´e kriterium se pouˇzije veliˇcina R
X 12 FR = Ti2 − 3n(R + 1) , n R(R + 1) i=1
(5.13)
ych vzork˚ u kde n je poˇcet hodnotitel˚ u, R poˇcet vzork˚ u a Ti jsou souˇcty poˇrad´ı jednotliv´ pro i = 1, 2, . . . , R. Testovan´a hypot´eza se zam´ıt´a, pokud pro dan´e α plat´ı F R ≥ Q1−α (R, n) , pˇriˇcemˇz Q1−α (R, n) jsou kritick´e hodnoty tabelovan´e pro α = 0, 05 a 0, 01, 3 ≤ n ≤ 16, 3 ≤ R ≤ 10 (viz [11]). Pro vyˇsˇs´ı poˇcet posuzovatel˚ u ˇci vzork˚ u (pro R ≥ 5, n ≥ 5) je 2 pˇrijateln´a aproximace testovac´ı statistiky Pearsonov´ ym χ rozdˇelen´ım s (R − 1) stupni volnosti. Hypot´eza H0 se pak zam´ıt´a, pokud pro dan´e α plat´ı F R ≥ χ21−α (R − 1) , kde χ21−α (R − 1) jsou kvantily Pearsonova χ2 rozdˇelen´ı s (R − 1) stupni volnosti. Zam´ıtne-li se dan´a hypot´eza, je vhodn´e zjistit, kter´e jednotliv´e vzorky se od sebe liˇs´ı. K tomuto u ´ˇcelu slouˇz´ı N´emenyiho metoda v´ıcen´asobn´eho p´arov´eho porovn´av´an´ı z´avisl´ ych v´ ybˇer˚ u. Jedn´a se o oboustrann´ y test, lze tedy stanovit rozd´ılnost mezi vzorky jako takovou, ale nikoli jej´ı smˇer. Metoda v´ ych´az´ı znovu ze souˇct˚ u poˇrad´ı. Rozd´ıl mezi i-t´ ym a j-t´ ym vzorkem pak je se 100(1 − α)% spolehlivost´ı v´ yznamn´ y, plat´ı-li |Ti − Tj | ≥ q1−α (R, n) , 52
(5.14)
kde q1−α (R, n) je speci´aln´ı tabelovan´a kritick´a hodnota pro p´arov´a porovn´av´an´ı opˇet pro α = 0, 05 a 0, 01, 3 ≤ n ≤ 16, 3 ≤ R ≤ 10 (viz [11]). V pˇr´ıpadˇe mal´eho rozsahu tabelovan´ ych hodnot lze jiˇz pro R > 5 pouˇz´ıt aproximaci. Hypot´eza se pak pro dan´e α zam´ıt´a, plat´ı-li r n R(R + 1) |Ti − Tj | ≥ g1−α (R) (5.15) 12 u v p˚ uvodn´ı kde g1−α (R) je kritick´a hodnota speci´aln´ı studentizovan´e funkce pro poˇcet vzork˚ R-tici (viz [11], [4])
5.3 5.3.1
Vyhodnocen´ı stupnicov´ ych metod Hodnocen´ı jednoho senzorick´ eho znaku v r´ amci jednoho v´ yrobku
´ Ukolem metod slouˇz´ıc´ıch pro hodnocen´ı jednoho senzorick´eho znaku v r´amci jednoho v´ yrobku je srovn´an´ı pravdˇepodobnost´ı kategori´ı v r´amci dan´e ot´azky. Mˇejme n posuzovatel˚ u hodnot´ıc´ ıch dle stupnice o K kategori´ıch. Relativn´ı ˇcetnost kP nk t´e kategorie je pk = n , kde n = K ı ˇcetnost k-t´e kategorie pro k=1 nk a nk je absolutn´ k = 1, 2, . . . , K. Pˇri hodnocen´ı jednoho znaku chceme ovˇeˇrit, zda se pod´ıl posuzovatel˚ u hovoˇr´ıc´ıch ve prospˇech jedn´e a druh´e kategorie v´ yznamnˇe liˇs´ı. V r´amci jedn´e ot´azky se tedy ’ zjiˇst uje, zda je rozd´ıl mezi absolutn´ımi ˇcetnostmi ni a nj tˇechto dvou kategori´ı statisticky v´ yznamn´ y. Tato u ´loha se opˇet ˇreˇs´ı testem o parametru binomick´eho rozdˇelen´ı. Mˇejme hypot´ezu H0 : kategorie se navz´ajem neliˇs´ı, tj. π = 12 , proti alternativˇe H1 : existuje rozd´ıl mezi i-tou a j-tou kategori´ı, tj. π 6= 12 . Hypot´eza H0 se zam´ıt´a, plat´ı-li ni ≥ F1− α2 (ν1 , ν2 ) , nj + 1
(5.16)
kde F1− α2 (ν1 , ν2 ) je kvantil Fisherova rozdˇelen´ı s ν1 = 2(nj + 1) a ν2 = 2ni stupni volnosti. Je-li k dispozici dostateˇcnˇe velk´ y poˇcet hodnotitel˚ u (dle [11] pro ni + nj > 30), lze poˇz´ıt tak´e testovac´ı statistiku n i − nj u= √ . (5.17) ni + nj Hypot´eza se pak zam´ıt´a, plat´ı-li |u| ≥ u1−α/2 , kde u1−α/2 je kvantil rozdˇelen´ı N (0, 1). Je-li pˇredmˇetem z´ajmu prok´az´an´ı, zda pod´ıl posuzovatel˚ u hovoˇr´ıc´ıch ve prospˇech i-t´e kategorie v´ yznamnˇe pˇrevyˇsuje pod´ıl hodnotitel˚ u stavˇej´ıc´ıch se ve prospˇech j-t´e kategorie, aplikuje se jednostrann´ y test. V pˇr´ıpadˇe, ˇze potˇrebujeme rozˇs´ıˇrit srovn´av´an´ı na L kategori´ı, vyuˇzijeme test o shodˇe pravdˇepodobnost´ı L kategori´ı, L ≤ K. Tento test je moˇzn´e prov´est, plat´ı-li n1 + n2 + . . . + nL > 30(viz [11]). Mˇejme hypot´ezu H0 : kategorie jsou shodn´e, tj. π1 = π2 = · · · = πL , 53
proti alternativˇe H1 : alespoˇ n jedna kategorie se od dalˇs´ı liˇs´ı, tj. πi 6= πj pro libovoln´e i 6= j. Pak pro test vyuˇzijeme statistiku 2
χ =
L X (nk − nπk )2
nπk
k=1
.
Protoˇze pro H0 plat´ı πk = L1 , k = 1, . . . , L, lze testovac´ı kriterium zapsat jako P L L Lk=1 n2k X χ = PL − nk . n k k=1 k=1 2
(5.18)
Hypot´eza se zam´ıt´a na dan´e hladinˇe v´ yznamnosti α, plat´ı-li χ2 ≥ χ21−α (L − 1) , kde χ21−α (L − 1) je kvantil Pearsonova rozdˇelen´ı s (L − 1) stupni volnosti. K dalˇs´ım metod´am slouˇz´ıc´ım k vyhodnocen´ı jednoho senzorick´eho znaku u jednoho v´ yrobku patˇr´ı tak´e metoda odhadu intervalu spolehlivosti tzv. m´ıry asymetrie pro ordin´aln´ı znak. Pˇredpokl´ad´a se vˇetˇs´ı poˇcet posuzovatel˚ u (n ≥ 30) a stupnice o lich´em poˇctu kategori´ı. Uprostˇred stupnice se nach´az´ı tzv. neutr´aln´ı kategorie. Vˇsechna hodnocen´ı se roztˇr´ıd´ı do tˇr´ı kategori´ı. Do prvn´ı kategorie oznaˇcen´e symbolem − se zaˇrad´ı v´ yrobky oznaˇcovan´e jako horˇs´ı, ˇci m´enˇe intenzivn´ı neˇz stˇredn´ı u ´roveˇ n, do druh´e kategorie oznaˇcen´e symbolem 0 se zaˇrad´ı v´ ysledky odpov´ıdaj´ıc´ı stˇredn´ı u ´rovni a posledn´ı kategorie + zahrne v´ ysledky vyjadˇruj´ıc´ı lepˇs´ı nebo v´ıce intenzivn´ı u ´roveˇ n neˇz stˇredn´ı u ´roveˇ n. Pro tyto kategorie stanov´ıme absolutn´ı a relativn´ı ˇcetnosti, oznaˇc´ıme je postupnˇe n− , n0 , n+ , p− , p0 a p+ . Za pˇredpoklad˚ u n > 30, n+ > 5 a n− > 5, lze stanovit 100(1 − α)% oboustrann´ y interval spolehlivosti ∗ ∗ , αH ) = (a∗ − u1− α2 s∗ , a∗ + u1− α2 s∗ ) , (αD
(5.19)
kde
n + − n− n ∗ je odhad charakteristiky α vyjadˇruj´ıc´ı m´ıru asymetrie (podrobnˇeji viz [11]), r p0 (1 − p0 ) + 4p+ p− s∗ = n a∗ =
je odhad smˇerodatn´e chyby odhadu a u1−α/2 je kvantil rozdˇelen´ı N (0, 1).
5.3.2
Srovn´ an´ı senzorick´ eho znaku dvou a v´ıce v´ yrobk˚ u
Je-li potˇreba srovnat mezi sebou ve sledovan´e senzorick´e vlastnosti dva v´ yrobky A a B, pouˇzije se Wilcoxon˚ uv test. Podm´ınkou je, aby pro poˇcet posuzovatel˚ u platilo nA + nB ≥ 20. Ke kaˇzd´emu v´ yrobku se pˇriˇrad´ı n´ahodn´ y v´ ybˇer reprezentovan´ y v´ ysledky posuzovatel˚ u y vzestupnˇe a ze vˇsech jednotek se vytvoˇr´ı sdruˇzen´ y v´ ybˇer o rozsahu n = nA +nB uspoˇr´adan´ 54
podle velikosti. Jednotliv´ ym hodnot´am se pˇriˇrad´ı poˇradov´a ˇc´ısla, stejn´ ym hodnot´am se pˇriˇrad´ı pr˚ umˇern´a poˇradov´a ˇc´ısla. Pro kaˇzd´ y v´ yrobek se pak spoˇc´ıt´a souˇcet poˇrad´ı jednotek pˇr´ısluˇsej´ıc´ıch do j-t´eho v´ ybˇeru a oznaˇc´ı se Tj , j = A, B. D´ale se pouˇzije modifikovan´a testovac´ı statistika s opravou na spojitost uW
Tj − p =
nj (n+1) 2
±
var(sW )
1 2
,
(5.20)
kde nj je poˇcet posuzovatel˚ u j-t´eho v´ yrobku a P 3 nA nB n 3 − K k=1 (nk ) var(sW ) = · , 12 n(n − 1) kde K je poˇcet kategori´ı, nk jsou ˇcetnosti odpov´ıdaj´ıc´ı tzv. celkov´emu zastoupen´ı k-t´e kategorie ve sdruˇzen´em v´ ybˇeru, k = 1, 2, . . . , K. Ve vztahu (5.20) pouˇzijeme + 12 , je-li v´ yraz v ˇcitateli (bez 12 ) z´aporn´ y, a − 12 , kdyˇz je v´ yraz v ˇcitateli kladn´ y. Prov´ad´ıme-li oboustrann´ y test, tj. zaj´ım´a-li n´as, zda maj´ı v´ yrobky odliˇsnou u ´roveˇ n ve sledovan´em znaku, zam´ıtneme hypot´ezu o shodnosti u ´rovn´ı, pokud |uW | ≥ u1− α2 , kde u1− α2 je kvantil rozdˇelen´ı N (0, 1). Pouˇzit´ı jednostrann´eho testu z´avis´ı na typu pˇredloˇzen´e stupnice. Hypot´ezou H0 je tvrzen´ı, ˇze oba v´ yrobky nejsou ve sledovan´em znaku rozd´ıln´e. Pˇredpokl´adejme pouˇzitou ordin´aln´ı stupnici prvn´ıho druhu. Pak alternativa H1 tvrd´ı, ˇze v´ yrobek A je intenzivnˇejˇs´ı nebo lepˇs´ı neˇz v´ yrobek B. Hypot´eza se zam´ıt´a, plat´ı-li uW ≥ u1−α .
(5.21)
′
Pokud bude alternativa H1 tvrdit, ˇze A je m´enˇe intenzivn´ı nebo horˇs´ı neˇz v´ yrobek B, hypot´eza H0 se zam´ıtne, pokud uW ≤ −u1−α . (5.22)
Pˇredpokl´ad´ame-li pouˇzit´ı stupnice druh´eho druhu, pak se pˇri alternativˇe H1 hypot´eza H0 ′ zam´ıt´a pro (5.22) a pˇri alternativˇe H1 zam´ıt´ame H0 , plat´ı-li (5.21).
Pro srovn´an´ı senzorick´eho znaku u v´ıce neˇz dvou v´ yrobk˚ u je vhodnou metodou Kruskal˚ uv-Wallis˚ uv test. Pˇredpokl´adejme, ˇze se hodnot´ı R v´ yrobk˚ u ve sledovan´e vlastnosti a poˇcet posuzovatel˚ u n je alespoˇ n 5. Kaˇzd´emu v´ yrobku se pˇriˇrad´ı n´ahodn´ y v´ ybˇer reprezentovan´ y v´ ysledky posuzovatel˚ u a ze vˇsech jednotek se vytvoˇr´ı sdruˇzen´ y v´ ybˇer o rozsahu n = n1 + n2 + . . . + nR uspoˇr´ad´an´ y vzestupnˇe podle velikosti. Jednotliv´ ym hodnot´am se pˇriˇrad´ı poˇradov´a ˇc´ısla. Pro kaˇzd´ y v´ ybˇer se pak poˇc´ıt´a souˇcet poˇrad´ı jednotek pˇr´ısluˇsej´ıc´ıch do r-t´eho v´ ybˇeru. Mˇejme hypot´ezu H0 : mezi R v´ yrobky nen´ı rozd´ıl v u ´rovni sledovan´eho n jeden v´ yrobek, kter´ y se ve sledovan´e R-tici znaku, proti alternativˇe H1 : existuje alespoˇ vu ´rovni senzorick´eho znaku liˇs´ı od jin´eho ˇci jin´ ych. Pouˇzije se testovac´ı kriterium R
QKW
X T2 12 r = − 3(n + 1) . n(n + 1) r=1 nr 55
(5.23)
Pokud je shodn´ ych pozorov´an´ı ve vˇsech v´ ybˇerech v´ıce neˇz 25%, pak se doporuˇcuje uˇz´ıt korigovan´e testov´e krit´erium QKW Q∗KW = , (5.24) 1 − n3D−n P 3 cet kategori´ı, R je poˇcet v´ yrobk˚ u, nk je poˇcet pozorov´an´ı kde D = K k=1 (nk − nk ), K je poˇ P u v r-t´em v´ ybˇeru, n = R v k-t´e kategorii ve sdruˇzen´em souboru, nr poˇcet posuzovatel˚ r=1 nr je celkov´ y poˇcet posuzovatel˚ u a Tr je souˇcet poˇrad´ı jednotek r-t´eho v´ ybˇeru. Hypot´eza se pˇri dan´e hladinˇe α zam´ıt´a, pokud plat´ı Q∗KW ≥ χ21−α (R − 1) , kde χ21−α (R − 1) je kvantil Pearsonova rozdˇelen´ı s (R − 1) stupni volnosti. Pokud byla na z´akladˇe Kruskalova-Wallisova testu zam´ıtnuta hypot´eza o shodˇe u ´rovn´ı, je vhodn´e pokraˇcovat N´emenyiho metodou v´ıcen´asobn´eho porovn´av´an´ı nez´avisl´ ych v´ ybˇer˚ u pro zjiˇstˇen´ı, kter´e jednotliv´e vzorky v R-tici posuzovan´ ych v´ yrobk˚ u se od sebe liˇs´ı. yrobk˚ u stejn´ y a plat´ı nr ≤ 25, rozd´ıl mezi i-t´ ym Jestiˇze je poˇcet posuzovatel˚ u nr u vˇsech v´ a j-t´ ym v´ yrobkem je v´ yznamn´ y se spolehlivost´ı 100(1 − α)%, plat´ı-li |Ti − Tj | > Q1−α (R, nr ) ,
(5.25)
kde Ti , Tj jsou souˇcty poˇrad´ı jednotek pˇr´ısluˇsej´ıc´ıch i-t´emu, j-t´emu v´ yrobku a R je poˇcet v´ yrobk˚ u zahrnut´ ych v p˚ uvodn´ım Kruskalovˇe-Wallisovˇe testu. Pro nr ≤ 25 a R ≤ 10 jsou kritick´e hodnoty Q1−α (R, nr ) tabelovan´e pro α = 0, 05 a α = 0, 01 (viz [11]). yrobk˚ u stejn´ y, plat´ı nr > 25 a pro poˇcet v´ yrobk˚ u Jestiˇze je poˇcet posuzovatel˚ u nr u vˇsech v´ plat´ı R ≤ 20, rozd´ıl mezi i-t´ ym a j-t´ ym v´ yrobkem je v´ yznamn´ y se spolehlivost´ı 100(1 − α)%, plat´ı-li r R(Rnr + 1) . (5.26) |Ti − Tj | > g1−α (R)nr 12 Kritick´e hodnoty g1−α (R) speci´aln´ı studentizovan´e funkce jsou tabelovan´e pro poˇcet posuzovatel˚ u R ≤ 20 a hladiny v´ yznamnosti α = 0, 05 a α = 0, 01 (viz [11]). Pro nestejn´ y ale dostateˇcn´ y poˇcet posuzovatel˚ u u vˇsech v´ yrobk˚ u je rozd´ıl mezi i-t´ ym a j-t´ ym v´ yrobkem v´ yznamn´ y se spolehlivost´ı 100(1 − α)%, plat´ı-li vztah ¯ s µ ¯ ¶ ¯ Ti Tj ¯ 1 1 1 ¯ − ¯> n(n + 1)χ21−α (R − 1) , + (5.27) ¯ n i nj ¯ 12 ni nj kde χ21−α (R − 1) je kvantil Pearsonova rozdˇelen´ı s (R − 1) stupni volnosti. Vˇsechny uveden´e typy test˚ u Nem´enyiho metody jsou oboustrann´e, tj. lze stanovit pouze rozd´ılnost v u ´rovni jako takovou, a nikoli jej´ı smˇer. Podrobn´ y popis test˚ u pro vyhodnocov´an´ı stupnicov´ ych metod obsahuje napˇr. [2], [8].
56
6
Software pro zpracov´ an´ı senzorick´ ych dat
V r´amci diplomov´e pr´ace byl na z´akladˇe v´ yˇse uveden´ ych teoretick´ ych z´avislost´ı v programovac´ım jazyce Delphi vytvoˇren uˇzivatelsk´ y software SMSA verze 1.09 (zkratka n´azvu Statistick´e metody v senzorick´e anal´ yze) pro vyhodnocov´an´ı senzorick´ ych dat vybran´ ymi statistick´ ymi metodami. Skl´ad´a se ze dvou modul˚ u: Senzorick´a anal´ yza a Anal´ yza jednorozmˇern´ ych dat. V´ ybˇer mezi sekcemi i n´aslednˇe mezi jednotliv´ ymi testy se prov´ad´ı pomoc´ı roletov´eho menu um´ıstˇen´eho v horn´ı ˇc´asti aplikace. Vˇsechny aktu´aln´ı v´ ysledky vˇcetnˇe vstupn´ıch dat lze ukl´adat ve form´atu .txt v pr˚ ubˇehu testov´an´ı, vykreslen´e grafy lze uloˇzit ve form´atu .bmp.
Obr. 6.1: Software SMSA
6.1
Senzorick´ a anal´ yza
Tento modul obsahuje prostˇredky k vyhodnocen´ı rozliˇsovac´ıch, poˇradov´ ych a stupnicov´ ych senzorick´ ych metod dle kapitoly 5, pˇriˇcemˇz je pˇresnˇe zachov´ano v´ yˇse uveden´e n´azvoslov´ı a oznaˇcen´ı promˇenn´ ych. 57
6.1.1
Rozliˇ sovac´ı zkouˇ sky
Po zvolen´ı jedn´e z rozliˇsovac´ıch zkouˇsek z menu (viz obr´azek 6.2) lze vybrat konkr´etn´ı test, podle kter´eho se z´ıskan´a senzorick´a data vyhodnot´ı. Na obr´azku 6.3 je moˇzno vidˇet uk´azku
Obr. 6.2: Roletov´e menu oboustrann´e p´arov´e porovn´avac´ı zkouˇsky. Byla zad´ana vstupn´ı data: hladina v´ yznamnosti α, poˇcet hodnotitel˚ u nA , kteˇr´ı oznaˇcili vorek A, a poˇcet hodnotitel˚ u nB , kteˇr´ı vybrali
Obr. 6.3: Uk´azka rozliˇsovac´ı zkouˇsky vzorek B. Byl zvolen test pomoc´ı statistiky F . Po v´ ypoˇctu se zobrazily zar´ameˇckovan´e 58
v´ ysledky obsahuj´ıc´ı vypoˇcten´e pˇr´ısluˇsn´e statistiky F1 , F2 a kvantily F1− α2 , F 1 , d´ale pak 2 ˇcervenˇe zv´ yraznˇen´ y z´avˇer cel´eho testu. Uˇzivatel m´a moˇznost stisknout tlaˇc´ıtko Anal´ yza silofunkc´ı, ˇc´ımˇz otevˇre nov´e okno, kde se vykresluj´ı silofunkce pro pˇredem zadan´e hodnoty a vybran´e druhy test˚ u (viz obr´azek 6.4). Z´aroveˇ n se vypisuj´ı hodnoty β(δ) v bodˇe δ = 0, tedy π = π0 . Konkr´etnˇe pro poˇradovou
Obr. 6.4: Anal´ yza silofunkc´ı zkouˇsku je v nab´ıdce tak´e tlaˇc´ıtko Volba rozsahu v´ ybˇeru, po jehoˇz stisknut´ı se otevˇre okno, v nˇemˇz lze zadat potˇrebn´e hodnoty pro v´ ypoˇcet minim´aln´ıho rozsahu v´ ybˇeru (ten se prov´ad´ı na z´akladˇe vzorc˚ u uveden´ ych v odstavci 3.9). Pro zadanou hladinu v´ yznamnosti α, hypot´ezu H0 : π = π0 proti alternativˇe H1 = π = π1 se poˇzaduje splnˇen´ı podm´ınky, ˇze pravdˇepodobnopst chyby II. druhu nebude vˇetˇs´ı neˇz β. Dan´a situace je ilustrov´ana na obr´azku 6.5. Ve spodn´ım r´ameˇcku jsou vyps´any spoˇcten´e hodnoty minim´aln´ıho rozsahu v´ ybˇeru n pro jednotliv´e vybran´e testovac´ı statistiky.
6.1.2
Poˇ radov´ e zkouˇ sky
Po zvolen´ı poloˇzky Poˇradov´a zkouˇska, pˇriˇcemˇz na v´ ybˇer jsou obˇe varianty uveden´e v odstavci 5.2, uˇzivatel zad´a poˇcet vzork˚ u a poˇcet hodnotitel˚ u. Pot´e vypln´ı do tabulky jednotliv´a poˇrad´ı z´ıskan´a pˇri senzorick´e zkouˇsce a stiskne tlaˇc´ıtko Vypoˇcti. Zobraz´ı se tabulka s diferencemi mezi vzorky, vypoˇcten´e testovac´ı krit´erium F R, kritick´e hodnoty Q, nebo χ21−α , pro N´emenyiho metodu krit., z´avˇer a tabulka se vzorky, mezi nimiˇz jsou statisticky v´ yznamn´e rozd´ıly (viz obr´azek 6.6).
59
Obr. 6.5: Volba rozsahu testu
Obr. 6.6: Uk´azka poˇradov´e zkouˇsky
60
6.1.3
Stupnicov´ e zkouˇ sky
Vyhodnocen´ı jedn´ e ot´ azky v jednom v´ ybˇ eru Uˇzivatel nejdˇr´ıve zad´a poˇcet kategori´ı pouˇzit´e stupnice, pˇriˇcemˇz maxim´aln´ı poˇcet je 7, pot´e vypln´ı tabulku z´ıskan´ ymi absolutn´ımi ˇcetnostmi a vybere si jeden z test˚ u uveden´ ych v odstavci 5.3.1, tedy Srovn´an´ı relativn´ı ˇcetnosti a teoretick´e pravdˇepodobnosti u jedn´e kategorie, Srovn´an´ı struktury v´ ybˇeru s pˇredpokl´adanou strukturou, Srovn´an´ı dvou kategori´ı - pˇresn´ y test, Srovn´an´ı v´ıce neˇz dvou kategori´ı nebo Vyhodnocen´ı m´ıry asymetrie. Na obr´azku 6.7 je zn´azornˇena prvn´ı situace.
Obr. 6.7: Uk´azka vyhodnocen´ı jedn´e ot´azky v jednom v´ ybˇeru
Srovn´ an´ı v´ ysledk˚ u jedn´ e ot´ azky ve dvou a v´ıce v´ ybˇ erech Zde jsou na v´ ybˇer tyto funkce: Srovn´an´ı dvou nez´avisl´ ych v´ ybˇer˚ u - oboustrann´ y a jednostrann´ y Wilcoxon˚ uv test, Srovn´an´ı tˇr´ı a v´ıce nez´avisl´ ych v´ ybˇer˚ u - Kruskal˚ uv-Wallis˚ uv test. Vyhodnocen´ı se prov´ad´ı dle odstavce 5.3.2. Na obr´azku 6.8 lze vidˇet pˇr´ıklad KruskalovaWallisova testu.
6.2
Anal´ yza jednorozmˇ ern´ ych dat
Sekce Anal´ yza jednorozmˇern´ ych dat je zpracov´ana nad r´amec teoretick´e ˇc´asti t´eto diplomov´e pr´ace, jednotliv´e v´ ypoˇcty jsou zaloˇzeny na vzorc´ıch uveden´ ych v literatuˇre [10], [5]. Tato ˇc´ast aplikace se d´ale dˇel´ı na: Z´akladn´ı zpracov´an´ı dat, Srovn´an´ı souboru s pˇredpokladem, Srovn´an´ı dvou nez´avisl´ ych soubor˚ u a Srovn´an´ı dvou z´avisl´ ych soubor˚ u.
61
Obr. 6.8: Uk´azka srovn´an´ı tˇr´ı a v´ıce nez´avisl´ ych v´ ybˇer˚ u
6.2.1
Z´ akladn´ı zpracov´ an´ı dat
Na z´akladˇe vstupn´ıch dat vyplnˇen´ ych do tabulky je moˇzno jednak ovˇeˇrit normalitu v´ ybˇeru pomoc´ı C-testu (test zaloˇzen´ y na v´ ybˇerov´e ˇsikmosti a v´ ybˇerov´e ˇspiˇcatosti viz [5]) a d´ale pak spoˇc´ıtat tyto z´akladn´ı charakteristiky souboru: rozsah souboru, aritmetick´ y pr˚ umˇer, momentov´ y rozptyl, momentov´a odchylka, v´ ybˇerov´ y rozptyl, v´ ybˇerov´a odchylka, koeficient ˇsikmosti a koeficient ˇspiˇcatosti (viz [5]). Ilustruj´ıc´ı uk´azka je uvedena na obr´azku 6.9.
6.2.2
Srovn´ an´ı souboru s pˇ redpokladem
V t´eto sekci se prov´ad´ı srovn´an´ı hodnot s pˇredpokladem pomoc´ı parametrick´ ych test˚ u a test˚ u pro vyhodnocen´ı nomin´aln´ıho znaku. Testy pro nomin´aln´ı znak se prov´adˇej´ı analogicky jako pˇri vyhodnocov´an´ı jedn´e ot´azky v jednom v´ ybˇeru u stupnicov´ ych metod (5.3.1). Vyuˇzit´ım parametrick´ ych test˚ u m˚ uˇze uˇzivatel srovnat jak rozptyl (test χ2 pro rozptyl souboru viz [10]), tak stˇredn´ı hodnotu souboru s pˇredpokl´adanou konstantou (ttest pˇri zn´am´em rozptylu viz [10]). Na obr´azku 6.10 je uveden pˇr´ıklad srovn´an´ı stˇredn´ı hodnoty s pˇredpokladem.
6.2.3
Srovn´ an´ı dvou nez´ avisl´ ych soubor˚ u
Dva nez´avisl´e soubory se srovn´avaj´ı pomoc´ı parametrick´ ych metod, a to porovn´an´ım bud’ jejich rozptyl˚ u (F -test [10]), nebo jejich stˇredn´ıch hodnot (pˇr´ıklad uveden na obr´azku 6.12). Pˇred hodnocen´ım stˇredn´ıch hodnot soubor˚ u je zapotˇreb´ı zvolit pˇredpoklad heteroskedasticity, nebo homoskedasticity, dle tohoto poˇzadavku se pak zvol´ı pˇr´ısluˇsn´ y test (dvouv´ ybˇerov´e t-testy viz [10]). Je moˇzno tak´e vyuˇz´ıt funkce Ovˇeˇrit shodnost rozptyl˚ u. Dle jej´ıho v´ ysledku se pˇredpoklad automaticky nastav´ı (ilustrov´ano na obr´azku 6.11).
62
Obr. 6.9: Uk´azka z´akladn´ıho zpracov´an´ı dat
Obr. 6.10: Uk´azka srovn´an´ı souboru s pˇredpokladem
63
Obr. 6.11: Uk´azka srovn´an´ı dvou nez´avisl´ ych soubor˚ u - ovˇeˇren´ı homoskedasticity
Obr. 6.12: Uk´azka srovn´an´ı dvou nez´avisl´ ych soubor˚ u - srovn´an´ı stˇredn´ıch hodnot
6.2.4
Srovn´ an´ı dvou z´ avisl´ ych soubor˚ u
Tato sekce vyuˇz´ıv´a opˇet parametrick´e metody. Spoˇc´ıv´a v porovn´an´ı souboru zadan´ ych diferenc´ı s pˇredpokl´adanou nulovou stˇredn´ı hodnotou (t-test pˇri zn´am´em rozptylu [10]). Uk´azku lze vidˇet na obr´azku 6.13. 64
Obr. 6.13: Uk´azka srovn´an´ı dvou z´avisl´ ych soubor˚ u
65
66
7
Pˇ r´ıklad senzorick´ eho experimentu
Byl proveden senzorick´ y experiment, kdy byly 19 laick´ ym hodnotitel˚ um pˇredloˇzeny dotazn´ıky (viz pˇr´ıloha P1) a zak´odovan´e vzorky Eidamsk´e cihly s 30% tuku v suˇsinˇe s r˚ uznou dobou zralosti: • vzorek A zral´ y 3 mˇes´ıce, • vzorek B zral´ y 4 t´ ydny, • vzorek C zral´ y 6 mˇes´ıc˚ u, • vzorek D zral´ y 5 t´ ydn˚ u, • vzorek E zral´ y 2 t´ ydny. C´ılem bylo zjistit, zda je bˇeˇzn´ y spotˇrebitel schopen rozeznat rozd´ıly mezi r˚ uznˇe zral´ ymi s´ yry a zda preferuje produkt s optim´aln´ı zralost´ı, coˇz je doba 2 aˇz 3 mˇes´ıce. V´ ysledky experimentu byly zpracov´any pomoc´ı softwaru SMSA (viz kapitola 6).
7.1
P´ arov´ a porovn´ avac´ı zkouˇ ska
Nejprve byla zaˇrazena p´arov´a porovn´avac´ı zkouˇska, kdy hodnotitel´e odpov´ıdali na tyto ot´azky: 1. Kter´ y ze vzork˚ u A a C preferujete? 2. Kter´ y ze vzork˚ u A a E preferujete? 3. Kter´ y ze vzork˚ u C a E preferujete? Data (tj. ˇcetnosti) z´ıskan´a t´ımto experimentem jsou uvedena v tabulce 7.1. Na z´akladˇe anal´ yzy silofunkc´ı byl pro test hypot´ezy H0 : v´ yrobky se neliˇs´ı, proti alternativˇe H1 : existuj´ı rozd´ıly mezi v´ yrobky v preferenc´ıch, na hladinˇe α = 0, 05 vybr´an jako vhodn´ y test U1 . Tabulka 7.1: Z´ıskan´e ˇcetnosti pro p´arovou porovn´avac´ı zkouˇsku Vzorek Ot´azka A C E 1. 14 5 2. 13 - 6 3. - 12 7
67
Pˇri 1. ot´azce se vyslovilo 14 hodnotitel˚ u z 19 pro vzorek A. Vypoˇcten´a testovac´ı statistika je U1 = 2, 151. Protoˇze |U1 | > u0,975 = 1, 96, mezi vzorky existuj´ı na dan´e hladinˇe v´ yznamnosti statisticky v´ yznamn´e rozd´ıly. Pˇri jednostrann´e zkouˇsce vyˇslo, ˇze U1 = 2, 151 > u0,95 = 1, 645, tedy vzorek A je preferovanˇejˇs´ı neˇz vzorek C. Na ot´azku 2. odpovˇedˇelo 13 hodnotitel˚ u z 19 ve prospˇech vzorku A. V´ ysledkem je yrobky se v´ yznamnˇe neliˇs´ı na pˇredepsan´e hladinˇe |U1 | = 1, 645 < u0,975 = 1, 96, tedy v´ v´ yznamnosti. Pˇri ot´azce 3. vybralo 12 hodnotitel˚ u z 19 jako preferovanˇejˇs´ı vzorek C. Dle v´ ysledku |U1 | = 1, 442 < u0,975 = 1, 96 je zˇrejm´e, ˇze se v´ yrobky v´ yznamnˇe na dan´e hladinˇe neliˇs´ı.
7.2
Poˇ radov´ a zkouˇ ska
Dalˇs´ım u ´kolem v r´amci experimentu byla poˇradov´a zkouˇska preferenc´ı. Hodnotitel´e mˇeli seˇradit vzorky do posloupnosti od nejpreferovanˇejˇs´ıho (poˇradov´e ˇc´ıslo 1) aˇz po nejm´enˇe preferovan´ y (poˇradov´e ˇc´ıslo 5). V´ ysledky hodnotitel˚ u jsou uvedeny v tabulce 7.2. Na hladinˇe v´ yznamnosti α = 0, 05 yry v pˇeti stupn´ıch prozr´alosti jsou v˚ uˇci sobˇe stejnˇe preferse testovala hypot´eza H0 : s´ ovan´e, proti alternativˇe H1 : mezi srovn´avan´ ymi s´ yry je alespoˇ n jeden, kter´ y se v preferenc´ıch liˇs´ı od jin´eho ˇci jin´ ych. Zkouˇska byla vyhodnocena Friedmanov´ ym testem s Pearsonovou aproximac´ı. Testovac´ı statistika vyˇsla F R = 7, 916, kritick´a hodnota χ20,95 (4) = 9, 488. Protoˇze F R < χ20,95 (4), nebyla s 95% spolehlivost´ı dok´az´ana existence statisticky v´ yznamn´ ych rozd´ıl˚ u mezi preferencemi jednotliv´ ych vzork˚ u.
7.3
Hodnocen´ı s pouˇ zit´ım ordin´ aln´ıch stupnic
Nakonec dostali hodnotitel´e za u ´kol posoudit vzhled a barvu vzork˚ u a jejich chut’ a v˚ uni dle pˇredloˇzen´ ych pˇetibodov´ ych stupnic. Pouˇzit´e stupnice byly specifikov´any pˇr´ımo v dotazn´ıku (pˇr´ıloha P1). V´ ysledn´e ˇcetnosti zastoupen´ı vzork˚ u v jednotliv´ ych kategori´ıch pˇri hodnocen´ı vzhledu a barvy jsou uvedeny v tabulce 7.3. Na hladinˇe v´ yznamnosti α = 0, 05 se formulovala hypot´eza H0 : s´ yry v pˇeti stupn´ıch prozr´alosti maj´ı stejn´ y vzhled a barvu, proti alterymi s´ yry je alespoˇ n jeden, kter´ y se ve vzhledu a barvˇe liˇs´ı nativˇe H1 : mezi srovn´avan´ od jin´eho ˇci jin´ ych. Data byla zpracov´ana Kruskalov´ ym-Wallisov´ ym testem na hladinˇe v´ yznamnosti α = 0, 05 pomoc´ı programu SMSA, konkr´etnˇe vyuˇzit´ım funkce Srovn´an´ı tˇr´ı a v´ıce nez´avisl´ ych v´ ybˇer˚ u. Spoˇcten´e testovac´ı krit´erium QKW = 7, 125 je menˇs´ı neˇz kri2 tick´a hodnota χ0,95 (4) = 9, 488, a proto s 95% spolehlivost´ı nebyl shled´an mezi vzorky statisticky v´ yznamn´ y rozd´ıl ve vzhledu a barvˇe. ˇ Cetnosti kategori´ı pro hodnocen´ı chutˇe a v˚ unˇe vzork˚ u jsou uvedeny v tabulce 7.4. yry v pˇeti stupn´ıch Test byl na hladinˇe v´ yznamnosti α = 0, 05 formulov´an jako H0 : s´ ymi s´ yry je alespoˇ n jeden, prozr´alosti maj´ı stejnou chut’ a v˚ uni, H1 : mezi srovn´avan´ kter´ y se v chuti a v˚ uni liˇs´ı od jin´eho ˇci jin´ ych. Tato zkouˇska se vyhodnotila stejn´ ym 68
Tabulka 7.2: Z´ıskan´a poˇrad´ı pro poˇradovou zkouˇsku Hodnotitel 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
Vzorek A B C D 2 3 5 1 4 2 5 1 4 2 5 3 4 2 5 1 4 2 5 1 4 2 5 3 2 3 4 1 2 3 1 4 3 4 1 2 2 3 1 4 2 4 1 3 1 3 4 5 1 4 2 5 1 4 2 3 3 1 4 2 1 5 2 3 3 2 4 1 1 4 2 3 2 3 5 4
E 4 3 1 3 3 1 5 5 5 5 5 2 3 5 5 4 5 5 1
Tabulka 7.3: Z´ıskan´e ˇcetnosti kategori´ı pro stupnicovou zkouˇsku - vzhled a barva Vzorek A B C D E
Kategorie 1. 2. 3. 4. 5. 4 9 5 1 0 2 8 5 4 0 5 3 4 4 3 4 6 7 2 0 2 3 8 5 1
zp˚ usobem jako pˇredeˇsl´a. Bylo vypoˇcteno testovac´ı krit´erium QKW = 10, 772, coˇz je m´enˇe yrobky tedy s 95% spolehlivost´ı existuje statisticky v´ yznamn´ y neˇz χ20,95 (4) = 9, 488. Mezi v´ rozd´ıl. Dle hodnoty krit´eria pro p´arov´e porovn´av´an´ı, kter´e vyˇslo rovno 463, 6, byly urˇceny jako v´ yznamnˇe statisticky rozd´ıln´e v chuti a v˚ uni vzorky A a E.
69
Tabulka 7.4: Z´ıskan´e ˇcetnosti kategori´ı pro stupnicovou zkouˇsku - chut’ a v˚ unˇe Vzorek A B C D E
7.4
Kategorie 1. 2. 3. 4. 7 8 3 1 3 8 7 1 4 3 6 4 3 7 6 3 3 4 4 6
5. 0 0 2 0 2
Shrnut´ı v´ ysledk˚ u senzorick´ eho experimentu
Z v´ ysledk˚ u p´arov´e porovn´avac´ı zkouˇsky plyne z´avˇer, ˇze spotˇrebitel´e d´avaj´ı pˇrednost s´ yru zral´emu 3 mˇes´ıce (vzorek A) pˇred s´ yrem zral´ ym 6 mˇes´ıc˚ u (vzorek C), tj. vol´ı sp´ıˇse s´ yr s optim´aln´ı zralost´ı neˇz s´ yr pˇrezr´al´ y. Rozd´ıly v preferenc´ıch mezi vzorky s´ yru s optim´aln´ı zralost´ı (vzorek A) a s´ yrem nezral´ ym (vzorek E) a mezi vzorky s´ yru pˇrezr´al´eho (vzorek C) a nezral´eho (vzorek E) nejsou statisticky v´ yznamn´e. Bˇehem poˇradov´e zkouˇsky, kdy hodnotitel´e pˇriˇrazovali preference vˇsem vzork˚ um najednou, se ˇz´adn´e statisticky v´ yznamn´e rozd´ıly mezi s´ yry s r˚ uznou dobou zr´an´ı neprok´azaly, a to ani v pˇr´ıpadˇe vzork˚ u A a C. Pˇri hodnocen´ı pomoc´ı stupnic se uk´azalo, ˇze r˚ uzn´ y stupeˇ n prozr´alosti pr˚ ukaznˇe neovlivnil vzhled a barvu jednotliv´ ych s´ yr˚ u. Ovˇsem s 95% spolehlivost´ı doˇslo k ovlivnˇen´ı u chuti a v˚ unˇe. V´ yznamn´e rozd´ıly se prok´azaly u vzork˚ u A a E, konkr´etnˇe chut’ a v˚ unˇe s´ yru s optim´aln´ı zralost´ı byla hodnocena jako lepˇs´ı neˇz s´ yru nezral´eho. Celkov´ y z´avˇer tohoto senzorick´eho experimentu je pozitivn´ı. Laick´ y spotˇrebitel dle srovn´an´ı chut´ı a v˚ un´ı preferuje vzorek s optim´aln´ı prozr´alost´ı nad nezral´ ym vzorkem a z´aroveˇ n, rozhoduje-li se obecnˇe mezi s´ yrem s optim´aln´ı dobou zr´an´ı a pˇrezr´al´ ym s´ yrem, vol´ı opˇet s´ yr optim´alnˇe prozr´al´ y. D˚ uvod, ˇze se bˇehem poˇradov´e zkouˇsky rozd´ıly mezi tˇemito vzorky nepotvrdily, m˚ uˇze spoˇc´ıvat v celkov´e n´aroˇcnosti t´eto zkouˇsky na posuzovatele, zejm´ena pak n´aroky na senzorickou pamˇet’. Tento experiment provedli pouze kr´atce zaˇskolen´ı hodnotitel´e, pˇriˇcemˇz nebyl dodrˇzen jejich minim´aln´ı poˇcet doporuˇcovan´ y v [11] pro poˇradovou zkouˇsku.
70
Z´ avˇ er Vˇsechny pˇredem vytyˇcen´e c´ıle byly v t´eto diplomov´e pr´aci splnˇeny. Bylo vybr´ano pˇet r˚ uzn´ ych test˚ u o parametru π binomick´eho rozdˇelen´ı vhodn´ ych k vyhodnocov´an´ı dat z´ıskan´ ych pˇri senzorick´ ych zkouˇsk´ach. Pozornost byla zamˇeˇrena na rozliˇsovac´ı zkouˇsky senzorick´e anal´ yzy. Byly odvozeny jednotliv´e testovac´ı statistiky. D´ale byly analyticky odvozeny pˇr´ısluˇsn´e silofunkce v pˇresn´ ych i aproximovan´ ych tvarech. N´aslednˇe byly v MATLABu naprogramov´any fukce vykresluj´ıc´ı pr˚ ubˇeh silofunkc´ı z´ıskan´ ych aproximac´ı. Pomoc´ı MATLABu byly tak´e naprogramov´any simulace test˚ u na n´ahodnˇe generovan´ ych v´ ybˇerech z binomick´eho rozdˇelen´ı, jejichˇz v´ ystupem jsou opˇet grafy silofunkc´ı a pˇr´ısluˇsn´e hodnoty. Na z´akladˇe v´ ysledk˚ u tˇechto implementac´ı bylo provedeno srovn´an´ı jednotliv´ ych test˚ u pro r˚ uzn´e volby parametr˚ u. Zejm´ena se podaˇrilo zjistit, ˇze pro urˇcit´e hodnoty parametr˚ u jsou nˇekter´e z test˚ u naprosto nevhodn´e. Jedn´a se hlavnˇe o testov´an´ı pˇri mal´em rozsahu v´ ybˇeru, kdy silofunkce nˇekter´ ych test˚ u maj´ı anom´aln´ı pr˚ ubˇehy. D´ale byly u vybran´ ych test˚ u odvozeny analytick´e vztahy pro v´ ypoˇcet minim´aln´ıho rozsahu v´ ybˇeru pˇri pˇredem zadan´e alternativˇe a poˇzadovan´e s´ıle testu. Tak´e byla pops´ana grafick´a metoda pro zjiˇst’ov´an´ı minim´aln´ıho rozsahu. V´ yznamn´ ym pˇr´ınosem t´eto diplomov´e pr´ace je t´eˇz vytvoˇren´ı uˇzivatelsk´e aplikace nazvan´e SMSA (Statistick´e metody v senzorick´e anal´ yze). Tento software slouˇz´ı k vyhodnocov´an´ı vˇsech popsan´ ych typ˚ u senzorick´ ych zkouˇsek. Jsou v nˇem tak´e zaˇclenˇeny funkce Anal´ yza silofunkc´ı a Volba minim´aln´ıho rozsahu v´ ybˇeru slouˇz´ıc´ı k optim´aln´ımu n´avrhu experimentu a jeho vyhodnocen´ı. Souˇc´ast´ı vyhodnocovac´ıho programu je i sekce pro z´akladn´ı anal´ yzu jednorozmˇern´ ych dat. V r´amci praktick´e aplikace teoretick´ ych znalost´ı byl se skupinou hodnotitel˚ u proveden senzorick´ y experiment, jehoˇz u ´kolem bylo zkoum´an´ı rozd´ıl˚ u mezi vzorky s´ yr˚ u s r˚ uzn´ ymi stupni prozr´alosti. Data z´ıskan´a t´ımto experimentem byla vyhodnocena pomoc´ı softwaru SMSA, ˇc´ımˇz byla ovˇeˇrena jeho praktick´a vyuˇzitelnost.
71
72
Literatura [1] AGRESTI, A.: Analysis of ordinal categorical data. New York: J.Wiley, 1984. [2] AGRESTI, A.: Categorical data analysis. New York: J.Wiley, 1990. ˇ J.: Matematick´ [3] ANDEL, a statistika. Praha: SNTL, 1978. ˇ J.: Statistick´e metody. Praha: Matfyzpress, 1993. [4] ANDEL, ˇ J.: Z´ [5] ANDEL, aklady matematick´e statistiky. Praha: Matfyzpress, 2005. [6] ANSCOMBE, F. J.: The transformation of Poisson, binomial and negatice binomial data. Biometrics 35, 1948. [7] FLEISS, J. L.: Statistical methods for rates and proportions. New York: John Wiley & Sons, 1981. ´ ˇ AK, ´ Z.: Theory of rank tests. Praha: Academia, 1967. [8] HAJEK, J., SID ´ ˇ J.: Z´aklady poˇctu pravdˇepodobnosti a matematick´e statistiky. [9] HATLE, J., LIKES, Praha: SNTL, 1972. [10] KANJI, G. K.: 100 Statistics tests. London: Sage Publications, 2007. ˇ ´IZ, ˇ O., BUNKA, ˇ ˇ J.: Senzorick´a anal´yza potravin II. - Statistick´e [11] KR F., HRABE, metody. Univerzita Tom´aˇse Bati ve Zl´ınˇe, 2007. [12] LEHMANN, E. L.: Testing statistical hypotheses. New York: Springer Verlag, 1997. ˇ J., MACHEK, J.: Matematick´a statistika. Praha: SNTL, 1983. [13] LIKES, ˇ J., LAGA, J.: Z´akladn´ı statistick´e tabulky. Praha: SNTL, 1978. [14] LIKES, ´ [15] MICHALEK, J.: Biometrika. Praha: SPN, 1982. [16] SPRENT, P.: Applied nonparametric statistical methods. New York: Chapman and Hall, 1989.
73
74
Seznam z´ akladn´ıch pouˇ zit´ ych zkratek a symbol˚ u Ω
prostor element´arn´ıch jev˚ u
A
syst´em jev˚ u definovan´ ych na Ω
A
jev
(Ω, A)
jevov´e pole
P (A)
pravdˇepodobnost jevu A
(Ω, A, P )
pravdˇepodobnostn´ı prostor
X, Y
n´ahodn´a veliˇcina
x, y
realizace n´ahodn´e veliˇciny
F (x)
distribuˇcn´ı funkce n´ahodn´e veliˇciny X
p (x)
pravdˇepodobnostn´ı funkce n´ahodn´e veliˇciny X
EX
stˇredn´ı hodnota n´ahodn´e veliˇciny X
DX
rozptyl n´ahodn´e veliˇciny X
Bi(n, π)
binomick´e rozdˇelen´ı
A(π)
alternativn´ı rozdˇelen´ı
Be(p, q)
beta rozdˇelen´ı
B(p, q)
beta funkce
F (ν1 , ν2 )
Fisherovo-Snedecorovo rozdˇelen´ı F
Fν1 , ν2 (x)
distribuˇcn´ı funkce rozdˇelen´ı F
Fα (ν1 , ν2 )
α-kvantil rozdˇelen´ı F
ν1 , ν2
stupnˇe volnosti rozdˇelen´ı F
N (0, 1)
normovan´e norm´aln´ı rozdˇelen´ı
Φ(x)
distribuˇcn´ı funkce normovan´eho norm´aln´ıho rozdˇelen´ı
α
hladina v´ yznamnosti
uα
α-kvantil normovan´eho norm´aln´ıho rozdˇelen´ı
g(x)
transformaˇcn´ı funkce 75
X
n´ahodn´ y v´ ybˇer
θ
parametr
Θ
parametrick´ y prostor
Wα
kritick´ y obor
kα
kritick´a hodnota
β
pravdˇepodobnost chyby II. druhu
βα (θ)
silofunkce testu
hπD , πH i
interval spolehlivosti pro parametr π
⌊x⌋
nejbliˇzˇs´ı niˇzˇs´ı cel´e ˇc´ıslo k ˇc´ıslu x
⌈x⌉
nejbliˇzˇs´ı vyˇsˇs´ı cel´e ˇc´ıslo k ˇc´ıslu x
n
rozsah v´ ybˇeru
π
parametr binomick´eho rozdˇelen´ı
π0
parametr binomick´eho rozdˇelen´ı dan´ y nulovou hypot´ezou
π1
parametr binomick´eho rozdˇelen´ı dan´ y alternativou
δ
rozd´ıl parametr˚ u π1 − π0
F-test
pˇresn´ y test o parametru binomick´eho rozdˇelen´ı
U, U ∗ , U1 , U2
testovac´ı statistiky pro hypot´ezy o parametru π binomick´eho rozdˇelen´ı
FR
testovac´ı statistika Friedmanova testu
uW
testovac´ı statistika Wilcoxonova testu
QK W
testovac´ı statistika Kruskalova-Wallisova testu
χ2α (R − 1)
kvantily Pearsonova χ2 rozdˇelen´ı s R − 1 stupni volnosti
≈
pˇribliˇzn´a rovnost
76
Seznam pˇ r´ıloh P1
Hodnotitelsk´e sch´ema pro Eidamskou cihlu s 30% tuku v suˇsinˇe
P2
Programy pro vykreslov´an´ı teoretick´ ych a simulovan´ ych silofunkc´ı a pro v´ ypoˇcet minim´aln´ıho rozsahu v MATLABu
P3
CD obsahuj´ıc´ı program SMSA.exe, sloˇzku Silofunkce s pˇr´ısluˇsn´ ymi programy v MATLABu a elektronickou podobu diplomov´e pr´ace.
77
Pˇ r´ıloha P1 Hodnotitelsk´ e sch´ ema pro Eidamskou cihlu s 30% tuku v suˇ sinˇ e ˇ Cas:
Datum:
´ Ukol 1 - P´ arov´ a porovn´ avac´ı zkouˇ ska Vzorky A a C Vzorky A a E Vzorky C a E
Kter´ y z pˇredloˇzen´ ych vzork˚ u preferujete? Kter´ y z pˇredloˇzen´ ych vzork˚ u preferujete? Kter´ y z pˇredloˇzen´ ych vzork˚ u preferujete?
......... ......... .........
´ Ukol 2 - Poˇ radov´ a zkouˇ ska Seˇrad’te pˇredloˇzen´e vzorky podle sv´ ych preferenc´ı (1 - vzorek nejpreferovanˇejˇs´ı, 5 - vzorek s nejmenˇs´ı preferenc´ı). Vzorek Poˇrad´ı
A
B
C
D
E
´ Ukol 3 - Hodnocen´ı s pouˇ zit´ım ordin´ aln´ıch stupnic Vzhled a barva 1. Vynikaj´ıc´ı - povrch s´ yra such´ y, hladk´ y, vzhled a tvar s´ yra bez vlis˚ u, nerovnost´ı, barva s´ yrov´eho tˇesta smetanov´a, homogenn´ı na cel´em ˇrezu. 2. V´ yborn´ a - povrch s´ yra such´ y, pˇr´ıp. jemnˇe vlhˇc´ı, neporuˇsen´ y, hladk´ y s nepatrn´ ymi nerovnostmi (vlisy), tvar s´ yra pravideln´ y, barva s´ yrov´eho tˇesta homogenn´ı v cel´e hmotˇe s odst´ınem smetanov´ ym aˇz ˇzlut´ ym. 3. Dobr´ a - povrch s´ yra such´ y, pˇr´ıp. jemnˇe zmrazovatˇel´ y (vlhˇc´ı) na povrchu v d˚ usledku vypocen´eho tuku, resp. vlhkosti, ˇcir´ y, vzhled s´ yra pravideln´ y, pˇripouˇst´ı se menˇs´ı poˇcet patrn´ ych vlis˚ u na povrchu, m´ırn´e odchylky od homogenn´ı smetanov´e, resp. naˇzlourl´e barvy u tˇesta jsou pˇr´ıpustn´e. 4. M´ enˇ e dobr´ a - povrch s´ yra vlhk´ y aˇz mazlav´ y, na povrchu omezen´ y v´ yskyt diz´ıch barevn´ ych skvrn a odst´ın˚ u (skvrnitost), silnˇejˇs´ı vlisy na povrchu, m´ırn´e deformace tvaru s´ yra, barva s´ yra mramorovit´a, nehomogenn´ı, soln´ y prstenes pod povrchem. Barva tˇesta nepˇrirozenˇe b´ıl´a. 5. Nevyhovuj´ıc´ı - povrch a tvar s´ yra deformovan´ y, nepravideln´ y, povrch silnˇe naruˇsen´ y, barva s´ yra netypick´a s ciz´ımi odst´ıny napˇr. po pl´ısni. Barva s´ yrov´eho tˇesta nehomogenn´a, b´ıl´e neprozr´al´e tˇesto, v tˇestˇe siln´a mramorovitost, ciz´ı barevn´e odst´ıny, hnilobn´a hn´ızda. I
Chut’ a v˚ unˇe 1. Vynikaj´ıc´ı - chut’ ˇcist´a, typick´a pro eidamsk´e s´ yry, jemnˇe ml´eˇcnˇe nakysl´a, nebo nasl´adl´a, v´ yrazn´a a pln´a v d˚ usledku hlubok´eho prozr´an´ı s´ yra, harmonicvk´a. V˚ unˇe charakteristick´a, ˇcist´a bez jak´ ychkoliv ciz´ıch pach˚ u. 2. V´ yborn´ a - chut’ ˇcist´a, harmonick´a, ml´eˇcnˇe nakysl´a, nebo slabˇe hoˇrko mandlov´a, st´ale v´ yrazn´a a typick´a v d˚ usledku odpov´ıdaj´ıc´ıho prozr´an´ı s´ yra. V˚ unˇe st´ale ˇcist´a a harmonick´a. 3. Dobr´ a - chut’ a v˚ unˇe ˇcist´a, ml´eˇcn´a, typick´a pro eidamsk´e s´ yry, m´ırn´e odchylky v harmonii a v´ yraznosti jsou pˇr´ıpustn´e, napˇr. hoˇrko mandlov´a, m´ırnˇe slanˇejˇs´ı nebo kyselejˇs´ı. 4. M´ enˇ e dobr´ a - Chut’ neharmonick´a, ale jeˇstˇe pˇrijateln´a. V´ yraznˇeji pˇrevl´ad´a nˇekter´ y z hodnocen´ ych deskriptor˚ u (d´ılˇc´ıch vlastnost´ı) v˚ unˇe a chuti, tj. kyselost, hoˇrkost, ciz´ı pˇr´ıchut’, slanost apod. Ve v˚ uni v´ yraznˇejˇs´ı, ale jeˇstˇe pˇrijateln´e ciz´ı pachy (neˇcist´a, netypick´a, ciz´ı, sladov´a, naˇzlukl´a, nasl´adl´a po duˇren´ı). 5. Nevyhovuj´ıc´ı - hoˇrk´a, p´aliv´a, ostˇre kysel´a, zatuchl´a, plesniv´a, ˇzlukl´a, hnilobn´a, nepˇrijateln´a ciz´ı chut’ po chemik´alii. Ve v˚ uni v´ yrazn´e nepˇrijateln´e ciz´ı pachy, po chemik´alii, hnilobn´a, zatuchl´a, ˇzlukl´a apod. Pˇriˇrad’te z v´ yˇse prezentovan´ ych ordin´aln´ıch stupnic jednotliv´ ym s´ yr˚ um stupeˇ n (kategorii), ’ kter´a dle Vaˇseho n´azoru nejl´epe odpov´ıd´a skuteˇcnosti (do tabulky uved te ˇc´ıslo kategorie).
Vzorek A B C D E
Senzorick´ y znak Vzhled a barva Chut’ a v˚ unˇe
II
Pˇ r´ıloha P2 1
Programy pro vykreslov´ an´ı teoretick´ ych silofunkc´ı v MATLABu
Funkce silaF, silaU, silaUstar, silaU1 a silaU2 se vstupn´ımi parametry α, n, π0 vykresluj´ı teoretick´ y pr˚ ubˇeh a vypisuj´ı spoˇc´ıtan´e hodnoty (dle aproximovan´ ych vztah˚ u) ∗ silofunkc´ı pro F-test, U -test, U -test, U1 -test a U2 -test. Parametr π se zvyˇsuje s krokem k. Vykreslov´an´ı je nyn´ı zakomentov´ano kv˚ uli dalˇs´ımu vyuˇzit´ı tˇechto funkc´ı pˇri srovn´av´an´ı pomoc´ı d´ale uveden´e funkce comAllT. Silofunkce F-testu: function [sila] = silaF(alpha,n,Pi0) Pi = 0; k = 0.01; m =100; sila = zeros(1,m); sila1 = zeros(1,m); sila2 = zeros(1,m); osa = zeros(1,m); c1 = binoinv((alpha/2),n,Pi0)-1; if (c1<0) c1 = 0; end; c2 = binoinv((1-alpha/2),n,Pi0)+1; if (c2>n) c2 = n; end; for i = 1:m for t = c2:n sila1(1,i) = sila1(1,i) + (factorial(n)/(factorial(t)*factorial(n-t)))*Pi∧t*(1-Pi)∧(n-t); end for t = 0:c1 sila2(1,i) = sila2(1,i) + (factorial(n)/(factorial(t)*factorial(n-t)))*Pi∧t*(1-Pi)∧(n-t); end sila(1,i)=sila1(1,i)+sila2(1,i); osa(1,i)=Pi; Pi = Pi+k; end % plot(osa,sila,′ r′ ); % hold % xlabel(′ \pi′ ); % ylabel(′ \beta(\pi)′ );
I
Silofunkce U -testu: function [sila] = silaU(Pi0,n,alpha) Pi = 0; k = 0.01; m = 100; sila = zeros(1,m); osa = zeros(1,m); u = norminv(alpha/2,0,1);% kvantil normovan´ eho norm´ aln´ ıho rozdˇ elen´ ı for i = 1:m X1 = sqrt(n)*((Pi-Pi0)/sqrt(Pi*(1-Pi)))+u*sqrt((Pi0*(1-Pi0))/(Pi*(1-Pi))); X2 = sqrt(n)*((Pi0-Pi)/sqrt(Pi*(1-Pi)))+u*sqrt((Pi0*(1-Pi0))/(Pi*(1-Pi))); sila(1,i) = normcdf(X1,0,1)+normcdf(X2,0,1); osa(1,i) = Pi; Pi = Pi+k; end; % plot(osa,sila,′ r′ ); % hold % xlabel(′ \pi′ ); % ylabel(′ \beta(\pi)′ );
Silofunkce U ∗ -testu: function [sila] = silaUstar(Pi0,n,alpha) Pi = 0; k = 0.01; m = 100; sila = zeros(1,m); osa = zeros(1,m); u = norminv(alpha/2,0,1); for i = 1:m X1 = (n*Pi-n*Pi0-0.5)/sqrt(n*Pi*(1-Pi))+u*sqrt((Pi0*(1-Pi0))/(Pi*(1-Pi))); X2 = (n*Pi0-n*Pi-0.5)/sqrt(n*Pi*(1-Pi))+u*sqrt((Pi0*(1-Pi0))/(Pi*(1-Pi))); sila(1,i) = normcdf(X1,0,1)+normcdf(X2,0,1); osa(1,i) = Pi; Pi = Pi+k; end; % plot(osa,sila,′ r′ ); % hold % xlabel(′ \pi′ ); % ylabel(′ \beta(\pi)′ );
Silofunkce U1 -testu: function [sila] = silaU1(alpha,n,Pi0) Pi = 0; k = 0.01; m = 100; sila = zeros(1,m); osa = zeros(1,m); u = norminv(alpha/2,0,1); II
for i = 1:m X1 = 2*sqrt(n)*(asin(sqrt(Pi))-asin(sqrt(Pi0)))+u; X2 = 2*sqrt(n)*(asin(sqrt(Pi0))-asin(sqrt(Pi)))+u; sila(1,i) = normcdf(X1,0,1)+normcdf(X2,0,1); osa(1,i) = Pi; Pi = Pi+k; end; % plot(osa,sila,′ r′ ); % hold % xlabel(′ \pi′ ); % ylabel(′ \beta(\pi)′ );
Silofunkce U2 -testu: function [sila] = silaU2(alpha,n,Pi0) Pi = 0; k = 0.01; m = 100; sila = zeros(1,m); osa = zeros(1,m); u = norminv(alpha/2,0,1); for i = 1:m X1 = sqrt(4*n+2)*(asin(sqrt((Pi+3/(8*n))/(1+3/(4*n)))) -asin(sqrt((Pi0+3/(8*n))/(1+3/(4*n)))))+u; X2 = sqrt(4*n+2)*(asin(sqrt((Pi0+3/(8*n))/(1+3/(4*n)))) -asin(sqrt((Pi+3/(8*n))/(1+3/(4*n)))))+u; sila(1,i) = normcdf(X1,0,1)+normcdf(X2,0,1); osa(1,i) = Pi; Pi = Pi+k; end; % plot(osa,sila,′ r′ ); % hold % xlabel(′ \pi′ ); % ylabel(′ \beta(\pi)′ );
Srovn´ an´ı teoretick´ ych silofunkc´ı vˇ sech pˇ eti test˚ u: function [betaF,betaN,betaNs,betaU1,betaU2] = comAllT(alpha,Pi0,n) Pi = 0; k=0.01; m = 100; delta = zeros(1,m); for i = 1:m delta(1,i) = Pi-Pi0; Pi = Pi+k; end; betaF = silaF(alpha,n,Pi0); betaN = silaU(Pi0,n,alpha); betaNs = silaUstar(Pi0,n,alpha); betaU1 = silaU1(alpha,n,Pi0); III
betaU2 = silaU2(alpha,n,Pi0); plot(delta,betaF,′ g′ ); hold plot(delta,betaN,′ r′ ); plot(delta,betaNs,′ b′ ); plot(delta,betaU1,′ y′ ); plot(delta,betaU2,′ m′ ); legend(′ F-test′ ,′ U-test′ ,′ U*-test′ ,′ U 1-test′ ,′ U 2-test′ ,7); set(gca,′ XTick′ ,delta(1,1):0.1:delta(1,m)); title([′ H 0 : \pi = \pi 0 = ′ ,num2str(Pi0),′ , H 1 : \pi \neq \pi 0, \alpha = ′ ,num2str(alpha),′ , n = ′ ,num2str(n)]); xlabel(′ \delta =\pi - \pi 0′ ); ylabel(′ \beta(\delta )′ );
2
Programy pro simulace test˚ u v MATLABu
Funkce testF, testU, testUstar, testU1 a testU2 maj´ı vstupn´ı parametry Y , N , α, n, π0 , kde Y je n´ahodn´ y v´ ybˇer a N je celkov´ y poˇcet opakov´an´ı simulace. Tyto funkce prov´adˇej´ı jednotliv´e simulovan´e testy a vrac´ı hodnoty silofunkce (v´ ystupn´ı promˇenn´a beta). Funkce comAllS pak na z´akladˇe tˇechto hodnot vykresluje simulovan´e silofunkce vˇsech pˇeti test˚ u do jednoho obr´azku pro zadan´e α, n a π0 . Simulace F-testu: function beta = testF(Y,n,Pi0,N,alpha) D = zeros(1,N); H = zeros(1,N); Y = Y′ ; F1 = finv(1-alpha/2,2.*(n-Y+1),2.*Y); F2 = finv(1-alpha/2,2.*(Y+1),2.*(n-Y)); for i = 1:N if (Y(1,i) == 0) D(1,i) = 0; else D(1,i) = Y(1,i)./(Y(1,i)+(n-Y(1,i)+1).*F1(1,i)); end; if (Y(1,i) == n) H(1,i) = 1; else H(1,i) = ((Y(1,i)+1).*F2(1,i))./(n-Y(1,i)+(Y(1,i)+1).*F2(1,i)); end; end; s1 = length(find(Pi0
H)); M = s1+s2; beta = M/N ; IV
Simulace U -testu: function beta = testU(Y,u,n,Pi0,N) U = (Y-n*Pi0)./sqrt(n*Pi0*(1-Pi0)); absU = abs(U); M = length(find(absU>=u)); beta = M/N; Simulace U ∗ -testu: function beta = testUstar(Y,u,n,Pi0,N) U = (abs(Y-n*Pi0)-0.5)./sqrt(n*Pi0*(1-Pi0)); M = length(find(U>=u)); beta = M/N; Simulace U1 -testu: function beta = testU1(Y,u,n,Pi0,N) U = 2.*sqrt(n).*(asin(sqrt(Y./(n)))-asin(sqrt(Pi0))); absU = abs(U); M = length(find(absU>=u)); beta = M/N; Simulace U2 -testu: function beta = testU2(Y,u,n,Pi0,N) U =sqrt(4*n+2)*(asin(sqrt((8*Y+3)/(8*n+6)))-asin(sqrt((8*n*Pi0+3)/(8*n+6)))) absU = abs(U); M = length(find(absU>=u)) beta = M/N Srovn´ an´ı simulovan´ ych silofunkc´ı vˇ sech pˇ eti test˚ u: function [betaF,betaN,betaNs,betaU1,betaU2] = comAllS(alpha,Pi0,n) Pi = 0; k=0.01; m = 101; N = 1000; betaF = zeros(1,m); betaN = zeros(1,m); betaNs = zeros(1,m); betaU1 = zeros(1,m); betaU2 = zeros(1,m); delta = zeros(1,m); u = norminv(1-alpha/2,0,1); for i = 1:m Y = binornd(n,Pi,N,1); betaF(1,i) = testF(Y,n,Pi0,N,alpha); betaN(1,i) = testU(Y,u,n,Pi0,N); V
betaNs(1,i) = testUstar(Y,u,n,Pi0,N); betaU1(1,i) = testU1(Y,u,n,Pi0,N); betaU2(1,i) = testU2(Y,u,n,Pi0,N); delta(1,i) = Pi-Pi0; Pi = Pi+0.01; end; plot(delta,betaF,′ r′ ); hold plot(delta,betaN,′ g′ ); plot(delta,betaNs,′ b′ ); plot(delta,betaU1,′ m′ ); plot(delta,betaU2,′ y′ ); legend(′ F-test′ ,′ U-test′ ,′ U*-test′ ,′ U 1-test′ ,′ U 2-test′ ,7); title([′ H 0 : \pi = \pi 0 = ′ ,num2str(Pi0),′ , H 1 : \pi \neq \pi 0, \alpha = ′ ,num2str(alpha),′ , n = ′ ,num2str(n)]); xlabel(′ \delta = \pi - \pi 0′ ); ylabel(′ \beta( \delta )′ );
3
Programy pro v´ ypoˇ cet minim´ aln´ıho rozsahu
Funkce nU, nUstar a nU1 slouˇz´ı k v´ ypoˇctu minim´aln´ıch rozsah˚ u v´ ybˇeru. Vstupn´ımi parametry jsou α, β, π0 a π1 . Minim´ aln´ı rozsah U -testu: function [n] = nU(alpha,beta,Pi,Pi0) uA = norminv(1-alpha/2,0,1); uB = norminv(1-beta,0,1); n = (Pi*(1-Pi)*(uA*sqrt((Pi0*(1-Pi0))/(Pi*(1-Pi)))+uB)∧2)/(Pi-Pi0)∧2; Minim´ aln´ı rozsah U ∗ -testu: function [n1,n2] = nUstar(alpha,beta,Pi,Pi0) uA = norminv(1-alpha/2,0,1); uB = norminv(1-beta,0,1); b = Pi*(1-Pi)*(uA*sqrt((Pi0*(1-Pi0))/(Pi*(1-Pi)))+uB)∧2+abs(Pi-Pi0); D = (b∧2)-(Pi-Pi0)∧2; n1 = (b+sqrt(D))/(2*(Pi-Pi0)∧2); n2 = (b-sqrt(D))/(2*(Pi-Pi0)∧2); Minim´ aln´ı rozsah U1 -testu: function [n] = nU1(alpha,beta,Pi0,Pi) uA = norminv(1-alpha/2,0,1); uB = norminv(1-beta,0,1); n = (uA+uB)∧2/(4*(asin(sqrt(Pi))-asin(sqrt(Pi0)))∧2); VI