I. Valószínűségelméleti és matematikai statisztikai alapok 1. A szükséges valószínűségelméleti és matematikai statisztikai alapismeretek összefoglalása Az alkalmazott statisztikai módszerek tárgyalása, amely e kötet célja, feltételezi a valószínűségszámítás és matematikai statisztika alapvető fogalmainak és módszereinek ismeretét. A témakörnek magyar nyelven is tekintélyes és jól használható szakirodalma van (Vincze I.: Matematikai statisztika ipari alkalmazásokkal, 1975; Prékopa A.: Valószínűségelmélet, 1980; Lukács O.: Matematikai statisztika példatár, 1987; Reimann J., 1992; Rényi A., 1966; Meszéna Gy., Ziermann M.: Valószínűségelmélet és matematikai statisztika, 1981; Kröpfl, B. és mts.: Alkalmazott statisztika, 2000). Ebben és a következő fejezetben ezért csak áttekintjük a szükséges alapokat. Az 1. fejezetben az alapfogalmakról és a gyakran használatos eloszlásokról lesz szó, a 2. fejezet tárgya a statisztikai következtetés, vagyis a hipotézisvizsgálat és a paraméterbecslés. 1.1. Alapfogalmak Véletlen jelenség Ha egy gépről lekerülő termékpéldányok valamely jellemzőjét (pl. a konzervdobozokba töltött paradicsomsűrítmény tömegét) megvizsgáljuk, azt tapasztaljuk, hogy a jellemző értékei különbözőek, és ez az ingadozás elkerülhetetlen. Ugyanígy ingadoznak az egy alkatrész (egy példány) valamely geometriai méretére kapott mérési adatok. Minden jelenséget az okok egy bizonyos rendszere hoz létre. Ha az okok mindegyikét figyelembe tudnánk venni, a jelenség lefolyása azokból egyértelműen levezethető, kiszámítható volna. Ez azonban gyakorlatilag lehetetlen, vagy célszerűtlen, ezért az esetek túlnyomó többségében az ingadozást véletlenszerűnek nevezzük. Sokaság és minta Az egy gépről lekerülő alkatrészek méretadatai, a paradicsomkonzervek tömeg-adatai stb. sokaságot alkotnak. A vizsgálatok célja e sokaság megismerése. Mivel az alapsokaság teljes körű vizsgálatát nem lehet, vagy nem lenne gazdaságos elvégezni, ezért vizsgálatainkat csak az összesség egy kiragadott részére, az ún. mintára korlátozzuk. A minta adatai alapján a matematikai statisztika segítségével következtetünk az alapsokaságra. Véges sokaság elemeinek meghatározása elvileg lehetséges, de esetleg igen nagy munka. A matematikai statisztika alkalmazása ezt szükségtelenné teszi. Végtelen sokaság esetén az egész sokaság elvileg sem mérhető meg. Például gondoljunk egy adott tárgy tömegének meghatározására. A tömegmérés eredménye a tárgy valódi tömegétől a véletlen hibával különbözik. A lehetséges mérési eredmények végtelen sokaságot alkotnak. Ha a tárgyat mérlegre tesszük, s megmérjük a tömegét, ezzel ki12
választottuk a sokaság egy elemét. A mérést többször megismételve véges számú adatot, a mintát kapjuk. Valószínűségi változó Azokat a mennyiségeket, amelyeknek értéke nem állandó, hanem esetről esetre más és más lehet, azonban meghatározható, hogy mekkora valószínűséggel esnek megadott határok közé, valószínűségi változóknak nevezzük. Diszkrét a valószínűségi változó és annak eloszlása, ha egy véges vagy megszámlálhatóan végtelen elemű készletből vehet fel értékeket. Diszkrét valószínűségi változó például az egy műszak alatt gyártott selejtes termékek száma. Lehetséges értékei (0, 1, 2, ..., N) véges sorozatot alkotnak, ahol N az egy műszak alatt gyártott termékek száma. Valamely gyártó gépsor egy műszak alatti üzemzavarainak száma szintén diszkrét valószínűségi változó. Az üzemzavarok lehetséges száma elvileg nem korlátozott, s ha a nagyon nagy számokhoz gyakorlatilag elhanyagolható (igen kicsi) valószínűségeket rendelünk, az üzemzavarok lehetséges száma végtelen sorozatot alkot. Ha a valószínűségi változó a valós számok folytonos sokaságának értékeit veheti fel, folytonos valószínűségi változóról beszélünk. Folytonos valószínűségi változó pl. az acéltermék szakítószilárdsága, vagy a polimer sűrűsége. A diszkrét valószínűségi változó sűrűség- és eloszlásfüggvénye Képzeljük el, hogy egy pénzérmét 10-szer földobunk. Az 1-1a) ábrán látható p(x) sűrűségfüggvény “tűi” az egyes x = k értékeknél annak valószínűségét mutatják, hogy a 10 földobás eredménye éppen k-szor fej: (1.1) p k P x k . 0.28 0.24 0.20
p(x)
0.16 0.12 0.08 0.04 0.00 0
1
2
3
4
5
6
7
8
9
10
x 1-1a) ábra. Diszkrét valószínűségi változó sűrűségfüggvénye A p(x) sűrűségfüggvény tulajdonságai: 13
p xi 0 minden xi helyen;
p x 1 .
(1.2)
i
i
A szummázás az összes xi elemre végzendő. Szokás a kumulált valószínűségeket is ábrázolni, ezt eloszlásfüggvénynek nevezik. Az 1-1b) ábra szerinti F(x) eloszlásfüggvény értéke az x = k helyen azt mutatja, hogy a fej eredményű dobások száma milyen valószínűséggel lesz 10 dobásból legföljebb k:
F k P x k
p x .
(1.3)
i
xi k
Az irodalomban az F k P x k
p x konvenció is előfordul. i
xi k
1.0 0.8
F(x)
0.6 0.4 0.2 0.0 0
1
2
3
4
5
6
7
8
9
10
x
1-1b) ábra. Diszkrét valószínűségi változó eloszlásfüggvénye A folytonos valószínűségi változó sűrűség- és eloszlásfüggvénye Ábrázoljuk a konkrét mintavétel során kapott értékeket olyan derékszögű koordinátarendszerben, amelynek abszcisszáján a valószínűségi változót osztályokba soroltuk.
14
0.5 0.4
rel. gyak
f (x ) 0.3 0.2 0.1 0.0 9.4
9.6
9.8
10.0
10.2
10.4
10.6
x
1-2. ábra. Hisztogram és sűrűségfüggvény A x intervallum az osztály szélessége, xi pedig az osztály közepe, az ún. osztályindex. Az intervallumok mindegyike fölé téglalapot rajzolunk úgy, hogy a téglalapok területe az intervallumokbeli előfordulások relatív gyakoriságával (ni/N), legyen arányos (1-2. ábra). Ez az ún. relatív gyakorisági hisztogram. Ha egyre több mérést végzünk és finomítjuk az osztályszélességet, az f x valószínűség-sűrűségfüggvényt kapjuk, amelyet az ábrán folytonos vonal jelöl. A sűrűségfüggvény értelmezése Annak valószínűsége, hogy az x folytonos valószínűségi változó a és b közötti értéket vegyen föl (1-3. ábra): b
P a x b f x dx .
(1.4)
a
f(x)
a
b
x
1-3. ábra. A folytonos valószínűségi változó sűrűségfüggvényének értelmezése
15
Mivel x folytonos valószínűségi változó, nincs értelme egy-egy érték valószínűségéről beszélni, ugyanis P x x0 0 (bár ez nem lehetetlen esemény). Az f x sűrűségfüggvény tulajdonságai:
f x 0
- x , vagyis f x értéke nem lehet negatív,
f xdx 1 , vagyis az egész görbe alatti terület egységnyi.
Ábrázoljuk a kumulált relatív gyakoriságokat (annak relatív gyakoriságát, hogy a valószínűségi változó xi vagy annál kisebb értékeket vesz fel) x függvényében (1-4. ábra). Itt, ha egyre több mérést végzünk, az eloszlásfüggvényt kapjuk, ezért az előbbi kumulált relatív gyakorisági hisztogramot, ill. adatait tapasztalati eloszlásfüggvénynek is nevezik. Az eloszlásfüggvény a sűrűségfüggvény integrálja (l. az 1-5. ábrát): xi
F xi P x xi
f xdx .
(1.5)
A sűrűség-, ill. eloszlásfüggvény alakjának és paramétereinek ismerete jelenti a sokaság ismeretét. 1.0 0.9
F(x)
0.8
kum.rel.gyak
0.7 0.6 0.5 0.4 0.3 0.2 0.1 0.0 9.4
9.6
9.8
10.0
10.2
10.4
10.6
x
1-4. ábra. Folytonos valószínűségi változó kumulált relatív gyakorisági hisztogramja és eloszlásfüggvénye F(x)
F(xi) xi
x
1-5. ábra. A folytonos valószínűségi változó eloszlásfüggvényének értelmezése 16
Paraméter és statisztika A sokaságra vonatkozó valószínűség-sűrűség-, ill. -eloszlásfüggvény konstansai, ill. ezek származékai (momentumok stb.) a paraméterek. A méréssel (mintavétellel) ezek értékeiről, azaz a sűrűség- és eloszlásfüggvényről akarunk információt szerezni. A paraméterek analogonjai a minta jellemzői vagy más néven statisztikák. A paraméterek a sokaság tulajdonságai, míg a jellemzők (statisztikák) a mintáéi. A legfontosabb paraméterek és statisztikák (jellemzők) Várható érték A várható érték definíciója folytonos valószínűségi változó esetén:
E x
xf xdx ,
(1.6)
ahol f x a sűrűségfüggvény. Diszkrét valószínűségi változóra:
E x xi p xi .
(1.7)
i
A várható érték a sokaság tulajdonsága, tehát paraméter. A mintára a várható értékkel analóg statisztika a számtani átlag: x
1 N
N
x i 1
.
i
(1.8)
A valószínűségi változó függvényének várható értéke Ha (x) az x folytonos valószínűségi változó egyértékű valós függvénye, (x) várható értékén a következő kifejezést értjük:
E x x f x dx .
(1.9)
Ennek alapján könnyen belátható, hogy E cx cE x , és E c c , ahol c konstans. Ha x1, x2,..., xn valószínűségi változók (pl. egy veendő minta elemei), a definícióból belátható, hogy E x1 x2 xn E x1 E x2 E xn .
(1.10)
Medián A medián az az érték, amelynél nagyobbat a valószínűségi változó ugyanolyan valószínűséggel vesz fel, mint kisebbet (1-6. ábra). A mediánt e -vel jelölve ez a következőt jelenti:
F e 0.5 .
(1.11)
A tapasztalati medián a nagyság szerint rendezett mintaelemek közül a középső. Páros mintaelemszám esetén a két középső érték számtani átlaga. 17
0.175 módusz
= 8
0.131
0.087
0.044
e=7.34 0.000 0
5
10
15
20
25
1-6. ábra. Módusz, medián, várható érték Módusz A módusz a valószínűségi változó legnagyobb valószínűségű értéke (a sűrűségfüggvény maximumhelye). Egy eloszlásnak több módusza is lehet. A tapasztalati módusz a legnagyobb gyakoriságú osztály (a hisztogram legmagasabb téglalapjának) osztályindexe. Ha több móduszt találunk, általában több sokaság összekeveredésére gyanakodhatunk. Egycsúcsos szimmetrikus eloszlás esetében a módusz és a medián egybeesik a várható értékkel, aszimmetrikus esetben nem (1-6. ábra). A variancia definíciója Az x folytonos valószínűségi változóra: Var x
x E x f xdx E x
2
2
2
.
(1.12)
Diszkrét valószínűségi változóra:
Var x xi E x p xi E x , 2
2
(1.13)
azaz a várható értéktől való eltérés négyzetének várható értéke. Szokás (a magyar nyelvű szakirodalomban is) a következő jelölés: D2(x). Megjegyzendő, hogy a magyar szakirodalomban a variancia helyett a szórásnégyzet elnevezést használják. Az elméleti és a tapasztalati szórásnégyzet megkülönböztetése végett tartottuk szükségesnek, hogy könyvünkben más kifejezést használjunk. A variancia a sokaság tulajdonsága (ezért paraméter), a sűrűségfüggvény „szélességét” adja meg. A definíció alapján könnyen belátható, hogy
Var cx c 2Var x ,
(1.14)
és független x1 , x2 ,.., xn valószínűségi változókra (mint pl. egy minta elemeire): Var x1 x2 xn Var x1 Var x2 Var xn .
18
(1.15)
A variancia mintabeli analogonja a szórásnégyzet (más néven tapasztalati szórásnégyzet vagy korrigált tapasztalati szórásnégyzet):
s2
1 n 2 xi x . n 1 i1
(1.16)
1.2. A legfontosabb diszkrét eloszlások Számos diszkrét eloszlás ismeretes, közülük számunkra most a binomiális és a Poisson-eloszlás a legfontosabbak. A binomiális eloszlás Dobjunk föl egy pénzérmét n-szer. Legyen p annak valószínűsége, hogy egy földobás eredménye fej legyen (ez hibátlan érménél 0.5). Annak valószínűségét, hogy a sorozatban éppen x legyen a fej dobások száma, a következő sűrűségfüggvény adja meg: n n x (1.17) p x p x 1 p . x Általánosabban a binomiális eloszlás akkor használható, ha a vett minta eleme kétféle lehet. A gyártmány- vagy gyártásellenőrzésnél p a sokaságbeli (tételbeli) selejtarány, x az n elemű mintában talált selejtes darabok száma. Szükséges, hogy a mintavétel visszatevéssel történjék, vagyis a k-adik mintaelem ugyanolyan eséllyel legyen selejtes, mint a k+1-edik. Természetesen a gyakorlatban nem szokás a vett mintaelemeket visszatenni, ekkor a binomiális eloszlás csak közelítés, amely n N esetén teljesen jogos. A binomiális eloszlású valószínűségi változó várható értéke és varianciája: (1.18) E x np ,
Var x np1 p .
(1.19)
Ha a talált selejtes darabok száma helyett a mintabeli selejtarányt tekintjük valószínűségi változónak, ennek várható értéke és varianciája: x E p , n
(1.20)
x p1 p Var . (1.21) n n A mintabeli selejtarány is diszkrét valószínűségi változó, bár lehetséges értékei nem egész számok. Például 20 elemű mintában a talált selejtarány lehet 0, 1/20, 2/20 s.i.t.
A Poisson-eloszlás Ritka események eloszlásának modellezésére használható, pl. a ritkán előforduló selejtes darabok tételenkénti száma, a műszakonkénti fonalszakadások száma, az üzemi 19
balesetek száma évente, a festési hibahelyek száma egy autón stb. A minőségbiztosításban elsősorban a termékegységen előforduló hibák eloszlásának modellezésére használják. Annak feltételei, hogy a ritka esemény valamely idő-intervallumbeli, vagy adott egységbeli előfordulásainak száma Poisson-eloszlást kövessen: a) bármely egységben bekövetkező eseménynek függetlennek kell lennie a többi egységbelitől; b) az esemény bekövetkezésének valószínűsége bármely egységben azonos, és arányos az egység méretével; c) annak valószínűsége, hogy két vagy több előfordulás következik be egy egységben, az egység méretének csökkentésével nullához tart. Ha a binomiális eloszlásnál a p paraméter igen kicsi (p0), a mintaelemszám pedig igen nagy (n), de közben az np = szorzat véges konstans ( 0), a valószínűségi változó Poisson-eloszlású lesz. A Poisson-eloszlású valószínűségi változó sűrűségfüggvénye:
e x . x! Várható értéke és varianciája: E x Var x . p x
(1.22)
(1.23)
1.3. A legfontosabb folytonos eloszlás: normális eloszlás A természetben akkor találkozunk normális eloszlással, ha sok, egymástól független, egyenként kis hatású tényező hatása összeadódik. Emiatt a közvetlenül mért, véletlenszerű ingadozásokat mutató adatok (tömeg, hőmérséklet stb.) jó közelítéssel normális vagy Gauss-féle eloszlású sokaságból vett mintának tekinthetők. A Gauss-eloszlás sűrűség- és eloszlásfüggvénye: f x
1 x 2 1 exp , 2 2
(1.24)
1 x 2 1 F xi exp dx . 2 2 A normális eloszlású valószínűségi változó várható értéke és varianciája: xi
E x ,
(1.25)
(1.26)
Var x 2 .
(1.27)
A normális eloszlás szokásos rövid jelölése N(, ), pl. N(0, 1). Ha az eloszlásfüggvény értékeit táblázatba akarnánk foglalni, háromdimenziós táblázatra lenne szükség, mivel F(x) az x változón kívül a és paramétereket is tartalmazza. Célszerű tehát transzformációt keresnünk. 2
20
Normalizált (standardizált) normális eloszlás: u-eloszlás Definiáljuk a következő valószínűségi változót: x . u
(1.28)
Az új valószínűségi változó paraméterei: x E x E u E 0,
(1.29)
1 x Var u Var 2 Var x 1 .
(1.30)
A két paraméter felhasználásával a normalizált (standardizált) normális eloszlás sűrűségfüggvénye:
f u
u2 1 exp . 2 2
(1.31)
Minthogy a sűrűségfüggvényben egyetlen paraméter sem szerepel, a normalizált normális eloszlás eloszlásfüggvényének értékei kisméretű táblázatba foglalhatók (Függelék I. táblázat). E táblázat adatai bármilyen paraméterű normális eloszlásra használhatók a transzformációs képlet alkalmazásával. Annak valószínűsége, hogy a N(, 2) eloszlású x valószínűségi változó nem haladja meg a értékét, a következő integrállal adható meg: P x a F a
a
ahol ua
a
ua 1 x 2 u2 1 1 exp exp du F ua , dx 2 2 2 2 (1.32)
.
A P x a valószínűség értékét az 1-7a) ábrán a vonalkázott terület mutatja. A kettős vízszintes skála szemlélteti a transzformációt. Az 1-7b) ábra az eloszlásfüggvénnyel magyarázza ugyanezt.
21
f(x)
a
x
ua
u
1-7a) ábra. Standardizált normális eloszlású valószínűségi változó sűrűségfüggvénye
F(x)
F(a) a
x
ua
1-7b) ábra. Standardizált normális eloszlású valószínűségi változó és eloszlásfüggvénye Tehát annak valószínűsége, hogy x a , megegyezik annak valószínűségével, hogy a . u ua
1-1. példa Határozzuk meg annak valószínűségét, hogy az x normális eloszlású valószínűségi változó a , intervallumba eső értéket vesz fel!
P x F F Az összefüggést az 1-8a) és b) ábrák szemléltetik.
22
f(x) P(x) P(x - )
-
+
-1
0
1
x
1-8a) ábra. A normális eloszlású valószínűségi változó , intervallumbeli előfordulásának valószínűsége a sűrűségfüggvényen szemléltetve
F( P(- x + )
F(- ) -
+
-1
0
1
x
1-8b) ábra. A normális eloszlású valószínűségi változó , intervallumbeli előfordulásának valószínűsége az eloszlásfüggvényen szemléltetve ufölsõ 1 ualsó 1
A Függelék I. táblázatából F 1 0.84134 . Belátható, hogy mivel f x szimmetrikus függvény és F 1 , F a 1 F a . Így F 1 1 F 1 0.15866 . P x 0.68268 ; P 0.683, azaz a valószínűség 68.3 % .
23
Hasonló számítással adódik: intervallum szélessége P
2
3
0.68268
0.9545
0.9973
1-2. példa Határozzuk meg, hogy egy N , 2 normális eloszlású valószínűségi változó értékei milyen szimmetrikus intervallumban vannak 95 %-os, ill. 99 %-os valószínűséggel! Határozzuk meg először az u normalizált normális eloszlású változó alsó és felső határértékét! Legyen annak valószínűsége, hogy az érték az adott intervallumon kívül esik; szimmetrikus sűrűségfüggvényről lévén szó, /2 annak valószínűsége, hogy balra, ill. jobbra kiesik az intervallumból (1-9. ábra): A Függelék I. táblázatából
0.05
0.01
1-
0.95
0.99
1-/2
0.975
0.995
u
1.96
2.58
f(x)
/2
/2
xa lsó -u/2
0
xfö lsõ -u/2
u
1-9. ábra. Az u-eloszlású valószínűségi változó 1– valószínűségű intervalluma Térjünk vissza az eredeti x valószínűségi változóra és határozzuk meg a kérdéses intervallumot! Tehát xalsó u /2 ; xfölsõ u /2 .
24
xalsó xfölső
0.05 –1.96 +1.96
0.01 –2.58 +2.58
1.4. Eloszlások közelítése Gyakran célszerű – különösen ha nem számítógéppel számolunk – egyes nehezebben számítható vagy kezelhető eloszlásokat másokkal közelíteni. A következőkben bemutatjuk a szokásos közelítéseket, alkalmazásuk feltételeit és módját. (A számítógépek alkalmazásával e közelítések jelentősége csekélyebb.) A binomiális eloszlás közelítése Poisson-eloszlással Ha p kicsiny (p0.1) és n nagy, a = np paraméterű Poisson-eloszlás jó közelítés. Természetesen annál jobb a közelítés, minél nagyobb az n mintaelemszám, és minél kisebb a p paraméter értéke. A binomiális eloszlás közelítése normális eloszlással A normális eloszláshoz annál közelebb van a binomiális eloszlás, minél nagyobb n, 1 n és minél távolabb van p a 0 és 1 szélső értékektől, pontosabban p n 1 n 1 szükséges. A közelítés nem megfelelő a várható érték körüli 3 (vagyis
np 3 np1 p ) intervallumon kívül sem (Montgomery, 1991). Ez azt jelenti, hogy
jó a közelítés a várható érték környékén, de nem alkalmas a várható értéktől való nagy eltérések kis valószínűségének (tehát a sűrűségfüggvény farok-területének) számítására. A közelítés: 1 k np 2 n k 1 n k . P x k p k p 1 p exp (1.33) k 2 np1 p 2 np1 p A Poisson-eloszlás közelítése normális eloszlással Mivel a Poisson-eloszlás közeli rokonságban van a binomiálissal, az utóbbi pedig jól közelíthető a normális eloszlással, kézenfekvő, hogy van a paraméternek olyan tartománya, amelyben a Poisson-eloszlás is jól közelíthető a normális eloszlással. Ez a 10, még biztosabban a 15 tartományban ténylegesen megvalósul: a Poissoneloszlású valószínűségi változó helyettesíthető egy várható értékű és varianciájú normális eloszlással: e x P x k p k x!
x 2 1 exp . 2 2
(1.34)
25
2. A statisztikai következtetés Az 1. fejezetben láttuk, hogy az eloszlás ismeretében képet alkothatunk a folyamat eredményéről, pl. a selejtarányról, vagy arról, milyen valószínűséggel kapunk adott tűréshatárok közötti méretű alkatrészeket. A valóságban a folyamat (az eloszlás) paraméterei ismeretlenek, ezért a matematikai statisztika módszereivel következtetünk a minta statisztikai jellemzőiből a sokaság eloszlásának paramétereire. A következtetésnek két fő módszere van: a becslés és a hipotézisvizsgálat. Ebben a fejezetben e módszereknek a mérési adatok feldolgozása és a minőségszabályozás szempontjából elsődlegesen fontos vonatkozásait ismertetjük. 2.1. A minta statisztikai jellemzői Ebben az alfejezetben áttekintjük a véletlen minta statisztikai jellemzőinek eloszlását és a sokaság paramétereivel való kapcsolatukat. A minta akkor hasznosítható statisztikai következtetésre, ha véletlen minta. A véletlenszerűség itt azt jelenti, hogy a mintavétel során nem érvényesítünk szándékosságot, így pl. egy véges sokaság bármely elemének egyforma esélye van arra, hogy kiválasszuk. A véletlen mintából statisztikai jellemzőket számolunk ki (pl. átlag, szórásnégyzet, selejtarány), melyeket statisztikáknak is nevezünk. Ha ismerjük a sokaság eloszlását (az eloszlás típusát és paramétereit), megkaphatjuk a mintabeli jellemzők eloszlását is. Általában célszerű az adatokat ábrázolni, mert rögtön képet alkothatunk az eloszlás jellegéről. A vizuális benyomás sugallja az elvégzendő statisztikai vizsgálatokat is.
26
Max = 63 Min = 37 75% = 54.6 25% = 44.8 Median = 50.1
70
70
65
65
60
60
55
55
50
50
45
45
40
40
35
35
30
30 0%
5%
10%
15%
20%
25%
30%
rel. g y ak .
a) b) 2-1. ábra. a) Dobozos ábra és b) hisztogram szimmetrikus eloszlásból vett mintára A mintabeli adatatok grafikus megjelenítésének egyik elterjedt módja a dobozos ábra (box-plot ill. box-and-whisker plot). A 2-1a) ábrán 51 elemű minta dobozos ábráját mutatjuk be, a mellette lévő 2-1b) ábrán pedig ugyanennek a mintának a gyakorisági hisztogamját láthatjuk. A 2-1a) ábrán a vízszintes vonalak a szélső értékekig tartanak, ha nincs kiugró érték. A dobozban lévő négyzet a tapasztalati medián (aminél kisebb és nagyobb értékeket egyforma gyakorisággal vesz föl a változó, az ábrán értéke 50.1). A minimum és a doboz alsó vonala által határolt intervallumban (37; 44.8) van az adatok 25%-a (alsó kvartilis: Q1). Ugyancsak az adatok 25%-a található a doboz fölső vonala és a maximális érték közötti tartományban (54.6; 63, fölső kvartilis: Q3). A bemutatott ábrázolás jól használható tetszőleges eloszlású sokaságból vett minta ábrázolására, mivel az ilyen ábrázolásnál könnyen észlelhető az eloszlás esetleges aszimmetriája is. Erre látunk példát a 2-2a) ábrán, a 2-2b) ábra pedig a mintabeli adatok relatív gyakorisági hisztogramját mutatja.
27
20
20
Max = 15 Min = 0.
18
18
75% = 7.6 25% = 2.0
16
16
14
14
12
12
10
10
8
8
6
6
4
4
2
2
0
0
Median = 4.4
kiesõ
0%
5%
10%
15%
20%
25%
rel. g y ak .
a) b) 2-2. ábra. a) Dobozos ábra és b) hisztogram aszimmetrikus eloszlásból vett mintára A dobozos ábrák egyszerűen elkészíthetők, a hisztogramokkal ellentétben viszonylag kis elemszámú mintára is használhatók. 2.1.1. A számtani középérték A számtani középérték definíciója Képzeljünk el egy tetszőleges eloszlású sokaságból vett n elemű mintát! Elemeinek számtani középértéke: 1 1 (2.1) x x1 x2 ... xn xi , n n ahol x1 , x2 , ..., xn a valószínűségi változók, a minta elemei; x természetesen maga is valószínűségi változó. Mivel a minta elemei ugyanazon alapsokaságból származnak, várható értékük ill. varianciájuk azonos. A számtani közép várható értéke: 1 1 (2.2) E x E x1 E x2 E xn nE x E x . n n A számtani középérték varianciája:
Var x
28
1 1 Var x . 2 Var x1 +Var x 2 Var x n 2 nVar x n n n
(2.3)
Látható, hogy a számtani közép várható értéke azonos a minta egy elemének várható értékével, varianciája pedig az egy elem varianciájának n-ed része, bármiféle eloszlású sokaságból vett mintáról legyen is szó. 2-1. példa Ha egy = 10 várható értékű és 2 0. 25 varianciájú sokaságból n = 5 elemű mintát veszünk, milyen intervallumban lesz a mintaelemek átlaga 95% valószínűséggel? Hogyan viszonylik ez a tartomány ahhoz az intervallumhoz, amelyben a mintaelemek 95% valószínűséggel vesznek föl értékeket?
P u / 2 / n x u / 2 / n 1
A Függelék I. táblázatából = 0.05 valószínűséghez u / 2 196 . .
P 10 196 . 0.5 / 5 x 10 196 . 0.5 / 5 P 9.56 x 10.44 0.95 ,
vagyis az átlag a véletlen ingadozás következtében 9.56 és 10.44 közötti értékeket vesz föl 95% valószínűséggel. Az egyedi értékekre a 95% valószínűségű intervallum: P10 196 . 05 . x 10 196 . 05 . 0.95 , P 9.02 x 10.98 0.95 . 2.0
átlag 1.6
f(x)
átlag fölsõ
átlag alsó
1.2
xals ó 0.8
xföls õ
0.4
egyedi
0.0 8.0
8.5
9.0
9.5
10.0
10.5
11.0
11.5
12.0
x 2-3. ábra. Egyedi érték és átlagérték sűrűségfüggvénye és 95%-os valószínűséghez tartozó intervalluma Az egyedi értékekre az ingadozás intervalluma jóval szélesebb. A 2-3. ábra mutatja normális eloszlás esetén az egyetlen mintaelem és az ötelemű minta átlagának sűrűségfüggvényét. 2.1.2. A centrális határeloszlási tétel Bármilyen eloszlású sokaságból vett minták számtani középértéke közelítőleg normális eloszlást követ az eredeti eloszlás várható értéke körül, varianciájuk pedig
29
x- n N(0, 1) eloszlású. Ha az eredeti eloszlás szimmetrikus, már négy elemű mintára is jó a közelítés, és általánosan egyre javul a mintaelemszám növekedésével. /n. Tehát az x N , 2 n eloszlású valószínűségi változó, vagyis az u=
2.1.3. A normális eloszlású minta szórásnégyzetének eloszlása: 2- (khi-négyzet-) eloszlás Vegyünk egy N , 2 normális eloszlású sokaságból n elemű mintát: x1, x2, ..., xn! x Ezekből az u= normalizált normális eloszlású [N(0, 1)] valószínűségi válto-
zók képezhetők. A 2 -eloszlású valószínűségi változót a következőképpen kapjuk: n
2 u12 u22 un2 ui2 .
(2.4)
i 1
A négyzetösszeg szabadsági fokán az (u1, u2,..., un) lineáris rendszer szabadsági fokát értjük. A lineáris rendszer szabadsági fokát megkapjuk, ha a változók számából levonjuk a köztük lévő lineáris összefüggések számát. Mivel itt a tagok egymástól függetlenek, az összeadandók száma (n) megegyezik a szabadsági fokkal. Az eloszlás sűrűségfüggvénye csak a paramétert tartalmazza: f 2 , rajza a 2-4. ábrán látható. 0.20
f(2 0.15
0.10
0.05
0.00 0
5
10
15
20
25
2
2-4. ábra. A -eloszlás sűrűségfüggvénye különböző szabadsági fokhoz 2
A Függelék II. táblázatában a különféle valószínűségekhez és szabadsági fokhoz tartozó 2 kritikus értékek vannak feltüntetve. A 2 -eloszlású valószínűségi változó várható értéke:
2 2 2 E E ui E ui E ui 0 Var ui . i 1 i 1 i 1 i 1 2
30
(2.5)
Varianciája: Var 2 2 .
(2.6)
A 2-eloszlás felbontási tétele (Fisher–Cochran-tétel) Legyen fölbontva k számú kifejezés összegére a szabadsági fokú 2-eloszlású négyzetösszeg:
u i 1
Q1 Q2 Q j Qk ,
2 i
(2.7)
ahol a Q j -k (j = 1k) maguk is N(0, 1) eloszlású valószínűségi változók lineáris kifejezéseinek négyzetösszegei j szabadsági fokkal. Ekkor annak szükséges és elégséges feltétele, hogy a Q j négyzetösszegek függetlenek és j paraméterű 2eloszlásúak legyenek az, hogy a Q j négyzetösszegek j szabadsági fokok összege egyenlő legyen a bal oldalon álló négyzetösszeg szabadsági fokával: k
j .
(2.8)
j 1
Például: legyenek az xi valószínűségi változók normális eloszlásúak, várható értékkel és 2 varianciával; ekkor 2 xi 2 (2.9) . i A közös 2 -tel mindkét oldalt szorozva 2 2 eloszlású kifejezést kapunk: n
n
n
2 2 x i x i x x x i x n x , 2
i 1
i 1
2
2
2
(2.10)
i 1
ugyanis n
n
i 1
i 1
2 x i x x 2 x x i x 0 , mert
x i
i
(2.11)
x xi n x 0 . i
A kiindulási négyzetösszeg 2 2 eloszlású n szabadsági fokkal, az algebrai felbontás után kapott Q1 és Q2 kifejezések is 2 2 eloszlásúak lesznek n 1 , ill. 1 szabadsági fokkal és egymástól függetlenek. A Q1 eltérés-négyzetösszeg szabadsági foka azért n 1 , mert n számú összeadandót tartalmaz ugyan, de ezek közül csak n 1 független, ugyanis
x
x i
n
i
,
31
ezért az x1 x x 2 x x n x 0 összefüggés érvényes közöttük. Ne higgyük, hogy a felbonthatóság feltétele mindig teljesül! Például a következő felbontás esetén nem: n
x i 1
2
i
n 1
x i x x n x n x . 2
2
2
i 1
1 n 1,
2 1,
3 1
Az első négyzetösszeg szabadsági foka azért n 1 , mert n 1 összeadandót tartalmaz, amelyek között nincs kapcsolat (mivel x1 , , x n1 és x között nincs kapcsolat). Így a felbontás során kapott három négyzetes kifejezés nem mindegyike 2 2 eloszlású, és nem mind független egymástól. A felbontási tétel megfordításaként hasonló addíciós tétel is érvényes. A normális eloszlású sokaságból vett minta tapasztalati szórásnégyzetének eloszlása A korrigált tapasztalati szórásnégyzet definíciója: s2
1 n 2 xi x n 1 i 1
(2.12) n
A (2.10) egyenletből látható, hogy a
x i 1
i
x
2
négyzetösszeg 2 2 eloszlású,
n 1 szabadsági fokkal, várható értéke: n 2 E x i x 2 E 2 2 n 1 . i1
(2.13)
A (2.12) egyenlettel definiált korrigált tapasztalati szórásnégyzet várható értéke a 2 variancia: n 2 E x i x i1
n 1 2 E 2 n 1 2 .
(2.14)
Így a korrigált tapasztalati szórásnégyzet 2 2 eloszlású, vagy másképpen az
s 2 2 kifejezés 2 -eloszlású 2 s 2 2 , n 1 szabadsági fokkal.
32
2-2. példa Egy 2 0.08 varianciájú normális eloszlású sokaságból 8 elemű mintát veszünk. a) Határozzuk meg azt az intervallumot, amelyben az s2 korrigált tapasztalati szórásnégyzet 95%-os valószínűséggel megtalálható! 2 2 P salsó s 2 sfölsõ 0.95
s2 2 s2 2 2 2 2 2 2 2 P salsó sfölsõ P alsó2 fölsõ2 P alsó fölsõ 0.95 2 2 Annak valószínűsége, hogy 2 alsó , legyen 0.025, azé pedig, hogy 2 fölsõ , 2 legyen 0.975. = 7 szabadsági fokra a Függelék II. táblázatából alsó 169 . ; 2 fölsõ 16.0 . Így
P
2 alsó
2
2 fölsõ
2 2 alsó 2 fölsõ 2 2 P s
. 0.08 16.0 0.08 169 P s2 . 0.95 P 0.0193 s 2 0183 7 7
Vegyük észre, hogy a szórásnégyzet milyen széles tartományban ingadozhat, pusztán a véletlen következtében! f( 2)
0.025 0.025
2al s ó
2fö l s õ
2
2-5a) ábra. A 2 -eloszlás kritikus értékei b) Határozzuk meg azt az értéket, amelyet s2 95%-os valószínűséggel nem halad meg! 2 P s 2 sfölsõ 0.95
2 141 . A II. táblázatból fölsõ
2 2 141 . 0.08 P s 2 fölsõ P s 2 . 0.95 P s 2 0161 7
33
f( ) 2
2
2
2-5b) ábra. A 2 eloszlás valószínűséghez tartozó fölső kritikus értéke 2.1.4. t-eloszlás (Student-eloszlás) Az u-eloszlás sokszor nem használható, ha a minta elemszáma kicsi, és nincs bőséges előzetes adathalmazunk a 2 variancia becslésére (csak kis számú ismétlés szórásnégyzetével helyettesíthetjük). Ilyen esetekben alkalmazandó a t-eloszlás (2-6. ábra).
0.4
20
f(t)
0.3
4
0.2
1
0.1 0.0 -3
-2
-1
0
1
2
3
t 2-6. ábra. A t-eloszlás sűrűségfüggvénye különböző szabadsági fokhoz Egy normális eloszlású valószínűségi változóból a következő kifejezéssel kapunk Student-féle t-eloszlásút:
t
34
u
2
E 22
E s
.
(2.15)
Az eloszlás egyetlen paramétere a szabadsági fokok száma, , amely a nevezőben lévő szórás négyzetének a szabadsági fokszáma. Várható értéke: E t 0 .
(2.16)
A 2-6. ábrán a = 1, 4 és szabadsági fokokhoz tartozó sűrűségfüggvényeket ábrázoltuk. Ha , a t-eloszlás közeledik a normális eloszláshoz. A gyakorlatban a > 30 esetén a t-eloszlást normális eloszlással helyettesíthetjük. Származzék például a t valószínűségi változó az n elemű minta középértékéből. A következő valószínűségi változó t-eloszlású, n – 1 szabadsági fokkal: t=
x- x- . sx s/ n
(2.17)
A Függelék III. táblázatában a különféle valószínűségekhez és szabadsági fokhoz tartozó t/2 kritikus értékek vannak feltüntetve. Mivel a t-eloszlás szimmetrikus, az alsó kritikus értéket –t/2-lel szokás jelölni. A t valószínűségi változó valószínűséggel veszi föl a (–t/2 , t/2) intervallumon kívül eső értékeket (2-7. ábra). f(t)
/2
2
- t /2
0
t /2
2-7. ábra. A t-eloszlás kritikus értékei 2-3. példa 10 mérés eredménye a következő: 24.46; 23.93; 25.79; 25.17; 23.82; 25.39; 26.54; 23.85; 24.19; 25.50. x 24.864 ; s 2 0.89422 ; s 0.946 Ne feledjük, hogy s nem a középérték szórása, hanem az egyedi mért értéké! Kérdés: milyen intervallumban van a valódi érték 95%-os valószínűséggel? x t , P t 2 t t 2 1 , s n
35
P x t 2 s
n t x t 2 s
n 1 .
A III. táblázatból 0.05 és n 1 9 értékekhez t 2 2. 262 .
t 2 s n
2. 262 0.946 0. 677 , 10
P 24. 29 25. 64 0.95 .
Tehát a 95%-os konfidencia-intervallum: (24.29, 25.64).
2.1.5. F-eloszlás Legyen 12 és 22 két, egymástól független, -eloszlású valószínűségi változó 1 , ill. 2 szabadsági fokkal. A következő kifejezés F-eloszlású, a számláló szabadsági foka 1 , a nevezőé 2 : F
12 1 . 22 2
Figyelembe véve, hogy
(2.18)
s2
s2
2
2 2 ;
2 ,
s12 / 12 ; és ha 12 22 , F 2 s2 / 22
(2.19)
s12 F 2 . s2
(2.20)
Vagyis azonos varianciájú normális eloszlású sokaságokból vett minták tapasztalati szórásnégyzeteinek hányadosa F-eloszlású (2-8. ábra).
36
1.00
=3; =10
f(F) 0.75
=10; =10
0.50 0.25
=10; =2 0.00 0
1
2
3
4
F 2-8. ábra. Az F-eloszlás sűrűségfüggvénye Takarékosabb táblázatot készíthetünk, ha csak a fölső határt adjuk meg, az alsót ugyanezen táblázatból kis számolással kapjuk. Legyen F (1 ,2 ) a 1 és 2 szabadsági fokokkal jellemzett F-eloszlású valószínűségi változónak az a kritikus értéke, amelyet az csak valószínűséggel halad meg. Erre a következő egyenlőség érvényes: F (1 ,2 )
1 . F1 (2 ,1 )
(2.21)
f(F)
F
F
2-9. ábra. Az F-eloszlás kritikus értékei 37
2-4. példa Azonos módszerrel két mérési sorozatot kaptunk, amelyek 4 ill. 7 mérésből állnak. Milyen intervallumban lehet a két minta szórásnégyzetének aránya 90 % valószínűséggel? Minthogy azonos módszerről van szó, a variancia változatlan: 12 22 .
P Falsó s12 s22 Ffölsõ = 0.90
A Függelék IV. táblázatából Ffölsõ F0.05 (3, 6) = 4.76 ;
Falsó F0.95 (3, 6) =
1 1 0.112 . F0.05 ( 6, 3) 8.94
Az eredmény: a két szórásnégyzet aránya a (0.112; 4.76) intervallumba esik 90% valószínűséggel (2-9. ábra). Látható, hogy két minta szórásnégyzete nagyon különböző lehet akkor is, ha a mögöttük álló sokaság varianciája azonos. 2.2. Hipotézisvizsgálat, statisztikai próbák A matematikai statisztikában a célunk a sokaság megismerése (paramétereinek meghatározása). Ennek során gyakran úgy járunk el, hogy az alapsokaságra valamilyen feltevéssel élünk (pl. és/vagy értéke) és ezt statisztikai próbával ellenőrizzük. Azt ellenőrizzük a tételből ill. folyamatból vett minták elemzésével, hogy a tétel vagy folyamat olyan eloszlású-e ill. olyan paraméterekkel jellemezhető, mint azt feltételezzük. Például megvizsgáljuk, hogy vízminta nitrát-tartalma nem haladja-e meg a megengedett értéket; a selejtarány nem nőtt-e meg stb. A próbák gondolatmenete lényegében mindig ugyanaz, ezért azt az u-próba ismertetésénél mutatjuk be részletesen. 2.2.1. u-próba Tegyük fel, hogy egy normális eloszlású sokaság varianciájának számszerű értéke korábbi vizsgálat alapján rendelkezésünkre áll. Ellenőrizni akarunk egy, a sokaság várható értékére vonatkozó hipotézist, azaz azt, hogy egy meghatározott számmal, 0-lal egyenlő-e (pl. hogy a gyártott alkatrészek méretingadozásának centruma a névleges érték-e). Ezt tekintjük nullhipotézisnek: H0 : = 0 .
Lehetséges ellenhipotézisek többek között: H1: 0 , vagy H1: 0 , vagy H1: 0 , vagy H1: 1 .
38
Legyen x1 , x2 ,..., x n egy, a sokaságból vett n elemű minta. (Mindaddig, amíg a konkrét méréseket el nem végezzük, a mintaelemek nem számszerű értékek, hanem valószínűségi változók.) 1. Az u-próba menete a következő: A minta elemeinek számtani középértékéből kiszámítjuk a próbastatisztikát: x 0 . u0 n Az u0 próbastatisztika kifejezése nem azonos az N(0, 1) eloszlású u standardizált normális eloszlású valószínűségi változóéval (mert helyett 0 szerepel benne), csak akkor, ha 0, vagyis ha a H0 nullhipotézis igaz. Általános esetben a következő kifejezés első tagja a definíció szerint u eloszlású, a második tag pedig attól eltérést okoz: x 0 x 0 u0 . n n n 2.
Az u-eloszlás táblázata segítségével kiszámítjuk, hogy az u0 próbastatisztika nagy (pl. 1 – = 0.95) valószínűséggel milyen intervallumba esik, ha a H0 igaz (vagyis az u0 föntebbi kifejezésének második tagja zérus), ez lesz az elfogadási tartomány. Úgynevezett kétoldali ellenhipotézis, H1: 0 esetén ez a tartomány:
x 0 x 0 P -ua 2 ua 2 P ua 2 1 . n n 3.
Megvizsgáljuk, hogy a próbastatisztika kiszámított értéke az elfogadási tartományban van-e. Ha a H0 nullhipotézis igaz, akkor u0 nagy (pl. 1 – = 0.95) va-
lószínűséggel az elfogadási tartományban ua 2 , ua 2 van (kritikus érték: u 2 ), és csak kis (pl. = 0.05) valószínűséggel esik azon kívülre, az ún. elutasítási tartományba (l. a 2-10. ábrán). 4.
Ha u0 számított értékét az (1 – ) valószínűséghez tartozó elfogadási tartományon belül találjuk, akkor a H0 nullhipotézist elfogadjuk, míg ha a próbastatisztika értéke az intervallumon kívül esik, az elutasítási tartományba, akkor elutasítjuk. Ez a döntés.
Az elfogadási tartomány az a tartomány, amelyben a próbastatisztika értékeit 1 – valószínűséggel fölveszi, amennyiben a H0 nullhipotézis igaz. Másképpen az a tartomány, amelyben az u0 próbastatisztika értékei a véletlenszerű ingadozás következtében 1 valószínűséggel lehetnek. Vegyük észre, hogy a vizsgálat lényege az u0 próbastatisztika kifejezése számlálójában lévő különbség és a nevezőben szereplő ingadozás összehasonlítása. Ha az x és 0 eltérése lényegesen meghaladja azt a mér-
39
téket, ami még a véletlen ingadozással magyarázható, az eltérést szignifikánsnak (jelentősnek) nevezzük.
f(u)
/2
/2
-u /2 elutasítás
0 elfogadás
u /2
u
elutasítás
2-10. ábra. A nullhipotézis elfogadási tartománya Az valószínűséget a statisztikai próba szignifikanciaszintjének nevezzük. A hipotézisvizsgálat szignifikanciaszintjét az eredménnyel együtt mindig meg kell adnunk, ugyanis az eltérés lehet szignifikáns 0.05-os szinten, de esetleg nem szignifikáns 0.01-os szinten. 2-5. példa Táramérlegen négy ismételt tömegméréssel határoztuk meg egy tárgy tömegét. A 4 mérésből álló minta számtani középértéke x 50125 g. Korábbi mérésekből tudjuk, . hogy a mérés varianciája = 10-4 g2 . El kell döntenünk, hihető-e, hogy a várható érték (a tárgy valódi tömege) 5.0000 g. H0 : = 0 50000 . g,
H1: 0
(kétoldali ellenhipotézis).
A hipotéziseket u-próbával vizsgáljuk. A próbastatisztika aktuális értéke: x 0 5.0125 5.0000 u0 2.5 . 10 4 / 2 n 1 – =0.95 valószínűséget választva, a Függelék I. táblázata szerint u = 1.96. Az elfogadási tartomány: (-1.96; 1.96), a próbastatisztika aktuális értéke (2.5) ezen kívül van, így a H0 hipotézist 0.05-os szignifikanciaszinten elvetjük (az adatok ellentmondanak annak, hogy a várható érték 5,0000 g). Mivel kétoldali ellenhipotézist használtunk, az elutasítási tartomány is két részből áll (l. a 2-10. ábrát), mindegyikhez különkülön /2 valószínűség tartozik. 40
Az elfogadási tartományt x -ra is megadhatjuk:
P 0 ua 2
Behelyettesítve:
P 5.0000 1.96 0.01
n x 0 ua 2
4 x 5.0000 1.96 0.01
n 1 .
4 P 4.99 x 5.01 0.95 .
2-6. példa Egy bizonyos vegyszer 1 kg-jában legföljebb 5.0000 g idegen anyag lehet. Négy elemzés eredményének átlaga 5.0125 g. Korábbi mérésekből tudjuk, hogy a meghatározás varianciája = 10-4 g2. Eldöntendő, hihető-e, hogy az elemzési eredmények várható értéke (az igazi idegenanyag-tartalom) nem haladja meg az 5 g-os határt. Legyen itt is az valószínűség 0.05! A hipotézisek ekkor: H0 : 0 50000 . g, H1: 0
u0
(jobb oldali ellenhipotézis).
5.0125 5.0000 2.5 0.01 / 4
Bontsuk az u0 próbastatisztika kifejezést egy biztosan u eloszlású és egy az attól való eltérést képviselő részre: 5.0125 E x E x 5.0000 u0 0.005 0.005 A próbastatisztika kifejezésének második tagja a nullhipotézis érvényessége esetén zérus vagy negatív, az ellenhipotézis szerint pozitív. Ez azt jelenti, hogy u0 eloszlása H1 igazsága esetén jobbra van eltolva az u-eloszláshoz képest (2-11. ábra). A nullhipotézist akkor utasítjuk el (az ellenhipotézist akkor fogadjuk el), ha az u0 próbastatisztika aktuális értéke annyira nagy (jobbra eltolt), hogy azt a véletlen csak valószínűséggel okozhatná, vagyis
P u0 u H0 .
Az u kritikus érték =0.05-hoz 1.65, u0 ennél nagyobb, tehát elvetjük a nullhipotézist. Egyoldali ellenhipotézis esetén csak egyetlen elutasítási tartomány van, itt: (u ; ).
41
f(u)
=0.05
1.65
2-11. ábra. A jobb oldali ellenhipotézis Nyilvánvalóan minél jobban meghaladja a próbastatisztika aktuális értéke a táblázatból adott szignifikanciaszinthez vett kritikus értéket, annál jelentősebb az eltérés, annál biztosabbak lehetünk a nullhipotézist elutasító döntésünkben. Az is igaz, hogy minél jelentősebb az eltérés, annál kisebb -szinten fogadnánk el a nullhipotézist. 2-7. példa Elfogadnánk-e a nullhipotézist a kétoldali alternatívával szemben, ha a 2-5. példában -ra 0.05 helyett 0.01-ot, 0.005-et, 0.001-et választanánk? A kritikus értékek a Függelék I. táblázatából:
0.05 0.01 0.005 0.001
u 1.96 2.58 2.81 3.29
Eszerint már =0.01-es szinten elfogadnánk nullhipotézist. Számítsuk ki, hogy mi lenne az az szignifikanciaszint, amelynél még éppen elfogadnánk a nullhipotézist, vagyis milyen -hoz tartozó kétoldali kritikus értékkel egyezik meg u0 aktuális értéke (u0 = 2.50)! Ezt a valószínűséget p-vel szokás jelölni, és nagysága a Függelék I. táblázata szerint 0.00621 (2-12. ábra).
42
f(x)
A Függelék I. táblázatából F(2.50)=0.99379
0.00621
2.5
f(x)
p = 0.006210+0.006210 = 0.01242
0.00621
0.00621
-2.5
2.5
2-11. ábra. A p valószínűség szemléltetése a 2-7. példához A p az a valószínűség, amellyel a próbastatisztika a talált vagy azon is túl lévő értéket vesz föl, amennyiben H0 igaz, vagyis pusztán a véletlen ingadozásnak tulajdoníthatóan: Minél kisebb ez a p érték, annál kisebb a valószínűsége, hogy u0 a véletlen műveként vegyen föl legalább akkora értéket, amekkorát találtunk. Vagyis minél kisebb p valószínűség tartozik a próbastatisztika talált értékéhez, annál biztosabbak lehetünk benne, hogy az nem a véletlen következménye, hanem valóságos eltérésé. A p érték meghatározása táblázatokból nehézkes, de a számítógépes statisztikai programok könnyedén kiszámítják.
43
2.2.2. Első- és másodfajú hiba Minden statisztikai próbánál kétféle hibát követhetünk el: elvetjük a nullhipotézist, holott igaz, ill. elfogadjuk a hipotézist, pedig az nem igaz. Ezeket első-, ill. másodfajú hibáknak nevezzük. A H0 nullhipotézis igaz nem igaz
Döntés: A H0 hipotézist elfogadjuk elutasítjuk Helyes döntés Elsőfajú hiba Másodfajú hiba
Helyes döntés
Annak valószínűsége, hogy elsőfajú hibát követünk el, éppen , ugyanis annak valószínűsége, hogy H0 fennállása esetén a próbastatisztika az elutasítási tartományba essék. A másodfajú hiba valószínűségét egy olyan H1 alternatív hipotézisre szokás megadni, amely a H0 nullhipotézistől a feladat megszabta műszaki szempontból már észrevehetően különböző állítást tartalmaz. Legyen ez az alternatív hipotézis: H1: 1 . Amennyiben a H0 hipotézis helyett H1 az igaz, az u0 próbastatisztika sűrűségfüggvénye az u-eloszláséhoz képest a – 0 különbség nagyságától függő mértékben el van tolva: x 0 x 1 1 0 u0 n n n A 2-13. ábrán az u0 próbastatisztika sűrűségfüggvénye látható abban az esetben, ha a H0 igaz ( = 0 ill. ha H1 az igaz ( = 1 Az elfogadási tartományt a nullhipotézis érvényességét feltételezve jelöljük ki, hiszen éppen a H0 elfogadási tartományáról van szó.
44
f ( u 0H0)
f(x)
f (u 0H1)
( n)
2-13. ábra. A másodfajú hiba valószínűsége Látható, hogy a másodfajú hiba valószínűsége annál kisebb, minél távolabb van 0 a 1-től (vagyis nagyobb másodfajú hiba elkövetésének kisebb a valószínűsége). Ez azt jelenti, hogy minél nagyobb az eltérés, annál kisebb a valószínűsége, hogy észrevétlen maradjon. A nagysága függ a próbastatisztika varianciájától (a görbe szélességétől) is, tehát a minta elemszámának növelésével tetszőlegesen csökkenthető. Az is látható, hogy ha az elsőfajú hiba megengedett valószínűségét csökkentjük, ezzel a másodfajú hiba valószínűségét növeljük! 2-8. példa Tegyük föl, hogy a 2-5. példában a valóságos várható érték H1: = 1 5.01 g ; számítsuk ki a másodfajú hiba valószínűségét arra az esetre, amelynél a H0 : = 0 50000 . g nullhipotézist elfogadtuk az =0.01 szinten! ( x 50125 g, = 10-4 g2, n=4, az u0 próbastatisztika aktuális értéke 2.5, u) . A másodfajú hiba valószínűsége annak valószínűsége, hogy a próbastatisztika az elfogadási tartományba essék, pedig az ellenhipotézis az igaz:
P u / 2 u0 u / 2 H1 . H1 érvényessége esetén u0 nem u-eloszlású, hanem a következő helyettesítés szerinti első tag az:
P u / 2
0 x u / 2 1 / n / n 0 0 P u / 2 1 u u / 2 1 . / n / n
Számszerűen:
45
P 2.58
0.01 0.01 u 2.58 0.01 / 4 0.01 / 4 P 4.58 u 0.58 0.7104 .
Tehát ha a próbastatisztika kiszámított értéke kívül van a Függelék I. táblázatából = 0.01 szinthez vehető kritikus értékek meghatározta elfogadási tartományon, a nullhipotézist elutasítjuk. Itt az annak valószínűsége, hogy elutasítsuk a nullhipotézist, pedig igaz: értékét elég kicsire választva ezt a kockázatot tetszőlegesen csökkenthetjük. Így elég valószínű lesz, hogy csak akkor utasítjuk el a nullhipotézist, ha nem igaz. Ha az eltérést nem találjuk szignifikánsnak (az elfogadási tartományon belül van a próbastatisztika értéke, ezért elfogadjuk a nullhipotézist), nem lehetünk biztosak abban, hogy a nullhipotézis igaz. Csak azt mondhatjuk, hogy a rendelkezésre álló információ nem elegendő a nullhipotézis elutasításához. A valóságban a nullhipotézistől elég nagy is lehet ilyenkor az eltérés. Ennek kockázatát éppen a másodfajú hiba valószínűsége fejezi ki. Minél kisebb a minta információtartalma (kis elemszám, nagy szórás), annál nagyobb a valószínűsége, hogy elfogadjuk a nullhipotézist, ha az nem igaz. 2-9. példa Legyen egy 4 elemű minta átlaga x 5006 , az ingadozás varianciája = 10-4. Az u0 . próbastatisztika aktuális értéke: 5.006 5.000 u0 12 . . 10 2 / 4 A táblázat mutatja három hipotézispár esetére az elfogadási tartományokat = 0.05 szinthez: H0 = 0 5.0000 0 5.0000 0 5.0000
H1 0 > 0 < 0
elfogadási tartomány 1.96 u0 1.96 u0 165 . 165 . u0
döntés elfogadjuk elfogadjuk elfogadjuk
Vagyis mindhárom, egymásnak részben ellentmondó nullhipotézist elfogadjuk. A helyes következtetés nyilvánvalóan nem az, hogy mindhárom igaz, hanem az, hogy a minta egyiknek sem mond ellent. Ha az eltérés 0-tól nagyobb, pl. x 50125 , akkor . csak a harmadik nullhipotézist ( 0 5.0000 ) fogadjuk el. A másodfajú hiba valószínűsége csak egy adott ellenhipotézishez ( H1: 1 ) számítható ki, és éppen annak valószínűsége, hogy a –0 különbséget nem veszszük észre.
46
Ha nem egy ellenhipotézis ( =1) jöhet szóba, hanem az alternatívák folyamatos sorozata (pl. 0, azaz az ellenhipotézis összetett hipotézis, akkor a másodfajú hiba valószínűsége függvény, amelynek maximuma a 1 = 0 helyen van, ezt a próba erőfüggvényének nevezik. A értéket, vagyis a nullhipotézis elfogadási valószínűségét szokás a 1 – 0 különbség függvényében ábrázolni, ezt nevezik a próba működési jelleggörbéjének (Operating Characteristic: OC-görbe). 2-10. példa Legyen 0 5.0000 , = 10-4, n=4, = 0.05. Ekkor az elfogadási tartomány: 1.96 u0 1.96 .
Számítsuk ki a másodfajú hiba elkövetésének valószínűségét különböző ellenhipotézis szerinti várható értékekhez!
P u u / 2
1 0 1 0 u P u / 2 / n / n
A képletben szereplő két valószínűséget és nagyságát különböző 1 értékekhez a következő táblázat mutatja:
1
1-0
5.000 5.005 5.010 5.015 5.020
0 0.005 0.010 0.015 0.020
0 P u u / 2 1 / n 0.995 0.94295 0.71904 0.33724 0.07780
0 P u / 2 1 u / n 0.005 0 0 0 0
0.990 0.943 0.719 0.337 0.078
Tehát ha pl. a 1–0 különbség 0.01, 0.719 annak valószínűsége, hogy az eltérést nem vesszük észre, és a = 0 5.0000 nullhipotézist hisszük igaznak.
47
1.0 0.8 0.6 0.4 0.2 0.0 5.000
5.005
5.010
5.015
1
5.020
2-14. ábra. OC-görbe a 2-10. példához Jelölje azt a különbséget, amelyet már műszaki szempontból jelentősnek tartunk, és ezért nagy biztonsággal ki akarunk mutatni: = 1 – 0. Célszerű ehhez az eltéréshez kiszámítani a másodfajú hiba valószínűségét, vagyis annak esélyét, hogy egy nagyságú eltérést a nullhipotézistől nem veszünk észre. Láttuk, hogy az elsőfajú hiba adott valószínűsége esetén a másodfajú hiba valószínűsége az alternatív hipotézistől (a 1 – 0 különbségtől), valamint a sűrűségfüggvény szélességétől függ, mely utóbbi a mérések varianciájából és az ismétlések számából adódik ( 2 n ). Ha megadjuk és értékeit, kiszámíthatjuk az elvégzendő mérések számát. A számítás menetét vizsgáljuk meg egy mintavételi példán, amely a normális eloszlásra épül (u-próba). Ha a nullhipotézist elfogadjuk, nem kell aggódni az elsőfajú hiba miatt; ha a nullhipotézist elutasítottuk, nem kell kérdezni a másodfajú hiba valószínűségét.
48
2-11. példa (Hald, 1965 nyomán) Egy anyag minősége egyértelműen jellemezhető a sűrűségével, melynek kívánatos értéke kisebb, mint 1.54. A gyártás során szerzett eddigi ismeretek szerint a mérés pontosságára jellemző variancia négyzetgyöke = 0.03. A vizsgálat menete a következő: n-szer mintát veszünk a minősítendő legyártott tételből, mindegyik minta sűrűségét megmérjük, átlagoljuk: az így kapott átlagos sűrűség x . Ha x meghalad egy bizonyos x * értéket, az adagot rossznak, ha x < x * , jónak minősítjük. Hogy a jó tételt majdnem mindig elfogadjuk, a rosszakat majdnem mindig elutasítsuk, a következő kívánalmakat adjuk meg: a) ha 1.50, 99 % legyen a valószínűsége, hogy jónak minősítsük, b) ha 1.54, 98 % legyen a valószínűsége, hogy rossznak minősítsük az adagot. A nullhipotézist és az ellenhipotézist a következőképpen fogalmazhatjuk meg: H0 : 0 = 1.50 (a tétel jó);
H1: 1 = 1.54 (a tétel rossz).
Az elsőfajú hiba megengedett valószínűsége = 0.01, a másodfajú hibáé = 0.02. A kimutatandó, jelentősnek minősítendő különbség: = 0.04. A feladat: határozzuk meg a veendő minták n számát és az x * határértéket.
0
-u
0
u
2-15. ábra. Kritikus értékek az első- és másodfajú hibához Fejezzük ki azt az x * határt, amelyet x 1 valószínűséggel nem halad meg, ha H0 igaz (2-15. ábra alsó része):
49
P u0 u H0 P x 0 u
n P x x * H0 1 .
Másodfajú hibát akkor követünk el, ha H1 az igaz ( 1 1.54 ), de mivel u0 u , elfogadjuk a H0 hipotézist (hogy 0 1.50 ). Ennek valószínűsége:
x 1
Pu0 u H1 P x x * H1 P Ha a H1 ellenhipotézis igaz, az
x 1
n
x * 1 . n
valószínűségi változónak van u-eloszlása,
/ n amely az alsó ( u ) kritikus értéket valószínűséggel haladja meg lefelé (2-14. ábra fölső része). Tehát
x 1 u . / n
P
A két kifejezésében szereplő határt egyenlővé téve:
x * 1 0 u n 1 0 . u u 1 n n n Ebből a kimutatandó különbség: 1 0 = (u u ) vagyis
n ,
2
n u u 2 2 .
Esetünkre a Függelék I. táblázatából u 2.326 , u 2.054 , így n = 10.8
és
x * = 1.521.
Ez azt jelenti, hogy minden adagból 11 elemű mintát kell venni és akkor fogadható el a tétel, ha a sűrűségek átlagértéke 1.521-nél kisebb. 2.2.3. -próba a variancia vizsgálatára A próba normális eloszlású sokaság ismeretlen 2 varianciájára vonatkozó nullhipotézis ellenőrzésére szolgál. Tételezzük fel, hogy egy normális eloszlású sokaságból n elemű mintát veszünk. A minta szórásnégyzete (s2) segítségével vizsgáljuk meg, hogy a sokaság varianciája megegyezik-e a 02 értékkel:
H0 : 2 02 . Az ellenhipotézis legyen az, hogy a variancia nagyobb, mint 02 : H1: 2 02 .
A nullhipotézist eszerint pontosítva: 50
H0 : 2 02 . Ha H0 igaz, akkor a következő kifejezés 2 eloszlású, n 1 szabadsági fokkal:
02
s 2 n 1
02
.
A próbához szignifikanciaszintet választva, annak valószínűsége, hogy a 02 próbastatisztika aktuális értéke az elfogadási tartományba esik, 1 – :
s 2 n 1 P 2 1 . 2 0
2 értékét és n 1 függvényében a Függelék II. táblázata tartalmazza. A H0 nullhipotézist tehát elfogadjuk, ha s 2 ( n 1) 02 2 , elutasítjuk, ha s 2 ( n 1) 02 2 (2-16. ábra). 2
f( )
elfogadás
22
2
elutasítás
2-16. ábra. A 2 -próba kritikus értéke Ha a H0 hipotézis igaz, vagyis 2 02 , kicsi () annak valószínűsége, hogy a 02 próbastatisztika meghaladja a 2 kritikus értéket. Ha az ellenhipotézis az igaz, a próbastatisztika 2 2 02 eloszlású, és mivel 2 02 , általában 2 -nél nagyobb értéket vesz föl. Mindenesetre egy kis -nál nagyobb a valószínűsége annak, hogy 2 -tól jobbra eső értékeket vegyen fel, tehát a H1: 0 02 ellenhipotézis jobb oldali ellenhipotézis. 2-12. példa Normális eloszlásból vett 11 elemű minta szórásnégyzete s 2 15.6 . Ellenőrizzük 0.05 -os szignifikanciaszinten, hogy elfogadható-e az az állítás, mely szerint a
51
sokaság varianciája nem nagyobb, mint 14.0. Ellenhipotézisünk legyen az, hogy a variancia nagyobb, mint 14.0.
H1: 2 14.0
H0 : 2 14.0 A 02 próbastatisztika aktuális értéke:
02
s 2 n 1
2 0
15.6 10 111 . 14.0
A Függelék II. táblázatából =0.05-os szignifikanciaszinthez 10 esetén 2 18.3 . Mivel a próbastatisztika értéke ezt a határt nem haladja meg, a H0 nullhipotézist = 0.05 szignifikanciaszinten elfogadjuk. Ha a H1 ellenhipotézist megváltoztatjuk, és a H0 nullhipotézist a bal oldali ellenhipotézis, azaz a H1: 2 02 ellenében vizsgáljuk, az elutasítási és az elfogadási tartományt a 2-17. ábra mutatja. f( 2)
1 2
elfogadás
elutasítás
2-17. ábra. Elfogadási és elutasítási tartomány a bal oldali ellenhipotézishez Azt, hogy most 02 12 jelenti az elutasítási tartományt, vagyis alsó kritikus határt kell kijelölnünk, könnyen megértjük, ha meggondoljuk, hogy H1 fennállása esetén a próbastatisztika kifejezésében a variancia valódi 2 értékénél nagyobb számmal, 02 -tel osztunk, ezért az 2 2 02 2 lesz. 2-13. példa
52
Oldjuk meg a 2-12. példát H1: 2 14.0 esetére! A II. táblázat jelöléseivel =10 szabadsági fokhoz az alsó kritikus határ: 02.95 3.94 . A próbastatisztika kiszámított értéke 11.1, így ebben az esetben is az elfogadási tartományba esik. Az előbbi két gondolatmenetünk után az olvasó könnyen értelmezheti a H1: 2 02 kétoldali ellenhipotézist.
2.2.4. Két szórásnégyzet összehasonlítása (F-próba) Két, normális eloszlású sokaságból vett független minta szórásnégyzetének összehasonlításával el kell döntenünk, hogy a minták mögött álló sokaságok varianciái megegyeznek-e. Amennyiben a két variancia azonos, a szórásnégyzetek aránya Feloszlású, vagyis a nullhipotézis: H 0 : 12 22 A próbastatisztika s2 s2 2 2 2 F0 12 12 12 12 F n1 1, n2 1 12 . s2 s2 2 2 2 Látható, hogy az F0 próbastatisztika csakis akkor F eloszlású, ha a varianciák egyenlők, ellenkező esetben a 12 22 hányados értékétől függően lefelé 12 22 1 , vagy fölfelé 12 22 1 eltér tőle. Egyoldali ellenhipotézis esetén pl.
H1:12 22 . Akkor utasítjuk el a nullhipotézist, és fogadjuk el az ellenhipotézist, ha s12 / s22 F . Kétoldali ellenhipotézis esetén: H1:12 22 . Akkor utasítjuk el a nullhipotézist, és fogadjuk el az ellenhipotézist, ha s12 s12 vagy F Fa/ 2 . 1-a/ 2 s22 s22
A kétoldali próba gyakorlati kivitelezésekor célszerű, ha a tört számlálójába a nagyobb értékű szórásnégyzetet írjuk1, vagyis
s12 / s22 1 Ilyenkor elég az elfogadási tartomány fölső határát ellenőrizni, mert ha s12 / s22 F / 2 (1 ,2 ) ,
akkor egyúttal biztosak lehetünk abban, hogy 1
A számítógépes programok elterjedésével ennek jelentősége egyre csökken, mivel nem szorulunk az F-eloszlás kizárólag F > 1 értékeket tartalmazó táblázatainak használatára.
53
s22 / s12 F1 / 2 (1 ,2 ) , ha s12 s22 . Ez azt is jelenti, hogy az említett konvenciót követve elvégzett próbához nem /2, hanem 2/2 = szignifikanciaszint tartozik (így a 95 %-os egyoldali szint megfelel a 90 %-os kétoldali szintnek).
2-14. példa Egy vizsgálatot két mérési módszerrel (A és B) lehet elvégezni. Az A elemzéssel 12, a B elemzéssel 8 mintát vizsgáltak meg. A tapasztalati szórásnégyzet az első esetben s 2A 0.0244 , a második esetben sB2 0.0300 volt. Állapítsuk meg, van-e a két módszer ismételhetősége között különbség!
H0 : A2 B2 ;
sB2 0.0300 123 . . s A2 0.0244 A Függelék IV. táblázatából az a kritikus érték, amelyet az F-eloszlású valószínűségi változó 95 % valószínűséggel nem halad meg, ha a számláló szabadsági foka 7, a nevezőé pedig 11: F0,95 (7, 11) = 3.01. Minthogy a konvenció szerint a nagyobb szórásnégyzetet írjuk a számlálóba, ez a felső határ 90 %-os kétoldali szintnek felel meg. Mivel sB2 s A2 F , a nullhipotézist elfogadjuk, és azt mondjuk, hogy a két módszer ismételhetősége 10 %-os szinten nem különbözik egymástól szignifikánsan. 2.2.5. A t-próba Az u-próba használatához ismernünk kell a sokaság varianciáját. Ez csak igen nagyszámú korábbi mérésből lehetséges, ami a gyakorlatban legtöbbször nem áll rendelkezésre. Láttuk a t-eloszlás bemutatásakor, hogy az az u-eloszlással rokon, tőle éppen abban különbözik, hogy a legtöbbször ismeretlen variancia helyett benne az s2 szórásnégyzet szerepel. 2.2.5.1. Egymintás t-próba Az egymintás t-próba hasonló az u-próba előbb ismertetett változatához. Annak vizsgálatára alkalmas, hogy a várható érték különbözik-e egy adott értéktől; csak az upróbánál használt, de általában ismeretlen variancia helyett a t-próbánál a kiszámítható tapasztalati szórásnégyzet szerepel. Tehát a nullhipotézis: H 0 : = 0 ; vagy másképpen: H 0 : 0 0 . Az ellenhipotézis a kétoldali változatnál: H1: 0 ; vagy másképpen: H1: 0 0 .
54
A próbastatisztika:
t0
x 0 . s n
2.2.5.2. Kétmintás t-próba A kétmintás t-próbánál két, egymástól független minta mögött álló sokaság várható értékének különbözőségére vonatkozik a nullhipotézis (pl. H0 : 1 – 2 = 0). A statisztikai próba elvégzéséhez ismert a két minta elemszáma (n1 és n2), valamint szórásnégyzetük ( s12 és s22 ). Tételezzük fel, hogy a két sokaság varianciája megegyezik. Ezt a 2.2.4. pontban ismertetett F-próbával ellenőrizni kell! Vezessünk be egy új valószínűségi változót: (2.22) d x1 x2 . A d eloszlása is normális, paraméterei:
E d = E x1 x2 E x1 E x2 1 2 ,
(2.23)
Var d = Var x1 x2 Var x1 Var x2 2 n1 2 n2 2 1 n1 1 n2 .
(2.24)
Egy, a d-től független valószínűségi változó, sd2 a következőképpen származtatható:
1 1 sd2 s 2 . n1 n2
(2.25)
A képletben s 2 a két minta szórásnégyzetéből egyesítéssel adódik: 1 s2 s12 n1 1 s2 2 n2 1 . n1+n2 -2
(2.26)
A következő kifejezés t-eloszlású, n1 n2 2 szabadsági fokkal: t=
d E d d Ed . sd 1 1 s n1 n2
(2.27)
A nullhipotézis: H0 : = 2, ekkor E d 0 . A próbastatisztika tehát: d-0 d t 0= , n1 n2 2 . sd 1 1 s n1 n2
(2.28)
55
Amennyiben az így kiszámított próbastatisztika t-eloszlású, vagyis értéke a –t alsó és a t fölső küszöbérték között van ( t a/ 2 t t a/ 2 ), azt mondhatjuk, hogy a két átlagérték különbözősége szinten nem szignifikáns. Az s2 egyesített szórásnégyzet használata előnyösebb, mint ha sd2 kiszámítására csak s12 -et vagy csak s22 -et használnánk, mert szabadsági foka nagyobb, így a Függelék III. táblázatában hozzá kisebb kritikus érték tartozik. Az itt leírt vizsgálat: t-próba két minta középértékének különbözőségére. 2-15. példa Egy gépről két különböző napon lekerülő alkatrészekből mintát vettek, az alkatrészek tömegére a következőket kapták: n1 = 10
x1 = 50.0 g
s12 2.0 102 g2 ;
n2 = 15
x2 49.8 g
s22 15 . 102 g2 .
Különböző-e a két napon a gyártott alkatrészek tömegének várható értéke 5 %-os szignifikanciaszinten? Először F-próbával ellenőrizzük azt a hipotézist, hogy a két minta azonos varianciájú sokaságból származik. s 2 2.0 10 2 F0 12 1.333 s2 1.5 10 2 A számláló szabadsági foka 1 n1 1 9 ; a nevezőé 2 n2 1 14 . A Függelék IV. táblázatából az a kritikus érték, amelyet az F-eloszlású valószínűségi változó 95 % valószínűséggel nem halad meg, ha a számláló szabadsági foka 9, a nevezőé pedig 14: F0,95 (9, 14) = 2.65. Mivel s12 s22 F , a nullhipotézist elfogadjuk. d = 0.2 g; 1 3.9 10 1 2 2 2 s 2 10 9 15. 10 14 23 17. 102 ; 10 15 2 ; s 1.7 10-2 01305 . t 0=
0.2 1 1 01305 . 10 15
= 3.7 .
A t-eloszlás kritikus értéke a Függelék III. táblázatából 23 szabadsági fokhoz ( 0.05 ): t = 2.069. A próbastatisztika értéke a kritikus határt meghaladja, tehát a nullhipotézist elutasítjuk: a két nap közötti különbség 5 %-os szinten szignifikáns. Kérdezhetjük, hogy adott mintaelemszámmal mekkora különbséget tudnánk kimutatni. Amit kiszámolhatunk, hogy az ismétlések varianciájához képest mekkora a kimutatható eltérés: 56
, ahol 1 2
Például nézzük meg, hogy mindkét mintában 3 ismétlés esetén mekkora a ? A Függelék IX. táblázatában találjuk a értékeket = 0.05 és = 0.1 hibavalószínűségekhez. Az oszlopokban van az összehasonlítandó csoportok száma (a kétmintás t-próbánál ez 2), a sorokban az ismétlésszám, ez most 3. A érték a táblázatból 3.544, ami azt jelenti, hogy az ismétlések szórásának több mint háromszorosát kitevő különbséget tudunk csak kimutatni, ha mindkét minta 3 elemű. Nézzük most meg, mekkora minták szükségesek, ha a kimutatni kívánt 1 2 különbség a variancia négyzetgyökével egyezik meg ( = 1.0). Ehhez a táblázat szerint a két mintában 19-19 adatra van szükség. Ha a kétmintás t-próba végrehajtása során a 2.2.4. pontban ismertetett F-próba arra az eredményre vezet, hogy nem fogadható el a 12 22 feltevés, az itt ismertetett kétmintás t-próba nem alkalmazható, helyette a következő próbastatisztikát használjuk (Welch-próba): t 0=
x1 x 2 s12 s22 n1 n2
.
(2.29)
A H0 hipotézis fennállása esetén ez a t0 statisztika közelítőleg Student-eloszlású, paraméterrel, ahol : 2
2
s12 /n1 s22 /n2 1 1 2 2 . 2 2 n1 1 s1 /n1 s2 /n2 n2 1 s1 /n1 s2 /n2 1
(2.30)
A (2.23) kifejezéssel számított szabadsági fok jellemzően nem egész szám, de ez a számítógépes programokkal könnyen kezelhető. 2.2.5.3. Páros t-próba A t-próba harmadik változata az ún. páros t-próba. Legyen x és y két normális eloszlású valószínűségi változó, mint például egy oldatsorozat két különböző elemzési módszerrel mért eredménypárjai, vagy n számú golyó két különböző mérőeszközzel mért átmérőadatpárjai, vagyis a két minta nem független egymástól, viszont a méréskor elkövetett véletlen hibák egymástól függetlenek. A nullhipotézis: H 0 : E x i E y i . Vezessünk be egy d valószínűségi változót a következő definícióval: d i xi yi .
(2.31) 57
Paraméterei:
E d i E xi E yi .
(2.32)
Mivel a méréskor elkövetett véletlen hibák egymástól függetlenek:
Var di Var xi Var yi .
(2.33)
A páronkénti eltérés átlagértéke: i d i ; d n szórásnégyzete:
sd2
d
i
d
2
d
2 i
(2.34)
nd 2
. i n 1 n 1 A következő kifejezés t-eloszlású:
t
i
d E d sd
n
(2.35)
.
(2.36)
Ha a nullhipotézis igaz, E d 0 . Tehát a próbastatisztika: t0
d
. sd n Amennyiben a próbastatisztika értéke a –t/2 alsó és t/2 fölső kritikus értékek között van, a nullhipotézist szinten elfogadjuk. 2-16. példa Textilszövet szakítószilárdságának impregnálás hatására bekövetkező változását vizsgálták. A vizsgálat szempontjából fontos, hogy a textília inhomogenitásának hatása elválasztható legyen az impregnálószer hatásától. Ezért a kivágott mintadarabokat sorszámmal jelölték, majd kettévágták. Az egyik felét impregnálták, majd mindkettőnek megmérték a szakítószilárdságát. A mérési eredmények a következők:
58
i
xi N/cm
yi N/cm
1 2 3 4 5 6
260 290 280 270 250 270
270 290 290 280 260 270
a) Állapítsuk meg, hogy az impregnálás befolyásolja-e a textilszövet szakítószilárdságát! Vizsgálatunkat = 0.05-os szignifikanciaszinten végezzük! A két valószínűségi változó nem független egymástól, xi és yi összetartozó értékek. Annak eldöntésére, hogy az impregnálásnak van-e hatása, páros t-próbát végzünk. i
di = xi – yi
1 2 3 4 5 6
-10 0 -10 -10 -10 0 di = -40
sd2
d
i
d
d 2
2 i
nd 2
i n 1 n 1 Ha H0 igaz, a következő statisztika t-eloszlású:
t 0=
i
26.6 .
d 0 6.66 0 3162 . . sd n 26.6 6
Kétoldali ellenhipotézis esetén = 0.05 szignifikanciaszinten a III. táblázatból = 5 szabadsági fokhoz t2 = 2.571. Mivel a próbastatisztika aktuális értéke ezt meghaladja ( t 0 2.571 ), a nullhipotézist elutasítjuk. Tehát az impregnálás, = 0.05-os szignifikanciaszinten vizsgálva, befolyásolja a textilszövet szakítószilárdságát. b) Tételezzük fel, hogy az impregnálószer kimosta a sorszámokat. Ekkor a hat-hat mintadarabot nem tudjuk összepárosítani, az x és y értékek sorrendje tetszőleges lehet. Vizsgáljuk meg, hogy az így mért adatokból milyen választ adhatunk az a) pontban feltett kérdésre. Mivel ebben az esetben nem állapítható meg, hogy melyik minta honnan származik, a mérést kiértékelő személy kétmintás t-próbát alkalmazna.
H 0 : E x E y ; H1: E x E y ; x=270.0 ;
y 276.6 ;
d y x 6.6 ;
59
1 1 sd2 s 2 , nx n y s
így
2 d
sx2 s 2y
s2
d 0 sd
2
,
mivel nx = ny = n,
n
s 2y 146.6 ,
sx2 200.0 , t0 =
sx2 s 2y
6.6 0.87 . 200.0 146.6 6
A III. táblázatból = 0.05 kétoldali szignifikanciaszinten = 10 szabadsági fokhoz t2 = 2.228. Mivel t < t2 , a statisztikai próbát végző személy az impregnálószer hatását = 0.05-os szignifikanciaszinten nem minősítené szignifikánsnak. A 2-18. ábra mutatja a másodfajú hiba valószínűségét a 2-16. példa adatainak páros és kétmintás t-próbával való kezelésére [a példa a) és b) részében leírt statisztikai próbákra]. Például annak valószínűsége, hogy a kétmintás próbával 10 egység nagyságú különbséget ne vegyünk észre, 85%, ugyanennek kockázata a páros próbával csak 5%. 1.0 0.9 kétmintás
0.8
páros
0.7 0.6 0.5 0.4 0.3 0.2 0.1 0.0 0
10
20
30
40
E(x)-E(y)
2-18. ábra. A kétmintás és páros t-próba jelleggörbéje a 2-16. példához A 2-19. ábrán láthatjuk a másodfajú hiba valószínűségének függését a mintaelemszámtól kétmintás t-próbára. Ahhoz, hogy a másodfajú hiba valószínűsége a kétmintás t-próbára is csak 5% legyen (mint a páros t-próbánál), 90 elemű minta kellene mindkét csoportban (impregnálva és anélkül).
60
1.0 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0.0 0
10
20
30
40
50
60
70
80
90
100
n 2-19. ábra. A másodfajú hiba valószínűségének függése a mintaelemszámtól a 2-16. példában
Ha a textilszövet inhomogenitásának hatásától el kell különítenünk az impregnálószer hatását, feltétlenül az a) pontban leírt mintavétel szerint járjunk el. Ellenkező esetben az impregnálószer szakítószilárdságot befolyásoló hatását elfedi a szövet inhomogenitásának hatása. A feltételezett hiba előfordulása (a sorszámok kimosása) esetén ismételten textilmintákat kell venni, és a mérést meg kell ismételni. 2.3. Paraméterbecslés A becslés művelete: a sokaság tulajdonságára (paraméterére) következtetünk a minta adatai (jellemzői) alapján. A becslés: a mintából kiszámított statisztika; pl. a várható érték egyik lehetséges becslése a mintaelemek számtani középértéke ( x ). A becslés is valószínűségi változó, eloszlása van. A becsült érték, amelyet jelölésben a becsléstől nem különböztetünk meg, egy számérték, amely nem valószínűségi változó, nincs eloszlása. Általában: ha jelenti a paramétert, a becslés jele ; szokás még a paraméterek valódi értékére görög betűket (, , ), a becslésre pedig a megfelelő latin betűket (m, s, a) használni. A 2-20. ábra szerint a jobb becslés, mint b, mert kisebb a valódi érték körüli ingadozás; c-re a várható érték nem .
61
f
a
c b
2-20. ábra. Becslések összehasonlítása 2.3.1. A becslések tulajdonságai Jelölje n az n elemű mintából meghatározható becslést. A n valószínűségi változó, amely mintáról mintára más-más értéket vehet fel. Torzítatlan egy becslés, ha n mint valószínűségi változó körül ingadozik, várható értéke : (2.41) E n .
a korrekció pedig: E . A torzítás:
E n ; n
Vannak paraméterek, amelyekre nem létezik torzítatlan becslés. Ilyenkor olyan becslést keresünk, amelynek torzítása n növelésével csökken. A becslés aszimptotikusan torzítatlan, ha lim E . (2.42) n
n
Kívánatos, hogy a n becslés ingadozásai ne legyenek túlságosan nagyok, vagyis a n aktuális becslés kis valószínűséggel térjen el a paraméter értékétől, azaz a becslésnek mint valószínűségi változónak a varianciája lehetőleg kicsi legyen. A becslés varianciája a becslés hatásosságának mértéke. Két torzítatlan becslés közül az a becslés hatásosabb (efficiensebb), amelyiknek kisebb a varianciája. Hasznos tulajdonsága egy becslésnek, ha a minta elemszámának növelésével a becslés a paraméter igazi értékéhez tart, pontosabban n növelésével egyre csökken annak valószínűsége, hogy -tól jelentősen eltérjen:
62
lim P n 0.
n
(2.43)
Ez a konzisztens becslés. A konzisztens becslés nem feltétlenül torzítatlan, de legalább aszimptotikusan torzítatlan (Vincze, 1968). 2-19. példa Vizsgáljuk meg, hogy a) a számtani átlag x b) az n-edik mért érték (xn) milyen becslése a várható értéknek! (Ha nincs rendszeres hiba, akkor a várható érték azonos a valódi értékkel; ilyen pl. a tömegmérés jó mérlegen, parallaxismentes skálaleolvasással.) i x i a) . (2.44) x n A becslés várható értéke: E x
1 1 E x i n E x i E x i , n i n i
(2.45)
vagyis torzítatlan, és belátható, hogy konzisztens is. A becslés varianciája:
nVar x i 2 1 . Var x 2 Var x i i n n2 n
(2.46)
b) E E x n ,
torzítatlan, de kevésbé efficiens az előzőnél, mivel Var x n 2 2 n , és nem konzisztens.
2-20. példa Vizsgáljuk meg, hogy a korrigálatlan tapasztalati szórásnégyzet milyen becslése a varianciának!
Var x = s 2*
x
i
x
i
n
2
.
A (2.10) összefüggéssel bizonyítottuk, hogy a
(2.47)
x
várható értéke n 1 2 , mivel n 1 , tehát n 1 2 E s 2* . n
x kifejezés 2 2 eloszlású, 2
i
(2.48)
63
Az s 2 * tehát torzított, bár aszimptotikusan torzítatlan, konzisztens becslés. Ennek n n 1 -szeresét célszerű használni, hogy torzítatlan legyen. Ez az ún. korrigált tapasztalati szórásnégyzet:
s2
1 2 xi x . n 1
Var s 2
Varianciája:
(2.49)
2 4
.
(2.50)
Tehát a (2.49) szerinti korrigált tapasztalati szórásnégyzet konzisztens becslése a varianciának, mert a minta elemszámának növelésével a torzítatlan becslés varianciája csökken. 2-21. példa a) Vizsgáljuk meg, hogy a súlyozott átlag x a várható értéknek milyen becslése!
x w1 x1 w2 x2 wn x n wi xi ,
(2.51)
i
ahol a wi értékek tetszőleges számok, az ún. súlyok. A súlyozott átlag várható értéke: E x E wi x i wi E x i wi . i i i Látható, hogy amennyiben
w
i
1,
(2.52)
i
a becslés torzítatlan. b) A továbbiakban vizsgáljuk meg, hogy milyen súlyozás szükséges ahhoz, hogy az előbbi torzítatlan becslés efficiens (a legkisebb varianciájú) legyen! Var x -nek wi szerinti minimuma ott van, ahol a becslés varianciájának wi szerinti első deriváltja zérus, s a második derivált a Var x wi 0 helyen pozitív érték. A becslés varianciája: Var x Var wi x i wi2Var x i wi2 i2 . i i i
(2.53)
A (2.51) szerinti torzítatlan becslés efficiens, ha
w 2 i
2 i
min. ,
(2.54)
i
figyelembe véve a (2.52) feltételt. Fejezzük ki wk -t a (2.52) feltételből: wk 1
64
n
w
i 1, i k
i
és helyettesítsük (2.54)-be:
2
n w w 1 wi k2 . i1, i k i 1 i 1 i k n
n
2 i
2 i
2 i
2 i
(2.55)
Var x minimumának szükséges feltétele, hogy 2 n n 2 2 2 wi2 i2 wi i 1 wi k i 1, i k i 1 i 1, i k 0, w j w j n
(2.56)
ahol j, k =1, ..., n, de j k. A szummában a w j -t nem tartalmazó tagok deriváltja zérus lesz, így
2w j j2 2wk k2 0 ,
(2.57a)
vagy átrendezve
k2 w j wk 2 . j
(2.57b)
A varianciának a (2.56) helyen minimuma van, ha (2.57a) w j szerinti deriváltja, 2Var x pozitív érték. A deriválást elvégezve: tehát 2 w j
2Var x 2w j 2j 2wk k2 2 2j 0 . 2 w w j j
(2.58)
Mivel 2j értéke mindig pozitív, a feltétel teljesül, így a becslés varianciájának a szélsőértéke minimum. Hogy a becslés torzítatlan legyen, a (2.57b) szerinti súlyozófaktorra teljesülnie kell a (2.52) feltételnek, azaz 1 (2.59) w j 1 wk k2 2 1 . j
j
j
Ebből
wk
1
1
2 k
j
2 j
,
(2.60)
vagyis a súly arányos a variancia reciprokával: x
1
x1 x 2 x 2 2 n2 . 1 1 2 n
j
(2.61)
2 j
A becslés varianciája: 65
Var x i
1 i4 1 2j j
2
i2
1 1 2j j
1
2
i
2 i
1 1
j
.
(2.62)
2 j
Abban a triviális esetben, ha a varianciák egyenlők, a súlyok is egyenlők, és az így kapott becslés azonos a számtani középértékkel: Var x n
1 2 Var x . 1 n
(2.63)
2
Tehát a súlyozás nélküli számtani középérték akkor efficiens becslése a várható értéknek, ha az xi valószínűségi változók varianciái azonosak. A becslések általánosabb minősítése A felhasználás szempontjából tulajdonképpen az a fontos, hogy a becsült érték nagy valószínűséggel kevéssé különbözzék a becsülendő paraméter értékétől, ezért a becs2 lések minősítésének szokásos és célszerű alapja a E kifejezés (MSE:
Mean Square Error, közepes négyzetes hiba) nagysága. Alakítsuk ezt át:
2 E E
E E
2
E E 2E E E
E E
2
2
E
E E
2
2
.
(2.64)
Az átalakításnál felhasználtuk, hogy
E E E E E 0 E . és felhasználjuk, hogy E E
2
E E E E E E
2
2
Az első tagban felismerhetjük a becslés varianciáját, a második tag a torzítás négyzete; e két tag összegének kell kicsinek lennie. Az a becslés kedvezőbb, amelyre a (2.64) szerinti várható érték kisebb. Amint látjuk, ez nem feltétlenül a torzítatlan becslés. Egy torzítatlan becsléssel szemben kedvezőbb lehet egy másik, torzított becslés, ha közepes négyzetes hibája kisebb, mint a torzítatlan becslésé. A becslések tulajdonságainak vizsgálata 66
Az előbbiekben felsorolt tulajdonságok vizsgálatához szükség van a becslések (mint valószínűségi változók) eloszlása sűrűségfüggvényének ill. a függvény paramétereinek (várható érték, variancia) ismeretére. Háromféle utat követhetünk: a) Elméleti levezetéssel: a becslés matematikai alakjából egyszerűbb esetekben az eloszlása is levezethető. Például a normális eloszlású sokaságból származó mintaelemek átlaga a várható érték becslése: x i n , ez N , 2 n normális eloszlású. b) A kísérletek ismétlésével: lévén a becslés valószínűségi változó, az egymás utáni mintákból különbözőnek adódik; így a tapasztalati eloszlás paraméterei kiszámíthatók. A módszer hátránya, hogy a sok kísérlet miatt költséges, és nem is alkalmas a torzítás megítélésére, mert ehhez a paraméter valódi értékét kellene ismerni. c) Számítógépes szimulációval (Monte Carlo-módszer): a kísérleteket nem a valóságos fizikai rendszeren, hanem számítógéppel végezzük. Felvéve az adott modellegyenlethez a paramétereket és a mérési hibák eloszlásának sűrűségfüggvényét, a változók modell szerinti értékéhez (valódi érték) mérési hibaként hozzáadjuk az előírt hibaeloszlás-függvény szerint generált véletlen számokat. Így a becslés tulajdonságait tetszőleges pontossággal meghatározhatjuk. Bonyolultabb esetekben ez az egyetlen gyakorlatilag is megvalósítható eljárás. 2.3.2. Becslési módszerek A következőkben azt vizsgáljuk meg, hogyan konstruálhatunk olyan statisztikákat a mintákból, amelyek a sokaság paramétereinek becsléséül szolgálhatnak. 2.3.2.1. Legkisebb négyzetek módszere Vegyük például az egyszerű egydimenziós mérések várható értékének becslését. A mért adatok x1 , x2 ,, x n . Olyan statisztikát keresünk, amely e mért adatokból felépíthető és becsléséül szolgál. Minthogy a mért adatok egyikét sincs okunk kitüntetni, kézenfekvő, hogy olyan becslést vegyünk, amelyik az xi pontok mindegyikéhez valamilyen értelemben a legközelebb esik. Eszerint az x i különbségek abszolút értékének összegét kellene minimalizálni, de így matematikailag nehezen kezelhető függvényt kapnánk (az abszolútérték-függvény nem differenciálható). Gauss ehelyett az eltérések négyzetösszegének minimalizálását javasolta: 2 (2.65) x i min. i
A szerint differenciálva és a deriváltat nullával egyenlővé téve: 67
2 x i 0 i
x
0
i
i
x i
i
n 0
x
i
x. n Az elv általánosabb alkalmazását a 4. fejezetben mutatjuk be. i
(2.66)
2.3.2.2. Maximum-likelihood-(legnagyobb valószínűség) módszer Tételezzünk fel egy f x; 1 , 2 , 3 sűrűségfüggvényt ( 1 , 2 , 3 a paraméterek)! Az (1.4) összefüggés alapján annak valószínűsége, hogy egy mérés eredménye az x1 és x1 x1 közötti intervallumban legyen: P x1 x x1 x1 f x1 x1 .
Mivel az egymástól független események együttes bekövetkezésének valószínűsége az egyes események bekövetkezési valószínűségeinek szorzata, annak valószínűsége, hogy n egymástól független mérés eredménye x1 , x2 ,, x n (környezetében) legyen, a következő:
P xi x xi xi ; i 1, 2, , n f x1 f x2 f x n x1x2 x n .
A P valószínűség értéke a feltételezett f(x) sűrűségfüggvény paramétereinek függvénye. Ha a minta alapján akarunk a sokaság paramétereire következtetni (márpedig becslésnél éppen ezt tesszük), fel kell tételeznünk, hogy a minta "jól tükrözi" a sokaság tulajdonságait. A 2-21. ábrán látható hisztogram képviselte minta származhat az f1 , f2 , f3 stb. sűrűségfüggvények jellemezte sokaságok bármelyikéből, de más-más valószínűséggel. A maximum-likelihood-módszer szerint azt a sűrűségfüggvényt (ill. paramétereit) fogadjuk el becslésként, amelyekből a legnagyobb valószínűséggel kapnánk a ténylegesen kapott eredménysorozatot. Tehát a felírt P x1 , x 2 ,, x n [az f(x) 1, 2, 3 paramétereitől függő] valószínűségi függvényt kell maximalizálni. A maximum helyét a x1x2 x n szorzat nem befolyásolja, úgyhogy a maximalizálandó függvény (a likelihood-függvény):
68
f1
ni N
f2
f3
x 2-21. ábra. A maximum-likelihood-módszer szemléltetése L x; 1 , 2 , 3 f x1 f x2 f x n . A
(2.67)
L L , stb. becslések a , 0; 0 stb. egyenletekből kaphatók a 1 2 1 2 1 2
stb. paraméterekre. Normális eloszlásnál a sűrűségfüggvény (1.24) kifejezését (2.67)-be írva, és ha a minta elemei (a mérési eredmények) egy N , 2 sokaságból származnak (, ill.
2 azonos), a likelihood-függvény: L
1
n 2
n/ 2
1 xi 2 exp . 2 i
(2.68)
Szokás ennek logaritmusát is likelihood-függvénynek nevezni: n 1 x L ln L ln 2 2 i . 2 2 i 2
A becsléséhez L maximumát keressük függvényében. L maximuma ott van, ahol a második tagban, vagyis a (2.68)-beli exponenciális függvény argumentumában szereplő szumma minimális: x i i min . 2
(2.69)
Az ezzel a feltétellel kiszámítható érték nem a sokaság várható értéke, annak csak becslése, ezért jelöli. Minthogy 2 konstans, a minimalizálandó függvényt másként írva: 69
x i min . 2
(2.70)
i
normális eloszlás esetén azonos a legkisebb négyzetek szerinti (2.65) becslési kritériummal. Tehát 2 konstans értéke esetén a legkisebb négyzetek módszerrel és a maximum-likelihood-módszerrel azonos becsléshez, a számtani középhez jutottunk, amelyről a 2.3.1. alfejezetben megmutattuk, hogy torzítatlan, efficiens becslése a várható értéknek. Ha a minta elemei (a mérési eredmények) több (azonos , de különböző 2 ) normális eloszlásból származnak, a végül minimalizálandó függvény az előbbihez hasonló úton kapható: 2
x i min . i i
(2.71)
Milyen becslést kapunk a várható értékre ez utóbbi esetben? 1 2 2 x i 0 , i i x 1 i2 2 0 , i
i
i
i
n
xi
i 1 n
n
1
j 1
1
2 i
i 1
2 j
n
xi
n
2 i
j 1
1
i 1
2 j
xi
i2 2 j 1 j n
i2
n
xi i 1
n
1
j 1
,
2 j
amelyről bebizonyítottuk, hogy torzítatlan és efficiens becslés. Milyen becslést ad a maximum-likelihood-módszer a varianciára? n 1 x L ln2 n ln i , 2 2 i L 1 1 2 n 3 xi 0 , i 1 2 n 2 xi 0 , i 2
n
2
x i1
i
n
2
.
(2.72)
2 2 E n 2 E x i E x i nVar x , i i vagyis az így kapott becslés torzítatlan.
(2.73)
Sajnos, ez a becslés általában nem használható, mivel értékét nem ismerjük. Ha helyére x kerül, a következő becslést kapjuk: 70
n
2 s 2*
x i 1
i
x
n
2
,
és erről már láttuk, hogy torzított becslés, hiszen a (2.47) összefüggéssel, azaz a korrigálatlan tapasztalati szórásnégyzettel azonos. 2.3.2.3. Momentumok módszere Kétféle momentumról lesz szó, közönséges és centrális momentumról. Az első közönséges momentum:
1 xf x dx E x ,
(2.74)
egyben a várható érték. A második közönséges momentum:
2 x 2 f x dx .
(2.75)
Általában a k-adik közönséges momentum:
k
x f x dx . k
(2.76)
A második centrális momentum:
2
x f x dx Var x , 2
(2.77)
egyben a variancia. Általában a k-adik centrális momentum:
k
x f x dx . k
(2.78)
Könnyen belátható, hogy az első centrális momentum értéke zérus. A minta ún. tapasztalati eloszlás-, ill. sűrűségfüggvényére (a gyakoriság-adatokra) kiszámítható a momentumokkal analóg jellemző, pl.: n x i xi , (2.79) i N az első tapasztalati momentum, vagy
s 2* i
ni 2 xi x , N
(2.80)
a második centrális tapasztalati momentum. A becslés módja: a sűrűségfüggvény alakjának ismeretében analitikusan kifejezhetők az ún. elméleti momentumok: ezeket egyenlővé tesszük a kiszámított tapaszta71
lati momentumokkal, így kellő számú egyenletet nyerünk, amelyekből a paraméterek becsült értékei kiszámíthatók. Például a normális eloszlás két paraméterére ( és 2 ) egyszerűen kaphatunk becslést, ha az elméleti momentumokat a tapasztalati momentumokkal egyenlővé tesszük. Elméleti momentumok:
1 xf x dx
2 x 2 f x dx 2 2
Tapasztalati momentumok: n m1 x i x i i N
m2 i
ni 2 x N i
1-et m1-gyel, 2-t m2-vel egyenlővé téve:
1 m1 x , 2 m2
2 m2 m12 i
ni 2 x i x s 2* N
2.3.3. A becslés kivitelezése Ha a mérési adatok és az eloszlásfüggvény alakja (típusa) alapján az előbbi módszerek valamelyikével becslést adunk az eloszlásfüggvény paramétereire – egyetlen számértéket paraméterenként –, akkor ez az ún. pontbecslés. Intervallumbecslést kapunk, ha a becslés eloszlásfüggvénye (normális, t stb.) ismeretében a kívánt szignifikanciaszinten (=0.05 vagy 0.01 a szokásos) konfidenciaintervallumot számítunk a pont körül, amelybe a becsült paraméter értéke például 1– = 0.95 vagy 0.99 valószínűséggel beleesik. Ez azt jelenti, hogy sokszor elvégezve a mintavételt, a kapott konfidenciaintervallumok kb. 95 ill. 99 %-ára lesz igaz, hogy tartalmazzák a valódi paraméterértéket. Tehát maga a konfidenciaintervallum (az intervallum alsó és fölső határa) a valószínűségi változó. Ilyen intervallumbecslést adtunk a sokaság várható értékére a 2-1. és 2-3. példákban. Pontbecslés A minta statisztikai jellemzői sokszor egyben a sokaság eloszlása paramétereinek becsléséül szolgálnak. Pl. egy N(, ) eloszlásból vett mintából kiszámított átlag és szórásnégyzet a várható érték ill. a variancia pontbecslései: s 2 2 . x ,
72
A sokaságnak (eloszlásnak) nem feltétlenül a várható érték és a variancia a paraméterei. A binomiális eloszlás paraméterei n és p, míg a várható érték np, a variancia np(1–p). Egyetlen mérés és többelemű minta átlaga egyaránt torzítatlan becslései a várható értéknek. A minta szórásnégyzete torzítatlan becslése a varianciának, de a szórása nem torzítatlan becslése -nak. Minimális varianciájú (hatásos) egy pontbecslés, ha a mintából kiszámítható bármely más statisztikánál (pontbecslésnél) kisebb a varianciája. A minta átlagának varianciája n-ed része az egyedi mért érték varianciájának, tehát előbbi hatásosabb. Intervallumbecslés A pont-becslés egyetlen értéket ad meg. Általában azt is szeretnénk tudni, hogy a becsült értéktől a valóságos paraméter milyen mértékben térhet el. Az intervallumbecslés egy intervallum, amely bizonyos valószínűséggel magában foglalja a paraméter igazi értékét. Pl. a várható értékre egy L és U határolta intervallumra igaz, hogy
P L U 1
Ezt az intervallumot 100·(1–) %-os megbízhatósági - vagy konfidenciaintervallumnak nevezzük. Az L U intervallumot pontosabban kétoldali megbízhatósági intervallumnak kell nevezni, mivel alsó és fölső határa van. A műszaki problémák jellege sokszor egyoldali határt kíván. Például egy huzal szakítószilárdságának alsó határértéke felől akarunk biztosak lenni, a selejtarányra viszont inkább fölső korlátot kell adnunk. Egyoldali határ esetén a 100 (1-) %-os alsó L határ úgy választandó, hogy a
P L 1
teljesüljön. Egyoldali U fölső határra pedig:
P U 1 2-22. példa Egy alkatrészsorozat tömege eloszlásának varianciája =10-2 g2 és az eloszlás normális. a)
Adjunk 99 %-os kétoldali konfidenciaintervallumot az eloszlás várható értékére egyetlen darab alapján, melyre a mérés eredménye 50 g!
P(u / 2 u u / 2 ) 1 0.99
73
ahol
u=
x
50.00 . 10 1 P x u / 2 x u / 2 0.99 .
A Függelék I. táblázatából =0.01-hez
u/2=2.58,
P50.00 2.58 10 1 50.00 2.58 10 1 0.99 A tömegeloszlás várható értéke 99 % valószínűséggel a (49.74; 50.26) intervallumba esik. b) Adjunk 99 %-os kétoldali konfidenciaintervallumot az eloszlás várható értékére több alkatrész átlaga alapján!
P(u / 2 u u / 2 ) 1 0.99 itt u=
x , / n
P x u / 2 / n x u / 2 / n 0.99 ,
P 2.58 101 / n x 2.58 101 / n 0.99 .
n
Az intervallum félszélessége, u / 2 / n
A csökkenés mértéke, 1/ n
1 2 3 4 5 6 7
2.5810-1 1.8210-1 1.4910-1 1.2910-1 1.1510-1 1.0510-1 0.9710-1
1 0.707 0.578 0.500 0.446 0.408 0.378
Látható, hogy 4 elem átlagával számolva felére, 7 méréssel majdnem harmadára csökken a konfidenciaintervallum. 2-23. példa Adjunk a 2-3. példában szereplő mérési eredmények várható értékére 95 %-os megbízhatóságú alsó határt!
74
P L 0.95 Az = 0.05 valószínűséghez tartozó egyoldali határt (2-22a) ábra) a t-eloszlás táblázatából, ahogy a 2-22b) ábra illusztrálja, = 0.1-nél kell leolvasni, mivel a táblázat eredetileg kétoldali határra készült. f(x)
0.05
2-22a) ábra. Egyoldali határ leolvasása f(x)
0.9 0.05
0.05
0.1
2-22b) ábra. Egyoldali határ leolvasása a kétoldali határra készült táblázatból A = 9 szabadsági fokhoz t0.1/2=1.833. Ezzel a várható érték alsó határa: P( x t0.1/ 2 s
n ) P(24.864 1833 . 0.965
10 )
P(24.316 ) 0.95
x statisztika akkor is közelítőleg t-eloszlású, ha x nem s/ n normális (Box-Hunter-Hunter, 1978, p. 81), feltéve, hogy a minta elemei egymástól statisztikailag függetlenek. Ez utóbbi kikötés azt jelenti, hogy az egymás utáni mintaelemek bármilyen eloszlás szerint ingadozhatnak, de nem lehet valamilyen menetük, pl. kizáró ok a fokozatos elállítódás, a szerszám kopása. Megjegyzendő, hogy a t=
75
2-24. példa Egy 2000 elemű tételből 100 elemű mintát veszünk. Azt találjuk, hogy 15 selejtes darab van a mintában. Adjunk 95%-os konfidenciaintervallumot a tételbeli p selejtarányra! A pontbecslés: 15 p 0.15 . 100 A minta n = 100 elemszáma elhanyagolható a tétel N = 2000 elemszámához képest, tehát számolhatunk a binomiális eloszlással. Az eloszlás varianciája: 015 . 0.85 x p1 p , ennek becsült nagysága Var 1275 . 10 3 . n n 100
Az intervallumbecsléshez a binomiális eloszlást normális eloszlással közelítjük az 1.4.2. pontban leírtak szerint: 015 . p . u 1275 . 10 3 A konfidenciaintervallum:
P015 . 196 . 0.0357 p 015 . 196 . 0.0357 P0144 . p 0186 . 0.95 . 1 A közelítés jogos, mert p alsó határára is igaz, hogy p. n 1
76
3. Több valószínűségi változó együttes eloszlása, korreláció Egyazon kísérlettel, jelenséggel kapcsolatosan egyszerre több mennyiséget is vizsgálhatunk. Például egy műszál rugalmassági mutatója és szakítószilárdsága, vagy burgonya sűrűsége és keményítőtartalma, vagy a szülők és gyermekeik magassága, vagy testek térfogata és tömege egymással bizonyos mértékig összefüggő változók, vagy legalábbis van értelme ilyen összefüggés vizsgálatának. 3.1. Többváltozós eloszlás sűrűségfüggvénye Az egy valószínűségi változó sűrűségfüggvényét értelmező (1.4) összefüggés mintájára két valószínűségi változó együttes eloszlásának sűrűségfüggvénye a következő módon értelmezhető:
P x0 x x0 x ; y0 y y0 y
x0 x y0 y
f x, y dxdy f x0 , y0 x y .
x0
y0
(3.1)
Az eloszlásfüggvény értelmezése pedig:
P x x0 ; y y 0 F x0 , y 0
x0
y0
f x, y dxdy .
(3.2)
Az összefüggés bal oldala annak valószínűsége, hogy az x valószínűségi változó x0 nál kisebb, vagy x0 -val egyenlő értéket, és ugyanakkor az y valószínűségi változó
y 0 -nál kisebb, vagy legföljebb azzal egyenlő értéket vesz föl. f(x, y)
y x
3-1. ábra. A kétváltozós normális eloszlás sűrűségfüggvénye 77
Az 3-1. ábra kétváltozós normális eloszlás sűrűségfüggvényét mutatja. A feltételes sűrűségfüggvény:
P y 0 y y 0 y x 0
y0 y
f y x dxdy f y 0
0
x 0 xy .
(3.3)
y0
Az f y x0 feltételes sűrűségfüggvény az 3-1. ábrán látható hegynek az x0 ponton áthaladó, az x tengelyre merőleges síkkal való metszete, amely csak y függvénye. Kiszámítása:
f x, y , f x
(3.4a)
f x, y dy .
(3.4b)
f y x ahol
f x
A feltételes várható érték:
yf y xdy .
E yx
(3.5)
3.2. Valószínűségi változók függetlensége Az x és y valószínűségi változók függetlenek, ha
f x, y f x f y .
(3.6)
Ilyenkor az együttes sűrűségfüggvény által meghatározott felületet az x, y síkkal párhuzamos síkokkal elmetszve olyan ellipsziseket (szintvonalakat) kapunk, amelyeknek a tengelyei párhuzamosak a koordinátatengelyekkel. y f(x, y) = konstans
x 78
3-2. ábra. Független valószínűségi változók sűrűségfüggvényének szintvonalas ábrája A független valószínűségi változók szorzatának várható értéke:
E xy
xyf x, ydxdy xf xdx yf ydy E x E y .
(3.7)
A valószínűségi változók összegének varianciája: Var x y E
x y E x y Var x Var y 2Cov x, y , 2
(3.8a)
mivel
E
x E x y E y E x E x E y E y 2 E x E x y E y Var x Var y 2Cov x, y . 2
2
2
(3.8b)
A kifejezés harmadik tagja az ún. kovariancia, amelynek definíciója folytonos valószínűségi változókra:
xy Cov x, y E x E x y E y
x x y y f x, y dx dy .
(3.9)
Ha x és y független valószínűségi változók:
Cov x , y E xy E yE x E xE y E E xE y
E x E y E x E y E x E y E x E y 0 ,
(3.10)
vagyis a független valószínűségi változók kovarianciája nulla. Ezért független valószínűségi változókra, az (1.15) összefüggésnek megfelelően: Var x y Var x Var y.
A variancia becslésének – a korrigált tapasztalati szórásnégyzetnek – analógiájára a kovariancia becslése:
xy sxy
x
i
x y i y
i
n 1
xi yi i i 1 . xi yi n 1 i n
(3.11)
Számítási célra a második alak előnyösebb. A kovarianciamatrix több valószínűségi változó varianciáit és kovarianciáit tartalmazza. Például három valószínűségi változóra: 79
11 12 13 C 21 22 23 , 31 32 33
(3.12)
ahol
kl
xk k xl l f xk , xl dxk dxl ,
(3.13)
( xk és xl a valószínűségi változók, mint előbb x és y). Becslése általánosabban:
ˆ k l
xk i xl i xk i i n xl i i n i n 1
.
(3.14)
Látható, hogy 11 12 stb. Független valószínűségi változók esetén k l 0 , ha l k, így C diagonális mátrixszá egyszerűsödik.
3.3. Korreláció Két valószínűségi változó kölcsönös viszonyának teljes jellemzését a két változó együttes eloszlásfüggvénye ill. együttes sűrűségfüggvénye adja meg. Ez a függvény sokszor nem ismert, ezért kívánatos, hogy az eloszlás jellegét jól tükröző, kevés számú jellemző segítségével tájékozódjunk. A következő kifejezéssel definiált korrelációs együttható a változók közötti lineáris kapcsolat szorosságát méri:
xy
E x x y y xy . x y x y
(3.15)
A x y kovariancia x és y léptékétől is függ (vagyis attól, hogy pl. a tömegeket kgban vagy g-ban mérjük), míg a x y korrelációs együttható, mivel a x y szorzatra vonatkoztattuk, független a léptéktől. A korrelációs együttható értékei a –1 és +1 közötti intervallumban lehetnek. Ha a két valószínűségi változó egymástól független, x y 0 , minthogy x y 0 . Ha viszont x y értéke zérus, még nem mondhatjuk, hogy a két valószínűségi változó független egymástól, csak azt, hogy korrelálatlanok. A x y korrelációs együttható értéke akkor és csak akkor egységnyi ( 1 ), ha x és y 80
között lineáris függvénykapcsolat van. Értéke +1, ha az egyenes iránytangense pozitív érték, –1, ha negatív. A kétváltozós normális eloszlás sűrűségfüggvénye:
f x, y
1 2 x y 1 2
1 exp 2 1 2
x x x
2
x x 2 x
y y y
y y y
2
.
(3.16)
Az eloszlás paraméterei: x és y az x és y valószínűségi változók várható értékei;
x2 és y2 az x és y varianciái;
korrelációs együttható. (Az egyszerűbb jelölés érdekében elhagytuk az xy indexet.)
Ha 0 , a (3.16) összefüggésből látható, hogy az f(x,y) sűrűségfüggvény x és y normális eloszlású valószínűségi változók sűrűségfüggvényeinek szorzataként írható fel, azaz teljesül a valószínűségi változók függetlenségét definiáló (3.6) összefüggés, tehát x és y egymástól függetlenek. Az együttes sűrűségfüggvény által meghatározott felületet az x,y síkkal párhuzamos síkokkal elmetszve olyan ellipsziseket kapunk, amelyek tengelyei a koordinátatengelyekkel párhuzamosak (l. a 3-2. ábrát). Kétváltozós normális eloszlás esetében tehát a korrelálatlanság egyben a változók függetlenségét is jelenti. Amennyiben az x és y valószínűségi változók nem függetlenek egymástól, nem lesz igaz, hogy az együttes sűrűségfüggvény szintvonalai a koordinátatengelyekkel párhuzamos tengelyű ellipszisek. Ez szemléletesen azt jelenti, hogy a sűrűségfüggvényhegynek vonulata van, amely nem párhuzamos egyik koordinátatengellyel sem.
81
y
f(x, y) = konstans
x 3-3. ábra. A sűrűségfüggvény szintvonalas ábrája, ha a valószínűségi változók nem függetlenek egymástól A korrelációs együttható becslése a véletlen minta korrelációs együtthatója:
r
sxy2 sx s y
x
i
x y i y
i 2 2 2 2 n x i x i n y i y i i i i i
.
(3.17)
Ha a kétváltozós normális eloszlású sokaság korrelációs együtthatója 0 , bizonyítható (Vincze, 1968), hogy a véletlen minta r korrelációs együtthatójából felépített
t
r 1 r 2
n2 .
(3.18)
statisztika Student-féle t-eloszlást követ, szabadsági foka n 2 . A t-eloszlás segítségével tehát elvégezhető a H0: 0 nullhipotézis statisztikai próbája. Az r becsült korrelációs együttható másképpen is értelmezhető. Ábrázoljuk a megfigyeléseket, és az ábrázolt pontokhoz illesszünk egyeneseket a legkisebb négyzetek módszerével: y y byx x x ,
x x bxy y y .
(3.19a) (3.19b)
Először x legyen a független, y a függő változó, majd fordítva, így két különböző egyenest kapunk (l. a 3-4a) ábrát).
82
y
y
x x bxy y y
y y byx x x y y byx x x
x x bxy y y
a) 0 < r < 1
x
b) r 0
x
3-4. ábra. A korrelációs együttható értelmezése Az egyenesek iránytangensének felhasználásával a korrelációs együttható becslése: r b yxbx y .
(3.20)
Bebizonyítható, hogy a (3.20) egyenlet azonos a (3.17) összefüggéssel. Ha a változók korrelálatlanok, azaz r 0 , a két egyenes csaknem párhuzamos a koordinátatengelyekkel (l. az 3-4b) ábrát). Ha a két egyenes azonos (csak egy egyenes adódik, l. az 3-5a) ábrát): 1 és r 1 . (3.21) bx y b yx y
y
a) r = 1
x
b) r < 1
x
3-5. ábra. A korrelációs együttható értelmezése Ha y és x egymástól nem függetlenek és a közöttük fennálló összefüggés nem lineáris (l. az 3-5b. ábrát), a korrelációs együttható abszolút értéke egynél kisebb lesz. Korrelációanalízis során a sokaságból véletlen mintát vesznek, például a burgonyahalomból véletlenszerűen kivesznek tíz szemet. Megmérik a sűrűségét és a keményítőtartalmát, ezek alkotják az összetartozó (xi, yi) értékpárokat. A minta (3.17) szerint számított korrelációs együtthatójából következtetnek a változók közötti lineá83
ris függvénykapcsolat szorosságára, de nem becsülhetők az egyenes paraméterei. Ha a korrelációs együttható értéke zérushoz közeli szám, a változók korrelálatlanok, de ez nem jelenti azt, hogy nincs közöttük más, nemlineáris függvénykapcsolat. Ha a változók egyikét (például x értékét) előre elkészített kísérleti terv szerint választjuk meg (aktív kísérlet), a minta korrelációs együtthatójának értékét erősen befolyásolja x megválasztása (Ezekiel–Fox, 1970). Aktív kísérletek esetén célszerűbb regresszióanalízissel kiértékelni az adatokat, mivel így nemcsak azt ítélhetjük meg, hogy van-e a változók között függvénykapcsolat, hanem annak paraméterei is becsülhetők.
84
II. Lineáris regresszió 4. A regresszióanalízis alapjai; egyváltozós lineáris regresszió 4.1. A regresszióanalízis alapjai A regresszióanalízis feladatai a következők: a) a függvénykapcsolat (az Y(x) elméleti regressziós függvény) paramétereinek becslése, b) ha lehetséges, a függvény alkalmasságára vonatkozó hipotézis vizsgálata, c) a paraméterekre vonatkozó hipotézisek vizsgálata (pl. az elméleti regressziós egyenes átmegy-e az origón, ill. meredeksége szignifikánsan különbözik-e zérustól), d) konfidenciaintervallum, ill. konfidenciasáv számítása a függvény paramétereire és az Y x tapasztalati vagy empirikus regressziós görbére (a becsült függvényre).
becsült regressziós görbe: Y x
y 60
Y x , elméleti re-
50
gressziós görbe 40
30
20
Yi
x
y10 i
Yi 0 0
2 3 4 5 6 7 x1i x 8 4-1. ábra. Egyedi mért érték, elméleti regressziós függvény és becsült regressziós görbe kapcsolata
Az, hogy a függvény konstansait paramétereknek nevezzük, összhangban van az első fejezetben említett paraméterfogalommal, lévén ezek is a sokaságnak a tulajdonságai, a becsült paraméterek pedig a mérési adatokat (a mintát) leíró függvény (a tapasztalati regressziós görbe) konstansai, és így a minta jellemzői. 85
Az illesztett függvényről alkotott elképzelés kétféle lehet: a) görbét (interpolációs formulát) kívánunk illeszteni, amely jól kezelhető, és a szükséges pontossággal reprezentálja a mérési adatokat, b) a változók közötti oksági összefüggést leíró modellt illesztünk, amelynek paraméterei fizikai értelemmel bírnak, így extrapolációra is használhatók. A regresszió technikája a két esetben azonos, de a becsült paraméterekre vonatkozó statisztikai vizsgálatoknak elsősorban fizikai tartalom szempontjából megalapozott modellillesztés esetén van értelmük. Ebben a fejezetben az x független változókat determinisztikus (nem valószínűségi) változóknak tekintjük, azaz a független változók értékeit a kísérletező választhatja meg, és pontosan ismeri azokat. Vizsgáljuk a következő modellt: valamely (pl. fizikai) törvényszerűség értelmében az x független változó bizonyos értékénél a függő változó értéke Y x . A mérés során mérési pontatlanságok vagy az egyéb, a függvénykapcsolatban nem szereplő, de a jelenséget befolyásoló hatások (pl. nem elég pontosan állandóan tartott hőmérséklet, ajtócsapkodás, légáram stb.) miatt Y helyett valamely y értéket mérünk, amelyre, ha az ingadozások véletlenszerűek (azonos valószínűséggel pozitív vagy negatív irányúak), és igen kis hatásúak, igaz, hogy E y x Y , vagy y Y , ahol
a hiba és E 0 . Általában feltehető, hogy y eloszlása Y körül normális eloszlás, varianciája:
Var y x y2 Var .
(4.1)
Amennyiben nincsen ismert és igazolt fizikai összefüggés a változók között (pontosabban a változók várható értékei között), hanem éppen ilyet keresünk, vagy csak a mérési eredményeket leíró, esetleg minden kauzális meggondolás nélkül alkotott függvénykapcsolatot keresünk (approximáció), a meggondolások ugyanúgy érvényesek, azzal a különbséggel, hogy nem lehetünk előre meggyőződve a függvény alkalmasságáról. A regresszióanalízis során feltételezzük, hogy
1. E y x Y x f x; , , , az ismert vagy feltételezett függvénykapcsolat alakja, ahol , , a függvény konstansai (paraméterei);
2. Var y Var y x konstans, illetve y-nak vagy x-nek ismert függvénye; 3. a különböző i mérési pontokban elkövetett mérési hibák egymástól függetlenek; 4. y az x minden értékénél normális eloszlású, vagyis az mérési hibák N(0, ) normális eloszlásúak. Ha a feltételek nem teljesülnek, akkor is elvégezhetjük függvények (modellek vagy görbék) illesztését, de az ismertetendő statisztikai vizsgálatok nem használhatók, ill. a kapott becslések tulajdonságai mások lesznek. 86
Nevezetesen, ha az mérési hibák nem normális eloszlásúak, a maximumlikelihood-becslésmódszer alkalmazásakor a másik, de ismert eloszlás sűrűségfüggvényét kell helyettesítenünk. Ha az eloszlás nem ismert, a maximumlikelihood-módszer nem is használható, de más becslési módszerek (pl. a legkisebb négyzetek) igen. Amennyiben a hiba varianciája nem ismert, és nem tudjuk, hogy állandó-e, azt a becslésnél nem használhatjuk, így a kapott becslések kevesebb információt fognak tartalmazni, nagyobb bizonytalanságúak lesznek. Vannak olyan becslési módszerek is, amelyek akkor alkalmazhatók, ha a mérési hibák a különböző i pontokban egymástól nem függetlenek, de összefüggésük ismert (Bard, 1974). Fontos megjegyezni, hogy az ismertetendő becslési kritériumok és hipotézisvizsgálati módszerek nagymértékben épülnek a fölsorolt feltételezésekre. A fejezet további részében vizsgálatunkat szűkítsük le az egyváltozós lineáris függvénykapcsolat becslésére! A többváltozós lineáris függvények illesztésével a következő fejezetben foglalkozunk. 4.2. Lineáris regresszió, ismétlés nélküli mérések, y2 konstans Vizsgáljuk a következő mérési adatokat: x1 , y1; x2 , y2 ; xi , yi ; xn , yn . Az összefüggés alakja:
Y x E y x x x ;
(4.2)
y x x ,
(4.3)
ahol x
x
i
. Az x -ot tartalmazó transzformált alak előnyösebb az
n
Y x ' x
(4.4)
alaknál, elsősorban azért, mert becslése így független -étól (l. később); ' x , a tengelymetszet. 4.2.1. Becslés a legkisebb négyzetek módszerével A legkisebb négyzetek módszere szerinti becslési kritérium:
y
i
2 Y x i min.
(4.5)
A továbbiakban az összegzés mindig i szerint (a mérési pontok sorszáma szerint) végzendő; az egyszerűség kedvéért helyett csak a jelölést használjuk. i
Esetünkben:
87
yi xi x min. 2
(4.6)
Ennek a függvénynek kell az és szerinti minimumát megkeresni: 2 y i x i x 0 ,
2 y x x x x 0 . i
i
i
(4.7) (4.8)
Ezek az ún. normálegyenletek. Átrendezve: y n x x , i
i
2 yi xi x xi x xi x , de mivel x x x nx 0 , az első egyenletből yi y , a i
i
n a másodikból
b
yi xi x . 2 xi x
(4.9)
(4.10)
A két egyenlet egymástól függetlenül oldható meg, ezt az Y xi x írásmódnak köszönhetjük, és éppen ebben áll az és becslések függetlensége. Az
a becsült paraméter nem a tengelymetszet, hanem y . 4.2.2. Maximum-likelihood-becslés A feltételes sűrűségfüggvény normális eloszlás esetén:
1 y Y x ; , 2 i i f yx exp (4.11) . 2 2 y y A likelihood-függvény az egyes y értékekhez tartozó sűrűségfüggvények szorzata, ha a különböző i mérési pontokban elkövetett hibák egymástól függetlenek:
n
L i 1
1
1 y Yx 2 i i exp 2 y 2 y 1
2
n/ 2
n y
A likelihood-függvény logaritmusa: 88
1 y Y x 2 i i exp . 2 i y
(4.12)
1 yi Y xi L ln L n / 2 ln2 n ln y . 2 i y 2
(4.13)
A logaritmusfüggvény monoton növekvő függvény lévén, mindegy, hogy L vagy L’ maximumát keressük. Az L és L’ függvényeknek az Y(x) regressziós görbe konstansai, vagyis a becsült paraméterek (a, b,...) szerinti maximuma ott van, ahol a minimuma, vagyis L maximalizálása helyett a 2 y i Y x i min . y
(4.14)
szélsőérték-feladatot kell megoldani. Mivel y2 konstans, ez a következő alakot ölti:
y
i
2 Y xi yi a b xi x
2
(4.15)
= min.
A kapott kritérium normális eloszlás és konstans variancia esetén azonos a legkisebb négyzetek (4.5) becslési kritériumával, így a és b kifejezése is azonos a (4.9) és (4.10) képletekkel.
y2 maximum-likelihood-becslése A (4.13) képlet szerinti likelihood-függvény szélsőértékhelye: 2 L n 1 3 yi Y x i 0. y y y
(4.16)
y2 0 , ezért szorozhatjuk vele az egyenlet mindkét oldalát: n
y2
1 yi Y xi y2
y
i
2
0,
Y xi
2
, (4.17) n amelyről bebizonyítható, hogy torzítatlan becslés, de nem lehet kiszámítani, mivel az Y x függvény konstansai (esetünkben és ) nem ismertek. Ha és helyébe a és b értékét helyettesítjük [vagyis Y x helyett annak becslését, Y x -ot használjuk], a becslés torzított lesz, de ez a torzítás korrigálható. Az és becslések tulajdonságai Az becslés várható értéke yi 1 1 E y i E x i x i , Ea E n n n
89
és mivel x i x nem valószínűségi változó: 1 1 1 Ea xi x Ei n xi x , n n n figyelembe véve, hogy x i x 0 .
(4.18)
Hasonlóan belátható, hogy E b . Vagyis a és b torzítatlan becslése -nak, ill. -nak, amennyiben az elméleti regressziós függvény a feltételezett Y x x alakú, ugyanis ezt felhasználtuk az előző levezetésekben, amikor y helyében Y került. Megjegyzendő, hogy a és b normális eloszlású, mivel y normális eloszlású valószínűségi változók lineáris függvénye, és normális eloszlású változók bármely lineáris kombinációja szintén normális eloszlású (ún. addíciós tétel). Hasonlóan Yi is normális eloszlású. A becslések varianciája:
yi 1 y2 1 2 2 Var y i 2 n y Vara Var ; n n n n
Var b
2y
x
i
x
2
(4.19)
.
(4.20)
Látható, hogy n növekedésével a és b varianciája zérushoz tart, vagyis a becslés
konzisztens is. Az is látható, hogy Var b nagymértékben függ x i x -től, vagyis az xi mérési pontok megválasztásától, tehát a kísérletek megtervezésétől. Minél nagyobb (4.20) nevezője, azaz a választott xi értékek minél inkább a vizsgált intervallum két szélén helyezkednek el, annál kisebb Var b , vagyis b becslése szempontjából ez a kísérleti terv optimális. Ebben az esetben azonban nem tudjuk ellenőrizni a választott lineáris függvény helyességét. A mérési pontok ilyen elrendezését akkor alkalmazzuk, ha a lineáris függvénykapcsolat fennállását előzőleg igazoltuk. A becsült regressziós egyenes varianciája: 2
Var Y x Y2 E Y Y
Vara b x x 2
1 x x 2 2 Var a x x Var b y2 n x x j j
2 .
(4.21)
Vegyük észre, hogy a becslés varianciája az x x 0 -nak megfelelő helyen a legkisebb (azaz ha x x ), valamint hogy a mérési pontok számának növekedésével
90
csökken, és függ a mérési pontok elhelyezésétől (az x j x különbségektől), vagyis a kísérleti tervtől is. Az eltérések négyzetösszegének vizsgálata A mért y érték és az Y valódi érték közötti eltérés a következő módon írható fel:
y i Yi y i Yi Yi Yi .
(4.22)
Feladatunk a lineáris függvény alkalmasságának vizsgálata, vagyis arra vagyunk kíváncsiak, hogy adekvát-e a függvény. Nullhipotézisünk az, hogy a változók között fennáll a (4.2) lineáris összefüggés, ellenhipotézisünk, hogy nem:
H0 : Y x x ;
H1 : Y x x .
Írjuk a (4.22) kifejezésbe a nullhipotézisnek megfelelő lineáris függvényt:
yi Yi yi Yi ai i b xi x .
(4.23)
A (4.23) kifejezést négyzetre emelve és i szerint szummázva, a következőt kapjuk:
yi Yi
2
yi Yi
2
nai i b 2
2
xi x
2
.
(4.24)
A vegyes szorzatokat tartalmazó szummák mindegyike zérus. 4-1. táblázat Az eltérés
Négyzetösszeg
Szabadsági fok
A négyzetösszeg várható értéke
a és
a 2 n
1
y2
b és
b 2 xi x 2
1
y2
2
n2
n 2 y2
2
n
n y2
Az empirikus regressziós görbe körül y i és Yi
y
i
Yi
Teljes
y
i
Yi
i
Az elméleti regressziós vonal körüli y i Yi eltérések a regresszióanalízis bevezetőjében ismertetett feltételezés értelmében normális eloszlásúak, y2 varianciával, így négyzetösszegük 2 y2 eloszlású, szabadsági foka n. A (4.24) összefüggés jobb oldalán szereplő három négyzetösszeg közül az elsőnek n 2 [mivel Yi és yi között fennáll a (4.9) és (4.10) összefüggés], a másik kettőnek egy-egy a szabadsági foka. A négyzetösszegek szabadsági fokainak összege n, me91
gegyezik a
y i Yi
2
négyzetösszeg szabadsági fokával. Ha a nullhipotézis igaz
i
[ekkor igaz a (4.23) szerinti algebrai felbontás], akkor a Fisher–Cochran-féle felbontási tétel mindkét feltétele teljesül, és a (4.24) jobb oldalán levő három négyzetösszeg mindegyike egymástól független, 2 y2 eloszlású. A H0 nullhipotézis ellenőrzése
2 -próbával lehetséges, ugyanis H0 fennállása esetén a (4.24) jobb oldalán szereplő kifejezés mindegyikének várható értéke:
E 2 y2 y2 E 2 y2 .
(4.25)
Az és értékének ismerete híján a három közül csupán a
y
i
Yi
2
négyzetö-
sszeg, s így a következőképpen definiált szórásnégyzet (ún. reziduális szórásnégyzet) számítható ki: 2 y i Yi 2 sr . n2 Ha a H0 nullhipotézis igaz, a (4.25) értelmében sr2 torzítatlan becslése y2 -nak.
Ekkor az sr2 n 2 / 2y kifejezés 2 eloszlású, szabadsági foka n 2 . A nullhipotézis ellenőrzésére a 2 -próbát akkor tudjuk elvégezni, ha előzetes kísérleti tapasztalatok alapján ismerjük y2 értékét. Ha a számított sr2 n 2 / y2 érték az szignifikanciaszinthez tartozó elutasítási tartományba esik, a nullhipotézist elutasítjuk, vagyis szignifikanciaszinten elutasítjuk a lineáris modellt. Sajnos a gyakorlati esetek döntő többségében y2 értéke nem áll rendelkezésre, tehát ismételt mérések nélkül nincs mód annak vizsgálatára, hogy a feltételezett egyenes adekvát-e. Az adatok feldolgozásakor az egyenes illesztése után nemcsak azt kérdezhetjük, hogy az egyenes megfelelő-e az adatok leírására, hanem azt is, hogy szükség van-e erre az egyenesre, vagyis a vízszintes egyenes nem épp olyan jó-e. A vízszintes egyenes az Y a y modellt jelenti, vagyis a 0 nullhipotézis vizsgálandó. Amennyiben az egyenes adekvátnak bizonyult, vagy legalábbis azt joggal feltételezzük, a (4.24) jobb oldalának minden tagja 2 y2 eloszlású, így az utolsó is, 1 szabadsági fokkal. A H0 : 0 nullhipotézis igazsága esetén ez a b2 xi x
2
négyzetösszegre is igaz. Az alkalmas próbastatisztika: b2 xi x F0
1 y i Yi
n 2
92
2
2
b2 xi x sr2
2
,
(4.26)
ahol a nevezőben az Y a b x x modellhez számított reziduális szórásnégyzet szerepel. A szakkönyvekben a (4.26) kifejezés többféle azonos alakjával találkozunk. Belátható, hogy 2 2 b2 x x Y y .
i
i
i
E képlet alapján szokás a szóban forgó négyzetösszeget a “regresszió négyzetösszegének” nevezni, mert azt fejezi ki, hogy a regressziós egyenes az y adatok átlagától mennyire tér el. Ugyanehhez az F0 próbastatisztikához vezet az ún. általános regressziós próba is:
S RH0 S R F0 , SR
(4.27)
R
ahol SR a teljes modellhez (itt Y a b x x ) számított reziduális négyzetösszeg; H S 0 a nullhipotézis szerinti redukált modellhez (itt Y a y ) számított reziduális R
négyzetösszeg; a két négyzetösszeg szabadsági fokszámainak különbsége, itt n 2 n 1 1 ; R a teljes modell reziduális négyzetösszegének szabadsági fokszáma. Esetünkre:
S RH0 yi y ; n 1; 2
i
(4.28a)
S R yi a b xi x ; n 2 . i
2
(4.28b)
H
S R 0 a következőképpen bontható föl algebrailag:
y i
i
2 y yi Yi i
Y y 2
i
2
.
(4.29)
i
Az első, az egyenlet bal oldalán lévő négyzetösszeget nevezhetjük “teljes” négyzetösszegnek, a második a reziduális, a harmadik a “regresszió” négyzetösszege. Vagyis a (4.27) általános regressziós próba számlálójában szereplő különbség éppen a “regresszió” négyzetösszege. Az F0 próbastatisztika aktuális értéke alapján dönthetünk arról, hogy a regresszió szignifikáns-e, vagyis a kérdéses függvény (itt az egyenes) jobban illeszkedik-e az adatokra, mint y , a vízszintes egyenes. Természetesen ez a próba csak akkor ad helyes eredményt, ha a teljesebb modell (itt az Y a b x x egyenes) csakugyan megfelelő az adatok leírására. Ugyancsak természetesen, ha a mérési hibák nem normális eloszlásúak, vagy nem
93
függetlenek egymástól, a (4.24)-ben szereplő négyzetösszegek nem lesznek 2 y2 eloszlásúak. A (4.29) egyenlet bal oldalán szereplő “teljes” négyzetösszeget, valamint a felbontásával kapott reziduális és “regressziós” négyzetösszegeket felhasználhatjuk arra is, hogy a regressziós függvény illeszkedésének jóságát mérjük. Erre szolgál a determinációs együttható:
Y y y y
2
i
R2
i
y 1 y
Yi
i
y
i
2
i
i
i
2
(4.30)
2
i
Azt mondhatjuk, hogy R2 az yi mérési adatok y átlagtól való eltérésének az a része, amely az Y regressziós függvénnyel magyarázható. Érdekes megjegyezni, hogy ez az R2 determinációs együttható algebrai átrendezésekkel belátható módon az x és y adatok közötti r korrelációs együttható négyzete, amelyet az eredeti értelmében szigorúan véve csak akkor volna jogos használni, ha x és y egyaránt valószínűségi változók lennének (ún. korrelációs modell). R2 értéke erősen függ az x független változó értékeitől, ahogy az a számláló
b2 xi x
2
írásmódjából rögtön látszik. Az R2 értéke ugyancsak erősen függ a
modell paramétereinek p számától. Szélső esetben, ha a modellnek ugyanannyi (p = n) paramétere van, mint mérési pont, például n 1 -edfokú polinomot használunk, az yi Y 0 , vagyis R2 1 lesz. 2 Ezért szokás egy igazított R2-et ( Radj ) használni, amely nem a négyzetösszegeket,
hanem a megfelelő szórásnégyzeteket tartalmazza:
yi Yi
2 Radj 1 1 R2
n 1 1 n p
2
i
n p
2 yi y
1
sr2 , sT2
(4.31)
i
n 1
ahol
sT2
az ún. teljes eltérés szórásnégyzete.
A becsült regressziós egyenes varianciája Az Y becsült regressziós egyenes egy pontjának szórásnégyzete:
2 Y2 2 y2 1 x x 2 s . n xi x 2 2 Y
94
i
(4.32)
Felhasználva, hogy 1 Y2 sY2 s 2y n
s 2y
2 y2 ,
. 2 i x i x
x x 2
(4.33)
Ugyanígy kapjuk Var a és Var b becsléséül az sa2 és sb2 kifejezését:
s 2 a
2 a
b2 sb2
s 2y n
,
(4.34) s 2y
x
i
x
2
.
(4.35)
i
Ha a lineáris függvény adekvát, az sr2 reziduális szórásnégyzet 2 y2 eloszlású, így s y2 -ként használhatjuk. Az Y becsült regressziós egyenes egy pontjának szórásnégyzete (4.34) és (4.35) felhasználásával:
sY2 sa2 sb2 x x sa2' sb2 x 2 2 xx . 2
(4.36)
ahol sa'2 az a' tengelymetszet szórásnégyzete, sa2' sa2 sb2 x 2 . Az sa2' -vel felírt kifejezés azért igen hasznos, mert a számítógépi programok általában sa2' értékét adják meg. A becsült paraméterek konfidenciaintervalluma A t-eloszlást definiáló összefüggés értelmében a következő statisztika t-eloszlású: a és n 2 , (4.37a) t sa sy ahol . (4.37b) sa n Hasonlóan t
b ; n2, sb
ahol
(4.38a)
sb
sy
x
i x
2
,
(4.38b)
és
95
t
Y Y ; n2, sY
(4.39)
ahol sY a (4.33) kifejezés négyzetgyöke. Az előbbi statisztikák alapján adott valószínűségi szintekhez -ra és -ra konfidenciaintervallumot, az Y függvényre pedig konfidenciasávot számíthatunk. 4-1. példa Egy standard anyagból különböző koncentrációjú oldatokat készítettek, majd minden oldatból azonos mennyiséget (1 l) gázkromatográfba fecskendezve, kísérletileg vizsgálták a kapott csúcs alatti terület (y) és a koncentráció (x) közötti összefüggést. A mérési adatok a 4-2. táblázatban láthatók, a koncentráció értéke szerint növekvő sorrendbe rendezve. A tényleges mérési sorrendet a táblázat második oszlopa tartalmazza. Feltételezve, hogy a terület és a koncentráció közötti függvénykapcsolat lineáris, adjunk becslést az egyenes paramétereire (kalibrációs egyenes)! 4-2. táblázat
i
A mérés
Mérési adatok
Számított adatok
sorrendje
xi
yi
(mg/ml)
(terület)
x
xi x
i
x
2
yi xi x
1
3
0
0
–0.083333
·102 0.69444
2
5
0.05
1681894
–0.033333
0.11111
–56063
3
4
0.08
2614987
–0.003333
0.00111
–8717
4
2
0.10
3297753
0.016667
0.02778
54963
5
1
0.12
3983787
0.036667
0.13444
146072
6
6
0.15
4978455
0.066667
0.44444
331897
0.50
16556876
1.41333
468152
x = 0.083333;
y = 2759479;
a = y = 2759479;
b
y x x 468152 . 10 x x 141333 i
i
2
2
3.3124 10 7 ;
i
Y = 2759479 + 3.3124·107·(x – 0.083333) = –843 + 3.3124·107·x.
A becsült Yi értékek és a reziduális szórásnégyzet számítása: 96
0
4-3. táblázat i 1 2 3 4 5 6
sr2
sorrend 3 5 4 2 1 6
xi 0 0.05 0.08 0.10 0.12 0.15
y i Yi
Yi
yi 0 1681894 2614987 3297753 3983787 4978455
y
i
Yi
y 2
i
Yi
sr
–8
–843 1655357 2649077 3311557 3974037 4967757
843 26537 –34090 –13804 9750 10698
22.671 108 5.6678 108 ; 62
·10 0.007 7.042 11.621 1.906 0.951 1.144 22.671
0.0354 1.1147 –1.4319 –0.5798 0.4095 0.4494
sr 2.3807 104 .
A regresszió feltételeinek ellenőrzése a reziduumok grafikus vizsgálatával Ismételt mérések hiányában nincs lehetőség y2 modelltől független becslésére, ezért a regresszió feltételeit csak a reziduumok grafikus vizsgálatával tudjuk ellenőrizni. Az y i Yi reziduumokat a mérések sorrendjében ábrázolva ellenőrizhetjük, hogy a mérések egymásutánjában a mérési hibáknak nincs-e egyirányú menete (az i és i1 hibák függetlenek-e). 40000 30000 20000 10000
reziduum
0 -10000 -20000 -30000 -40000 0
1
2
3
4
5
6
sorrend
4-2. ábra. A reziduumok a mérések sorrendjének függvényében
97
A 4-2. ábrán az adatoknak nincs egyirányú menete, tehát az i hibák nem korreláltak. 1.6 1.2
reziduum/sr
0.8 0.4 0.0 -0.4 -0.8 -1.2 -1.6 0
1e6
2e6
3e6
4e6
5e6
y
4-3. ábra. A standardizált reziduumok az yi mérési adatok függvényében
y
Yi
ún. standardizált reziduum értékeket a mért yi függvényében sr ábrázoljuk (4-3. ábra). Mivel a pontok zérus körül véletlenszerűen ingadoznak, azaz nem tapasztalunk trendet, és a reziduumok eltolódást sem mutatnak, az illesztett lineáris függvény adekvát. Mivel az adatok azonos szélességű sávban ingadoznak, elfogadhatjuk azt a feltételezést is, hogy y2 konstans.
Az ún. Gauss-háló (valószínűségi papír) vízszintes tengelyén a reziduumokat, függőleges tengelyén pedig az elméleti eloszlásfüggvényből visszaszámolt valószínűségi változó (normal score) értékeket ábrázoljuk (4-4. ábra). Mivel az így előállított ábrán a pontok egyenes mentén helyezkednek el, és nem találunk kiugró pontot vagy szisztematikus eltérést, elfogadhatjuk azt a feltételezést, hogy az i hibák normális eloszlást követnek.
98
Az
i
1.6 1.2 0.8
u
0.4 0.0 -0.4 -0.8 -1.2 -1.6 -40000
-30000
-20000
-10000
0
10000
20000
30000
40000
reziduum
4-4. ábra. A reziduumok ábrázolása Gauss-hálón Szignifikáns-e a regresszió (nem zérus-e a meredekség)? Szükség van-e erre az egyenesre (vagyis a vízszintes egyenes nem épp olyan jó-e)? A vízszintes egyenes az Y a y modellt jelenti, vagyis a 0 nullhipotézis vizsgálandó. A nullhipotézist a (4.26) általános regressziós próbával ellenőrizzük. Regressziós négyzetösszeg:
Y y
b2 xi x 3.3124 107 141333 . 10 2 1.5507 1013 .
2
2
2
i
Reziduális négyzetösszeg:
y F0
i
Yi
2
2.2671 109 ,
b2 xi x
y
i
Yi
2
2
sr2 5.6678 108 .
b2 xi x sr2
2
1.5507 1013 4 8 2.736 10 . 5.6678 10
i
n2 A Függelék IV. táblázatából F0 .05 1,4 7.71 , a próbastatisztika aktuális értéke ezt meghaladja, tehát a nullhipotézist elutasítjuk, azaz szükség van az egyenesre, a regresszió szignifikáns (a vízszintes egyenes nem megfelelő). Statisztikai programok használatakor általában nincs szükségünk a IV. táblázatra, mivel a programok megadják a próbastatisztika számított értékéhez tartozó elsőfajú hiba valószínűségét, amelyet általában p-vel jelölnek. Ez az érték jelenleg rendkívül kicsi ( p 0.05 ). A 4-4. táblázatban a statisztikai programok eredményközlésének megfelelő elrendezésben (ún. ANOVA táblázat) megadjuk a (4.29) összefüggés bal és jobb oldalán szereplő négyzetösszegeket (S), szabadsági fokaikat (), valamint a szórásnégyzetek értékét. A táblázat utolsó előtti oszlopában az F0 próbastatisztika értékét, utolsó 99
oszlopában pedig az elsőfajú hiba valószínűségét találjuk (a nullhipotézis érvényessége esetén ekkora a valószínűsége annak, hogy F0 értéke 27360, vagy annál nagyobb legyen). 4-4. táblázat S
s2
F0
p
1.5507·1013
1
1.5507·1013
2.736·104
8·10-9
0.0002·1013
4
5.6678·108
1.5509·1013
5
négyzetösszeg
Y y
2
i
i
y
i
Yi
2
i
y
i
y
2
i
Mivel b normális eloszlás szerint ingadozik körül, t-próbával is vizsgálható, hogy az egyenes meredeksége szignifikánsan különbözik-e zérustól. A próbastatisztika: b b t0 sb
x
i
x
sr
2
3.3124 10 7 141333 . 10 2 3.9379 10 6 165.41 2.3807 10 4 2.3807 10 4
Ez éppen az előbbi F0 négyzetgyöke. Általánosan is igaz, hogy egy szabadsági fokú t-eloszlású valószínűségi változó négyzete F 1, eloszlású, amint erről a t és F táblázat összevetésével is meggyőződhetünk. Számítsuk ki a determinációs együtthatót! R2
y 1 y
i
Yi
i
y
i
2
2
1
2.269 10 9 0.99985 1.5509 1013
i
A teljes eltérés-négyzetösszeg 99.985%-át „magyarázza” az illesztett egyenes. Áthalad-e az igazi egyenes az origón? A nullhipotézis: H0: Y x 0 ' 0 . A próbastatisztika kiszámításához szükségünk van az a' tengelymetszet sa' szórására, azaz sY értékére az x = 0 helyen.
sr2 5.6678 108 s 9.446 10 7 , n 6 2 a
s 2 b
sr2
x
j
x
2
5.6678 10 8 10 2 4.010 10 , 1.41333 10
j
sa2' sa2 sb2 x 2 9.447 107 4.010 1010 0.083332 3.7295 108 , 100
t0
a' sa'
843 3.7295 108
0.043 ,
t 0.05 2 4 2.776 ,
2.776 t0 2.776 .
Mivel a próbastatisztika értéke a 0.05 szignifikanciaszinthez tartozó elfogadási tartományba esik, nem utasítjuk el azt a nullhipotézist, hogy az egyenes átmegy az origón. 4.2.3. A mérések sorrendje Képzeljük el a következő helyzetet: egy anyag bemért koncentrációja függvényében mérjük az abszorbanciáját (analitikai jel), és az összefüggést lineáris függvénnyel írjuk le. A méréseket nem tudjuk nagyon rövid idő alatt elvégezni, és az eltelt idő alatt az anyag nedvességet szív magába, ami az abszorbanciáját is megváltoztatja. A 4-5. ábra fölső képei szemléltetik az abszorbanciának a koncentrációtól és az eltelt idő alatt felvett nedvességtől való függését külön-külön, ha nincs mérési bizonytalanság. A valóságos mérésnél a koncentráció és a nedvesség hatása együtt jelentkezik, ráadásul a mérést mérési hiba is terheli. A kísérletezőn múlik, hogy az egyes méréseket milyen sorrendben végzi el.
Az egyik (nagyon kézenfekvő) lehetőség, hogy a koncentráció növekvő sorrendjében mér, ezt mutatja a bal oldali ábra (a bal oldali fölső ábrán az időtengelyre bejelölt x adatok nagyság szerinti sorrendben vannak). Ekkor a két hatás összege körül ingadozó pontokat kap az y tengelyen x függvényében, vagyis az illesztett függvény a két hatás összegét becsüli (a két függvény összege lesz). Ez látható a bal oldali középső képen, ahol Y x az abszorbancia valódi koncentrációfüggvénye. Ha a kísérletező gondos, és az egyenes illesztése után a reziduumokat is ábrázolja a mérések sorszáma (bal oldali legalsó ábra) ill. az x változó függvényében, nem lát rendszerességet (zérus körül véletlenszerű ingadozást tapasztal), mert a két hatás összegét leíró egyenes körül véletlenszerű az ingadozás. Tehát a kísérletezőnek minden oka megvan, hogy azt higgye, az illeszkedés megfelelő, és nem szerez tudomást róla, hogy az abszorbanciának a koncentrációtól való függésébe egy zavaró tényező (az időben fölvett nedvesség) hatását is belemérte és beleszámolta. Amikor használja az összefüggést, tipikusan kalibrációs egyenesként, akkor az ismeretlen koncentrációjú anyag abszorbanciájából számolja a koncentrációt, de ez hamis lesz, mert a nedvességtartalom eltéríti.
101
et 1.0
et 1.0
0.8 0.6 0.4 0.2 0.0
0.8 0.6 0.4 0.2 0.0
x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 idõ 12 10 8 6 4 2 0
y
y 10 8 6
Y(x)
Y(x)
4 2 0
x
x 0.7
reziduum
0.7
reziduum
idõ
x9 x1 x3 x10 x6 x5 x8 x4 x2 x7
0.3 -0.1 -0.5
0.3 -0.1 -0.5
0
2
4
6
8
mérési sorrend
10
12
0
2
4
6
8
10
12
mérési sorrend
4-5. ábra. A mérések végrehajtásának sorrendje
A másik lehetőség, hogy nem a növekvő koncentráció sorrendjében mér, hanem véletlenszerű sorrendben, ebbe beleértve, hogy ha egy koncentrációnál több ismételt mérést végez, azok nem egymás után következnek. Ez látható a jobb oldali fölső ábrán, ahol az időtengelyre bejelölt x adatok nem nagyság szerinti sorrendben vannak. Ekkor az egyre nagyobb koncentrációértékekhez nem tartozik egyre nagyobb nedvességtartalom, vagyis bár itt is a két hatás összegét méri, de a két hatás nem mutat egy irányba, a nedvességtartalom (az idő) járuléka nem nő monoton módon a koncentrációval. Ilyenkor az időbeliség egyrészt eltorzítja az összefüggést (nagyjából párhuzamosan fölfelé tolja el az egyenest), másrészt nagyobb szóródást okoz. Ha a kísérletező ábrázolja a reziduumokat x függvényében (az ábrán ez nem látható), az előbbi esetben tapasztaltnál valamivel nagyobb ingadozást lát, de az most is véletlenszerű. Ha azonban a mérések sorszáma függvényében ábrázolja a reziduumokat, azok rendszerességet mutatnak, mert az abszorbanciának az időtől (a nedvességtartalomtól) való függéséről az illesztett egyenes nem ad számot, azt az egyenestől való eltérésként észleljük.
A növekvő koncentráció sorrendjében végzett mérés tehát olyan torzítást okoz, amit nincs módunk a reziduumok vizsgálatával észrevenni. A véletlenszerű sorrendben végzett mérésnél is van torzítás (és a szórás is nagyobb lesz), de még egy jelenségről (az idő hatásáról) is értesülünk, amit az adatok korrekciójánál illetve a módszer fejlesztésénél felhasználtunk. 102
4.3. Lineáris regresszió ismételt mérések esetén, y2 konstans Minthogy ismételt mérések híján az illesztett függvény alkalmasságára statisztikai próbát nem tudnánk végezni, célszerű minden x beállításnál, vagy azok egy részében ismételt mérést végezni y-ra. A mérési adatok táblázata (pi az i-edik pontban végzett ismétlések száma): x1 x2 . xi . xn
y12, …, y1k, …, y1p1; y22, …, y2k, …, …., y2p2;
y11, y21, . yi1, . yn1,
yi2, …, yik, …,
…,
…,
yipi
yn2, …, ynk, …,
…,
…,
…, ynpn.
A paraméterek becslése Ismételt mérések esetén, amennyiben a bevezetőben említett feltételek teljesülnek, a maximum-likelihood-módszer szerinti becslési kritériumot megkapjuk, ha az egyes y értékekhez tartozó feltételes sűrűségfüggvényeket előbb k (az ismétlések) szerint, majd i (a mérési beállítások) szerint összeszorozzuk: pi
n
L i 1 k 1
1
y
i
n
L' ln L i 1
1 y Y x ; , 2 ik i exp ; 2 2 yi
(4.40)
pi 1 n pi y ik Y x i ; , ln 2 2 ln yi 2 2 i1 k 1 y2i
2
.
(4.41)
Az L és L’ függvényeknek a becsült paraméterek szerinti maximuma ott van, ahol n
pi
y
ik
i 1 k 1
Y x i
yi2
2
min .
(4.42)
Mivel most a yi2 konstans esettel foglalkozunk, a becslési kritérium megegyezik a legkisebb négyzetek módszere szerinti becslési kritériummal:
y n
pi
i 1 k 1
ik
2 Y x i min .
y
Ez a négyzetösszeg az
(4.43)
ik
Yi
eltérések 4-6. ábrán bemutatott fölbontásának
megfelelően tovább bontható: n
pi
y i 1 k 1
n
ik
2 y i pi y i Yi i 1
2
min .
(4.44) 103
yy
x , y x , y
yik yi y i Yi
i
ik
i
i
x , Y i
Yi Yi
i
x , Y i
a
i
Y x x
Y a b x x
xx
xxi
i
4-6. ábra. Az egyedi mérési adat y ik , az ismétlések átlaga y i , a becsült és a valódi érték Y , ill. Y közötti eltérések szemléltetése
i
i
pi
y k 1
yi
ahol
pi
ik
.
(4.45)
Az első négyzetösszeg független Yi -től, ezért a likelihood-függvénynek az Yi függvény becsülendő paraméterei szerinti maximuma egybeesik a második szumma minimumával. A becslési kritérium tehát:
n
pi yi Yi i 1
p y 2
n
i
i 1
i
a b xi x
2
min .
(4.46)
A kritériumot a és b szerint parciálisan differenciálva és a deriváltakat nullával egyenlővé téve a normálegyenleteket kapjuk. Átrendezés után az egyenletrendszer:
p y i
i
104
i
a pi b pi x i x i
i
(4.46)
p y x i
i
x a pi xi x b pi xi x . 2
i
i
i
(4.47)
i
x -ra teljesülnie kell a következő feltételnek, ahhoz, hogy az első egyenlet jobb oldalán a második tag és a második egyenlet jobb oldalán az első tag nulla legyen (így az a becslés egyedül az első egyenletből, a b becslés egyedül a második egyenletből adódik, vagyis függetlenek):
p x i
i
x 0 .
(4.48a)
i
Vagyis x definíciója erre az esetre:
px x p
i i
i
.
(4.48b)
i
i
A normálegyenletekből kifejezhetjük az a és b becsléseket:
p y a p i
i
i
;
(4.49)
i
i
p y x x b . p x x i
i
i
i
(4.50)
2
i
i
i
Megmutatható, hogy amennyiben az elméleti regressziós függvény alakja Y x x , a (4.49) és (4.50) kifejezések torzítatlan becslései -nak, ill. -nak. A négyzetösszeg felbontása Az előzőkhöz hasonlóan a valódi értéktől (az elméleti regressziós egyenestől) való eltérések felbonthatók:
y
ik
Yi y ik y i y i Yi Yi Yi .
(4.51)
Négyzetre emelve, i és k szerint szummázva:
y i
ik
2 2 Yi y ik y i pi y i Yi
k
i
k
p Y Y 2
i
i
i
i
2
.
(4.52)
i
Ha feltételezzük (H0 nullhipotézis), hogy az elméleti regressziós függvény (a valódi függvény) Y x x alakú, a (4.52) jobb oldalán álló utolsó szumma tovább bontható behelyettesítve, hogy Y a b x x : i
i
p Y Y a p b p x 2
i
i
i
i
i
i
x . 2
2
2
i
i
(4.53)
i
105
Ha az igazi függvény nem lineáris, a (4.53) szerinti felbontás algebrailag hibás. 4-5. táblázat Az eltérés a és
Négyzetösszeg
Szabadsági fok
a 2 pi
1
b 2 pi xi x 2
b és Az empirikus regressziós görbe körül, y i és Yi A csoportokon belül, y ik és y i
p y
y i
i
2
Yi
yi
2
ik
Yi
2
k
y
Teljes
i
i
ik
Szórásnégyzet
1 n–2
p
i
n
p
sr2 se2
i
k
Minthogy y ik normális eloszlású, Yi várható értékkel, a teljes négyzetösszeg (amely nem számítható ki) biztosan 2 y2 eloszlású. Mivel a táblázat első négy sorában szereplő négyzetösszegek szabadsági fokainak összege megegyezik a teljes négyzetösszeg szabadsági fokával, a négyzetösszegek 2 y2 eloszlásúak, és egymástól függetlenek. Megjegyzendő, hogy a csoportokon belüli eltérések négyzetösszege az Y függvény alakjától függetlenül 2 y2 eloszlású. A táblázat első két szórásnégyzete és ismeretének híján nem számítható ki. A másik két (kiszámítható) szórásnégyzet: sr2 , az ún. reziduális szórásnégyzet:
sr2
p y i
Yi
i
2
i
;
n2
(4.54)
se2 , a csoportokon belüli, ún. error szórásnégyzet
y p
ik
se2
i
yi
k
i
n
2
.
(4.55)
Az se2 csoportokon belüli szórásnégyzet a variancia torzítatlan becslése, függetlenül az Y függvény alakjától.
106
A reziduális szórásnégyzet azonban csak akkor 2 y2 eloszlású, ha a tapasztalati regressziós függvény „megfelelő alakú”, vagyis az elméleti regressziós függvény lineáris. Esetünkben tehát akkor, ha Y x x . Ha pl. az elméleti (valódi) regressziós függvény Y 'x x 2 alakú, akkor a (4.53) felbontás algebrailag hibás, az Y a' bx tapasztalati regressziós függvény csak 0 esetén torzítatlan becslése az elméleti regressziós függvénynek. Azt a tényt, hogy sr2 csak akkor 2 y2 / eloszlású, ha a választott regressziós görbe megfelelő alakú, felhasználhatjuk a tapasztalati regressziós függvény ( Y ) jóságának (adekvát voltának) ellenőrzésére. Az F-eloszlás 2.1.5. pontban tárgyalt definíciója szerint [(2.18) és (2.19) egyenletek]: 2 2 r2 r y r r sr2 F 2 2 2 2 , e e y se e e
amennyiben sr2 2 y2 r eloszlású, vagyis a tapasztalati regressziós görbe adekvát (ez a nullhipotézis). Ha az sr2 se2 arány ( sr2 se2 ) nem halad meg fölfelé egy F kritikus értéket, azt mondhatjuk, hogy a mérési adatok nem mondanak ellent annak a nullhipotézisnek, amely szerint az elméleti és tapasztalati regressziós görbe matematikailag azonos alakú (egyoldali próba). Ha elfogadjuk a nullhipotézist, egyben azt állítjuk, hogy sr2 és se2 egyaránt y2 torzítatlan becslései. A kettő együtt több információt nyújt, mint bármelyik különkülön, mivel az így egyesített szórásnégyzet nagyobb szabadsági fokú (tehát kisebb varianciájú) becslése y2 -nak, mint akár sr2 , akár se2 . Célszerű tehát a két becslést egyesíteni. A 2-eloszlás addíciós tétele alapján
v2 v2 v2 , 1
2
1
(4.56)
2
és így
v2 y2 v2 y2 v2 y2 , 1
2
1
(4.57)
2
y y p y Y p n n 2 2
y2 s y2
s e s r e r 2 e
2 r
ik
i
i
k
i
i
i
2
i
.
(4.58)
i
107
A becsült paraméterek és a tapasztalati regressziós görbe konfidencia-tartománya A konfidenciatartományok a t-eloszlás alapján számíthatók, az alábbi szórások felhasználásával:
y2
Var a sa
sy
p
Varb sb
p
,
(4.59a)
i
,
(4.59b)
i
y2
pi x i x sy
p x i
i
x
2
2
,
(4.60a)
;
(4.60b)
2 1 x x Var Y Var a x x Var b 2y 2 , pi pi x i x i i
sY s y
2
1
x x 2
p p x i
i
i
i
x
(4.61a)
sa2 sb2 x x . 2
2
(4.61b)
i
4-2. példa Dolgozzuk fel a következő mérési adatokat: 4-6. táblázat yik xi 20 14 10 5 1.25
i 1 2 3 4 5
ha k 1 2.0046 1.5404 1.0043 0.5756 0.1952
2 2.1167 1.4737 1.0059 0.6248 0.2362
3 2.0059 1.5205 1.1068 0.5701 0.1954
pi 4 2.1028 1.5372 1.0036 0.6275 0.2437
5 2.1053 1.4512 0.2455
p
i
x
108
5 20 5 14 4 10 4 5 5 1.25 10.2717 . 23
5 5 4 4 5 23
Először ellenőrizzük, hogy jogos-e a y2 konstans feltételezés! Számítsuk ki minden i pontban az s y2i
y
ik
yi
k
pi 1
2
szórásnégyzet értékét (4-7. táblázat):
4-7. táblázat
y
i
ik
yi
2
s y2i
k
1 2 3 4 5
0.012844 0.006404 0.007836 0.002859 0.002643 =0.032587
y
ik
yi
2
k
pi 1 0.003211 0.001601 0.002612 0.000953 0.000661
Az s y2i értékekre Bartlett-próbát végezhetünk (2.2.6.1. pont). A 2-17. példában éppen ezeket az adatokra végeztük el a Bartlett-próbát. Azt találtuk, hogy a kapott szórásnégyzetek nem különböznek egymástól szignifikánsan, és nincs egyirányú menetük, ezért elfogadtuk, hogy y2 = konstans. A regressziós egyenes paramétereinek becslése:
4-8. táblázat i 1 2 3 4 5
yi
pi y i
2.0671 1.5046 1.0302 0.5995 0.2232
10.3355 7.5230 4.1208 2.3980 1.1110 25.4933
a
p y p i
i
i
x
i
x
9.7283 3.7283 –0.2717 –5.2717 –9.0217
25.4933 11084 . ; 23
x
i
x
2
pi y i x i x
pi x i x
100.5468 28.0480 –1.1196 –12.6415 –10.0682 104.7655
473.1991 69.5010 0.2953 111.1633 406.9554 1061.1141
94.6398 13.9002 0.0738 27.7908 81.3911
b
2
p y x x 104.7655 0.0987 . . p x x 10611141 i
i
i
2
i
i
A tapasztalati regressziós egyenes egyenlete: Y 11084 . 0.0987 x 10.2717 0.0946 0.0987 x .
109
4-9. táblázat
y
i
Yi
y i Yi
1 2 3 4 5
2.0686 1.4764 1.0816 0.5881 0.2180
–0.0015 0.0282 –0.0514 0.0114 0.0052
s 2 r
se2
p y i
Yi
i
i
2
pi y i Yi
2
1.125·10–5 3.976·10–3 1.057·10–2 5.198·10–4 1.352·10–4 1.521·10–4
1521 . 10 2 5.070 10 3 ; 3
yi
k
i
2
n2 ik
Yi
2.250·10–6 7.952·10–4 2.642·10–3 1.300·10–4 2.704·10–5 =
i
y p
i
n
2
0.032587 1810 . 10 3 ; 23 5
i
5.070 10 3 F0 2.804 . 1810 . 10 3 Az F-eloszlás kritikus értéke 95 % -os egyoldali szinten ( = 0.05), ha a számláló szabadsági foka 3, a nevezőé 18 (l. a Függelék IV. táblázatát): F0.05(3, 18) = 3.16. Azt mondhatjuk, hogy a számított egyenes (a tapasztalati regressziós görbe) a mérési pontokat megfelelően leírja. Az egyesített szórásnégyzet:
r sr2 e se2 3 5.070 10 3 18 1810 . 10 3 s 2.276 10 3 . r e 3 18 2 y
Adjunk 95 %-os ( = 0.05) valószínűségű konfidenciaintervallumot -ra!
s 2 b
s 2y
p x i
i
x
sb 1.46 103 ;
2
2.276 103 214 . 10 6 , 106111 . t / 2 t 0 .025 21 2.08 ,
P b t / 2 sb b t / 2 sb
P0.0987 2.08 146 . 10 3 0.0987 2.08 146 . 10 3
P0.096 0102 . 0.95 .
a) Vizsgáljuk meg, hogy az elméleti regressziós egyenes átmegy-e az origón! 110
H0: ’ = 0, Y x 0 0 ,
H1 : ’ 0.
Ha H0 igaz, a következő statisztika t-eloszlású:
t
Y x 0 ; sY x 0
1 x 10.2717 2 s 2.276 10 [l. a (4.61b) összefüggést]; 106111 . 23 2 3 2 sY 2.276 10 4.3478 10 9.9432 10 2 3.25 10 4 , 3
2 Y
sY x 0 180 . 102 , 0.0946 5.25 . 180 . 10 2 = 0.05 szignifikanciaszinten n = 21 esetén t0.05/2(21) = 2.08 (l. a II. táblázatot), t0 nagyobb ennél, ezért a nullhipotézist elutasítjuk, vagyis az egyenes nem megy át az origón.
és t 0
b) Számítsuk ki a tapasztalati regressziós egyenes 95 %-os konfidenciasávját!
P Y t / 2 sY Y Y t / 2 sY 0.95 , sY2 9.8957 105 21449 . 106 x 10.2717 . 2
4-10. táblázat i
Yi
sY2
t / 2 sY
Y t / 2 sY
Y t / 2 sY
1 2 3 4 5
2.0686 1.4764 1.0816 0.5881 0.2180
3.02·10–4 1.29·10–4 9.91·10–5 1.59·10–4 2.74·10–4
0.036 0.024 0.021 0.026 0.034
2.032 1.500 1.061 0.562 0.184
2.105 1.500 1.102 0.614 0.252
111
becsült egyenes 95%-os konfidenciasáv
2. 50
y 2. 00
1. 50
1. 00
@ yyiikk o yyi
0. 50
0. 00 0
5
10
15
20
25
x
x 4-7. ábra A 4-2. példa y ik és y i értékei, a becsült egyenes, és 95%-os konfidenciasávja
112
9. Bevezetés a kísérlettervezésbe 9.2. Többfaktoros kísérletek A hagyományos kísérletezésnél a független változók (faktorok) független vizsgálatának lehetőségét úgy biztosítják, hogy egyszerre csak egy faktor szintjét változtatják. Ezzel ellentétben a kísérlettervezés itt is tárgyalt módszertanának legjellemzőbb vonása az, hogy egyszerre több faktor (független változó) szintjét változtatjuk. 7
4. 5
x3
8
3.
x2
6 3 x3
1.
1
x2
4
x1
2
2.
a)
x1
b)
9-1. ábra. a) Egyszerre egy faktor szintjének változtatása, b) 23 teljes faktoros terv Vegyük először szemügyre a 9-1a) ábrát! Itt egyszerre csak egy faktor szintjét (egy független változó beállítását) változtatjuk, például az 1. alapponthoz képest a 2. pont csak az x1 beállításában különbözik, a 3. pontban megint csak az 1. alapponthoz képest x2 értékét változtattuk, s.i.t. Az 1. és 2. pont közötti különbségből értékeljük ki az x1 változtatásának hatását, az 1. és 3. pont közötti különbségből x2-ét, és így tovább. Az egyes változók hatásának kvantitatív jellemzésére egyeneseket illeszthetünk. Például az x1 változtatásának hatását leíró egyenes meredeksége: y y1 , (9.1) b1 2 x12 x11 ahol az x első indexe a változót azonosítja, második indexe a kísérleti pontot. Az egyenes meredekségének varianciája:
Var b1
x
2 y2
12 x11
2
.
(9.2)
113
Nézzük most meg a 9-1b) ábrán az ún. 23 teljes faktoros tervet! Az összesen 8 beállítás a kocka csúcspontjaiban helyezkedik el. Ha itt akarjuk kiszámítani az x1 változtatásának hatását leíró egyenes meredekségét, ahhoz nemcsak az 1-2 pontpárt, hanem a 3-4, 5-6 és 7-8 pontpárt is használhatjuk (egyelőre feltéve a hatások additivitását), mert ezeknél is csak x1 értékében van különbség a két pont között (az iránytangenst a négy pontpárból egyenként kiszámoljuk, majd az így kapott négy érték átlagát használjuk becslésként). Az egyenes átlagos meredekségének varianciája negyedakkora lesz, mint amikor csak az 1-2 pontpárt használtuk (4 értéket átlagolunk, az átlag varianciája az ismétlések számával fordítottan arányos). Ugyanez igaz a másik két faktor (független változó) hatásának meredekségére. Tehát a kocka-tervből a függés meredekségének varianciája negyedakkora, vagyis a kocka-terv egyszeri végrehajtása (8 kísérlet) ugyanakkora statisztikai biztonságú következtetést ad, mint a változók egyenkénti változtatása a 9-1a) ábra szerint, de négyszer végrehajtva (összesen 16 kísérlet). Ez úgy is megfogalmazható, hogy a faktorok egyenkénti változtatásával többet (itt kétszer annyit) kell dolgozni ugyanannyi információért, mint ha a faktorokat egyszerre változtatjuk. A nyereség a kétféle kísérleti terv (a változók egyenkénti változtatása ill. egyszerre változtatása) között nem mindig ilyen arányú, függ a faktorok (független változók) számától. Például 3 helyett 4 faktor esetén az egyenkénti változtatás 5 kísérletet igényel, a kocka-terv 4 faktorra 23=8 helyett 24=16 kísérletből áll. Az utóbbi tervben minden változó hatására 8 pontpárunk van, tehát a kiszámított átlagos meredekség varianciája nyolcada az egy párból számítotténak. A kocka-tervben a kísérletek száma 16/5=3.2-szeres, a variancia csökkenése 8-szoros, az arány 2.5. Általánosan igaz, hogy k faktor esetén (k+1)/2-szer annyi kísérletet kell végezni a faktorok egyenkénti változtatásával, mint 2k tervvel, ha ugyanolyan varianciát kívánunk elérni a hatás meredekségére. A faktorok egyszerre változtatásának még egy előnye van. Az egyenkénti változtatásnál nem szerzünk tudomást róla, ha az egyik faktor hatása függ a másik faktor szintjétől (a másik változó beállított értékétől), vagyis ha kölcsönhatás van a faktorok között. Közismert például, hogy egyes gyógyszerek hatása függ attól, hogy mellette milyen más gyógyszert szed a beteg. Ha egyszerre csak egyféle gyógyszert adunk, a kölcsönhatás sohasem derül ki. A kocka-tervből a kölcsönhatások is kiértékelhetők. Ilyenkor természetesen a hatások nem additívak, de a kísérleti terv szerkezete biztosítja (ortogonalitás), hogy külön értékelhessük ki őket. 9.3. Mennyiségi és minőségi változók, mérési skálák Változóink nemcsak mennyiségi, hanem minőségi jellegűek is lehetnek. A következő ún. mérési skálákat szokás definiálni: névleges (nominal, categorical): eredendően nem szám, például férfi-nő, szakaszos vagy folyamatos technológia, melyik üzemben végezzük a gyártást, az A, B vagy C szállítótól származó nyersanyagból stb. Még ha kódszámot adunk is az
114
egyes szinteknek, sorrendjük nem értelmezhető (pl. a férfiak személyi száma 1essel kezdődik, a nőké 2-essel, de ez nem sorrend, mint tudjuk!) sorrendi (ordinal, ordered categorical): eredendően ez sem szám, például hadnagy, főhadnagy, százados. Itt nincs értelme annak a kérdésnek, hogy a főhadnagy mennyivel magasabb rangú, mint a hadnagy. Illetve az a tény, hogy az alhadnagy és a főhadnagy között két rendfokozat van, míg a főhadnagy és a százados között csak egy, még nem mond semmit arról, hogy az alhadnagy és a főhadnagy között nagyobb-e a különbség, mint a százados és a főhadnagy között. Ezt a két skálát együtt minőségi skálának nevezzük.
intervallum- (interval): eredendően szám, például a °C-ban mért hőmérséklet. A 40 0C-os folyadék éppen 20 °C-kal melegebb a 20 °C-osnál, de nem kétszer olyan meleg. arányos (proportional): eredendően szám, például a K-ben mért hőmérséklet, tömeg, hosszúság stb. Természetes zérus-pontja van, és a 4 kg cukor tömege éppen kétszerese a 2 kg-énak.
Ezt a két skálát együtt mennyiségi skálának nevezzük. Ha a független változó minőségi változó, nyilvánvalóan értelmetlen a változók közötti függvénykapcsolatról beszélni (és például azt kérdezni, hogy lineáris vagy másodfokú függvény írja-e le megfelelően). Jelölhetjük ugyan a vízszintes tengelyen a különböző beszállítókat, a függőleges tengelyen a szállított huzal szakítószilárdságát, de nem rajzolhatunk az összefüggésre görbét. Ha a független változónk minőségi jellegű, az eredmények kiértékelésére a varianciaanalízist használhatjuk. Ha csak két szintje (kétféle beállítása) van, formálisan regresszióanalízissel is operálhatunk, de az illesztett lineáris függvénynek nem szabad tényleges értelmet tulajdonítanunk (ha a nyíregyházi beszállítótól vásárolt huzal szakítószilárdsága nagyobb, mint a sopronitól vásárolté, nem indokolt még keletebbre próbálkoznunk). Ha a független változónk mennyiségi jellegű, a kísérleti adatok földolgozására a varianciaanalízis és a regresszióanalízis egyaránt használható. Az utóbbi jobban használható következtetésekre, kvantitatív modellhez vezet. Egy kísérleti tervben a független változók lehetnek vegyesen minőségi és mennyiségi jellegűek is. Ilyenkor a regresszióanalízis és varianciaanalízis kombinációját használjuk az eredmények elemzésére. Hogy a független változó hányféle beállításánál végzünk kísérleteket, a változók jellege is befolyásolja. Mennyiségi változó esetén, ha lineáris összefüggés kielégítő lesz az eredmények leírására, két szint elegendő, másodfokú függvény illesztéséhez legalább 3 szint kell s.i.t. Minőségi faktorok esetén a probléma szakmai természete meghatározhatja a szintek számát (például hány beszállító termékét akarjuk összehasonlítani). Mindkét esetben az elvégzendő kísérletek száma a változók számától és beállítandó értékeik (szintjeik) számától függ. E könyv III. részében (10-19. fejezetek) a varianciaanalízis módszereit tárgyaljuk, tehát elsősorban a minőségi és vegyes változókkal végzett kísérletek földolgozását, 115
és bemutatjuk az ehhez használatos kísérleti terveket. A IV. részben a kétszintes minőségi és két- vagy többszintes mennyiségi faktorokkal végzett kísérletek földolgozásának módszertanát és az ehhez tartozó kísérleti terveket mutatjuk be. A két részben számos analógia van. Az utolsó fejezetben a kísérletes problémamegoldás lépéseivel, gyakorlati problémáival foglalkozunk.
IV. Faktoros kísérleti tervek 20. Kétszintes kísérleti tervek Az optimalizáló kísérlettervezés olyan speciális optimalizálási feladatnak tekinthető, amelyben az optimalizálandó függvény nem ismert (ún. fekete doboz). Helyette viszonylag egyszerű (lineáris és másodfokú) függvények alkalmazásával a független változóknak az optimális működés tartományát jellemző értékeit keressük. Az ismertetendő módszerek a változókat egyszerre változtatják, így egy-egy kísérlet minden változó hatásáról nyújt információt, a könnyű kiértékelést (legtöbbször az ortogonalitást) pedig a kísérleti terv matematikai tulajdonságai teszik lehetővé. A legegyszerűbb (lineáris) modell két szint (a független változók két-két értéke) beállítását igényli, mivel két pontra egyenes illeszthető. Ipari-technológiai és laboratóriumi problémáknál, ahol a kísérletek viszonylag gyorsan végrehajthatók, a kísérlettervezés-kísérletezés folyamatának minden lépésében a következő kísérletek optimális megtervezéséhez felhasználjuk az addig rendelkezésre álló ismereteinket az objektumról vagy jelenségről. Minél több az előzetes ismeretünk (a priori információ), annál hatékonyabb a további kísérletezés, abban az értelemben, hogy a lehető legkevesebb kísérlettel érjünk célhoz. A független változókat faktoroknak nevezik, beállított értékeiket szinteknek (faktorszinteknek). Feltételezzük, hogy e szinteket pontosan be tudjuk állítani. Gyakorlatilag ez azt jelenti, hogy beállításuk bizonytalansága elhanyagolható azon intervallum szélességéhez képest, amelyben értéküket változtatjuk. A faktorok nemcsak mennyiségiek lehetnek, hanem minőségiek is; pl. a nyersanyag gyártmánya, minősége, tisztasága, hogy melyik készüléken dolgozunk stb. 20.1. 2p típusú teljes faktoros kísérleti tervek A 2p típusú tervek p faktort tartalmaznak, mindegyiket két szinten vizsgálják. Ha minden beállításnál egyetlen kísérletet végzünk, a kísérleti terv N=2p pontot tartalmaz. Jelölje zj a j-edik faktort, z 0j a faktor alapszintjét:
z 0j 116
z max z min j j 2
.
(20.1)
A z 0j (j = l, ..., p) értékekkel jellemzett pontot a terv centrumának nevezik. A zj ún. variációs intervallum definíciója: z j
z max z min j j
. 2 A faktorokat a következőképpen célszerű transzformálni:
xj
z j z 0j z j
(20.2)
, j=1, ..., p.
(20.3)
Az így kapott xj faktor értéke +1 a magasabbik szinten ( z j z max ), –1 az alacsoj nyabbik szinten ( z j z min ). j Minőségi faktorok esetén az alapszint és a variációs intervallum általában nem értelmezhető, a szintek azonban igen; pl. egyik vagy másik típusú készüléken végezzük a kísérletet, analitikai vagy technikai tisztaságú nyersanyagból dolgozunk stb. A kísérleti terv az a táblázat, amely kísérletenként megadja az egyes faktorok beállítandó értékeit (szintjeit). Két faktor esetére a kísérleti terv pl.: N = 22 = 4 (l. a 20-1. ábrát). x2 +1
3
4
i 1 2 3 4
0
-1
2
1
-1
0
+1
x1 – + – +
x2 – – + +
x1
20-1. ábra. 22 kísérleti terv beállításai A két faktor esetében jól látszik, de általánosan is belátható, hogy a 2p típusú teljes faktoros kísérleti tervek ortogonális tulajdonságúak, vagyis a faktorokra (független változókra) teljesül, hogy
x
ji
x ki 0 , ha jk; j, k = 1, ..., p.
i
A feltételezett modell (elméleti regressziós függvény): 117
Y = 0 1 x1 2 x2 ...p x p .
(20.4)
A lineáris regresszióban és a konfidenciavizsgálatokban itt is célszerű egy szimbolikus x0 változót bevezetni, amelynek értéke mindig +1, így a 0 paraméter a többivel azonosan kezelhető, helyette a (20.4)-ben 0x0 írható. Az így kibővített kísérleti terv: i x0 x1 x2 1 + 2 + + 3 + + 4 + + + Könnyen belátható, hogy az újonnan bevezetett x0 faktorral is teljesül az ortogonalitás feltétele (l. az 5.2. alfejezetet):
x
ji
x ki 0 , ha jk; j, k=0,1, ..., p.
i
A paraméterek becslésére, minthogy ortogonális változókról van szó, az 5.2. alfejezetben levezetett formulák használhatók:
yx x i
bj
ji
i
2 ji
yx i
ji
i
,
N
(20.5)
i
ahol N a kísérleti terv pontjainak (beállításainak) száma. Az ortogonalitás következtében a bj együtthatók egymástól független becslések, vagyis az egyes faktorok hatása más faktorokétól függetlenül vizsgálható annak ellenére, hogy a kísérleti tervben több faktor szintjét (a független változók értékét) változtatjuk egyszerre. A becsült paraméterek varianciája:
Var b j
y2
x 2ji
y2 N
.
(20.6)
i
A becsült regressziós függvény varianciája:
p
Var Y x 2j Var b j j 0
y2
p
x N j 0
2 j
.
(20.7)
Ez egy p-dimenziós gömb egyenlete, vagyis a becsült függvény varianciája a faktortér bármely irányában csak a terv centrumától mért távolságtól függ. E tulajdonságot forgathatóságnak (rotatability) nevezik, és azért előnyös, mert a kísérleti terv elkészítésekor még nem tudjuk, hogy az optimum felé haladás szempontjából melyik irány fontos számunkra, és ezért melyik irányban kívánatos Y bizonytalanságát csökkenteni.
118
A kísérleti tervek értékelésekor szokás a faktorok hatását grafikusan szemléltetni és számszerűen is megadni. A j-edik faktor hatása (hj) az alábbi képlettel írható le:
h j y j y j
(20.8)
ahol y általánosságban a függő változó (célfüggvény) számtani középértéke; a j+ és j alsó index a fölső, illetve az alsó szinthez tartozó középértéket jelez. Könnyen belátható, hogy a b j együttható értéke a megfelelő hatás fele. Ezt szemlélteti a transzformált x j változó függvényében a 20-2. ábra.
y N
bj
b0
b0
hj
y i 1
i
N
bj
y x0j
-1
xj
+1
20-2. ábra. A faktor hatásának és együtthatójának kapcsolata
20-1. példa 22 kísérleti terv végrehajtásakor két célfüggvényt (y1 és y2) vizsgáltak és az alábbi eredményeket kapták: 20-1. táblázat i 1 2 3 4
x0 + + + +
x1 – + – +
x2 – – + +
x1x2 + – – +
y1 23 19 31 27
y2 26 12 30 32
a) Először értékeljük ki a tervet az y1 változóra! A (20.4) lineáris modell paramétereinek becslése: 119
b0
23 19 31 27 25 ; 4
b2
23 19 31 27 58 42 4. 4 4
b1
23 19 31 27 46 54 2 ; 4 4
A becsült sík egyenlete: Y 25 2x1 4x 2 . Az 1. faktor hatása a fölső szinten és az alsó szinten mért y1 értékek átlagainak különbsége: 19 27 23 31 46 54 1. faktor: h1 23 27 4 , 2 2 2 2 31 27 23 19 58 42 2. faktor: h2 29 21 8 . 2 2 2 2 Tehát a 20-2. ábrának megfelelően a hatás az együttható kétszerese.
30
30
28
28
26
26
y1
y1
Most szemléltessük grafikusan a faktorok hatását.
24 22 20
24 22
-1.
1.
x1
20
-1.
1.
x2
20-3. ábra. A faktorok hatása az y1 változóra a 20-1. példában A hatás (20.8) definíciójában az adott faktor fölső és alsó szintjén vett számtani átlag kiszámításakor a többi faktor szintjeinek kombinációja szerint nem teszünk további megkülönböztetést, mert a terv szerkezete (ortogonalitás) biztosítja, hogy a hatásokat egymástól függetlenül értékelhessük ki. Egyes esetekben a faktorok hatása additív. Ez azt jelenti, hogy a vizsgált faktor hatása azonos a többi faktor minden szintkombinációjában. Végezzünk erre grafikus ellenőrzést. Készítsünk olyan ábrát, amelyen az 1. faktor hatását a 2. faktor alsó és fölső szintjén külön-külön ábrázoljuk!
120
32
y1
28
x2 = 1
24 20 16
x2 = -1 -1.
1.
x1
20-4. ábra. A faktorok kölcsönhatása a 20-1. példában, a célfüggvény: y1 A 20-4. ábrán az x2 alsó és fölső szintjéhez tartozó egyenesek párhuzamosak, azaz az x1 faktor hatása (a fölső és alsó szinthez tartozó y1 érték különbsége) azonos az x2 faktor mindkét szintjén, tehát nincs a faktorok között kölcsönhatás (interakció). b) Végezzük el az értékelést az y2 változóra is! A lineáris modell paramétereinek becslése: b0
23 19 31 27 25 ; 4
b2 6 .
b1 3 ;
A becsült sík egyenlete: Y 25 3x1 6 x2 . A faktorok hatása: 1. faktor: h1 22 28 6 , 2. faktor: h2 31 19 12 .
35
35
30
30
25
25
y2
y2
Szemléltessük grafikusan a faktorok hatását és ellenőrizzük a faktorok közötti kölcsönhatást is!
20
15
15 10
20
-1.
1.
x1
10
-1.
1.
x2
20-5. ábra. A faktorok hatása az y2 változóra a 20-1. példában 121
35
x2= 1
30
y2
25 20 15
x2= -1
10
-1.
1.
x1
20-6. ábra. A faktorok kölcsönhatása a 20-1. példában, a célfüggvény: y2 A 20-4. ábrával ellentétben, a 20-6. ábrán az x2 alsó és fölső szintjéhez tartozó egyenesek nem párhuzamosak, azaz az x1 faktor hatása függ az x2 faktor beállításától, tehát a hatások nem additívak, vagyis a faktorok között van kölcsönhatás (interakció). Az elméleti modellt finomítanunk kell, figyelembe kell vennünk, hogy a hatások nem additívak. Mivel a faktorokat csupán két szinten vizsgáljuk, ezért továbbra is lineáris modellt kell használnunk. Lineáris modellt illesztve, a modellben az interakciót az x1x 2 taggal vehetjük figyelembe: Y = 0 1 x1 2 x2 12 x1 x2 .
(20.9)
Az x1x 2 tag a modellben újabb független változóként kezelendő, de ez természetesen a valóságban nem jelenti a vizsgált faktorok számának a megnövekedését, hiszen az x1 és x2 faktorok szintjeinek megválasztásával meghatározott lesz x1x 2 értéke is. x1x 2 együtthatója azt fejezi ki, hogy az x1 faktor hatása milyen mértékben függ a másik faktor szintjétől. Az együttható értéke pozitív, ha x1 növelése nagyobb mértékben növeli y értékét az x2= +1 beállításnál, mint x2= –1-nél. Könnyen belátható, hogy az újonnan bevezetett x1x 2 változóra is teljesül az ortogonalitás feltétele, tehát a kölcsönhatás becslése független a főhatások becslésétől. Általánosan megfogalmazva tehát:
x x i
ji
x ki 0 , ha j k; j, k = 1, ..., p; = 0, ..., p.
i
A példában a kölcsönhatás együtthatója:
b12
26 12 30 32 58 42 16 4. 4 4 4
Az y1 ill. y2 célfüggvények és a vizsgált faktorok közötti függvénykapcsolatot (válaszfelületet) háromdimenziós koordináta-rendszerben is bemutatjuk (20-7. ábra). 122
y2
y1
x2
x1
x2
a) Y1 25 2 x1 4x2
x1
b) Y2 25 3x1 6 x2 4x1 x2
20-7. ábra. A becsült modellek 3 dimenziós ábrázolása az 20-1. példában A 20-7a) ábrán jól látható, hogy ha a faktorok között nem lép fel kölcsönhatás, az illesztett modell két faktor esetén egy sík egyenlete. Ha a faktorok között kölcsönhatás van, a felület csavarodott (20-7b) ábra). Ezt is még lineáris modellnek nevezik abban az értelemben, hogy négyzetes tagok nincsenek benne. Mennyiségi faktorok esetén a becsült modellt interpolációra illetve extrapolációra egyaránt használhatjuk, azaz x j (j = 1, , p) elvben tetszőleges értéket felvehet. Minőségi faktorok esetén mindegyik x j csak a –1 és a +1 szinten értelmezhető, tehát más értéket nem vehet fel. Ebből következik, hogy minőségi faktorra az illesztett modellel csak a tervben szereplő szintekhez (+ ill. –) végezhető számítás. Mennyiségi faktorok vizsgálata esetén célszerű a terv centrumában is végezni méréseket. Ez két szempontból is előnyös: a) egyrészt ismétlés nélkül végrehajtott terv esetén a centrumban végzett mérések lehetőséget adnak a y2 variancia becslésére, b) másrészt a centrumpontbeli kísérleti információ az illesztett lineáris modell ellenőrzésére is szolgál (adekvát-e a modell). a) Ha van s 2y becslésünk y2 -re, statisztikai próbával vizsgálhatjuk, hogy a b becsült paraméterek szignifikánsan különböznek-e zérustól. Ehhez felhasználhatjuk, hogy s 2y s 2y bj j 2 t , ahol sb j . sb j x 2ji N i
123
Az ismertetett példában ismételt méréseket végeztek a terv centrumában (ahol minden faktor szintje 0), amelyeknek eredményei az y1 célfüggvényre: 3
y110 25 ,
y120 25 ,
y130 26 , 3
y
0 1m
y10
y10
y m1
3
0 1m
25.33 .
2
0.333 , =2 , 2 0.333 sb2j 0.0833 , sb j =0.289. 4
s 2y1 0
m1
Most már elvégezhetjük a próbát, amelynek nullhipotézise: H0 : j =0. Ha a nullhipotézis helytálló, a hányados t-eloszlású, vagyis P(–t/2< b j sb j
sb j t/2
=0.05 szignifikanciaszinthez, = 2 szabadsági fok esetén a III. táblázatból
t 0.05 2 4.3 ; sb j t 2 0.289 4.3 1243 ; vagyis azon együtthatókat tekinthetjük .
szignifikánsnak (a zérustól szignifikánsan különbözőnek), amelyek abszolút értéke 1.243-nál nagyobb. A példában x1 és x2 együtthatója (b1 és b2) egyaránt szignifikáns. Megjegyezzük, hogy lehetne ismételt méréseket végezni a terv bizonyos pontjában vagy bármely más pontban is, minthogy y2 konstans. Még ha az ismétléseket a terv valamely pontjában végezzük is, az ekkor mért adatok nem vonhatók össze az eredeti terv megvalósítása során kapottakkal, vagyis nem átlagolhatjuk őket együtt. Ugyanis ha a terv különböző pontjaiban az ismétlések száma külön-
böző, a pontok súlya y2 pi különböző. b) Ellenőrizzük, hogy az y1 függő változó illesztett lineáris modell adekvát-e (nincse szükség másodfokú tagra)! A centrumban végzett mérések eredményei az Y1 felületen lévő valódi függvényérték ( Y10 ) körül ingadoznak, a számtani közép várható értéke:
E y10 Y10
A 22 terv négy pontjában kapott mérési adatokra illesztett lineáris modellből számított centrumbeli érték megegyezik b0 értékével ( Y10 b0 ). A becsült ten124
gelymetszet (b0) várható értéke azonban csak akkor egyezik meg a centrumbeli y1 mérések várható értékével, ha a valóságban az Y1 felület lineáris. A lineáris modell érvényessége esetén tehát (nullhipotézis): H0 : E b0 E y10 Y10 .
(20.10a)
Az ellenhipotézis az, hogy nem lineáris a modell, azaz
H1 : E b0 E y10 .
(20.10b)
Ha feltételezzük, hogy a valóságban a 20-1. példában szereplő Y1 felület nem lineáris, a 20-8. ábrán vázolt helyzet fordulhat elő (a modell nem adekvát, H0 nem igaz). A 22 terv mért y1 értékeire illesztett sík metszi a valóságban nemlineáris Y1 felületet. A modell becsült b0 értéke a sík középpontjában van, a centrumbeli mérések átlaga pedig tőle távol, a valódi Y1 felület közelében van. A próbastatisztika (a kétmintás t-próba analógiájára): d , t0 sd ahol most
(20.11a)
d y 0 b0 ,
(20.11b)
1 1 sd2 s 2y , kc N mivel Var y b0 Var y 0
(20.11c)
0
Var b 0
y2 kc
y2 N
.
(20.11d)
kc a centrumban végzett ismétlések száma, l az illesztett modell paramétereinek száma. A t próbastatisztika szabadsági foka N-l+kc-1, vagyis sr2 és s 2y 0 szabadsági fokainak összege.
125
5 35
Lineáris modell (sík)
y y0 304
d b0
25 3
mért yi
mért yi
20 2 -2
15
x-12
1 -1
0
x1
1
0 1 2
2
20-8. ábra. A 22 terv centrumában végzett mérések átlagának eltérése a lineáris modell b0 konstansától: a modell nem adekvát 1 1 . A 20-1. példában: d 25.33 25 0.33 ; sd2 0.333 01943 ; sd 0.441 ; 4 3 0.33 t 0 t 0.05/ 2 2 4.3 , t0 0.748 , 0.441
tehát az adatok nem mondanak ellent annak a nullhipotézisnek, hogy az Y1 felület lineáris, vagyis a modell adekvát. A statisztikai programokban ezt a hipotézisvizsgálatot görbeség-ellenőrzésnek nevezik (curvature check). 20-2. példa Vizsgáljuk egy kémiai reaktorban a kitermelést (%) négy faktor függvényében, ha a z1 126
hőmérséklet
40 és 60 oC,
z2 z3 z4
reakcióidő kiindulási komponens koncentrációja nyomás
10 és 20 min, 45 és 65 %, 2·105 és 6·105 Pa.
20-2. táblázat Faktorok z 0j z j
z1 50
z2 15
z3 55
z4 4·105
z max j
10 60
5 20
5 65
2·105 6·105
z min j
40
10
45
2·105
A 24 kísérleti terv és a mérési eredmények táblázata: 20-3. táblázat
i 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Természetes egységekben z2 z3 10 45 10 45 20 45 20 45 10 65 10 65 20 65 20 65 10 45 10 45 20 45 20 45 10 65 10 65 20 65 20 65
z1 40 60 40 60 40 60 40 60 40 60 40 60 40 60 40 60
z4 2·105 2·105 2·105 2·105 2·105 2·105 2·105 2·105 6·105 6·105 6·105 6·105 6·105 6·105 6·105 6·105
x0 + + + + + + + + + + + + + + + +
A transzformált faktorok x1 x2 x3 – – – + – – – + – + + – – – + + – + – + + + + + – – – + – – – + – + + – – – + + – + – + + + + +
y x4 – – – – – – – – + + + + + + + +
% 60.4 75.9 79.8 86.0 64.9 80.9 86.4 91.6 59.6 77.0 83.1 85.0 65.0 79.3 88.7 91.1
A b1 becsült paraméter kiszámítása: i yi x1i 60.4 75.9 79.8 86.0 64.9 80.9 86.4 916. b1 16 x12i i
59.6 77.0 831 . 85.0 65.0 79.3 88.7 911 . 4.93 . 16 Hasonlóan a többi becsült paraméter: b0= 78.42; b2= 8.04; b3= 2.57; b4= 0.18.
127
Az x1, x2, x3 és x4 faktorok hatását a 20-10. ábrán mutatjuk be. 90
kitermelés, %
85
80
75
70
65
-1.
1.
hõmérséklet
-1.
reakcióidõ
1.
-1.
1.
-1.
koncentráció
1.
nyomás
20-10. ábra. A faktorok hatása a 20-2. példában Az ún. főhatások (main effects) grafikus megjelenítése alapján megállapítható, hogy a vizsgált négy faktor közül a reakcióidő hatása a legjelentősebb, a nyomás hatása pedig lényegesen kisebb a másik három faktorénál, értéke alig különbözik zérustól. A becsült regressziós sík egyenlete: Y 78.42+4.93x1 8.04 x2+2.57x3 + 0.18 x4 .
A 16 kísérletből így csak öt paramétert becsültünk, lehetséges egy több paramétert tartalmazó kibővített függvény (már nem sík) illesztése is. Ennek alakja: Y b0+b1 x1+b2 x2+b3 x3+b12 x1 x2+b13 x1 x3+b14 x1 x 4 b23 x2 x3+b24 x2 x 4 b34 x3 x 4 +b123 x1 x2 x3 +b124 x1 x2 x 4+b134 x1 x3 x 4+b234 x2 x3 x 4+b1234 x1 x2 x3 x 4 ,
(20.12)
ahol b12, b13, b14, b23, b24, b34 a kétfaktoros vagy elsőrendű interakciós tagok együtthatói, b123, b124, b134, b234 a háromfaktoros vagy másodrendű interakciós tagok együtthatói, a b1234 pedig az itt lehetséges egyetlen négyfaktoros vagy harmadrendű interakciós tag együtthatója. Az interakció vagy kölcsönhatás azt méri, hogy az egyik faktor hatása milyen mértékben függ a másik faktor szintjétől. Az x1x2 kölcsönhatás együtthatója például negatív, ha a reakcióidő növelése kisebb mértékben javítja a kitermelést 60 °C-on (fölső szint), mint 40 °C hőmérsékleten (alsó szint).
128
Az így kibővített kísérleti terv a 20-4. táblázatban látható (nem kell újabb kísérleteket végezni, x1x2 , ... x1x2x3 , ... x1x2x3x4 előjele x1 , x2 , x3, és x4 beállításából adódik!): 20-4. táblázat i x0 x1 x2 x3 x4 x1x2 x1x3 x1x4 x2x3 x2x4 x3x4 x1x2x3 x1x2x4 x1x3x4 x2x3x4 x1x2x3x
y
4
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
+ + + + + + + + + + + + + + + +
– + – + – + – + – + – + – + – +
– – + + – – + + – – + + – – + +
– – – – + + + + – – – – + + + +
– – – – – – – – + + + + + + + +
+ – – + + – – + + – – + + – – +
+ – + – – + – + + – + – – + – +
+ – + – + – – + – + – + – + – +
+ + – – – – + + + + – – – – + +
+ + – – + + – – – – + + – – + +
+ + + + – – – – – – – – + + + +
– + + – + – – + – + + – + – – +
– + + – – + + – + – – + + – – +
– + – + + – + – + – + – – + – +
– – + + + + – – + + – – – – + +
+ – – + – + + – – + + – + – – +
60.4 75.9 79.8 86.0 64.9 80.9 86.4 91.6 59.6 77.0 83.1 85.0 65.0 79.3 88.7 91.1
Az interakciók a együtthatók becslésekor újabb faktorokként kezelendők, így pl.
60.4 75.9 79.8 86.0 64.9 80.9 86.4 916 . 16 59.6 77.0 831 . 85.0 65.0 79.3 88.7 911 . 2.97 . 16 b12
Hasonlóan b13 = –0.19; b14 = –0.43; b23 = 0.42; b24 = –0.33; b34 = –0.14; b123 = 0.13; b124 = –0.46; b134 = –0.13; b234 = 0.08; b1234 = 0.32. Minthogy így a 16 kísérleti pontból 16 paramétert becsülhetünk, a függvény az összes kísérleti ponton keresztülmegy. A b becsült paraméterek értékei lényegesen különböznek egymástól; szükségesnek látszik annak vizsgálata, hogy mindegyik szignifikánsan különbözik-e zérustól. Mivel a kísérleti terv adatai alapján nincs becslésünk y2 -re, statisztikai próbát nem tudunk végezni. Ábrázoljuk a b j becsült paramétereket a számegyenesen (dot plot). Ahol azonos helyre több adat kerülne, a láthatóságuk érdekében csúsztassuk el az egyiket függőlegesen felfelé (20-11. ábra). Amennyiben a faktoroknak nincs hatása, illetve nincs kölcsönhatás (valódi értékük nulla, ez az ún. nullhipotézis), a becsült értékek csupán 129
a véletlen műveként térnek el zérustól, zérus várható értékű normális eloszlást követnek (l. a haranggörbét az ábrán). Az ábrán jól láthatóan zérushoz igen közel helyezkednek el a bj értékek, csupán négy érték esik távol a többitől, ezek balról jobbra rendre a b12, b3, b1, b2.
b3
b12 -4
-2
0
b1
2
4
b2 6
8
10
együtthatók
20-11. ábra. A lineáris modell becsült paramétereinek pontábrázolása Az ábra alapján nagy valószínűséggel feltételezhetjük, hogy a x4 faktornak és az x1x2 kölcsönhatás kivételével a többi interakciónak nincs szignifikáns hatása, b j értéke csupán a véletlen műveként tér el zérustól. Ezen értékeket fölhasználhatjuk y2 becslésére. Az x1, x2 és x3 faktor valamint az x1x2 kölcsönhatás együtthatójának zérustól jelentősen eltérő értéke szignifikáns hatásra utal. Ha nincs ismételt mérés, a b becsült paraméterek (vagy ezek kétszeresei, a hatások) szignifikanciáját az ún. Gauss-háló (Normal Probability Plot) ábrázolásban is vizsgálhatjuk. Ezt mutatja a 20-12. ábra. 3.0 2.5
.99
2.0
(2)
1.5 (3)
1.0
u
.85 .75 .65 .55 .45 .35 .25 .15
2by3 2by4 (4) 1*2*3 2*3*4 1*3*4 3by4 1by3 1by4 1*2*4
0.5 0.0 -0.5 -1.0 -1.5
.95
(1)
1by2
.05
-2.0 .01
-2.5 -3.0 -10
-5
0
5
10
15
hatás - kölcsönhatás
- fõhatás
20-12. ábra. A hatások ábrázolása Gauss-hálón 130
20
A nullhipotézisünk most is az, hogy a faktoroknak nincs hatása (valódi értékük nulla), és nincs közöttük kölcsönhatás. Ha igaz a nullhipotézis, a becsült értékek csupán a véletlen műveként térnek el zérustól, azaz zérus várható értékű normális eloszlást követnek, és a 20-12. ábrán a pontoknak az origón átmenő elméleti egyenes közelében kell elhelyezkedniük. Amelyik faktor hatása (vagy amelyik kölcsönhatás) az egyenestől távol helyezkedik el, az jelentősnek minősíthető (nem követi a nullhipotézisnek megfelelő zérus várható értékű normális eloszlást, a hatás szignifikáns). A példában az x1, x2 és x3 faktor, valamint az x1x2 kölcsönhatás ilyen. A (20.12) modellből a fenti grafikus vizsgálat alapján nyilvánvalóan nem szignifikáns hatásokat kihagyva (modellredukció), a kísérleti terv beállításainak számánál kevesebb együtthatót kell becsülnünk, az illesztett függvény nem megy át a terv öszszes pontján, ezért most már lehetőség van arra, hogy kiszámoljuk a reziduális szórásnégyzetet: 2 y Y s 2 r
i
i
i
,
N l
ahol l a paraméterek száma. A számított és a mért értékek eltérésének négyzetösszegéből számított sr2 reziduális szórásnégyzet y2 becslése, szabadsági foka a tervpontok számának és a becsült együtthatók számának a különbsége. Most már, hogy van becslésünk y2 -re, statisztikai próbával vizsgálhatjuk, hogy a b becsült paraméterek szignifikánsan különböznek-e zérustól. Ehhez felhasználhatjuk, hogy s 2y s 2y bj j 2 , ahol sb j (itt s 2y sr2 ). t 2 sb j N x ji i
A statisztikai próba (t-próba) nullhipotézise: H0 : j =0. Ha a nullhipotézis helytálló, a hányados t-eloszlású, vagyis
P t 2 b j sb j t 2 1 . Ebből látszik, hogy a nullhipotézist akkor utasítjuk el, ha
b j sb j t 2 . Első lépésben ne vegyük bele a modellbe a négyfaktoros kölcsönhatást (max. 3 faktoros interakció a modellben). Az reziduális szórásnégyzet így kapott értékét, annak szabadsági fokát, a III. táblázatból kikeresett t0.05/2 értékeket és az sb j t/2 szorzatot a 20-5. táblázatban adjuk meg. Azok az együtthatók különböznek szignifikánsan zérustól, amelyek abszolút értéke nagyobb, mint 4.050. Ez az x1 és x2 faktorok esetén 131
teljesül. Tekintettel arra, hogy mindössze 1 a y2 becslésére használt szórásnégyzet szabadsági foka, helyesebb, ha úgy fogalmazzuk meg döntésünket, hogy a 3 faktoros kölcsönhatások biztosan kihagyhatók a modellből, mivel nem szignifikánsak, és az új redukált modellel megismételjük a számítást. Ennek eredményeit a 20-5. táblázat utolsó oszlopában találjuk. Most már csak főhatásokat és 2 faktoros kölcsönhatásokat tartalmazó modellt illesztettünk, tehát összesen 11 paramétert becsültünk. A megnövekedett szabadsági fokának köszönhetően a statisztikai próba erősebb, kisebb hatás kimutatása is lehetséges. Azok az együtthatók különböznek szignifikánsan zérustól, amelyek abszolút értéke meghaladja a 0.681-et. 20-5. táblázat Max. interakció a modellben:
sr2
3 faktoros
2 faktoros
1.6256 1
1.1226 5
sb2j
0.1018
0.0702
t0.05/2()
12.706
2.571
sb j t 0.05 2
4.050
0.681
A példában az x1, x2 és x3 faktor, valamint az x1x2 kölcsönhatás szignifikáns, mivel ezek együtthatói jelentősen nagyobbak 0.681-nél, a többi viszont lényegesen kisebb. Ugyanezt láttuk a 20-11. és 20-12. ábrákon is. A szignifikánsnak bizonyult együtthatókkal a modell és a reziduális szórásnégyzet: Y 78.42+4.93x1+8.04x2 2.53x3-2.97x1 x2 , . sr2 1328 . Az x1x2 interakció jól látható a 20-13. ábrán. A vízszintes tengelyen az x2 faktor (reakcióidő) szerepel, a hatást megjelenítő két-két vonal pedig az x1 faktor (hőmérséklet) alsó és fölső szintjéhez tartozik. Az egyenesek nem párhuzamosak, mivel az x2 faktor hatása x1 szintjeitől függ. Az x1= –1 szinten az x2 faktor hatása nagyobb, mint az x1 faktor fölső szintjén (x1 = 1), tehát az x1x2 együtthatójának az előjele negatív.
132
95 90
x1=1
85
y, %
80 75
x1=-1
70 65 60 55 -1.
1.
x2
20-13. ábra. A hőmérséklet (x1) és a reakcióidő (x2) közötti kölcsönhatás grafikus szemléltetése (az ábrán feltüntettük a 95%-os konfidenciaintervallumokat)
A példa szerinti 24 tervből 15 hatás értékelhető ki. Amikor ezek szignifikanciájáról együttesen döntünk, a 11.3. alfejezetben megbeszéltek értelmében az elsőfajú hiba kockázata (hogy valamelyik hatást akkor is jelentősnek higgyük, ha nem az) megnő. 15 1 1 0.05 0.537 Ezért * (az egy vizsgálat szignifikanciaszintje kicsinek (0.05-nál kisebbnek) választandó. Másrészt a „sometimes pooling” szabály miatt p 0.25 -nál mondjuk, hogy biztos nincs hatás (a másodfajú hiba valószínűségének csökkentése végett). Tehát széles a szürke sáv, amelyben se abban nem lehetünk biztosak, hogy van egy hatás, se az nem biztos, hogy nincs. Az ún. hierarchiaszabály azt írja elő, hogy amennyiben egy faktor valamely kölcsönhatása szignifikáns, magát a faktort (vagy főhatását) akkor is tartsuk meg a modellben, ha az nem szignifikáns. Mivel a tervben mennyiségi faktorokat vizsgáltak2, a terv centrumában (ahol minden faktor szintje 0) is végeztek méréseket. A három ismételt mérés eredménye, az átlaguk és a szórásnégyzet értéke:
y10 79.7 ,
y 20 78.6 ,
y 30 80.4 ,
y 0 79.57 ,
s y20 0.823 .
A centrumban végzett ismételt mérések lehetőséget adnak egyrészt a y2 variancia modelltől független becslésére, másrészt a centrumpontbeli kísérleti információ az illesztett lineáris modell ellenőrzésére is szolgál (adekvát-e a modell). 2
Centrumpont csak mennyiségi faktoroknál értelmezhető, minőséginél nem. Ha egy tervben mennyiségi és minőségi faktorok is vannak, a minőségi faktorok valamennyi szintjén van a mennyiségi faktoroknak centrumpontja.
133
Ha a centrumban végzett ismételt mérésekből számított, modelltől független s 2y 0 szórásnégyzetet összehasonlítjuk a redukált modellhez tartozó sr2 reziduális szórásnégyzettel, a kettő hányadosa F-eloszlású, ha az illesztett modell megfelelően leírja a terv pontjaihoz tartozó mérési adatokat (tehát a centrumpont nélkül): s 2 1328 . F0 2r 161 . . s y 0 0.823 Az F-eloszlás táblázatából (IV. táblázat) = 0.05 egyoldali szintre, ha a számláló szabadsági foka 11, a nevezőé 2: F0.05 (11, 2)= 8.76 , ezt az értéket a próbastatisztika kiszámított értéke nem éri el, tehát a terv sarokpontjaiban mért adatokra illesztett függvény a modellredukciót követően is megfelelő az adatok leírására (vagyis valóban csak a nem szignifikáns tagokat hagytuk ki a modellredukció során a modellből). Ellenőrizzük, hogy az illesztett lineáris modell adekvát-e! A modell inadekvát voltát a korábban sr2 s 2y 0 arányra elvégzett F-próba nem mutatja ki. A terv centrumában végzett ismételt mérések felhasználásával végzett kétmintás t-próbával dönthető el, hogy adekvát-e a lineáris modell (l. 20-8. ábrát). A nullhipotézis az, hogy a lineáris modell adekvát, az ellenhipotézis, hogy nem az (négyzetes tag is kell a modellbe): H0 : Eb0 E y 0 ; H1 : E b0 E y 0 . A próbastatisztika (a kétmintás t-próba analógiájára): d , ahol most d y 0 b0 79.57 78.42 115 . , t0 sd
s 2 y
N l sr2 s 2y 0 kc 1 11 1328 . 3 0.823 N l kc 1
11 3
, 1220 .
kc a centrumban végzett ismétlések száma, l az illesztett modell paramétereinek száma.
1 1 1 1 sd2 s 2y 1220 . 0.381 , 4 16 kc N t0
sd 0.617 .
d 115 . . 1864 . sd 0.617
A t0 próbastatisztika szabadsági foka sr2 és s 2y 0 szabadsági fokainak összege,
. a III. táblázatból, így t 0 t 0.05 2 13 . A nullN l kc 1 13 . t 0.05 2 13 2160
hipotézist elfogadjuk, vagyis a lineáris modell adekvát. A regresszió feltételeinek (l. a 4.1. és 8.3. alfejezeteket) ellenőrzésére végezzük el a reziduumok grafikus vizsgálatát! A reziduumokat Gauss-hálón ábrázolva (normal 134
probability plot) jó közelítéssel egyenes mentén helyezkednek el az adatok, tehát a reziduumok normális eloszlásúaknak tekinthetők. 3 2
.95
u
1 0
.75 .55 .35
-1
.15
-2
.01
-3 -3
-2
-1
0
1
2
reziduum 20-14. ábra. A reziduumok ábrázolása Gauss-hálón A reziduumokat a terv végrehajtásának sorrendjében (függetlenség), illetve a mért y érték függvényében vizsgálva ( y2 konstans) szintén nem találunk rendellenességet.
20.2. 2p–r típusú részfaktortervek Az előző példában először 8 kísérleti pontból 4 lineáris paramétert becsültünk, majd a kísérleti pontok fölös számára hivatkozva az interakciók figyelembevételével kibővítettük a modellt. Ha van okunk azt gondolni, hogy ezek az interakciók nem szükségesek az adott folyamat vagy objektum leírására, inkább az eredeti lineáris modellt megtartva az elvégzendő kísérletek számát csökkentjük. Ezt valósítják meg a részfaktortervek. Induljunk ki például egy 22 típusú teljes faktoros kísérleti tervből! 8
1
7
6
4 5 4
3
x3 3
x2
2
i 1 2 3 4
x0 + + + +
22 x1 – + – +
x2 x1x2 – + – – + – + +
i 1 2 3 4
x0 + + + +
23-1 x1 – + – +
x2 x3 – + – – + – + +
1 x1
2 135
20-15. ábra. Részfaktorterv generálása Ha az x1x2 kölcsönhatás nem játszik szerepet, helyette bevezethetjük az x3 faktort, vagyis a kísérleteket úgy kell végezni, hogy az eredetileg az x1x2 kölcsönhatásra kapott szintekre kell beállítani x3 faktor értékét. Így egy ún. 23-1 részfaktortervet kapunk (egy 23 terv felét), amelynek eredményére a következő modell illeszthető: (20.13) Y b b x b x b x . 0
1 1
2 2
3 3
Ennél a modellnél a 4 kísérleti pontból 4 paramétert kell becsülnünk. Amennyiben a nem létezőnek tekintett interakciók nem hanyagolhatók el, a becsült paraméterek torzítottak lesznek, pl. a b3 a 3 -nak és a 12 -nek becsléséből tevődik össze, szokásos jelölése: b3 3 12 . Az ilyen keveredések vizsgálatához induljunk ki a harmadik faktor beállítandó értékeire használt generáló összefüggésből: (20.14) x3 x1 x2 . Szorozzuk meg ennek mindkét oldalát x3 -mal: 1 x1 x2 x3 ,
(20.15)
mivel x32 1 (+1 és –1 négyzete egyaránt 1). Ezt a kifejezést nevezik meghatározó kontrasztnak. Ha mindkét oldalát megszorozzuk valamely faktorral vagy interakcióval, a keveredési rendszert kapjuk:
x1 x12 x2 x3 x2 x3 ,
x2 x1 x3 .
Így esetünkben az x3 generálásánál figyelembe vett keveredésen kívül a következőket kapjuk: b1 1 23 ; b2 2 13 . Négy faktor (24–1) esetén már többféle lehetőség van az új, negyedik faktor generálására, háromfaktoros (másodrendű) interakcióval vonjuk egybe: x4 x1 x2 x3 ,
ill.
x4 x1 x2 x3 ,
(20.16)
vagy valamelyik kétfaktoros interakcióval, pl.: x4 x1 x2 .
(20.17)
Ha a negyedik faktort háromfaktoros interakció helyett vezetjük be, a meghatározó kontraszt a következő: 1 x1 x2 x3 x4 .
(20.18)
A keveredési rendszer (mindkét oldalt a faktorokkal és interakciókkal egyenként szorozva): 136
x1 x2 x3 x4 , x2 x1 x3 x4 , x3 x1 x2 x4 , x4 x1 x2 x3 ,
x1 x2 x3 x4 , x1 x3 x2 x4 , x1x4 x2 x3 .
Látható, hogy ebben az esetben főhatások csak háromfaktoros interakciókkal keverednek, a kétfaktoros interakciók pedig egymással. A másik, a (20.17) generáló összefüggést választva a meghatározó kontraszt: 1 x1 x2 x4 .
(20.19)
A keveredési rendszer pedig: x1 x2 x4 , x2 x1 x4 , x3 x1 x2 x3 x4 , x4 x1 x2 .
x1 x3 x2 x3 x4 , x2 x3 x1 x3 x4 , x3 x4 x1 x2 x3 ,
Itt a főhatások kétfaktoros interakciókkal is keverednek, egyes kétfaktoros interakciók pedig háromfaktorosokkal. Ez akkor célszerű, ha 13, 23 és 34 becslése a fő cél, ezektől várjuk, hogy jelentősek legyenek, a főhatások kevésbé lényegesek. Egy faktoros kísérleti terv feloldóképessége (Resolution, rövidítve Res) annál nagyobb, minél magasabb rendű (többfaktoros) interakcióval keverednek a főhatások. Eszerint az utóbbi terv feloldóképessége kisebb. Res értéke III, IV vagy V lehet. Azért választották a feloldóképességre ezeket az értékeket, mert ha az így definiált feloldóképesség értékéből kivonjuk a vizsgálni kívánt hatásban szereplő faktorok számát (főhatásban 1 faktor szerepel, az elsőrendű interakcióban 2, és így tovább), eredményül megkapjuk, hogy hány faktor közötti interakcióval fog a vizsgált hatás keveredni. Ennek megfelelően: Res=III
Res=IV
Res=V
a főhatások egymással nem keverednek, de a kétfaktoros interakciókkal (és az ennél több faktoréval) igen (III– 1=2) a főhatások egymással és kétfaktoros interakciókkal nem keverednek, de keverednek a 3 és ennél több faktor interakciójával. A 2 faktoros interakciók egymással (és magasabb rendű interakciókkal) keverednek (IV–1=3; IV–2=2) a főhatások csak 4 faktor közötti interakciókkal (és ennél magasabb rendűekkel) keverednek. A kétfaktoros interakciók egymással nem keverednek, csak a 3 és annál több faktor közötti kölcsönhatással (V–1=4; V–2=3; V–3=2)
137
Öt és ötnél több faktor esetén 2 p 2 , 2 p3 terveket is szokás alkalmazni, így a 2 p teljes terv egynegyed, ill. egynyolcad részét írják elő. Ezeknél több generáló összefüggést kell választani, a keveredési rendszer is bonyolultabb lesz. Például egy 25-2 részfaktorterv esetén a következőket választhatjuk: (20.20a) x4 x1 x2 x3 , (20.20b) x5 x1 x2 . A meghatározó kontrasztok: 1 x1 x2 x3 x4 , 1 x1 x2 x5 .
(20.21a) (20.21b)
Ezeket egymással megszorozva kapjuk az összefoglaló meghatározó kontrasztot: (20.22) 1 x1 x2 x3 x4 x1 x2 x5 x3 x4 x5 . A keveredési rendszer:
x0 x1 x2 x3 x4 x1 x2 x5 x3 x4 x5 , x1 x2 x3 x4 x2 x5 x1 x3 x4 x5 , x2 x1 x3 x4 x1 x5 x2 x3 x4 x5 , x3 x1 x2 x4 x1 x2 x3 x5 x4 x5 , x4 x1 x2 x3 x1 x2 x4 x5 x3 x5 , x5 x1 x2 x3 x4 x5 x1 x2 x3 x4 , x1 x3 x2 x4 x2 x3 x5 x1 x4 x5 , x1 x4 x2 x3 x2 x4 x5 x1 x3 x5 .
Például:
b3 3 124 1235 45 .
Minden főhatás legalább egy kétfaktoros interakcióval együtt jelentkezik. Ha a kísérletek elvégzése után mégis felmerül annak szükségessége, hogy a főhatásokat a kétfaktoros interakciókkal való keveredésüktől megszabadítsuk, mert ezek az interakciók esetleg nem hanyagolhatók el, a kísérleti tervet kibővíthetjük az ún. átváltásos módszerrel (foldover) (Adler, Markova, Granovszkij, 1978; Box, Hunter, Hunter, 1978). A módszer lényege, hogy egy másik, ugyanakkora kísérleti tervet realizálunk, de a generáló összefüggéseket alkalmasan úgy választjuk meg, hogy a kétfaktoros interakciók előjele fordított legyen, így a két kísérletsorozat eredményeinek páronkénti átlagolásával éppen kiszűrjük a kétfaktoros interakciók hatását. Vizsgáljuk meg, hogy meddig lehet a kísérletek számát csökkenteni! Még ha az összes interakciókat elhanyagolhatónak tekintjük is, a főhatásokat becsülnünk kell, vagyis legalább annyi pontból kell állnia a kísérleti tervnek, amennyi az Y b b x b x ... b x (20.23) 0
1 1
2 2
p
p
modell együtthatóinak száma, tehát minimálisan p+1 pontból. Eszerint ha pl. 7 faktorunk van, a kísérleti tervnek legalább 8 beállítást kell tartalmaznia (27–4). Ha a faktorok száma 8 és 15 között van, a minimális beállítások száma 16. Azt a tervet, amely 138
éppen annyi kísérleti pontból áll, ahány együtthatója van a lineáris modellnek, telített tervnek nevezzük. Ilyenek pl.: 23–1, 27–4, 215–11. 20-3. példa (Ahnazarova, Kafarov, 1978) A kísérletek célja speciális üveg optimális előállítási körülményeinek meghatározása volt. A célfüggvény az üveg optikai sűrűsége, melynek maximális értékét kell elérni. Faktorként a következőket vizsgálták: z1 a klór kiindulási koncentrációja, g/100g üveg, z2 a bróm kiindulási koncentrációja, g/100g üveg, z3 az Ag:Cl arány, z4 a főzés hőmérséklete, C, z5 a tartózkodási idő, h, z6 az Al2O3 móltörtje, z7 a Li2O:SiO2 arány. A választott kiindulási adatok: Jellemzők
z1
z2
z3
z4
z5
z6
z7
Alapszint, z 0j
0.0425
0.0187
0.0675
1325
1.75
0.1405
0.4165
Variációs intervallum, z j
0.0205
0.0093
0.0325
25
0.25
0.0165
0.0835
+1
0.0630
0.0280
0.1000
1350
2.00
0.1570
0.5000
–1
0.0220
0.0094
0.0350
1300
1.50
0.1240
0.3330
Először egy 27–4 részfaktorterv szerint végeztek kísérleteket a következő generáló összefüggésekkel: x4=x1 x2 x3 ;
x5=x1 x2 ;
x6=x1 x3 ;
x7=x2 x3 .
(20.24)
Az új faktorok levezetéséhez az összes interakciókat fel kellett használni, így annyi kísérleti beállításunk lesz, ahány paramétert ki kell értékelnünk, tehát telített tervet kapunk. A kísérleteket minden beállításnál kétszer végezték el (két ismétlés). A kísérleti tervet és a célfüggvény talált értékeit adjuk meg a táblázatban:
139
i
x0
x1
x2
x3
x4
x5
x6
x7
y1
y2
yi
1 2 3 4 5 6 7 8
+ + + + + + + +
– + – + – + – +
+ + – – + + – –
– – – – + + + +
+ – – + – + + –
– + + – – + + –
+ – + – – + – +
– – + + + + – –
0.000 0.108 0.000 0.194 0.298 0.400 0.255 0.453
0.000 0.150 0.000 0.160 0.292 0.408 0.278 0.408
0.000 0.129 0.000 0.177 0.295 0.404 0.266 0.431
si2 ·104 0.00 8.82 0.00 5.78 0.18 0.32 2.65 10.10
A következő modellt illesztjük: Y b0 b1 x1 ... b7 x7 .
Interakciók figyelembevételére nincs lehetőség, mivel telített tervvel dolgoztunk. Ellenőrizzük a y2 = konstans feltételezést, amely a további vizsgálatokhoz szükséges! 2
y
yi
2
yi 2 s 1 2 Alkalmazzuk a Cochran-próbát, amely több, azonos szabadsági fokú szórásnégyzet összehasonlítására szolgál (l. a 2.2.6.2. pontot). A próbastatisztika: s2 101 . 10 4 G max2 0.363 . si 27.85 104 k 1
2 yi
ik
y
2
i1
i
A kritikus érték az V. táblázatból, ha f = 1, k = 8 és a szignifikanciaszint = 0.05: G0.95(1,8) = 0.6798, eszerint a nullhipotézist ( y2 = konstans) elfogadjuk. Minthogy a szabadsági fokok egyenlők, a Fisher–Cochran-tétel szerinti összegzés itt egyszerű átlagolást jelent. Így az egyesített becslés y2 -re:
se2 E szórásnégyzet
y2
s
2 i
i
N
27.85 10 4 3.48 10 4 . 8
2
eloszlású, =8 szabadsági fokkal, ha a függő változó (cél-
függvény) normális eloszlású. Az ortogonális többváltozós regresszió (20.5) paraméterbecslési formulája szerint: N
b j x ji yi / N ; i 1
b0 = 0.21280 ,
140
b1 = 0.07240 ,
b2 = -0.00575 ,
b3 = 0.13630 , b6 = 0.00410 ,
b4 = -0.00088 , b7 = 0.00625 .
b5 = -0.01290 ,
Megvizsgáljuk az egyes faktorok hatásának szignifikanciáját, vagyis a következő nullhipotézist: H0 : j = 0. Ehhez a t-eloszlás használható, mivel a következő statisztika t-eloszlású: t
bj j sb j
.
Az sb j szórás kifejezéséhez induljunk ki a bj becslés varianciájából:
Var b j
y2
y2
, N 2N mivel a b j becslésekhez az y értékeket használtuk, amelyeket két mérés átlagolásával kaptunk ( y2 y2 / 2 ). s 2 bj
sb2j
2Var b j
2
2 y
2N
2 y
s 2y se2 1 , 2N 2N 2N
se2 3.48 10 4 2175 . 10 5 , 2N 16 sbj 4.66 103 .
A t-eloszlás kritikus értéke a III. táblázatból, = 8 és = 0.05 esetén: 2.306. A H0 hipotézist akkor fogadjuk el, ha b j 4.66 10 -3 < 2.306 ,
vagyis
b j < 2.306 4.66 10-3 = 0.0107 . Eszerint b0, b1, b3 és b6 szignifikánsan különbözik
zérustól, a többi együttható nem. A becsült regressziós sík: Y 0.2128 0.0724 x1 01363 . x3 0.0129 x5 .
A mért és becsült értékek eltérését mutatja a következő táblázat. i
yi
Yi
1 2 3 4 5 6 7 8
0.000 0.129 0.000 0.177 0.295 0.404 0.266 0.431
0.0170 0.1360 0.0880 0.1618 0.2896 0.4086 0.2638 0.4344
y
i
Yi
2
104
2.89 0.49 0.77 2.31 0.29 0.21 0.05 0.16 7.13
Vizsgáljuk meg, hogy adekvát-e ez a sík! A reziduális szórásnégyzet: 141
N
sr2
2 yi Yi i 1
2
84
2 713 . 10 4 357 . 10 4 . 4
Ha a modell adekvát (nullhipotézis), a következő próbastatisztika F-eloszlású: sr2 357 . 10 4 F0 2 1026 . se 348 . 10 4
A kritikus érték a IV. táblázatból, 0.05 egyoldali szintre, ha a számláló szabadsági fokainak száma 4, a nevezőé 8: F0.05(4, 8)=3.84. A próbastatisztika aktuális értéke ezt nem haladja meg, tehát a nullhipotézist elfogadjuk, a modell adekvátnak tekinthető. Természetesen, ha mind a 8 együtthatót szignifikánsnak találtuk volna, a függvény átmenne minden mérési ponton, így reziduális szórásnégyzetet nem számolhatnánk és a modell adekvát voltát nem ellenőrizhetnénk. Az optimum keresését a következő példában folytatjuk. 20.3. A kétszintes tervekkel kimutatható hatások nagysága A kétszintes tervekben a főhatások és a kölcsönhatások szabadsági foka is 1 (a szintek száma – 1). A hatások szignifikanciájának vizsgálatára t-próbát használunk. Láttuk, hogy egy szabadsági fokú t-eloszlású valószínűségi változó négyzete olyan Feloszlást követ, amelynél a számláló szabadsági foka 1, a nevezőé . Jelölje a vizsgálandó faktor (vagy kölcsönhatás) két szintje közötti különbséget a függő változóban, ha azt a kísérleti bizonytalanság nem terheli:
Y x j 1 Y x j 1 e . A varianciaanalízis modellje szerint
i 2 e 2 . A Függelék X. táblázatában
C
A
e2
értékek vannak, = 0.1, másodfajú és
= 0.05 elsőfajú hiba-valószínűségekhez. Itt A kifejezése: 2
A
Ebből
142
i 1
2 i
2 1
2 2 . 2 e
2 A
e2
.
C értéke a kísérleti terv összes kísérletei számának fele. 20-4. példa Számítsuk ki, hogy egy egyszer végrehajtott (p = 1) 23 tervben a hatás vagy kölcsönhatás e hányszorosa kell legyen ahhoz, hogy 90% biztonsággal kimutassuk! Tételezzük föl, hogy a 7 hatás (3 fő- és 4 kölcsönhatás) közül 3-ról már az első vizsgálat (Pareto-diagram, Gauss-háló) alapján egyértelműen látjuk, hogy nem lényegesek. A maradék szabadsági foka éppen a nem létező hatások száma, tehát 3 lesz. A beállítások száma 8, tehát C = 4. A Függelék X. táblázatából számláló=1 és nevező=3 ér A tékekhez leolvasva C 2 4.985 .
e
4.985 2 A , vagyis az A 2.4925 , és 2 2.4925 3525 . e2 4 val jelölt faktor hatásának el kell érnie a e 3.5-szeresét, hogy 90% biztonsággal észrevegyük. Ebből
A 2 e
20-5. példa Számítsuk ki, hogy ha az előbbi 23 terv minden beállítását kétszer végrehajtva (p=2), tehát összesen 16 kísérletből mekkora hatás vagy kölcsönhatás (e hányszorosa) mutatható ki 90% biztonsággal! Tételezzük föl itt is, hogy a 7 hatás (3 fő-és 4 kölcsönhatás) közül 3 nem létezik. A maradék szabadsági foka éppen a nem létező hatások száma + az ismétlések miatti szabadsági fokszám, tehát 3 + 8 = 11 lesz. A beállítások száma 16, tehát C = 8. A Függelék X. táblázatából számláló=1 és nevező=11 értékekhez leolvasva A C 2 349 . .
e
Ebből
2 A
e2
349 . 2 2 1745 . , vagyis ha az A-val jelölt faktor hatása eléri a 8
e 1.75-szorosát, 90% biztonsággal észrevesszük. 20-7. példa Számítsuk ki, hogy egy egyszer végrehajtott (p = 1) 24 tervben (16 kísérlet) a hatás vagy kölcsönhatás e hányszorosa kell legyen ahhoz, hogy 90% biztonsággal kimu143
tassuk! Tételezzük föl, hogy a 15 hatás közül csak 4 lesz jelentős (persze, előre nem tudjuk, hogy melyik 4). A maradék szabadsági foka éppen a nem létező hatások száma, tehát 11 lesz. A beállítások száma 16, tehát C = 8. A Függelék X. táblázatából számláló=1 és nevező=11 A értékekhez leolvasva C 2 349 . .
e
Ebből
2 A
e2
2
349 . 2 , vagyis ha az A-val jelölt faktor hatása el 1745 . 8
éri a e 1.75-szorosát, 90% biztonsággal észrevesszük, ugyanúgy, mint az ugyancsak 16 kísérleti beállítást tartalmazó kétszer végrehajtott 23 tervből. A 24 tervben 4 faktor és kölcsönhatásaik vizsgálatára van lehetőség, a kétszer végrehajtott 23 tervvel csak 3 faktort és kölcsönhatásaikat vizsgálhatjuk. Tehát a 24 terv ugyanannyi kísérlettel, azonos statisztikai biztonsággal több faktorról ad információt, mint a kétszer végrehajtott 23 terv. 20-8. példa Hasonlítsuk össze a 23 tervből és a 27-4 tervből kimutatható hatások nagyságát, megint feltéve, hogy csak 4 hatás létezik! Mindkét tervben a maradék szabadsági fokszáma a nem létező hatások száma, tehát 3 lesz. A beállítások száma 8, tehát C=4. A Függelék X. táblázatából számláló=1 és A nevező=3 értékekhez leolvasva C 2 4.985 .
e
Ebből
A
2 e
4.985 2.4925 , és 4
2 A
e2
2 2.4925 3525 . , mindkét
tervhez. Általánosítható tanulság, hogy ha a nem létező hatások száma azonos, a kimutatható hatások nagyságát a terv mérete határozza meg, nem a faktorok száma. Érdemes tehát ugyanannyi kísérlettel több faktort vizsgálni ahelyett, hogy az ismétlések számát választanánk nagyra a statisztikai biztonság növelésére: a leghasznosabb ismétlés a más körülmények között végzett ismétlés. 20.4. A kísérletek menete Randomizálás A kísérleti tervek felépítésekor hallgatólagosan feltételeztük, hogy a célfüggvényt csak a vizsgált faktorok befolyásolják, minden más tényező hatását kiküszöbölhetjük. 144
Ez a valóságban természetesen nincs így. A jelenséget befolyásoló, feltehetően a vizsgált faktorokénál kisebb hatású tényezők egy része ismeretlen, hatásuk az idővel változik (pl. öregedési folyamatok, külső légnyomás változása stb.). Ha a kísérleti tervet úgy hajtjuk végre, hogy valamely faktor beállításai az idővel egy irányba változzanak (pl. 23 tervben x3 az első időszakban +, a második szakaszban –), e faktor hatása az időben változó tényezők hatásától nem választható el. Ezért a kísérletek sorrendjét, különösen többszöri ismétlési lehetőség esetén, célszerű véletlenszerűsíteni (randomizálni). A sorrend meghatározásához a véletlen számok táblázatát vehetjük igénybe, vagy sorsolhatunk. Ezzel az időben változó tényezők hatása a véletlen hibával együtt jelentkezik, sajnálatos módon egyben annak szórásnégyzetét is növeli. Blokkokra osztás A zavaró tényezők másik csoportjáról a kísérletezőnek van bizonyos információja, de hatásukat nem lehetséges vagy nem fontos vizsgálni. Tipikus példa az az eset, amikor a kísérletekhez felhasználandó nyersanyag egy tételéből nincs annyi, hogy az egész kísérletsorozatra futná, vagy nem végezhetjük az egész sorozatot egy napon ill. egy készüléken. A probléma megoldható lenne úgy, hogy randomizálással gondoskodunk arról, hogy e nem kívánatos hatások véletlen hibákkal együtt jelentkezzenek. Ekkor azonban a szórás indokolatlanul megnő és elfedi a lényeges faktorok hatását. A 19. fejezetben láttuk, hogy a körülmények zavaró hatását a terv több blokkra osztásával, tehát új faktor bevezetésével lehet elválasztani a többi hatásoktól. Itt, ha nem akarjuk a faktorok számát (tehát az elvégzendő kísérletek számát) növelni, a részfaktortervek generálásánál megismert módon ezt a blokkfaktort egy minél magasabb rendű, vagyis minél többfaktoros kölcsönhatás terhére vezetjük be. Ilyenkor arra kell ügyelni, hogy a zavaró tényező hatása olyan interakcióval keveredjék, amelyről tudjuk, vagy alapos okkal feltételezzük, hogy nem jelentős. Például 23 teljes faktoros kísérleti terv esetén a két nyersanyagtétel különbözőségének hatását a legmagasabb rendű, x1x2x3 interakcióval egyesíthetjük. i 1 2 3 4 5 6 7 8
x0 + + + + + + + +
x1 + – + – + – + –
x2 + + – – + + – –
x3 + + + + – – – –
x1x2x3 = nyersanyag + – – + – + + –
Az 1., 4., 6. és 7. kísérletet az egyik nyersanyagtételből, a 2., 3., 5. és 8., kísérleteket a másik tételből végezzük, ezzel a tervet két blokkra osztottuk. A nyersanyag hatását 145
nem kívánjuk vizsgálni, csak arra törekszünk, hogy a faktorok hatását ettől függetlenítsük. Ezt az ortogonális kísérleti tervnek az a tulajdonsága teszi lehetővé, hogy a faktorok ill. interakciók hatása egymástól függetlenül vizsgálható. Formailag úgy járunk el, mintha új faktort vezetnénk be a megjelölt interakció helyébe, de a faktor együtthatóját nem értékeljük ki, és természetesen a további kísérleteknél sem vesszük figyelembe. Ha az adott példában a háromfaktoros interakció nem hanyagolható el, valamelyik másik hatással kell a nyersanyag inhomogenitásának hatását egyesíteni. Blokkokra osztottnak tekinthető a páros t-próbához végzett kísérletsorozat is, ahol a vizsgálni kívánt faktor hatásától elkülönítettük a vizsgálni nem kívánt hatásokat, mint a példában a textilszövet inhomogenitását. Hasonlóan egy kísérleti terv kettőnél több blokkra is osztható. Például az előbbi példánkban egy további, második zavaró tényezőt valamelyik elsőrendű interakció helyére bevezetve a két blokkot további kettőre, tehát a 8 kísérletet összesen négy blokkra oszthatjuk. A variációs intervallum megválasztása A variációs intervallum nagyságát a faktorok értelmezési tartományán belül, az előkísérletek tapasztalatai alapján választjuk meg. Figyelemmel kell lenni arra is, hogy ehhez az intervallumhoz képest kell a faktor beállítási bizonytalanságának elhanyagolhatónak lennie. A variációs intervallum megválasztása érinti a b együtthatók nagyságát. Ha a véletlen hibától eltekintünk, a variációs intervallum kétszeresére növelésével b értéke is kétszer akkora lesz. Ha a variációs intervallumot túlságosan kicsire választjuk, az illető faktor hatástalannak mutatkozik, ugyanúgy, mintha egyenes illesztésekor két nagyon közeli x értéknél végeznénk csupán méréseket (20-16. ábra).
146
hj 20-16. ábra. A variációs intervallum túlságosan kicsi
2zj Ha ilyen gyanúnk ébred, a kísérleti terv felét még egyszer végre kell hajtani, de nagyobb variációs intervallummal (20-17. ábra). Az egyik (az alsó vagy a fölső) szint fizikai egységekben mért értékét változatlanul tartjuk, a másikat és így az alapszinzj tet is megváltoztatjuk.
147
hj
2zj
zj
20-17. ábra. A variációs intervallum mérete megfelelő
148
20-18. ábra. A variációs intervallum mérete túl nagy
Egy szélesebb z j tartományban az y f z j görbe szélsőértéket vehet föl, így még az is előfordulhat, hogy a kísérletek alapján a z j faktort kizárjuk a további vizsgálatból, mivel hatását nem találjuk szignifikánsnak, pedig a valóságban a faktor hj nagymértékben befolyásolja y értékét. Ezt szemlélteti a 20-18. ábra. Ha z j túlságosan nagy, a nagyobb tartományban a görbe felület leírására a sík nem bizonyul adekvátnak (l. 20-8. ábrát). 2zj felét, kisebb variációs intervalIlyenkor is vagy meg kell ismételni a kísérletek lummal, vagy pedig a tervet másodfokúvá kell kiegészíteni, hogy az illesztendő függvény alkalmassá váljék a magasabb fokú felület leírására. Ez a lépés arra is lehetőséget kínál, hogy az eddigiekben nem vizsgált (és nem változtatott) faktorokkal kibővítsük a tervet. zj
149
A faktorok kijelölése A független változók (faktorok) sokszor többféleképpen is megválaszthatók. Gondos megfontolással olyan faktorok jelölhetők ki, amelyek között kevésbé várható kölcsönhatás; ha ügyetlenebbek vagyunk, e kölcsönhatásokat beépítjük. Például, ha egy észter lúgos hidrolízisét végző folyamatos működésű reaktort vizsgálunk, a kísérletek során a lúgoldat és az észtert tartalmazó oldat betáplálási térfogatáramát változtathatjuk. A reaktor működését ténylegesen Wlúg+Wészter összes betáplált térfogatáram (az elegy t közepes tartózkodási ideje) és a lúg koncentrációja befolyásolja.
t
Wlúg
V ; Wészter
clúg
Wlúg Wlúg Wészter
.
Ha faktorként a két térfogatáramot választjuk, ami a legkényelmesebb, már akkor is lesz kölcsönhatás közöttük, ha a reaktorban az összes térfogatáram (tartózkodási idő) és a komponens koncentrációja között nincs interakció. Helyesebb a tartózkodási időt és a koncentrációt választani faktoroknak, még ha ez egy kis számolást igényel is. V = 100 dm3 térfogatú reaktorra a 20-6. táblázat mutatja a 22 terv beállítási pontjait a tartózkodási időre t és a koncentrációra (c), a kódolt x1 és x2 független változókra, illetve a beállítandó térfogatáram értékekre. 20-6. táblázat i 1 2 3 4
x1 – + – +
x2
clúg
t
Wlúg
Wészter
h
dm3/h
dm3/h
– – + +
– 0.2 0.4 0.2 0.4
10 10 20 20
2 4 1 2
8 6 4 3
A szignifikanciavizsgálatok értelmezése A tipikus nullhipotézis szerint a j-edik faktornak nincs hatása: H0: j = 0. Ezt csak akkor utasítjuk el, ha a t 0 b j sb j próbastatisztika meghaladja a táblázatból vehető kritikus értéket, vagyis, ha bj az sb j szóráshoz képest elég nagy. Az sb j szórás négyzete
150
2Var b j
2
2 y
1 kN
eloszlású, ahol k a terv ismétléseinek száma, annak az
s 2y
2 y2 szórásnégyzet
nek a szabadsági foka, amely az ismételt mérésekből rendelkezésre áll. Ha minden pontban k-szor (k > 1) ismételjük a kísérletet N k 1 ; ha csak a centrumban van k c ismétlés, k c 1 . Látható, hogy sb2j az ismétlések számától és az egyedi kísérletek varianciájától függ. Ha y2 és így (különösen kis esetén) s 2y nagy, k pedig kicsi, könnyen előfordulhat, hogy egy faktor hatását a szórás elfedi és nem találjuk szignifikánsnak, vagyis nem mutatunk ki egy létező hatást: másodfajú hibát követünk el. Az előzetes kísérleti tapasztalat segít y2 nagyságrendjének megítélésében. Ebből kiszámítható, hogy egy minimális bj kimutatásához (szignifikánsnak minősítéséhez) hány ismétlésre van szükség. Ha az ismétlések száma a terv egyes pontjaiban nem azonos (például azért, mert valamelyik kísérletet elrontottuk), elvész az ortogonalitás, az eredményeket csak a 5. fejezetben nem-ortogonális esetre ismertetett módszerekkel dolgozhatjuk föl.
151
Varianciaanalízis alapjai 10. Egy faktor szerinti osztályozás A t-próbával két csoportot hasonlíthatunk össze, kérdezve, hogy a mögöttük álló két sokaság várható értéke azonos-e. Egyes esetekben szükség lehet több csoport (pl. ötféle nyersanyag, háromféle katalizátor) összehasonlítására: erre alkalmas módszer a varianciaanalízis vagy szóráselemzés. Nevével ellentétben nem szórások, hanem átlagok összehasonlítására szolgál. A módszer alapelveit ebben a fejezetben az egy faktor szerinti osztályozáson mutatjuk be, a további fejezetekben kerül sor a több faktor szerinti osztályozásra és az alkalmazásra szolgáló kísérleti tervek típusaira. A varianciaanalízis hasonló részletességű ismertetése a hazai szakirodalomban nem található meg, ezért a lehetőségekhez képest teljességre törekedtünk. Ez azt jelenti, hogy olyan matematikai részleteket is megmutatunk, amelyekre csak az olvasók egy részének van szüksége. Az ezeket tartalmazó alfejezeteket *-gal jelöltük. A matematikai részletek iránt nem érdeklődő olvasó a jelzett fejezetek kihagyásával is megkapja a módszerek használatához szükséges tudnivalókat. 10-1. példa Liszthez a sütőipari minőség javítása érdekében háromféle fehérjeizolátumot adtak: kukoricacsírát, búzacsírát és rizscsírát, és mérték az MT technofunkciós tulajdonságot. Összehasonlításképpen adalék nélküli mintát is vizsgáltak. Az adalék fajtája a vizsgált faktor, jelöljük A-val. A (valóságos elemekből létrehozott) hipotetikus mérési eredményeket mutatja a 10-1. táblázat, mely néhány, a számításokhoz szükséges további adatot is tartalmaz. 10-1. táblázat 1: adalék nélkül 2: kukoricacsíra adalékkal 3: búzacsíra adalékkal 4: rizscsíra adalékkal Faktorszint
y ij pi y i si 152
1 250(1) 259(8) 269(3) 3 259.33 9.504
2 222(12) 228(5) 237(9) 3 229.00 7.550
3 238(2) 247(11) 250(6) 3 245.00 6.245
4 212(10) 225(4) 234(7) 3 223.67 11.060
90.333
si2
57.003
39.000
122.324
A táblázatban lévő számértékek az y ij értékek, ahol az első index (i) a csoport sorszáma, vagyis azt mutatja, hogy melyik adalékot használták; a második index (j) pedig a csoporton belüli ismétlés sorszámát mutatja. A számok fölött zárójelben lévő kis számok a kísérletek elvégzésének sorrendjét mutatják. Jelölje általában r a csoportok számát (itt r = 4), p az ismétlések számát (itt p = 3). A példában az ismétlések p száma minden csoportra azonos. A vizsgálat célja többek között annak eldöntése, hogy az adalékolás befolyásolja-e a liszt MT tulajdonságát. Azt szeretnénk eldönteni, hogy van-e különbség az 1, 2, 3, 4 csoportok között, vagy másképpen van-e hatása az “adalék” faktornak az MT tulajdonságra. Ha ugyanazzal az adalékkal többször elkészítjük a lisztet, és megmérjük az MT tulajdonságát, természetesen különböző eredményeket kapunk, amint ez a táblázatban is látható. Az y valószínűségi változó ingadozásának (a csoporton belüli, az ismétlés során tapasztalt ingadozásnak) a varianciája y2 e2 . A e2 jelölés azt hangsúlyozza, hogy az y-ban elkövetett kísérleti hiba varianciájáról van szó. Ez a variancia a csoportokon belüli ingadozásból, az ismétlésekből becsülhető. Az i-edik csoportra:
y p
si2
j 1
ij
y i
2
. (10.1) p 1 Ha az egyes csoportokon belüli ingadozás varianciája azonos, ezeket a szórásnégyzeteket egyesíthetjük (mivel itt mindegyik si2 szórásnégyzetnek azonosan p – 1 a szabadsági foka, ez egyszerű átlagolást jelent):
s R2 s 2y
si2 i
y r
r
i
p
j
ij
y i
2
y2
(10.2) r r p 1 Ezt az egyesített szórásnégyzetet a varianciaanalízisben maradék szórásnégyzetnek nevezik (innen az R index), de tulajdonképpen a regresszióanalízisnél megismert error szórásnégyzetnek felel meg. Nevezik csoportokon belüli (within groups) szórásnégyzetnek is. Az 1. fejezetben megtanultuk, hogy ha egyetlen sokaságból veszünk több csoportban mintát, a csoportok átlaga nem lesz azonos (az átlag is valószínűségi változó). Ezt szemlélteti három csoport esetére a 10-1a) ábra. Ha a csoportok között csakugyan nincs különbség, az átlagok eltérését ugyanaz a véletlen ingadozás okozza, mint a csoportokon belüli ismétlések különbözőségét. Ebben az esetben az átlagok ingadozásának varianciája y2 y2 p e2 p , és ez az átlagok eltéréséből becsülhető, ha az egyes csoportokban azonos p számú ismétlés van: 153
r
y2 s 2y
y i 1
i
y
2
.
r 1
(10.3)
Az alkalmazott jelölések: yi. az yij értékek j index (az ismétlés) szerinti átlaga, y.. a j és i szerinti átlag, vagyis az összes kísérleti eredmények átlaga. Az A faktor szintjei: Ai i=1
i = 21
1
i=3
0
0 4
5
6
7
y
8
4
5
számtani közép
6
7
8
y
a) b) 10-1. ábra. Szemléltető ábrák egy faktor szerinti osztályozáshoz Az y valószínűségi változó (az MT technofunkciós tulajdonság) ingadozásának varianciáját kiszámíthatjuk az átlagok varianciájából is: y2 p y2 (ha tényleg csak a véletlen ingadozás miatt különböznek az átlagok). Ez a variancia az átlagok (10.3) képlettel kiszámított szórásnégyzetéből becsülhető: r
s A2 s 2y p
p y i y
2
i 1
. (10.4) r 1 Ezt a szórásnégyzetet nevezik az A faktor szórásnégyzetének (innen az A index), vagy csoportok közötti (between groups) szórásnégyzetnek. Ha a csoportok között nincs különbség, és az átlagok eltérését csak a véletlen ingadozás okozza, az átlagok eltéréséből most kiszámított s A2 és a csoportokon belüli eltérésekből az előbb kiszámított s R2 szórásnégyzet egyaránt y2 e2 körül ingadozik, hányadosuk F-eloszlású. Ha az egyes csoportok várható értékei között különbség van (10-1b) ábra), akkor az s A2 szórásnégyzet, amely ekkor nem y2 körül ingadozik, sokkal nagyobb az s R2 szórásnégyzetnél, vagyis hányadosuk sokkal nagyobb, mint amekkora az F-eloszlás szerint lehetne. Ezt vizsgáljuk majd statisztikai próbával. A próbastatisztika: 154
s A2 F0 2 . sR
(10.5)
Az s R2 szórásnégyzet mindenképpen y2 körül ingadozik, ez adja a 10-1. ábrán a Gauss-görbét. Amennyiben a minták (csoportok) eltérő várható értékű sokaságból származnak, a csoportok átlagainak eltérése a várható értékek különbözőségéből és a véletlen ingadozásból tevődik össze, ezért az átlagértékek jobban eltérnek egymástól (és a közös y.. átlagtól), mint azt a véletlen ingadozás indokolná. Ezért lesz s A2 sokkal nagyobb s R2 -nél. A 10-1a. ábrán a véletlen ingadozás magyarázza az átlagok különbözőségét. A 101b. ábrán az átlagok közötti különbség nagyobb annál, hogy azt a csoportokon belüli ingadozással magyarázhatnánk. Feladatunkban a valóságot nem ismerjük, éppen azt kell eldöntenünk, hogy a két eset közül melyik áll fönn. A 10-1. példa folytatása Először számítsuk ki sR2 értékét, azaz egyesítsük a csoporton belüli szórásnégyzeteket. A 10-1. táblázat utolsó sorában szereplő négy szórásnégyzet szabadsági foka azonos ( 3 1 2 ), ezért a (10.2) egyenlet alapján
sR2
90.333 57.003 39.000 122.324 308.660 77.165 4 4
Az s A2 szórásnégyzetet a (10.5) képlet alapján számítjuk: y.. s 2 y
259.33 229.00 245.00 223.67 239.250 4
259.33 239.25 2 229.00 239.25 2 3
2 245.00 239.25 2 22367 . 239.25
3
261356 .
sA2 3 261356 . 784.068 2 2 Az s A és sR hányadosaként a (10.5) szerint adódó F0 próbastatisztika: s A2 784.068 F0 2 10.16 . sR 77.165
Az F-eloszlás kritikus értéke 0.05-os szignifikanciaszinthez a Függelék IV. táblázatából 4.07 [a számláló szabadsági foka 3, a nevezőé 4 3 1 8 ]. A talált próbastatisztika-érték ezt a határt meghaladja, tehát elutasítjuk azt a feltételezést, hogy a csoportok várható értékei nem különböznek, vagyis hogy az adaléknak nincs hatása MTre.
155
A számítást a varianciaanalízisnél szokásos táblázatos formában is elvégezzük a 10-2. példában. 10.1. A modell A valószínűségi modell a következő: az egyes i adalékolási módszerekkel kapható MT értékek (jelöljük őket, ahogy a függő változót szokás, általánosan y-nal) azonos varianciájú normális eloszlású sokaságot alkotnak, i várható értékkel. Az i-edik adalékolással végzett j-edik ismételt kísérlet eredménye: (10.6) yij i ij . A várható értéktől való eltérés az kísérleti hiba. Az kísérleti hibára a következő feltételezések érvényesek: az ij hibák várható értéke zérus; ez azt jelenti, hogy az yij kísérleti adatok a i
várható érték körül ingadoznak; varianciájuk e2 , konstans, vagyis mindegyik i csoportra egyforma nagyságú (homoszcedaszticitás); az ij hibák csoportokon belül és csoportok között is függetlenek egymástól,
és normális eloszlásúak.
Legyen általánosan az összehasonlítandó csoportok száma (a faktor szintjeinek száma) r, az egyes csoportokon belüli ismételt kísérletek száma pi, vagyis a levezetések arra az esetre is érvényesek, amelynél az ismétlések száma csoportonként különböző. Az itt előforduló egyetlen faktort A jelöli. A kérdés, amire a választ keressük, hogy az egyes adalékokhoz tartozó i várható értékek megegyeznek-e. Az ij kísérleti hiba nemcsak y mérésének hibáját tartalmazza, hanem a figyelembe nem vett (vizsgálatba be nem vont, és megfelelően kézben nem tartható) többi faktor ingadozásának, változásának hatását is. Például a levegő nedvességtartalma, vagyis hogy melyik nap végezzük a kísérletet, hatással lehet az eredményre, de az is lehet, hogy a névleg azonos készülékek sem adnak azonos eredményt, ha több készülékkel dolgozunk. Nyilvánvalóan helytelen lenne egyik nap (vagy egyik készüléken) mérni az egyik adalékkal, másik nap (vagy másik készülékben) a másikkal, mert akkor nem tudnánk, hogy az adalékok hatásában van-e a különbség, vagy pedig a kísérleti körülmények eltérése okozza az eltérő eredményt. Ekkor megsértenénk az ij hibák függetlenségére vonatkozó feltételt. Minthogy ezeket az egyéb hatásokat kiküszöbölni nem tudjuk, randomizálással, a kísérletek sorrendjének ill. az egyes kísérletekhez tartozó készülék véletlenszerű megválasztásával érjük el, hogy a zavaró hatások ne a kísérletek sorrendjében (az időben) megnyilvánuló vagy a készülékhez rendelhető rendszeres hibaként, hanem a függő változó szórásaként jelentkezzenek. Szokás az i-edik adalékoláshoz tartozó i várható értéket egy közös részre és az A faktor i-edik csoporthoz rendelhető i hatására bontani: 156
i i .
(10.7) Ez a felbontás természetesen végtelenül sokféleképpen megvalósítható, mert annyi i értékünk van, ahány adalék (r), az egyenletben pedig eggyel több a paraméterek száma ( r 1 ). Az egyik szokásos módszer szerint a közös rész a i várható értékek átlaga, vagyis:
pY p p p i i
i
i
i
i
i
i
.
(10.8)
i
i
Ekkor
pi i 0 .
(10.9)
i
A szakirodalomban ezt „sum to zero” vonatkoztatásnak nevezik. Egy másik, ugyancsak használatos, de e könyvben nem követett konvenció, hogy az utolsó (r-edik) csoportra vonatkoztatnak, vagyis r 0 , ezt „set to zero” névvel illetik. A modell tehát: yij i ij . (10.10) A vizsgálandó hipotézis az, hogy az A faktornak nincs hatása, vagy másképpen, a csoportok között nincs különbség. Ez a következőképpen fogalmazható meg: H0: 1=2= =r.
(10.11)
Ezt nevezik átlagmodellnek (means model). Másképpen: H0: i = 0,
i = 1, ..., r,
(10.12)
ezt nevezik hatásmodellnek (effects model). A kettő természetesen egyenértékű. A következőkben elvégezzük a modell és i paramétereinek becslését, majd az eltérés-négyzetösszeg fölbontását. 10.2. A modell paramétereinek becslése A becsült modell: Yi i m ai ,
(10.13)
ahol megint legyen érvényes, hogy
pi ai 0 .
(10.14)
i
Ez a modell megegyezik az egyváltozós lineáris regresszió modelljével Y= i + x i -x , de itt a faktorok egyes szintjeinek értékét (az xi értékeket) nem kí157
vánjuk használni, ill. nem ismerjük, ezért x i -x helyett i szerepel, amelyben xi és csak együtt jelenik meg. A legkisebb négyzetek módszere (és minthogy e2 konstans, a hibák függetlenek és normális eloszlásúak, a maximum-likelihood-módszer) szerint minimalizálandó négyzetösszeg: n
pi
i
j
yij m ai
2
min .
(10.15)
Megjegyzendő, hogy ez a kritérium csak akkor használható teljes joggal, ha a kísérleti hibák egymástól függetlenek. Ha valamilyen időbeli folyamat játszódik le, amelyet a modellben nem veszünk figyelembe, ez a függetlenség az egymás utáni hibákra nem teljesül. A szélsőérték helyét a szokásos módon úgy határozzuk meg, hogy a becsült paraméterek szerinti parciális deriváltakat nullával tesszük egyenlővé:
2 yij m ai 0 , m i j
(10.16)
yij m pi piai .
(10.17)
i
j
i
i
A jobb oldal második tagja zérus, ezért
yij pi yi i j m i y . pi pi i
(10.18)
i
2 yij m ai 0 , a j
(10.19)
yij mpi pi ai .
(10.20)
j
Az előbb m-re kapott kifejezést behelyettesítve: 1 ai y ij m y i y i = 1, ..., r. pi j
(10.21)
Az egyes csoportok becsült várható értéke, vagyis a modellből számított érték: (10.22) Y y . i
i
i
10.3. Az eltérés-négyzetösszeg fölbontása Ebben a pontban az eltérés-négyzetösszeg fölbontásával megalapozzuk a hipotézisvizsgálatot. Bontsuk föl az eltéréseket, feltételezve, hogy a (10.10) modell érvényes:
158
y
ij
y
i yij Yi yij Yi Yi Yi ij
m ai m ai i
(10.23)
Négyzetre emelve mindkét oldalt, és j, majd i szerint szummázva, végül m-re és ai -re (10.18)-at, ill. (10.21)-et helyettesítve: 2 2 yij Yi yij m ai m pi pi ai i 2
i
2
j
i
yij yi i
j
i
y 2
2
i
pi pi yi y i
j
i
2
.
(10.24)
i
A vegyes szorzatokat tartalmazó tagok zérussal egyenlők, mert a szorzást kijelölve bennük
y
vagy a
ij
y i 0 ,
j
pi yi y pi ai 0 ,
vagy a
i
i
vagy pedig a
pi i 0 tag szerepel. i
Ha a modell adekvát, vagyis a feltételezések teljesülnek, a FisherCochran-tétel szerint a (10.24) jobb oldalán szereplő négyzetösszegek egymástól függetlenek, mindegyikük 2 e2 eloszlású, mert a bal oldalon levő négyzetösszeg ilyen, és a szabadsági foka:
pi pi 1 1 r 1 . i
(10.25)
i
Vizsgáljuk először a (10.24) jobb oldalán szereplő utolsó négyzetösszeget! Ha a nullhipotézis igaz, vagyis minden i 0 , ezt behelyettesítve a következő kifejezés lesz 2 e2 eloszlású: S A pi ai2 pi yi y , 2
i
(10.26)
i
r 1 szabadsági fokkal. A (10.24) jobb oldalának első tagja az yij yi . eltérések négyzetösszege:
S R yij m ai i
j
y 2
i
j
ij
yi
2
.
(10.27)
Ezt maradék- vagy reziduális négyzetösszegnek nevezik, de a regresszióanalízisnél megismert error négyzetösszegnek felel meg. Ez a négyzetösszeg a nullhipotézis érvényességétől függetlenül 2 e2 eloszlású, pi r szabadsági fokkal. A szabadsági fokkal osztva az s R2 szórásnégyzetet kapjuk, amely 2 e2 eloszlású, vár-
159
ható értéke e2 . Ehhez természetesen szükség van az hibákra vonatkozó föntebbi feltételezések teljesülésére. Az SA négyzetösszeget a szabadsági fokával ( r 1-gyel) elosztva egy s A2 szórásnégyzetnek nevezhető mennyiséget kapunk, amely eszerint a nullhipotézis igaz volta esetén 2 e2 eloszlású. Ha a H0 hipotézis igaz, a két szórásnégyzet aránya Feloszlású, vagyis a H0 hipotézis F-próbával ellenőrizhető. A kézi számolás segédnégyzetösszegek kiszámításával egyszerűbbé tehető: S A pi yi . y.. pi yi2 y2 pi 2
i
i
(10.28)
i
S R yij2 pi yi2 i
j
(10.29)
i
A szórásnégyzetek várható értéke Az s R2 maradék szórásnégyzet várható értéke, amennyiben a varianciaanalízisnek a hibák eloszlására vonatkozó feltételei fennállnak, e2 . Az A faktor hatása s A2 szórásnégyzetének várható értéke a következőképpen kapható meg. A
yij Yi i
2
négyzetösszeg fölbontásával kimutattuk, hogy a szoká-
j
sos feltételek érvényessége esetén a
p a i
i pi y i y i 2
i
i
2
négyzet-
i
összeg 2 e2 eloszlású = r – 1 szabadsági fokkal. Algebrailag átalakítva:
pi ai i pi ai2 pii2 2 pi aii . 2
i
i
i
(10.30)
i
Ennek várható értéke, figyelembe véve, hogy E ai i :
E pi ai i
i
2 E pi ai2 pii2 . i
(10.31)
i
A bal oldalon álló négyzetösszeg 2 e2 eloszlású, várható értéke r 1 e2 , mert a
2 várható értéke az r 1 szabadsági fok. Ezzel E S A E pi ai2 r 1 e2 pi i2 . i i
(10.32)
Az s A2 szórásnégyzet várható értéke:
E s A2 e2
160
p i
i
r 1
2 i
.
(10.33)
Ha a nullhipotézis igaz, vagyis minden i=0, a második tag zérus, és s A2 várható értéke e2 . Megjegyzendő, hogy s A2 nem igazi szórásnégyzet, mert nem véletlenszerű, hanem rendszeres eltérések következménye, nincs tehát olyan sokaság, amelynek a 2 varianciájával rokonságban lenne, vagyis nem 2 2 eloszlású, kivéve, ha a nullhipotézis igaz, akkor 2 e2 eloszlású. 10.4. Hipotézisvizsgálat és ANOVA-tábla A 10.1. alfejezetben a (10.11) és (10.12) összefüggésekkel definiáltuk a nullhipotézist, amely szerint a csoportok várható értékei között nincs különbség (átlagmodell): H0 : 1 2 r ,
(10.11)
illetve hogy az A faktornak nincs hatása (hatása a faktor minden szintjén azonos): H0: i = 0,
i = 1, ..., r.
(10.12)
Ha a nullhipotézis igaz, az s A2 (10.5) F0 2 sR próbastatisztika F-eloszlású. A négyzetösszegeket és a szórásnégyzeteket ill. a számított próbastatisztikát a következő szóráselemzési (ANOVA: analysis of variance) táblázatban szokás összefoglalni (10-2. táblázat). 10-2. táblázat Az eltérés forrása A hatása (csoportok közötti) Ismétlések (csoportokon belüli)
Eltérés-négyzetösszeg
S R y ij y i
Teljes
S 0 y ij y
S A pi yi y
Szabadsági fok r 1
2
Szórásnégyzet
s 2A
SA r 1
F0
s 2A s R2
i
i
i
2
i
j
j
pi r
2
p
i
s R2
SR pi r i
1
i
161
Az S0 ún. teljes négyzetösszeg az y átlagtól való eltéréseket méri. A szóráselemzés úgy is fölfogható, hogy ezt a négyzetösszeget bontjuk a hatások szerinti alkotókra. A Fisher–Cochran-tételből azt is tudjuk, hogy ezek a négyzetösszegek egymástól függetlenek. Az A faktor hatását akkor minősítjük jelentősnek (akkor utasítjuk el a H0 nullhipotézist), ha az s A2 s R2 arány az F-eloszlás kritikus értékénél nagyobb. Egyoldali F-próbát végzünk, mert az SA négyzetösszeg a 2 e2 eloszlástól fölfelé tér el, ha a H0 nullhipotézis nem igaz. Kiegyensúlyozott terv Legkedvezőbb, ha az ismétlések pi száma az A faktor minden i szintjén azonos (ún. kiegyensúlyozott terv): p1 = p2 = ... = pr = p . Erre az esetre a szóráselemzés a 10-3. táblázatban látható. Ilyen a 10-1. példában szereplő adatsor. 10-3. táblázat Az eltérés forrása A hatása (csoportok közötti) Ismétlések (csoportokon belüli)
Eltérés-négyzetösszeg
S A p yi y
2
S R y ij y i j
S 0 y ij y
Teljes
r 1
i
i
i
j
Szabadsági fok
2
r p 1
Szórásnégyzet s A2
s R2
SA r 1
F0
s 2A s R2
SR r p 1
2
rp 1
Vezessük be itt a következő jelölést:
A
i2 i
r 1
(10.34)
Ezzel E s 2A e2 p A A szakirodalom szerint (Lindman, 1991, p. 22) kiegyensúlyozott tervnél (vagyis ha p minden csoportra azonos) a statisztikai próbák kevésbé érzékenyek a varianciáknak az egyes csoportok közötti esetleges csekély különbözőségére. Másrészt a próbák ereje ilyenkor a legnagyobb (legkisebb a másodfajú hiba – a hatás ki nem mutatásának – valószínűsége). 162