Biometria Gerg´o Lajos 2012.
Tartalomjegyz´ ek 1. Val´ osz´ın˝ us´ egsz´ am´ıt´ asi bevezet˝ o 1.1. Bevezet˝o p´eld´ak, defin´ıci´ok . . . . . . . . . . . . . . . . . 1.2. Val´osz´ın˝ us´egi v´altoz´o . . . . . . . . . . . . . . . . . . . . 1.2.1. Norm´alis eloszl´as´ u val´osz´ın˝ us´egi v´altoz´o . . . . .
4 4 6 11
2. Statisztikai m´ odszerek 2.1. Gyakoris´agi- ´es s˝ ur˝ us´eghisztogram . . 2.2. V´arhat´o ´ert´ek ´es sz´or´as becsl´ese . . . 2.3. Regresszi´o, korrel´aci´o . . . . . . . . . 2.4. Nevezetes eloszl´asok a statisztik´aban 2.4.1. t-eloszl´as . . . . . . . . . . . . 2.4.2. F -eloszl´as . . . . . . . . . . . 2.4.3. χ2 -eloszl´as . . . . . . . . . . . 2.5. Becsl´esek . . . . . . . . . . . . . . . . 2.5.1. Pontbecsl´esek . . . . . . . . . 2.5.2. Intervallum becsl´esek . . . . . 2.6. Statisztikai hipot´ezisvizsg´alat . . . . 2.7. Pr´ob´ak . . . . . . . . . . . . . . . . . 2.7.1. Korrel´aci´os t-pr´oba . . . . . . 2.7.2. Egymint´as t-pr´oba . . . . . . 2.7.3. F -pr´oba . . . . . . . . . . . . 2.7.4. K´etmint´as t-pr´oba . . . . . . 2.7.5. Variancia-anal´ızis . . . . . . . 2.7.6. χ2 -pr´ob´ak . . . . . . . . . . .
14 15 16 21 24 24 26 28 29 29 30 32 34 34 36 38 39 41 44
2
. . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . .
´ TARTALOMJEGYZEK 3. Diszkr´ et eloszl´ asok 3.1. Poisson-eloszl´as . . . . . . 3.2. Binomi´alis-eloszl´as . . . . 3.3. Hipergeometrikus-eloszl´as 3.4. P´eld´ak . . . . . . . . . . . 4. Statisztikai t´ abl´ azatok
3 . . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
48 48 49 50 51 52
1. fejezet Val´ osz´ın˝ us´ egsz´ am´ıt´ asi bevezet˝ o 1.1.
Bevezet˝ o p´ eld´ ak, defin´ıci´ ok
Az els˝o fejezetben szeretn´enk megismertetni az olvas´okat a val´osz´ın˝ us´egsz´am´ıt´as alapjaival, legink´abb egyszer˝ u p´eld´akon kereszt¨ ul. A terjedelem korl´atai miatt nem tehet¨ unk mindig pontos kijelent´eseket, de t¨oreksz¨ unk a lehet˝o legprec´ızebb defin´ıci´okra, t´etelkimond´asokra. Akkor tekints¨ uk is az els˝o p´eld´ankat, ami az egy darab dob´okock´aval t¨ort´en˝o dob´ast ´ırja le. Egy k´ıs´erlet lehets´eges kimeneteleinek halmaz´at a val´osz´ın˝ us´egsz´am´ıt´asban esem´ enyt´ ernek nevezik ´es a´ltal´aban az Ω (g¨or¨og nagy omega) bet˝ uvel jel¨olik. Eset¨ unkben ez Ω = {1, 2, 3, 4, 5, 6} Az Ω halmaz tetsz˝oleges r´eszhalmaz´at esem´enynek nevezz¨ uk, tekints¨ unk erre is p´eld´akat. 1. A1 : 6-ost dobok, halmazjel¨ol´essel: A1 = {6} ⊂ Ω 2. A2 : pr´ımsz´amot dobok, A2 = {2, 3, 5} ⊂ Ω 3. A3 : legal´abb kettest dobok, A3 = {2, 3, 4, 5, 6} ⊂ Ω 4. A4 : p´aros sz´amot dobok, A4 = {2, 4, 6} ⊂ Ω 4
5
1.1 Bevezet˝o p´eld´ak, defin´ıci´ok
Az egy elemet tartalmaz´o esem´enyeket elemi esem´ enyeknek nevezz¨ uk. P´eld´aink k¨oz¨ ul az A1 egy elemi esem´eny, a t¨obbi p´eld´ank viszont nem elemi esem´eny. L´etezik m´eg k´et kiemelt, k¨ ul¨on nevet kap´o esem´eny, ezek pedig a lehetetlen esem´ eny (∅), valamint a biztos esem´ eny (Ω). Egyszer˝ uen l´athat´o, hogy esem´enyek uni´oja, metszete, k¨ ul¨onbs´ege, ´es (Ω-ra vonatkoz´o) komplementere is esem´eny lesz. Ezek jel¨ol´es´ere a val´osz´ın˝ us´egsz´am´ıt´as ter¨ ulet´en ´altal´aban a k¨ovetkez˝oket haszn´alj´ak ∪ (uni´o), ∩, vagy · (metszet), \ (k¨ ul¨onbs´eg), A (A esem´eny komplementere). L´athatjuk, hogy a metszetet szorz´asjellel szok´as jel¨olni, aminek oka, hogy f¨ uggetlen esem´enyek val´osz´ın˝ us´ege egyenl˝o az esem´enyek val´osz´ın˝ us´egeinek szorzat´aval. Az esem´enyek defin´ıci´oja ut´an t´erj¨ unk r´a a val´ osz´ın˝ us´ eg defin´ıci´oj´ara. Egy esem´eny val´osz´ın˝ us´eg´enek meghat´aroz´asakor az esem´enyhez egy sz´amot rendel¨ unk a [0, 1] intervallumb´ol. Ez tulajdonk´eppen egy P , az esem´enyek halmaz´an ´ertelmezett f¨ uggv´eny seg´ıts´eg´evel t¨ort´enik. A f¨ uggv´eny esem´enyhez rendelt ´ert´eke lesz az adott esem´eny val´osz´ın˝ us´ege. A f¨ uggv´enynek bizonyos tulajdons´agokkal rendelkeznie kell, hogy val´osz´ın˝ us´egr˝ol besz´elhess¨ unk. Egy p´elda az ilyen tulajdons´agok r¨ogz´ıt´es´ere a Kolmogorov-f´ele axi´omarendszer 1. 0 ≤ P (A) ≤ 1, azaz a val´osz´ın˝ us´eg egy 0 ´es 1 k¨oz¨otti ´ert´ek; 2. P (∅) = 0, azaz a lehetetlen esem´eny val´osz´ın˝ us´ege 0; 3. P (Ω) = 1, a biztos esem´eny´e pedig 1; 4. A∩B = ∅ ⇒ P (A ∪ B) = P (A)+P (B), azaz ha A ´es B egym´ast kiz´ar´o esem´enyek, akkor a k´et esem´eny uni´oj´anak val´osz´ın˝ us´ege megegyezik az esem´enyek val´osz´ın˝ us´egeinek ¨osszeg´evel; ! n n [ X 5. Ai ∩ Aj = ∅ (i 6= j) ⇒ P Ai = P (Ai ), azaz a 4. felt´etel i=1
i=1
v´eges sok, egym´ast kiz´ar´o esem´enyre is alkalmazhat´o. Ennek egy n [ tov´abbi fontos esete, amikor Ai = Ω, azaz az Ai esem´enyek i=1
6
1. Val´osz´ın˝ us´egsz´am´ıt´asi bevezet˝o ! n [ teljes esem´enyrendszert alkotnak, ´es ekkor P Ai = 1. i=1
Megjegyezn´enk, hogy term´eszetesen nem csak a Kolmogorov-f´ele val´osz´ın˝ us´eg l´etezik, vannak sokkal bonyolultabbak is, de ez az egyik legelterjedtebb modell, mi ezt fogjuk haszn´alni a tov´abbiakban. P´eldak´eppen n´ezz¨ uk a m´ar eml´ıtett, kockadob´ashoz tartoz´o esem´enyeket, ´es val´osz´ın˝ us´egeiket: P (A1 ) = 61 , P (A2 ) = 36 = 21 , P (A3 ) = 5 3 1 , P (A4) = 6 = 2 . 6 Most t´erj¨ unk ´at egy kicsit bonyolultabb p´eld´ara, tekints¨ uk azt, amikor k´et k¨ ul¨onb¨oz˝o dob´okock´aval (piros, k´ek) dobunk. Ekkor Ω = {(1, 1), (1, 2), . . . , (1, 6), (2, 1), . . . , (2, 6), . . . , (6, 6)} az esem´enyt´er, |Ω| = 36. Megjegyezn´enk, hogy fontos az a felt´etel, hogy k¨ ul¨onb¨oz˝o kock´akkal dobtunk, mert ebben az esetben - u ´ gymond - sz´am´ıt a sorrend, m´ıg ha egyform´ak lenn´enek a kock´ak, akkor nem, ´es bonyolultabb lenne a modell. P´eld´ak esem´enyekre 1. A1 : legal´abb 11 a k´et dobott 1 {(5, 6), (6, 5), (6, 6)} ⊂ Ω, P (A1 ) = 12
sz´am
¨osszege,
A1
=
2. A2 : a k´et dobott sz´amb´ol legal´abb egy 1-es van, A2 = {(1, 1), (1, 2), . . . , (1, 6), (2, 1), (3, 1), . . . , (6, 1)} ⊂ Ω, P (A2 ) = 11 36 3. A3 : a k´et dobott sz´am k¨oz¨ott pontosan egy 1-es van, A3 = 5 {(1, 2), (1, 3), . . . , (1, 6), (2, 1), (3, 1), . . . , (6, 1)} ⊂ Ω, P (A3 ) = 18 4. A4 : dupla 1-est dobtunk, A4 = {(1, 1)} ⊂ Ω, P (A4 ) =
1.2.
1 36
Val´ osz´ın˝ us´ egi v´ altoz´ o
E k´et p´elda ut´an megpr´ob´aljuk defini´alni a val´ osz´ın˝ us´ egi v´ altoz´ ot, ´am mivel a bevezet˝oben is eml´ıtett¨ uk, hogy nem egy matematikailag t¨ok´eletesen prec´ız m˝ u elk´esz´ıt´ese a c´elunk, hanem a tanulm´anyok sor´an
7
1.2 Val´osz´ın˝ us´egi v´altoz´o
elsaj´at´ıtand´o tananyag k¨onny˝ u meg´ert´es´et seg´ıt˝o jegyzet, ez´ert csak bizonyos szeml´eletes defin´ıci´ot ny´ ujtunk. Teh´at legyen ξ (g¨or¨og bet˝ u, ejtsd: ksz´ı) egy val´osz´ın˝ us´egi v´altoz´o, err˝ol mondjunk egyel˝ore annyit, hogy bizonyos szempontb´ol m´er” vala” mit, ´ert´ekeit egy r¨ogz´ıtett halmazb´ol veheti fel. A szeml´eletes defin´ıci´ohoz mutassunk p´eld´akat 1. ξ1 val´osz´ın˝ us´egi v´altoz´o: m´eri egy kockadob´as eredm´eny´et 2. ξ2 val´osz´ın˝ us´egi v´altoz´o: m´eri k´et kock´aval t¨ort´en˝o dob´as eset´en a dobott sz´amok ¨osszeg´et 3. ξ3 val´osz´ın˝ us´egi v´altoz´o: m´eri egy embercsoport testmagass´ag´at 4. ξ4 val´osz´ın˝ us´egi v´altoz´o: m´eri egy embercsoport testh˝om´ers´eklet´et 5. ξ5 val´osz´ın˝ us´egi v´altoz´o: m´eri valamely term´ek s´ uly´at Prec´ızebben fogalmazva a val´ osz´ın˝ us´ egi v´ altoz´ o az esem´enyt´eren ´ertelmezett f¨ uggv´eny, mely minden egyes esem´enyhez egy sz´amot rendel. 1.1. Defin´ıci´ o. Egy ξ val´osz´ın˝ us´egi v´altoz´ot diszkr´ et eloszl´ as´ u val´osz´ın˝ us´egi v´altoz´onak nevez¨ unk, ha megsz´aml´ alhat´o (v´eges, vagy megsz´aml´alhat´ oan v´egtelen) sz´am´ u ´ert´eket vehet fel, k¨ ul¨onben folytonos eloszl´ as´ unak nevezz¨ uk. A p´eld´akban eml´ıtett val´osz´ın˝ us´egi v´altoz´ok k¨oz¨ ul ξ1 ´es ξ2 diszkr´et eloszl´as´ uak, ξ1 lehets´eges ´ert´ekei: 1, 2, 3, 4, 5, 6, m´ıg ξ2 lehets´eges ´ert´ekei: 2, 3, 4, . . . , 12. ξ3 , ξ4 , ξ5 val´osz´ın˝ us´egi v´altoz´ok pedig folytonos eloszl´as´ uak, lehets´eges ´ert´ekeiket egy adott intervallumb´ol vehetik fel. 1.2. Defin´ıci´ o. Egy ξ val´osz´ın˝ us´egi v´altoz´o eloszl´ asf¨ uggv´ eny´ en az al´abbi F : R → [0, 1] f¨ uggv´enyt ´ertj¨ uk, ahol F (x) = P (ξ < x) defin´ıci´o szerint. 1.3. Megjegyz´ es. F monoton n¨oveked˝o f¨ uggv´eny.
8
1. Val´osz´ın˝ us´egsz´am´ıt´asi bevezet˝o
1.4. Megjegyz´ es. Ha ξ diszkr´et eloszl´as´ u val´osz´ın˝ us´egi v´altoz´o, lehets´eges ´ert´ekei: x1 , x2 , . . ., akkor X F (x) = P (ξ = xi ) xi <x
alakban sz´am´ıthat´o. Folytonos eloszl´as´ u val´osz´ın˝ us´egi v´altoz´ok eset´en gyakran l´etezik egy u ´ gynevezett s˝ ur˝ us´ egf¨ uggv´ eny (f : R → [0, +∞)), amely seg´ıts´eg´evel fel´ırhat´o az eloszl´asf¨ uggv´eny F (x) =
Zx
f (t) dt
−∞
alakban. Z+∞ 1.5. Megjegyz´ es. f (t) dt = 1 egyenl˝os´egnek minden s˝ ur˝ us´egf¨ ugg−∞
v´eny eset´en teljes¨ ulnie kell. 1. P´ elda Vizsg´aljuk meg megint az egy kock´aval t¨ort´en˝o dob´ast, de most ebben az ´altal´anosabb t´argyal´asm´odban, azaz legyen ξ val´osz´ın˝ us´egi v´altoz´o a kockadob´as eredm´enye. Ekkor a lehets´eges ´ert´ekei: 1, 2, 3, 4, 5, 6. N´ezz¨ uk meg az eloszl´asf¨ uggv´eny´et, amelyet k¨onnyen megkaphatunk az 1.4 megjegyz´esbeli k´eplet alkalmaz´as´aval: • F (x) = 0, ha x ≤ 1, • F (x) = 61 , ha 1 < x ≤ 2, .. . • F (x) = 56 , ha 5 < x ≤ 6, • F (x) = 1, ha x > 6.
9
1.2 Val´osz´ın˝ us´egi v´altoz´o
2. P´ elda ξ val´osz´ın˝ us´egi v´altoz´o m´eri az ´ora k´et mutat´oja a´ltal k¨ozrez´art kisebbik sz¨oget, 0 ≤ ξ ≤ π a lehets´eges ´ert´ekek. Ekkor az eloszl´asf¨ uggv´eny megadhat´o x π , ha x ∈ [0, π] F (x) = P (ξ < x) = 0, ha x < 0 1, ha x > π alakban, valamint ebben az esetben megadhat´o a val´osz´ın˝ us´egi v´altoz´o s˝ ur˝ us´egf¨ uggv´enye is 1 , ha x ∈ [0, π] f (x) = π 0, k¨ ul¨onben
form´aban. Tov´abb´a ellen˝orizhet˝o, hogy a s˝ ur˝ us´egf¨ uggv´eny, ´es az eloszl´asf¨ uggv´eny k¨ozti ¨osszef¨ ugg´es fenn´all, azaz teljes¨ ul az F (x) =
Zx
f (t) dt
−∞
egyenl˝os´eg. 1.6. Defin´ıci´ o (V´ arhat´ o´ ert´ ek). A ξ val´osz´ın˝ us´egi v´altoz´o v´ arhat´ o ´ ert´ ek´ en a k¨ovetkez˝o sz´amot ´ertj¨ uk X M(ξ) = µ = xi P (ξ = xi ) i
diszkr´et esetben, m´ıg folytonos esetben az Z+∞ M(ξ) = µ = xf (x) dx −∞
sz´amot.
10
1. Val´osz´ın˝ us´egsz´am´ıt´asi bevezet˝o
1.7. Defin´ıci´ o (Sz´ or´ asn´ egyzet). A ξ val´osz´ın˝ us´egi sz´ or´ asn´ egyzete (varianci´ aja) a 2 D (ξ) = M (ξ − µ)2 = M ξ 2 − (M(ξ))2
v´altoz´o
mennyis´eg. Diszkr´et esetben sz´am´ıthat´o X (xi − µ)2 P (ξ = xi ) i
form´aban, folytonos esetben pedig Z+∞ (x − µ)2 f (x) dx −∞
alakban. 1.8. Defin´ıci´ o (Sz´ or´ as). A ξ val´osz´ın˝ us´egi v´altoz´o sz´ or´ asa (standard elt´ er´ ese) a q p σ = M (ξ − µ)2 = D 2 (ξ) = D(ξ) mennyis´eg.
1. P´ elda Vizsg´aljuk meg egy kockadob´as v´arhat´o ´ert´ek´et µ=
X
xi P (ξ = xi ) =
i
6 X i=1
i·
1 7 = , 6 2
ehhez k´et megjegyz´est f˝ uzn´enk, mint l´atjuk, a felt´etlen¨ ul a lehets´eges ´ert´ekek k¨oz¨ ul val´o (h´arom dobni), viszont v´arhat´o, hogy sok dob´as ´atlaga ´ert´ekhez, teh´at ilyen szempontb´ol m´egis egy olyan mint amit a neve sugall.
v´arhat´o ´ert´ek nem ´es felet nem tudunk k¨ozel lesz ehhez az m´er˝osz´amot fejez ki,
2. P´ elda N´ezz¨ uk meg, mit tudunk mondani az ´oramutat´os p´eld´an´al ξ v´arhat´o ´ert´ek´er˝ol Z+∞ Zπ 1 π µ= xf (x) dx = x dx = , π 2 −∞
0
teh´at azt kaptuk, hogy a k¨ozrez´art sz¨og v´arhat´oan der´eksz¨og.
11
1.2 Val´osz´ın˝ us´egi v´altoz´o
1.2.1.
Norm´ alis eloszl´ as´ u val´ osz´ın˝ us´ egi v´ altoz´ o
A tov´abbiakban egy nagyon fontos folytonos eloszl´as´ u val´osz´ın˝ us´egi v´altoz´oval fogunk foglalkozni r´eszletesebben, m´egpedig a norm´alis eloszl´as´ u val´osz´ın˝ us´egi v´altoz´oval. 1.9. Defin´ıci´ o. A ξ val´osz´ın˝ us´egi v´altoz´o norm´alis eloszl´as´ u, ha s˝ ur˝ us´egf¨ uggv´enye f (x) = √
(x−µ)2 1 e− 2σ2 , 2πσ
(x ∈ R)
alakban adott. 1 ⇒ F (x) = √ 2πσ
Zx
e−
(t−µ)2 2σ 2
dt,
(x ∈ R)
−∞
alakban sz´am´ıthat´o az eloszl´asf¨ uggv´enye, viszont sajnos ezt z´art alakban nem lehet kifejezni. A k¨ovetkez˝o ´abr´an a µ = 2.5, σ = 1.5 param´eterekkel rendelkez˝o norm´alis eloszl´ashoz tartoz´o s˝ ur˝ us´egf¨ uggv´enyt szeml´eltetj¨ uk. 0.3
−2
−1
f (x)
1 2 3 4 5 µ µ+σ µ−σ
6
7
L´athat´o, hogy a norm´alis eloszl´as´ u v´altoz´ok s˝ ur˝ us´egf¨ uggv´enye egy harangg¨orbe lesz, amelynek maximuma van a µ pontban, valamint inflexi´os
12
1. Val´osz´ın˝ us´egsz´am´ıt´asi bevezet˝o
pontjai vannak a µ ± σ pontokban, tov´abb´a term´eszetesen ±∞-ben 0 a hat´ar´ert´eke. Kisz´am´ıthat´o, hogy ezen eloszl´as szerinti val´osz´ın˝ us´egi v´altoz´o v´arhat´o ´ert´eke pontosan a param´eterk´ent megadott µ, m´ıg sz´or´asa szint´en a param´eterk´ent adott σ lesz. 1.10. Defin´ıci´ o. Norm´alis eloszl´as eset´en a µ = 0, σ = 1 esetnek k¨ ul¨on neve van, az ilyen val´osz´ın˝ us´egi v´altoz´ot standard norm´ alis eloszl´ as´ u val´osz´ın˝ us´egi v´altoz´onak nevezz¨ uk. S˝ ur˝ us´egf¨ uggv´enye x2 1 f (x) = √ e− 2 2π
alakban adott. Standard norm´alis eloszl´as eset´en az eloszl´asf¨ uggv´enyt nem F -fel, hanem Φ-vel jel¨olik ´es 1 Φ(x) = √ 2π
Zx
t2
e− 2 dt
−∞
alakban sz´am´ıthat´oak az ´ert´ekei. 1.11. Megjegyz´ es. Ez a Φ f¨ uggv´eny a val´osz´ın˝ us´egsz´am´ıt´as ter¨ ulet´en nagyon komoly szerepet j´atszik, sok helyen ker¨ ul el˝o, ´es mivel el´eg bonyolult a k´eplete, ´altal´aban minden k¨onyvben megtal´alhat´oak t´abl´azatolva az ´ert´ekei, egy el´eg s˝ ur˝ u feloszt´ason v´eve. Viszont a s˝ ur˝ us´egf¨ uggv´eny szimmetrikus a 0-ra, ez´ert term´eszetesen csak x > 0 esetben szokt´ak t´abl´azatolni a f¨ uggv´eny´ert´ekeket, ugyanis a szimmetria tulajdons´ag felhaszn´al´as´aval kisz´am´ıthat´o Φ(−x) = 1 − Φ(x) alakban tetsz˝oleges helyen a helyettes´ıt´esi ´ert´eke. 1.12. Megjegyz´ es. Ha ξ (µ, σ) param´eter˝ u norm´alis eloszl´as´ u egy standard norm´ a lis eloszl´ a s´ u val´osz´ın˝ us´egi v´altoz´o, akkor ξ−µ σ val´osz´ın˝ us´egi v´altoz´ot fog megadni. Teh´at tetsz˝oleges norm´alis eloszl´as´ u v´altoz´ot vissza tudunk vezetni standard norm´alisra, ´es ´ıgy haszn´alhatjuk a t´abl´azatolt ´ert´ekeket. P´eldak´ent hat´arozzunk meg h´arom, speci´alis val´osz´ın˝ us´eg´ert´eket.
13
1.2 Val´osz´ın˝ us´egi v´altoz´o • P (|ξ − µ| > σ) ≈ 0.32, • P (|ξ − µ| > 2σ) ≈ 0.05, • P (|ξ − µ| > 3σ) ≈ 0.002.
Innen l´athat´o p´eld´aul, hogy k¨or¨ ulbel¨ ul 68% val´osz´ın˝ us´eggel a (µ−σ, µ+σ) intervallumba esik a v´altoz´o ´ert´eke. V´eg¨ ul szeml´eltet´esk´eppen rajzoljuk fel a standard norm´alis eloszl´ashoz tartoz´o s˝ ur˝ us´egf¨ uggv´eny grafikonj´at is, azaz amikor µ = 0, σ = 1. 0.4
f (x)
≈ 68%
−3
−2
−1
1
2
3
Eset¨ unkben a v´altoz´o 68%-os val´osz´ın˝ us´eggel a [−1, 1] intervallumba esik, tov´abb´a a [−2, 2] intervallumba m´ar 95% val´osz´ın˝ us´eggel esik bele, v´eg¨ ul szinte teljesen biztos, hogy a [−3, 3] intervallumba bele fog esni a v´altoz´onk felvett ´ert´eke, eg´eszen pontosan ez a val´osz´ın˝ us´eg 99.8%, de ez l´atszik az ´abr´ankon is, mert a s˝ ur˝ us´egf¨ uggv´eny −3-n´al ´es 3-n´al m´ar er˝osen k¨ozel´ıt a 0-hoz. A pontos ´ert´ekekhez lapozzunk a jegyzet 53. oldal´ara, ahol megtal´aljuk a Φ f¨ uggv´eny t´abl´azat´at.
2. fejezet Statisztikai m´ odszerek A r¨ovid val´osz´ın˝ us´egsz´am´ıt´asi bevezet˝o ut´an most szeretn´enk bemutatni az alapvet˝o statisztikai m´odszereket, defin´ıci´okat, term´eszetesen p´eld´akkal illusztr´alva. Els˝o l´ep´esben tiszt´azzuk, hogy mi is a statisztika feladata. Tegy¨ uk fel, hogy adott egy konkr´et val´osz´ın˝ us´egi v´altoz´o (konkr´et m´er´es), a statisztika sor´an ezt szeretn´enk jobban megismerni, jellemezni bizonyos k´ıv´ant szempontok alapj´an. A k¨ovetkez˝o k´erd´es az lehetne, hogy milyen m´odon, mi alapj´an szeretn´enk, tudjuk ezt megtenni. A v´alasz egyszer˝ u, nem ismerj¨ uk a val´osz´ın˝ us´egi v´altoz´o tulajdons´agait, csak v´eges sok adat (m´er´es) a´ll rendelkez´es¨ unkre, ´es ebb˝ol szeretn´enk min´el t¨obbet megtudni a val´osz´ın˝ us´egi v´altoz´or´ol. A rendelkez´esre ´all´o adatokat mint´ anak nevezik a statisztik´aban. Ezen minta elemeit a x1 , x2 , . . . , xn bet˝ ukkel jel¨olj¨ uk, n-et a minta m´ eret´ enek, vagy elemsz´am´anak nevezz¨ uk. 2.1. Defin´ıci´ o (Statisztikai k¨ ovetkeztet´ es). Statisztikai k¨ovetkeztet´esnek h´ıvjuk, amikor egy ismeretlen param´eter˝ u, de ismert eloszl´as´ u (pl. norm´alis) val´osz´ın˝ us´egi v´altoz´o param´eter´ere k¨ovetkeztet¨ unk egy adott minta alapj´an. A gyakorlatban ezt arra haszn´alhatjuk, hogy egy popul´aci´on, vagy popul´aci´okon vett m´er´esek, megfigyel´esek alapj´an tesz¨ unk k¨ovetkeztet´eseket a popul´aci´ora vonatkoz´oan. 14
15
2.1 Gyakoris´agi- ´es s˝ ur˝ us´eghisztogram
2.1.
Gyakoris´ agi- ´ es s˝ ur˝ us´ eghisztogram
Legyen adott x1 , x2 , . . . , xn minta, ahol a minta m´erete, n legyen nagy” ” (50-100). Rendezz¨ uk a mint´at, ´es jel¨olj¨ uk ennek az elemeit a = x∗1 , x∗2 , . . . , x∗n−1 , x∗n = b, teh´at a jel¨olje a legkisebb, m´ıg b a legnagyobb mintaelemet. Ezek ut´an osszuk fel az [a, b] intervallumot r egyenl˝o r´eszre az yk = a + b−a k (k = 0, 1, . . . , r) oszt´opontokkal. A gyakorlatban r r ´ert´eke ´altal´aban 5-14 k¨oz¨ott helyezkedik el. Jel¨olje ezek ut´an fk az [yk−1 , yk ) intervallumba es˝o mintaelemek sz´am´at. Ezek alapj´an m´ar defini´alhatjuk egy intervallum relat´ıv gyakoris´ ag´ at a fk qk = n h´anyadossal. 2.2. Defin´ıci´ o. Egy x1 , x2 , . . . , xn mint´ahoz tartoz´o grafikont gyakoris´agi hisztogramnak nevez¨ unk, ha az [yk−1 , yk ) intervallumokon rendre fk az yk −yk−1 ´ert´ekeket veszi fel (egy´ebk´ent pedig 0-t). Ellen˝orizhet˝o, hogy ilyenkor a grafikon ´altal bez´art ter¨ ulet pontosan a minta m´erete, azaz n lesz, ugyanis n n X X fk = fk = n. T = (yk − yk−1) yk − yk−1 k=1
k=1
2.3. Defin´ıci´ o. Egy x1 , x2 , . . . , xn mint´ahoz tartoz´o grafikont s˝ ur˝ us´eghisztogramnak nevez¨ unk, ha az [yk−1 , yk ) intervallumokon qk rendre a yk −y ´ e rt´ e keket veszi fel (egy´ebk´ent pedig 0-t). k−1 Ekkor a grafikon ´altal k¨ozrez´art ter¨ ulet pedig 1-gyel lesz egyenl˝o, ami az el˝oz˝oek alapj´an nagyon egyszer˝ uen l´athat´o. A s˝ us˝ us´egi hisztogram j´ol k¨ozel´ıti a s˝ ur˝ us´egf¨ uggv´enyt, ha n nagy”, ” ´ıgy ha kiv´alasztunk tetsz˝oleges α, β ´ert´ekeket (a ≤ α < β ≤ b), akkor a P (α ≤ ξ < β) val´osz´ın˝ us´egre j´o k¨ozel´ıt´est tudunk adni a s˝ ur˝ us´eghisztogram [α, β] intervallum feletti ter¨ ulet´evel. Teh´at ha egy h (szakaszonk´ent ´alland´o) f¨ uggv´enyk´ent tekint¨ unk a s˝ ur˝ us´egi hisztogramra, akkor Zβ P (α ≤ ξ < β) ≈ h(x) dx α
16
2. Statisztikai m´odszerek
o¨sszef¨ ugg´est tudjuk fel´ırni. 2.4. Megjegyz´ es. Mivel egy konkr´et α ´ert´ek feletti ter¨ ulet 0 (mivel az intervallum hossza ilyenkor 0), ez´ert mindig csak intervallumba es´es val´osz´ın˝ us´eg´er˝ol szok´as besz´elni. A k¨onnyebb meg´ert´es el˝oseg´ıt´es´ere n´ezz¨ uk a k¨ovetkez˝o mint´at a s˝ ur˝ us´eghisztogramra vonatkoz´oan.
q3 y3 − y2 ···
q3
qn−2
q2
qn−1
q1 y0 y1
qn y2
y3
· · · yn−3
yn−2 yn−1
yn
Az ´abr´an a t´eglapok belsej´eben szerepl˝o qk ´ert´ekek az adott t´eglalap ter¨ ulet´et mutatj´ak. Tudjuk, hogy ezen ter¨ uletek ¨osszege pedig 1-et ad ki.
2.2.
V´ arhat´ o´ ert´ ek ´ es sz´ or´ as becsl´ ese
Ebben a r´eszben adott egy µ v´arhat´o ´ert´ek˝ u, σ sz´or´as´ u ξ val´osz´ın˝ us´egi v´altoz´o, de mi nem ismerj¨ uk sem µ, sem σ ´ert´ek´et, ezekre szeretn´enk becsl´est kapni, szint´en egy statisztikai minta seg´ıts´eg´evel.
17
2.2 V´arhat´o ´ert´ek ´es sz´or´as becsl´ese 2.5. Defin´ıci´ o (Minta´ atlag). Az n
1X x= xi n i=1 sz´amot a minta ´atlag´anak nevezz¨ uk. Err˝ol a mennyis´egr˝ol elmondhatjuk, hogy j´ol k¨ozel´ıti a v´arhat´o ´ert´eket, teh´at x ≈ µ. 2.6. Defin´ıci´ o (Variancia). Az n
s2x
1 X = (xi − x)2 n − 1 i=1
sz´amot pedig a minta varianci´aj´anak nevezz¨ uk. Ekkor sx ≈ σ, azaz a minta varianci´aj´anak n´egyzetgy¨oke j´ol becsli a ξ val´osz´ın˝ us´egi v´altoz´o sz´or´as´at. Az sx mennyis´eget tapasztalati sz´or´asnak nevezz¨ uk. 2.7. Megjegyz´ es. N´eha k¨onnyebb sz´amolnunk, ha xi minta helyett egy yi mint´aval dolgozunk, amire teljes¨ ul, hogy yi = xi − A (∀i = 1, 2, . . . , n, tetsz˝oleges, alkalmas A ∈ R ´ert´ekkel). Vizsg´aljuk is meg a megjegyz´esben eml´ıtett esetet b˝ovebben. El˝osz¨or tekints¨ uk az yi minta ´atlag´at, n
n
n
1X 1X 1X yi = (xi − A) = xi − A = x − A, y= n i=1 n i=1 n i=1 teh´at ha minden elemet A-val eltolunk, akkor a minta ´atlaga is A-val tol´odik el. Ezek ut´an n´ezz¨ uk meg, mi t¨ort´enik a tapasztalati varianci´aval, n
s2y
n
1 X 1 X (yi − y)2 = (xi − A − (x − A))2 = = n − 1 i=1 n − 1 i=1 n
=
1 X (xi − x)2 = s2x , n − 1 i=1
teh´at azt kaptuk, hogy az eltol´as val´oban nem v´altoztat a tapasztalati sz´or´ason, teh´at ha k´enyelmesebb, akkor val´oban sz´amolhatunk az yi mint´aval.
18
2. Statisztikai m´odszerek
P´ elda Sz´am´ıtsuk ki az x1 = 55, x2 = 52, x3 = 56 minta a´tlag´at, ´es varianci´aj´at! 163 55 + 52 + 56 = , x= 3 3 ebb˝ol " 2 2 2 # 163 163 163 1 55 − + 52 − + 56 − s2x = 2 3 3 3 lenne, de ez el´eg bonyolult” kifejez´es, ink´abb haszn´aljuk fel az el˝oz˝o ” megjegyz´esben eml´ıtetteket. Legyen yi = xi − 52, ´ıgy a minta: y1 = 3, y2 = 0, y3 = 4, a minta´atlag pedig y = 73 . Ezek ut´an n´ezz¨ uk meg az yi minta varianci´aj´at, amir˝ol tudjuk, hogy megegyezik az xi minta varianci´aj´aval: " 2 2 2 # 1 7 7 7 s2x = s2y = 3− = + 0− + 4− 2 3 3 3 1 = 2
" 2 2 # 2 2 4 + 49 + 25 39 7 5 = = ≈ 4.3 + + 3 3 3 18 9
2.8. Megjegyz´ es. Tan´acsk´ent megeml´ıten´enk, hogy a minta´atlagot, ´es a minta varianci´aj´at is 1 tizedesjeggyel pontosabban sz´am´ıtsuk, mint ahogyan az adatok megad´asra ker¨ ultek, term´eszetesen kerek´ıt´essel. A tov´abbiakban ismerkedj¨ unk meg k´et hibafogalommal. 2.9. Defin´ıci´ o (Minta hib´ aja). Egy x1 , x2 , . . . , xn minta hib´aj´an az adatoknak az x ´atlagt´ol val´o elt´er´es´et nevezz¨ uk. Ezt az sx sz´or´as m´eri. Ezek alapj´an, mint eml´ıtett¨ uk, a hib´at az sx mennyis´eggel m´erhetj¨ uk. Egy N (µ, σ) eloszl´as´ u v´altoz´o eset´en a 2sx mennyis´eggel adhat´o egy 95% megb´ızhat´os´ag´ u becsl´es, ez az u ´ gynevezett hibakorl´at, valamint a 3sx mennyis´eggel adhat´o egy 99.8% megb´ızhat´os´ag´ u becsl´es, amit pedig biztos hibakorl´atnak szok´as nevezni.
2.2 V´arhat´o ´ert´ek ´es sz´or´as becsl´ese
19
2.10. Defin´ıci´ o (Az ´ atlag hib´ aja). Egy x1 , x2 , . . . , xn mint´ara vonatkoz´o x ´atlag sz´or´as´at standard hib´anak nevezz¨ uk, ´es ´ıgy jel¨olhetj¨ uk, sz´am´ıthatjuk ki: sx sx = √ , n ahol n a megszokott m´odon a minta elemsz´am´at jel¨oli. P´ elda Egerek testh˝om´ers´eklet´et m´ert´ek, ebb˝ol k´esz´ıtettek egy 15 elem˝ u mint´at, az al´abbi ´ert´ekekkel (x1 , x2 , . . . , x15 ): 36.8, 36.2, 37.1, 36.7, 36.9, 37.0, 36.9, 37.4, 36.9, 36.6, 36.7, 36.1, 36.8, 36.4, 37.0 ◦ C Hat´arozzuk meg a minta ´atlag´at, tapasztalati sz´or´as´at, sz´or´asn´egyzet´et, a standard hib´at, valamint adjuk meg a biztos hibakorl´atot is, majd ellen˝orizz¨ uk, hogy mit kaptunk. Megold´ as: A sz´am´ıt´asok sor´an a megfelel˝o sz´am´ u tizedesjegyig kerek´ıt¨ unk, viszont a k´enyelmess´eg, ´es ´atl´athat´os´ag miatt egyenl˝os´egjellel ´ırjuk le a megold´asokat. A minta ´atlaga 15 1 X xi = 36.77 x= 15 i=1 A minta sz´or´asn´egyzete
15
s2x
1 X = (xi − x)2 = 0.115 14 i=1
Ebb˝ol a minta sz´or´asa sx = A standard hiba
p
s2x = 0.34
sx sx = √ = 0.09 n
A biztos hibakorl´at pedig egyszer˝ uen ad´odik 3sx = 1.02
20
2. Statisztikai m´odszerek
form´aban. Ezek ut´an vegy¨ uk ´eszre, hogy mi´ert is nevezik biztos hibakorl´atnak ezt a mennyis´eget. Ehhez n´ezz¨ uk meg, hogy a 15 mintaelemb˝ol mennyi esik bele az [x − 3sx , x + 3sx ] intervallumba. Els˝o l´ep´esben hat´arozzuk meg ezt az intervallumot, ami nem m´as, mint [35.75, 37.79]. Innen m´ar l´atszik, hogy az ¨osszes mintaelem ebben az intervallumban helyezkedik el. 2.11. Defin´ıci´ o (Metodikai hiba). Ebben az esetben p´arhuzamos m´er´eseket v´egz¨ unk, rendre n1 , n2 , . . . , nk elem˝ u mint´akat k´esz´ıtve: (1)
(1)
(2)
(2)
x1 , x2 , . . . , x(1) n1 x1 , x2 , . . . , x(2) n2 .. . (k)
(k)
x1 , x2 , . . . , x(k) nk Ezen adatokb´ol kisz´am´ıtjuk a Qx(1) , Qx(2) , . . . , Qx(k) ´ert´ekeket a k¨ovetkez˝o m´odon: nj 2 X (i) (i) Qx(i) = xj − x j=1
Ebb˝ol kapjuk az u ´gynevezett metodikai hib´at v u k u P u Q (j) u j=1 x sm = u uP t k (nj − 1) j=1
alakban. A metodikai hiba tulajdonk´eppen a m´odszernek, elj´ar´asnak a hib´aj´at adja meg.
21
2.3 Regresszi´o, korrel´aci´o
2.12. Defin´ıci´ o (Relat´ıv sz´ or´ as). Egy minta ´atlag´anak (x), valamint sz´or´as´anak (sx ) felhaszn´al´as´aval defini´alhat´o az u ´gynevezett relat´ıv sz´or´as V =
sx · 100 % x
m´odon. A relat´ıv sz´or´as, mint m´er˝osz´am akkor lehet seg´ıts´eg¨ unkre, amikor m´er´eseket szeretn´enk ¨osszehasonl´ıtani.
2.3.
Regresszi´ o, korrel´ aci´ o
Az ´atlagra, ´es sz´or´asra vonatkoz´o k¨ ul¨onb¨oz˝o defin´ıci´ok, becsl´esek, p´eld´ak ut´an t´erj¨ unk ´at a k¨ovetkez˝o t´emak¨orre, ami nem m´as, mint a regresszi´o, korrel´aci´o. Ezek k¨oz¨ ul is el˝osz¨or ismerkedj¨ unk meg a regresszi´o fogalm´aval. A regresszi´o feladat´aban azzal foglalkozunk, hogy k´et adott val´osz´ın˝ us´egi v´altoz´o k¨oz¨ott van-e valamif´ele kapcsolat, egy bizonyos f¨ uggv´enyen kereszt¨ ul. Pl. ξ = f (η), ahol f egy tetsz˝oleges f¨ uggv´eny. Mi csak a line´aris regresszi´oval fogunk r´eszletesebben foglalkozni. 2.13. Defin´ıci´ o (Regresszi´ os egyenes). Legyen adott k´et minta ξ : x1 , x2 , . . . , xn η : y1 , y2 , . . . , yn Ekkor az (xi , yi ) (i = 1, 2, . . . , n) pontokra a legkisebb n´egyzetek m´odszer´evel illesztett egyenest regresszi´os egyenesnek nevezz¨ uk. A defin´ıci´oban eml´ıtett egyenes egyenlete y = ax + b alakban adott, ´es tudjuk, hogy a megold´as nem lesz m´as, mint
a=
n P
i=1 n P
i=1
xi yi − y x2i
−x
n P
i=1 n P
i=1
xi , xi
22
2. Statisztikai m´odszerek b = y − ax
Tekints¨ uk a k¨ovetkez˝o jel¨ol´eseket: Qxy =
n X i=1
xi yi − y Qx =
n X
xi =
i=1
n X
n X i=1
x2i
−x
i=1
(xi − x) (yi − y)
n X
xi ,
(2.1)
(2.2)
i=1
amely jel¨ol´esek majd fontos szerepet fognak j´atszani a kovariancia, ´es korrel´aci´o defini´al´asa sor´an. 2.14. Megjegyz´ es. A metodikai hib´an´al defini´alt Qx m´er˝osz´am megegyezik az itt eml´ıtettekkel, csak kiss´e m´as form´aban ´ırtuk fel. Ezekkel a jel¨ol´eseket felhaszn´alva a=
Qxy , b = y − ax Qx
alakban kapjuk a megold´ast. 2.15. Megjegyz´ es. A legkisebb n´egyzetek m´odszere b´armilyen elrendez˝od´es˝ u pontokra fel´ırja a felt´eteleknek megfelel˝ o egyenest, teh´at az elj´ar´as sikeress´ege semmit nem jelent a k´et v´altoz´o k¨oz¨otti line´aris kapcsolat tekintet´eben. Ezek ut´an r´a is t´er¨ unk a m´ar eml´ıtett kovariancia defin´ıci´oj´ara. 2.16. Defin´ıci´ o (Kovariancia, korrel´ aci´ o). Adott k´et minta x1 , x2 , . . . , xn ´es y1 , y2, . . . , yn . A k´et mint´ara vonatkoz´o kovarianci´an (egy¨ uttes ingadoz´ason) az sxy =
Qxy n−1
mennyis´eget ´ertj¨ uk. A k´et minta korrel´aci´os egy¨ utthat´oja pedig r= alakban ad´odik.
Qxy sxy =p sx sy Qx Qy
23
2.3 Regresszi´o, korrel´aci´o 2.17. Megjegyz´ es. Megmutathat´o, hogy |r| ≤ 1.
2.18. Megjegyz´ es. Vegy¨ uk ´eszre, hogy a line´aris regresszi´o sor´an kapott a, valamint az sxy ´es az r mennyis´egek sz´aml´al´oja rendre Qxy , nevez˝oik pedig pozit´ıvak, ´ıgy az el˝ojel¨ uk szint´en megegyezik, ´es csakis Qxy el˝ojel´et˝ol f¨ ugg. 2.19. Megjegyz´ es. Ha r = 0, akkor azt mondjuk, hogy a k´et minta korrel´alatlan. Tov´abb´a r > 0 eset´en pozit´ıv korrel´aci´or´ol, m´ıg r < 0 eset´en negat´ıv korrel´aci´or´ol besz´elhet¨ unk. Ha |r| ≈ 1, akkor igen er˝os a korrel´aci´o (¨osszef¨ ugg´es) a k´et minta k¨oz¨ott. 2.20. Megjegyz´ es. Ha k´et norm´alis val´osz´ın˝ us´egi v´altoz´o korrel´alatlan, azaz r = 0, akkor f¨ uggetlenek is. P´ elda Adott a k¨ovetkez˝o k´et minta: xi : −5, −3, −1, 1, 3 yi : 8, 10, 9, 12, 11 Hat´arozzuk meg a regresszi´os egyenest, ´es a korrel´aci´os egy¨ utthat´ot! Ezek meghat´aroz´as´ahoz sz¨ uks´eg¨ unk lesz Qxy , Qx , Qy ´ert´ekeire. Qxy =
5 X i=1
Qx =
5 X
xi yi − y x2i
i=1
Qy =
5 X i=1
Tov´abb´a
−x
yi2
i=1
5 X
−y
a=
5 X
i=1
xi = −30 − 10 (−5) = 16
xi = 45 − (−1) (−5) = 40
5 X i=1
yi = 510 − 10 · 50 = 10
16 Qxy = = 0.4 Qx 40
b = y − ax = 10 − 0.4 (−1) = 10.4
24
2. Statisztikai m´odszerek Ezek alapj´an megadhat´o a regresszi´os egyenes¨ unk egyenlete y = 0.4x + 10.4
alakban. A korrel´aci´os egy¨ utthat´o pedig Qxy 16 4 r=p =√ = = 0.8 5 Qx Qy 40 · 10
m´odon ad´odik. Ezek ut´an t´erj¨ unk r´a megint egy u ´ j t´emak¨orre, ami ink´abb a val´osz´ın˝ us´egsz´am´ıt´asi bevezet˝oh¨oz tartozik, ugyanakkor legt¨obbsz¨or csak a statisztik´ak k´esz´ıt´es´en´el haszn´alj´ak, ez´ert mi is itt eml´ıtj¨ uk meg.
2.4.
Nevezetes eloszl´ asok a statisztik´ aban
H´arom k¨ ul¨onb¨oz˝o, a statisztik´aban sokat haszn´alt eloszl´ast fogunk megeml´ıteni, ezek a t-eloszl´as, az F -eloszl´as, valamint a χ2 -eloszl´as (kh´ın´egyzet). Tov´abb´a bemutatjuk az ezen eloszl´asokhoz tartoz´o t´abl´azatok haszn´alat´at is.
2.4.1.
t-eloszl´ as
Legyen adott egy (µ, σ)-norm´alis eloszl´as´ u val´osz´ın˝ us´egi v´altoz´o a´ltal meghat´arozott x1 , x2 , . . . , xn minta. Ezek alapj´an kisz´am´ıtjuk az x ´es az sx ´ert´ekeket. Ekkor az x−µ sx n − 1 szabads´agfok´ u, t-eloszl´as´ u lesz. A t-eloszl´as eloszl´asf¨ uggv´enye nem ´all´ıthat´o el˝o explicit form´aban, de hasonl´oan a standard norm´alis eloszl´as eset´ehez, a k´ıv´ant ´ert´ekeket egy t´abl´azatb´ol kikereshetj¨ uk magunknak. A t-eloszl´ashoz tartoz´o t´abl´azat megtal´alhat´o az 54. oldalon. A haszn´alat´ahoz n´ezz¨ unk egy r¨ovid ismertet´est, le´ır´ast, majd egy p´eld´at. A t´abl´azat els˝o oszlopb´ol olvashat´o le a k´ıv´ant szabads´agi fok, ez alapj´an ki tudjuk v´alasztani a keresett ´ert´ek¨ unk sor´at, majd az els˝o
25
2.4 Nevezetes eloszl´asok a statisztik´aban
sorban szerepl˝o val´osz´ın˝ us´egek alapj´an meghat´arozhatjuk a keresett ´ert´eknek az oszlop´at is, ilyen m´odon pedig m´ar rendelkez´es¨ unkre is fog ´allni a k´ıv´ant ´ert´ek. P´ elda Legyen n = 3, a k´ıv´ant val´osz´ın˝ us´eg 0.05, ekkor n−1 = 2 sort, ´es a 0.05 ´ert´ekhez tartoz´o oszlopot kell n´ezn¨ unk, ´ıgy a keresett ´ert´ek¨ unk a 4.303 lesz. Ennek jelent´ese nem m´as, mint P (|t| > 4.303) = 0.05, azaz ez a bizonyos t-eloszl´as´ u v´altoz´o 0.05 val´osz´ın˝ us´eggel esik a [−4.303, 4.303] intervallumon k´ıv¨ ulre. N´ezz¨ unk egy ´abr´at a t-eloszl´ashoz tartoz´o s˝ ur˝ us´egf¨ uggv´enyr˝ol. Az ´abra az 5 szabads´agfok´ u t-eloszl´ast szeml´elteti. 0.4
−4
−3 −tp −2
−1
1
2 tp
3
4
Tudjuk, hogy egy s˝ ur˝ us´egf¨ uggv´eny integr´alja a sz´amegyenes felett mindig 1-et kell adjon. Az itt jel¨olt tp k¨ usz¨obsz´am azt adja meg, hogy a 0 k¨or¨ ul mekkora k¨ornyezetben kell venn¨ unk az integr´alt, hogy 1 − p ´ert´eket kapjunk, azaz hogy a v´altoz´o pontosan 1 − p val´osz´ın˝ us´eggel essen a [−tp , tp ] intervallumba. Ebb˝ol viszont k¨ovetkezik, hogy annak a val´osz´ın˝ us´ege, hogy ezen k´ıv¨ ul esik, pontosan p lesz, ez pedig nem m´ast fejez ki, mint amit az el˝oz˝o p´eld´ankn´al fel´ırtunk. Megjegyezn´enk, hogy mi minden esetben ezt a verzi´oj´at fogjuk haszn´alni a t-t´abl´azatnak, amit k´etoldali vizsg´alatnak szok´as nevezni, ugyanis, mint az ´abr´an is l´athat´o, mindk´et oldalon egyenl˝o r´eszeket
26
2. Statisztikai m´odszerek
vesz¨ unk a sz´amegyenesb˝ol. Ugyanakkor l´etezik egyoldali vizsg´alat is a t-eloszl´asra, ennek jelent´ese, hogy a val´osz´ın˝ us´egen bel¨ ul nem az abszol´ ut ´ert´eket, hanem a konkr´et ´ert´eket vizsg´aljuk, ´es arra szeretn´enk bal-, vagy jobboldali becsl´est kapni. Tov´abb´a megjegyezn´enk, hogy a k´etoldali k¨ usz¨ob´ert´ekekb˝ol egyszer˝ uen kisz´am´ıthat´oak az egyoldali vizsg´alathoz sz¨ uks´eges k¨ usz¨ob´ert´ekek, eg´eszen pontosan a p val´osz´ın˝ us´eg˝ u egyoldali vizsg´alathoz tartoz´o tp ´ert´ek megegyezik a k´etoldali megegyez˝o szabads´agfokkal rendelkez˝o t2p ´ert´ekkel.
2.4.2.
F -eloszl´ as
Legyenek adottak egy (µ, σ)-norm´alis eloszl´as´ u val´osz´ın˝ us´egi v´altoz´o a´ltal meghat´arozott x1 , x2 , . . . , xn ´es y1 , y2, . . . , ym mint´ak. Ekkor az s2x s2y F -eloszl´as´ u lesz n − 1, m − 1 szabads´agfokokkal. A tov´abbiakban v´alasszuk u ´ gy a t¨ortet, hogy s2x >1 s2y teljes¨ ulj¨on, azaz ha nem teljes¨ ul, akkor cser´elj¨ uk meg a k´et mint´at. Az F -eloszl´ashoz tartoz´o ´ert´ekeket szint´en egy t´abl´azatban tal´alhatjuk meg, m´egpedig az 55. oldalt´ol kezd˝od˝oen. A haszn´alathoz itt is adunk egy kis le´ır´ast, majd egy konkr´et p´eld´aval m´eg vil´agosabb´a tessz¨ uk az alkalmaz´ast. El˝osz¨or is, ´allap´ıtsuk meg a nevez˝o szabads´agfok´at, ami jel¨ol´eseink szerint m−1. Keress¨ uk meg azt az oldalt, ahol ezen szabads´agfok szerepel a t´abl´azat els˝o oszlop´aban. Ez kijel¨ol nek¨ unk k´et t´abl´azatban 5-5 sort. Ezek ut´an n´ezz¨ uk meg a sz´aml´al´o szabads´agfok´at is, ami jel¨ol´eseinkkel n − 1 lesz. Ezt az ´ert´eket keress¨ uk ki a megfelel˝o t´abl´azat els˝o sor´ab´ol, ´ıgy m´ar csak 5 lehet˝os´eg maradt meg. Ezek ut´an vegy¨ uk figyelembe a k´ıv´ant val´osz´ın˝ us´eget, amit a t´abl´azat 2. oszlop´aban tal´alunk, ´es m´aris megkaptuk a keresett ´ert´ek¨ unket.
27
2.4 Nevezetes eloszl´asok a statisztik´aban
P´ elda Legyen n = 21, m = 13, a k´ıv´ant megb´ızhat´os´ag pedig 0.01, ekkor a nevez˝o szabads´agfoka m − 1 = 12 lesz, azaz a sz´obaj¨ohet˝o 8 oldalnyi t´abl´azatb´ol sz´amunkra m´ar csak az 57. ´es 58. oldalon tal´alhat´o k´et t´abl´azat lesz fontos, azoknak is a 12-es szabads´agfokhoz tartoz´o 5-5 sora. Ezek ut´an n´ezz¨ uk a sz´aml´al´o szabads´agfok´at, ez n − 1 = 20 lesz, amivel m´ar csak az 58. oldalon szerepl˝o t´abl´azatr´eszt kell n´ezn¨ unk. V´eg¨ ul felhaszn´aljuk a k´ıv´ant val´osz´ın˝ us´eget is, ami eset¨ unkben 0.01, azaz 1% volt, ´ıgy a keresett ´ert´ek¨ unk a 3.86 lett. Ennek jelent´ese pedig a k¨ovetkez˝o: 2 sx > 3.86 = 0.01, (2.3) P s2y azaz ez a bizonyos F -eloszl´as´ u val´osz´ın˝ us´egi v´altoz´o 1% val´osz´ın˝ us´eggel vesz fel 3.86-n´al nagyobb ´ert´eket. Az ´altal´anos esethez m´eg egy ´abr´at is besz´ urn´ank, hogy az a tp k¨ usz¨obindex val´oj´aban mit jelent. 0.6 0.5 0.4 0.3 0.2 0.1 −0.1
1
2
tp
3
4
Az ´abr´an az 5, 2 szabads´agi fokokhoz tartoz´o F -eloszl´as s˝ ur˝ us´egf¨ uggv´enye l´athat´o, amir˝ol tudjuk, hogy integr´alja a sz´amegyenesen 1-et ad. A tp k¨ usz¨ob´ert´ek azt adja meg, hogy honnant´ol kezdve kell integr´alnunk, hogy pontosan p legyen a fennmarad´o [tp , +∞) intervallum felett vett integr´al. Azt pedig tudjuk, hogy a s˝ ur˝ us´egf¨ uggv´eny integr´alja egy intervallum felett pontosan azt adja meg, hogy a v´altoz´o milyen val´osz´ın˝ us´eggel esik az intervallumba, eset¨ unkben
28
2. Statisztikai m´odszerek
a [tp , +∞) intervallumba, ami pedig nem m´ast jelent, mint a 2.3 pontban le´ırt val´osz´ın˝ us´eg.
2.4.3.
χ2 -eloszl´ as
Adott egy (µ, σ) param´eter˝ u norm´alis eloszl´as´ u v´altoz´ob´ol sz´armaz´o x1 , x2 , . . . , xn minta. Ekkor 2 n X xi − x σ i=1 n − 1 szabads´agfok´ u χ2 -eloszl´as´ u lesz.
A χ2 -eloszl´as t´abl´azata a 63. oldalon tal´alhat´o. Mivel haszn´alata megegyezik a t-t´abl´azat´eval, itt csak egy r¨ovid p´eld´at eml´ıt¨ unk meg. P´ elda Legyen ism´et n = 3, a k´ıv´ant val´osz´ın˝ us´eg pedig 0.05. Ebben az esetben szint´en az n − 1 = 2 ´ert´ekhez tartoz´o sort, ´es a 0.05 ´ert´ekhez tartoz´o oszlopot kell n´ezn¨ unk, ´ıgy a keresett ´ert´ek¨ unk a 5.991 lesz. L´atjuk, hogy a haszn´alat sor´an ugyanazt kellett tenn¨ unk val´oban, mint a t-eloszl´as eset´eben, viszont jelent´esben van elt´er´es a kett˝o k¨oz¨ott. M´egpedig a p´eld´aban eml´ıtettek jelent´ese a k¨ovetkez˝o:
P
! 2 n X xi − x > 5.991 = 0.05, σ i=1
azaz ez a bizonyos χ2 -eloszl´as´ u, nemnegat´ıv val´osz´ın˝ us´egi v´altoz´o 0.05 val´osz´ın˝ us´eggel vesz fel 5.991-n´el nagyobb ´ert´eket. N´ezz¨ uk meg a χ2 -eloszl´asnak is a s˝ ur˝ us´egf¨ uggv´eny´et, m´egpedig amikor a szabads´agfok ´ert´eke 3.
29
2.5 Becsl´esek 0.3 0.2 0.1
1
2
3
4
5
tp 6
7
8
L´enyeg´eben itt is ugyanazt l´atjuk a grafikonon, mint amit az F eloszl´asn´al l´athattunk, a s˝ ur˝ us´egf¨ uggv´eny term´eszetesen nem egyezik meg az ottanival, de a szeml´eletes jelent´es megegyezik. Amit ´eszrevehet¨ unk az ´abr´an, hogy ez a s˝ ur˝ us´egf¨ uggv´eny el´eg kis ´ert´ekeket vesz fel a 0 k¨ozel´eben is, ´es ´ıgy a k¨ usz¨ob´ert´ekekre picit nagyobb ´ert´ekeket kaphatunk, mint amit az F -eloszl´asn´al l´athattunk. Ezek ut´an t´erj¨ unk r´a a konkr´et statisztikai m´odszerek t´argyal´as´ara.
2.5. 2.5.1.
Becsl´ esek Pontbecsl´ esek
A pontbecsl´esek sor´an a val´osz´ın˝ us´egi v´altoz´o egy param´eter´enek becsl´es´et szeretn´enk megkapni egy bizonyos ´ert´ekkel. Az ilyen t´ıpus´ u becsl´esekr˝ol az el˝oz˝oekben m´ar volt sz´o, csak az ism´etl´es kedv´e´ert r¨oviden megeml´ıtj¨ uk. x ∼ µ, azaz a minta´atlaggal becs¨ ult¨ uk a v´arhat´o ´ert´eket, s2x ∼ σ 2 , azaz a tapasztalati sz´or´asn´egyzettel becs¨ ult¨ uk az elm´eleti sz´or´asn´egyzetet, valamint ha ezt ´ıgy konkr´etan nem is mondtuk
30
2. Statisztikai m´odszerek
ki, a tapasztalati korrel´aci´os egy¨ utthat´oval becs¨ ulhetj¨ uk az elm´eleti korrel´aci´os egy¨ utthat´ot (r ∼ ρ). Mivel ezeket a m´odszereket ott r´eszletesebben t´argyaltuk, l´epj¨ unk is tov´abb.
2.5.2.
Intervallum becsl´ esek
Az intervallum becsl´esek sor´an a param´eterre egy u ´ gynevezett megb´ızhat´os´agi intervallumot adunk meg, ami azt jelenti, hogy megadunk egy intervallumot, amibe adott val´osz´ın˝ us´eggel esik a keresett ismeretlen param´eter. V´ arhat´ o´ ert´ ek intervallum becsl´ ese. Adott egy (µ, σ) param´eter˝ u norm´alis eloszl´asb´ol sz´armaz´o x1 , x2 , . . . , xn minta, ekkor mint tudjuk x−µ sx n-1 szabads´agfok´ u t-eloszl´as´ u lesz. Ekkor a t-eloszl´as t´abl´azat´at felhaszn´alva n − 1 ´es 1 − p ismeret´eben keress¨ uk ki a megfelel˝o ´ert´eket, legyen ez tp . L´attuk, hogy ennek a jelent´ese nem m´as, mint x − µ > tp = 1 − p, P sx
ezzel ekvivalens ´all´ıt´ask´ent m´ar megkapjuk a k´ıv´ant form´at, m´egpedig a k¨ovetkez˝oek szerint. N´ezz¨ uk meg, hogy az abszol´ ut´ert´ekes kifejez´es 1 − p val´osz´ın˝ us´eggel nagyobb, mint tp , ´am ekkor teljes¨ ul az is, hogy p ´ val´osz´ın˝ us´eggel kisebb, mint tp . Irjuk is fel ezt. x − µ P < tp = p, sx itt ha kibontjuk az abszol´ ut ´ert´eket, akkor x−µ < tp = p P −tp < sx
2.5 Becsl´esek
31
alakot kapjuk, amiben minden ismert, csak a keresett µ nem. ´atrendezz¨ uk P (−x − tp sx < −µ < −x + tp sx ) = p,
Ha
majd a val´osz´ın˝ us´eghez tartoz´o z´ar´ojeleken bel¨ ul tov´abb alak´ıt´assal P (x − tp sx < µ < x + tp sx ) = p, amivel pontosan egy p megb´ızhat´os´ag´ u intervallumbecsl´es´et kaptuk a v´arhat´o ´ert´eknek. P´ elda Adottak a k¨ovetkez˝ok: x = 3, sx = 6, n = 9, hat´arozzuk meg a 95%-os megb´ızhat´os´agi intervallumot a v´arhat´o ´ert´ekre vonatkoz´oan. A megold´ashoz sz¨ uks´eg¨ unk lesz a t´abl´azatb´ol tp ´ert´ek´ere, valamint m´eg sz¨ uks´eges sx ismerete is, viszont ezt kisz´am´ıthatjuk a tanult m´odon 6 sx sx = √ = = 2, n 3 m´ıg a t´abl´azatb´ol kikeresett tp = 2.306 kapjuk. Innen az el˝oz˝oek szerint 3 − 2 · 2.306 < µ < 3 + 2 · 2.306, teh´at a v´arhat´o ´ert´ek 95% val´osz´ın˝ us´eggel a [−1.612, 7.612] intervallumba esik. P´ elda N´ezz¨ unk egy, a gyakorlathoz k¨ozelebb ´all´o p´eld´at is. Tablett´ak hat´oanyagtartalm´anak a vizsg´alat´at v´egezz¨ uk el, ´es a k¨ovetkez˝o 9 ´ert´eket kapjuk mg-ban m´erve 25.6, 25.3, 24.1, 25.3, 25, 24.7, 25.3, 24.4, 25.6 Adjunk 90%, majd 99%-os megb´ızhat´os´agi intervallumot a v´arhat´o ´ert´ekre. A megold´ashoz el˝osz¨or sz¨ uks´eg¨ unk lesz x ´es sx ´ert´ek´ere. Ezek a k¨ovetkez˝ok lesznek: x = 25.033
32
2. Statisztikai m´odszerek
0.529 = 0.176 3 Tov´abb´a tudjuk, hogy 9 elem˝ u a minta, teh´at a szabads´agi fokunk 8 lesz. El˝osz¨or n´ezz¨ uk a 90%-os megb´ızhat´os´agi intervallumot, azaz amikor p ´ert´eke 0.9 lesz. tp meghat´aroz´as´ahoz a t´abl´azatban a 8-as ´ert´ekhez tartoz´o sorban kell keresni, ´es 1 − p = 0.1-hez tartoz´o oszlopban. Itt azt tal´aljuk, hogy tp = 1.86, ´ıgy a 90%-os megb´ızhat´os´agi intervallumra sx = 0.529 ⇒ sx =
25.033 − 1.86 · 0.176 < µ < 25.033 + 1.86 · 0.176 ad´odik, azaz µ 90%-os val´osz´ın˝ us´eggel a [24.71, 25.36] intervallumba esik. N´ezz¨ uk meg, mi a helyzet a 99%-os megb´ızhat´os´agi intervallummal. Itt m´ar nem r´eszletezz¨ uk a sz´am´ıt´asokat, ebben az esetben tp = 3.355, ´ıgy a megb´ızhat´os´agi intervallum pedig a [24.44, 25.62] intervallum lesz. L´athatjuk, hogy ugyan sz´elesebb intervallumot kaptunk ebben az esetben, viszont ez az intervallum megb´ızhat´obb becsl´est ad a v´arhat´o ´ert´ekre vonatkoz´oan.
2.6.
Statisztikai hipot´ ezisvizsg´ alat
Ebben az alfejezetben, mint a c´ım is mutatja, a hipot´ezisvizsg´alattal fogunk foglalkozni. A vizsg´alat l´enyege, hogy megfogalmazunk egy a´ll´ıt´ast egy val´osz´ın˝ us´egi v´altoz´oval kapcsolatban, ezt fogjuk hipot´ezisnek nevezni, majd egy statisztikai pr´ob´aval ellen˝orizz¨ uk az ´all´ıt´asunkat, ´es az eredm´enyek alapj´an vagy elfogadjuk, vagy elvetj¨ uk a hipot´ezist. N´ezz¨ uk meg, hogy mik a leggyakoribb hipot´ezisek: • L´etrej¨on-e valamilyen megv´ altoz´ as (pl. gy´ogyszer hat´as´ara) • Van-e k¨ ul¨ onbs´ eg (pl. f´erfi ´es n˝o k¨oz¨ott) • Van-e kapcsolat (pl. kor ´es v´ernyom´as k¨oz¨ott) A megfogalmazott hipot´ezis¨ unket, ´all´ıt´asunkat nullhipot´ezisnek nevezz¨ uk, ´es H0 -lal jel¨olj¨ uk. P´ eld´ ak H0 : M(ξ) = a
2.6 Statisztikai hipot´ezisvizsg´alat
33
H0 : M(ξ) = M(η) H0 : D(ξ) = D(η) A hipot´ ezisvizsg´ alat l´ ep´ esei. El˝osz¨or is feltessz¨ uk, hogy adott egy x1 , x2 , . . . , xn mint´ank az adott hipot´ezishez. Ebb˝ol a mint´ab´ol k´esz´ıt¨ unk egy statisztikai v´altoz´ot (legyen ez st), aminek ismert az eloszl´asa (felt´eve, hogy H0 igaz). Ezek ut´an megadunk egy val´osz´ın˝ us´eget, ez lesz az u ´ gynevezett szignifikancia szint, amilyen bizonyoss´aggal szeretn´enk elv´egezni a hipot´ezisvizsg´alatot, ez legt¨obbsz¨or 5%, de lehet 1%-os is, s˝ot ha nagyon megb´ızhat´o vizsg´alatra lenne sz¨ uks´eg, akkor ak´ar 0.1%-ot is vehet¨ unk. Ezek ut´an ism´et a megfelel˝o t´abl´azatra lesz sz¨ uks´eg¨ unk, ahonnan is kikeress¨ uk a megfelel˝o tp ´ert´eket, majd a k¨ovetkez˝ot tessz¨ uk: • |st| ≤ tp eset´en elfogadjuk a nullhipot´ezist, • |st| > tp eset´en pedig elvetj¨ uk. Ennek kapcs´an egy u ´ j fogalom ker¨ ulhet bevezet´esre, m´egpedig a hiba fogalma. A hipot´ezisvizsg´alat sor´an k´et k¨ ul¨onb¨oz˝o t´ıpus´ u, u ´ gynevezett statisztikai hib´ar´ol besz´elhet¨ unk, az els˝ofaj´ u, illetve a m´asodfaj´ u hib´ar´ol. 2.21. Defin´ıci´ o (Els˝ ofaj´ u statisztikai hiba). Els˝ofaj´ u hib´ar´ol akkor besz´el¨ unk, ha a nullhipot´ezis¨ unk ugyan igaz, viszont mi a sz´am´ıt´asok alapj´an m´egis elvetj¨ uk. Az els˝ofaj´ u hiba val´osz´ın˝ us´ege pontosan megegyezik a szignifikancia szinttel. 2.22. Defin´ıci´ o (M´ asodfaj´ u statisztikai hiba). M´asodfaj´ u hib´ar´ol pedig akkor besz´el¨ unk, ha a nullhipot´ezis¨ unk nem ´all fenn, viszont a sz´am´ıt´asok alapj´an m´egis elfogadjuk. Az alapok megeml´ıt´ese ut´an t´erj¨ unk r´a a konkr´et hipot´ezisvizsg´alati elj´ar´asokra, a statisztikai pr´ob´akra.
34
2. Statisztikai m´odszerek
2.7. 2.7.1.
Pr´ ob´ ak Korrel´ aci´ os t-pr´ oba
A korrel´aci´os t-pr´oba alkalmaz´asa sor´an arra a k´erd´esre keress¨ uk a v´alaszt, hogy vajon k´et norm´alis eloszl´as´ u v´altoz´o f¨ uggetlen-e egym´ast´ol. Ennek eld¨ont´es´ere term´eszetesen rendelkez´es¨ unkre ´all a k´et v´altoz´ob´ol sz´armaz´o x1 , x2 , . . . , xn ´es y1 , y2 , . . . , yn minta. A nullhipot´ezis¨ unk, hogy a k´et v´altoz´o f¨ uggetlen, azaz H0 : ρ = 0 A pr´ob´ahoz term´eszetesen sz¨ uks´eg lesz egy szignifikancia szintre, els˝o l´ep´esben megv´alasztjuk ezt. Majd kisz´am´ıtjuk az r tapasztalati korrel´aci´os egy¨ utthat´ot, ´es ebb˝ol elk´esz´ıtj¨ uk a t=
√
n−2√
r 1 − r2
statisztik´at, amely n-2 szabads´agfok´ u, t-eloszl´as´ u lesz, amennyiben H0 igaz. Majd a m´ar megszokott m´odon a t-eloszl´ashoz tartoz´o t´abl´azatb´ol kikeress¨ uk a megfelel˝o tp ´ert´eket, ´es megvizsg´aljuk, hogy vajon |t| < tp felt´etel teljes¨ ul-e. Amennyiben igen, akkor elfogadjuk a nullhipot´ezist, ellenkez˝o esetben pedig elvetj¨ uk, az adott szignifikancia szint mellett. Ebben az esetben szok´as azt is mondani, hogy szignifik´ans (azaz H0 nem igaz), illetve nem szignifik´ans (H0 igaz) a kapcsolat. P´ elda Adott a k¨ovetkez˝o k´et minta: x : 0.1, 0.2, 0.3, 0.4, 0.5, 0.8, 1 y : 40, −3, 0, 18, −4, −22, −25 Vizsg´aljuk meg a k´et v´altoz´o kapcsolat´at. El˝osz¨or sz´am´ıtsuk ki a korrel´aci´os egy¨ utthat´ot, majd v´egezz¨ uk el a korrel´aci´os t-pr´ob´at is! Els˝o l´ep´esben sz´am´ıtsuk is ki a tapasztalati korrel´aci´os egy¨ utthat´ot Qxy r=p Qx Qy
35
2.7 Pr´ob´ak
alapj´an. Ehhez hat´arozzuk meg Qx , Qy , Qxy ´ert´ekeit a 22. oldalon tal´alhat´o 2.1 ´es 2.2 k´epletek alapj´an. A k¨onnyebb ´atl´athat´os´ag kedv´e´ert foglaljuk t´abl´azatba a sz¨ uks´eges adatokat.
Tov´abb´a x =
3.3 , 7
P
xi 0.1 0.2 0.3 0.4 0.5 0.8 1 3.3
yi 40 −3 0 18 −4 −22 −25 4
xi yi 4 −0.6 0 7.2 −2 −17.6 −25 −34
x2i
2.19
y = 47 , ´ıgy Qx = 2.19 −
3.32 = 0.6343 7
Qy = 3058 − 4 Qxy = −34 − 3.3
4 = 3055.7 7 4 = −35.8857 7
Innen m´ar megkaphatjuk a keresett korrel´aci´os egy¨ utthat´o ´ert´ek´et r=√
−35.8857 = −0.815 0.6343 · 3055.7
m´odon. Ebb˝ol azt l´athatjuk, hogy |r| ∼ 1, teh´at er˝osnek l´atszik a korrel´aci´o a k´et v´altoz´o k¨oz¨ott. N´ezz¨ uk meg, hogy a korrel´aci´os t-pr´oba milyen eredm´enyt szolg´altat nek¨ unk. √ −0.815 = −3.146 t= 5· √ 1 − 0.664
36
2. Statisztikai m´odszerek
Most lapozzunk a t-eloszl´ashoz tartoz´o t´abl´azatunkhoz, az 54. oldalra, ´es keress¨ uk ki az 5%-os szignifikancia szinthez tartoz´o 5 szabads´agi fokkal rendelkez˝o k¨ usz¨ob´ert´eket. Azt tal´aljuk, hogy tp = 2.571, majd n´ezz¨ uk meg, hogy |t| ≤ tp teljes¨ ul-e. Azt kapjuk, hogy nem, ´ıgy elvetj¨ uk a nullhipot´ezis¨ unket, teh´at elvetj¨ uk, hogy f¨ uggetlen lenne a k´et v´altoz´o, vagy a m´asik sz´ohaszn´alatunkkal ´elve szignifik´ans a kapcsolat a k´et v´altoz´o k¨oz¨ott. T´erj¨ unk r´a a k¨ovetkez˝o pr´ob´ankra, ami nem m´as, mint az egymint´as t-pr´oba.
2.7.2.
Egymint´ as t-pr´ oba
Az egymint´as t-pr´ob´at arra haszn´alhatjuk, hogy meg´allap´ıtsuk, vajon egy bizonyos beavatkoz´as hat´as´ara megv´altozik-e egy adott tulajdons´ag. Vizsg´alhatjuk p´eld´aul egy gy´ogyszer hat´asoss´ag´at, testh˝om´ers´eklet, v´ernyom´as szempontj´ab´ol. Alkalmaz´ asa. M´er´eseinket egy n elem˝ u, N (µ, σ) eloszl´as´ u v´altoz´ob´ol sz´armaz´o mint´an v´egezz¨ uk. Adottak a beavatkoz´as el˝otti m´ert ´ert´ekek (ei ), valamint a beavatkoz´as ut´aniak (ui ), ezekb˝ol kisz´am´ıtjuk a k¨ ul¨onbs´eget, megv´altoz´ast (xi = ui − ei ), ´es ezt fogjuk a mint´anak tekinteni. Ezek ut´an a nullhipot´ezis¨ unk ´all´ıt´asa, hogy a v´arhat´o ´ert´ek 0, azaz H0 : µ = 0, a beavatkoz´asnak nincs hat´asa, x az adott mint´an csak v´eletlen¨ ul lett 0-t´ol k¨ ul¨onb¨oz˝o. A elj´ar´asok, sz´am´ıt´asok pedig a k¨ovetkez˝oek szerint zajlanak le. El˝osz¨or is kisz´am´ıtjuk a x t= sx statisztik´at, amely n − 1 szabads´agfok´ u t-eloszl´as´ u lesz, amennyiben H0 igaz.
37
2.7 Pr´ob´ak
Majd ism´et a t-eloszl´ashoz tartoz´o t´abl´azatb´ol kikeress¨ uk a megfelel˝o szignifikancia szinthez tartoz´o tp k¨ usz¨ob´ert´eket, ´es megvizsg´aljuk, hogy teljes¨ ul-e a |t| ≤ tp o¨sszef¨ ugg´es. Amennyiben igen, akkor H0 nullhipot´ezist elfogadjuk, k¨ ul¨onben pedig elvetj¨ uk.
2.23. Megjegyz´ es. Figyelj¨ unk, mit is jelent ebben az esetben, ha elfogadjuk a nullhipot´ezis¨ unket. Ez azt jelenti, hogy 0 a v´arhat´o ´ert´ek, teh´at v´arhat´oan nem t¨ort´enik v´altoz´as a gy´ogyszer hat´as´ara, ha elvetj¨ uk a nullhipot´ezist, az jelenti azt, hogy hat´asos a gy´ogyszer. Szok´as ´elni a szignifik´ans a v´altoz´as sz´ohaszn´alattal is ebben az esetben. P´ elda L´azcsillap´ıt´o hat´as´at vizsg´aljuk l´azas betegeken, a t´abl´azatban ei az i. beteg l´aza a gy´ogyszer bev´etele el˝ott, ui az ut´ana m´ert ´ert´ek, xi pedig az elt´er´es a k´et ´ert´ek k¨oz¨ott. ei 38.4 38.5 39.8 38.3 39.2 38.4 38.5 39.1
ui 37.6 37.8 37.8 38.4 37.3 38.8 37.1 38.4
P
xi −0.8 −0.7 −2 0.1 −1.9 0.4 −1.4 −0.7 −7
x2i
11.36
Amire m´eg sz¨ uks´eg¨ unk lesz, az x = − 87 = −0.875, valamint sx , amit kisz´am´ıthatunk a szok´asos m´odon s2x = 0.748 seg´ıts´eg´evel sx = m´odon.
√
0.748 √ = 0.3057 8
38
2. Statisztikai m´odszerek Ezek ut´an m´ar nincs m´as, mint kisz´am´ıtani a t statisztik´at t=
−0.875 = −2.862, 0.3057
majd keress¨ uk ki a 7 szabads´agi fokhoz, ´es 5%-os szignifikancia szinthez tartoz´o k¨ usz¨ob´ert´eket a t-eloszl´as t´abl´azat´ab´ol. Ott azt tal´aljuk, hogy tp = 2.365. Ezek ut´an vizsg´aljuk meg, hogy |t| ≤ tp teljes¨ ul-e. Nem teljes¨ ul, ´ıgy elvetj¨ uk a nullhipot´ezist, teh´at szignifik´ans a v´altoz´as, azaz hat´asos a gy´ogyszer.
2.7.3.
F -pr´ oba
Az F -pr´oba seg´ıts´eg´evel azt tudjuk ellen˝orizni, hogy k´et norm´alis eloszl´as´ u v´altoz´onak megegyezik-e a sz´or´asa. Azaz H0 : σ1 = σ2 lesz a nullhipot´ezis¨ unk ebben az esetben. Alkalmaz´ asa. Adott a k´et mint´ank: x1 , x2 , . . . , xn ´es y1 , y2 , . . . , ym . Ezekb˝ol kisz´am´ıtjuk az s2x ´es s2y varianci´akat, ´es elk´esz´ıtj¨ uk az s2x F = 2 sy statisztik´at. Fontos, hogy itt is u ´ gy v´alasszuk meg a t¨ortet, hogy nagyobb legyen, mint 1. Az ´ıgy kapott statisztika n − 1, m − 1 szabads´agfokokkal rendelkez˝o F -eloszl´as´ u lesz. Megv´alasztunk egy k´ıv´ant szignifikancia szintet, legyen ez p, majd kikeress¨ uk az F -eloszl´as t´abl´azat´ab´ol a megfelel˝o szabads´agi fokok mellett, ´es p2 val´osz´ın˝ us´eghez tartoz´o k¨ usz¨ob´ert´eket, ez legyen t p2 . Amennyiben F ≤ t p2 , akkor elfogadjuk a nullhipot´ezist, k¨ ul¨onben pedig elvetj¨ uk. P´ elda Adott a k¨ovetkez˝o minta 63, 65, 63, 63, 67, 65,
39
2.7 Pr´ob´ak
tov´abb´a tudjuk, hogy van egy m´asik mint´ank, amely m = 10 elem˝ u, ´es 2 a varianci´aja sy = 16. Hasonl´ıtsuk ¨ossze a k´et minta sz´or´as´at 5%-os szinten! Ehhez csak s2x ´ert´ek´ere lesz sz¨ uks´eg¨ unk, ehhez haszn´aljuk fel a 2.2 fejezetben le´ırt tr¨ ukk¨ot, ´es a minta elemeib˝ol vonjunk ki 63-at, ´ıgy az u ´j mint´ank 0, 2, 0, 0, 4, 2 lesz. K¨onnyen kisz´am´ıthat´o, hogy x = 43 a minta´atlag. Ebb˝ol 16 1 120 4 64 8 1 2 3 = · +2 + = , sx = 5 9 9 9 5 9 3 ´ıgy m´ar ki tudjuk sz´am´ıtani a statisztik´at F =
sy 16 = 8 = 6. sx 3
Ezek ut´an keress¨ uk ki az F -eloszl´as t´abl´azat´ab´ol (55 − 62 oldal) a 9, 5 szabads´agi fokokhoz, ´es 2p = 2.5%-os szinthez tartoz´o ´ert´eket t p2 = 6.68, mivel 6 < 6.68, ez´ert elfogadjuk a nullhipot´ezist, ´es azt mondjuk, hogy a sz´or´asok k¨oz¨otti elt´er´es nem szignifik´ans. 2.24. Megjegyz´ es. L´athatjuk, hogy a sz´am´ıt´asok sor´an megcser´elt¨ uk a k´et mint´at, ´es az x ker¨ ult a nevez˝obe, m´ıg y a sz´aml´al´oba, ennek oka, hogy a t¨ortnek 1-n´el nagyobbnak kell lennie. Term´eszetesen a szabads´agi fokokat is meg kell cser´elni ilyenkor, az´ert is lett a p´eld´aban (9,5) az (5,9) helyett.
2.7.4.
K´ etmint´ as t-pr´ oba
Ezzel a pr´ob´aval k´et csoport k¨oz¨otti, bizonyos tulajdons´ag szerinti k¨ ul¨onb¨oz˝os´eg´et lehet vizsg´alni, felt´eve, hogy a mint´ak norm´alis eloszl´as´ uak, f¨ uggetlenek, ´es azonos sz´or´assal rendelkeznek. Ezt a k¨ ul¨onb¨oz˝os´eget, vagy ´eppen azonoss´agot a v´arhat´o ´ert´ekek seg´ıts´eg´evel
40
2. Statisztikai m´odszerek
fogjuk meg´allap´ıtani, ´ıgy a nullhipot´ezis¨ unk is a v´arhat´o ´ert´ekekre vonatkozik H0 : M(ξ) = M(η), teh´at a nullhipot´ezis¨ unk, hogy megegyeznek a v´arhat´o ´ert´ekek, nincs k¨ ul¨onbs´eg a k´et csoport k¨oz¨ott az adott tulajdons´ag szempontj´ab´ol. Alkalmaz´ asa. Mindenekel˝ott adott k´et minta x1 , x2 , . . . , xn ´es y1 , y2 , . . . , ym , valamint egy k´ıv´ant szignifikancia szint, p. Ezekb˝ol kisz´am´ıtjuk az r Qx + Qy sm = n+m−2 k¨oz¨os sz´or´ast, majd ebb˝ol a t=
x−y q sm n1 +
1 m
statisztik´at, amely n + m − 2 szabads´agfok´ u t-eloszl´as´ u lesz. Ezek ut´an megkeress¨ uk a t´abl´azatban a tp ´ert´eket, majd a megszokott m´odon d¨ont¨ unk. Amennyiben |t| ≤ tp , akkor elfogadjuk H0 hipot´ezist, ebben az esetben azt mondhatjuk, hogy nem szignifik´ans a k¨ ul¨onbs´eg, ellenkez˝o esetben pedig elutas´ıtjuk, ´es azt mondjuk, hogy szignifik´ans a k¨ ul¨onbs´eg. P´ elda 8 doh´anyz´o, ´es 8 nem doh´anyz´o n˝o bizonyos tulajdons´ag´at vizsg´aljuk, ´es a k¨ovetkez˝oket kapjuk n=8 x = 3.402 Qx = 28 sx = 2 sx = 0.707
m=8 y = 6.804 Qy = 98 sy = 3.742 sy = 1.323
t-pr´ob´aval d¨onts¨ uk el, van-e k¨ ul¨onbs´eg a k´et csoport k¨oz¨ott, azaz a k´et elm´eleti v´arhat´o ´ert´ek elt´er-e egym´ast´ol. Mindezt tegy¨ uk 5%-os szignifikancia szint mellett.
41
2.7 Pr´ob´ak Els˝o l´ep´esben sz´am´ıtsuk ki a metodikai hib´at r 28 + 98 √ = 9 = 3, sm = 14 majd ennek seg´ıts´eg´evel m´ar egyszer˝ uen megkaphatjuk a statisztik´at t=
3.402 − 6.804 −3.402 q = −2.268, = 3 2 3 18 + 81
ezek ut´an a t-eloszl´as t´abl´azat´ab´ol keress¨ uk ki a megfelel˝o szignifikancia szinthez, ´es a 14 szabads´agi fokhoz tartoz´o ´ert´eket tp = 2.145, elv´egezve az ¨osszehasonl´ıt´ast, azt kapjuk, hogy |t| > tp , ´ıgy elutas´ıtjuk a nullhipot´ezist, teh´at azt kapjuk, hogy a k´et csoport k¨oz¨ott szignifik´ans a k¨ ul¨onbs´eg.
2.7.5.
Variancia-anal´ızis
A variancia-anal´ızissel arra keress¨ uk a v´alaszt, hogy vajon k´et v´altoz´o f¨ uggetlen-e egym´ast´ol, vagy sem. Megjegyezn´enk, hogy ezt m´ar vizsg´altuk a korrel´aci´os t-pr´ob´aval is, azonban itt m´asok lesznek az alkalmazhat´os´agi felt´eteleink, valamint mindig j´ol j¨on, ha egy dolgot nem csak egy m´odszerrel tudunk megvizsg´alni, hanem t¨obbf´ele elj´ar´asunk is van r´a. Az alkalmazhat´os´aghoz el´eg, hogy az egyik v´altoz´onk (η) norm´alis eloszl´as´ u legyen. A nullhipot´ezis H0 : a k´et v´altoz´o f¨ uggetlen form´aban adott.
42
2. Statisztikai m´odszerek
Alkalmaz´ asa. V´alasztunk egy szignifikancia szintet, legyen ez eset¨ unkben p = 5%. Ezut´an kisz´am´ıtjuk a k¨ovetkez˝oket Q2xy Qr := , Qx majd ebb˝ol s2r := Qr valamint Qh := Qy − Qr , s2h := ahol n az els˝o minta elemsz´ama. Ezen adatokb´ol elk´esz´ıtj¨ uk az
Qh , n−2
F =
s2r s2h
statisztik´at, amely H0 fenn´all´asa eset´en 1, n − 2 szabads´agfok´ u Feloszl´as´ u lesz. Megkeress¨ uk az adott szignifikancia szinthez tartoz´o tp ´ert´eket, ´es amennyiben F ≤ tp , akkor elfogadjuk a nullhipot´ezist, k¨ ul¨onben pedig elutas´ıtjuk. 2.25. Megjegyz´ es. Vigy´azzunk, hogy az F-pr´ob´aval ellent´etben itt nem p -h¨ o z, hanem a p-hez tartoz´o ´ert´eket keress¨ uk ki a t´abl´azatb´ol! 2 2.26. Megjegyz´ es. Term´eszetesen itt is ´elhet¨ unk a szok´asos sz´ohaszn´alattal, miszerint szignifik´ans a kapcsolat, illetve nem szignifik´ans a kapcsolat a k´et v´altoz´o k¨oz¨ott. P´ elda Adottak a k¨ovetkez˝ok n = 12, Qx = 5, Qy = 50, Qxy = 10, p = 0.05 a k´erd´es az, hogy vajon a k´et minta k¨oz¨ott van-e ¨osszef¨ ugg´es. Vizsg´aljuk meg ezt az ´all´ıt´ast korrel´aci´os t-pr´ob´aval, ´es a variancia-anal´ızis eszk¨ozeivel is!
43
2.7 Pr´ob´ak
El˝osz¨or tekints¨ uk a t-pr´ob´at, amihez sz¨ uks´eg¨ unk lesz a korrel´aci´os h´anyados meghat´aroz´as´ara √ 10 Qxy = , r=p 5 Qx Qy ebb˝ol
t=
√
√
10
10 q 5 1−
10 25
10 = √ = 2.582 15
A t´abl´azatb´ol kikeresve a megfelel˝o ´ert´eket, azt kapjuk, hogy tp = 2.228, ´ıgy elutas´ıtjuk a k´et v´altoz´o f¨ uggetlens´eg´et, teh´at azt kaptuk, hogy szignifik´ans a k¨ ul¨onbs´eg. N´ezz¨ uk, mit ad a variancia-anal´ızis. Vegy¨ uk sorban a sz´am´ıt´asokat: Qr =
Q2xy 100 = = 20 ⇒ s2r = 20, Qx 5
Qh = Qy − Qr = 50 − 20 = 30 ⇒ s2h = 3, ebb˝ol pedig F =
20 = 6.667 3
lesz a statisztik´ank. Ez (1, 10) szabads´ag fok´ u F -eloszl´as´ u lesz, ´ıgy a t´abl´azatb´ol kikeresve a megfelel˝o ´ert´eket kapjuk, hogy tp = 4.96, mivel F > tp , ´ıgy elvetj¨ uk a nullhipot´ezist. Teh´at ebben az esetben is azt kaptuk, hogy szignifik´ans a f¨ ugg´es. 2.27. Megjegyz´ es. A k´et m´odszer l´enyeg´eben ugyanazt adja, s˝ot lehet tudni azt is, hogy t2 = F ¨osszef¨ ugg´es fenn´all, amit ak´ar ellen˝orz´esre is lehet haszn´alni. N´ezz¨ uk is meg ezt az ¨osszef¨ ugg´est a p´eld´ankban: t2 =
100 20 = = F, 15 3
44
2. Statisztikai m´odszerek
itt val´oban teljes¨ ult. De n´ezz¨ uk meg, ´altal´aban mi´ert igaz ez az o¨sszef¨ ugg´es. Ehhez kicsit alak´ıtgassuk a t2 kifejez´est. t2 = (n − 2)
r 2 Qy r2 r2 = (n − 2) , = (n − 2) 2 Q Q2 1 − r2 1 − xy Qy − xy Qx Qy
Qx
itt haszn´aljuk fel, hogy r 2 Qy = Qr azt kapjuk, hogy t2 = (n − 2)
Qr Qr s2 = (n − 2) = 2r = F, Qy − Qr Qh sh
amivel bel´attuk az ´all´ıt´asunkat.
2.7.6.
χ2 -pr´ ob´ ak
A χ2 -pr´oba ´altal´aban nem sz´amszer˝ u adatokra vonatkoz´o pr´ob´at jelent. N´ezz¨ uk is sorra a k¨ ul¨onb¨oz˝o haszn´alati lehet˝os´egeit. K´ et csoport ¨ osszehasonl´ıt´ asa bizonyos szempontb´ ol Ebben az esetben adott k´et csoport (A ´es B), valamint egy tulajdons´ag, ami alapj´an ¨ossze k´ıv´anjuk hasonl´ıtani a k´et csoportot. Ehhez adott egy u ´ gynevezett n´egymez˝os t´abl´azat, a k¨ovetkez˝o form´aban P tulajdons´ag: + tulajdons´ag: A a b a+b B c d c+d P a+c b+d a+b+c+d=n
ahol a, b, c, d nem m´er´esi adatokat jelentenek, hanem darabsz´amokat. Ebben az esetben nagyon fontos, hogy a haszn´alhat´os´agnak van egy felt´etele, miszerint min (a + b, c + d) · min (a + c, b + d) > 5n felt´etelnek teljes¨ ulnie kell, egy´ebk´ent sajnos nem haszn´alhat´o a m´odszer. Ebben az esetben a nullhipot´ezis¨ unk, hogy nincs k¨ ul¨onbs´eg a k´et csoport k¨oz¨ott az adott tulajdons´ag szempontj´ab´ol.
45
2.7 Pr´ob´ak A statisztik´at a χ2 =
n (ad − bc)2 (a + b) (b + d) (a + c) (c + d)
k´eplet szerint k´esz´ıthetj¨ uk el, ami 1 szabads´agfok´ u χ2 -eloszl´as´ u lesz. Ezek ut´an a k´ıv´ant p szignifikancia szinthez tartoz´o tp k¨ usz¨ob´ert´eket kikeress¨ uk a t´abl´azatb´ol (63. oldal), ´es χ2 ≤ tp eset´en elfogadjuk a nullhipot´ezist, k¨ ul¨onben elutas´ıtjuk. Term´eszetesen itt is ´elhet¨ unk a szok´asos sz´ohaszn´alattal, miszerint szignifik´ans, illetve nem szignifik´ans a k¨ ul¨onbs´eg a k´et csoport k¨oz¨ott. 2.28. Megjegyz´ es. Mivel itt mindig 1 lesz a szabads´agfok, ´es ´altal´aban p = 0.05 szinten vizsg´aljuk a k¨ ul¨onbs´eget, ez´ert ´erdemes k¨ ul¨on kiemelni az ezekhez tartoz´o tp = 3.841 ´ert´eket. P´ elda Azt vizsg´aljuk meg, hogy van-e k¨ ul¨onbs´eg az ´or´ara j´ar´as szempontj´ab´ol a fi´ uk ´es a l´anyok k¨oz¨ott. Adott a k¨ovetkez˝o t´abl´azat fi´ uk l´anyok P
bej´ar 10 50 60
nem j´ar be 20 40 60
P
30 90 120
Vizsg´aljuk meg, alkalmazhat´o-e a pr´oba: 30 · 60 = 1800 > 120, teh´at alkalmazhat´o. K´esz´ıts¨ uk el a statisztik´at 120 (400 − 1000)2 χ = = 4.44 > tp = 3.841, 60 · 60 · 30 · 90 2
teh´at szignifik´ans a k¨ ul¨onbs´eg a fi´ uk, ´es a l´anyok k¨oz¨ott ´or´araj´ar´as szempontj´ab´ol. N´ezz¨ unk m´eg egy p´eld´at, amiben a sokszor eml´ıtett k´erd´esre keress¨ uk a v´alaszt, miszerint boldog´ıt-e a p´enz? P´ elda Magas, ´es alacsony j¨ovedelemmel rendelkez˝o embereket k´erdezt¨ unk arr´ol, hogy mi a v´elem´eny¨ uk a p´enz boldog´ıt´o hat´as´ar´ol. V´alaszaikat az al´abbi t´abl´azat foglalja ¨ossze.
46
2. Statisztikai m´odszerek boldog´ıt 10 30 40
magas j¨ovedelem alacsony j¨ovedelem P
nem boldog´ıt 10 10 20
P
20 40 60
Ellen˝orizhet˝o, hogy teljes¨ ulnek az alkalmazhat´os´agra vonatkoz´o felt´etelek, ´ıgy k´esz´ıts¨ uk is el a statisztik´at. 60 (100 − 300)2 = 3.75 < 3.841, 202 · 402 ´ıgy azt kapjuk, hogy nem szignifik´ans a k¨ ul¨onbs´eg a k´et csoport v´elem´enye k¨oz¨ott. χ2 =
Megv´ altoz´ as vizsg´ alata χ2 -pr´ ob´ aval Ebben az esetben egy csoportot vizsg´alunk bizonyos szempontb´ol egy adott esem´eny el˝ott, ´es ut´an. Ebben az esetben is adott egy n´egymez˝os t´abl´azat, ´am most a k¨ovetkez˝o form´aban esem´eny el˝ott: + esem´eny el˝ott: -
esem´eny ut´an: + a c
esem´eny ut´an: b d
itt is szint´en csak darabsz´amok vannak megadva. A nullhipot´ezis¨ unk, hogy nincs v´altoz´as, az esem´enynek nincs hat´asa az adott csoportra vonatkoz´oan. Ebben az esetben a statisztika pedig (b − c)2 χ = b+c 2
lesz, ami szint´en 1 szabads´agfok´ u χ2 -eloszl´as´ u, az alkalmaz´as felt´etele ebben az esetben, hogy b + c > 10 legyen. Szint´en kikeress¨ uk a t´abl´azatb´ol a megfelel˝o tp ´ert´eket, ´es amennyiben χ2 < tp , akkor elfogadjuk, hogy nincs v´altoz´as, k¨ ul¨onben elutas´ıtjuk, ´es azt mondjuk, hogy l´enyeges hat´asa van az esem´enynek az adott tulajdons´agra vonatkoz´olag. N´ezz¨ unk is erre egy p´eld´at!
47
2.7 Pr´ob´ak
P´ elda Egy doh´anygy´ar egy 270 f˝ob˝ol ´all´o mint´at k´erdezett meg azzal kapcsolatban, hogy doh´anyzik-e, vagy sem. Majd egy 10%-os a´remel´est k¨ovet˝oen f´el ´ev eltelt´evel u ´ jra megk´erdezte ezt a csoportot, hogy vajon doh´anyzik-e. Ezzel arra kerest´ek a v´alaszt, hogy vajon van-e hat´asa az ´aremel´esnek a doh´anyz´as m´ert´ek´ere. Az adatokat a k¨ovetkez˝o t´abl´azat foglalja ¨ossze.
el˝otte
doh´anyz´o nem doh´anyz´o
ut´ana doh´anyz´o nem doh´anyz´o 200 21 6 43
N´ezz¨ uk meg, hogy alkalmazhat´o-e a χ2 -pr´oba. 6 + 21 > 10, teh´at igen, alkalmazhat´o. K´esz´ıts¨ uk is el a statisztik´at 152 χ = = 8.33, 27 2
p = 5%-os szignifikancia szint mellett a k¨ usz¨ob´ert´ek, mint m´ar eml´ıtett¨ uk is, tp = 3.841 < 8.33 = χ2 , ´ıgy elutas´ıtjuk a nullhipot´ezist, teh´at szignifik´ans az ´aremel´es hat´asa a doh´anyz´as m´ert´ek´ere. P´ elda N´ezz¨ unk meg m´eg egy p´eld´at. Itt azt vizsg´aljuk, hogy milyen hat´assal van a gyorshajt´asra, ha valaki balesetnek lesz szemtan´ uja.
el˝otte
gyorshajt´o nem gyorshajt´o
ut´ana gyorshajt´o nem gyorshajt´o 10 2 30 158
Teh´at adottak a baleset el˝otti darabsz´amok, illetve a baleset ut´ani darabsz´amok. Szint´en teljes¨ ulnek az alkalmazhat´os´agra vonatkoz´o felt´etelek, ´ıgy ´alljunk is neki elk´esz´ıteni a statisztik´at χ2 =
282 = 24.5 > tp , 32
´ıgy azt kaptuk, hogy l´enyeges a baleset hat´asa a gyorshajt´as szempontj´ab´ol.
3. fejezet Diszkr´ et eloszl´ asok Az eddigiekben folytonos eloszl´asokkal foglalkoztunk, most eml´ıts¨ uk meg a legfontosabb diszkr´et eloszl´asokat is. A bevezet˝oben l´attuk, hogy egy v´altoz´o akkor diszkr´et eloszl´as´ u, ha ´ert´ekeit vagy v´eges, vagy pedig megsz´aml´alhat´oan v´egtelen halmazb´ol veheti fel. A diszkr´et eloszl´asok az´ert fontosak, mert a biometri´aban sok olyan adat szerepel, amely nem m´er´esi adat, ´es ´ıgy nem is folytonos eloszl´as´ uak. Itt r¨oviden ismerkedj¨ unk meg a sz´amunkra 3 legfontosabb diszkr´et eloszl´assal.
3.1.
Poisson-eloszl´ as
Az els˝o p´eld´ank a Poisson-eloszl´as lesz, melynek eloszl´asa a k¨ovetkez˝o formul´aval adott λk −λ P (ξ = k) = e , k! ahol λ az eloszl´as param´etere, valamint k ∈ {0, 1, 2, . . . }. Ha kisz´am´ıtjuk egy Poisson-eloszl´as´ u val´osz´ın˝ us´egi v´altoz´o v´arhat´o ´ert´ek´et, akkor azt kapjuk, hogy nem m´as, mint a param´eter, a sz´or´asa pedig a param´eter n´egyzetgy¨oke, azaz M(ξ) = λ, D(ξ) = 48
√
λ
3.2 Binomi´alis-eloszl´as
49
Poisson-eloszl´ ast k¨ ovetnek: sejtek a sz¨ovetben, halak a tengerben, csillagok a vil´ag˝ urben (mind egy adott t´err´eszre vonatkoz´oan)
3.2.
Binomi´ alis-eloszl´ as
Binomi´alis eloszl´asnak a n k p (1 − p)n−k P (ξ = k) = k formul´aval adott eloszl´ast nevezz¨ uk, ahol n ∈ N ´es p ∈ [0, 1] param´eterek, n! n = k!(n − k)! k pedig a binomi´alis egy¨ utthat´ok. A binomi´alis eloszl´as azt ´ırja le, hogy egy k´ıs´erlet sor´an p val´osz´ın˝ us´eggel bek¨ovetkez˝o esem´eny h´anyszor k¨ovetkezik be abban az esetben, ha a k´ıs´erletet n-szer hajtjuk v´egre, teh´at P (ξ = k) azt ´ırja le, hogy mi annak a val´osz´ın˝ us´ege, hogy az n k´ıs´erletb˝ol pontosan k-szor k¨ovetkezik be az esem´eny¨ unk. P´ elda Tekints¨ uk p´eldak´ent a kockadob´ast, az esem´eny, amit vizsg´alunk pedig a 6-os dob´asa. Tudjuk, hogy a 6-os dob´as´anak val´osz´ın˝ us´ege p = 16 , legyen most 4 k´ıs´erlet¨ unk, azaz n = 4. Ebben az esetben a binomi´alis eloszl´as azt adja meg, hogy a 4 dob´asb´ol h´anyszor dobunk 6-ost. N´ezz¨ uk is ezeket a val´osz´ın˝ us´egeket: 4 5 4 0 4 = 0.4823 p (1 − p) = P (ξ = 0) = 6 0 3 1 5 4 1 3 p (1 − p) = 4 P (ξ = 1) = = 0.3858 1 6 6 2 2 5 1 4 2 2 p (1 − p) = 6 P (ξ = 2) = = 0.1157 6 6 2
50
3. Diszkr´et eloszl´asok 3 1 5 4 3 = 0.0154 p (1 − p)1 = 4 P (ξ = 3) = 6 6 3 4 1 4 4 0 = 0.0008 p (1 − p) = P (ξ = 4) = 6 4
Ezek ut´an n´ezz¨ uk meg a binomi´alis-eloszl´as v´arhat´o ´ert´ek´et, ´es a sz´or´as´at M(ξ) = np p D(ξ) = np(1 − p),
ezen ´ert´ekek a v´arhat´o ´ert´ek defin´ıci´oja alapj´an kisz´am´ıthat´oak, ellen˝orz´es´et az olvas´ora b´ızzuk.
3.3.
Hipergeometrikus-eloszl´ as
Ebben az esetben adott N darab elem, amelyek k¨oz¨ ul M darab rendelkezik egy bizonyos tulajdons´aggal. Mi tesz¨ unk n k´ıs´erletet (kiv´alasztunk n darab elemet), ahol n ≤ M. A hipergeometrikus-eloszl´as azt adja meg, hogy a kih´ uzott elemek k¨oz¨ott milyen val´osz´ın˝ us´eggel lesz k darab olyan, amely rendelkezik az adott tulajdons´aggal. Teh´at a lehets´eges ´ert´ekeit a {0, 1, 2, 3, . . . , n − 1, n} halmazb´ol veheti fel, a k¨ovetkez˝o P (ξ = k) =
M k
N −M n−k N n
val´osz´ın˝ us´egekkel. P´ elda P´eldak´ent tekints¨ uk az 5-¨oslott´ot. N = 90 darab sz´am lehets´eges, ebb˝ol M = 5 rendelkezik az ´altalam megjel¨olt sz´amok tulajdons´aggal. n = 5 a kih´ uzott goly´ok sz´ama. ´Igy annak a val´osz´ın˝ us´ege, hogy k tal´alatom lesz: 85 5 P (ξ = k) =
k
5−k 90 5
51
3.4 P´eld´ak V´arhat´o ´ert´eke, ´es sz´or´asa padig a k¨ovetkez˝o M(ξ) = n D(ξ) =
3.4.
r
n
M N
M N −M N −n N N N −1
P´ eld´ ak
P´ elda binomi´ alis-eloszl´ asra. Adott egy tulajdons´ag, ami p = 0.02, azaz 2%-os val´osz´ın˝ us´eggel fordul el˝o az emberekn´el. Mi a val´osz´ın˝ us´ege, hogy egy 110 f˝os ´evfolyamon tal´alunk pontosan 1, illetve pontosan 3 ilyen embert? Mivel binomi´alis-eloszl´asr´ol van sz´o, haszn´alhatjuk az ottani k´epleteket: 110 0.02 · 0.98109 = 0.48, P (ξ = 1) = 1 110 0.023 · 0.98107 = 0.199 P (ξ = 3) = 3 P´ elda Poisson-eloszl´ asra. Egy adott munkahelyre 12-13 o´ra k¨oz¨ott ´atlagosan 1 telefonh´ıv´as fut be. Ez azt jelenti, hogy a Poisson-eloszl´as param´etere λ = 1 lesz. Mekkora a val´osz´ın˝ us´ege annak, hogy ha m´ar befutott 2 telefonh´ıv´as, akkor befut m´eg egy ebben az id˝oben? P (ξ = 3) =
1 −1 e = 0.06, 6
azaz 6% a val´osz´ın˝ us´ege, teh´at nyugodtan elmehetnek eb´edelni, el´eg val´osz´ın˝ u, hogy nem lesz probl´ema.
4. fejezet Statisztikai t´ abl´ azatok Az itt szerepl˝o t´abl´azatok a k¨ovetkez˝o m˝ u alapj´an k´esz¨ ultek: ´ Dr. Hajtman B´ela: A biometria alapjai, Budapest (Atdolgozott ´es b˝ov´ıtett kiad´as)
Az els˝o t´abl´azatban szerepl˝o ´ert´ekek a k¨ovetkez˝o adatokat adj´ak meg: 1 − Φ(z) = P (ξ > z) = p, ahol term´eszetesen ξ standard norm´alis eloszl´as´ u v´altoz´o. Ezen fel¨ ul a t´abl´azatban szerepel m´eg a Φ f¨ uggv´eny ´altal az adott pontban felvett ´ert´ek Φ(z) = y form´aban.
52
53 4.1. t´abl´azat. Norm´alis eloszl´as p 0.50 0.49 0.48 0.47 0.46 0.45 0.44 0.43 0.42 0.41 0.40 0.39 0.38 0.37 0.36 0.35 0.34 0.33 0.32 0.31 0.30 0.29 0.28 0.27 0.26 0.25 0.24 0.23 0.22 0.21 0.20 0.19 0.18 0.17 0.16 0.15 0.14 0.13 0.12 0.11
z 0.000 0.025 0.050 0.075 0.100 0.126 0.151 0.176 0.202 0.228 0.253 0.280 0.305 0.332 0.358 0.385 0.412 0.440 0.468 0.496 0.524 0.553 0.583 0.613 0.643 0.674 0.706 0.739 0.772 0.806 0.842 0.878 0.915 0.954 0.994 1.036 1.080 1.126 1.175 1.227
y 0.39894 0.39882 0.39844 0.39781 0.39694 0.39580 0.39442 0.39279 0.39089 0.38875 0.38634 0.38368 0.38076 0.37757 0.37412 0.37040 0.36641 0.36215 0.35761 0.35279 0.34769 0.34230 0.33662 0.33065 0.32437 0.31778 0.31087 0.30365 0.29609 0.28820 0.27996 0.27137 0.26240 0.25305 0.24331 0.23316 0.22258 0.21155 0.20004 0.18804
p 0.100 0.095 0.090 0.085 0.080 0.075 0.070 0.065 0.060 0.055 0.050 0.045 0.040 0.035 0.030 0.025 0.020 0.015 0.010 0.009 0.008 0.007 0.006 0.005 0.004 0.003 0.002 0.001 0.0009 0.0008 0.0007 0.0006 0.0005 0.0004 0.0003 0.0002 0.0001
z 1.282 1.311 1.341 1.372 1.405 1.440 1.476 1.514 1.555 1.598 1.645 1.695 1.751 1.812 1.881 1.960 2.054 2.170 2.326 2.366 2.409 2.457 2.512 2.576 2.652 2.748 2.878 3.090 3.121 3.156 3.195 3.239 3.291 3.353 3.432 3.540 3.719
y 0.17550 0.16902 0.16239 0.15561 0.14867 0.14156 0.13427 0.12679 0.11912 0.11124 0.10314 0.09479 0.08617 0.07727 0.06804 0.05845 0.04842 0.03787 0.02665 0.02431 0.02192 0.01949 0.01700 0.01446 0.01185 0.00915 0.00634 0.00337 0.00306 0.00274 0.00243 0.00210 0.00178 0.00145 0.00111 0.00076 0.00040
54
4. Statisztikai t´abl´azatok
Szabads´ agfok
4.2. t´abl´azat. t-eloszl´as
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 60 120 ∞
0.90 0.158 0.142 0.137 0.134 0.132 0.131 0.130 0.130 0.129 0.129 0.129 0.128 0.128 0.128 0.128 0.128 0.128 0.127 0.127 0.127 0.127 0.127 0.127 0.127 0.127 0.127 0.127 0.127 0.127 0.127 0.126 0.126 0.126 0.126
0.70 0.510 0.445 0.424 0.414 0.408 0.404 0.402 0.399 0.398 0.397 0.396 0.395 0.394 0.393 0.393 0.392 0.392 0.392 0.391 0.391 0.391 0.390 0.390 0.390 0.390 0.390 0.389 0.389 0.389 0.389 0.388 0.387 0.386 0.385
0.50 1.000 0.816 0.765 0.741 0.727 0.718 0.711 0.706 0.703 0.700 0.697 0.695 0.694 0.692 0.691 0.690 0.689 0.688 0.688 0.687 0.686 0.686 0.685 0.685 0.684 0.684 0.684 0.683 0.683 0.683 0.681 0.679 0.677 0.674
0.30 1.963 1.386 1.250 1.190 1.156 1.134 1.119 1.108 1.100 1.093 1.088 1.083 1.079 1.076 1.074 1.071 1.069 1.067 1.066 1.064 1.063 1.061 1.060 1.059 1.058 1.058 1.057 1.056 1.055 1.055 1.050 1.046 1.041 1.036
Val´ osz´ın˝ us´ eg 0.20 0.10 3.078 6.314 1.866 2.920 1.638 2.353 1.533 2.132 1.476 2.015 1.440 1.943 1.415 1.895 1.397 1.860 1.383 1.833 1.372 1.812 1.363 1.796 1.356 1.782 1.350 1.771 1.345 1.761 1.341 1.753 1.337 1.746 1.333 1.740 1.330 1.734 1.328 1.729 1.325 1.725 1.323 1.721 1.321 1.717 1.319 1.714 1.318 1.711 1.316 1.708 1.315 1.706 1.314 1.703 1.313 1.701 1.311 1.699 1.310 1.697 1.303 1.684 1.296 1.671 1.289 1.658 1.282 1.645
0.05 12.706 4.303 3.182 2.776 2.571 2.447 2.365 2.306 2.262 2.228 2.201 2.179 2.160 2.145 2.131 2.120 2.110 2.101 2.093 2.086 2.080 2.074 2.069 2.064 2.060 2.056 2.052 2.048 2.045 2.042 2.021 2.000 1.980 1.960
0.02 31.821 6.965 4.541 3.747 3.365 3.143 2.998 2.896 2.821 2.764 2.718 2.681 2.650 2.624 2.602 2.583 2.567 2.552 2.539 2.528 2.518 2.508 2.500 2.492 2.485 2.479 2.473 2.467 2.462 2.457 2.423 2.390 2.358 2.326
0.01 63.657 9.925 5.841 4.604 4.032 3.707 3.499 3.355 3.250 3.169 3.106 3.055 3.012 2.977 2.947 2.921 2.898 2.878 2.861 2.845 2.831 2.819 2.807 2.797 2.787 2.779 2.771 2.763 2.756 2.750 2.704 2.660 2.617 2.576
55 4.3. t´abl´azat. F -eloszl´as
1
2
A nevez˝o szabads´agfoka
3
4
5
6
7
8
Val´ osz´ın˝ us´eg 10% 5% 2.5% 1% 0.5% 10% 5% 2.5% 1% 0.5% 10% 5% 2.5% 1% 0.5% 10% 5% 2.5% 1% 0.5% 10% 5% 2.5% 1% 0.5% 10% 5% 2.5% 1% 0.5% 10% 5% 2.5% 1% 0.5% 10% 5% 2.5% 1% 0.5%
1 39.9 161 648 4050 16200 8.53 18.5 38.5 98.5 199 5.54 10.0 17.4 34.1 55.6 4.54 7.71 12.2 21.2 31.3 4.06 6.61 10.0 16.3 22.8 3.78 5.99 8.81 13.7 18.6 3.59 5.59 8.07 12.2 16.2 3.46 5.32 7.57 11.3 14.7
2 49.5 200 800 5000 20000 9.00 19.0 39.0 99.0 199 5.46 9.55 16.0 30.8 49.8 4.32 6.94 10.6 18.0 26.3 3.78 5.79 8.43 13.3 18.3 3.46 5.14 7.26 10.9 14.5 3.26 4.74 6.54 9.55 12.4 3.11 4.46 6.06 8.65 11.0
A sz´aml´al´o szabads´agfoka 3 4 5 6 53.6 55.8 57.2 58.2 216 225 230 234 864 900 922 937 5400 5620 5760 5860 21600 22500 23100 23400 9.16 9.24 9.29 9.33 19.2 19.2 19.3 19.3 39.2 39.2 39.3 39.3 99.2 99.2 99.3 99.3 199 199 199 199 5.39 5.34 5.31 5.28 9.28 9.12 9.01 8.94 15.4 15.1 14.9 14.7 29.5 28.7 28.2 27.9 47.5 46.2 45.4 44.8 4.19 4.11 4.05 4.01 6.59 6.39 6.26 6.16 9.98 9.60 9.36 9.20 16.7 16.0 15.5 15.2 24.3 23.2 22.5 22.0 3.62 3.52 3.45 3.40 5.41 5.19 5.05 4.95 7.76 7.39 7.15 6.98 12.1 11.4 11.0 10.7 16.5 15.6 14.9 14.5 3.29 3.18 3.11 3.05 4.76 4.53 4.39 4.28 6.60 6.23 5.99 5.82 9.78 9.15 8.75 8.47 12.9 12.0 11.5 11.1 3.07 2.96 2.88 2.83 4.35 4.12 3.97 3.87 5.89 5.52 5.29 5.12 8.45 7.85 7.46 7.19 10.9 10.1 9.52 9.16 2.92 2.81 2.73 2.67 4.07 3.84 3.69 3.58 5.42 5.05 4.82 4.65 7.59 7.01 6.63 6.37 9.60 8.81 8.30 7.95
7 58.9 237 948 5930 23700 9.35 19.4 39.4 99.4 199 5.27 8.89 14.6 27.7 44.4 3.98 6.09 9.07 15.0 21.6 3.37 4.88 6.85 10.5 14.2 3.01 4.21 5.70 8.26 10.8 2.78 3.79 4.99 6.99 8.89 2.62 3.50 4.53 6.18 7.69
8 59.4 239 957 5980 23900 9.37 19.4 39.4 99.4 199 5.25 8.85 14.5 27.5 44.1 3.95 6.04 8.98 14.8 21.4 3.34 4.82 6.76 10.3 14.0 2.98 4.15 5.60 8.10 10.6 2.75 3.73 4.90 6.84 8.68 2.59 3.44 4.43 6.03 7.50
56
4. Statisztikai t´abl´azatok 4.4. t´abl´azat. F -eloszl´as (folytat´as)
1
2
A nevez˝o szabads´agfoka
3
4
5
6
7
8
Val´ osz´ın˝ us´eg 10% 5% 2.5% 1% 0.5% 10% 5% 2.5% 1% 0.5% 10% 5% 2.5% 1% 0.5% 10% 5% 2.5% 1% 0.5% 10% 5% 2.5% 1% 0.5% 10% 5% 2.5% 1% 0.5% 10% 5% 2.5% 1% 0.5% 10% 5% 2.5% 1% 0.5%
9 59.9 241 963 6020 24100 9.38 19.4 39.4 99.4 199 5.24 8.81 14.5 27.3 43.9 3.94 6.00 8.90 14.7 21.1 3.32 4.77 6.68 10.2 13.8 2.96 4.10 5.52 7.98 10.4 2.72 3.68 4.82 6.72 8.51 2.56 3.39 4.36 5.91 7.34
10 60.2 242 969 6060 24200 9.39 19.4 39.4 99.4 199 5.23 8.79 14.4 27.2 43.7 3.92 5.96 8.84 14.5 21.0 3.30 4.74 6.62 10.1 13.6 2.94 4.06 5.46 7.87 10.1 2.70 3.64 4.76 6.62 8.38 2.54 3.35 4.30 5.81 7.21
A sz´aml´al´o szabads´agfoka 15 20 30 60 61.2 61.7 62.3 62.8 246 248 250 252 985 993 1000 1010 6160 6210 6260 6310 24600 24800 25000 25300 9.42 9.44 9.46 9.47 19.4 19.4 19.5 19.5 39.4 39.4 39.5 39.5 99.4 99.4 99.5 99.5 199 199 199 199 5.20 5.18 5.17 5.15 8.70 8.66 8.62 8.57 14.3 14.2 14.1 14.0 26.9 26.7 26.5 26.3 43.1 42.8 42.5 42.1 3.87 3.84 3.82 3.79 5.86 5.80 5.75 5.69 8.66 8.56 8.46 8.36 14.2 14.0 13.8 13.7 20.4 20.2 19.9 19.6 3.24 3.21 3.17 3.14 4.62 4.56 4.50 4.43 6.43 6.33 6.23 6.12 9.72 9.55 9.38 9.20 13.1 12.9 12.7 12.4 2.87 2.84 2.80 2.76 3.94 3.87 3.81 3.74 5.27 5.17 5.07 4.96 7.56 7.40 7.23 7.06 9.81 9.59 9.36 9.12 2.63 2.59 2.56 2.51 3.51 3.44 3.38 3.30 4.57 4.47 4.36 4.25 6.31 6.16 5.99 5.82 7.97 7.75 7.53 7.31 2.46 2.42 2.38 2.34 3.22 3.15 3.08 3.01 4.10 4.00 3.89 3.78 5.52 5.36 5.20 5.03 6.81 6.61 6.40 6.18
120 63.1 253 1010 6340 25400 9.48 19.5 39.5 99.5 199 5.14 8.55 13.9 26.2 42.0 3.78 5.66 8.31 13.6 19.5 3.12 4.40 6.07 9.11 12.3 2.74 3.70 4.90 6.97 9.00 2.49 3.27 4.20 5.74 7.19 2.32 2.97 3.73 4.95 6.06
∞ 63.3 254 1020 6370 25500 9.49 19.5 39.5 99.5 200 5.13 8.53 13.9 26.1 41.8 3.76 5.63 8.26 13.5 19.3 3.10 4.36 6.02 9.02 12.1 2.72 3.67 4.85 6.88 8.88 2.47 3.23 4.14 5.65 7.08 2.29 2.93 3.67 4.86 5.95
57 4.5. t´abl´azat. F -eloszl´as (folytat´as)
9
10
A nevez˝o szabads´agfoka
11
12
13
14
15
16
Val´ osz´ın˝ us´eg 10% 5% 2.5% 1% 0.5% 10% 5% 2.5% 1% 0.5% 10% 5% 2.5% 1% 0.5% 10% 5% 2.5% 1% 0.5% 10% 5% 2.5% 1% 0.5% 10% 5% 2.5% 1% 0.5% 10% 5% 2.5% 1% 0.5% 10% 5% 2.5% 1% 0.5%
1 3.36 5.12 7.21 10.6 13.6 3.29 4.96 6.94 10.0 12.8 3.23 4.84 6.72 9.65 12.2 3.18 4.75 6.55 9.33 11.8 3.14 4.67 6.41 9.07 11.4 3.10 4.60 6.30 8.86 11.1 3.07 4.54 6.20 8.68 10.8 3.05 4.49 6.12 8.53 10.6
2 3.01 4.26 5.71 8.02 10.1 2.92 4.10 5.46 7.56 9.43 2.86 3.98 5.26 7.21 8.91 2.81 3.89 5.10 6.93 8.51 2.76 3.81 4.97 6.70 8.19 2.73 3.74 4.86 6.51 7.92 2.70 3.68 4.77 6.36 7.70 2.67 3.63 4.69 6.23 7.51
A sz´aml´al´o szabads´agfoka 3 4 5 6 2.81 2.69 2.61 2.55 3.86 3.63 3.48 3.37 5.08 4.72 4.48 4.32 6.99 6.42 6.06 5.80 8.72 7.96 7.47 7.13 2.73 2.61 2.52 2.46 3.71 3.48 3.33 3.22 4.83 4.47 4.24 4.07 6.55 5.99 5.64 5.39 8.08 7.34 6.87 6.54 2.66 2.54 2.45 2.39 3.59 3.36 3.20 3.09 4.63 4.28 4.04 3.88 6.22 5.67 5.32 5.07 7.60 6.88 6.42 6.10 2.61 2.48 2.39 2.33 3.49 3.26 3.11 3.00 4.47 4.12 3.89 3.73 5.95 5.41 5.06 4.82 7.23 6.52 6.07 5.76 2.56 2.43 2.35 2.28 3.41 3.18 3.03 2.92 4.35 4.00 3.77 3.60 5.74 5.21 4.86 4.62 6.93 6.23 5.79 5.48 2.52 2.39 2.31 2.24 3.34 3.11 2.96 2.85 4.24 3.89 3.66 3.50 5.56 5.04 4.69 4.46 6.68 6.00 5.56 5.26 2.49 2.36 2.27 2.21 3.29 3.06 2.90 2.79 4.15 3.80 3.58 3.41 5.42 4.89 4.56 4.32 6.48 5.80 5.37 5.07 2.46 2.33 2.24 2.18 3.24 3.01 2.85 2.74 4.08 3.73 3.50 3.34 5.29 4.77 4.44 4.20 6.30 5.64 5.21 4.91
7 2.51 3.29 4.20 5.61 6.88 2.41 3.14 3.95 5.20 6.30 2.34 3.01 3.76 4.89 5.86 2.28 2.91 3.61 4.64 5.52 2.23 2.83 3.48 4.44 5.25 2.19 2.76 3.38 4.28 5.03 2.16 2.71 3.29 4.14 4.85 2.13 2.66 3.22 4.03 4.69
8 2.47 3.23 4.10 5.47 6.69 2.38 3.07 3.85 5.06 6.12 2.30 2.95 3.66 4.74 5.68 2.24 2.85 3.51 4.50 5.35 2.20 2.77 3.39 4.30 5.08 2.15 2.70 3.29 4.14 4.86 2.12 2.64 3.20 4.00 4.67 2.09 2.59 3.12 3.89 4.52
58
4. Statisztikai t´abl´azatok 4.6. t´abl´azat. F -eloszl´as (folytat´as)
9
10
A nevez˝o szabads´agfoka
11
12
13
14
15
16
Val´ osz´ın˝ us´eg 10% 5% 2.5% 1% 0.5% 10% 5% 2.5% 1% 0.5% 10% 5% 2.5% 1% 0.5% 10% 5% 2.5% 1% 0.5% 10% 5% 2.5% 1% 0.5% 10% 5% 2.5% 1% 0.5% 10% 5% 2.5% 1% 0.5% 10% 5% 2.5% 1% 0.5%
9 2.44 3.18 4.03 5.35 6.54 2.35 3.02 3.78 4.94 5.97 2.27 2.90 3.59 4.63 5.54 2.21 2.80 3.44 4.39 5.20 2.16 2.71 3.31 4.19 4.94 2.12 2.65 3.21 4.03 4.72 2.09 2.59 3.12 3.89 4.54 2.06 2.54 3.05 3.78 4.38
10 2.42 3.14 3.96 5.26 6.42 2.32 2.98 3.72 4.85 5.85 2.25 2.85 3.53 4.54 5.42 2.19 2.75 3.37 4.30 5.09 2.14 2.67 3.25 4.10 4.82 2.10 2.60 3.15 3.94 4.60 2.06 2.54 3.06 3.80 4.42 2.03 2.49 2.99 3.69 4.27
A sz´aml´al´o szabads´agfoka 15 20 30 60 2.34 2.30 2.25 2.21 3.01 2.94 2.86 2.79 3.77 3.67 3.56 3.45 4.96 4.81 4.65 4.48 6.03 5.83 5.62 5.41 2.24 2.20 2.16 2.11 2.85 2.77 2.70 2.62 3.52 3.42 3.31 3.20 4.56 4.41 4.25 4.08 5.47 5.27 5.07 4.86 2.17 2.12 2.08 2.03 2.72 2.65 2.57 2.49 3.33 3.23 3.12 3.00 4.25 4.10 3.94 3.78 5.05 4.86 4.65 4.44 2.10 2.06 2.01 1.96 2.62 2.54 2.47 2.38 3.18 3.07 2.96 2.85 4.01 3.86 3.70 3.54 4.72 4.53 4.33 4.12 2.05 2.01 1.96 1.90 2.53 2.46 2.38 2.30 3.05 2.95 2.84 2.72 3.82 3.66 3.51 3.34 4.46 4.27 4.07 3.87 2.01 1.96 1.91 1.86 2.46 2.39 2.31 2.22 2.95 2.84 2.73 2.61 3.66 3.51 3.35 3.18 4.25 4.06 3.86 3.66 1.97 1.92 1.87 1.82 2.40 2.33 2.25 2.16 2.86 2.76 2.64 2.52 3.52 3.37 3.21 3.05 4.07 3.88 3.69 3.48 1.94 1.89 1.84 1.78 2.35 2.28 2.19 2.11 2.79 2.68 2.57 2.45 3.41 3.26 3.10 2.93 3.92 3.73 3.54 3.33
120 2.18 2.75 3.39 4.40 5.30 2.08 2.58 3.14 4.00 4.75 2.00 2.45 2.94 3.69 4.34 1.93 2.34 2.79 3.45 4.01 1.88 2.25 2.66 3.25 3.76 1.83 2.18 2.55 3.09 3.55 1.79 2.11 2.46 2.96 3.37 1.75 2.06 2.38 2.84 3.22
∞ 2.16 2.71 3.33 4.31 5.19 2.06 2.54 3.08 3.91 4.64 1.97 2.40 2.88 3.60 4.23 1.90 2.30 2.72 3.36 3.90 1.85 2.21 2.60 3.17 3.65 1.80 2.13 2.49 3.00 3.44 1.76 2.07 2.40 2.87 3.26 1.72 2.01 2.32 2.75 3.11
59 4.7. t´abl´azat. F -eloszl´as (folytat´as)
17
18
A nevez˝o szabads´agfoka
19
20
21
22
23
24
Val´ osz´ın˝ us´eg 10% 5% 2.5% 1% 0.5% 10% 5% 2.5% 1% 0.5% 10% 5% 2.5% 1% 0.5% 10% 5% 2.5% 1% 0.5% 10% 5% 2.5% 1% 0.5% 10% 5% 2.5% 1% 0.5% 10% 5% 2.5% 1% 0.5% 10% 5% 2.5% 1% 0.5%
1 3.03 4.45 6.04 8.40 10.4 3.01 4.41 5.98 8.29 10.2 2.99 4.38 5.92 8.18 10.1 2.97 4.35 5.87 8.10 9.94 2.96 4.32 5.83 8.02 9.83 2.95 4.30 5.79 7.95 9.73 2.94 4.28 5.75 7.88 9.63 2.93 4.26 5.72 7.82 9.55
2 2.64 3.59 4.62 6.11 7.35 2.62 3.55 4.56 6.01 7.21 2.61 3.52 4.51 5.93 7.09 2.59 3.49 4.46 5.85 6.99 2.57 3.47 4.42 5.78 6.89 2.56 3.44 4.38 5.72 6.81 2.55 3.42 4.35 5.66 6.73 2.54 3.40 4.32 5.61 6.66
A sz´aml´al´o szabads´agfoka 3 4 5 6 2.44 2.31 2.22 2.15 3.20 2.96 2.81 2.70 4.01 3.66 3.44 3.28 5.18 4.67 4.34 4.10 6.16 5.50 5.07 4.78 2.42 2.29 2.20 2.13 3.16 2.93 2.77 2.66 3.95 3.61 3.38 3.22 5.09 4.58 4.25 4.01 6.03 5.37 4.96 4.66 2.40 2.27 2.18 2.11 3.13 2.90 2.74 2.63 3.90 3.56 3.33 3.17 5.01 4.50 4.17 3.94 5.92 5.27 4.85 4.56 2.38 2.25 2.16 2.09 3.10 2.87 2.71 2.60 3.86 3.51 3.29 3.13 4.94 4.43 4.10 3.87 5.82 5.17 4.76 4.47 2.36 2.23 2.14 2.08 3.07 2.84 2.68 2.57 3.82 3.48 3.25 3.09 4.87 4.37 4.04 3.81 5.73 5.09 4.68 4.39 2.35 2.22 2.13 2.06 3.05 2.82 2.66 2.55 3.78 3.44 3.22 3.05 4.82 4.31 3.99 3.76 5.65 5.02 4.61 4.32 2.34 2.21 2.11 2.05 3.03 2.80 2.64 2.53 3.75 3.41 3.18 3.02 4.76 4.26 3.94 3.71 5.58 4.95 4.54 4.26 2.33 2.19 2.10 2.04 3.01 2.78 2.62 2.51 3.72 3.38 3.15 2.99 4.72 4.22 3.90 3.67 5.52 4.89 4.49 4.20
7 2.10 2.61 3.16 3.93 4.56 2.08 2.58 3.10 3.84 4.44 2.06 2.54 3.05 3.77 4.34 2.04 2.51 3.01 3.70 4.26 2.02 2.49 2.97 3.64 4.18 2.01 2.46 2.93 3.59 4.11 1.99 2.44 2.90 3.54 4.05 1.98 2.42 2.87 3.50 3.99
8 2.06 2.55 3.06 3.79 4.39 2.04 2.51 3.01 3.71 4.28 2.02 2.48 2.96 3.63 4.18 2.00 2.45 2.91 3.56 4.09 1.98 2.42 2.87 3.51 4.01 1.97 2.40 2.84 3.45 3.94 1.95 2.37 2.81 3.41 3.88 1.94 2.36 2.78 3.36 3.83
60
4. Statisztikai t´abl´azatok 4.8. t´abl´azat. F -eloszl´as (folytat´as)
17
18
A nevez˝o szabads´agfoka
19
20
21
22
23
24
Val´ osz´ın˝ us´eg 10% 5% 2.5% 1% 0.5% 10% 5% 2.5% 1% 0.5% 10% 5% 2.5% 1% 0.5% 10% 5% 2.5% 1% 0.5% 10% 5% 2.5% 1% 0.5% 10% 5% 2.5% 1% 0.5% 10% 5% 2.5% 1% 0.5% 10% 5% 2.5% 1% 0.5%
9 2.03 2.49 2.98 3.68 4.25 2.00 2.46 2.93 3.60 4.14 1.98 2.42 2.88 3.52 4.04 1.96 2.39 2.84 3.46 3.96 1.95 2.37 2.80 3.40 3.88 1.93 2.34 2.76 3.35 3.81 1.92 2.32 2.73 3.30 3.75 1.91 2.30 2.70 3.26 3.69
10 2.00 2.45 2.92 3.59 4.14 1.98 2.41 2.87 3.51 4.03 1.96 2.38 2.82 3.43 3.93 1.94 2.35 2.77 3.37 3.85 1.92 2.32 2.73 3.31 3.77 1.90 2.30 2.70 3.26 3.70 1.89 2.27 2.67 3.21 3.64 1.88 2.25 2.64 3.17 3.59
A sz´aml´al´o szabads´agfoka 15 20 30 60 1.91 1.86 1.81 1.75 2.31 2.23 2.15 2.06 2.72 2.62 2.50 2.38 3.31 3.16 3.00 2.83 3.79 3.61 3.41 3.21 1.89 1.84 1.78 1.72 2.27 2.19 2.11 2.02 2.67 2.56 2.44 2.32 3.23 3.08 2.92 2.75 3.68 3.50 3.30 3.10 1.86 1.81 1.76 1.70 2.23 2.16 2.07 1.98 2.62 2.51 2.39 2.27 3.15 3.00 2.84 2.67 3.59 3.40 3.21 3.00 1.84 1.79 1.74 1.68 2.20 2.12 2.04 1.95 2.57 2.46 2.35 2.22 3.09 2.94 2.78 2.61 3.50 3.32 3.12 2.92 1.83 1.78 1.72 1.66 2.18 2.10 2.01 1.92 2.53 2.42 2.31 2.18 3.03 2.88 2.72 2.55 3.43 3.24 3.05 2.84 1.81 1.76 1.70 1.64 2.15 2.07 1.98 1.89 2.50 2.39 2.27 2.14 2.98 2.83 2.67 2.50 3.36 3.18 2.98 2.77 1.80 1.74 1.69 1.62 2.13 2.05 1.96 1.86 2.47 2.36 2.24 2.11 2.93 2.78 2.62 2.45 3.30 3.12 2.92 2.71 1.78 1.73 1.67 1.61 2.11 2.03 1.94 1.84 2.44 2.33 2.21 2.08 2.89 2.74 2.58 2.40 3.25 3.06 2.87 2.66
120 1.72 2.01 2.32 2.75 3.10 1.69 1.97 2.26 2.66 2.99 1.67 1.93 2.20 2.58 2.89 1.64 1.90 2.16 2.52 2.81 1.62 1.87 2.11 2.46 2.73 1.60 1.84 2.08 2.40 2.66 1.59 1.81 2.04 2.35 2.60 1.57 1.79 2.01 2.31 2.55
∞ 1.69 1.96 2.25 2.65 2.98 1.66 1.92 2.19 2.57 2.87 1.63 1.88 2.13 2.49 2.78 1.61 1.84 2.09 2.42 2.69 1.59 1.81 2.04 2.36 2.61 1.57 1.78 2.00 2.31 2.55 1.55 1.76 1.97 2.26 2.48 1.53 1.73 1.94 2.21 2.43
61 4.9. t´abl´azat. F -eloszl´as (folytat´as)
25
26
A nevez˝o szabads´agfoka
28
30
40
60
120
∞
Val´ osz´ın˝ us´eg 10% 5% 2.5% 1% 0.5% 10% 5% 2.5% 1% 0.5% 10% 5% 2.5% 1% 0.5% 10% 5% 2.5% 1% 0.5% 10% 5% 2.5% 1% 0.5% 10% 5% 2.5% 1% 0.5% 10% 5% 2.5% 1% 0.5% 10% 5% 2.5% 1% 0.5%
1 2.92 4.24 5.69 7.77 9.48 2.91 4.23 5.66 7.72 9.41 2.89 4.20 5.61 7.64 9.28 2.88 4.17 5.57 7.56 9.18 2.84 4.08 5.42 7.31 8.83 2.79 4.00 5.29 7.08 8.49 2.75 3.92 5.15 6.85 8.18 2.71 3.84 5.02 6.63 7.88
2 2.53 3.39 4.29 5.57 6.60 2.52 3.37 4.27 5.53 6.54 2.50 3.34 4.22 5.45 6.44 2.49 3.32 4.18 5.39 6.35 2.44 3.23 4.05 5.18 6.07 2.39 3.15 3.93 4.98 5.79 2.35 3.07 3.80 4.79 5.54 2.30 3.00 3.69 4.61 5.30
A sz´aml´al´o szabads´agfoka 3 4 5 6 2.32 2.18 2.09 2.02 2.99 2.76 2.60 2.49 3.69 3.35 3.13 2.97 4.68 4.18 3.85 3.63 5.46 4.84 4.43 4.15 2.31 2.17 2.08 2.01 2.98 2.74 2.59 2.47 3.67 3.33 3.10 2.94 4.64 4.14 3.82 3.59 5.41 4.79 4.38 4.10 2.29 2.16 2.06 2.00 2.95 2.71 2.56 2.45 3.63 3.29 3.06 2.90 4.57 4.07 3.75 3.53 5.32 4.70 4.30 4.02 2.28 2.14 2.05 1.98 2.92 2.69 2.53 2.42 3.59 3.25 3.03 2.87 4.51 4.02 3.70 3.47 5.24 4.62 4.23 3.95 2.23 2.09 2.00 1.93 2.84 2.61 2.45 2.34 3.46 3.13 2.90 2.74 4.31 3.83 3.51 3.29 4.98 4.37 3.99 3.71 2.18 2.04 1.95 1.87 2.76 2.53 2.37 2.25 3.34 3.01 2.79 2.63 4.13 3.65 3.34 3.12 4.73 4.14 3.76 3.49 2.13 1.99 1.90 1.82 2.68 2.45 2.29 2.17 3.23 2.89 2.67 2.52 3.95 3.48 3.17 2.96 4.50 3.92 3.55 3.28 2.08 1.94 1.85 1.77 2.60 2.37 2.21 2.10 3.12 2.79 2.57 2.41 3.78 3.32 3.02 2.80 4.28 3.72 3.35 3.09
7 1.97 2.40 2.85 3.46 3.94 1.96 2.39 2.82 3.42 3.89 1.94 2.36 2.78 3.36 3.81 1.93 2.33 2.75 3.30 3.74 1.87 2.25 2.62 3.12 3.51 1.82 2.17 2.51 2.95 3.29 1.77 2.09 2.39 2.79 3.09 1.72 2.01 2.29 2.64 2.90
8 1.93 2.34 2.75 3.32 3.78 1.92 2.32 2.73 3.29 3.73 1.90 2.29 2.69 3.23 3.65 1.88 2.27 2.65 3.17 3.58 1.83 2.18 2.53 2.99 3.35 1.77 2.10 2.41 2.82 3.13 1.72 2.02 2.30 2.66 2.93 1.67 1.94 2.19 2.51 2.74
62
4. Statisztikai t´abl´azatok 4.10. t´abl´azat. F -eloszl´as (folytat´as)
25
26
A nevez˝o szabads´agfoka
28
30
40
60
120
∞
Val´ osz´ın˝ us´eg 10% 5% 2.5% 1% 0.5% 10% 5% 2.5% 1% 0.5% 10% 5% 2.5% 1% 0.5% 10% 5% 2.5% 1% 0.5% 10% 5% 2.5% 1% 0.5% 10% 5% 2.5% 1% 0.5% 10% 5% 2.5% 1% 0.5% 10% 5% 2.5% 1% 0.5%
9 1.89 2.28 2.68 3.22 3.64 1.88 2.27 2.65 3.18 3.60 1.87 2.24 2.61 3.12 3.52 1.85 2.21 2.57 3.07 3.45 1.79 2.12 2.45 2.89 3.22 1.74 2.04 2.33 2.72 3.01 1.68 1.96 2.22 2.56 2.81 1.63 1.88 2.11 2.41 2.62
10 1.87 2.24 2.61 3.13 3.54 1.86 2.22 2.59 3.09 3.49 1.84 2.19 2.55 3.03 3.41 1.82 2.16 2.51 2.98 3.34 1.76 2.08 2.39 2.80 3.12 1.71 1.99 2.27 2.63 2.90 1.65 1.91 2.16 2.47 2.71 1.60 1.83 2.05 2.32 2.52
A sz´aml´al´o szabads´agfoka 15 20 30 60 1.77 1.72 1.66 1.59 2.09 2.01 1.92 1.82 2.41 2.30 2.18 2.05 2.85 2.70 2.54 2.36 3.20 3.01 2.82 2.61 1.76 1.71 1.65 1.58 2.07 1.99 1.90 1.80 2.39 2.28 2.16 2.03 2.81 2.66 2.50 2.33 3.15 2.97 2.77 2.56 1.74 1.69 1.63 1.56 2.04 1.96 1.87 1.77 2.34 2.23 2.11 1.98 2.75 2.60 2.44 2.26 3.07 2.89 2.69 2.48 1.72 1.67 1.61 1.54 2.01 1.93 1.84 1.74 2.31 2.20 2.07 1.94 2.70 2.55 2.39 2.21 3.01 2.82 2.63 2.42 1.66 1.61 1.54 1.47 1.92 1.84 1.74 1.64 2.18 2.07 1.94 1.80 2.52 2.37 2.20 2.02 2.78 2.60 2.40 2.18 1.60 1.54 1.48 1.40 1.84 1.75 1.65 1.53 2.06 1.94 1.82 1.67 2.35 2.20 2.03 1.84 2.57 2.39 2.19 1.96 1.55 1.48 1.41 1.32 1.75 1.66 1.55 1.43 1.94 1.82 1.69 1.53 2.19 2.03 1.86 1.66 2.37 2.19 1.98 1.75 1.49 1.42 1.34 1.24 1.67 1.57 1.46 1.32 1.83 1.71 1.57 1.39 2.04 1.88 1.70 1.47 2.19 2.00 1.79 1.53
120 1.56 1.77 1.98 2.27 2.50 1.54 1.75 1.95 2.23 2.45 1.52 1.71 1.91 2.17 2.37 1.50 1.68 1.87 2.11 2.30 1.42 1.58 1.72 1.92 2.06 1.35 1.47 1.58 1.73 1.83 1.26 .35 1.43 1.53 1.61 1.17 1.22 1.27 1.32 1.36
∞ 1.52 1.71 1.91 2.17 2.38 1.50 1.69 1.88 2.13 2.33 1.48 1.65 1.83 2.06 2.22 1.46 1.62 1.79 2.01 2.18 1.38 1.51 1.64 1.80 1.93 1.29 1.39 1.48 1.60 1.69 1.19 1.25 1.31 1.38 1.43 1.00 1.00 1.00 1.00 1.00
63
Szabads´ agfok
4.11. t´abl´azat. χ2 -eloszl´as
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 32 34 36 38 40 42 44 46 48 50 52 54 56 58 60
0.90 0.016 0.211 0.584 1.064 1.610 2.204 2.833 3.490 4.168 4.865 5.578 6.304 7.042 7.790 8.547 9.312 10.085 10.865 11.651 12.443 13.240 14.041 14.848 15.659 16.473 17.292 18.114 18.939 19.768 20.599 22.271 23.952 25.643 27.343 29.051 30.765 32.487 34.215 35.949 37.689 39.433 41.183 42.937 44.696 46.459
0.70 0.148 0.713 1.424 2.195 3.000 3.828 4.671 5.527 6.393 7.267 8.148 9.034 9.926 10.821 11.721 12.624 13.531 14.440 15.352 16.266 17.182 18.101 19.021 19.943 20.867 21.792 22.719 23.647 24.577 25.508 27.373 29.242 31.115 32.992 34.872 36.755 38.641 40.529 42.420 44.313 46.209 48.106 50.005 51.906 53.809
0.50 0.455 1.386 2.366 3.357 4.351 5.348 6.346 7.344 8.343 9.342 10.341 11.340 12.340 13.339 14.339 15.338 16.338 17.338 18.338 19.337 20.337 21.337 22.337 23.337 24.337 25.336 26.336 27.336 28.336 29.336 31.336 33.336 35.336 37.335 39.335 41.335 43.335 45.335 47.335 49.335 51.335 53.335 55.335 57.335 59.335
Val´ osz´ın˝ us´ eg 0.30 0.20 1.074 1.642 2.408 3.219 3.665 4.642 4.878 5.989 6.064 7.289 7.231 8.558 8.383 9.803 9.524 11.030 10.656 12.242 11.781 13.442 12.899 14.631 14.011 15.812 15.119 16.985 16.222 18.151 17.322 19.311 18.418 20.465 19.511 21.615 20.601 22.760 21.689 23.900 22.775 25.038 23.858 26.171 24.939 27.301 26.018 28.429 27.096 29.553 28.172 30.675 29.246 31.795 30.319 32.912 31.391 34.027 32.461 35.139 33.530 36.250 35.665 38.466 37.795 40.676 39.922 42.879 42.045 45.076 44.165 47.269 46.282 49.456 48.396 51.639 50.507 53.818 52.616 55.993 54.723 58.164 56.827 60.332 58.930 62.496 61.031 64.658 63.129 66.816 65.227 68.972
0.10 2.706 4.605 6.251 7.779 9.236 10.645 12.017 13.362 14.684 15.987 17.275 18.549 19.812 21.064 22.307 23.542 24.769 25.989 27.204 28.412 29.615 30.813 32.007 33.196 34.382 35.563 36.741 37.916 39.087 40.256 42.585 44.903 47.212 49.513 51.805 54.090 56.369 58.641 60.907 63.167 65.422 67.673 69.919 72.160 74.397
0.05 3.841 5.991 7.815 9.488 11.070 12.592 14.067 15.507 16.619 18.307 19.675 21.026 22.362 23.685 24.996 26.296 27.587 28.869 30.144 31.410 32.671 33.924 35.172 36.415 37.652 38.885 40.113 41.337 42.557 43.773 46.194 48.602 50.999 53.384 55.759 58.124 60.481 62.830 65.171 67.505 69.832 72.153 74.468 76.778 79.082
0.01 6.635 9.210 11.345 13.277 15.086 16.812 18.475 20.090 21.666 23.209 24.725 26.217 27.688 29.141 30.578 32.000 33.409 34.805 36.191 37.566 38.932 40.289 41.638 42.980 44.314 45.642 46.963 48.278 49.588 50.892 53.486 56.061 58.619 61.162 63.691 66.206 68.710 71.201 73.683 76.154 78.616 81.069 83.513 85.950 88.379