´ sz´ınu ˝ s´ ´ m´ıta ´s Valo egsza ´ es matematikai statisztika
2006. okt´ober 24.
ii
Tartalomjegyz´ ek I.
Val´ osz´ın˝ us´ egsz´ am´ıt´ as
1
1. V´ eletlen jelens´ egek matematikai modellje 1.1. Val´osz´ın˝ us´egi mez˝o . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2. Nevezetes v´eletlen k´ıs´erletek . . . . . . . . . . . . . . . . . . . . . . . . . 1.3. Feladatok . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3 3 7 12
2. Felt´ eteles val´ osz´ın˝ us´ eg, f¨ uggetlens´ eg 2.1. A f¨ uggetlens´eg tulajdons´agai . . . . . . 2.2. A felt´eteles val´osz´ın˝ us´eg tulajdons´agai 2.3. Bayes d¨ont´es . . . . . . . . . . . . . . 2.4. Feladatok . . . . . . . . . . . . . . . .
. . . .
13 14 17 18 19
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
3. Val´ osz´ın˝ us´ egi v´ altoz´ ok 3.1. Val´osz´ın˝ us´egi v´altoz´oval kapcsolatos esem´enyek 3.2. Val´osz´ın˝ us´egi v´altoz´ok strukt´ ur´aja . . . . . . . . 3.3. Val´osz´ın˝ us´egi v´altoz´ok eloszl´asa . . . . . . . . . 3.4. Nevezetes eloszl´as´ u val´osz´ın˝ us´egi v´altoz´ok . . . 3.5. Feladatok . . . . . . . . . . . . . . . . . . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
21 21 23 24 30 35
4. V´ arhat´ o´ ert´ ek, sz´ or´ as 4.1. V´arhat´o ´ert´ek . . . . . . . . 4.2. Sz´or´as . . . . . . . . . . . . 4.3. Nevezetes eloszl´asok v´arhat´o 4.4. Momentumok, kovariancia . 4.5. Feladatok . . . . . . . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
37 37 42 43 45 47
5. Nagy sz´ amok t¨ orv´ enye 5.1. Nevezetes egyenl˝otlens´egek . . . . . . . . . . . . . . . . . . . . . . . . . . 5.2. Nagy sz´amok t¨orv´enyei . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.3. Feladatok . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
51 51 53 54
6. Karakterisztikus f¨ uggv´ eny 6.1. Hat´areloszl´asok . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.2. V´eletlen tagsz´am´ u o¨sszeg . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.3. Feladatok . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
57 61 66 67
. . . . . . . . ´ert´eke, . . . . . . . .
iii
. . . . . . . . . . sz´or´asa . . . . . . . . . .
. . . . .
. . . . .
´ TARTALOMJEGYZEK
iv 7. Vektor val´ osz´ın˝ us´ egi v´ altoz´ ok jellemz˝ oi 7.1. Jel¨ol´esek, elnevez´esek . . . . . . . . . . . . . . 7.1.1. V´arhat´o ´ert´ek, kovariancia m´atrix . . . 7.1.2. Karakterisztikus f¨ uggv´eny . . . . . . . 7.2. Vektor val´osz´ın˝ us´egi v´altoz´o f˝okomponensei . . 7.3. Norm´alis eloszl´as´ u vektor val´osz´ın˝ us´egi v´altoz´o 7.4. Feladatok . . . . . . . . . . . . . . . . . . . .
. . . . . .
69 69 70 71 72 75 78
8. Nevezetes eloszl´ asok 8.1. χ2 eloszl´as . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.2. T ´es F -eloszl´as . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.3. Feladatok . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
81 81 86 88
9. Regresszi´ o anal´ızis 9.1. T¨obbv´altoz´os line´aris regresszi´o . . . . . . 9.2. Elm´eleti regresszi´o, felt´eteles v´arhat´o ´ert´ek 9.3. Bayes d¨ont´es . . . . . . . . . . . . . . . . 9.4. Feladatok . . . . . . . . . . . . . . . . . .
. . . .
. . . .
. . . . . .
. . . .
. . . . . .
. . . .
10.Sztochasztikus folyamatok 10.1. V´eletlen esem´enyfolyamat, Poisson folyamat . . . 10.2. Brown-mozg´as, Wiener folyamat . . . . . . . . . . 10.3. F¨ uggetlen ´es stacion´arius n¨ovekm´eny˝ u folyamatok 10.4. Stacion´arius folyamatok . . . . . . . . . . . . . . 10.5. Feladatok . . . . . . . . . . . . . . . . . . . . . .
II.
. . . . . .
. . . . . . . . .
. . . . . .
. . . . . . . . .
. . . . . .
. . . . . . . . .
. . . . . .
. . . . . . . . .
. . . . . .
. . . . . . . . .
. . . . . .
. . . . . . . . .
. . . . . .
. . . . . . . . .
. . . . . .
. . . . . . . . .
. . . . . .
. . . . . . . . .
. . . . . .
. . . . . . . . .
. . . . . .
. . . . . . . . .
. . . . . .
. . . . . . . . .
. . . .
89 89 93 103 105
. . . . .
107 109 114 118 122 130
Matematikai statisztika
11.A matematikai statisztika alapfogalmai 11.1. Statisztikai mez˝o . . . . . . . . . . . . 11.2. Statisztik´ak . . . . . . . . . . . . . . . 11.3. Param´eterek . . . . . . . . . . . . . . . 11.4. Likelihood f¨ uggv´eny . . . . . . . . . . . 11.5. Feladatok . . . . . . . . . . . . . . . .
133 . . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
12.Param´ eterbecsl´ es 12.1. Pontbecsl´es . . . . . . . . . . . . . . . . . . . . . . . . . 12.2. Becsl´esek hat´ekonys´aga . . . . . . . . . . . . . . . . . . . 12.2.1. Maximum likelihood becsl´es . . . . . . . . . . . . 12.2.2. Hat´ekonyabb becsl´es mint az el´egs´eges statisztika f¨ uggv´enye . . . . . . . . . . . . . . . . . . . . . . 12.2.3. A hat´ekonys´ag inform´aci´os hat´ara . . . . . . . . . 12.3. Intervallum becsl´esek . . . . . . . . . . . . . . . . . . . . 12.4. Feladatok . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
135 135 138 140 141 145
147 . . . . . . . . . 147 . . . . . . . . . 153 . . . . . . . . . 153 . . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
154 154 158 162
´ TARTALOMJEGYZEK
v
13.Hipot´ ezis vizsg´ alat 13.1. Alapfogalmak . . . . . . . . . . . . . . . 13.2. Val´osz´ın˝ us´egh´anyados pr´oba . . . . . . . 13.2.1. Bartlett pr´oba . . . . . . . . . . . 13.2.2. Val´osz´ın˝ us´eg pr´ob´aja, (n;c) terv . 13.3. Norm´alis eloszl´as param´etereinek pr´ob´ai 13.4. Feladatok . . . . . . . . . . . . . . . . .
. . . . . .
. . . . . .
14.Line´ aris f¨ ugg˝ os´ egi kapcsolat 14.1. Egyenl˝o m´ert´ek˝ u, f¨ uggetlen megfigyel´esi hiba 14.2. Korrel´alt megfigyel´esi hib´ak . . . . . . . . . 14.3. Ridge becsl´es . . . . . . . . . . . . . . . . . 14.4. Nemline´aris regresszi´os f¨ uggv´enyek . . . . . 14.5. Feladatok . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . .
165 165 167 168 170 172 176
. . . . .
177 177 184 186 187 189
15.Sz´ or´ asanal´ızis 191 15.1. R¨ogz´ıtett hat´asok modellje . . . . . . . . . . . . . . . . . . . . . . . . . . 192 15.2. V´eletlen hat´asok modellje . . . . . . . . . . . . . . . . . . . . . . . . . . 196 15.3. Feladatok: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 197 16.Nem param´ eteres pr´ ob´ ak 16.1. Illeszked´es vizsg´alat . . . 16.2. F¨ uggetlens´eg vizsg´alat . 16.3. Homogenit´as vizsg´alat . 16.4. Feladatok . . . . . . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
199 199 202 204 207
A. M´ ert´ ek ´ es integr´ al 209 A.1. M´ert´ek . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 209 A.2. M´erhet˝o f¨ uggv´eny . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 214 A.3. Integr´al . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 215 B. T´ abl´ azatok
219
C. K´ epletek
229
K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
vi
´ TARTALOMJEGYZEK
I. r´ esz Val´ osz´ın˝ us´ egsz´ am´ıt´ as
1
1. fejezet V´ eletlen jelens´ egek matematikai modellje 1.1.
Val´ osz´ın˝ us´ egi mez˝ o
V´eletlen jelens´egek k¨or´enek meghat´aroz´asa hasonl´o neh´ezs´egekkel j´ar, mint m´as term´eszettudom´anyok eset´en a vizsg´alatok t´argy´anak megad´asa. Azt azonban elfogadhatjuk, ´es mindennapi sz´ohaszn´alatunk is ezt jelzi, hogy vannak olyan jelens´egek, t¨ort´en´esek, melyek lej´atsz´od´as´aval kapcsolatos bizonytalans´agunkat u ´ gy fejezz¨ uk ki, hogy a ”v´eletlen¨ ul”, ”tal´alomra”, stb. kifejez´eseket haszn´aljuk. Ilyen jelens´egek p´eld´aul egy kocka dob´asa, vagy egy adott helyen ´es id˝opontban m´erhet˝o id˝oj´ar´asi elem (pl. h˝om´ers´eklet). Ezen jelens´egekr˝ol b˝os´eges tapasztalat szerezhet˝o ism´etelt megfigyel´es¨ ukkel. Ilyen tapasztalat, hogy szab´alyos kock´at dobva minden eredm´eny hasonl´o gyakoris´aggal k¨ovetkezik be, vagy m´ask´epp fogalmazva, egyforma es´ely˝ u, illetve janu´arban kev´esb´e val´osz´ın˝ u a 20C◦ feletti h˝om´ers´eklet, mint a fagypont alatti, vagy a´ltal´aban a gyakrabban bek¨ovetkez˝o dolgokat, ´eppen gyakoris´aguknak megfelel˝oen, val´osz´ın˝ ubbnek mondjuk. Foglaljuk most o¨ssze az ilyen, un. v´eletlen k´ıs´erletek k¨oz¨os von´asait: • a v´eletlen k´ıs´erletnek j´ol meghat´arozhat´o kimenetelei vannak; • bizonyos kimenetelek bek¨ovetkez´es´enek esem´eny´er˝ol besz´elhet¨ unk; • az ilyen esem´enyek bek¨ovetkez´esi es´elye mennyis´egi form´aban megadhat´o; C´elunk olyan modell megfogalmaz´asa, ahol mindezeknek matematikai fogalmakat feleltet¨ unk meg, ´es matematikai m´odszerekkel olyan eredm´enyeket nyerhet¨ unk, amelyek seg´ıtenek ezen jelens´egek meg´ert´es´eben, illetve a tapasztalat a´ltal is meger˝os´ıthet˝o t¨orv´enyszer˝ us´egeket tudunk bizony´ıtani. Egy ilyen modell seg´ıts´eg´evel olyan k¨ovetkeztet´esek is ”levezethet˝ov´e” v´alnak, melyek tapasztalatinkb˝ol k¨ozvetlen¨ ul nem k¨ovetkeztethet˝ok ki, lehet˝ov´e t´eve ezzel ilyen eredm´enyek sz´elesk¨or˝ u alkalmaz´as´at.
3
´ ´ 1. FEJEZET. VELETLEN JELENSEGEK MATEMATIKAI MODELLJE
4
1.1. Defin´ıci´ o. Val´osz´ın˝ us´egi mez˝onek nevezz¨ uk az (Ω, A, P ) h´armast, ahol • Ω – az elemi esem´enyek halmaza, esem´enyt´er; • A ⊂ 2Ω – az esem´enyt´er r´eszeinek egy σ-algebr´aja, az esem´enyalgebra, azaz teljes¨ ulnek: A1 Ω ∈ A ;
A2 ha A ∈ A akkor A = Ω \ A ∈ A ; A3 ha An ∈ A n = 1, 2, . . .
akkor
∞ S
n=1
An ∈ A ;
• P : A → R – f¨ uggv´eny, a val´osz´ın˝ us´egi m´ert´ek, azaz teljes¨ ulnek: P1 P (Ω) = 1 ; P2 ha A ∈ A akkor P (A) ≥ 0 ;
P3 ha An ∈ A n = 1, 2, . . . ´es Ak ∩ Al = ∅ k 6= l = 1, 2, . . . akkor ! ∞ ∞ [ X An = P (An ) ; P n=1
n=1
Teh´at a val´osz´ın˝ us´egi mez˝o egy m´ert´ekt´er v´eges m´ert´ekkel (l´asd A. F¨ uggel´ek). A tov´abbiakban minden esetben egy ilyen modellt t´etelez¨ unk fel, ´es ha k¨ ul¨on nem is eml´ıtj¨ uk, fogalmaink egy (Ω, A, P ) val´osz´ın˝ us´egi mez˝ovel lesznek kapcsolatosak. Az al´abbiakban felsorolunk n´eh´any egyszer˝ uen k¨ovetkez˝o tulajdons´agot, ´es itt haszn´alatos elnevez´est, kifejez´est. 1. Az A esem´enyalgebra elemei az esem´enyek, Ω ∈ A a biztos esem´eny. 2. Mivel ∅ = Ω ∈ A, az ∅ u ¨ res halmazt lehetetlen esem´enynek nevezz¨ uk. 3. Az esem´enyalgebra z´art a szok´asos m¨ uveletekre: ha A, B ∈ A akkor • A ∪B = A∪B ∪∅∪ ∅∪... ∈ A • A∩B =A∪B ∈A
• A\B =A∩B ∈A
4. A lehetetlen esem´eny val´osz´ın˝ us´ege 0, mivel P (∅) = P (∅ ∪ ∅ ∪ ∅ ∪ . . .) = P (∅) + P (∅) + P (∅) + . . . ami csak u ´ gy teljes¨ ulhet, ha P (∅) = 0.
´ ´INUS ˝ EGI ´ ˝ 1.1. VALOSZ MEZO
5
5. A val´osz´ın˝ us´egi m´ert´ek v´egesen addit´ıv: ha A, B ∈ A ´es A ∩ B = ∅ vagyis A ´es B kiz´ arj´ ak egym´ast, akkor A∪ B = A ∪B ∪ ∅∪ ∅∪... kiz´ar´o esem´enyek egyes´ıt´ese, ´es ´ıgy P (A ∪ B) = P (A) + P (B) + 0 + 0 + . . . = P (A) + P (B) . 6. N´eh´any tov´abbi ”sz´amol´asi szab´aly”: ha A, B ∈ A akkor • mivel Ω = A ∪ A kiz´ar´o esem´enyek u ´ ni´oja, ´ıgy 1 = P (A) + P (A), teh´at P (A) ≤ 1
P (A) = 1 − P (A) ;
´es
• mivel A = (A ∩ B) ∪ (A \ B) kiz´ar´o esem´enyek u ´ ni´oja, ´ıgy P (A \ B) = P (A) − P (A ∩ B) ; ha teljes¨ ul m´eg A ⊃ B, vagyis B bek¨ ovetkez´ese maga ut´ an vonja A bek¨ ovetkez´es´et, akkor P (A) ≥ P (B) ´es P (A \ B) = P (A) − P (B) ; • mivel A ∪ B = A ∪ (B \ A) kiz´ar´o esem´enyek u ´ ni´oja, haszn´alva az el˝oz˝o eredm´enyt, kapjuk P (A ∪ B) = P (A) + P (B) − P (A ∩ B) ; • az el˝oz˝o eredm´enyb˝ol kapjuk a val´osz´ın˝ us´eg un. szubaddit´ıv tulajdons´ag´at: P (A ∪ B) ≤ P (A) + P (B) ami v´eges vagy megsz´aml´alhat´o u ´ ni´ora is k¨ovetkezik. 7. A val´osz´ın˝ us´egi m´ert´ek folytonoss´aga: ha A1 ⊂ A2 ⊂ . . . ∈ A, akkor B1 = A 1 , B2 = A 2 \ A 1 , B3 = A 3 \ A 2 , . . . p´aronk´ent kiz´ar´o esem´enyek, ´es egyes´ıt´es¨ uk ∞ [
n=1
Bn =
∞ [
An ,
n=1
amib˝ol kapjuk ! ∞ [ P An = P (A1 ) + (P (A2 ) − P (A1 )) + (P (A3 ) − P (A2 )) + . . . = lim P (An ) . n→∞
n=1
Hasonl´oan teljes¨ ul A1 ⊃ A2 ⊃ . . . ∈ A eset´en ! ∞ \ P An = lim P (An ) . n=1
n→∞
K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
6
´ ´ 1. FEJEZET. VELETLEN JELENSEGEK MATEMATIKAI MODELLJE
A tov´abbiakban n´eh´any tipikus, v´eletlen jelens´egek modellez´es´ere j´ol haszn´alhat´o p´eld´at adunk val´osz´ın˝ us´egi mez˝ok megad´as´ara. 1. Kombinat´ orikus val´ osz´ın˝ us´ egsz´ am´ıt´ asi probl´ em´ ak V´eges sok, egyform´ an val´ osz´ın˝ u kimenetellel rendelkez˝ o v´eletlen k´ıs´erlet modellje. Ω = {ω 1 , ω 2 , . . . , ω n } A = 2Ω < A elemeinek sz´ama > P (A) = < Ω elemeinek sz´ama >
A⊂Ω
ahol 2Ω jel¨ ol¨ oli Ω o ¨sszes r´eszeinek halmaz´ at (hatv´ anyhalmaz´ at). 2. ”Diszkr´ et” val´ osz´ın˝ us´ egi mez˝ o V´eges vagy megsz´ aml´ alhat´ oan v´egtelen sok kimenetel˝ u v´eletlen k´ıs´erlet modellje, ahol a kimenetelek val´ osz´ın˝ us´egei egy (pn )n=1,2,... diszkr´et val´osz´ın˝ us´egeloszl´assal adottak. Ω = {ω 1 , ω 2 , . . . , ω n , . . .} A = 2Ω X P (A) = pn ω n ∈A
ahol (pn )n=1,2,... egy diszkr´et val´ osz´ın˝ us´egeloszl´ as, azaz pn ≥ 0 n = 1, 2, . . .
´es
X
pn = 1.
n
3. Geometriai val´ osz´ın˝ us´ egsz´ am´ıt´ asi probl´ em´ ak Rn valamely v´eges, pozit´ıv m´ert´ek˝ u r´eszhalmaz´ at kit¨ olt˝ o kimenetelekkel rendelkez˝ o v´eletlen k´ıs´erlet modellje, ahol egy r´esztartom´ any bek¨ ovetkez´esi val´ osz´ın˝ us´ege ar´ anyos annak m´ert´ek´evel. Ω ⊂ Rn A = {Ω ∩ B | B ∈ Bn } < A m´ert´eke > P (A) = A∈A < Ω m´ert´eke > ahol Bn jel¨ oli az Rn intervallumait tartalmaz´ o legsz˝ ukebb σ-algebr´ at. 4. ”Folytonos” val´ osz´ın˝ us´ egi mez˝ o A v´eletlen k´ıs´erlet kimenetelei Rn (vagy valamely m´erhet˝ o r´esz´enek) pontjaival n azonos´ıthat´ ok, ´es egy x ∈ R pont ”kis” k¨ ornyezet´ebe es´es val´ osz´ın˝ us´ege ar´ anyos
´ ´ 1.2. NEVEZETES VELETLEN K´ISERLETEK
7
egy val´osz´ın˝ us´egi s˝ ur˝ us´egf¨ uggv´eny f (x) ´ert´ek´evel. Ω = Rn A = B Zn P (A) = f
A∈A
A
ahol az f : Rn → R egy val´ osz´ın˝ us´egi s˝ ur˝ us´egf¨ uggv´eny, azaz Z n f (x) ≥ 0 x ∈ R ´es f = 1. Rn
A fenti p´eld´akban a 1.1 defin´ıci´onak megfelel˝o h´armast adtunk meg, ami a 2. p´elda kapcs´an egyszer˝ uen ellen˝or´ızhet˝o, az 1. p´elda pedig ennek speci´alis esete a pk =
1 n
k = 1, 2, . . . n
val´osz´ın˝ us´egeloszl´assal. A 4. p´elda az A. f¨ uggel´ek egyik p´eld´aja m´ert´ek megad´as´ara, ´es a 3. p´elda l´enyeg´eben az el˝obbi speci´alis esete az 1 ha x ∈ Ω <Ω m´ert´eke> f (x) = 0 egy´ebk´ent val´osz´ın˝ us´egi s˝ ur˝ us´egf¨ uggv´eny v´alaszt´as´aval.
1.2.
Nevezetes v´ eletlen k´ıs´ erletek
Az al´abbiakban felsorolunk n´eh´any nevezetes v´eletlen jelens´eget, megfogalmazzuk a vel¨ uk kapcsolatos val´osz´ın˝ us´egi modellt, ´es megadjuk esem´enyek val´osz´ın˝ us´egeit. Ezek a val´osz´ın˝ us´egi mez˝ok a fenti p´eld´ak konkr´et esetei lesznek, ez´ert mind´ıg csak az Ω esem´enyteret ´es a megfelel˝o diszkr´et val´osz´ın˝ us´egeloszl´ast, illetve val´osz´ın˝ us´egi s˝ ur˝ us´egf¨ uggv´enyt adjuk meg. (1) Visszatev´ es n´ elk¨ uli mintav´ etel Egy N ∈ N+ elemsz´ am´ u halmaz elemei k¨ oz¨ ott M ≤ N sz´ am´ u megjel¨ olt van. V´eletlenszer˝ uen kiv´ alasztva n ≤ N sz´ am´ ut, mennyi annak val´ osz´ın˝ us´ege, hogy k sz´ am´ u megjel¨ olt van a kiv´ alasztottak k¨ oz¨ ott, azaz a mint´aban? Legyen • Ω az N elem n-ed oszt´aly´ u ism´etl´es n´elk¨ uli kombin´aci´oinak CNn = sz´am´ u halmaza, • minden kombin´aci´o egyform´an val´osz´ın˝ u,
N n
elem-
• Ak – esem´eny (azon kombin´aci´ok halmaza). amikor a kiv´alasztottak k¨oz¨ott k-sz´am´ u megjel¨olt van, k = 0, 1, 2, . . . n. K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
´ ´ 1. FEJEZET. VELETLEN JELENSEGEK MATEMATIKAI MODELLJE
8
Haszn´aljuk a tov´abbiakban az a = 0 ha a < b ∈ N b ´ertelmez´est, amivel Ak elemsz´ama M N −M · , k n−k teh´at P (Ak ) =
M k
·
N −M n−k N n
k = 0, 1, 2, . . . n.
(1.1)
Mivel az Ak k = 0, 1, 2, . . . n esem´enyek p´aronk´ent kiz´ar´oak, ´es Ω = ∪nk=0 Ak , teljes¨ ul n X
P (Ak ) = 1
k=0
vagyis (1.1) egy diszkr´et val´osz´ın˝ us´egeloszl´as, amit hipergeometriai eloszl´ asnak nevez¨ unk. (2) Visszatev´ eses mintav´ etel Egy N ∈ N+ elemsz´ am´ u halmaz elemei k¨ oz¨ ott M ≤ N sz´ am´ u megjel¨ olt van. V´eletlenszer˝ uen kiv´ alasztva n ≤ N sz´ am´ ut egym´ as ut´ an a kiv´ alasztottak visszatev´es´evel, mennyi annak val´ osz´ın˝ us´ege, hogy k sz´ am´ u megjel¨ olt van a mint´ aban? Legyen • Ω az N elem n-ed oszt´aly´ u ism´etl´eses vari´aci´oinak VNn,i = N n elemsz´am´ u halmaza, • minden vari´aci´o egyform´an val´osz´ın˝ u,
• Ak – esem´eny (azon vari´aci´ok halmaza), amikor a v´alasztottak k¨oz¨ott k-sz´am´ u megjel¨olt van, k = 0, 1, 2, . . . n.
Mivel Ak elemsz´ama
ap=
M N
n · M k · (N − M )n−k , k
jel¨ol´est bevezetve kapjuk: n · pk · (1 − p)n−k P (Ak ) = k
k = 0, 1, 2, . . . n.
(1.2)
Az Ak k = 0, 1, 2, . . . n esem´enyek most is p´aronk´ent kiz´ar´oak, ´es Ω = ∪nk=0 Ak , teh´at n X P (Ak ) = 1 k=0
vagyis (1.2) egy diszkr´et val´osz´ın˝ us´egeloszl´as, amit binomi´ alis eloszl´ asnak nevez¨ unk.
´ ´ 1.2. NEVEZETES VELETLEN K´ISERLETEK
9
(3) Bernoulli k´ıs´ erlet Egy p ∈ [0; 1] val´ osz´ın˝ us´eg˝ u esem´eny n-ism´etelt megfigyel´ese eset´en mennyi annak val´ osz´ın˝ us´ege, hogy a figyelt esem´eny k-szor k¨ ovetkezik be? Vegy¨ uk ´eszre, hogy a visszatev´eses mintav´eteltben egy p = M val´osz´ın˝ us´eg˝ u eseN m´enyt figyel¨ unk meg n-szer, ´es Ak ´eppen azt jelenti, hogy k-szor k¨ovetkezik be a figyelt esem´eny, azaz a megjel¨olt v´alaszt´asa. Teh´at v´alaszthatjuk • Ω = {0, 1, 2, . . . , n} • pk = nk · pk · (1 − p)n−k
k = 0, 1, 2, . . . n.
Ezek a p´eld´ak a v´eletlen jelens´egekr˝ol szerezhet˝o tapasztalatok leggyakoribb forr´asait modellezik. Az ism´etelt megfigyel´esb˝ol szerezhet˝o tapasztalataink szerint egy esem´eny bek¨ovetkez´eseinek relat´ıv gyakoris´aga a v´elelmezett val´osz´ın˝ us´eg egyfajta k¨ozel´ıt´ese. Ezt igazolni l´atszik az a k¨onnyen ellen˝or´ızhet˝o k¨or¨ ulm´eny is, hogy a hipergeometriai ´es binomi´alis eloszl´asok legnagyobb val´osz´ın˝ us´egei az np ´ert´ekhez legk¨ozelebbi eg´eszek egyike lesz. Teh´at az np ´ert´ek mint ”´atlagos” illetve ”legval´osz´ın˝ ubb” gyakoris´ag ´ertelmezhet˝o. Ezzel a fogalommal lehet˝ov´e v´alik olyan jelens´egek modellez´ese, ahol a megfigyel´esek n sz´ama igen nagy, ´es a p bek¨ovetkez´esi val´osz´ın˝ us´eg nagyon kicsi, de az ”´atlagos” gyakoris´ag megadhat´o mint egy 0 < λ mennyis´eg. L´etezik ugyanis a k¨ovetkez˝o hat´ar´ert´ek n λk −λ n−k k lim · p · (1 − p) = ·e k = 0, 1, 2, . . . (1.3) n→∞ k k! np=λ ´es
∞ X λk k=0
k!
· e−λ = 1,
teh´at (1.3) egy diszkr´et val´osz´ın˝ us´egeloszl´ast, az un. Poisson eloszl´ ast hat´aroz meg, amivel megfogalmazhatjuk a k¨ovetkez˝o v´eletlen k´ıs´erletet. (4) V´ eletlen esem´ enysz´ am Egy a ´tlagosan λ-szor bek¨ ovetkez˝ o esem´eny v´eletlen sz´ am´ u bek¨ ovetkez´es´enek megfigyel´ese. Legyenek • Ω=N • pk =
λk k!
· e−λ
k∈N.
Ha ez ut´obbi k´ıs´erletet olyan esetben fogalmazzuk meg, amikor egy esem´eny bek¨ovetkez´ese egy berendez´es meghib´asod´as´at jelenti, ´es λ az id˝oegys´egre jut´o meghib´asod´asok a´tlagos sz´ama, akkor t-id˝otartam´ u meghib´asod´as mentes m˝ uk¨od´es val´osz´ın˝ us´ege: Z ∞ p0 = e−λt = λ · e−λt dt , t
K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
´ ´ 1. FEJEZET. VELETLEN JELENSEGEK MATEMATIKAI MODELLJE
10 ahol
f (t) =
λ · e−λt ha 0 ≤ t 0 egy´ebk´ent
egy un. exponenci´ alis val´osz´ın˝ us´egi s˝ ur˝ us´egf¨ uggv´eny. Megfogalmazhatjuk teh´at a k¨ovetkez˝o v´eletlen k´ıs´erletet, melynek modellje egy folytonos val´osz´ın˝ us´egi mez˝o. (5) V´ eletlen id˝ otartam u v´eletlen id˝ otartam megfigyel´ese eset´en, adjuk meg egy Egy a ´tlagosan T = λ1 idej˝ t-n´el hosszabb id˝ otartam bek¨ ovetkez´es´enek val´ osz´ın˝ us´eg´et! Legyenek • Ω = R+
• f (t) = λ · e−λt
• At = [t; +∞[
t ∈ R+
a 0 < t-n´el hosszabb id˝otartam megfigyel´es´enek esem´enye,
akkor P (At ) = e
−λt
=
Z
∞ t
λ · e−λt dt t > 0 .
(1.4)
Vizsg´aljuk a k¨ovetkez˝o k´ıs´erletet: egy lejt˝on az al´abbi m´odon helyez¨ unk el ´ekeket 2n sz´am´ u sorban, ´es egy goly´ot legur´ıtunk u ´ gy, hogy az minden soron a´thaladva, ´es egy ´ekn´el v´eletlenszer˝ uen ir´anyt v´altoztatva ´erkezik le a k = −n, −(n−1), . . . , −1, 0, 1, . . . , (n−1), n helyek valamelyik´ere.
−n
.. . 4
4 ···
4 .. . 4
4 4 0
4 .. . 4
4 ···
.. . 4
1. sor 2. sor 3. sor .. . 2n. sor n ´erkez´esi helyek
A k helyre ´erkez´es pontosan akkor k¨ovetkezik be, ha a goly´o 2n sz´am´ u u ¨ tk¨oz´esb˝ol n − k sz´am´ uszor fog jobbra gurulni, ´es feltehetj¨ uk a jobbra ´es balra halad´as egyforma val´osz´ın˝ us´eg´et. Teh´at a Bernoulli k´es´erlet szerint a k helyre ´erkez´es val´osz´ın˝ us´ege: 2n 1 pk = · 2n k = 0, ±1, ±2, . . . , ±n . n−k 2 Ha a sorok sz´am´at n¨ovelj¨ uk, de egyben a m´eretek cs¨okkent´es´evel el´erj¨ uk, hogy a le´erkez´esi 1 helyek egym´as k¨ozti t´avols´aga cs¨okkenjen, ´es ´eppen √n legyen, az x = √kn r¨ogz´ıtett helyre ´erkez´es val´osz´ın˝ us´eg´ere nyerj¨ uk a k¨ovetkez˝o hat´ar´ert´eket: lim n→∞
x= √k n
√
1 2 n · pk = √ · e−x π
x∈R.
(1.5)
´ ´ 1.2. NEVEZETES VELETLEN K´ISERLETEK
Ezt felhaszn´alva, el´eg nagy t´abla eset´en, k´et x1 = esem´eny´enek val´osz´ın˝ us´eg´ere kapjuk:
P A[x1 ;x2 ] = ahol xk =
√k n
l2 X
k=l1
11 l1 √ n
< x2 =
l2 √ n
hely k¨oz´e ´erkez´es A[x1 ;x2 ]
Z x2 l2 X 1 1 1 2 −x2k √ ·e √ · e−x dx ·√ ≈ pk ≈ π n π x1 k=l 1
k = l1 , · · · , l2 . Teh´at egy folytonos val´osz´ın˝ us´egi modellt kapunk az 1 2 f (x) = √ · e−x π
x∈R
s˝ ur˝ us´egf¨ uggv´ennyel. Ennek egyszer˝ u transzform´altjak´ent kaphat´o f (x) = √
(x−m)2 1 · e− 2σ2 2π · σ
x∈R
(1.6)
az un. Gauss, vagy norm´ alis val´osz´ın˝ us´egi s˝ ur˝ us´egf¨ uggv´eny a´ltal´anos alakja, ahol m ∈ R ´es σ > 0. Mindezek alapj´an megfogalmazhatjuk sok v´eletlen elt´er´es o¨sszeg´enek, mint pl. egy m´er´es v´eletlen eredm´eny´enek modellj´et. (6) M´ er´ esi eredm´ eny Sok kicsiny elt´er´es o ¨sszegek´ent nyerhet˝ o v´eletlen ´ert´ek megfigyel´ese. Legyenek • Ω=R • f (x) =
√1 2π·σ
· e−
(x−m)2 2σ 2
x∈R
ahol az f norm´alis s˝ ur˝ us´egf¨ uggv´eny alakja miatt, m a hiba mentes, igazi ´ert´ek, σ > 0 pedig a pontoss´ag egyfajta m´ert´ekek´ent ´ertelmezhet˝o. Egy [x1 ; x2 ] intervallumba es˝o ´ert´ek megfigyel´es´enek val´osz´ın˝ us´ege Z x2 (x−m)2 1 √ P ([x1 ; x2 ]) = · e− 2σ2 dx . (1.7) 2π · σ x1 (7) V´ eletlen pont v´ alaszt´ asa Egy [a; b] ⊂ R intervallumban v´ alasszunk tal´ alomra egy sz´ amot, adjuk meg annak val´ osz´ın˝ us´eg´et, hogy a pont egy [x; y] ⊂ [a; b] r´eszintervallumba esik! Legyenek
• Ω = [a; b] • f (x) =
1 b−a
x ∈ [a; b] ,
akkor egy [x1 ; x2 ] ⊂ [a; b] intervallumba es˝o ´ert´ek v´alaszt´as´anak val´osz´ın˝ us´ege Z x2 1 x2 − x 1 P ([x1 ; x2 ]) = = dx . (1.8) b−a x1 b − a K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
´ ´ 1. FEJEZET. VELETLEN JELENSEGEK MATEMATIKAI MODELLJE
12
1.3.
Feladatok
1. Legyenek A1 , A2 , . . . , An p´aronk´ent diszjukt halmazok, ´es Ω = ∪nk=1 Ak . Adjuk meg az ezeket tartalmaz´o legsz˝ ukebb esem´enyalgebr´at, ´es az ezen ´ertelmezhet˝o val´oszn´ın˝ us´egi m´ert´ekeket mi hat´arozza meg? 2. Legyenk A1 , A2 , . . . , An halmazok, ´es Ω = ∪nk=1 Ak , tov´abb´a teljes¨ ulj¨on
A∗1 ∩ A∗2 ∩ . . . ∩ A∗n 6= ∅ ahol A∗k vagy az Ak halmaz, vagy A¯k = Ω \ Ak k = 1, 2, . . . n. Adjuk meg az ezeket tartalmaz´o legsz˝ ukebb esem´enyalgebr´at, ´es mutassuk meg, hogy pontosan egy olyan val´osz´ın˝ us´egi m´ert´ek adhat´o meg ezen, hogy teljes¨ uljenek P
(A∗1
∩
A∗2
P (Ak ) = pk ∈ [0; 1] k = 1, 2, . . . n ∩ . . . ∩ A∗n ) = P (A∗1 ) · P (A∗2 ) · . . . · P (A∗n ) .
3. Adjuk meg a hipergeometriai, binomi´alis ´es Poisson eloszl´as legnagyobb val´osz´ın˝ us´eg´et! 4. Igazoljuk az (1.5) hat´ar´ert´eket az √ n! = αn · 2πn · nn · e−n
ahol
lim αn = 1
n→∞
Stirling formula seg´ıts´eg´evel! 5. Vizsg´aljuk az (1.6) f¨ uggv´eny menet´et, ´es mutassuk meg, hogy val´osz´ın˝ us´egi s˝ ur˝ us´egf¨ uggv´eny! 6. Sz´am´ıtsuk ki a LOTTO j´et´ek kapcs´an a k¨ ul¨onb¨oz˝o nyer˝o oszt´alyok val´osz´ın˝ us´egeit! 7. Egy jegyp´enzt´arban 500Ft-´ert lehet egy jegyet v´as´arolni. Ha 100 sorban´all´o mindegyike egy jegyet v´as´arol, ´es negyvenen ezressel, hatvanan pedig o¨tsz´azassal akarnak fizetni, mennyi annak val´osz´ın˝ us´ege, hogy a nyit´askor u ¨ res p´enzt´ar ellen´ere nem lesz fennakad´as? 8. Mi val´osz´ın˝ ubb: (a) egy kock´aval 4 dob´asb´ol legal´abb egyszer hatost dobni? (b) k´et kock´aval 24 dob´asb´ol legal´abb egyszer dupla hatost dobni? 9. n1 sz´am´ u 1-est ´es n2 sz´am´ u 0-´at v´eletlenszer˝ uen elrendezve, adjunk rekurz´ıv formul´at annak val´osz´ın˝ us´eg´ere, hogy a v´eletlen sorrendben az egyeseket o¨sszesen k = 0, 1, . . . , n1 · n2 sz´am´ u nulla el˝ozi meg! 10. Egy s´ıklapon egym´ast´ol d t´avols´agra p´arhuzamos vonalak vannak, ´es egy l < d hossz´ us´ag´ u t˝ ut ejt¨ unk tal´alomra a s´ıkra. Mennyi annak val´osz´ın˝ us´ege, hogy valamelyik vonalat metszi a t˝ u? 11. Egy r sugar´ u k¨orben tal´alomra v´alasztott h´ ur milyen val´osz´ın˝ us´eggel lesz r-n´el r¨ovidebb?
2. fejezet Felt´ eteles val´ osz´ın˝ us´ eg, f¨ uggetlens´ eg V´eletlen jelens´egek kapcs´an megfogalmazott valamely esem´eny bek¨ovetkez´ese eset´en, m´as esem´enyek bek¨ovetkez´es´enek es´ely´et sok esetben u ´ jra ´ert´ekelj¨ uk, ´es kev´esb´e vagy m´eg ink´abb val´osz´ın˝ unek v´elj¨ uk mint kor´abban. Mindezt annak megfelel˝oen tessz¨ uk, hogy a vizsg´alt esem´enyt alkot´o kimenetelek milyen m´ert´ekben ”t¨oltik” ki a bek¨ovetkezett esem´enyt. 2.1. Defin´ıci´ o. Legyenek A, B ∈ A esem´enyek, ´es P (B) > 0. Az A esem´eny B-re vonatkoz´o felt´eteles val´osz´ın˝ us´eg´enek nevezz¨ uk: P (A | B) =
P (A ∩ B) P (B)
Az ´ıgy defini´alt felt´eteles val´osz´ın˝ us´eget az A esem´eny (felt´etel n´elk¨ uli, abszulut, teljes) val´osz´ın˝ us´eg´evel o¨sszehasonl´ıtva, mondhatjuk: • P (A | B) > P (A) ⇒ B bek¨ovetkez´ese eset´en az A esem´eny bek¨ovetkez´ese val´osz´ın˝ ubb. • P (A | B) < P (A) ⇒ B bek¨ovetkez´ese eset´en az A esem´eny bek¨ovetkez´ese kev´esb´e val´osz´ın˝ u. • P (A | B) = P (A) ⇒ B bek¨ovetkez´ese nem befoly´asolja az A esem´eny bek¨ovetkez´esi es´ely´et, ´es ilyenkor ha m´eg P (A) > 0 is teljes¨ ul, kapjuk P (B | A) = P (B) ´es P (A ∩ B) = P (A) · P (B) . Teh´at ez ut´obbi esetben A bek¨ovetkez´ese sem befoly´asolja a B esem´eny bek¨ovetkez´esi es´ely´et, ami a k¨ovetkez˝o fogalom defin´ıci´oj´ahoz vezet. 2.2. Defin´ıci´ o. i) Az A, B ∈ A esem´enyeket f¨ uggetleneknek nevezz¨ uk, ha teljes¨ ul P (A ∩ B) = P (A) · P (B) . 13
´ ´ ´INUS ˝ EG, ´ FUGGETLENS ¨ ´ 2. FEJEZET. FELTETELES VALOSZ EG
14
ii) Az A1 , A2 , . . . ⊂ A esem´enyhalmazokat, vagy m´ask´eppen esem´enyrendszereket p´aronk´ent f¨ uggetleneknek nevezz¨ uk, ha A ∈ Ak
´es B ∈ Al f¨ uggetlenek k 6= l = 1, 2, . . . .
iii) Az A1 , A2 , . . . ⊂ A esem´enyrendszereket teljesen f¨ uggetleneknek nevezz¨ uk, ha A ki ∈ A ki
{k1 , k2 , . . . , kn } ⊂ N+
n ∈ N+
eset´en teljes¨ ul P (Ak1 ∩ Ak2 ∩ . . . ∩ Akn ) = P (Ak1 ) · P (Ak2 ) · . . . · P (Akn ) . A f¨ uggetlens´eg fogalma teh´at a felt´eteles val´osz´ın˝ us´eg ´ertelmez´es´enek egyszer˝ u k¨ovetkezm´enye. Ha az esem´enyrendszerek egyetlen esem´enyb˝ol a´llnak, az esem´enyeket mondjuk p´aronk´ent illetve teljesen f¨ uggetleneknek.
2.1.
A f¨ uggetlens´ eg tulajdons´ agai
A 2.2 defin´ıci´ob´ol k¨ovetkezik n´eh´any egyszer˝ u a´ll´ıt´as, megjegyz´es: 1. Ha esem´enyrendszerek teljesen f¨ uggetlenek, akkor p´aronk´ent is f¨ uggetlenek, ´es az A k1 ∩ A k2 ∩ . . . ∩ A kn
A l1 ∩ A l2 ∩ . . . ∩ A lm
esem´enyek f¨ uggetlenek, ahol Aki ∈ Aki {k1 , k2 , . . . , kn } ⊂ N+ n ∈ N+ Ali ∈ Ali {l1 , l2 , . . . , lm } ⊂ N+ m ∈ N+ ∅ = {k1 , k2 , . . . , kn } ∩ {l1 , l2 , . . . , lm } . A teljes f¨ uggetlens´eg teh´at azt jelenti, hogy az egyes esem´enyrendszerek esem´enyeinek egy¨ uttes bek¨ovetkez´ese f¨ uggetlen m´as, ugyancsak v´eges sok esem´enyrendszer esem´enyeinek egy¨ uttes bek¨ovetkez´es´et˝ol. Ez nem k¨ovetkezik a p´aronk´enti f¨ uggetlens´egb˝ol (l´asd 1. feladat). A tov´abbiakban, t¨obb esem´eny, esem´enyrendszer eset´en, a f¨ uggetlens´eg mind´ıg a teljes f¨ uggetlens´eget fogja jelenteni. 2. A lehetetlen illetve biztos esem´eny minden esem´enyt˝ol f¨ uggetlen, mivel A ∈ A eset´en P (A ∩ ∅) = 0 = P (A) · 0 , P (A ∩ Ω) = P (A) = P (A) · 1 .
¨ ´ TULAJDONSAGAI ´ 2.1. A FUGGETLENS EG
15
3. Ha A ´es B f¨ uggetlen esem´enyek, akkor A¯ ´es B,
¯ A ´es B,
A¯ ´es
¯ B
f¨ uggetlenek, mert pl. ¯ · P (B) . P (A¯ ∩ B) = P (B \ A) = P (B) − P (A) · P (B) = P (A) K¨ ovetkezm´ eny: F¨ uggetlen esem´enyrendszerek b˝ov´ıthet˝ok az esem´enyek komplementereivel, a p´aronk´enti illetve teljes f¨ uggetlens´eg megtart´as´aval. 4. V´eletlen k´ıs´erletek f¨ uggetlens´eg´et modellezhetj¨ uk val´osz´ın˝ us´egi mez˝ok szorzat m´ert´ekter´evel. Legyen (Ω1 , A1 , P1 ) ´es (Ω2 , A2 , P2 ) k´et val´osz´ın˝ us´egi mez˝o, akkor az (Ω, A, P ) szorzat m´ert´ekt´er (l´asd A. F¨ uggel´ek) egy val´osz´ın˝ us´egi mez˝o, ahol Ω = Ω 1 × Ω2 A = σ {A × B | A ∈ A1 , B ∈ A2 } P (A × B) = P1 (A) · P2 (B) A ∈ A1 , B ∈ A2 , ´es ebben az Ae1 = {A × Ω2 | A ∈ A1 } ⊂ A Ae2 = {Ω1 × B | B ∈ A2 } ⊂ A
esem´enyrendszerek f¨ uggetlenek. Hasonl´oan kapjuk t¨obb v´eletlen k´ıs´erlet teljesen f¨ uggetlen ”be´agyaz´as´at” a szorzat modellbe. A f¨ uggetlens´eg fogalm´aval a kor´abban m´ar eml´ıtett Bernoulli k´ıs´erlet u ´ jra megfogalmazhat´o, ´es u ´ jabb nevezetes v´eletlen k´ıs´erleteket vizsg´alhatunk. (3) Bernoulli k´ıs´ erlet Egy p ∈ [0; 1] val´ osz´ın˝ us´eg˝ u esem´enyt n-szer megfigyelve, mennyi annak val´ osz´ın˝ us´ege, hogy k-szor k¨ ovetkezik be? Legyenek a B1 , B2 , . . . , Bn esem´enyek f¨ uggetlenek, ´es P (Bi ) = p i = 1, 2, . . . , n. Jel¨olje tov´abb´a Ak esem´eny k-sz´am´ u bek¨ovetkez´es´et a B1 , B2 , . . . , Bn esem´enyek k¨oz¨ ul. Akkor ¯k+1 ∩ . . . ∩ B ¯n ∪ . . . Ak = B1 ∩ B 2 ∩ . . . ∩ B k ∩ B olyan nk -tag´ u diszjunkt u ´ ni´o, melynek minden tagja k-sz´am´ u B· ´es (n − k)-sz´am´ u ¯ B· esem´eny k¨oz¨os r´esze, ez´ert n · pk (1 − p)n−k k = 0, 1, 2, . . . n . P (Ak ) = k K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
´ ´ ´INUS ˝ EG, ´ FUGGETLENS ¨ ´ 2. FEJEZET. FELTETELES VALOSZ EG
16
(8) T¨ obb kimenetel˝ u k´ıs´ erlet ism´ etelt megfigyel´ ese Egy r kimenetel˝ u k´ıs´erletet n-szer megism´etelve, adjuk meg annak val´ osz´ın˝ us´eg´et, hogy az egyes kimenetelek k1 , k2 , . . . kr -szer k¨ ovetkeznek be, ha az egyes kimenetelek val´ osz´ın˝ us´egei a p1 , p2 , . . . , pr diszkr´et val´ osz´ın˝ us´egeloszl´ assal adottak! Legyenek a {Bi1 , Bi2 , . . . , Bir } ⊂ A i = 1, 2, . . . , n
teljes esem´enyrendszerek f¨ uggetlenek, ´es P (Bij ) = pi
i = 1, 2, . . . , n,
j = 1, 2, . . . , r .
Ekkor a vizsg´alt Ak1 ,k2 ,...,kr =
[
j1 ,j2 ,...,jn
esem´eny egy pontosan
n! k1 !·k2 !·...·kr !
n \
Biji
i=1
!
tag´ u diszjunkt u ´ ni´o, ahol j1 , j2 , . . . , jn
egy ism´etl´eses permut´aci´o k1 sz´am´ u 1-essel, k2 sz´am´ u 2-essel, . . . ´es kr sz´am´ u r-essel, ´ıgy a f¨ uggetlens´eget is haszn´alva, kapjuk n! · pk1 · pk22 · . . . pkr r (2.1) P (Ak1 ,k2 ,...,kr ) = k1 ! · k2 ! · . . . · kr ! 1 r X ha kj ∈ N j = 1, 2, . . . , n ´es kj = n . j=
Mivel (2.1) val´osz´ın˝ us´egeinek o¨sszege (a polinomi´alis t´etel szerint is) 1, ezt a val´osz´ın˝ us´egeloszl´ast polinomi´ alis eloszl´ asnak nevezz¨ uk.
(9) Esem´ eny megfigyel´ ese az els˝ o bek¨ ovetkez´ esig Egy p ∈]0; 1[ val´ osz´ın˝ us´eg˝ u esem´enyt figyel¨ unk meg az els˝ o bek¨ ovetkez´esig, adjuk meg annak val´ osz´ın˝ us´eg´et, hogy ez a k-adik kis´erletben t¨ ort´enik meg! Legyenek a B1 , B2 , . . . esem´enyek f¨ uggetlenek, ´es P (Bi ) = p i = 1, 2, . . .. Jel¨olje tov´abb´a a vizsg´aland´o esem´enyt ¯1 ∩ B ¯2 ∩ . . . ∩ B ¯k−1 ∩ Bk k = 1, 2, . . . Ak = B akkor a f¨ uggetlens´egb˝ol kapjuk:
P (Ak ) = p · (1 − p)k−1
k = 1, 2, . . .
(2.2)
ami az un. diszkr´et geometriai eloszl´ as, ugyanis konvergens geometriai sor o¨sszegek´ent kapjuk ∞ X p · (1 − p)k−1 = 1 . k=1
¯1 ∩ B ¯2 ∩ . . . = A1 ∪ A2 ∪ . . . esem´eny Ez egyben azt is jelenti, hogy az A∞ = B val´osz´ın˝ us´ege P (A∞ ) = 0 .
´ ´ ´INUS ˝ EG ´ TULAJDONSAGAI ´ 2.2. A FELTETELES VALOSZ
2.2.
17
A felt´ eteles val´ osz´ın˝ us´ eg tulajdons´ agai
Az al´abiakban felsoroljuk a felt´eteles val´osz´ın˝ us´eg n´eh´any egyszer˝ uen ellen˝or´ızhet˝o fontos tulajdons´ag´at, melyek indokolj´ak a fogalom ´ertelmez´es´et, ´es m´odszereket adnak bizonyos t´ıpus´ u probl´em´ak megold´as´ahoz. 1. Ha B, A ∈ A f¨ uggetlenek, ´es P (B) > 0, akkor P (A | B) = P (A) , teh´at a felt´etelt˝ol f¨ uggetlen esem´eny felt´eteles val´osz´ın˝ us´ege v´altozatlan. 2. Legyen P (B) > 0, ha B ⊂ A ∈ A akkor P (A | B) = 1, teh´at ha B maga ut´an vonja az A esem´enyt, annak erre vonatkoz´o val´osz´ın˝ us´ege 1. Ha pedig A, B ∈ A kiz´ar´oak, akkor P (A | B) = 0. 3. Ha B ∈ A egy r¨ogz´ıtett esem´eny, ´es P (B) > 0, akkor P (· | B) : A →R A 7→ P (A | B) val´osz´ın˝ us´egi m´ert´ek A-n.
K¨ ovetkezm´ eny: A val´osz´ın˝ us´egggel kapcsolatos ”sz´amol´asi szab´alyokat” a felt´eteles val´osz´ın˝ us´egre is alkalmazhatjuk, mint pl. • P (A¯ | B) = 1 − P (A | B)
• P (A1 \ A2 | B) = P (A1 | B) − P (A1 ∩ A2 | B)
• P (A1 ∪ A2 | B) = P (A1 | B) + P (A2 | B) − P (A1 ∩ A2 | B) .. .
4. Szorz´ asi szab´ aly Legyenek A1 , A2 , . . . , An ∈ A esem´enyek olyanok, hogy P (A1 ∩ A2 ∩ . . . ∩ An ) > 0, akkor P (A1 ∩ A2 ∩ . . . ∩ An ) = P (A1 ) · P (A2 | A1 ) · P (A3 | A1 ∩ A2 ) · . . . · P (An | A1 ∩ A2 ∩ . . . An−1 ) . 5. Teljes val´ osz´ın˝ us´ eg t´ etel Legyenek B1 , B2 , . . . , Bn ∈ A, Bk ∩ Bl = ∅ ha k 6= l = 1, 2, . . . , n ´es ∪nk=1 Bk = Ω, vagyis egy un. teljes esm´enyrendszer, tov´abb´a A ∈ A, akkor P (A) =
n X k=1
P (A | Bk ) · P (Bk ) . K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
´ ´ ´INUS ˝ EG, ´ FUGGETLENS ¨ ´ 2. FEJEZET. FELTETELES VALOSZ EG
18 6. Bayes t´ etel
Legyen B1 , B2 , . . . , Bn ∈ A egy teljes esem´enyrendszer, A ∈ A ´es P (A) > 0, akkor
2.3.
P (A | Bl ) · P (Bl ) P (Bl | A) = Pn k=1 P (A | Bk ) · P (Bk )
l = 1, 2, . . . , n .
Bayes d¨ ont´ es
A felt´eteles val´osz´ın˝ us´eg seg´ıts´eg´evel megadhatjuk a k¨ovetkez˝o, un. d¨ont´esi feladat megold´as´at. Feladat: Legyenek (Ai )ni=1 ´es (Bj )m enyrendszerek, ´es P (Bj ) > 0 j = j=1 teljes esem´ 1, 2, . . . m. Keress¨ uk azt a d : {1, 2, . . . , m} → {1, 2, . . . , n} un. d¨ont´es f¨ uggv´enyt, mellyel a Hd =
m X j=1
A¯d(j) ∩ Bj
d¨ ont´esi hiba val´ osz´ın˝ us´ege a legkisebb. A d¨ont´esi hiba val´osz´ın˝ us´eg´et a´talak´ıtva kapjuk: P (Hd ) = 1 −
m X j=1
m X P Ad(j) | Bj · P (Bj ). P Ad(j) ∩ Bj = 1 − j=1
Ez pedig akkor maxim´alis, ha azt a d∗ d¨ont´esf¨ uggv´enyt v´alasztjuk, melyre teljes¨ ul P (Ad∗ (j) | Bj ) ≥ P (Ai | Bj ) i = 1, 2, . . . , n j = 1, 2, . . . , m , amit Bayes d¨ ont´esnek nevez¨ unk. Term´eszetesen d∗ nem egy´ertelm˝ uen adott, de minden Bayes d¨ont´es hibaval´osz´ın˝ us´ege ugyanaz. Egy m´asik lehets´eges d¨ont´esf¨ uggv´eny az a konstans dmax , melyre teljes¨ ul P (Admax ) = max {P (A1 ), P (A2 ), . . . , P (An )} amivel a d¨ont´es hib´aja P (Hdmax ) = 1 − P (Admax ) ≤ P (Hd∗ ) . K¨onnyen bel´athat´o, hogy a k´et teljes esem´enyrendszer f¨ uggetlens´ege eset´en d ∗ = dmax . Egy m´asik ”sz´els˝os´eges” eset, amikor minden Bj -hez van olyan Ai esem´eny, hogy Bj ⊂ Ai , vagyis az Ω esem´enyt´er (Bj )m asa finomabb, mint az (Ai )ni=1 feloszt´as, m´ask´eppen j=1 felosz´ fogalmazva minden Bj esem´eny maga ut´an vonja egy Ai esem´eny bek¨ovetkez´es´et. Ekkor d∗ (j) = i ha Bj ⊂ Ai amib˝ol k¨ovetkezik, hogy ilyenkorP (Hd∗ ) = 0.
19
2.4. FELADATOK
2.4.
Feladatok
1. V´alasszunk egy orig´o k¨oz´eppont´ u r sugar´ u k¨orben tal´alomra egy pontot, ´es jel¨olje • A – a pont az ”x” tengely f¨ol¨otti f´elk¨orbe esik;
• B – a pont az ”y” tengelyt˝ol jobbra es˝o f´elk¨orbe esik;
• C – a pont az els˝o, vagy a harmadik s´ıknegyedbe esik; Mutassuk meg, hogy az A, B ´es C esem´enyek p´aronk´ent f¨ uggetlenek, de nem teljesen! 2. Mutassuk meg, hogy ha Ω = I0 ×J0 ⊂ R2 intervallum, ´es a geometriai val´osz´ın˝ us´egsz´am´ıt´as modellj´et haszn´aljuk, akkor az Ix = {I × J0 | I ⊂ I0 intervallum} ´es Jy = {I0 × J | J ⊂ J0 intervallum} esem´enyrendszerek f¨ uggetlenek. 3. Bizony´ıtsuk a felt´eteles val´osz´ın˝ us´eg tulajdons´agait! 4. K´et c´ell¨ov˝o felv´altva l˝o, ´es az nyer, aki el˝osz¨or eltal´alja a c´elt. Ha feltessz¨ uk, hogy a c´el eltal´al´as´anak esem´enyei az egym´ast k¨ovet˝o l¨ov´esek sor´an teljesen f¨ uggetlenek, ´es az els˝onek l¨ov˝o eset´en 0.6, illetve a m´asodikn´al 0.8 a tal´alati val´osz´ın˝ us´eg, adjuk meg annak val´osz´ın˝ us´eg´et, hogy az els˝o, illetve a m´asodik l¨ov˝o nyer! 5. Egy kos´arlabda j´at´ekos egym´as ut´an v´egez b¨ untet˝o dob´asokat. Az els˝ot bedobja, a m´asodikat nem, ´es minden tov´abbi dob´asa akkora val´osz´ın˝ us´eggel lesz sikeres, mint amennyi a megel˝oz˝o dob´asokban a kosarak relat´ıv gyakoris´aga. Mennyi annak val´osz´ın˝ us´ege, hogy 100 dob´asb´ol pontosan 50 kosarat fog dobni? 6. Szinb´ad, a szult´annak tett szolg´alatai´ert, v´alaszthat egyet az N sz´am´ u h´aremh¨olgy k¨oz¨ ul u ´ gy, hogy az egyenk´ent el˝otte elvonul´o h¨olgyek valamelyik´ere r´amutat. Tegy¨ uk fel, hogy a h´aremh¨olgyek sz´eps´eg¨ uk szerint egy´ertelm˝ uen sorrendbe a´ll´ıthat´oak, ´es Szinb´ad strat´egi´aja a k¨ovetkez˝o: az els˝o n sz´am´ u h¨olgy szemrev´etele ut´an azt v´alasztja, aki szebb minden kor´abban l´atottn´al. Mennyi annak val´osz´ın˝ us´ege, hogy N Szinb´ad a legszebb h´aremh¨olgyet v´alasztja? Hogyan kell az n ´ert´ek´et megv´alasztani el´eg nagy N eset´en, hogy ez a val´osz´ın˝ us´eg a legnagyobb legyen? 7. K´et v´aros k¨oz¨otti t´av´ır´o o¨sszek¨ottet´es olyan, hogy a leadott t´av´ır´o jelek k¨oz¨ ul a 2 1 pontok 5 -e vonall´a torzul, a vonalak 3 -a pedig pontt´a. A leadott jelek k¨oz¨ ul a pontok ´es vonalak ar´anya 5 : 3. Adjunk d¨ont´esi szab´alyt a vev˝o sz´am´ara, mennyi a hib´as dek´odol´as val´osz´ın˝ us´ege?
K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
20
´ ´ ´INUS ˝ EG, ´ FUGGETLENS ¨ ´ 2. FEJEZET. FELTETELES VALOSZ EG
3. fejezet Val´ osz´ın˝ us´ egi v´ altoz´ ok Egy v´eletlen k´ıs´erlet eredm´eny´ehez sok esetben term´eszetes m´odon tartozik egy vagy t¨obb (v´eletlen) mennyis´eg. A matematikai modellben ennek megfelel˝o fogalom a k¨ovetkez˝o. 3.1. Defin´ıci´ o. i) Skal´ar val´osz´ın˝ us´egi v´altoz´onak (r¨oviden v.v.) nevezz¨ uk a ξ:Ω→R f¨ uggv´enyt, ha ∀x ∈ R eset´en {ξ < x} = {ω ∈ Ω | ξ(ω) < x} = ξ −1 (] − ∞, x[) ∈ A ; ii) Vektor val´osz´ın˝ us´egi v´altoz´onak (r¨oviden v.v.v.) nevezz¨ uk a ξ = (ξ 1 , ξ 2 , . . . , ξ n ) : Ω → Rn f¨ uggv´enyt, ha a ξ i : Ω → R i = 1, 2, . . . , n komponensek skal´ar val´osz´ın˝ us´egi v´altoz´ok. A tov´abbiakban a skal´ar ill. vektor jelz˝oket csak akkor haszn´aljuk, ha azt hangs´ ulyozni k´ıv´anjuk, egy´ebk´ent egyszer˝ uen val´osz´ın˝ us´egi v´altoz´or´ol, r¨oviden (v.)v.v.-r´ol besz´el¨ unk.
3.1.
Val´ osz´ın˝ us´ egi v´ altoz´ oval kapcsolatos esem´ enyek
Jel¨olj¨on a tov´abbiakban ξ egy skal´ar v.v.-t, ekkor a vele kapcsolatos esem´enyek az al´abbiak: 1. A defin´ıci´o szerint ∀x ∈ R eset´en {ξ < x} = {ω ∈ Ω | ξ(ω) < x} = ξ −1 (] − ∞, x[) ∈ A ; 21
´ ´INUS ˝ EGI ´ ´ ´ 3. FEJEZET. VALOSZ VALTOZ OK
22
2. Az esem´enyalgebra tulajdons´agaib´ol k¨ovetkeznek ∀x ≤ y ∈ R eset´en {ξ ≥ x} = {ω ∈ Ω | ξ(ω) ≥ x} = ξ −1 ([x, +∞[) = {ξ < x} ∈ A ; {x ≤ ξ < y} = {ω ∈ Ω | x ≤ ξ(ω) < y} = ξ −1 ([x, y[) = {ξ < y} \ {ξ < x} ∈ A ; ∞ T 1 −1 {ξ = x} = {ω ∈ Ω | ξ(ω) = x} = ξ ({x}) = ∈A; x≤ξ <x+ n n=1 {x ≤ ξ ≤ y} = {ω ∈ Ω | x ≤ ξ(ω) ≤ y} = ξ −1 ([x, y]) = = {x ≤ ξ < y} ∪ {ξ = y} ∈ A ; .. . teh´at a´ltal´aban I ⊂ R intervallum eset´en {ξ ∈ I} = {ω ∈ Ω | ξ(ω) ∈ I} = ξ −1 (I) ∈ A . Hasonl´oan ellen˝or´ızhet˝o, hogy egy ξ = (ξ 1 , ξ 2 , . . . , ξ n ) : Ω → Rn v.v.v. eset´en p´eld´aul {x1 ≤ ξ 1 < y1 , x2 ≤ ξ 2 < y2 , . . . , xn ≤ ξ n < yn } =
n \
i=1
{xi ≤ ξ i < yi } ∈ A
xi ≤ yi ∈ R i = 1, 2, . . . , n , vagy a´ltal´aban {ξ ∈ I} = {ω ∈ Ω | ξ(ω) ∈ I} = ξ −1 (I) ∈ A ∀I ⊂ Rn intervallum. Mindezekb˝ol (l´asd : A. f¨ uggel´ek) k¨ovetkeznek az al´abbiak: 3.2. K¨ ovetkezm´ eny. i) Egy ξ : Ω → Rn f¨ uggv´eny pontosan akkor (v.)v.v., ha m´erhet˝o az intervallumokat tartalmaz´o legsz˝ ukebb Bn σ-algebr´ara, azaz {ξ ∈ B} = {ω ∈ Ω | ξ(ω) ∈ B} = ξ −1 (B) ∈ A ∀B ∈ Bn . ii)
Aξ = ξ −1 (Bn ) = ξ −1 (B) | B ∈ Bn ⊂ A
egy esem´enyalgebra, amit a ξ (v.)v.v.-val kapcsolatos esem´enyek rendszer´enek nevez¨ unk. iii) A ξ (v.)v.v. egy Pξ : Bn → [0; 1] B 7→ P (ξ ∈ B)
val´osz´ın˝ us´egi m´ert´eket gener´al, amit ξ eloszl´as´anak nevez¨ unk. Ennek megfelel˝oen, val´osz´ın˝ us´egi v´altoz´okat akkor fogunk (p´aronk´ent, teljesen) f¨ uggetleneknek nevezni, ha a vel¨ uk kapcsolatos esem´enyrendszerek (esem´enyalgebr´ak) f¨ uggetlenek. Ezzel kapcsolatos a k¨ovetkez˝o t´etel.
´ ´INUS ˝ EGI ´ ´ ´ STRUKTUR ´ AJA ´ 3.2. VALOSZ VALTOZ OK
23
3.3. T´ etel. A ξ : Ω → Rp ´es η : Ω → Rq (v.)v.v.-k pontosan akkor f¨ uggetlenek, ha P ({ξ ∈ I} ∩ {η ∈ J}) = P (ξ ∈ I) · P (η ∈ J)
I ⊂ Rp , J ⊂ Rq intervallumok.
(3.1)
Bizony´ıt´ as. Az egyik ir´any nyilv´anval´o, teh´at tegy¨ uk fel, hogy (3.1) teljes¨ ul. Ekkor a Bp+q -n (ξ, η)-´altal gener´alt P(ξ,η) m´ert´ekre P(ξ,η) (I × J) = Pξ (I) · Pη (J)
I ⊂ I p , J ⊂ Iq ,
teh´at megegyezik a szorzatm´ert´ekkel az Ip+q f´elgy˝ ur˝ un, de akkor az egy´ertelm˝ u kiterjeszt´es miatt P(ξ,η) a szorzatm´ert´ek (l´asd: A. f¨ uggel´ek, A.3. t´etel), vagyis P(ξ,η) (A × B) = P ({ξ ∈ A} ∩ {η ∈ B}) = P (ξ ∈ A) · P (η ∈ B)
A ⊂ B p , B ⊂ Bq ,
amit bizony´ıtani kellett.
3.2.
Val´ osz´ın˝ us´ egi v´ altoz´ ok strukt´ ur´ aja
Az al´abbiakban o¨sszefoglaljuk a skal´ar v.v.-k (m´erhet˝o f¨ uggv´enyek, l´asd: A f¨ uggel´ek), k¨onnyen ellen˝or´ızhet˝o tulajdons´agait. 1. Egy A ∈ A esem´eny indik´ atora 1A (ω) =
1 ha ω ∈ A 0 ha ω ∈ A¯
val´osz´ın˝ us´egi v´altoz´o. Speci´alisan az 1Ω ≡ 1 iletve 1∅ ≡ 0 konstans f¨ uggv´enyek v.v.-k. 2. A skal´ar v.v.-k L halmaza vektorh´al´o, azaz ξ ∈ L, c ∈ R ⇒ c · ξ ∈ L ξ, η ∈ L ⇒ ξ + η ∈ L max{ξ, η}
min{ξ, η} ∈ L ,
amib˝ol k¨ovetkezik, hogy egy ξ v.v. ξ + = max{0, ξ} ξ − = − min{0, ξ} pozit´ıv ´es negat´ıv r´esze, ´es |ξ| = ξ + − ξ −
abszol´ ut ´ert´eke is val´osz´ın˝ us´egi v´altoz´o.
3. Egy v´eges ´ert´ekk´eszlet˝ u ξ : Ω → R f¨ uggv´eny pontosan akkor v.v., ha {ξ = x} ∈ A x ∈ im(ξ), ´es ekkor a ξ=
X
x∈im(ξ)
x · 1{ξ=x}
val´osz´ın˝ us´egi v´altoz´ot egyszer˝ u nek nevezz¨ uk. K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
´ ´INUS ˝ EGI ´ ´ ´ 3. FEJEZET. VALOSZ VALTOZ OK
24
4. A skal´ar v.v.-k L halmaza z´art a pontonk´enti limeszre, azaz ha ξ n ∈ L n = 1, 2, . . . ´es lim ξ n = ξ : Ω → R , n→∞
akkor ξ val´osz´ın˝ us´egi v´altoz´o. 5. Ha 0 ≤ ξ v.v., akkor megadhat´o egyszer˝ u v.v.-k (ξ n )∞ okken˝o n=1 monoton nem cs¨ sorozata, hogy Aξn ⊂ Aξ n = 1, 2, . . . ´es lim ξ n = ξ .
n→∞
(3.2)
6. Val´osz´ın˝ us´egi v´altoz´o m´erhet˝o f¨ uggv´enye is val´osz´ın˝ us´egi v´altoz´o, teh´at ha ξ : Ω → Rn (v.)v.v. ´es h : Rn → R m´erhet˝o, akkor h◦ξ :Ω→R val´osz´ın˝ us´egi v´altoz´o. Speci´alisan, ha h folytonos f¨ uggv´eny, akkor h◦ξ val´osz´ın˝ us´egi v´altoz´o.
3.3.
Val´ osz´ın˝ us´ egi v´ altoz´ ok eloszl´ asa
Egy ξ : Ω → Rn (v.)v.v. mind´ıg gener´al egy (Rn , Bn , Pξ ) val´osz´ın˝ us´egi mez˝ot, ahol a Pξ (B) = P ξ −1 (B) B ∈ Bn
val´osz´ın˝ us´egi m´ert´eket (vagy a gener´alt val´osz´ın˝ us´egi mez˝ot), amely az egys´egnyi val´osz´ın˝ un s´eget ”sz´etosztja” R m´erhet˝o halmazain, a ξ v.v. eloszl´ as´anak nevezz¨ uk. A ξ-t diszkr´et eloszl´ as´ u nak nevezz¨ uk, ha ez a m´ert´ek egy diszkr´et val´osz´ın˝ us´egeloszl´assal adott, vagyis X Pξ (B) = P (ξ = x) B ∈ Bn , x∈B
n
ahol a P (ξ = x) x ∈ R val´osz´ın˝ us´egek k¨oz¨ ul csak v´eges, vagy megsz´aml´alhat´oan v´egtelen sok k¨ ul¨onb¨ozik null´at´ol, ´es azok o¨sszege X P (ξ = x) = 1 . x∈Rn
A ξ-t folytonos eloszl´ as´ u nak nevezz¨ uk, ha ez a m´ert´ek egy val´osz´ın˝ us´egi s˝ ur˝ us´egf¨ uggv´ennyel adott, vagyis Z Pξ (B) = f B ∈ Bn , B
ahol f : Rn →
R+ 0
val´osz´ın˝ us´egi s˝ ur˝ us´egf¨ uggv´eny, azaz Z f =1. Rn
´ ´INUS ˝ EGI ´ ´ ´ ELOSZLASA ´ 3.3. VALOSZ VALTOZ OK
25
Ilyenkor f nulla m´ert´ek˝ u halmazon t¨ort´en˝o megv´altoztat´asa azonos eloszl´ast eredm´enyez, teh´at f megad´asa nulla m´ert´ek˝ u halmazt´ol eltekintve egy´ertelm˝ u. Eloszl´asok e k´et t´ıpusa azonban k¨ozel sem mer´ıti ki az o¨sszes lehet˝os´eget (l´asd pl. a ubben kezelhet˝ok, ´es az alkalma3. feladatban (ξ 1 , η) eloszl´asa), csup´an ezek a legegyszer˝ z´asokban is ilyenek fordulnak el˝o leggyakrabban. Mint k´es˝obb l´atni fogjuk, a Pξ m´ert´eket, vagyis ξ eloszl´as´at egy´ertelm˝ uen meghat´arozza a k¨ovetkez˝o fogalom. 3.4. Defin´ıci´ o. A ξ = (ξ 1 , ξ 2 , . . . , ξ n ) : Ω → Rn (v.)v.v. eloszl´asf¨ uggv´eny´enek nevezz¨ uk az F (x1 , x2 , . . . , xn ) = P (ξ 1 < x1 , ξ 2 < x2 , . . . , ξ n < xn )
(x1 , x2 , . . . , xn ) ∈ Rn
f¨ uggv´enyt. A defin´ıci´ob´ol ´es a val´osz´ın˝ us´egi m´ert´ek tulajdons´agaib´ol egyszer˝ uen k¨ovetkeznek az al´abbiak. Az eloszl´ asf¨ uggv´ eny tulajdons´ agai: 1. A ξ (v.)v.v. F eloszl´asf¨ uggv´enye korl´atos, im (F ) ⊂ [0; 1] . 2. Legyen a ξ v.v.v. eloszl´asf¨ uggv´enye F, akkor r¨ogz´ıtett (x 1 , . . . , xk−1 , xk+1 , . . . , xn ) ∈ n−1 R eset´en az F(k) = F (x1 , . . . , xk−1 , ·, xk+1 , . . . , xn ) : R → [0; 1] x 7→ F (x1 , . . . , xk−1 , x, xk+1 , . . . , xn ) parci´alis f¨ uggv´eny (a) monoton nem cs¨okken˝o, balr´ol minden¨ utt folytonos; (b) hat´ar´ert´eke a v´egtelenben: F(k) (−∞) = lim F(k) (x) = 0 x→−∞
´es F(k) (+∞) = lim F(k) (x) = x→+∞
= P ξ 1 < x1 , ξ 2 < x2 , . . . , ξ k−1 < xk−1 , ξ k+1 < xk+1 , . . . ξ n < xn vagyis F(k) (+∞) a ξ 1 , ξ 2 , . . . , ξ k−1 , ξ k+1 , . . . ξ n n − 1 dimenzi´os un. perem eloszl´asf¨ uggv´enye az (x1 , . . . , xk−1 , xk+1 , . . . , xn ) ∈ Rn−1 helyen. Speci´alisan, ha ξ skal´ar v.v., F monoton nem cs¨okken˝o, balr´ol folytonos, ´es lim F (x) = 0
x→−∞
lim F (x) = 1 .
x→+∞
K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
´ ´INUS ˝ EGI ´ ´ ´ 3. FEJEZET. VALOSZ VALTOZ OK
26
3. Legyen ξ skal´ar v.v., akkor a ξ-vel kapcsolatos esem´enyek val´osz´ın˝ us´egei x ≤ y ∈ R eset´en: P (ξ < x) = F (x) P (ξ ≥ x) = 1 − F (x) P (x ≤ ξ < y) = F (y) − F (x) P (ξ = x) = F (x + 0) − F (x) P (x ≤ ξ ≤ y) = F (y + 0) − F (x) P (x < ξ ≤ y) = F (y + 0) − F (x + 0) P (x < ξ < y) = F (y) − F (x + 0) ahol F (x + 0) = lim F (t), t→x+
vagy a´ltal´aban jel¨olj¨ uk mindezt az al´abbi m´odon: P (ξ ∈ I) = [F ]I
I ⊂ R intervallum.
Ha ξ vektor val´osz´ın˝ us´egi v´altoz´o, hasonl´oan kaphatjuk P (ξ ∈ I) = [F ]I
I ⊂ Rn intervallum .
Megjegyz´ es: Teh´at Pξ ´ert´eke az intervallumokon kifejezhet˝o az eloszl´asf¨ uggv´ennyel, azaz ξ eloszl´as´at meghat´arozza eloszl´asf¨ uggv´enye (l´asd: A. f¨ uggel´ek, A.3. t´etel). Ennek k¨ovetkezm´enye az, hogy egy v.v. ´ert´ek´et 0 val´osz´ın˝ us´eg˝ u esem´enyen tetsz˝olegesen m´odos´ıtva (vagy ak´ar meg sem adva), az eloszl´asf¨ uggv´eny v´altozatlan marad. A tov´abbiakban felsorolunk n´eh´any egyszer˝ uen ellen˝or´ızhet˝o, (feladatokban, alkalmaz´asokban) gyakran haszn´alt k¨ovetkezm´enyt. K¨ ovetkezm´ enyek: 1. Legyen a ξ : Ω → R skal´ar v.v. (a) diszkr´et eloszl´as´ u, akkor a diszkr´et eloszl´as val´osz´ın˝ us´egei P (ξ = x) = F (x + 0) − F (x) x ∈ R , ´es az eloszl´asf¨ uggv´eny F (x) =
X t<x
P (ξ = t) x ∈ R .
Egy I ⊂ R intervallum eset´en P (ξ ∈ I) =
X x∈I
P (ξ = x) .
´ ´INUS ˝ EGI ´ ´ ´ ELOSZLASA ´ 3.3. VALOSZ VALTOZ OK
27
(b) folytonos eloszl´as´ u, akkor val´osz´ın˝ us´egi s˝ ur˝ us´egf¨ uggv´enye f (x) = F 0 (x) x ∈ R ahol f folytonos, ´es az eloszl´asf¨ uggv´eny F (x) =
Z
x −∞
f (t)dt x ∈ R .
Egy I ⊂ R intervallum eset´en, ha belseje ]a; b[ Z P (ξ ∈ I) = f (t)dt = [F ]I = F (b) − F (a) . I
Mindez ξ : Ω → Rn v.v.v. eset´en az al´abbi o¨sszef¨ ugg´eseket jelenti: n
f (x1 , x2 , . . . , xn ) = ∂x ∂x∂ ...∂x F (x1 , x2 , . . . , xn ) n 1 2 (x1 , x2 , . . . , xn ) ∈ Rn ahol f folytonos, illetve F (x1 , x2 , . . . , xn ) =
R x1 R x2 −∞
−∞
...
´es egy I ⊂ Rn intervallum eset´en, P (ξ ∈ I) =
R xn
−∞
Z
I
f (t1 , t2 , . . . , tn )dt1 dt2 . . . dtn (x1 , x2 , . . . , xn ) ∈ Rn ,
f = [F ]I .
Megjegyz´ es. Egy ξ skal´ar v.v. eloszl´as´anak folytonos´aga egyszer˝ uen k¨ovetkezik, ha teljes¨ ul az al´abbi k´et felt´etel: • F folytonos f¨ uggv´eny; • F folytonosan differenci´alhat´o az ]an ; bn [ n = 1, 2, . . . , N ny´ılt intervallumokon, ahol a1 = −∞, a2 = b1 , a3 = b2 , · · · , aN = bN −1 , bN = +∞ . 2. Legyen a (ξ, η) : Ω → Rp+q v.v.v. (a) diszkr´et eloszl´as´ u, akkor ξ illetve η diszkr´et eloszl´as´ uak, ´es P (ξ = x) =
X y
P (η = y) =
X x
P (ξ = x, η = y) x ∈ Rp ; P (ξ = x, η = y) y ∈ Rq ; K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
´ ´INUS ˝ EGI ´ ´ ´ 3. FEJEZET. VALOSZ VALTOZ OK
28
(b) folytonos eloszl´as´ u f : Rp+q → R+ ur˝ us´egf¨ uggv´ennyel, akkor ξ illetve η 0 s˝ folytonos eloszl´as´ uak, ´es s˝ ur˝ us´egf¨ uggv´enyeik Z fξ (x) = f (x, y)dy x ∈ Rp ; q ZR fη (y) = f (x, y)dx y ∈ Rq ; Rp
Megjegyz´ es: Kaptuk teh´at, hogy diszkr´et illetve folytonos eloszl´as´ u v.v.v. peremeinek eloszl´asa ugyancsak diszkr´et illetve folytonos. A megford´ıt´as az els˝o esetben igaz, hiszen a peremek diszkr´et eloszl´asa miatt az egy¨ uttes eloszl´as m´ar legfeljebb megsz´aml´alhat´oan v´egtelen sok ´ert´ek-p´ar felv´etel´ehez o¨sszesen 1 val´osz´ın˝ us´eget rendel. A peremek folytonos eloszl´as´ab´ol azonban nem k¨ovetkezik az egy¨ uttes eloszl´as folytonoss´aga (l´asd 3. feladat). 3. A (ξ, η) : Ω → Rp+q v.v.v. ξ : Ω → Rp ´es η : Ω → Rq peremei pontosan akkor f¨ uggetlenek, ha a megfelel˝o eloszl´asf¨ uggv´enyekre teljes¨ ul F(ξ,η) (x, y) = Fξ (x) · Fη (y) x ∈ Rp
y ∈ Rq .
Ha (ξ, η) diszkr´et eloszl´as´ u, ez a felt´etel ekvivalens a P (ξ = x, η = y) = P (ξ = x) · P (η = y) x ∈ Rp
y ∈ Rq
teljes¨ ul´es´evel, ´es ha (ξ, η) folytonos eloszl´as´ u, a felt´etel f (x, y) = fξ (x) · fη (y) x ∈ Rp
y ∈ Rq
alakban ´ırhat´o a megfelel˝o s˝ ur˝ us´egf¨ uggv´enyek alkalmas v´alaszt´as´aval. 4. Val´osz´ın˝ us´egi v´altoz´o konstru´al´asa adott eloszl´assal: (a) Legyen (pn )n=1,2,... egy diszkr´et val´osz´ın˝ us´egeloszl´as, ´es {x1 , x2 , . . .} ⊂ Rp , akkor az Ω = Rp A = Bp X P (B) = pn xn ∈B
B∈A
val´osz´ın˝ us´egi mez˝on ´ertelmezett ξ = idRp v.v. diszkr´et eloszl´as´ u, ´es eloszl´asa: pn ha x = xn n = 1, 2, . . . P (ξ = x) = . 0 egy´ebk´ent
´ ´INUS ˝ EGI ´ ´ ´ ELOSZLASA ´ 3.3. VALOSZ VALTOZ OK
29
(b) Legyen f : Rp → R egy val´osz´ın˝ us´egi s˝ ur˝ us´egf¨ uggv´eny, akkor az Ω = Rp A = Bp Z P (B) = f B
B∈A
val´osz´ın˝ us´egi mez˝on ´ertelmezett ξ = idRp v.v. folytonos eloszl´as´ u, ´es s˝ ur˝ us´egf¨ uggv´enye: f : Rp → R . (c) Legyen a ξ : Ω → R v.v. F eloszl´asf¨ uggv´enye folytonos, akkor az η = F (ξ) v.v. eloszl´asf¨ uggv´enye 0 ha x ≤ 0 x ha 0 < x ≤ 1 . Fη (x) = (3.3) 1 ha 1 < x
Megjegyz´ es: Az ilyen eloszl´as´ u η v.v.-t (pontosabban megfigyelt ´ert´ek´et) v´eletlen sz´ amnak nevezz¨ uk, a megfigyelt ´ert´eket szolg´altat´o k´ıs´erlet illetve elj´ar´as pedig az un.v´eletlen sz´am gener´ ator. A v´eletlen sz´am gener´atorok n´elk¨ ul¨ozhetetlenek v´eletlen jelens´egek szimul´aci´oj´ahoz, seg´ıts´eg¨ ukkel kaphatunk k´ıv´ant eloszl´as´ u v´eletlen mennyis´egeket: i. Ha F folytonos ´es invert´alhat´o eloszl´asf¨ uggv´eny, akkor az η v´eletlen sz´am seg´ıts´eg´evel kaphatunk F eloszl´asf¨ uggv´eny˝ u ξ = F −1 (η) val´osz´ın˝ us´egi v´altoz´ot. Ez a m´odszer esetenk´ent id˝oig´enyes lehet az inverz f¨ uggv´eny megad´asa miatt, ez´ert ilyenkor hat´ekonyabb (gyorsabb) elj´ar´asokat haszn´alnak (l´asd: 10. feladat). ii. Ha p1 , p2 , p3 , · · · egy diszkr´et val´osz´ın˝ us´egeloszl´as ´es {x1 , x2 , x3 , · · · } ⊂ R, akkor a ξ = x1 · 1{η≤p1 } + x2 · 1{p1 <η≤p1 +p2 } + x3 · 1{p1 +p2 <η≤p1 +p2 +p3 } + · · · v.v. eloszl´asa P (ξ = xk ) = pk
k = 1, 2, · · · .
5. Val´osz´ın˝ us´egi v´altoz´o f¨ uggv´eny´enek eloszl´asa: Legyen ξ : Ω → Rp v.v.v. (a) diszkr´et eloszl´as´ u, ´es h : Rp → Rq , akkor η = h ◦ ξ : Ω → Rq diszkr´et eloszl´as´ u v.v., ´es X P (η = y) = P (ξ = x) y ∈ Rq . (3.4) {x∈Rp |h(x)=y}
K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
´ ´INUS ˝ EGI ´ ´ ´ 3. FEJEZET. VALOSZ VALTOZ OK
30
(b) folytonos eloszl´as´ u f : Rp → R s˝ ur˝ us´egf¨ uggv´ennyel, h : Rp → Rp invert´alhat´o, ´es h−1 folytonosan differenci´alhat´o f¨ uggv´eny, akkor η = h ◦ ξ : Ω → Rp v.v.v. eloszl´asa folytonos, ´es s˝ ur˝ us´egf¨ uggv´enye ∂ −1 fη (y) = det h (y) · f h−1 (y) y ∈ Rp . (3.5) ∂y
K¨ ovetkezm´ eny: Ha a (ξ, η) : Ω → R val´osz´ın˝ us´egi v´altoz´o
(a) diszkr´et eloszl´as´ u, akkor ξ + η eloszl´asa is diszkr´et, ´es P P P (ξ + η = x) = z P (ξ = x − z, η = z) = z P (ξ = z, η = x − z) x∈R, ´es ha m´eg f¨ uggetlenek is, akkor P P P (ξ + η = x) = z P (ξ = x − z) · P (η = z) = z P (ξ = z) · P (η = x − z) x∈R. (b) folytonos eloszl´as´ u f : R2 → R s˝ ur˝ us´egf¨ uggv´ennyel, akkor ξ + η eloszl´asa is folytonos, ´es s˝ ur˝ us´egf¨ uggv´enye Z +∞ Z +∞ fξ+η (x) = f (x − z, z)dz = f (z, x − z)dz x ∈ R , −∞
´es ha m´eg f¨ uggetlenek is, akkor Z +∞ Z fξ+η (x) = fξ (x − z) · fη (z)dz = −∞
−∞
+∞ −∞
fξ (z) · fη (x − z)dz
x∈R,
ahol fξ ´es fη a megfelel˝o peremek s˝ ur˝ us´egf¨ uggv´enyei.
3.4.
Nevezetes eloszl´ as´ u val´ osz´ın˝ us´ egi v´ altoz´ ok
A tov´abbiakban r¨oviden o¨sszefoglaljuk a m´ar kor´abban (azonos sorsz´ammal) felsorolt, nevezetes v´eletlen k´ıs´erletek kapcs´an megfogalmazhat´o val´osz´ın˝ us´egi v´altoz´o jellemz˝oit, ´es n´eh´any k¨onnyen ellen˝or´ızhet˝o tulajdons´ag´at. Az egyszer˝ ubb jel¨ol´es ´erdek´eben, diszkr´et eloszl´asok eset´en csak a pozit´ıv val´osz´ın˝ us´egeket soroljuk fel a megfelel˝o ´ert´ekekkel, ´es folytonos eloszl´as s˝ ur˝ us´egf¨ uggv´eny´et csak ott adjuk meg, ahol pozit´ıv ´ert´eket vesz fel. Tehetj¨ uk mindezt az´ert is, mert 0 vall´osz´ın˝ us´eg˝ u esem´enyen egy v.v. tetsz˝olegesen megv´altoztathat´o az eloszl´as v´altozatlans´aga mellett. (1) Visszatev´ es n´ elk¨ uli mintav´ etel Egy N ∈ N+ elemsz´ am´ u halmaz elemei k¨ oz¨ ott 0 < M < N sz´ am´ u megjel¨ olt van. V´eletlenszer˝ uen kiv´ alasztva n ≤ N sz´ am´ ut, jel¨ olje ξ a megjel¨ oltek sz´ am´ at a mint´ aban.
´ U ´ VALOSZ ´ ´INUS ˝ EGI ´ ´ ´ 3.4. NEVEZETES ELOSZLAS VALTOZ OK
31
Ekkor ξ diszkr´et eloszl´as´ u, ´es (1.1) szerint eloszl´asa hipergeometrikus : N −M M · n−k k P (ξ = k) = k = 0, 1, 2, . . . n, N n
jel¨ol´ese ξ ∈ Hyp(N, M, n). Vezess¨ uk be tov´abb´a a k¨ovetkez˝o esem´enyeket Ak – a k-adik kiv´alasztott a megjel¨oltek k¨oz¨ ul val´o k = 1, 2, . . . , n; akkor ξ = 1 A1 + 1 A2 + . . . + 1 An
(3.6)
ahol P (Ak ) =
M M (M − 1) = p P (Ak ∩ Al ) = N N (N − 1)
k 6= l = 1, 2, . . . , n.
Tulajdons´ agok: (a) A legval´osz´ın˝ ubb ´ert´ek, un. m´ odusz, az a legnagyobb k eg´esz, melyre teljes¨ ul (n + 1)
M +1 ≥k, N +2
´es ha itt egyenl˝os´eg teljes¨ ul, akkor P (ξ = k) = P (ξ = k − 1) .
a´lland´o, akkor (b) Ha ξ N ∈ Hyp(N, M, n) ´es p = M N n · pk · (1 − p)n−k lim P (ξ N = k) = N →∞ k p= M
k = 0, 1, 2, . . . n.
N
(2,3) Visszatev´ eses mintav´ etel, Bernoulli k´ıs´ erlet Egy 0 < p < 1 val´ osz´ın˝ us´eg˝ u esem´eny n-ism´etelt megfigyel´ese eset´en jel¨ olje a ξ v.v. a bek¨ ovetkez´esek sz´ am´ at. Ekkor ξ diszkr´et eloszl´as´ u, ´es (1.2) szerint eloszl´asa n-edrend˝ u p-param´eter˝ u binomi´alis eloszl´as : n P (ξ = k) = · pk · (1 − p)n−k k = 0, 1, 2, . . . n, k jel¨ol´ese ξ ∈ Bin(n; p). Vezess¨ uk be tov´abb´a a k¨ovetkez˝o (teljesen) f¨ uggetlen esem´enyeket Ak – a k-adik megfigyel´esben bek¨ovetkezik a figyelt esem´eny
k = 1, 2, . . . , n;
akkor ξ = 1 A1 + 1 A2 + . . . + 1 An
(3.7)
ahol P (Ak ) = p k = 1, 2, . . . , n. Tulajdons´ agok: K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
´ ´INUS ˝ EGI ´ ´ ´ 3. FEJEZET. VALOSZ VALTOZ OK
32
(a) Az eloszl´as m´odusza az a legnagyobb k eg´esz, melyre teljes¨ ul (n + 1) p ≥ k , ´es ha itt egyenl˝os´eg teljes¨ ul, akkor P (ξ = k) = P (ξ = k − 1) .
(b) Ha ξ 1 ∈ Bin(n1 ; p) ´es ξ 2 ∈ Bin(n2 ; p) f¨ uggetlenek, akkor ξ 1 + ξ 2 ∈ Bin(n1 + n2 ; p) . (c) Ha ξ n ∈ Bin(n; p) ´es np = λ a´lland´o, akkor lim P (ξ n = k) = n→∞ np=λ
λk −λ e k!
k = 0, 1, 2, . . . .
(4) V´ eletlen esem´ enysz´ am Egy a ´tlagosan 0 < λ-szor bek¨ ovetkez˝ o esem´eny bek¨ ovetkez´eseinek sz´ am´ at jel¨ olje a ξ v.v. Ekkor ξ diszkr´et eloszl´as´ u, ´es (1.3) szerint eloszl´asa λ-param´eter˝ u Poisson eloszl´as: P (ξ = k) =
λk −λ ·e k!
k ∈ N,
jel¨ol´ese ξ ∈ Po(λ).
Tulajdons´ agok:
(a) Az eloszl´as m´odusza az a legnagyobb k eg´esz, melyre λ ≥ k, ´es ha itt egyenl˝os´eg teljes¨ ul, akkor P (ξ = k) = P (ξ = k − 1) .
(b) Ha ξ 1 ∈ Po(λ) ´es ξ 2 ∈ Po(µ) f¨ uggetlenek, akkor
ξ 1 + ξ 2 ∈ Po(λ + µ) (5) V´ eletlen id˝ otartam Egy a ´tlagosan T = v´ altoz´ o.
1 λ
idej˝ u v´eletlen id˝ otartam ´ert´eke legyen a ξ val´ osz´ın˝ us´egi
Ekkor ξ folytonos eloszl´as´ u, ´es (1.4) szerint eloszl´asa λ-param´eter˝ u exponenci´alis eloszl´as, s˝ ur˝ us´egf¨ uggv´enye f (t) = λ · e−λt eloszl´asf¨ uggv´enye F (t) = jel¨ol´ese ξ ∈ Exp(λ).
Tulajdons´ agok:
t>0,
0 ha t ≤ 0 −λt 1−e ha 0 < t
,
´ U ´ VALOSZ ´ ´INUS ˝ EGI ´ ´ ´ 3.4. NEVEZETES ELOSZLAS VALTOZ OK
(a) Az eloszl´as un. medi´ anja, az F (t) =
1 2
T1 = 2
33
egyenlet megold´asa ln(2) , λ
ami olyan id˝otartamk´ent ´ertelmezhet˝o, mely alatt, sok ilyen v´eletlen id˝otartamnak a´tlagosan a fele ´er v´eget (felez´esi id˝ o ). (b) Egy folytonos eloszl´asf¨ uggv´eny˝ u ξ : Ω → R+ es csak akkor expo0 v.v. akkor ´ nenci´alis eloszl´as´ u, ha minden x, y > 0 eset´en teljes¨ ul: P (ξ > x + y | ξ > y) = P (ξ > x) . (c) Ha ξ ∈ Exp(λ), ´es c ∈ R+ , akkor c · ξ ∈ Exp( λc ). (6) M´ er´ esi eredm´ eny Sok (kis) elt´er´es o ¨sszegek´ent nyerhet˝ o v´eletlen ´ert´eket jel¨ olje a ξ val´ osz´ın˝ us´egi v´ altoz´ o. Ekkor ξ folytonos eloszl´as´ u, ´es (1.7) szerint eloszl´asa m ∈ R ´es σ > 0 param´eter˝ u norm´alis (vagy Gauss) eloszl´as, s˝ ur˝ us´egf¨ uggv´enye f (x) = √
(x−m)2 1 · e− 2σ2 2π · σ
eloszl´asf¨ uggv´enye F (x) = jel¨ol´ese ξ ∈ N (m; σ).
Z
x ∈ R,
x −∞
f (t)dt x ∈ R ,
Tulajdons´ agok:
(a) Ha m = 0 ´es σ = 1, standard norm´alis eloszl´asr´ol besz´el¨ unk, aminek s˝ ur˝ us´egf¨ uggv´enye x2 1 ϕ(x) = √ · e− 2 x ∈ R , 2π eloszl´asf¨ uggv´enye pedig Z x Φ(x) = ϕ(t)dt x ∈ R , −∞
amit t´abl´azat seg´ıts´eg´evel haszn´alhatunk (l´asd: B. f¨ uggel´ek). Mivel ϕ p´aros f¨ uggv´eny, teljes¨ ul Z ∞ Z −x Φ(−x) = ϕ(t)dt = ϕ(t)dt = 1 − Φ(x) x ∈ R , −∞
x
ez´ert a t´abl´azatok a´ltal´aban csak 0 ≤ x helyen adj´ak meg a Φ(x) f¨ uggv´eny´ert´eket. Ebb˝ol k¨ovetkezik, hogy a N (0; 1) eloszl´as medi´anja 0. K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
´ ´INUS ˝ EGI ´ ´ ´ 3. FEJEZET. VALOSZ VALTOZ OK
34
(b) Ha ξ ∈ N (m; σ), ´es a 6= 0, b ∈ R, akkor a · ξ + b ∈ N (a · m + b; |a| · σ) , teh´at a line´aris transzform´aci´o nem v´altoztat az eloszl´as norm´alis volt´an. Speci´alisan a ξ u.n. standardiz´ altja ξ−m ∈ N (0; 1) . σ (c) Ha ξ ∈ N (m; σ), akkor s¨ ur˝ us´egf¨ uggv´enye 1 x−m f (x) = ϕ σ σ eloszl´asf¨ uggv´enye F (x) = Φ medi´anja m.
x−m σ
x∈R,
x∈R,
(d) Ha ξ 1 ∈ N (m1 ; σ 1 ) ´es ξ 2 ∈ N (m2 ; σ 2 ) f¨ uggetlenek, akkor q 2 2 ξ 1 + ξ 2 ∈ N m1 + m 2 ; σ 1 + σ 2 (7) V´ eletlen pont v´ alaszt´ asa Egy [a; b] ⊂ R intervallumban v´ alasszunk tal´ alomra egy sz´ amot, jel¨ olje ezt a ξ val´ osz´ın˝ us´egi v´ altoz´ o. Ekkor ξ folytonos eloszl´as´ u, ´es (1.8) szerint az elosz´als´ u v.v., s˝ ur˝ us´egf¨ uggv´enye f (x) = eloszl´asf¨ uggv´enye F (x) = jel¨ol´ese ξ ∈ U (a; b).
1 b−a
0
x−a b−a
1
[a; b] intervallumon egyenletes
a<x
ha x ≤ a ha a < x ≤ b ha b < x
,
Tulajdons´ agok:
(a) Az eloszl´as medi´anja
a+b 2
.
(b) Ha ξ ∈ U (a; b) ´es 0 6= α, β ∈ R akkor U (αa + β; αb + β) ha α > 0 α·ξ+β ∈ U (αb + β; αa + β) ha α < 0
.
35
3.5. FELADATOK
(c) A m´ar eml´ıtett v´eletlen sz´amok eloszl´asa U (0; 1), ´es ha η ∈ U (0; 1) egy ilyen v´eletlen sz´am, akkor a + (b − a) · η ∈ U (a; b) . (9) Esem´ eny megfigyel´ ese az els˝ o bek¨ ovetkez´ esig Egy p ∈]0; 1[ val´ osz´ın˝ us´eg˝ u esem´enyt figyel¨ unk meg az els˝ o bek¨ ovetkez´esig. Jel¨ olje ξ az ennek a k´ıs´erletnek a sorsz´ am´ at! Ekkor (2.2) szerint P (ξ = k) = p · (1 − p)k−1
k = 1, 2, . . .
teh´at ξ eloszl´asa a diszkr´et geometriai eloszl´as, jel¨ol´ese ξ ∈ Geom(p).
3.5.
Feladatok
1. Mutassuk meg, hogy egy ξ skal´ar v.v. eloszl´asf¨ uggv´enye legfeljebb megsz´aml´alhat´oan sok pont kiv´etel´evel folytonos! 2. Kock´at dobunk k´etszer, ´es jel¨olje ξ az eredm´enyek minimum´at, η az eredm´enyek maximum´at. Adjuk meg ξ, η ´es (ξ, η) eloszl´as´at! F¨ uggetlenek-e ξ ´es η ? 3. V´alasszunk k´et v´eletlen pontot a [0; 1] intervallumban, jel¨olje ezeket ξ 1 ´es ξ 2 . Adjuk meg ξ 1 , ξ 2 ´es (ξ 1 , ξ 2 ) eloszl´as´at! Legyen tov´abb´a η = max{ξ 1 , ξ 2 }, adjuk meg (ξ 1 , η) eloszl´as´at! F¨ uggetlenek-e ξ 1 ´es ξ 2 , illetve ξ 1 ´es η ? 4. Egy egys´egnyi sugar´ u k¨orben tal´alomra v´alasztunk egy pontot. Jel¨olje a pont pol´arkoordin´at´ait (ρ, ϕ) , f¨ uggetlenek-e a ρ ´es ϕ v.v.-k? 5. Egy dobozban 5 db c´edula van, az 1,2,3,4 ´es 5 sz´amokkal. Tal´alomra kiv´alsztunk (visszatev´es n´elk¨ ul) h´armat, ´es jel¨olje a ξ v.v. a h´arom kiv´alsztott k¨oz¨ ul a legkisebbet. Adjuk meg ξ eloszl´as´at, sz´am´ıtsuk ki a P (2 ≤ ξ ≤ 4) val´osz´ın˝ us´eget! 6. Legyen a ξ v.v. s˝ ur˝ us´egf¨ uggv´enye c · cos(x) ha 0 ≤ x ≤ π2 f (x) = . 0 egy´ebk´ent Adjuk meg ξ eloszl´asf¨ uggv´eny´et, ´es a P (ξ 2 > 1) val´osz´ın˝ us´eget! 7. Legyenek ξ 1 , ξ 2 ∈ N (0, 1) f¨ uggetlen val´osz´ın˝ us´egi v´altoz´ok, adjuk meg η 1 = ξ 21
´es η 2 = ξ 21 + ξ 22
eloszl´as´at!. K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
´ ´INUS ˝ EGI ´ ´ ´ 3. FEJEZET. VALOSZ VALTOZ OK
36
8. Legyenek ξ, η ∈ N (0, 1) f¨ uggetlen val´osz´ın˝ us´egi v´altoz´ok, adjuk meg η=
ξ η
eloszl´as´at! 9. Legyen τ ∈ U (0; 1), ´es λ > 0, adjuk meg − λ1 ln(τ ) eloszl´as´at! 10. Legyenek ξ k ∈ U (a; b), η k ∈ U (c; d) k = 1, 2, . . . f¨ uggetlenek, f : [a; b] → [c; d] egy val´osz´ın˝ us´egi s˝ ur˝ us´egf¨ uggv´eny, ´es a ζ v.v. olyan hogy ζ = ξn
ha f (ξ n ) ≥ η n ´es
f (ξ k ) < η k
k = 1, 2, . . . , n − 1.
Adjuk meg ζ eloszl´as´at! 11. Legyenek a ξ ´es η f¨ uggetlen skal´ar val´osz´ın˝ us´egi v´altoz´ok, ´es eloszl´asf¨ uggv´enyeik folytonosak. Mutassuk meg, hogy P (ξ = η) = 0. 12. Ellen˝or´ızz¨ uk a nevezetes eloszl´asok tulajdons´agait!
4. fejezet V´ arhat´ o´ ert´ ek, sz´ or´ as V´eletlen mennyis´egek megfigyel´es´evel kapcsolatos tapasztalat, hogy a megfigyelt v´eletlen ´ert´ekek egy ”k¨oz´ep-´ert´ek” k¨or¨ ul ingadoznak valamilyen ”m´ert´ekben”. A tov´abbiakban egy ξ skal´ar v.v.-val kapcsolatban, ennek megfelel˝o fogalmakat vezet¨ unk be a matematikai modell¨ unkben.
4.1.
V´ arhat´ o´ ert´ ek
4.1. Defin´ıci´ o. i) A ξ ≥ 0 egyszer˝ u v.v., v´arhat´o ´ert´ek´enek nevezz¨ uk az X E(ξ) = x · P (ξ = x) x∈R
o¨sszeget, ahol az o¨sszegz´es a v´eges sok pozit´ıv tagra vonatkozik. ii) A ξ ≥ 0 v.v. v´arhat´o ´ert´ek´enek nevezz¨ uk az E(ξ) = lim E(ξ n ) n→∞
v´eges hat´ar´ert´eket, ha (ξ n )∞ ıv egyszer˝ u v.v.-k monoton nem cs¨okken˝o n=1 nemnegat´ sorozata, ´es limn→∞ ξ n = ξ. iii) A ξ skal´ar v.v. v´arhat´o ´ert´ek´enek nevezz¨ uk az E(ξ) = E(ξ + ) − E(ξ − ) k¨ ul¨onbs´eget, ha a ξ + = max{0, ξ} ´es ξ − = max{0, −ξ} nemnegat´ıv v.v.-k v´arhat´o ´ert´eke defini´alt. A v´arhat´o ´ert´ek egy´ertelm˝ uen meghat´arozott, mint a ξ : Ω → R f¨ uggv´eny P val´osz´ın˝ us´egi m´ert´ek szerinti Z ξdP
Ω
37
´ ´ ERT ´ EK, ´ SZOR ´ AS ´ 4. FEJEZET. VARHAT O
38
integr´alja, ha az v´eges ´ert´ek (l´asd: A f¨ uggel´ek). Teh´at, ha a ξ v.v.-nak defini´alt (l´etezik) a v´arhat´o ´ert´eke, azt ∃E(ξ) vagy ξ ∈ L1 jel¨oli a tov´abbiakban. A v´arhat´o ´ert´ek (mint egy v´eges m´ert´ek szerinti integr´al), teljes´ıti az al´abbi tulajdons´agokat (l´asd: A. F¨ uggel´ek). 1. Esem´ eny indik´ator´anak v´arhat´o ´ert´eke: Legyen A ∈ A, akkor
E(1A ) = P (A) .
Speci´alisan az 1Ω ≡ 1 illetve 1∅ ≡ 0 konstansok v´arhat´o ´ert´eke E(1Ω ) = E(1) = 1 E(1∅ ) = E(0) = 0 . 2. Nemnegat´ıv tulajdons´ag: Ha ξ ≥ 0 ´es ∃E(ξ), akkor E(ξ) ≥ 0 ´es E(ξ) = 0 ⇔ P (ξ = 0) = 1. 3. Homog´ en ´es addit´ıv tulajdons´ag: Ha ξ, η v.v.-k v´arhat´o ´ert´eke l´etezik, ´es c ∈ R, akkor l´etezik E(c · ξ) ´es E(ξ + η), tov´abb´a E(c · ξ) = c · E(ξ) E(ξ + η) = E(ξ) + E(η) . K¨ ovetkezm´ enyek: (a) (Monoton) Ha ξ ≤ η v.v.-k v´arhat´o ´ert´eke l´etezik, akkor E(ξ) ≤ E(η) ´es E(ξ) = E(η) ⇔ P (ξ = η) = 1. (b) (Konvex) Ha h : I → R konvex f¨ uggv´eny az I ⊂ R intervallumon, ´es ξ : Ω → I v.v., tov´abb´a l´etezik az E(h(ξ)), E(ξ) v´arhat´o ´ert´ek, akkor h (E(ξ)) ≤ E(h(ξ)) . (c) A ξ v.v. v´arhat´o ´ert´eke akkor ´es csak akkor l´etezik, ha ∃E(|ξ|), ´es ekkor |E(ξ)| ≤ E(|ξ|) . (d) A ξ v.v. v´arhat´o ´ert´eke akkor ´es csak akkor l´etezik, ha ∃η ∈ L 1 ´es |ξ| ≤ η, ´es ekkor |E(ξ)| ≤ E(|ξ|) ≤ E(η) .
´ ´ ERT ´ EK ´ 4.1. VARHAT O
39
4. Folytonoss´ ag: (a) Ha ξ n ∈ L1 n = 1, 2, . . . v.v.-k monoton nem cs¨okken˝o sorozata, ξ = lim ξ n : Ω → R, n→∞
´es (E(ξ n ))∞ atos sorozat, akkor l´etezik a ξ v.v. v´arhat´o ´ert´eke, ´es n=1 korl´ E(ξ) = lim E(ξ n ) . n→∞
(b) Ha ξ n : Ω → R
n = 1, 2, . . . v.v.-k konvergens sorozata, ξ = lim ξ n : Ω → R, n→∞
´es ζ ∈ L1 melyre |ξ n | ≤ ζ ´es
n = 1, 2, . . ., akkor l´etezik a ξ v.v. v´arhat´o ´ert´eke, E(ξ) = lim E(ξ n ) . n→∞
A k¨ovetkez˝o tulajdons´agok val´osz´ın˝ us´egsz´am´ıt´asi szempontok miatt lesznek fontosak sz´amunkra, illetve a m´ert´ekt´er v´eges (norm´alt) volt´ab´ol k¨ovetkeznek. 5. Konstans v´arhat´o ´ert´eke mind´ıg l´etezik, ´es E(c) = E(c · 1Ω ) = c · P (Ω) = c c ∈ R . 6. A v´arhat´o ´ert´ek a v´eletlen igadoz´as centruma: Ha ξ ∈ L1 , akkor
E (ξ − E(ξ)) = E(ξ) − E(ξ) = 0.
7. Ha α > 1 eset´en ξ α ∈ L1 , azaz ξ ∈ Lα , akkor |ξ| ≤ 1 + |ξ α | miatt k¨ovetkezik ξ ∈ L1 . Speci´alisan ha ξ ∈ L2 ⇒ ξ ∈ L1 , ahol L2 = ξ | ξ v.v., ´es ξ 2 ∈ L1 . 8. Ha ξ, η ∈ L2 , akkor ξ · η ∈ L1 ´es
|E(ξ · η)| ≤
q
E(ξ 2 ) ·
p E(η 2 ) ,
(4.1)
tov´abb´a egyenl˝os´eg pontosan akkor teljes¨ ul, ha van olyan x ∈ R, hogy P (ξ = x · η) = 1 vagy P (η = x · ξ) = 1 . Bizony´ıt´ as. Mivel |ξ · η| ≤ 12 ξ 2 + η 2 , l´etezik E(ξ · η) ´es az E (ξ − x · η)2 = E(η 2 )x2 − 2E(ξη)x + E(ξ 2 )
(4.2)
K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
´ ´ ERT ´ EK, ´ SZOR ´ AS ´ 4. FEJEZET. VARHAT O
40
v´arhat´o ´ert´ek minden x ∈ R eset´en. Ha E(η 2 ) = 0, akkor P (η = 0) = 1, ´es ´ıgy teljes¨ ul: q p 0 = |E(ξ · η)| = E(ξ 2 ) · E(η 2 ) = 0 P (η = 0 · ξ) = 1 . Ha E(η 2 ) > 0, akkor az el˝obbi (4.2) m´asodfok´ u f¨ uggv´eny diszkrimim´ans´ara 4E 2 (ξη) − 4E(ξ 2 )E(η 2 ) ≤ 0, amit bizony´ıtani kellett, tov´abb´a a diszkrimin´ans pontosan akkor z´erus, ha a (4.2) E(ξη) es ´ıgy m´asodfok´ u f¨ uggv´eny egyetlen z´erushelye x = E(η 2) , ´ P
E(ξη) η ξ− E(η 2 )
2
=0
!
=1.
9. A v´arhat´o ´ert´ek minimum tuljadons´aga: Ha ξ ∈ L2 akkor m ∈ R eset´en E (ξ − m)2 ≥ E (ξ − E(ξ))2 ,
´es ” = ” akkor ´es csak akkor teljes¨ ul, ha m = E(ξ).
Bizony´ıt´ as. Mivel E (ξ − m)2 = E ((ξ − E(ξ)) + (E(ξ) − m))2 = E (ξ − E(ξ))2 + (E(ξ) − m)2 k¨ovetkezik az a´ll´ıt´as.
A k¨ovetkez˝o t´etelben a v´arhat´o ´ert´ek kisz´am´ıt´asi ”szab´alyait” foglaljuk o¨ssze. 4.2. T´ etel (Kisz´ am´ıt´ asi formul´ ak). i) Legyen ξ : Ω → Rn v.v.v., h : Rn → R m´erhet˝o f¨ uggv´eny, akkor Z E(h ◦ ξ) = hdPξ , Rn
´es a v´arhat´o ´ert´ek pontosan akkor l´etezik, ha a h f¨ uggv´eny integr´alja az (R n , Bn , Pξ ) m´ert´ekt´eren l´etezik ´es v´eges. Speci´alisan, ha n = 1 ´es h : R → R x 7→ x , akkor Z +∞ E(ξ) = xdPξ (x). −∞
´ ´ ERT ´ EK ´ 4.1. VARHAT O
41
ii) Ha ξ : Ω → Rn v.v.v. diszkr´et eloszl´as´ u, h : Rn → R m´erhet˝o f¨ uggv´eny, akkor h ◦ ξ v´arhat´o ´ert´eke pontosan akkor l´etezik, ´es akkor X E(h ◦ ξ) = h(x)P (ξ = x) , x∈Rn
ha ez a sor abszoult konvergens (illetve v´eges o¨sszeg). Speci´alisan, ha n = 1 ´es h : R → R x 7→ x , akkor X E(ξ) = x · P (ξ = x), x∈R
felt´eve, hogy ez a sor abszolut konvergens. iii) Ha ξ : Ω → Rn v.v.v. folytonos eloszl´as´ u f : R n → R+ osz´ın˝ us´egi s˝ ur˝ us´egf¨ ugg0 val´ n v´ennyel, h : R → R m´erhet˝o f¨ uggv´eny, akkor h ◦ ξ v´arhat´o ´ert´eke pontosan akkor l´etezik, ´es akkor Z Z E(h ◦ ξ) = · · · h(x1 , x2 , · · · , xn ) · f (x1 , x2 , · · · , xn )dx1 dx2 · · · dxn Rn
ha az improprius integr´al abszolut konvergens (azaz a megfelel˝o Lebesgue integr´al l´etezik, ´es v´eges). Speci´alisan, ha n = 1 ´es h : R → R x 7→ x , akkor Z +∞ E(ξ) = x · f (x)dx, −∞
felt´eve, hogy ez az improprius integr´al abszolut konvergens. iv) Ha ξ, η ∈ L1 f¨ uggetlen v.v.-k, akkor ξ · η ∈ L1 ´es E(ξ · η) = E(ξ) · E(η) . Bizony´ıt´ as. Az i) eset az o¨sszetett f¨ uggv´eny integr´alj´anak kisz´am´ıt´asi szab´alya a bels˝o (ξ) f¨ uggv´eny a´ltal gener´alt (Pξ ) m´ert´ek szerinti integr´allal (l´asd A. F¨ uggel´ek). A ii) ´es iii) ennek speci´alis esete, figyelembe v´eve az integr´al kisz´am´ıt´as´at a megfelel˝o m´ert´ekek szerint. A iv) a´ll´ıt´ashoz legyen h(x, y) = x · y (x, y) ∈ R2 ,
´es P(ξ,η) a Pξ ´es Pη m´ert´ekek szorzatm´ert´eke. A szorzatm´ert´ek szerinti integr´al´as kisz´am´ıt´asi szab´aly´at (l´asd A. F¨ uggel´ek) haszn´alva, kapjuk: Z Z Z Z E(ξ) · E(η) = xdPξ · ydPη = x · ydPξ dPη = R R R R ZZ = x · ydP(ξ,η) = E(ξ · η) R×R
K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
´ ´ ERT ´ EK, ´ SZOR ´ AS ´ 4. FEJEZET. VARHAT O
42
4.2.
Sz´ or´ as
A v´arhat´o ´ert´ek minimum tulajdons´aga miatt, a v´eletlen mennyis´egek ingadoz´asi m´ert´ek´enek tekinthetj¨ uk a k¨ovetkez˝o fogalmat. 4.3. Defin´ıci´ o. A ξ skal´ar v.v. sz´or´as´anak nevezz¨ uk a q D(ξ) = E (ξ − E(ξ))2
mennyis´eget, felt´eve a megfelel˝o v´arhat´o ´ert´ekek l´etez´es´et. A defin´ıci´oban szerepl˝o v´arhat´o ´ert´ekek l´etez´es´ehez el´eg feltenni, hogy ξ ∈ L 2 , a kijel¨olt gy¨okvon´as mind´ıg elv´egezhet˝o a v´arhat´o ´ert´ek nemnegat´ıv tulajdons´aga miatt. A D 2 (ξ) mennyis´eget sz´ or´ asn´egyzetnek nevezz¨ uk. A sz´ or´ as tulajdons´ agai: (felt´eve a megfelel˝o v´arhat´o ´ert´ekek l´etez´es´et) 1. Kisz´am´ıt´asi formula: A v´arhat´o ´ert´ek tulajdons´agaib´ol, kapjuk D 2 (ξ) = E ξ 2 − 2E(ξ) · ξ + E 2 (ξ) = E(ξ 2 ) − E 2 (ξ) .
2. Nemnegat´ıvit´as:
A v´arhat´o ´ert´ek nemnegat´ıv tulajdons´ag´ab´ol D(ξ) ≥ 0 ´es D(ξ) = 0 ⇔ P (ξ = E(ξ)) = 1 . 3. Pozit´ıv homog´en: Ha ξ v.v., c ∈ R, akkor a defin´ıci´o alapj´an q D(c · ξ) = E (c · ξ − E(c · ξ))2 = |c| · D(ξ) .
4. F¨ uggetlen v.v.-k o¨sszeg´enek sz´or´asa:
Ha ξ ´es η v.v.-k f¨ uggetlenek, akkor a kisz´am´ıt´asi formul´ab´ol, felhaszn´alva E(ξη) = E(ξ) · E(η), kapjuk D 2 (ξ + η) = E(ξ 2 ) + E(η 2 ) − E 2 (ξ) − E 2 (η) = D 2 (ξ) + D 2 (η) .
K¨ ovetkezm´ eny: Mivel konstans v.v. f¨ uggetlen minden v.v.-t´ol (Ab·1Ω = {∅, Ω}), ´es sz´or´asa nulla, kapjuk D(aξ + b) = |a| D(ξ) a, b ∈ R . M´ar a v´arhat´o ´ert´ek kisz´am´ıt´asi formul´aib´ol l´attuk, hogy azt a v.v. eloszl´asa hat´arozza meg. Ennek megfelel˝oen a sz´or´as is az eloszl´assal adott, ez´ert az eloszl´as v´arhat´o ´ert´ek´er˝ol vagy sz´or´as´ar´ol besz´elhet¨ unk. Ha teh´at a ξ ´es η v.v.-k eloszl´asf¨ uggv´enye megegyezik (ha pl. P (ξ = η) = 1), akkor v´arhat´o ´ert´ekekeik illetve sz´or´asaik egyszerre l´eteznek, ´es ekkor E(ξ) = E(η) D(ξ) = D(η) .
´ ´ ´ ERT ´ EKE, ´ ´ ASA ´ 4.3. NEVEZETES ELOSZLASOK VARHAT O SZOR
4.3.
43
Nevezetes eloszl´ asok v´ arhat´ o´ ert´ eke, sz´ or´ asa
A tov´abbiakban kisz´am´ıtjuk a m´ar felsorolt nevezetes eloszl´asok v´arhat´o ´ert´ek´et ´es sz´or´as´at, felhaszn´alva a kisz´am´ıt´asi formul´akat ´es tulajdons´agokat. (1) Hipergeometrikus eloszl´ as A ξ ∈ Hyp(N, M, n) v.v. eloszl´asa: P (ξ = k) =
M k
Haszn´aljuk a (3.6) szerinti
·
N −M n−k N n
k = 0, 1, 2, . . . n.
ξ = 1 A1 + 1 A2 + . . . + 1 An felbont´ast, akkor kapjuk: E(ξ) = np = n
M . N
Tov´abb´a ξ 2 = 1 A1 + 1 A2 + . . . + 1 An +
X
i6=j=1,2,...,n
1Ai ∩Aj
miatt kapjuk E(ξ 2 ) = np + n(n − 1)
M (M − 1) , N (N − 1)
amib˝ol a sz´or´as ´ert´eke: D(ξ) =
s
n−1 np(1 − p) 1 − . N −1
(2,3) Binomi´ alis eloszl´ as A ξ ∈ Bin(n; p) v.v. eloszl´asa:
n P (ξ = k) = · p · (1 − p)n−k k
k = 0, 1, 2, . . . n .
Haszn´aljuk a (3.7) ξ = 1 A1 + 1 A2 + . . . + 1 An felbont´ast, ahol az o¨sszeadand´o indik´atorok most f¨ uggetlenek is, ez´ert kapjuk p E(ξ) = np D(ξ) = np(1 − p) . K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
´ ´ ERT ´ EK, ´ SZOR ´ AS ´ 4. FEJEZET. VARHAT O
44 (4) Poisson eloszl´ as A ξ ∈ Po(λ) v.v. eloszl´asa: P (ξ = k) =
λk −λ ·e k!
k ∈ N.
A megfelel˝o sorok o¨sszegz´es´evel kapjuk E(ξ) = λ D(ξ) =
√
λ.
(5) Exponenci´ alis eloszl´ as A ξ ∈ Exp(λ) v.v. s˝ ur˝ us´egf¨ uggv´enye: f (t) = λ · e−λt dt t > 0 . A megfelel˝o integr´alok kisz´am´ıt´as´aval kapjuk E(ξ) =
1 λ
D(ξ) =
1 . λ
(6) Norm´ alis eloszl´ as A ξ 0 ∈ N (0; 1) standard norm´alis eloszl´as´ u v.v. s˝ ur˝ us´egf¨ uggv´enye: x2 1 ϕ(x) = √ · e− 2 2π
x∈R.
A v´arhat´o ´ert´ek kisz´am´ıt´as´ahoz most az Z +∞ x2 1 x · √ · e− 2 dx 2π −∞ improprius integr´al abszolut konvergenci´aj´at kell ellen˝or´ızni, amihez sz´amoljuk ki az Z +∞ Z 0 2 x2 1 1 1 − x2 x · √ · e dx = − x · √ · e− 2 dx = √ 2π 2π 2π 0 −∞ konvergens integr´alokat, amib˝ol kapjuk E(ξ 0 ) = 0 . A sz´or´ast az
Z
+∞
x2 1 x2 · √ · e− 2 dx = 1 2π −∞ konvergens improprius integr´alt felhaszn´alva kapjuk
E(ξ 20 )
=
D(ξ 0 ) = 1 . Mivel ξ = σξ 0 + m ∈ N (m; σ), kapjuk tetsz˝oleges norm´alis eloszl´as v´arhat´o ´ert´ek´et ´es sz´or´as´at E(ξ) = m D(ξ) = σ .
45
4.4. MOMENTUMOK, KOVARIANCIA
(7) Egyenletes eloszl´ as A ξ ∈ U (a; b) v.v. s˝ ur˝ us´egf¨ uggv´enye: f (x) =
1 b−a
a<x
A megfelel˝o integr´alok kisz´am´ıt´as´aval kapjuk E(ξ) =
4.4.
a+b 2
D(ξ) =
b−a √ . 2 3
Momentumok, kovariancia
A v´arhat´o ´ert´ek fogalm´aval term´eszetesen ad´odnak a k¨ovetkez˝ok (a jel¨olt v´arhat´o ´ert´ekek l´etez´es´et felt´eve): 1. A ξ skal´ar v.v. (a) nulladik momentuma m0 = E(ξ 0 ) = 1, (b) els˝ o momentuma m1 = E(ξ), (c) m´ asodik momentuma m2 = E(ξ 2 ), (d) n-edik momemtuma mn = E(ξ n ) n ∈ N, (e) els˝ o centr´ alis momentuma σ 1 = E(ξ − m1 ) = 0, (f) m´ asodk centr´ alis momentuma (variancia) σ 2 = E (ξ − m1 )2 = D 2 (ξ),
(g) n-edik centr´ alis momentuma
σ n = E ((ξ − m1 )n )
n ∈ N+ .
A v´arhat´o ´ert´ek tulajdons´agaib´ol kapjuk az al´abbi o¨sszef¨ ugg´eseket: σ 2 = m2 − m21 σ 3 = m3 − 3m2 m1 + 2m31 .. . K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
´ ´ ERT ´ EK, ´ SZOR ´ AS ´ 4. FEJEZET. VARHAT O
46
amib˝ol az mn n = 2, 3, . . . momentumok is kifejezhet˝ok m1 ´es a centr´alis momentumok seg´ıts´eg´evel m2 = σ 2 + m21 m3 = σ 3 + 3m1 σ 2 + m31 .. . Megjegyz´ es: A centr´alis momentumokb´ol szok´as sz´amolni az un. ferdes´eg σ3 σ3 ´es lapults´ ag
σ4 −3 σ4
√ jellemz´es´ere haszn´alt m´er˝osz´amokat, ahol σ = σ 2 = D(ξ). Ezek a mutat´ok a ξ v.v. un. ξ−E(ξ) standardiz´altj´anak harmadik illetve negyedik momentumai, ez D(ξ) ut´obbib´ol levonva a N (0; 1) eloszl´as negyedik momentum´at (l´asd 10. feladat). A ferdes´eg a szimmetria hi´any´anak m´ert´eke, a lapults´ag pedig a norm´alis eloszl´as s˝ ur˝ us´eg´enek lapults´ag´ahoz ad o¨sszehasonl´ıt´asi alapot. 2. A ξ ´es η skal´ar v.v.-k (a) kovarianci´ aja (k¨olcs¨on¨os varianci´aja) cov(ξ, η) = E [(ξ − E(ξ)) · (η − E(η))] = E(ξ · η) − E(ξ) · E(η) , (b) ha m´eg D(ξ), D(η) > 0, a k´et v.v. korrel´ aci´ os egy¨ utthat´ oja r=
cov(ξ, η) . D(ξ) · D(η)
(4.3)
A (4.1) egyenl˝otlens´eg szerint |cov(ξ, η)| ≤ D(ξ) · D(η) teh´at −1 ≤ r ≤ 1. Ez´ert a korrel´aci´os egy¨ utthat´o a k´et v.v. k¨oz¨otti f¨ ugg˝os´eg egyfajta norm´alt m´ert´eke, ugyanis ha ξ ´es η f¨ uggetlenek ⇒ cov(ξ, η) = r = 0 . P (η = aξ + b) = 1 vagy P (ξ = aη + b) = 1 a, b ∈ R ⇔ r = ±1
47
4.5. FELADATOK
K´et v.v. kovarianci´aja fontos szerepet j´atszik a k¨ovetkez˝o un. regresszi´ os feladat megold´as´aban. Feladat: Legyenek ξ ´es η ( ∈ L2 ) skal´ ar val´ osz´ın˝ us´egi v´ altoz´ ok, ´es keress¨ uk az a, b ∈ R regresszi´os egy¨ utthat´okat, melyekkel az η ∼ aξ + b k¨ ozel´ıt´es a legjobb, azaz a
σ 2R = E (η − aξ − b)2
marad´ek minim´ alis.
Megold´ as: Ha D 2 (ξ) = 0, akkor P (ξ = E(ξ)) = 1, teh´at a minimum-feladat megold´asa a v´arhat´o ´ert´ek minimum tulajdons´aga miatt a = 0 b = E(η) ´es σ 2R = D 2 (η) . Ha D 2 (ξ) > 0, akkor az E (η − aξ − b)2 = D 2 (ξ) · a2 − 2 cov(ξ, η) · a + D 2 (η) + [E(η) − a · E(ξ) − b]2
c´elf¨ uggv´eny minimumhelye a=
4.5.
cov(ξ, η) D 2 (ξ)
b = E(η) − a · E(ξ) ´es σ 2R = D 2 (η)(1 − r 2 ) .
(4.4)
Feladatok
1. Legyen ξ ∈ Ω → R v.v., mutassuk meg, hogy E(ξ) akkor ´es csak akkor l´etezik, ha a ∞ X P (|ξ| > n) n=1
sor konvergens!
2. Bizony´ıtsuk az un. ”parci´alis integr´al´as” szab´aly´at: Legyen ξ ≥ 0 v.v. eloszl´ asf¨ uggv´enye F , akkor Z x Z x tdPξ (t) = (1 − F (t)) dt − x · (1 − F (x)) . 0
0
3. Mutassuk meg, hogy ha a ξ ≥ 0 v.v.-nak l´etezik v´arhat´o ´ert´eke, akkor lim x · P (ξ > x) = 0 .
x→∞
K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
´ ´ ERT ´ EK, ´ SZOR ´ AS ´ 4. FEJEZET. VARHAT O
48
4. Legyen a ξ : Ω → N v.v. diszkr´et eloszl´as´ u. Mutassuk meg, hogy ξ ∈ L1 pontosan akkor, ha a ∞ X P (ξ > k) k=0
sor konvergens, ´es ekkor
E(ξ) =
∞ X
P (ξ > k)
k=0
5. Legyen a ξ : Ω → R+ asf¨ uggv´enye F. Mutassuk meg, hogy ξ ∈ L1 0 v.v. eloszl´ pontosan akkor, ha az Z +∞ Z +∞ P (ξ > x)dx = (1 − F (x)) dx 0
0
integr´al v´eges, ´es ekkor E(ξ) =
Z
+∞ 0
(1 − F (x)) dx .
6. Legyenek ξ 1 , ξ 2 , . . . , ξ n skal´ar v.v.-k, ´es h : Rn → R konvex f¨ uggv´eny, azaz minden (x01 , x02 , . . . , x0n ) ∈ Rn ponthoz van olyan line´aris f¨ uggv´eny, hogy teljes¨ ul h(x1 , x2 , . . . , xn ) ≥ h(x01 , x02 , . . . , x0n )+a1 ·(x1 −x01 )+a2 ·(x2 −x02 )+· · ·+an ·(xn −x0n ) ´es l´eteznek a megfelel˝o v´arhat´o ´ert´ekek, akkor h (E(ξ 1 ), E(ξ 2 ), . . . , E(ξ n )) ≤ E (h(ξ 1 , ξ 2 , . . . , ξ n )) . 7. V´alasszunk v´eletlenszer˝ uen egy pontot az orig´o k¨oz´eppont´ u egys´eg sugar´ u k¨orben, jel¨olje (ξ, η) a pont koordin´at´ait. Sz´am´ıtsuk ki ξ, η ´es ξ · η v´arhat´o ´ert´ek´et, ξ ´es η sz´or´as´at! 8. Dobjunk k´et kock´at, jel¨olje az eredm´enyek minimum´at ξ, maximum´at η. Sz´am´ıtsuk ki v´arhat´o ´ert´ek¨ uket! 9. Legyen ξ folytonos eloszl´as´ u f (x) =
c 1 + x2
x∈R
s˝ ur˝ us´egf¨ uggv´ennyel, mutassuk meg, hogy E(ξ) nem l´etezik! 10. Legyen ξ ∈ N (0; 1), sz´am´ıtsuk ki ξ momentumait: σ 2n = E(ξ 2n ) = (2n − 1) · (2n − 3) · . . . · 3 · 1 =
σ 2n+1 = E(ξ 2n+1 ) = 0
n = 0, 1, 2, . . .
(2n)! 2n · n!
4.5. FELADATOK
49
11. Egy p < 1 val´osz´ın˝ us´eg˝ u esem´enyt ism´etelten megfigyel¨ unk az els˝o bek¨ovetkez´esig. k Legyen a ξ v.v. ´ert´eke 2 ha ez a k-adik ism´etl´esben t¨ort´enik, k = 1, 2, . . . . Adjuk meg ξ v´arhat´o ´ert´ek´et ´es sz´or´as´at. 12. Egy hallgat´o egy t´argyb´ol h´aromszor vizsg´azhat. Az egyes vizsg´ak eredm´enyess´ege egym´ast´ol (teljesen) f¨ uggetlen, ´es sikeres vizsga val´osz´ın˝ us´ege rendre 0.6, 0.8 ´es 0.9. Jel¨olje a ξ val´osz´ın˝ us´egi v´altoz´o az els˝o sikeres vizsga sorsz´am´at, illetve legye ´ert´eke 0, ha mindh´arom sikertelen. Mennyi M (ξ) ´es D(ξ) ´ert´eke? 13. A k¨ovetkez˝o szerencsj´at´ekot j´atszuk egy T o¨sszeg befizet´ese ellen´eben: kock´at dobunk, ´es ha az eredm´eny 3-n´al t¨obb, az eredm´eny n´egyzet´enek ´ert´ek´et nyerj¨ uk, egy´ebk´ent m´eg fizet¨ unk annyit amennyi a dob´as eredm´enye. Milyen T eset´en ´erdemes j´atszani? ”Hat´aresetben” mennyi az egyenleg v´arhat´o ´ert´eke ´es sz´or´asa? 14. Egy ujs´ag´arusn´al egy adott lapot a´tlagosan 100 v´as´arl´o keres egy napon. Mennyit kell naponta rendelnie, hogy a v´arhat´o haszna maxim´alis legyen, ha az 50Ft-´ert beszerzett lapot 60Ft-´ert adja a v´as´arl´onak, ´es a megmaradt p´eld´anyokat 30Ft-´ert veszi vissza a terjeszt˝o?
K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
50
´ ´ ERT ´ EK, ´ SZOR ´ AS ´ 4. FEJEZET. VARHAT O
5. fejezet Nagy sz´ amok t¨ orv´ enye Ebben a fejezetben azt a tapasztalati t´enyt igazoljuk a matematikai modellben, hogy v´eletlen jelens´egek nagy sz´am´ u megfigyel´ese sor´an bizonyos ”kiegyenl´ıt˝od´es” figyelhet˝o meg, mint p´eld´aul a relat´ıv gyakoris´ag egyre kissebb m´ert´ek˝ u ingadoz´asa.
5.1.
Nevezetes egyenl˝ otlens´ egek
A k¨ovetkez˝o a´ll´ıt´asok v´eletlen mennyis´egek ingadoz´asainak m´ert´ek´er˝ol adnak becsl´est, l´enyeg´eben korl´atoss´agukat a´ll´ıtva. 5.1. T´ etel (Markov egyenl˝ otlens´ eg). Legyen ξ ≥ 0 v.v., λ > 0, ´es E(ξ) > 0, akkor P (ξ ≥ λ · E(ξ)) ≤
1 λ
(5.1)
Bizony´ıt´ as. Jel¨olje m = E(ξ) > 0, akkor a v´arhat´o ´ert´ek monoton tulajdons´ag´ab´ol ξ ≥ λ · m · 1{ξ≥λ·E(ξ)} ⇒ m ≥ λ · m · P (ξ ≥ λ · m) amib˝ol rendez´essel kapjuk a bizony´ıtand´o egyenl˝otlens´eget. 5.2. T´ etel (Csebisev egyenl˝ otlens´ eg). Legyen ξ skal´ar v.v., λ > 0, ´es D(ξ) > 0, akkor 1 (5.2) P (|ξ − E(ξ)| ≥ λ · D(ξ)) ≤ 2 λ Bizony´ıt´ as. ´Irjuk a Markov egyenl˝otlens´eget a (ξ − E(ξ))2 ≥ 0 v.v.-val ´es λ2 > 0 sz´ammal, akkor kapjuk 1 P (ξ − E(ξ))2 ≥ λ2 · D 2 (ξ) ≤ 2 λ
ami a bizony´ıtand´o (5.2)-egyenl˝otlens´eg.
51
´ ¨ ENYE ´ 5. FEJEZET. NAGY SZAMOK TORV
52 K¨ ovetkezm´ enyek: 1. A Markov egyenl˝otlens´egben λ = eset´en
ε E(ξ)
helyettes´ıt´essel kapjuk tetsz˝oleges 0 < ε
P (ξ ≥ ε) ≤
E(ξ) , ε
(5.3)
ami m´ar az E(ξ) = 0 esetben is teljes¨ ul. 2. Hasonl´oan nyerhetj¨ uk a Csebisev egyenl˝otlens´eg k¨ovetkez˝o alakj´at ε > 0 eset´en P (|ξ − E(ξ)| ≥ ε) ≤
D 2 (ξ) , ε2
(5.4)
ami teljes¨ ul a D(ξ) = 0 esetben is. 3. A Markov illetve Csebisev egyenl˝otlens´egek egyfajta korl´atoss´agot a´ll´ıtanak, annak megfelel˝oen, hogy l´etezik a v´arhat´ a sz´or´as. Ha m´eg feltessz¨ uk o ´ert´ek illetve E(ξ 4 ) l´etez´es´et, akkor l´etezik az E (ξ − E(ξ))4 negyedik centr´alis momentum, ´es hasonl´oan kapjuk E (ξ − E(ξ))4 , (5.5) P (|ξ − E(ξ)| ≥ ε) ≤ ε4 ami esetenk´ent m´eg szigr´ ubb korl´atot jelenet mint (5.4) ugyanazon esem´eny val´osz´ın˝ us´eg´ere. 4. Alkalmazzuk az (5.4) illetve (5.5) egyenl˝ otlens´egeket a (ξ n )∞ uggetlen, azonos n=1 f¨ P eloszl´as´ u v.v.-k sorozat´ab´ol nyert ¯ξ = n1 nk=1 ξ k a´tlagra: (a) ha ∃σ 2 = D 2 (ξ n ) n = 1, 2, . . . ´es ε > 0, akkor σ2 P ¯ξ − m ≥ ε ≤ 2 nε (b) ha ∃σ 4 = E (ξ n − E(ξ n ))4 n = 1, 2, . . . ´es ε > 0, akkor 3σ 4 P ¯ξ − m ≥ ε ≤ 2 4 n ε
(5.6)
(5.7)
ahol m = E(ξ n ) n = 1, 2, . . . a k¨oz¨os v´arhat´o ´ert´ek. Bizony´ıt´ as. Mivel m = E(¯ξ) ´es D 2 (¯ξ) = σn2 (5.4)-b˝ol k¨ovetkezik (5.6). (5.7) igazol´as´ahoz sz´amoljuk ki az a´tlag negyedik centr´alis momentum´at: !4 n h X 4 i 1 = E ¯ξ − m E (ξ k − m) = n4 k=1 " # X 1 = E (ξ 1 − m)k1 · (ξ 2 − m)k2 · . . . · (ξ n − m)kn = n4 k1 +k2 ,...+kn =4 1 n 4! 2 1 σ 2 = 4 n · σ 4 + 3n(n − 1)σ 22 n · σ4 + = 4 n n 2 2!2!
´ ¨ ENYEI ´ 5.2. NAGY SZAMOK TORV
53
ahol kihaszn´alva a sorozat tagjainak f¨ uggetlens´eg´et, az E (ξ k − m) · (ξ l − m)3 = 0 k 6= l = 1, 2, . . . n tagokat elhagyhattuk. A v´arhat´o ´ert´ek konvexit´asa szerint σ 22 = E 2 (ξ k − m)2 ≤ σ 4 ,
´es haszn´aljuk az
E
h
¯ξ − m
4 i
≤
1 3σ 4 [n · σ 4 + 3n(n − 1)σ 4 ] ≤ 2 4 n n
becsl´est (5.5)-ben, ´ıgy kapjuk (5.7)-et.
5.2.
Nagy sz´ amok t¨ orv´ enyei
5.3. T´ etel (Nagy sz´ amok gyenge t¨ orv´ enye). Legyenek (ξ n )∞ uggetlen, azonos eln=1 f¨ oszl´as´ u skal´ar v.v.-k, ´es l´etezzen m = E(ξ k ), σ = D(ξ k ) k = 1, 2, . . . k¨oz¨os v´arhat´o ´ert´ek¨ uk, sz´or´asuk. Akkor ε > 0 eset´en n ! 1 X lim P ξ k − m ≥ ε = 0 . (5.8) n→∞ n k=1
Bizony´ıt´ as. Az a´ll´ıt´as k¨ovetkezik (5.6)-b˝ol.
5.4. K¨ ovetkezm´ eny (Nagy sz´ amok Bernoulli t¨ orv´ enye). Legyen η n ∈ Bin(n; p) n = 1, 2, . . . ´es ε > 0, akkor η lim P n − p ≥ ε = 0 . n→∞ n
Bizony´ıt´ as. Mivel f¨ uggetlen, azonos p-val´osz´ın˝ us´eg˝ u esem´enyek indik´atorainak o¨sszege binomi´alis eloszl´as´ u, (5.8)-b˝ol k¨ovetkezik az a´ll´ıt´as.
5.5. T´ etel (Nagy sz´ amok er˝ os t¨ orv´ enye). Legyenek (ξ n )∞ uggetlen, azonos eloszn=1 f¨ l´as´ u skal´ar v.v.-k, ´es l´etezzen k¨oz¨os m = E(ξ n ) v´arhat´o ´ert´ek¨ uk, akkor ! n 1X ξk = m = 1 . P lim n→∞ n k=1
Bizony´ıt´ as. A bizony´ıt´ast itt csak abban az esetben adjuk meg, amikor l´eteznek a σ 4 = E [(ξ k − m)4 ] k = 1, 2, . . . k¨oz¨os negyedik centr´alis momentumok. Jel¨olje ( n ) ∞ [ ∞ 1 X \ 1 AN = ξ k − m > ∈A n N M =1 n=M k=1
K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
´ ¨ ENYE ´ 5. FEJEZET. NAGY SZAMOK TORV
54
∞ P uggv´eny-) sorozat nem konesem´enyt, melynek ω ∈ AN pontjaiban a n1 nk=1 ξ k n=1 (f¨ verg´alhat m-hez. Az o¨sszes ilyen elemi esem´enyek halmaza ekkor az A=
∞ [
N =1
AN ∈ A
esem´eny, ami a monoton b˝ov¨ ul˝o (AN )∞ enysorozat egyes´ıt´ese, ez´ert a val´osz´ın˝ us´egi N =1 esem´ m´ert´ek folytonoss´aga miatt P (A) = lim P (AN ) . (5.9) N →∞
A val´osz´ın˝ us´egi m´ert´ek monoton ´es szubaddit´ıv tulajdons´ag´ab´ol kapjuk tetsz˝oleges M ∈ N+ eset´en ( n )! ! ∞ ∞ n 1 X [ X X 1 1 1 P (AN ) ≤ P ξ k − m > ≤ P ξ k − m > , n n N N n=M k=1 n=M +1 k=1
amit (5.7) felhaszn´al´as´aval tov´abb n¨ovelve kapjuk P (AN ) ≤
∞ X
3σ 4
2 n=M +1 n
1 4 N
ami egy konvergens sor o¨sszeg´enek ´es M -edik r´eszlet¨osszeg´enek elt´er´ese, ami tetsz˝olegesen kicsi lesz, ha M el´eg nagy. Teh´at P (AN ) = 0 , amib˝ol (5.9) miatt k¨ovetkezik az a´ll´ıt´as. A fenti a´ll´ıt´asok azt fejezik ki, hogy azonos eloszl´as´ u, f¨ uggetlen val´osz´ın˝ us´egi v´altoz´ok a´tlaga bizonyos ´ertelemben k¨ozeledik a v´arhat´o ´ert´ekhez. Ez az 5.3 ´es 5.4 t´etelek eset´en az un. sztochasztikus (vagy m´ert´ekben val´ o ) konvergenci´at jelenti, az 5.5 t´etel pedig egy nulla val´osz´ın˝ us´eg˝ u esem´eny kiv´etel´evel a pontonk´enti, un. majdnem biztos (vagy majdnem minden¨ utt) konvergenci´at a´ll´ıtja.
5.3.
Feladatok
1. Legyen egy ξ v.v. v´arhat´o ´ert´eke E(ξ) = 100, sz´or´asa D(ξ) = 2. Mit mondhatunk a P (ξ ≥ 110) P (90 < ξ < 110) val´osz´ın˝ us´egekr˝ol? Adjuk meg a v´alaszt norm´alis ´es egyenletes eloszl´as eset´en! 2. Borel-Cantelli lemma: Legyenek A1 , A2 , . . . , An , . . . ∈ A esem´enyek, ´es jel¨olje ∞ ul A = ∩∞ n=1 (∪k=n Ak ), akkor teljes¨ ∞ X n=1
P (An ) < +∞
=⇒
P (A) = 0 ;
55
5.3. FELADATOK
ha m´eg az A1 , A2 , . . . , An , . . . ∈ A esem´enyek f¨ uggetlenek, akkor teljes¨ ul ∞ X
P (An ) = +∞
=⇒
P (A) = 1 .
n=1
3. Mutassuk meg, hogy ha a ξ 1 , ξ 2 , . . . , ξ n , . . . f¨ uggetlen, azonos eloszl´as´ u val´osz´ın˝ us´egi v´altoz´ok eset´en 1-val´osz´ın˝ us´eggel l´etezik a n 1 X lim · ξk n→∞ n k=1
hat´ar´ert´ek, akkor l´etezik az m = E(ξ n ) k¨oz¨os v´arhat´o ´ert´ek!
K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
56
´ ¨ ENYE ´ 5. FEJEZET. NAGY SZAMOK TORV
6. fejezet Karakterisztikus f¨ uggv´ eny M´ar l´attuk, hogy val´osz´ın˝ us´egi v´altoz´ok eloszl´as´at meghat´arozza az eloszl´asf¨ uggv´eny. Most egy u ´ jabb, ugyancsak egy´ertelm˝ u azonos´ıt´asra alkalmas fogalmat vezet¨ unk be. Ehhez haszn´aljuk a v´arhat´o ´ert´ek fogalm´anak komplex ´ert´ek˝ u val´osz´ın˝ us´egi v´altoz´okra t¨ort´en˝o E(ζ) = E (Re(ζ)) + i · E (Im(ζ)) kiterjeszt´es´et, ahol a ζ : Ω → C val´os ´es k´epzetes r´eszei skal´ar ´ert´ek˝ u val´osz´ın˝ us´egi v´altoz´ok. Az ´ıgy kiterjesztett v´arhat´o ´ert´ek is rendelkezik a m´ar kor´abban megismert, ´es ebben az esetben is megfogalmazhat´o tulajdons´agokkal (pl. homog´en ´es addit´ıv, de a nemnegat´ıv illetve monoton tulajdons´ag nem ´ertelmezhet˝o). A komplex sz´amok p |x + iy| = h(x, y) = x2 + y 2 x, y ∈ R abszulut ´ert´ek´et megad´o h f¨ uggv´eny konvexit´as´ab´ol most is k¨ovetkezik (l´asd: 48. oldal 6. feladat) |E(ζ)| ≤ E (|ζ|) . 6.1. Defin´ıci´ o. i ) A ξ : Ω → R skal´ar v.v. krakterisztikus f¨ uggv´eny´enek nevezz¨ uk a φξ : R → C t 7→ E eitξ
(6.1)
f¨ uggv´enyt.
ii) A ξ : Ω → N nemnegat´ıv eg´esz ´ert´ek˝ u v.v. gener´atorf¨ uggv´eny´enek nevezz¨ uk a Gξ : C → C z 7→ E z f¨ uggv´enyt. Megjegyz´ esek: 57
ξ
=
∞ X n=0
z n P (ξ = n)
(6.2)
¨ ´ 6. FEJEZET. KARAKTERISZTIKUS FUGGV ENY
58
1. φξ ´ertelmezett minden t ∈ R eset´en, mivel eitξ = 1 ´es korl´atos v.v.-nak mind´ıg van v´arhat´o ´ert´eke. Speci´alisan φξ (0) = 1. 2. Gξ egy, a z´art egys´egk¨orben konvergens hatv´anysor o¨sszegf¨ uggv´enye, melynek konvergencia sugara legal´abb 1, mivel |z| ≤ 1 eset´en ∞ X n=0
n
|z| P (ξ = n) ≤
∞ X
P (ξ = n) = 1 = Gξ (1) .
n=0
3. Nemnegat´ıv eg´esz ´ert´ek˝ u v.v. karaktarisztikus f¨ uggv´eny´et megkaphatjuk gener´atorf¨ uggv´eny´eb˝ol: t∈R φξ (t) = Gξ eit
4. A v´arhat´o ´ert´ek kisz´am´ıt´asi szab´alyainak megfelel˝oen, ha (a) ξ diszkr´et eloszl´as´ u, akkor φξ (t) =
X x
eitx · P (ξ = x)
t ∈ R,
(6.3)
ahol az o¨sszegz´es azon v´eges vagy megsz´aml´alhat´oan sok x ∈ R eset´en ´ertend˝o, melyre P (ξ = x) > 0. (b) ξ folytonos eloszl´as´ u f : R → R+ ur˝ us´egf¨ uggv´ennyel, akkor 0 s˝ Z+∞ φξ (t) = eitx · f (x)dx t ∈ R ,
(6.4)
−∞
ur˝ us´egf¨ uggv´enye. ahol f : R → R+ 0 a ξ v.v. s˝ 5. Egy ξ v.v. karakterisztikus f¨ uggv´eny´et meghat´arozza ξ eloszl´asa, ez´ert besz´elhet¨ unk a megfelel˝o eloszl´asok karakterisztikus f¨ uggv´eny´er˝ol. A karakterisztikus f¨ uggv´ eny tulajdons´ agai 1. A karakterisztikus f¨ uggv´eny folytonos ∀t ∈ R eset´en, mivel i(t+h)ξ e − eitξ ≤ eihξ − 1 ≤ 2
amib˝ol k¨ovetkezik a hat´ar´ert´ek ´es a v´arhat´o ´ert´ek felcser´elhet˝os´ege, teh´at lim φξ (t + h) − φξ (t) = E lim ei(t+h)ξ − eitξ = 0 h→0
h→0
2. φξ korl´atos f¨ uggv´eny, mivel φξ (t) = E(eitξ ) ≤ E eitξ = φξ (0) = 1.
59 3. Ha l´etezik az E(ξ n ) v´arhat´o ´ert´ek, akkor φξ n-szer differenci´alhat´o, ´es (k)
φξ (t) = ik E(ξ k eitξ ) t ∈ R k = 1, 2, . . . n ; illetve speci´alisan t = 0 esetben (k)
φξ (0) = ik E(ξ k ) k = 1, 2, . . . n . Hasonl´oan kapjuk nemnegat´ıv eg´esz ´ert´eket felvev˝o v.v. eset´en a gener´atorf¨ uggv´eny deriv´altjaira: (k) Gξ (1) = E (ξ(ξ − 1)(ξ − 2) · · · (ξ − k + 1)) Bizony´ıt´ as. El´eg megmutatni, hogy a deriv´al´as ´es a v´arhat´o ´ert´ek k´epz´es sorrendje felcser´elhet˝o, amihez megmutatjuk, hogy a megfelel˝o k¨ ul¨onbs´egi h´anyadosnak van integr´alhat´o major´ansa. N´ezz¨ uk ezt a legegyszer˝ ubb, k = 1 esetben. Mivel ekkor E(ξ) is l´etezik, ´es i(t+h)ξ ihξ itξ e e − 1 − e = |ξ| hξ ≤ K · |ξ| h ahol K a korl´atos
( ix e −1 ix ha x ∈ R\{0} x 7→ 1 ha x = 0
(6.5)
f¨ uggv´eny fels˝o korl´atja. Teh´at a h → 0 hat´ar´atmenet ´es az integr´al´as (l´asd A. f¨ uggel´ek, (A.9)) sorrendje felcser´elhet˝o, ´es kapjuk i(t+h)ξ e − eitξ 0 = E(iξeitξ ) t ∈ R. φξ (t) = lim E h→0 h A k > 1 esetben hasonl´oan j´arunk el, csak akkor |ξ|k v´arhat´o ´ert´ek´enek l´etez´es´et haszn´aljuk ki. K¨ ovetkezm´ eny: ´Irjuk a Taylor formul´at a t = 0 pontban φξ (t) =
n X (it)k k=0
ahol teljes¨ ul
k!
E(ξ k ) + Rn (t) t ∈ R ,
1 Rn (t) = 0 . t→0 tn
lim
4. Ha l´etezik az E(ξ n ) v´arhat´o ´ert´ek ∀n ∈ N, akkor φξ (t) =
∞ X (it)k k=0
k!
E(ξ k )
a hatv´anysor konvergencia tartom´any´aban. K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
¨ ´ 6. FEJEZET. KARAKTERISZTIKUS FUGGV ENY
60
Bizony´ıt´ as. El´eg megmutatni, hogy a Taylor formula 2n − 1-edik marad´ektagj´ara (2n) φ (ϑ) 2n 2n ξ 2n i2n E(ξ eiϑξ ) 2n E(ξ ) 2n ·t →0 |R2n−1 (t)| = · t ≤ ·t = (2n)! (2n)! (2n)! ami a konvergencia tartom´anyban teljes¨ ul.
5. Bizony´ıt´as n´elk¨ ul megeml´ıtj¨ uk, hogy a 3. tulajdons´ag r´eszbeni megford´ıt´asa is igaz, nevezetesen: (2n) ∃φξ (0) ⇒ ∃E(ξ 2n ). 6. Ha ξ karakterisztikus f¨ uggv´enye φξ , akkor a, b ∈ R eset´en az η = aξ + b karakterisztikus f¨ uggv´enye φη (t) = E eit(aξ+b) = eitb · φξ (at) t ∈ R . ´es speci´alisan
φ−ξ (t) = E e−itξ = φξ (−t) = φξ (t) .
Ha teh´at ξ eloszl´asa szimmetrikus, azaz ξ ´es −ξ eloszl´asa azonos, akkor karakterisztikus f¨ uggv´enye val´os ´ert´ek˝ u. 7. Ha ξ ´es η v.v.-k f¨ uggetlenk, akkor φξ+η (t) = E eit(ξ+η) = E eitξ · E eitη = φξ (t) · φη (t)
t ∈ R ..
8. φξ : R → C u ´ gynevezett pozit´ıv szemidefinit f¨ uggv´eny, azaz ∀t1 , t2 , . . . , tn ∈ R ´es eset´en teljes¨ ul: 0≤
n X n X k=1 l=1
∀z1 , z2 , . . . , zn ∈ C
φξ (tk − tl ) · zk · z¯l
Bizony´ıt´ as. Mivel 2 n X n n n X n X X X itk ξ itk ξ it ξ e · e l · zk · z¯l = 0≤ zk e = ei(tk −tl )ξ · zk · z¯l k=1 l=1
k=1
k=1 l=1
kapjuk
0≤E
n X n X k=1 l=1
e
i(tk −tl)ξ
· zk · z¯l
!
=
n X n X k=1 l=1
φξ (tk − tl ) · zk · z¯l
A (6.3) ´es (6.4) kisz´am´ıt´asi formul´akb´ol ´es a fenti tulajdons´agokb´ol k¨ozvetlen¨ ul megkaphat´ok az al´abbi eloszl´asok karakterisztikus f¨ uggv´enyei.
´ ´ 6.1. HATARELOSZL ASOK
61
1. A ∈ A, ´es ξ = 1A , akkor Gξ (z) = 1 − P (A) + z · P (A) z ∈ C ; φξ (t) = 1 − P (A) + eit · P (A) t ∈ R ; 2. A1 , A2 , . . . , An ∈ A f¨ uggetlenek, ´es P (Ak ) = p k = 1, 2, . . . n, akkor a ξ = Bin(n; p) v.v. eset´en n φξ (t) = p · eit − 1 + 1 t∈R;
Pn
k=1
1Ak ∈
3. ξ ∈ Geom(p), akkor
Gξ (z) =
∞ X k=1
z k (1 − p)k−1 p = φξ (t) =
zp 1 − z + zp
eit p 1 − eit + eit p
|z| <
1 ; 1−p
t∈R;
Amib˝ol megkaphatjuk a diszkr´et geometriai eloszl´as v´arhat´o ´ert´ek´et ´es sz´or´as´at: p 1 0 = E(ξ) 2 −→ G (1) = p (1 − z + zp) 2 (1 − p) 2p (1 − p) 00 = E(ξ 2 ) − E(ξ) G00 (z) = 3 −→ G (1) = 2 p (1 − z + zp) G0 (z) =
teh´at E(ξ) = p1 , ´es D(ξ) =
s
2 (1 − p) 1 + − p2 p
4. ξ ∈ U (a, b), akkor φξ (t) =
2 p (1 − p) 1 . = p p
eibt − eiat i(b − a)t
t∈R;
5. ξ ∈ Exp(λ), akkor φξ (t) =
6.1.
λ 1 = λ − it 1 − itT
t∈R T =
1 . λ
Hat´ areloszl´ asok
Most bizony´ıt´as n´elk¨ ul kimondunk k´et t´etelt, melyek a karakterisztikus f¨ uggv´eny k´et tov´abbi fontos tulajdons´ag´at a´ll´ıtj´ak. K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
¨ ´ 6. FEJEZET. KARAKTERISZTIKUS FUGGV ENY
62
6.2. T´ etel (Egy´ ertelm˝ us´ egi t´ etel). Egy ξ v.v. φξ karakterisztikus f¨ uggv´enye meghat´arozza ξ F : R → [0; 1]
eloszl´asf¨ uggv´eny´et, nevezetesen ha a < b ∈ R az F eloszl´asf¨ uggv´eny folytonoss´agi helyei, akkor ZT −iat 1 e − e−ibt φξ (t)dt . (6.6) F (b) − F (a) = lim T →∞ 2π it −T
6.3. K¨ ovetkezm´ eny. Ha φξ integr´alhat´o, akkor az eloszl´asf¨ uggv´eny F 0 = f deriv´altja minden¨ utt l´etezik, teh´at ξ folytonos eloszl´as´ u 1 f (x) = F (x) = 2π 0
Z∞
e−ixt φξ (t)dt x ∈ R
−∞
(6.7)
folytonos ´es korl´atos s˝ ur˝ us´egf¨ uggv´ennyel. Bizony´ıt´ as. φξ integr´alhat´os´aga eset´en 1 lim T →∞ 2π
ZT
e−iat − e−ibt φξ (t)dt = it
−T
=
1 lim T →∞ 2π 1 2π
Z∞
−∞
Z∞
−∞
1{−T ≤x≤T } ·
e−iat − e−ibt φξ (t)dt = it
e−iat − e−ibt φξ (t)dt = F (b) − F (a) it
mivel ekkor az integrandusnak van T -t˝ol nem f¨ ugg˝o integr´alhat´o major´ansa (l´asd A. f¨ uggel´ek, (A.9)): −iat −ibt −it(b−a) e − e e − 1 −ita 1{−T ≤x≤T } · ≤ (b − a) e ≤ (b − a) · K · φξ (t) , φ (t) φ (t) ξ ξ it −it(b − a)
ahol K a m´ar eml´ıtett (6.5) f¨ uggv´eny fels˝o korl´atja. Ebb˝ol kapjuk 1 F (b) − F (a) = b−a 2π
Z∞
−∞
e−ibt − e−iat φ (t)dt , −it(b − a) ξ
amib˝ol a b → a hat´ar´ert´ek k´epz´es´evel (hasonl´oan tal´alva b-t˝ol nem f¨ ugg˝o integr´alhat´o major´anst) kapjuk az a´ll´ıt´ast, mivel F folytonoss´agi helyei s˝ ur˝ u halmazt alkotnak (l´asd 35. oldal 1. feladat). f folytonoss´aga ´es korl´atoss´aga k¨ovetkezik a (6.7) formul´ab´ol. Az egy´ertelm˝ us´egi t´etel ad v´alaszt arra a nevezetes probl´em´ara is, hogy egy ξ v.v. eloszl´as´at mikor hat´arozz´ak meg momentumai, az E(ξ k ) k = 1, 2, . . . mennyis´egek. Ha ugyanis l´eteznek ezek a v´arhat´o ´ert´ekek, ´es a φξ karakterisztikus f¨ uggv´enyt el˝oa´ll´ıtja (t = 0 pontban fel´ırt) Taylor sora, akkor az eloszl´ast m´ar meghat´arozza momentumainak sorozata.
´ ´ 6.1. HATARELOSZL ASOK
63
6.4. T´ etel (Folytonoss´ agi t´ etel). Legyen (Fn )n∈N eloszl´asf¨ uggv´enyek gyeng´en konvergens sorozata, azaz lim Fn (x) = F (x) x ∈ {x ∈ R |F folytonos az x pontban} ,
n→∞
´es F eloszl´asf¨ uggv´eny, akkor az Fn eloszl´asf¨ uggv´enyhez tartoz´o φn karakterisztikus f¨ uggv´enyek (n ∈ N) sorozata konvergens, ´es lim φn = φ
n→∞
az F eloszl´asf¨ uggv´enyhez tartoz´o karakterisztikus f¨ uggv´eny. Megford´ıtva, ha l´etezik a φ(t) = lim φn (t) t ∈ R n→∞
hat´arf¨ uggv´eny, ´es φ folytonos a t = 0 pontban, akkor a megfelel˝o (F n )n∈N eloszl´asf¨ uggv´enyek sorozata gyeng´en konvergens, azaz lim Fn (x) = F (x) x ∈ {x ∈ R |F folytonos az x pontban} ,
n→∞
´es F eloszl´asf¨ uggv´eny, amelyhez tartoz´o karakterisztikus f¨ uggv´eny φ. Alkalmazzuk most a fentieket tov´abbi nevezetes eloszl´asok karakterisztikus f¨ uggv´eny´enek megad´as´ahoz. 1. Poisson eloszl´ as karakterisztikus f¨ uggv´ enye. Mivel a binomi´alis eloszl´as tagjainak hat´ar´ertke λ = np esetben egy λ param´eter˝ u Poisson eloszl´as megfelel˝o tagja, az eloszl´asf¨ uggv´enyek (gyenge) konvergenci´aja miatt kapjuk a n λ it φ(t) = lim t∈R · e − 1 + 1 = exp λ eit − 1 n→∞ n Po(λ) eloszl´as karakterisztikus f¨ uggv´eny´et.
2. Cauchy eloszl´ as karakterisztikus f¨ uggv´ enye. Mivel az f (x) = 21 e−|x| x ∈ R s˝ ur˝ us´egf¨ uggv´eny˝ u eloszl´as karakterisztikus f¨ uggv´enye 1 us´egi t´etel k¨ovetkezm´enye szerint (l´asd: 5. feladat) φ(t) = 1+t2 , az egy´ertelm˝ 1 −|a| 1 e = 2 2π
Z∞
e−iat
−∞
amib˝ol kapjuk e
−|a|
=
Z∞
−∞
e
iat
1 dt a ∈ R , 1 + t2
1 1 π 1 + t2
dt a ∈ R ,
ami a Cauchy eloszl´as karakterisztikus f¨ uggv´eny´et adja meg. K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
¨ ´ 6. FEJEZET. KARAKTERISZTIKUS FUGGV ENY
64
3. Norm´ alis eloszl´ as karakterisztikus f¨ uggv´ enye. Legyen ξ ∈ N (0, 1), akkor (l´asd 48. oldal 10. feladat) E(ξ 2n ) = (2n − 1) · (2n − 3) · . . . · 3 · 1 = amib˝ol kapjuk φξ (t) =
∞ X k=0
k
(−1) ·
(2n)! 2n · n!
2 k t 2
E(ξ 2n+1 ) = 0
t2
= e− 2
k!
n = 0, 1, 2, . . .
t∈R,
mivel a sor konvergens az eg´esz sz´amegyenesen. Ha σ > 0 ´es m ∈ R, akkor σξ + m ∈ N (m, σ), ´es ´ıgy kapjuk tetsz˝oleges norm´alis eloszl´as φ(t) = eimt−
t2 σ 2 2
t∈R,
karakterisztikus f¨ uggv´eny´et. Egy tov´abbi nevezetes alkalmaz´as a k¨ovetkez˝o t´etel. 6.5. T´ etel (K¨ ozponti hat´ areloszl´ as t´ etel, C.H.T.). Legyenek ξ 1 , ξ 2 , . . . , ξ n , . . . azonos eloszl´as´ u, f¨ uggetlen (skal´ar ´ert´ek˝ u) val´osz´ın˝ us´egi v´altoz´ok. Jel¨olje k¨oz¨os v´arhat´o ´ert´ek¨ uket ´es sz´or´asukat m = E(ξ k ) σ = D(ξ k ) k = 1, 2, . . . akkor teljes¨ ul a k¨ovetkez˝o lim P
n→∞
1 Pn
Bizony´ıt´ as. Legyen φ0 a
ξk − m √ n<x σ
k=1
n
= Φ(x) x ∈ R
ξ k −m σ
v.v.-k k¨oz¨os karakterisztikus f¨ uggv´enye. Mivel " 2 # ξk − m ξk − m ξk − m =0 D =E E =1, σ σ σ
φ0 Taylor formul´aja a t = 0 pontban φ0 (t) = 1 − Jel¨olje tov´abb´a φ1 az
ξ k −m σ
·
t2 + R(t) t ∈ R 2
´es
R(t) =0 t→0 t2
lim
√1 n
v.v. karakterisztikus f¨ uggv´eny´et, akkor t2 t t =1− + R( √ ) t ∈ R , φ1 (t) = φ0 √ n 2n n
amib˝ol ηn =
1 n
Pn
n
Xξ −m 1 ξk − m √ k ·√ n= σ σ n k=1
k=1
´ ´ 6.1. HATARELOSZL ASOK
65
miatt az η n krakterisztikus f¨ uggv´enye n t2 t n φn (t) = φ1 (t) = 1 − + R( √ ) 2n n
t∈R.
Haszn´aljuk a k¨ovetkez˝o hat´ar´ert´eket: Ha (rn )∞ ul limn→∞ n · rn = 0, ´es a ∈ C, akkor n=1 ⊂ C sorozatra teljes¨ lim
n→∞
n a 1 + + rn = exp(a) . n
Mivel a marad´ektag tulajdons´aga miatt n · R( √tn ) → 0, kapjuk t2
lim φn (t) = e− 2
n→∞
t∈R
ami az N (0, 1) eloszl´as karakterisztikus f¨ uggv´enye, amit bizony´ıtani kellett. 6.6. K¨ ovetkezm´ eny (Moivre-Laplace t´ etel). Legyen η n ∈ Bin(n; p), akkor ! η n − np lim P p < x = Φ(x) x ∈ R . n→∞ np(1 − p)
Bizony´ıt´ as. Mivel η n fel´ırhat´o p-val´osz´ın˝ us´eg˝ u f¨ uggetlen esem´enyek indik´atorainak o¨sszegek´ent, az a´ll´ıt´as k¨ovetkezik az el˝oz˝o t´etelb˝ol. A centr´alis hat´areloszl´as t´etelt (r¨oviden C.H.T.) u ´ gy alkalmazhatjuk, hogy sok f¨ uggetlen ´es azonos eloszl´as´ u v.v. o¨sszeg´enek standardiz´altj´at k¨ozel´ıt˝oen standard norm´alis eloszl´as´ unak tek¨ untj¨ uk, vagyis az o¨sszeg eloszl´as´at norm´alis eloszl´assal k¨ozel´ıthetj¨ uk. Az term´eszetesen a´ltal´aban nem adhat´o meg, hogy milyen n ´ert´ekt˝ol elfogadhat´o a k¨ozel´ıt´es, de pl. a binomi´alis eloszl´as eset´en np > 10 esetben ez m´ar kiel´eg´ıt˝o. Ha ξ diszkr´et eloszl´as´ u, N-beli lehets´eges ´ert´ekekkel, karakterisztikus f¨ uggv´eny´et, ´es ´ıgy eloszl´as´at meghat´arozza gener´atorf¨ uggv´enye. A gener´atorf¨ uggv´eny is meghat´arozza deriv´altjaival a ξ : Ω → N v.v. momentumait ha azok l´eteznek, nevezetesen: Gξ (1) = 1 0 Gξ (1) = E(ξ) 00
Gξ (1) = E(ξ 2 ) − E(ξ) .. . (k) Gξ (1) = E (ξ · (ξ − 1) · (ξ − 2) · . . . · (ξ − k + 1)) Haszn´aljuk mindezt annak igazol´as´ara, hogy a hipergeometrikus eloszl´as k¨ozelithet˝o a binomi´alis eloszl´assal nagy N, M eset´en. El´eg megmutatnunk, hogy momentumaik k¨ozelednek egym´ashoz, vagy ami ugyanaz, deriv´altjaik a z = 1 helyen, ez´ert gener´atorf¨ uggv´enyeik is, melyek n-edfok´ u polinomok, teh´at karakterisztikus f¨ uggv´enyeik is, amib˝ol K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
¨ ´ 6. FEJEZET. KARAKTERISZTIKUS FUGGV ENY
66
k¨ovetkezik az eloszl´asok hasonl´o konvergenci´aja. Az n-edrend˝ u p-param´eter˝ u binomi´alis eloszl´as gener´atorf¨ uggv´enye: n X k n pk (1 − p)n−k = (zp + 1 − p)n z ∈ C , G(z) = z k k=0 amib˝ol 0
Gξ (1) = np 00
Gξ (1) = n(n − 1)p2 .. . (k) Gξ (1) = n(n − 1) · . . . · (n − k + 1)pk
k = 1, 2, . . . n
Az N > M param´eter˝ u hipergeometrikus eloszl´as gener´atorf¨ uggv´enye: n M N −M X k n−k zk z ∈ C H(z) = N n
k=0
amib˝ol egyszer˝ u sz´amol´assal kapjuk: 0
Hξ (1) = n · 00
M N
Hξ (1) = n(n − 1) · .. .
M M −1 · N N −1
(k)
Hξ (1) = n(n − 1) · . . . · (n − k + 1) ·
M −k+1 M M −1 · ·...· N N −1 N −k+1
Ha m´eg feltessz¨ uk, hogy M, N → ∞ ´es p =
6.2.
M N
k = 1, 2, . . . n
a´lland´o, kapjuk a bizony´ıtand´o a´ll´ıt´ast.
V´ eletlen tagsz´ am´ uo ¨sszeg
Vizsg´aljuk most a k¨ovetkez˝o esetet. Legyenek a ν : Ω → N,
ξ 1, ξ2, . . . , ξn, . . .
v.v.-k teljesen f¨ uggetlenek, ´es az ut´obbiak azonos eloszl´as´ uak Jel¨olje η v.v. az al´abbi o¨sszeget ν ∞ X X η= ξk = 1{ν≥k} ξ k , k=0
k=1
ahol ξ 0 = 0. Ekkor η karakterisztikus f¨ uggv´enye ! ∞ ∞ k X Y X itξ j = P (ν = k) · φk (t) t ∈ R φη (t) = E 1{ν=k} e k=0
j=0
k=0
67
6.3. FELADATOK
ahol φ a ξ k
k = 1, 2, . . . v.v.-k k¨oz¨os karakterisztikus f¨ uggv´enye, ´es ha G(z) =
∞ X k=0
P (ν = k) · z k
z∈C
jel¨oli ν gener´atorf¨ uggv´eny´et, kapjuk φη (t) = G ◦ φ(t) t ∈ R . Ebb˝ol kapjuk η v´arhat´o ´ert´ek´ere ha l´etezik µ = E(ν) ´es m = E(ξ k ): iE(η) = φ0η (0) = G0 (1) · φ0 (0) = i · µ · m vagyis E(η) = µ · m . Tov´abb´a 2
−E(η 2 ) = φ00η (0) = G00 (1) · [φ0 (0)] + G0 (1) · φ00 (0) amib˝ol
E(η 2 ) = m2 E(ν 2 ) − µ + µ · E(ξ 2k )
vagyis
D 2 (η) = m2 · δ 2 + µ · σ 2
ahol δ 2 = D 2 (ν) ´es σ 2 = D 2 (ξ k ) k = 1, 2, . . . .
6.3.
Feladatok
1. K´et kock´aval dobunk. Jel¨olje ξ ´es η a k´et dob´as eredm´eny´et, ´ırjuk fel a ξ 2 + η 2 v.v. gener´atorf¨ uggv´eny´et, eloszl´as´at! uggv´eny´et! 2. Adjuk meg a χ22n eloszl´as karakterisztikus f¨ 3. Egy szekr´eny hat fi´okj´aban kellene rendet tenn¨ unk. Egy kocka dob´as´aval d¨ontj¨ uk el, hogy h´any fi´okot tesz¨ unk rendbe. Ha egy fi´ok rendez´es´ehez sz¨ uks´eges id˝o egyenletes eloszl´as´ u a 0 - 10 perc intervallumban, mi a rendez´essel t¨olt¨ott id˝o karakterisztikus f¨ uggv´enye, v´arhat´o ´ert´eke ´es sz´or´asa? 4. Legyenek a ξ ´es η v.v.-k f¨ uggetlenek, eloszl´asuk pedig xı 1 4
P (ξ = xı ) 1 3 2 3
yj P (η = xj ) 2 . 2 3 1 5 3
Adjuk meg ξ, η ´es ξ + η gener´atorf¨ uggv´eny´et, ´es ξ + η eloszl´as´at! K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
¨ ´ 6. FEJEZET. KARAKTERISZTIKUS FUGGV ENY
68 5. Legyena ξ v.v. s˝ ur˝ us´egf¨ uggv´enye
1 f (x) = e−|x| 2 adjuk meg ξ karakterisztikus f¨ uggv´eny´et! 6. Legyen a ξ v.v. s˝ ur˝ us´egf¨ uggv´enye f (x) =
(
0
x∈R,
ha x < 0
4xe−2x ha 0 ≤ x
,
adjuk meg ξ karakterisztikus f¨ uggv´eny´et! 7. Legyenek a ξ ´es η v.v.-k f¨ uggetlenek, eloszl´asuk pedig k−1 1 2 P (ξ = k) = P (η = k) = k = 1, 2, . . . . 3 3 Adjuk meg ξ, η ´es ξ + η gener´atorf¨ uggv´eny´et! 8. Legyen a ξ v.v. s˝ ur˝ us´egf¨ uggv´enye ( f (x) =
3 2 x 8
ha 0 < x < 2
0
egy´ebk´ent
,
adjuk meg ξ karakterisztikus f¨ uggv´eny´et! ¨ 9. Egy bizonyos t´ıpus´ u alkatr´esz, ha hib´atlan a´tlagosan 10 o´r´aig m˝ uk¨od˝ok´epes. Ot ilyen alkatr´eszt v´as´arolunk egy olyan gy´art´ot´ol, amely term´ekeinek 10%-a hib´as. Jel¨ ulje η v.v. a megv´as´arolt term´ekek o¨sszzes m˝ uk¨od´esi idej´et, ´ırjuk fel η karakterisztikus f¨ uggv´eny´et, v´arhat´o ´ert´ek´et ´es sz´or´as´at! 10. Egy u ¨ zletbe bej˝ov˝o v´as´arl´o exponenci´alis eloszl´as´ u v´eletlen o¨sszeget k¨olt el ha megtal´alja az a´ltala keresett term´eket. Ilyenkor az a´tlagos v´as´arl´asi ´ert´ek 1000Ft. Annak val´osz´ın˝ us´ege, hogy megtal´ahat´o a keresett term´ek, 0.7 . Jel¨olje η az els˝o sikertelen v´as´arl´asig befolyt bev´etel o¨sszeg´et, adjuk meg η (a) karakterisztikus f¨ uggv´eny´et! (b) v´arhat´o ´ert´ek´et ´es sz´or´as´at! 11. Egy sorsol´ason p = 0.5 val´osz´ın˝ us´eggel lehet egy 100 o´ra v´arhat´o ´elettartam´ u izz´ol´amp´at nyerni. 10 sorsol´ason igy nyert izz´ok o˝ssz´elettartam´at jel¨olje az η val´osz´ın˝ us´egi v´altoz´o. Adjuk meg η karakterisztikus f¨ uggv´eny´et, v´arhat´o ´ert´ek´et ´es sz´or´as´at! ¨ 12. Egy bizonyos t´ıpus´ u alkatr´esz, ha hib´atlan a´tlagosan 10 o´r´aig m˝ uk¨od˝ok´epes. Ot ilyen alkatr´eszt v´as´arolunk egy olyan gy´art´ot´ol, amely term´ekeinek 10%-a hib´as. Jel¨ ulje η v.v. a megv´as´arolt term´ekek o¨sszzes m˝ uk¨od´esi idej´et, ´ırjuk fel η karakterisztikus f¨ uggv´eny´et, v´arhat´o ´ert´ek´et ´es sz´or´as´at!
7. fejezet Vektor val´ osz´ın˝ us´ egi v´ altoz´ ok jellemz˝ oi 7.1.
Jel¨ ol´ esek, elnevez´ esek
p×q t´ıpus´ u v´eletlen m´atrixnak is nevezz¨ uk a ξ pq-dimenzi´os vektor val´osz´ın˝ us´egi v´altoz´ot, ´es komponenseit egy megfelel˝o m´eret˝ u m´atrixba rendezve, az al´abbi jel¨ol´eseket haszn´aljuk: ξ 11 ξ 12 · · · ξ 1q ξ 21 ξ 22 · · · ξ 2q ξ = .. : Ω → Rp×q .. . . .. . . . . ξ p1 ξ p2 · · · ξ pq A tov´abbiakban egy ξ = (ξ 1 , ξ 2 , . . . ξ n ) n-dimenzi´os vektor val´osz´ın˝ us´egi v´altoz´ot egy n × 1 t´ıpus´ u v´eletlen m´atrixk´ent is haszn´alni fogunk, teh´at ugyancsak ξ jel¨oli az oszlopvektort ´es ξ T ennek transzpon´altj´at, azaz: ξ1 ξ 2 ξT = ξ1 ξ2 · · · ξn . ξ = .. . ξn A fentieknek megfelel˝oen a tov´abbiakban haszn´alni fogjuk a m´atrixokkal kapcsolatos szok´asos m˝ uveleteket, igy p´eld´aul ha ξ ´es η k´et n-dimenzi´os v.v., skal´aris szorzatuk < ξ, η >= ξ T η =
n X
ξk ηk,
k=1
a ξ v.v. hossz´anak n´egyzete pedig: 2
T
|ξ| =< ξ, ξ >= ξ ξ = 69
n X i=1
ξ 2i .
´ ´INUS ˝ EGI ´ ´ ´ JELLEMZOI ˝ 7. FEJEZET. VEKTOR VALOSZ VALTOZ OK
70
7.1.1.
V´ arhat´ o´ ert´ ek, kovariancia m´ atrix
7.1. Defin´ıci´ o. V´eletlen vektor illetve m´atrix v´arhat´o ´ert´ek´en a megfelel˝o komponensek v´arhat´o ´ert´ek´eb˝ol k´epzett vektort illetve m´atrixot ´ertj¨ uk, teh´at E(ξ 11 ) E(ξ 12 ) · · · E(ξ 1q ) ξ 11 ξ 12 · · · ξ 1q ξ 21 ξ 22 · · · ξ 2q E(ξ 21 ) E(ξ 22 ) · · · E(ξ 2q ) E .. ∈ Rp×q .. .. .. = .. .. . . . . . . . . . . . . E(ξ p1 ) E(ξ p2 ) · · · E(ξ pq ) ξ p1 ξ p2 · · · ξ pq
A m´atrix-m˝ uveletek ´es a v´arhat´o ´ert´ek tulajdons´agaib´ol k¨ovetkeznek p´eld´aul az al´abbiak: A ∈ Rn×p , ξ : Ω → Rp×q , B ∈ Rq×r ⇒ E(AξB) = AE(ξ)B ∈ Rn×r 7.2. Defin´ıci´ o. i) A ξ = (ξ 1 , ξ 2 , . . . , ξ p ) p− dimenzi´ os vektor val´ osz´ın˝ us´egi v´ altoz´ o (auto-)kovariancia m´ atrix´ anak nevezz¨ uk a cov(ξ, ξ) = cov(ξ i , ξ j i=1,2,...,p j=1,2,...,p
p × p t´ıpus´ u m´ atrixot.
ii) A ξ = (ξ 1 , ξ 2 , . . . , ξ p ) p− dimenzi´ os ´es η = (η 1 , η 2 , . . . η q ) q− dimenzi´ os vektor val´ osz´ın˝ us´egi v´ altoz´ ok (kereszt-)kovariancia m´ atrix´ anak nevezz¨ uk a cov(ξ, η) = cov(ξ ı , η j ) i=1,2,...,p j=1,2,...,q
p × q t´ıpus´ u m´ atrixot.
A kovarianci m´ atrix tulajdons´ agai a defin´ıci´o k¨ozvetlen k¨ovetkezm´enyei: jel¨olje ξ ´es η a defin´ıci´oban szerepl˝o v´eletlen vektorokat, akkor k¨onnyen ellen˝or´ızhet˝oek az al´abbiak. 1. cov(ξ, η)T = cov(η, ξ), cov(ξ, ξ)T = cov(ξ, ξ). 2. Kisz´am´ıt´asi formula: cov(ξ, η) = E(ξη T ) − E(ξ)E(η)T . 3. Sz´amol´asi ”szab´alyok” : (a) Ha ζ egy tov´abbi p-dimenzi´os vektor val´osz´ın˝ us´egi v´altoz´o, akkor cov(ξ + ζ, η) = cov(ξ, η) + cov(ζ, η) .
¨ ESEK, ´ ´ 7.1. JELOL ELNEVEZESEK
71
(b) Ha a ξ, η v´eletlen vektorok f¨ uggetlenk, akkor cov(ξ, η) = 0 ∈ Rp×q . (c) Ha A ∈ Rn×p , a ∈ Rn×1 , B ∈ Rr×q , b ∈ Rr×1 , akkor cov(Aξ + a, Bη + b) = A cov(ξ, η)B T ∈ Rn×r . (d) Ha ξ, η : Ω → Rn f¨ uggetlen v.v.v.-k, akkor cov(ξ + η, ξ + η) = cov(ξ, ξ) + cov(η, η). 4. A ξ kovariancia m´atrixa szimmetrikus, pozit´ıv szemidefinit m´atrix, tov´abb´a az al´abbi a´ll´ıt´asok ekvivalensek: • cov(ξ, ξ) invert´alhat´o;
• cov(ξ, ξ) pozit´ıv definit;
• A cov(ξ, ξ)x = 0n homog´en line´aris egyenletrendszernek csak az x = (0, 0, . . . 0) ∈ Rp trivi´alis megold´asa van. • ξ komponensei k¨oz¨ott nincs line´aris o¨sszef¨ ugg´es, azaz ∀ c = (c1 , c2 , . . . cp ) ∈ Rp Pp est´en a i=1 ci ξ i val´osz´ın˝ us´egi v´altoz´o nem lehet egy val´osz´ın˝ us´eggel a´lland´o, ha c nem a z´erus vektor.
7.1.2.
Karakterisztikus f¨ uggv´ eny
7.3. Defin´ıci´ o. A ξ : Ω → Rn v.v.v. karakterisztikus f¨ uggv´eny´enek nevezz¨ uk a φξ : Rn → C t 7−→ E ei
f¨ uggv´enyt.
A skal´ar esethez hasonl´oan, most is teljes¨ ulnek az al´abbi tulajdons´agok: 1. A v´arhat´o ´ert´ek kisz´am´ıt´asi szab´alyainak megfelel˝oen, ha (a) ξ diszkr´et eloszl´as´ u {x1 , x2 , . . .} ⊂ Rn lehets´eges ´ert´ekekkel, akkor X φξ (t) = ei · P (ξ = xk ) t ∈ Rn k
(b) ξ folytonos eloszl´as´ u f : R n → R+ ur˝ us´egf¨ uggv´ennyel, akkor 0 s˝ Z Z φξ (t) = · · · ei · f (x)dx t ∈ Rn . Rn
K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
´ ´INUS ˝ EGI ´ ´ ´ JELLEMZOI ˝ 7. FEJEZET. VEKTOR VALOSZ VALTOZ OK
72
2. φξ folytonos, korl´atos f¨ uggv´eny, ´es φξ ≤ 1.
3. Ha l´etezik az E(ξ l11 · ξ l22 · . . . · ξ lnn ) v´arhat´o ´ert´ek, akkor k1 ≤ l1 , k2 ≤ l2 , . . . , kn ≤ ln eset´en D1k1 D2k2 . . . Dnkn φξ (t) = ik1 +k2 +...+kn E(ξ k11 · ξ k22 · . . . · ξ knn ei ) t ∈ Rn . 4. Ha ξ karakterisztikus f¨ uggv´enye φξ , akkor A ∈ Rr×n ´es b ∈ Rr eset´en az η = Aξ + b karakterisztikus f¨ uggv´enye φη (t) = E ei = ei · φξ AT t t ∈ Rr . 5. Ha ξ ´es η v.v.-k f¨ uggetlen n-dimenzi´os v.v.v.-k, akkor φξ+η (t) = E ei = E ei · E ei = φξ (t) · φη (t)
t ∈ Rn ..
6. H ξ : Ω → Rp ´es η : Ω → Rq v.v.(v.)-k f¨ uggetlenek, akkor φ(ξ,η) (t1 , t2 ) = E ei<(t1 ,t2 ),(ξ,η)> = E ei · E ei = = φξ (t1 ) · φη (t2 ) t1 ∈ Rp t2 ∈ Rq . 7. Az egy´ertelm˝ us´egi ´es folytonoss´agi t´eteleknek megfelel˝o a´ll´ıt´asok most is teljes¨ ulnek, teh´at p´eld´aul a v.v.v. karakterisztikus f¨ uggv´enye ´es eloszl´asf¨ uggv´enye most is k¨olcs¨on¨osen meghat´arozz´ak egym´ast. K¨ ovetkezm´ eny: A ξ : Ω → Rp ´es η : Ω → Rq v.v.(v.)-k akkor ´es csak akkor f¨ uggetlenek, ha φ(ξ,η) (t1 , t2 ) = φξ (t1 ) · φη (t2 ) t1 ∈ Rp t2 ∈ Rq .
7.2.
Vektor val´ osz´ın˝ us´ egi v´ altoz´ o f˝ okomponensei
A tov´abbiakban legyen ξ : Ω → Rp v.v.v., jel¨olje v´arhat´o ´ert´ek vektor´at E(ξ) = m ∈ Rp , ´es kovariancia m´atrix´at cov(ξ, ξ) = V ∈ Rp×p . Jel¨olje tov´abb´a ξ centr´altj´at ξ ∗ = ξ − m. A V sj´at´ert´ekei cs¨okken˝o sorba rendezve legyenek: λ1 ≥ λ 2 ≥ . . . ≥ λ p ≥ 0 a megfelel˝o saj´atvektorok ortonorm´alt rendszere pedig legyen: 1 ha i = j p T v1 , v2 , . . . , vp ∈ R , vi vj = i, j = 1, 2, . . . , p. 0 ha i 6= j Ekkor teljes¨ ulnek: V =
p X
λi vi viT
´es Ip =
i=1
ahol Ip ∈ Rp×p jel¨oli a p × p t´ıpus´ u egys´egm´atrixot.
p X i=1
vi viT ,
´ ´INUS ˝ EGI ´ ´ ´ FOKOMPONENSEI ˝ 7.2. VEKTOR VALOSZ VALTOZ O
73
7.4. Defin´ıci´ o. i) A ξ v.v.v. f˝ okomponenseinek nevezz¨ uk a τ i = viT ξ ∗
i = 1, 2, . . . , p
skal´ ar val´ osz´ın˝ us´egi v´ altoz´ okat. ii) A ξ v.v.v. pozit´ıv saj´ at´ert´ekeihez tartoz´ o f˝ ofaktorainak nevezz¨ uk a 1 τ ∗i = √ τ i λi
i = 1, 2, . . . , p ´es λi > 0
skal´ ar val´ osz´ın˝ us´egi v´ altoz´ okat. A f˝ okomponensek ´ es f˝ ofaktorok tulajdons´ agai: 1. A f˝okomponensek ´es f˝ofaktorok centr´altak ´es korrel´alatlanok, azaz E(τ i ) = E(τ ∗i ) = 0, tov´abb´a sz´or´asaik:
cov(τ i , τ j ) = cov(τ ∗i , τ ∗j ) = 0 i 6= j = 1, 2, . . . p
p λi i = 1, 2, . . . p D(τ i ) = ∗ D(τ i ) = 1 i = 1, 2, . . . p ´es λi > 0
2. A ξ v.v.v. fel´ırhat´o f˝okomponenseivel: ξ=
p X
τ i vi + m illetve f˝ofaktoraival ξ =
i=1
√
p X
τ ∗i wi + m
i=1,λı >0
ahol wi = λi vi ha λi > 0. Itt a vi illetve wi un. s´ ulyvektorok adnak lehet˝os´eget az egyes faktorok ´ertelmez´es´ere, annak megfelel˝oen, hogy milyen szoros kapcsolat van a ξ v.v.v. egyes komponensei ´es a k¨ ul¨onb¨oz˝o f˝okomponensek ill. f˝ofaktorok k¨oz¨ott. Ha m´eg ξ komponensei egys´egnyi sz´or´as´ uak, a wi s´ ulyvektor egyes kordin´at´ai ξ megfelel˝o komponense ´es az i-edik f˝okomponens ill. f˝ofaktor k¨oz¨otti korrel´aci´os egy¨ utthat´oval azonos ´ert´ek˝ u. 3. A ξ v.v.v. k¨ozel´ıt´ese p-n´el kevesebb r-dimenzi´os alt´erbe t¨ort´en˝o vet´ıt´essel: ξ≈
r X i=1
τ i vi + m illetve ξ ≈
r X
τ ∗i wi + m
i=1,λı >0
Ekkor a k¨ozel´ıt´es hib´aja: 2 2 p r X X τ i v i = E σ 2r = E ξ − m − τ i vi = i=1 i=r+1 ! !T ! p p p p X X X X 2 = E τ i vi τ i vi =E τi = λi i=r+1
i=r+1
i=r+1
i=r+1
K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
´ ´INUS ˝ EGI ´ ´ ´ JELLEMZOI ˝ 7. FEJEZET. VEKTOR VALOSZ VALTOZ OK
74
4. Az el˝oz˝o k¨ozel´ıt´est l´enyegkiemel´esnek is nevezz¨ uk, igaz ugyanis az al´abbi a´ll´ıt´as: Legyenek p ≥ r ∈ N+ , ui ∈ Rp i = 0, 1, 2, . . . , r vektorok , ψ i : Ω → R i = 1, 2, . . . , r skal´ ar val´ osz´ın˝ us´egi v´ altoz´ ok, akkor !T ! r r X X (7.1) ψ i ui − u 0 ξ− ψ i ui − u0 ≥ σ 2r . E ξ− i=1
i=1
Bizony´ıt´ as.
(a) Alak´ıtsuk a marad´ekot 2 2 r r X X (ψ i − E(ψ i ) · ui + ψ i ui − u0 = E (ξ − m) − E ξ − i=1 i=1 2 r X u − m + E(ψ ) · u 0 i i i=1
amib˝ol k¨ovetkezik, hogy el´eg a ξ ∗ = ξ − m centr´alt v.v.v. k¨ozel´ıt´es´esvel foglalkozni, amikor feltehet˝o E(ψ i ) = 0 i = 1, 2, . . . , r ´es u0 = 0 ∈ Rp .
(b) Ha az ui ∈ Rp i = 1, 2, . . . , r vektorok nem line´arisan f¨ uggetlenek, akkor a marad´ek egy kevesebb dimenzi´os k¨ozel´ıt´es marad´eka, teh´at feltehet˝o ezen vektorok f¨ uggetlens´ege. ´ıgy az a´ltaluk gener´alt alt´er minden b´azis´ahoz tartozik egy ugynilyen marad´ekot ad´o k¨ozel´ıt´es, teh´at v´alaszthatjuk ezeket a vektorokat egy ortonorm´alt b´azis vektorainak: 1 ha i = j T . < ui , uj >= ui uj = 0 ha i 6= j Ekkor azonban ξ ∗ -hoz az alt´erb˝ol a ”mer˝oleges vet¨ ulete” van legk¨ozelebb: 2 r X ∗ E ξ − ψ i ui = i=1 2 ! r r X X = E ξ ∗ − < ξ ∗ , ui > u i − (ψ i − < ξ ∗ , ui >) ui = i=1 i=1 2 r r X X ∗ ∗ E (ψ i − < ξ ∗ , ui >)2 ≥ < ξ , ui > u i + = E ξ − i=1 i=1 2 r X ∗ ∗ ≥ E ξ − < ξ , ui > u i i=1
teh´at a ψ ı =< ξ ∗ , ui >= ξ ∗T ui i = 1, 2, . . . , r
v´alaszt´as a minimumot adja.
´ ´ U ´ VEKTOR VALOSZ ´ ´INUS ˝ EGI ´ ´ ´ 7.3. NORMALIS ELOSZLAS VALTOZ O
75
(c) Teh´at el´eg a marad´ek minimum´at a fenti esetben keresni. Legyenek ui = [v1 , v2 , . . . , vp ] · cı ahol:
cji =< vj , ui >
´es teljes¨ ulnek p X
j = 1, 2, . . . p cı = r X
c2ji = 1 i = 1, 2, . . . , r,
j=1
i=1
c1i c2i .. . cpi
∈ Rp
i = 1, 2, . . . , r,
c2ji ≤ 1 j = 1, 2, . . . p .
´ıgy a marad´ek az al´abbi alakban ´ırhat´o: 2 p r r X r X X X λj · c2ji . uTi V ui = E ξ ∗T ξ ∗ − ψ i ui = E ξ ∗T ξ ∗ − E ξ ∗ − i=1 j=1
i=1
i=1
Vagyis el´eg megkeresni a
p X j=1
λj · q j
ahol qj =
r X
c2ji
i=1
Pp
kifejez´es maximum´at az 1 ≥ qj ≥ 0 j = 1, 2, . . . p, mellett. ´ırjuk teh´at p X j=1
λj · q j = ≤
r X
j=1 r X j=1
λj −
r X j=1
λj − λ r ·
λj · (1 − qj ) + r X j=1
p X
j=1 qj
j=r+1
(1 − qj ) + λr ·
= r, felt´etelek
λj · q j ≤
p X
j=r+1
qj =
r X
λj ,
j=1
amit bizony´ıtani kellett.
7.3.
Norm´ alis eloszl´ as´ u vektor val´ osz´ın˝ us´ egi v´ altoz´ o
7.5. Defin´ıci´ o. Legyenek ξ 1 , ξ 2 , . . . ξ p ∈ N (0, 1) teljesen f¨ uggetlenek, A ∈ Rq×p m´atrix ´es m ∈ R, jel¨olje tov´abb´a ξ = (ξ 1 , ξ 2 , . . . ξ p ),. ekkor az Aξ + m : Ω → Rq
(7.2)
v.v.v. eloszl´as´at q-dimenzi´os norm´alis eloszl´asnak nevezz¨ uk. K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
´ ´INUS ˝ EGI ´ ´ ´ JELLEMZOI ˝ 7. FEJEZET. VEKTOR VALOSZ VALTOZ OK
76 Megjegyz´ esek:
1. Ha p = 1 a skal´ar norm´alis eloszl´as defin´ıci´oj´at kapjuk, azzal a k¨ ul¨onbs´eggel, hogy a konstans is norm´alis eloszl´as´ u az ut´obbi ´ertelemben. 2. Ha A = Ip a p × p t´ıpus´ u egys´eg m´atrix ´es m = 0, ξ eloszl´as´at kapjuk, amit p-dimenzi´os standard norm´alis eloszl´asnak, ez´ert ξ-t standard norm´alis vektornak nevezz¨ uk. A standard eloszl´as s˝ ur˝ us´egf¨ uggv´enye a komponensek f¨ uggetlens´ege miatt ϕ(x) =
1 − 12 xT x p e (2π) 2
x ∈ Rp ,
karakterisztikus f¨ uggv´enye pedig Pp 1 Pp 2 φξ (t) = E ei k=1 tk ξk = e− 2 k=1 tk
t ∈ Rp
A norm´ alis eloszl´ as tulajdons´ agai: 1. Ha η egy q-dimenzi´os norm´alis eloszl´as´ u v.v.v., ´es B ∈ Rr×q b ∈ Rr , akkor Bη + b r-dimenzi´os norm´alis eloszl´as´ u v.v.v..Teh´at norm´alis vektor line´aris transzform´altja norm´alis eloszl´as´ u. K¨ ovetkezm´ eny: Norm´alis vektor minden pereme is norm´alis eloszl´as´ u. 2. Ha ξ p-dimenzi´os standard norm´alis vektor, ´es O ∈ Rq×p ortogon´alis m´atrix, azaz OO T = Iq , akkor Oξ q-dimenz´os standard norm´alis eloszl´as´ u. 3. Legyen ξ p-dimenzi´os standard norm´alis vektor, A ∈ Rq×p , m ∈ Rp ´es legyen az η v.v.v. eloszl´asa olyan mint Aξ + m eloszl´asa. Ekkor E(η) = m, cov(η, η) = V = AAT ´es
1 φη (t) = exp i < t, m > − < t, V t > 2
1 = exp it m − tT V t 2
4. Ha egy η v.v.v. karakterisztikus f¨ uggv´enye 1 T T φη (t) = exp it m − t V t 2
T
t ∈ Rp .
t ∈ Rp
ahol m ∈ Rp , V ∈ Rp×p pozit´ıv szemidefinit szimmetrikus m´atrix, ´es jel¨olje V saj´atvektorainak ortonorm´alt rendszer´et ´es a hozz´a tartoz´o saj´atr´ert´ekeket v1 , v2 , . . . , vp ∈ R p
λ1 ≥ λ2 ≥ . . . ≥ λp ≥ 0,
´ ´ U ´ VEKTOR VALOSZ ´ ´INUS ˝ EGI ´ ´ ´ 7.3. NORMALIS ELOSZLAS VALTOZ O
77
akkor a q = rang(V ) sz´am´ u pozit´ıv saj´at´ert´ekhez tartoz´o 1 τ ∗k = √ (ξ − m)T vk λk
k = 1, 2, . . . , q
f˝ofaktorok a τ ∗ = (τ ∗1 , τ ∗2 , . . . τ ∗q ) q = rang(V ) standard norm´alis vektor komponensei, mivel τ ∗ = A · (η − m) A =
√1 v T λ1 1
.. .
√1 vqT λq
karakterisztikus f¨ uggv´enye:
1 T t
φτ ∗ (t) = φη−m (AT t) = e− 2 t ´ıgy η=
√
λ1 · v 1
∈ Rq×p t ∈ Rq .
p √ · v . . . · v λ2 2 λq q
τ ∗1 τ ∗2 .. . τ ∗q
+ m,
teh´at η eloszl´asa norm´alis, ´es cov(η, η) = V , E(η) = m, vagyis η f˝ofaktorai standard norm´alis vektort alkotnak, ´es η ezek line´aris transzform´altjak´ent ´ırhat´o. K¨ ovetkezm´ enyek: 1. Norm´alis v.v.v. mind´ıg fel´ırhat´o a defin´ıci´oban szerepl˝o 7.2 alakban, nevezetesen a f˝ofaktorainak line´aris transzform´altjak´ent. 2. A norm´alis eloszl´as´at egy´ertelm˝ uen meghat´arozza v´arhat´o ´ert´eke ´es kovarianci m´atrixa, jel¨ol´ese ez´ert N (m, V ), ahol m ∈ Rq ´es V ∈ Rq×q pozit´ıv szemidefinit szimmetrikus m´atrix. Ez a jel¨ol´es a skal´ar norm´alis eloszl´as N (m, σ 2 ) jel¨ol´es´enek felel meg, azzal a kieg´esz´ıt´essel, hogy a konstans v.v. (σ 2 = 0) is norm´aslis eloszl´as´ ua tov´abbiakban. 3. Ha (ξ, η) egy p + q-dimenzi´os norm´alis vektor, ´es cov(ξ, η) = 0p×q ∈Rp×q , akkor ξ ´es η f¨ uggetlenek, mivel a cov(ξ, ξ)∈Rp×p
V22 = cov(η, η)∈Rq×q
m1 = E(ξ)∈Rp
m2 = E(η)∈Rp
jel¨ol´esekkel teh´at
ξ ∈ N (m1 , V11 ) η ∈ N (m2 , V22 ) ,
1 T T V11 0p×q t1 T T t t = φξ+η (t1 , t2 ) = exp i(t1 m1 + t2 m2 ) − 0q×p V22 t2 2 1 2 = φξ (t1 ) · φη (t2 ) K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
´ ´INUS ˝ EGI ´ ´ ´ JELLEMZOI ˝ 7. FEJEZET. VEKTOR VALOSZ VALTOZ OK
78
4. Ha rang(V ) = q, akkor η folytonos eloszl´as´ u, s˝ ur˝ us´egf¨ uggv´enye: 1 1 T −1 x ∈ Rq . fη (x) = exp − (x − m) V (x − m) q p 2 (2π) 2 det(V )
(7.3)
5. Ha 0 < rang(V ) = r < q, akkor η egy r-dimenzi´os perem´enek line´aris f¨ uggv´enyek´ent kifejezhet˝o η t¨obbi komponense, ´es ezen r-dimenzi´os perem kovariancia m´atrixa invert´ahat´o, teh´at s˝ ur˝ us´egf¨ uggv´enye megadhat´o az eredeti V kovariancia m´atrix ill. m v´arhat´o ´ert´ek vektor megfelel˝o komponenseib˝ol. 6. Ha egy η q-dimenzi´os v.v.v. s˝ ur˝ us´egf¨ uggv´enye 7.3 alakban ´ırrhat´o, ahol E(η) = m, cov(η, η) = V, akkor η q-dimenzi´os norm´alis eloszl´as´ u.
7.4.
Feladatok
1. Legyen a (ξ; η) v.v.v. eloszl´asa: ξ
1 2
η
1
0
1 12 1 6
1 12 1 3
−1 1 6 1 6
Adja meg a peremeloszl´asokat, f¨ uggetlenek-e ξ ´es η ? Adja meg (ξ; η) kovariancia m´atrix´at, v´arhat´o ´ert´ek´et ´es karakterisztikus f¨ uggv´eny´et! 2. Legyen X = {X1 , X2 , . . . , XN } ⊂ R, ´es v´alasszunk ki visszatev´es n´elk¨ ul tal´alomra n sz´am´ u elemet X elemeib˝ol, ´es jel¨olje ξ k a k-adik v´alszt´as eredm´eny´et k = 1, 2, . . . , n. Adjuk meg a ξ = (ξ 1 , ξ 2 , . . . , ξ n ) v.v.v. v´arhat´o ´ert´ek´et ´es kovariancia m´atrix´at! 3. ´Irjuk fel a ν = (ν 1 , ν 2 , . . . , ν r ) polinomi´alis eloszl´ as´ u v.v.v. kovariancia m´atrix´at! P T Ellen˝or´ızz¨ uk, hogy cov(ν, ν)1 = 0 , mivel ν 1 = ri=1 ν ı = n. ´ırjuk fel ν karakterisztikus f¨ uggv´eny´et! 4. Legyenek ξ, η ∈ N (0, 1) f¨ uggetlenek, ´es ξ 1 = 2ξ + η
ξ 2 = ξ + 2η
´ırjuk fel (ξ 1 , ξ 2 ) kovariancia m´atrix´at, ellen˝orizz¨ uk, hogy pozit´ıv definit! Adjuk meg a ξ 1 ≈ aξ 2 + b ´es ξ 2 ≈ a0 ξ 1 + b0 regresszi´os k¨ozel´ıt´eseket, ´es marad´ek sz´or´asaikat! ´ırjuk fel (ξ 1 , ξ 2 ) karakterisztikus f¨ uggv´eny´et! 5. A 4. feladat kapcs´an adja meg a kovariancia m´atrix saj´atvektorait, sz´am´ıtsa ki a legjobb egy-dimenzi´os vet¨ ulet hib´aj´at! Irja fel a f˝ofaktor s´ ulyok m´atrix´at, ´es a faktoroknak a komponesekkel val´o korrel´aci´os egy¨ utthat´oit!
79
7.4. FELADATOK
6. A ξ = (ξ 1 , ξ 2 ) v.v.v. kovariancia m´atrixa ´es v´arhat´o ´ert´ek vektora: √ 3 7 1 √ cov(ξ, ξ) = M (ξ) = 2 3 5 (a) Hat´arozza meg a nagyobbik saj´at´ert´ekhez tartoz´o f˝okomponensek egyenes´et! √ (b) Adja meg az (1+2 3; 4) megfigyelt ponthoz tartoz´o f˝okomponensek ´es f˝ofaktorok ´ert´ekeit! 7. Legyenek τ 1 ∈ U (0; 1), τ 2 ∈ N (1; 2) f¨ uggetlenek, ´es jel¨olje ξ = τ2 − 2 · τ1
η = τ2 .
Adjuk meg (ξ; η) kovariancia m´atrix´at, ´es a ”legjobb” egydimenzi´os vet´ıt´es egyenes´et! 8. Legyen (ξ, η) 2-dimenzi´os norm´alis vektor, ´es E(ξ) = m1 , E(η) = m2 , D 2 (ξ) = σ 21 , D 2 (η) = σ 22 , cov(ξ, η) = σ 12 ´es σ 21 σ 22 − σ 12 > 0. Irjuk fel a k´etdimenzi´os s˝ ur˝ us´egf¨ uggv´enyt! Ellen˝orizz¨ uk, hogy a korrel´alatlans´agb´ol k¨ovetkezik a k´et komponens f¨ uggetlens´ege! 9. Legyen a (ξ, η) v.v.v. s˝ ur˝ us´egf¨ uggv´enye: √ f (x, y) = c · exp −x2 + 2xy − y 2
(x, y) ∈ R2 .
Sz´am´ıtsa ki ξ ´es η korrel´aci´os egy¨ utthat´oj´at!
K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
80
´ ´INUS ˝ EGI ´ ´ ´ JELLEMZOI ˝ 7. FEJEZET. VEKTOR VALOSZ VALTOZ OK
8. fejezet Nevezetes eloszl´ asok A k¨ovetkez˝o eloszl´asok a norm´alis eloszl´asb´ol sz´armaztathat´ok, ´es nevezetes felhaszn´al´asi ter¨ ulet¨ uk a matematikai statisztika.
8.1.
χ2 eloszl´ as
8.1. Defin´ıci´ o. Legyen ξ = (ξ 1 , ξ 2 , . . . , ξ n ) standard norm´alis vektor, az η=
n X
ξ 2i
i=1
val´osz´ın˝ us´egi v´altoz´o eloszl´as´at n-szabads´agi fok´ u χ 2 eloszl´asnak nevezz¨ uk, jel¨ol´ese: η ∈ χ2n . Megjegyz´ esek: ur˝ us´egf¨ uggv´enye megadhat´o: 1. A χ2n eloszl´as folytonos, s˝ n −1 − x x2 e 2 ha x > 0 n fn (x) = 2 2 Γ( n2 ) 0 ha x ≤ 0 R +∞ ahol Γ(t) = 0 ut−1 e−u du t > 0. 2. A χ22 eloszl´as azonos az Exp 21 eloszl´assal (l´asd 1. feladat).
3. Ha n el´eg nagy (n > 80, 100, ...), a χ2n eloszl´as k¨ozel norm´alis lesz a centr´alis hat´areloszl´as t´etel miatt. 4. Az eloszl´as k¨ ul¨onb¨oz˝o α ∈]0; 1[ ´es n ∈ N+ ´ert´ekekhez tartoz´o un. χ2α kritikus ´ert´ek ei, melyekre P η > χ2α = α ha η ∈ χ2n , t´abl´azatb´ol nyerhet˝ok (l´asd B. f¨ uggel´ek). 81
´ 8. FEJEZET. NEVEZETES ELOSZLASOK
82 A χ2 eloszl´ as tulajdons´ agai: 1. Add´ıci´os tulajdons´ag.
Legyenek η 1 ∈ χ2n1 ´es η 2 ∈ χ2n2 f¨ uggetlenek, akkor η 1 + η 2 ∈ χ2n1 +n2 . Bizony´ıt´ as. Defin´ıc´o alapj´an nyilv´anval´o. 2. A χ2 eloszl´as v´arhat´o ´ert´eke ´es sz´or´asa: Ha η ∈ χ2n , akkor
E(η) = n
D(η) =
√ 2n.
Bizony´ıt´ as. Ha ξ ∈ N 0; 1), akkor E(ξ 2 ) = 1 ´es E(ξ 4 ) = 3, amib˝ol k¨ovetkezik az a´ll´ıt´as. √ K¨ ovetkezm´ eny: Ha n el´eg nagy, akkor χ2n ≈ N (n, 2n), tov´ abb´ a ∀ ε > 0 eset´en η lim P − 1 > ε = 0. n→∞ n
3. A χ2 eloszl´as mint n´egyzet¨osszeg eloszl´asa.
Legyen a Q ∈ Rn×n szimmetrikus m´ atrix rangja r ≥ 1 ´es teljes¨ ulj¨ on QQ = Q. a) Ha ξ ∈ N (m, σ 2 I), ahol m ∈ Rn , σ > 0 ´es I ∈ Rn×n az egys´egm´ atrix, akkor teljes¨ ulnek az al´ abbi a ´ll´ıt´ asok: i) ξ T Qξ = (Qξ)T (Qξ); ii) σ12 ξ T Qξ ∈ χ2r ⇔ mT Qm = 0
iii) E(ξ T Qξ) = rσ 2 + mT Qm; b) Ha η ∈ N (0, σ 2 Q), akkor
1 T η η σ2
⇔
Qm = 0 ∈ Rn .
∈ χ2r .
Bizony´ıt´ as. Ha v egys´eg hossz´ us´ag´ u saj´atvektora Q-nak, akkor Qv = λv ´es T 2 (Qv) Qv = λ = λ, teh´at Q saj´at´ert´eke csak 0 vagy 1 lehet, de akkor pontosan r-sz´am´ u 1 ´es a t¨obbi 0. i) Nyilv´anval´o.
P ii)-iii) Legyen teh´at Q = ri=1 vi viT ahol (vi )ri=1 ⊂ Rn ortonorm´alt vektorrendszer, akkor 2 r X 1 1 T 2 Tξ −m ξ Qξ = vi + 2 ξ T Qm − 2 mT Qm 2 σ σ σ σ i=1
ahol v1T ξ−m , . . . vrT ξ−m korrel´alatlan, teh´at f¨ uggetlen standard norm´alis eloszσ σ l´as´ u v.v.-k. Ebb˝ol v´arhat´o ´ert´eket sz´amolva kapjuk iii)-t, ´es k¨ovetkezik az a´ll´ıt´as, figyelmbe v´eve, hogy mT Qm = 0 ⇔ Qm = 0.
´ 8.1. χ2 ELOSZLAS
83
A b) a´ll´ıt´as a ii) k¨ovetkezm´enye, ha m = 0, ´es η = Qξ. Megjegyz´ es: Az i) ´es iii) a´ll´ıt´asok tetsz˝oleges n-dimenzi´os ξ v.v.v. eset´en is teljes¨ ulnek. 4. A χ2 eloszl´as part´ıci´os tulajdons´aga (Fisher-Cochran t´etel). Legyenek a Q1 , Q2 , . . . , Qk ∈ Rn×n szimmetrikus m´ atrixok rangjai az r1 , r2 , . . . , rk pozit´ıv eg´eszek, ´es teljes¨ ulj¨ on: I = Q 1 + Q2 + . . . + Q k
(8.1)
ahol I ∈ Rn×n az egys´egm´ atrix, legyen tov´ abb´ a ξ ∈ N (m, σ 2 I) norm´ alis eloszl´ as´ u vektor val´ osz´ın˝ us´egi v´ altoz´ o. Ekkor az a)-d) felt´etelek ekvivalensek: (a) n ≥ r1 + r2 + . . . + rk ; (b) n = r1 + r2 + . . . + rk ; (c) Qi Qi = Qi
i = 1, 2, . . . k;
(d) Qi Qj = 0 ∈ Rn×n ha i 6= j = 1, 2, . . . k; ´es b´ armelyikb˝ ol k¨ ovetkeznek az al´ abbiak: (e) ξ T Qi ξ = (Qi ξ)T (Qi ξ) i = 1, 2, . . . k; n´egyzet¨ osszegek, ´es ξ T ξ = (f) Qi ξ (g)
i = 1, 2, . . . k
1 T ξ Qi ξ σ2
∈ χ2ri
⇔
illetve
ξ T Qi ξ
i = 1, 2, . . . k
P
i
ξ T Qi ξ
f¨ uggetlenek;
mT Qi m = 0 i = 1, 2, . . . , k;
Bizony´ıt´ as. El˝obb az a)-d) felt´etelek ekvivalenci´aj´at bizony´ıtjuk. a⇒b Mivel x = Q1 x + Q2 x + . . . + Qk x, Rn minden vektora, p´eld´aul egy b´azisa, el˝oa´ll legfeljebb r1 + r2 + . . . + rk sz´am´ u vektor line´aris kombin´aci´ojak´ent, teh´at n ≤ r1 + r2 + . . . + rk , amib˝ol k¨ovetkezik az a´ll´ıt´as. b⇒c Ha n = r1 +r2 +. . .+rk , akkor Q1 , . . . , Qk r1 +r2 +. . .+rk sz´am´ u oszlopvektora b´azis. Ha. q a Q1 ezen b´azishoz tartoz´o oszlopvektora, vagyis az r1 sz´am´ u line´arisan f¨ uggetlen oszlopvektor egyike, akkor az egy´ertelm˝ u el˝oa´ll´ıt´as ´es q = Q1 q + Q2 q + . . . + Q k q miatt Q1 q = q kell hogy teljes¨ ulj¨on. Ha p a Q1 olyan oszlopvektora, amely az r1 sz´am´ u f¨ uggetlen oszlopvektor line´aris kombin´aci´oja, akkor is Q 1 p = p. Teh´at Q1 Q1 = Q1 , ´es hasonl´oan Qi Qi = Q i
i = 1, 2, . . . , k. K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
´ 8. FEJEZET. NEVEZETES ELOSZLASOK
84
c⇒d c) miatt xT Qi x = (Qi x)T (Qi x) ≥ 0 x ∈ Rn oszlopvektora, akkor
i = 1, 2, . . . k. Ha q a Q1 egy
q T q = q T q + q T Q2 q + . . . + q T Qk q q T Qi q = (Qi q)T (Qi q) ≥ 0 i = 2, 3, . . . k amib˝ol k¨ovetkezik Qi q = 0 ∈ Rn , vagyis Qi Q1 = 0 ∈ Rn×n hasonl´oan Qi Qj = 0 ∈ Rn×n i 6= j = 1, 2, . . . k;
i = 2, 3, . . . k, ´es
d⇒a Szorozzuk (8.1) mindk´et oldal´at pl. Q1 -el, kapjuk Q1 = Q 1 Q1 teh´at teljes¨ ul c) is. Tegy¨ uk fel, hogy n < r1 + r2 + . . . + rk , akkor a z´erusvektor kifejezhet˝o u ´ gy, hogy 0 = Q 1 x1 + . . . + Q k xk ahol az xi kombin´al´o vektoroknak az ri sz´am´ un k´ıv¨ uli, nem f¨ uggetlen vektorokhoz tartoz´o kordin´at´ai null´ak, ´es van k¨oz¨ott¨ uk nem z´erusvektor, pl.x 1 Ekkor Q1 -el balr´ol szorozva kapjuk 0 =Q1 x1 ami nem teljes¨ ulhet, mert Q1 line´arisan f¨ uggetlen vektoraib´ol csak trivi´alis m´odon kombin´alhat´o ki a z´erusvektor. Teh´at az n < r1 + r2 + . . . + rk indirekt felt´etel nem teljes¨ ulhet, vagyis n ≥ r1 + r2 + . . . + r k . Az e)-g) a´ll´ıt´asok k¨ovetkeznek az a)-d) felt´etelekb˝ol ´es a 3. tulajdons´agb´ol. Megjegyz´ es: A part´ıci´os tulajdons´ag annak felt´etel´et adja, hogy a ξ T ξ = ξ T Q1 ξ + ξ T Q2 ξ + . . . + ξ T Qk ξ n´egyzet¨osszeg felbont´as´anak tagjai mikor lesznek f¨ uggetlen n´egyzet¨osszegek, ´es ezek ponuak, ha v´arhat´o ´ert´ek¨ uk ennek megfelel˝o, mivel az g)-ben szerepl˝o tosan akkor χ2ri eloszl´as´ mT Qi m = 0 felt´etel ´es E( σ12 ξ T Qi ξ) = ri ekvivalensek. 8.2. K¨ ovetkezm´ eny. Legyenek a ξ 1 , ξ 2 , . . . ξ n ∈ N (m, σ) skal´ ar val´ osz´ın˝ us´egi v´ altoz´ ok f¨ uggetlenek, akkor n n X 2 1 X ∗2 ¯ξ = 1 ξ i ´es s = ξ i − ¯ξ (8.2) n i=1 n − 1 i=1 f¨ uggetlenek, tov´ abb´ a
¯ξ ∈ N
σ m, √ n
´es
n − 1 ∗2 s ∈ χ2n−1 . σ2
(8.3)
´ 8.1. χ2 ELOSZLAS
85
Bizony´ıt´ as. Jel¨olje
Q2 =
1 n 1 n
1 n 1 n
··· ··· .. .
1 n 1 n
1 n
1 n
···
1 n
Q1 = .. .
.. .
1 − n1 − n1 · · · − n1 − n1 1 − n1 · · · − n1 .. .. .. .. . . . . 1 1 −n − n · · · 1 − n1
n×n .. ∈ R .
∈ Rn×n
r1 = rang(Q1 ) = 1
r2 = rang(Q2 ) ≤ n − 1
mivel Q2 · 1 = 0 ∈ Rn
szimmetrikus m´atrixokat ´es ξ ∈ N (m · 1, σ 2 · I), amivel teljes¨ ul I =Q1 + Q2
1T =
1 1 ··· 1
´es n ≥ r1 + r2 .
Teh´at ´es
f¨ uggetlenek, ´es ez´ert
n = r1 + r2 ⇒ r2 = n − 1
Q1 ξ =
¯ξ ¯ξ .. . ¯ξ
Q2 ξ =
¯ξ ´es ξ T Q2 ξ =
n X i=1
ξ 1 − ¯ξ ξ 2 − ¯ξ .. . ξ n − ξ¯
2 ξ i − ¯ξ
f¨ uggetlenek, de akkor ¯ξ ´es s∗2 is f¨ uggetlen. Tov´abb´a nyilv´anval´oan teljes¨ ul ¯ξ ∈ N m, √σ , n ´es Q2 · (m · 1) = 0n miatt
n − 1 ∗2 s ∈ χ2n−1 . σ2
8.3. K¨ ovetkezm´ eny. Legyen ν 1 , ν 2 , . . . , ν r n-edrend˝ u p1 , p2 , . . . , pr param´eter˝ u polinomia ´lis eloszl´ as´ u, akkor nagy n (npk > 10) eset´en a r X (ν k − npk )2 k=1
npk
(8.4)
val´ osz´ın˝ us´egi v´ altoz´ o eloszl´ asa k¨ ozel χ 2r−1 . K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
´ 8. FEJEZET. NEVEZETES ELOSZLASOK
86
Bizony´ıt´ as. A k¨ozponti hat´areloszl´as t´etel miatt a ν = (ν 1 , ν 2 , . . . , ν r ) eloszl´asa k¨ozel´ıt˝oen norm´alis, teh´at feltehetj¨ uk (haszn´aljuk a 78. oldal 3. feladat eredm´eny´et) p1 p1 (1 − p1 ) −p1 p2 ··· −p1 pr p2 −p2 p1 p2 (1 − p2 ) · · · −p2 pr ν ∈ N n .. , n .. .. .. .. . . . . . pr −pr p1 −pr p2 · · · pr (1 − pr )
´es ´ıgy
ν = ∗
ahol
p=
p1 p2 .. . pr
√1 np1
0
0 .. .
√1 np2
.. . 0
0
√ p √ 1 √ p2 p = .. . √ pr
··· ··· .. . ···
0 .. . .. . √1 npr
Q=
(ν − n · p) ∈ N (0, Q)
√ √ 1 − p 1 − p1 p2 · · · − p1 pr √ √ − p2 p1 1 − p 2 · · · − p2 pr .. .. .. .. . . . . √ √ − pr p1 − pr p2 · · · 1 − p r
Teh´at Q ∈ Rr×r szimmetrikus m´atrix, ´es
√ √ T p· p I =Q + √ √ T √ p · p = 0r×r , teh´at k¨ovetkeznek Q p = 0 ∈ Rr ez´ert Q · √ √ T QQ = Q rang(Q) = r − rang p· p =r−1 , tov´abb´a a χ2 eloszl´as 3.b) n´egyzet¨osszeg tulajdons´aga miatt ∗T
∗
ν ν =
r X (ν k − npk )2 k=1
8.2.
npk
∈ χ2r−1 .
T ´ es F-eloszl´ as
8.4. Defin´ıci´ o. i) Legyenek ξ ∈ N (0; 1) ´es η ∈ χ2n val´ osz´ın˝ us´egi v´ altoz´ ok f¨ uggetlenek, a ξ t = pη
n
v.v. eloszl´ as´ at n-szabads´agi fok´ u T eloszl´asnak nevezz¨ uk, jel¨ ol´ese: t ∈ Tn .
.
´ F-ELOSZLAS ´ 8.2. T ES
87
ii) Legyenek η 1 ∈ χ2n1 , η 2 ∈ χ2n2 val´ osz´ın˝ us´egi v´ altoz´ ok f¨ uggetlenek, az f=
η 1 n2 · η 2 n1
v.v. eloszl´ as´ at (n1 , n2 )-szabads´agi fok´ u F -eloszl´asnak nevezz¨ uk, jel¨ol´ese f ∈ Fn1 ,n2 . Megjegyz´ es: A T ´es F eloszl´as folytonos, s˝ ur˝ us´egf¨ uggv´eny¨ uk megadhat´o, tulajdons´agaik 2 egyszer˝ uen k¨ovetkeznek a defin´ıci´ob´ol ´es a χ eloszl´as tulajdons´agaib´ol. AT ´ es F eloszl´ as tulajdons´ agai: 1. A T -eloszl´as szimmetrikus az x = 0 -ra, vagyis ha t ∈ Tn akkor −t ∈ Tn . 2. Ha n el´eg nagy (n > 120) ´es t ∈ Tn akkor t eloszl´asa k¨ozel N (0, 1). 3. Az eloszl´as k¨ ul¨onb¨oz˝o α ∈]0; 1[ ´es n ∈ N+ ´ert´ekekhez tartoz´o un. tα kritikus ´ert´ek ei, melyekre P (|η| > tα ) = α ha η ∈ Tn , t´abl´azatb´ol nyerhet˝ok (l´asd B. f¨ uggel´ek). Az n = ∞ jelenti a standard norm´alis eloszl´asra vonatkoz´o uα -val jel¨olt kritikus ´ert´ekeket. 4. Ha f ∈ Fn1 ,n2 akkor
1 f
∈ Fn2 ,n1 .
5. Ha f ∈ Fn1 ,n2 ´es n2 el´eg nagy (n > 80, 120) n1 · f
eloszl´asa k¨ozel χ2n1 .
6. Az eloszl´as k¨ ul¨onb¨oz˝o α ∈]0; 1[ ´es n1 , n2 ∈ N+ ´ert´ekekhez tartoz´o un. fα kritikus ´ert´ek ei, melyekre P (η > fα ) = α ha η ∈ Fn1 ,n2 , t´abl´azatb´ol nyerhet˝ok (l´asd B. f¨ uggel´ek). A t´abl´azatok a kis α = 0.1, 0.05, · · · ´ert´ekez tartoz´o ”fels˝o” fα kritikus ´ert´eket szolg´altatj´ak, az ”als´o” f1−α kritikus ´ert´eket, melyre P (η > f1−α ) = 1 − α ha η ∈ Fn1 ,n2 kapjuk az P
1 1 > η f1−α
=α
1 ∈ Fn2 ,n1 η
o¨sszef¨ ug´es szerint, mint a ford´ıtott szabads´agi fok-p´arhoz tartoz´o fels˝o kritikus ´ert´ek reciprok´at. K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
´ 8. FEJEZET. NEVEZETES ELOSZLASOK
88
8.3.
Feladatok
1. Adjuk meg a χ21 ´es χ22 eloszl´asok s˝ ur˝ us´egf¨ uggv´eny´et! 2. Adjuk meg a χ2n eloszl´as karakterisztikus f¨ uggv´eny´et! 3. Adjuk meg a (8.2)-ben szerepl˝o s∗2 , valamint s2 = v´arhat´o ´ert´ek´et, sz´or´as´at!
n−1 ∗2 s n
val´osz´ın˝ us´egi v´altoz´ok
4. Legyen ξ ∈ N (m, V ) n-dimenzi´os folytonos norm´alis eloszl´as´ u, ´es keress¨ unk olyan k ∈ R sz´amot, hogy P (ξ − m)T V −1 (ξ − m) ≤ k = 1 − α teljes¨ ulj¨on!
5. Legyen ξ ∈ N (m, σ 2 · Q) ahol m ∈ Rn×1
Q ∈ Rn×n
Q = QT
Q·Q=Q
rang(Q) ≥ 1 σ > 0 .
Mutassuk meg, hogy az
1 · ξ T Qξ 2 σ val´osz´ın˝ us´egi v´altoz´o eloszl´asa meghat´arozott az r = rang(Q) ranggal, ´es a λ = 1 T · m Qm un. nemcentr´alts´agi param´eterrel (η eloszl´asa az un. nemcentr´alt χ2 σ2 eloszl´as). η=
6. H´arom egyenk´ent 100 o´ra v´arhat´o ´elettartam´ u (exponenci´alis eloszl´as´ u) izz´ot egym´as ut´an felhaszn´alva, (a) milyen id˝otartamn´al lesz t¨obb az o¨ssz-´elettartam 0.9 val´osz´ın˝ us´eggel? (b) milyen hat´arok k¨oz¨ott lesz az a´tlag´elettartam 0.9 val´osz´ın˝ us´eggel? (c) milyen hat´arok k¨oz¨ott lesz 30 izz´o a´tlag´elettartama 0.95 val´osz´ın˝ us´eggel? 7. Egy 100 o´ra v´arhat´o ´elettartam´ u alkatr´esz ´elettartam´an´al h´anyszor t¨obb egy 800 o´r´as v´arhat´o ´elettartam´ u alkatr´esz ´elettartama 0.95 val´osz´ın˝ us´eggel? Tegy¨ uk fel, hogy az alkatr´eszek ´elettartama f¨ uggetlen exponenci´alis eloszl´as´ u!
9. fejezet Regresszi´ o anal´ızis A ξ ´es η (vektor-) val´osz´ın˝ us´egi v´altoz´okhoz keress¨ uk azt az f un. regresszi´os f¨ uggv´enyt, mellyel az η ≈ f (ξ)
k¨ozel´ıt´es a ”legjobb”. Hogy mi a legjobb k¨ozel´ıt´es, az f¨ ugg a v´alasztott c´elf¨ uggv´enyt˝ol, ´es a sz´oba j¨ohet˝o regresszi´os f¨ uggv´enyek halmaz´at´ol. Egy ilyen c´elf¨ uggv´eny, melynek minimum´at keress¨ uk, lehet az E |η − f (ξ)|2 u.n. marad´ek sz´or´asn´egyzet, vagy az
E (|η − f (ξ)|) abszolut elt´er´es v´arhat´o ´ert´eke. Ha az f f¨ uggv´enyt speci´alis form´aban keress¨ uk, besz´elhet¨ unk ennek megfelel˝oen η ≈ Aξ + b line´aris η ≈ a0 + a1 ξ + a2 ξ 2 + · · · + ap ξ p polinomi´alis η ≈ eAξ+b exponenci´alis .. .. . . regresszi´os feledatr´ol. Mivel a legt¨obb (elegend˝oen sima) f¨ uggv´eny j´ol k¨ozel´ıthet˝o line´aris f¨ uggv´ennyel (esetleg ´ertelmez´esi tartom´any´anak megfelel˝o lesz˝ uk´ıt´es´evel), illetve m´as esetekben u ´ j komponensek bevezet´es´evel (pl. polinom f¨ uggv´enyek), vagy egyszer˝ u transzform´aci´oval (pl. exponenci´alis f¨ uggv´enyek) a kit˝ uz¨ott feladat line´aris regressz´os f¨ uggv´eny keres´es´et jelenti.
9.1.
T¨ obbv´ altoz´ os line´ aris regresszi´ o
Feladat: Legyen η q-dimenzi´ os ´es ξ p-dimenzi´ os vektor val´ osz´ın˝ us´egi v´ altoz´ o. Keress¨ uk az η un. f¨ ugg˝o v´altoz´o legjobb line´ aris k¨ ozel´ıt´es´et a ξ un. f¨ uggetlen v´altoz´oval, azaz keress¨ uk az A ∈ Rq×p m´ atrixot ´es b ∈ Rq vektort 89
´ ANAL´IZIS 9. FEJEZET. REGRESSZIO
90 u ´gy, hogy az η ≈ Aξ + b k¨ ozel´ıt´es
σ 2R = E |η − Aξ − b)|2
hib´ aja, az un. marad´ek sz´ or´ asn´egyzet, minim´ alis legyen! Megjegyz´ esek:
1. Jel¨olje η = (η 1 , η 2 , . . . , η q ) ξ = (ξ 1 , ξ 2 , . . . , ξ p ), tov´abb´a aT1 aT 2 A = .. . aTq
ahol ai ∈ Rp ´es b = (b1 , b2 , . . . , bq ) ∈ Rq . Mivel a marad´ek sz´or´asn´egyzet az al´abbi o¨sszegre bonthat´o q X 2 E (η i − aTi ξ − bi )2 , σR = i=1
el´eg a q = 1 esetben megoldani a sz´els˝o´ert´ek feladatot.
2. Felt´etelezhetj¨ uk, hogy ξ komponensei k¨oz¨ott nincs line´aris o¨sszef¨ ugg´es, azaz cov(ξ, ξ) ∈ Rp×p invert´alhat´o. Megold´ as: q = 1 eset. Legyen η skal´ar v.v., ´es keress¨ uk azt az a ∈ Rp vektort valamint b ∈ R sz´amot melyekre σ 2R = E (η − aT ξ − b)2 ´ minim´alis. Atalak´ ıtva kapjuk:
σ 2R = cov(η, η) − 2 cov(η, ξ)a + aT cov(ξ, ξ)a + E(η) − aT E(ξ) − b amib˝ol kapjuk az aT = cov(η, ξ) cov(ξ, ξ)−1
b = E(η) − aT E(ξ)
minimum helyet, ´es ezzel a minimum σ 2R = cov(η, η) − cov(η, ξ) cov(ξ, ξ)−1 cov(η, ξ)T ´ert´ek´et.
2
¨ ´ ´ LINEARIS ´ ´ 9.1. TOBBV ALTOZ OS REGRESSZIO
91
q > 1 eset. Vezess¨ uk be az al´abbi jel¨ol´eseket: m1 = E(η) ∈ Rq m2 = E(ξ) ∈ Rp V12 = cov(η, ξ) ∈ Rq×p V11 = cov(η, η) ∈ Rq×q V21 = cov(ξ, η) ∈ Rp×q V22 = cov(ξ, ξ) ∈ Rp×p ekkor a fenti eredm´enyb˝ol kapjuk a line´aris regresszi´os feledat megold´as´at A = V12 V22−1
b = m1 − Am2 .
´es a marad´ek sz´or´asn´egyzet minim´alis σ 2R = tr V11 − V12 V22−1 V21
´ert´ek´et, ahol tr(·) a n´egyzetes m´atrix f˝oa´tl´oj´aban l´ev˝o elemek o¨sszeg´et jelenti. Vizsg´ aljuk a tov´abbiakban az η = η 0 + η 00 felbont´ast, ahol η 0 = Aξ + b a ξ-vel k¨ozel´ıtett r´esz; η 00 = η − Aξ − b a marad´ek; Itt, ´es a tov´abbiakban A ´es b a fenti sz´els˝o´ert´ek feladat megold´as´at jel¨oli. A k´et r´esz tulajdos´agai a k¨ovetkez˝ok: 1. E(η 0 ) = m1 , E(η 00 ) = 0 ∈Rq . 2. cov(ξ, η 00 ) = 0 ∈Rp×q , cov(η 0 , η 00 ) = 0 ∈Rq×q , teh´at a ξ-vel le´ırt r´esz ´es a marad´ek korrel´alatlan, norm´alis eloszl´as eset´en f¨ uggetlen. 3. VR = cov(η 00 , η 00 ) = V11 − V12 V22−1 V21 az un. marad´ek kovariancia m´atrix, melynek f˝oa´tl´oj´aban l´ev˝o elemeket o¨sszeadva kapjuk a marad´ek sz´or´asn´egyzetet: σ 2R = tr (VR ) . Ezen marad´ek kovariancia m´atrixb´ol sz´am´ıthat´o η 00 i 6= j komponensei k¨ozti olyan o¨sszef¨ ugg´es m´ert´eke, mely ξ hat´as´at´ol mentes, m´ask´eppen fogalmazva, η komponensei k¨ozti tiszta kapcsolat m´ert´eke. Ezt nevezz¨ uk az η i ´es η j k¨ozti, ξ-re vonatkoz´o parci´alis korrel´aci´os egy¨ utthat´onak. Jel¨ol´ese: ρ η i η j |ξ. 4. Ha q = 1, a marad´ek kovariancia m´atrix 1 × 1 t´ıpus´ u, σ 2R = D 2 (η) − V12 V22−1 V21 . Felt´eve, hogy η sz´or´asa sem nulla, a regresszi´os kapcsolat szoross´ag´at jelzi az η ´es η 0 k¨ozti korrel´aci´os egy¨ utthat´o, amit az η v.v. ξ-re vonatkoz´o t¨obbsz¨or¨os korrel´aci´os egy¨ utthat´oj´anak nevez¨ unk. Jel¨ol´ese, ´es kisz´am´ıt´asa a fentiek alapj´an: s p −1 σ2 V12 V22 V21 ρη|ξ = = 1 − 2R (9.1) D(η) D (η) K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
´ ANAL´IZIS 9. FEJEZET. REGRESSZIO
92
ennek n´egyzete az un. determin´aci´os egy¨ utthat´o, amivel a marad´ek sz´or´asn´egyzet σ 2R = D 2 (η) 1 − ρ2η|ξ kifejezhet˝o. Mindezekb˝ol egyszer˝ uen k¨ovetkeznek:
ρη|ξ = 1 ⇔ σ 2R = 0; ρη|ξ = 0 ⇔ cov(η, ξ) = 0 ∈ Rp ⇔ a = 0 ∈ Rp ;
(9.2)
tov´abb´a, ha p = 1, ´es r jel¨oli a ξ ´es η v´altoz´o 4.3 szerinti korrel´aci´os egy¨ utthat´oj´at, akkor ρη|ξ = |r| . (9.3) A line´aris regresszi´os feladat egyben megold´as´at adja a k¨ovetkez˝o nevezetes probl´em´anak is. Feladat (Legkisebb n´ egyzetek m´ odszere): Az (yk , xk1 , xk2 , . . . , xkp ) ∈ R1+p 1, 2, . . . , n pontokhoz keress¨ uk az
k =
a0 , a1 , . . . , ap ∈ R egy¨ utthat´ okat u ´gy, hogy a n X k=1
[yk − (a0 + a1 xk1 + a2 xk2 + · · · + ap xkp )]2
(9.4)
n´egyzet¨osszeg minim´alis legyen! Megold´ as: Legyen az (η, ξ 1 , ξ 2 , . . . , ξ p ) : Ω → R1+p vektor val´osz´ın˝ us´egi v´altoz´o eloszl´asa P (η = yk , ξ 1 = xk1 , ξ 2 = xk2 , . . . , ξ p = xkp ) =
1 n
k = 1, 2, . . . , n ,
akkor a 9.4 n´egyzet¨osszeg minimum´at az η ≈ a 0 + a1 ξ 1 + a2 ξ 2 + · · · + a p ξ p regresszi´os feladat megold´asak´ent kapjuk. Ha m´eg p = 1, 4.4 szerint kapjuk P xk yk − x¯y¯ a1 = 1 P 2 xk − x¯2 n 1 n
a0 = y¯ − a1 x¯
σ 2R
X 1 2 2 yk − y¯ − = n
1 n
2 P xk yk − x¯y¯ P 2 . (9.5) 1 2 x − x ¯ k n
´ ´ FELTETELES ´ ´ ´ ERT ´ EK ´ 9.2. ELMELETI REGRESSZIO, VARHAT O
9.2.
93
Elm´ eleti regresszi´ o, felt´ eteles v´ arhat´ o´ ert´ ek
A line´aris regresszi´os feladatban a f¨ ugg˝o v´altoz´ot a f¨ uggetlen v´altoz´o line´aris f¨ uggv´eny´evel k¨ozel´ıtett¨ uk. Keress¨ uk most a legjobban k¨ozel´ıt˝o f¨ uggv´enyt nem csak a line´aris f¨ uggv´enyek k¨or´eben, ´es ha van ilyen, azt a legjobb, vagy elm´eleti regresszi´os f¨ uggv´enynek is nevezz¨ uk. A k¨ovetkez˝o gondolatmenetben v´azoljuk a pontos megfogalmaz´as ig´enye n´elk¨ ul a feladat megoldhat´os´ag´aval kapcsolatos fogalmakat (l´asd: A. f¨ uggel´ek). A tov´abbiakban teh´at fontos szerepet t¨oltenek be azon q-dimenzi´os, illetve skal´ar val´osz´ın˝ us´egi v´altoz´ok, melyek komponensei n´egyzetesen integr´alhat´ok, jel¨olje ezeket L2 , ahol k¨ ul¨on nem jel¨olj¨ uk a dimenzi´ot. Ekkor L2 teljes vektorh´al´o a < ξ, η >L2 = E (< ξ, η >)
ξ, η ∈ L2
skal´aris szorzatb´ol sz´armaztathat´o al´abbi f´elnorm´aval: q p kξk = E |ξ|2 = E (< ξ, ξ >) ξ ∈ L2 .
Haszn´aljuk tov´abb´a az un. m´erhet˝o f¨ uggv´enyek fogalm´at, vagyis azon f : Rp → Rq f¨ uggv´enyeket, melyekre teljes¨ ul ∀I ⊂ Rq intervallum eset´en f −1 (I) ∈ σ {J | J ⊂ Rp intervallum} . Ilyen f¨ uggv´enyek ´es vektor val´osz´ın˝ us´egi v´altoz´ok f ◦ξ o¨sszet´etel´eb˝ol mind´ıg val´osz´ın˝ us´egi 2 v´altoz´ot kapunk, ´es ha azokat v´alasztjuk melyekre |f ◦ ξ| -nak van v´arhat´ qo ´ert´eke, az Rp → Rq t´ıpus´ u f¨ uggv´enyek egy teljes vektorh´al´oj´at kapjuk az kf k = E |f ◦ ξ|2 f´elnorm´aval. A tov´abbiakban szerepl˝o f¨ uggv´enyek mind´ıg ilyenek lesznek, ez´ert azt k¨ ul¨on nem eml´ıtj¨ uk a felt´etelek k¨oz¨ott, ´es az eml´ıtett teljess´eg miatt, a kit˝ uz¨ott feladatnak mind´ıg van megold´asa, amit a legfontosabb esetekben meg is adunk. 9.1. Defin´ıci´ o. Az η ∈ L2 q-dimenzi´os (vektor-) val´osz´ın˝ us´egi v´altoz´o ξ : Ω → Rp (v.)v.v.-ra vonatkoz´o felt´eteles v´arhat´o ´ert´ek´enek nevezz¨ uk a H : Rp → R q f¨ uggv´enyt, illetve a H ◦ ξ : Ω → Rq
val´osz´ın˝ us´egi v´altoz´ot, melyre minden h : Rp → Rq f¨ uggv´eny eset´en: E |η − H ◦ ξ|2 ≤ E |η − h ◦ ξ|2 .
Jel¨ol´ese:
E(η|ξ = .) = H illetve
vagy E(η|ξ = x) = H(x) /x ∈ Rp / E(η|ξ) = H ◦ ξ .
K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
´ ANAL´IZIS 9. FEJEZET. REGRESSZIO
94 Megjegyz´ esek:
1. A k´es˝obbiekben szerepl˝o η vektor val´osz´ın˝ us´egi v´altoz´ok mind´ıg L 2 -beliek lesznek, ´es p q a kor´abbi R → R t´ıpus´ u f¨ ugv´enyekkel kapcsolatos megjegyz´es¨ unk szerint mind´ıg l´eteznek majd a szerepl˝o v´arhat´o ´ert´ekek. 2. A felt´eteles v´arhat´o ´ert´eken teh´at vagy egy E(η|ξ = x) = H(x) /x ∈ R p / f¨ uggv´enyt (elm´eleti regresszi´os f¨ uggv´eny), vagy egy E(η|ξ) = H(ξ) val´osz´ın˝ us´egi v´altoz´ot (regresszi´os k¨ozel´ıt´es) ´ert¨ unk, ami a fenti ´ertelemben legjobban k¨ozel´ıti az η f¨ ugg˝o v´altoz´ot. 3. Vektor v.v. komponens´enek felt´eteles v´arhat´o ´ert´eke a felt´eteles v´arhat´o ´ert´ek megfelel˝o komponense, mivel: q X E |η i − Hi ◦ ξ|2 E |η − H ◦ ξ|2 = i=1
ahol η = (η 1 , η 2 , . . . η q ) ´es H = (H1 , H2 , . . . , Hq ). Ebb˝ol k¨ovetkezik, hogy a felt´eteles v´arhat´o ´ert´ek tulajdons´agait, kisz´am´ıt´asi m´odjait el´eg a q = 1 esetben vizsg´alni. 4. A felt´eteles v.´e. ξ-szerint 1-val´osz´ın˝ us´eggel meghat´arozott. Ha ugyanis P (E(η|ξ) = H ∗ ◦ ξ) = 1, akkor H ∗ is rendelkezik a definici´oban le´ırt minimum tulajdons´aggal. K´es¨obb azt is l´atni fogjuk, hogy b´armely, a minimum tulajdos´agot teljes´ıt˝o H 0 ´es H 00 eset´en P (H 0 ◦ ξ = H 00 ◦ ξ) = 1. Ez´ert egy felt´eteles v´arhat´o ´ert´eket meghat´aroz´o E(η|ξ = .) f¨ uggv´enyt el´eg megadni ξ ´ert´ekk´eszlet´enek 1-val´osz´ın˝ us´eg˝ u r´esz´en. A felt´ eteles v´ arhat´ o´ ert´ ek tulajdons´ agai: 1. A felt´eteles v.´e. v´ arhat´ o´ ert´ eke a felt´etel n´elk¨ uli v´arhat´o ´ert´ek: Legyenek η : Ω → Rq , ξ : Ω → Rp (v.)v.v.-k, akkor E (E(η|ξ)) = E(η). Bizony´ıt´ as. Legyen q = 1, ´es jel¨olje m = E(η) − E (E(η|ξ)), akkor a v´arhat´o ´ert´ek minimum tulajdons´aga miatt E [η − E(η|ξ)]2 ≥ E [η − E(η|ξ) − m]2 ,
ahol a felt´eteles v´arhat´o ´ert´ek minimum tulajdos´aga miatt csak egyenl˝os´eg lehet, ami pontosan akkor teljes¨ ul, ha m = 0.
´ ´ FELTETELES ´ ´ ´ ERT ´ EK ´ 9.2. ELMELETI REGRESSZIO, VARHAT O
95
2. A felt´eteles v´arhat´o ´ert´ek mint ortogon´ alis vet¨ ulet: q p Legyenek η : Ω → R , ξ : Ω → R (v.)v.v.-k, a H : Rp → Rq f¨ uggv´enyre H = E(η|ξ = .) ⇐⇒ ha ∀h : Rp → Rq eset´en E (η − H ◦ ξ)T h ◦ ξ = 0. Bizony´ıt´ as.
⇐ Tegy¨ uk fel most, hogy ∀h : Rp → Rq eset´en E (η − H ◦ ξ)T h ◦ ξ = 0. Ekkor E (η − E(η|ξ))2 = E ((η − H ◦ ξ) + (H ◦ ξ − E(η|ξ)))2 = E (η − H ◦ ξ)2 + E (H ◦ ξ − E(η|ξ))2
amib˝ol k¨ovetkezik E ((E(η|ξ) − H ◦ ξ)2 ) = 0, vagyis P (E(η|ξ) = H ◦ ξ) = 1.
⇒ Legyen q = 1, ´es tegy¨ uk fel, hogy H = E(η|ξ = .) ´es h : Rp → R olyan, hogy E ((η − H ◦ ξ) · h ◦ ξ) 6= 0 .
Jel¨olje τ = η − H ◦ ξ, ´es vizsg´aljuk a τ ∼ a · h ◦ ξ + b line´aris regresszi´os feladatot. A marad´ek sz´or´asn´egyzetre ekkor kapjuk: σ 2R = σ 2τ · 1 − r 2 , amib˝ol r 6= 0 miatt k¨ovetkezik
σ 2R = E (η − H ◦ ξ − a · h ◦ ξ − b)2 < σ 2τ = E (η − H ◦ ξ)2
ami nem teljes¨ ulhet ha H a felt´eteles v´arhat´o ´ert´ek.
K¨ ovetkezm´ enyek: (a) A bizony´ıt´asb´ol k¨ovetkezik az a kor´abbi megjegyz´es is, mely szerint a mininumfeladat b´armely k´et megold´asa 1-val´osz´ın˝ us´eggel megegyezik. (b) Ha (ξ, η) egy¨ uttes eloszl´asa norm´alis, akkor a line´aris regressz´os f¨ uggv´eny egyben a felt´eteles v´arhat´o ´ert´ek, mivel az η − Aξ − b marad´ek ´es ξ (vagy h ◦ ξ) ekkor f¨ uggetlenek, de akkor E (η − Aξ − b)T h ◦ ξ = 0.
Megjegyz´ es:
(a) Az a´ll´ıt´asban szerepl˝o h : Rp → Rq m´erhet˝o f¨ uggv´enyek helyett el´eg a q = 1 eset, ´es a h = 1I I ⊂ Rp intervallum alak´ u f¨ uggv´eny tetsz˝oleges v´alaszt´asa.. K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
´ ANAL´IZIS 9. FEJEZET. REGRESSZIO
96 (b) Az ortogonalit´as az E (η · h ◦ ξ)
illetve E (E(η|ξ) · h ◦ ξ)
v´arhat´o ´ert´ekek egyenl˝os´eg´evel ekvivalens, ´es itt a ” · ” m˝ uvelet nem csak skal´aris szorz´as lehet, hanem vektor skal´arral val´o szorz´asa is, mivel a felt´eteles v´arhat´o ´ert´ek komponensei a felt´eteles v´arhat´o ´ert´ek megfelel˝o komponensei. 3. Homog´ en: Legyenek η : Ω → Rq , ξ : Ω → Rp (v.)v.v.-k, ϕ : Rp → R, akkor E (ϕ ◦ ξ · η | ξ) = ϕ ◦ ξ · E (η|ξ) Bizony´ıt´ as. Legyen q = 1, ´es ellen˝or´ızz¨ uk az ortogonalit´ast: E ((ϕ ◦ ξ · η − ϕ ◦ ξ · E (η|ξ)) · h ◦ ξ) = E ((η − E (η|ξ)) · ϕ ◦ ξ · h ◦ ξ) = 0 . 4. Addit´ıv: Legyenek η 1 , η 2 : Ω → Rq , ξ : Ω → Rp (v.)v.v.-k, akkor E(η 1 + η 2 | ξ) = E(η 1 |ξ) + E(η 2 |ξ) Bizony´ıt´ as. Legyen q = 1, ´es az ortogonalit´as ellen˝orz´es´ehez sz´amoljuk ki a E ((η 1 + η 2 ) · h ◦ ξ) = E (η 1 · h ◦ ξ) + E (η 2 · h ◦ ξ) E ((E(η 1 |ξ) + E(η 2 |ξ)) · h ◦ ξ) = E (E(η 1 |ξ) · h ◦ ξ) + E (E(η 2 |ξ) · h ◦ ξ) v´arhat´o ´ert´ekeket. 5. Nemnegat´ıv: Legyenek η≥0, ξ : Ω → Rp (v.)v.v.-k, akkor P (E(η|ξ) ≥ 0) = 1. Bizony´ıt´ as. Mivel (η − E(η|ξ))2 ≥ (η − max {0; E(η|ξ)})2 , k¨ovetkezik az a´ll´ıt´as. K¨ ovetkezm´ eny: Ha η 1 ≤ η 2 ξ : Ω → Rp (v.)v.v.-k, akkor P (E(η 1 |ξ) ≤ E(η 2 |ξ)) = 1. 6. F¨ uggetlen v.v.-k felt´ eteles v´ arhat´ o´ ert´ eke: q p Legyenek η : Ω → R , ξ : Ω → R (v.)v.v.-k f¨ uggetlenek, akkor E(η|ξ) = E(η). Bizony´ıt´ as. Ellen˝or´ızz¨ uk az ortogonalit´ast a q = 1 esetben: E (η · h ◦ ξ) = E(η) · E(h ◦ ξ) = E (E(η) · E(h ◦ ξ))
´ ´ FELTETELES ´ ´ ´ ERT ´ EK ´ 9.2. ELMELETI REGRESSZIO, VARHAT O
97
7. Folytonoss´ ag: (a) Legyenek 0 ≤ η 1 ≤ η 2 ≤ · · · ≤ η n ≤ · · · ≤ η ∈ Ω → R, ξ : Ω → Rp (v.)v.v.-k ´es limn→∞ η n = η, akkor lim E (η n |ξ) = E (η|ξ)
n→∞
(b) Legyenek η 1 , η 2 , · · · , η n , · · · , η ∈ Ω → R, ξ : Ω → Rp (v.)v.v.-k ´es limn→∞ η n = η, tov´abb´a legyen ζ ∈ Ω → R olyan n´egyzetesen integr´alhat´o v.v., melyre |η n | ≤ ζ, akkor lim E (η n |ξ) = E (η|ξ) n→∞
Bizony´ıt´ as. Mindk´et a´ll´ıt´as k¨ovetkezik az ortogonalit´as ellen˝orz´es´eb˝ol, felhaszn´alva a v´arhat´o ´ert´ek folytonoss´ag´at. K¨ ovetkezm´ enyek: 1. Ha ϕ = c ∈ R a´lland´o, akkor E (c · η | ξ) = c · E (η|ξ) .
Bizony´ıt´ as. A ϕ = c konstans f¨ uggv´eny v´alaszt´as´aval, a homog´en tulajdons´agb´ol k¨ovetkezik az a´ll´ıt´as.
2. A k¨ozel´ıt´es marad´ek´anak kovariancia m´atrixa az al´abbi m´odon sz´amolhat´o: VR = cov (η − E(η|ξ), η − E(η|ξ)) = E(ηη T ) − E E(η|ξ)E(η|ξ)T = = cov(η, η) − cov (E(η|ξ), E(η|ξ))
Bizony´ıt´ as. Az ortogonalit´as miatt E (η − E(η|ξ)) E(η|ξ)T = 0
tov´abb´a a homogenit´ast felhaszn´alva, ´es a felt´eteles v´arhat´o ´ert´ek v´arhat´o ´ert´ek´et v´eve E E(η | ξ)η T = E E E(η | ξ)η T | ξ = E E(η | ξ)E η T | ξ kapjuk:
VR = E (η − E(η|ξ)) (η − E(η|ξ))T = = E (η − E(η|ξ)) η T − E (η − E(η|ξ)) E(η|ξ)T = = E(ηη T ) − E E(η|ξ)η T = E(ηη T ) − E E(η|ξ)E(η|ξ)T = = E(ηη T ) − E(η)E T (η) − E E(η|ξ)E(η|ξ)T − E(η)E T (η) . K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
´ ANAL´IZIS 9. FEJEZET. REGRESSZIO
98
3. Ha η, ξ 1 , ξ 2 (v.)v.v.-k, akkor E (E(η|ξ 1 , ξ 2 )|ξ 1 ) = E(η|ξ 1 ) . Bizony´ıt´ as. Ellen˝or´ızz¨ uk az ortogonalit´ast: E [(E(η|ξ 1 , ξ 2 ) − E(η|ξ 1 )) h(ξ 1 )] = = E [(η − E(η|ξ 1 )) h(ξ 1 )] − E [(η − E(η|ξ 1 , ξ 2 )) h(ξ 1 )] = 0 . 4. Ha ξ, η f¨ uggetlen r illetve s dimenzi´os vektor val´osz´ın˝ us´egi v´altoz´ok, tov´abb´a g : Rr+s → R (m´erhet˝o) f¨ uggv´eny, akkor E (g(ξ, η) | ξ = x) = E (g(x, η))
x ∈ Rr .
Bizony´ıt´ as. Ellen˝or´ızz¨ uk az ortogonalit´ast, sz´am´ıtsuk ki a v´arhat´o ´ert´ekeket a gener´alt m´ert´ekterekben. Mivel Z E (g(x, η)) = g(x, y)dPη (y) , Rs
kapjuk E [E (g(·, η)) (ξ) · h(ξ)] =
Z
Rr
Z
Rs
g(x, y)dPη (y) · h(x)dPξ (x),
´es a f¨ uggetlens´eg miatt a szorzatm´ert´ek szerinti integr´alt sz´amolva (l´asd: A. f¨ uggel´ek): ZZ E [g(ξ, η) · h(ξ)] = g · hd (Pξ × Pη ) = Rr+s Z Z g(x, y)dPη (y) · h(x)dPξ (x) . = Rr
Rs
A felt´ eteles v´ arhat´ o´ ert´ ek kisz´ am´ıt´ asa 1. Legyenek A, B ∈ A,´es η = 1A , ξ = 1B ´es 0 < P (B) < 1. Mivel ξ ´ert´ekk´eszlete {0, 1}, el´eg megadni az u1 , µ2 ∈ R sz´amokat u ´ gy, hogy E (1A − µ1 · 1B − µ2 · 1B )2 = (1 − u1 )2 P (A ∩ B) + µ21 P (A ∩ B) + (1 − u2 )2 P (A ∩ B) + µ22 P (A ∩ B)
minim´alis legyen. ´ıgy kapjuk: E(η|ξ = x) =
P (A | B) ha x = 1 . P (A | B) ha x = 0
´ ´ FELTETELES ´ ´ ´ ERT ´ EK ´ 9.2. ELMELETI REGRESSZIO, VARHAT O
99
Megjegyz´ es: L´athatjuk, hogy esem´enyek indik´ator´anak felt´eteles v´arhat´o ´ert´eke szoros kapcsolatban van az esem´enyek k¨or´eben defini´alt felt´eteles val´osz´ın˝ us´eggel. A tulajdos´agokb´ol k¨ovetkeznek tov´abb´a, hogy egy ξ : Ω → R p (v.)v.v. eset´en: E(1Ω | ξ) = 1 ∀A ∈ A 0 ≤ E(1A | ξ) ≤ 1 1-val´osz´ın˝ us´eggel E(1A∪B | ξ) = E(1A | ξ) + E(1B | ξ) ha A, B ∈ A ´es A ∩ B = ∅ Ezeket is figyelembe v´eve, az E(1A | ξ) felt´eteles v´arhat´o ´ert´eket felt´eteles val´ osz´ın˝ us´egnek nevezz¨ uk a tov´abbiakban, ´es az al´abbi jel¨ol´est haszn´aljuk: P (A | ξ) = E(1A | ξ) illetve P (A | ξ = x) = E(1A | ξ = x) x ∈ Rp . P 2. Legyen A ∈ A, η = 1A , ξ = i xi 1{ξ=xi } , ´es P (ξ = xi ) > 0 i = 1, 2, . . . , akkor ´ırhatjuk !2 X X E (η − H ◦ ξ)2 = E (1 − µi ) · 1A∩{ξ=xi } − µi · 1A∩{ξ=xi } = i
E X i
X i
i
(1 − µi )2 · 1A∩{ξ=xi } +
X i
(1 − µi )2 · P (A ∩ {ξ = xi }) +
µ2i · 1A∩{ξ=xi } X i
!
=
µ2i · P A ∩ {ξ = xi }
amib˝ol kapjuk, mint el˝obb: P (A|ξ = x) = P (A|ξ = xi )
ha x = xi
i = 1, 2, . . .
P q K¨ ovetkezm´ eny: Ha η = j yj 1{η=yj } , ahol im(η) = {yj | j = 1, 2, . . .} ⊂ R , akkor X E(η|ξ = xi ) = yj P (η = yj | ξ = xi ) i = 1, 2, . . . j
Teh´at a felt´eteles v´arhat´o ´ert´ek {ξ = xi } felt´etel eset´en a (P (η = yj | ξ = xi ))j un. felt´eteles eloszl´ ashoz tartoz´o v´arhat´o ´ert´ek. Ebb˝ol y ∈ R q esetben kapjuk X Fη|ξ (y|xi ) = P (η < y|ξ = xi ) = P (η = yj | ξ = xi ) i = 1, 2, . . . yj
amit az η (v.)v.v. ξ = xi felt´etelre vonatkoz´o felt´eteles eloszl´asf¨ uggv´eny´enek nevez¨ unk. A felt´eteles eloszl´asf¨ uggv´ennyel kifejezhetj¨ uk (az eloszl´asf¨ uggv´enyhez hasonl´oan) a X P (η ∈ I|ξ = xi ) = P (η = yj | ξ = xi ) = Fη|ξ (·|xi ) I i = 1, 2, . . . I ⊂ R yj ∈I
K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
´ ANAL´IZIS 9. FEJEZET. REGRESSZIO
100
felt´eteles val´osz´ın˝ us´egeket, ´es ´ıgy egy h (m´erhet˝o) f¨ uggv´eny eset´en X E(h ◦ η|ξ = xi ) = h(yj ) · P (η = yj | ξ = xi ) i = 1, 2, . . . j
ami megfelel a v´arhat´o ´ert´ek szok´asos kisz´am´ıt´as´anak diszkr´et eloszl´as eset´en. 3. Legyen A ∈ A ´es 0 < P (A) < 1, tov´abb´a a ξ : Ω → Rp (v.)v.v. eloszl´asa olyan, hogy minden I ⊂ Rp intervallum eset´en Z P (ξ ∈ I | A) = fA P (ξ ∈ I | A) =
ZI
fA
I
ahol fA ´es fA val´osz´ın˝ us´egi s˝ ur˝ us´egf¨ uggv´enyek, a ξ v.v. A ill. A esem´enyekre vonatkoz´o un. felt´eteles s˝ ur˝ us´egf¨ uggv´enyei. Ekkor a teljes val´osz´ın˝ us´eg t´etel szerint P (ξ ∈ I) = P (A) ·
Z
fA + P (A) ·
I
Z
fA ,
I
teh´at ξ s˝ ur˝ us´egf¨ uggv´enye fξ (x) = fA (x) · P (A) + fA (x) · P (A) x ∈ Rp , tov´abb´a fA (x)P (A) ha fξ (x) > 0 fξ (x) R p xfA (x)dx ha y = 1 = y) = RR xfA (x)dx ha y = 0
P (A|ξ = x) =
E(ξ|1A
(9.6)
Rp
Ellen˝or´ızz¨ uk az ortogonalit´as teljes¨ ul´es´et ez ut´obbi formul´ak eset´en: (a) Legyen h = 1I , ahol I ⊂ Rp intervallum, akkor
E 1A · 1{ξ∈I} = P ({ξ ∈ I} ∩ A) = P (A) · ´es E
fA (ξ)P (A) · 1{ξ∈I} fξ (ξ)
Z I
= P (A) ·
Z I
fA .
fA
´ ´ FELTETELES ´ ´ ´ ERT ´ EK ´ 9.2. ELMELETI REGRESSZIO, VARHAT O
101
(b) Legyen h : R → Rp tetsz˝oleges, akkor h(1A ) = a · 1A + b · 1A , ahol a = h(1), b = h(0) ∈ Rp . A (9.6) formul´at is haszn´alva E ξ T h(1A ) = E T (ξ · 1A ) a + E T (ξ · 1A ) b = = E T [ξ · P (A | ξ)] a + E T ξ · P A | ξ b = fA (ξ)P (A) fA (ξ)P (A) T T =E ·ξ a+E ·ξ b= fξ (ξ) fξ (ξ) Z Z T T xfA (x)dx bP (A) xfA (x)dx aP (A) + = Rp
Rp
´es
E
Z
Rp
xfA (x)dx · 1A + =
Z
Z
Rp
T
aP (A) +
Z
xfA (x)dx · 1A h(1A ) =
xfA (x)dx Rp
T
Rp
xfA (x)dx
T
bP (A)
P K¨ ovetkezm´ eny: Ha η = j yj 1{η=yj } ahol im(η) = {yj | j = 1, 2, . . .} ⊂ Rq ´es a ξ : Ω → Rp (v.)v.v. {η = yj } felt´etelre vonatkoz´o s˝ ur˝ us´egf¨ uggv´enye fj j = 1, 2, . . ., akkor ξ s˝ ur˝ us´egf¨ uggv´enye: X fξ (x) = fj (x)P (η = yj ) x ∈ Rp j
tov´abb´a E(η|ξ = x) =
X j
E(ξ|η = yj ) =
Z
yj
fj (x)P (η = yj ) fξ (x)
ha fξ (x) > 0
xfj (x)dx j = 1, 2, . . .
Rp
fj (x)P (η = yj ) Teh´at az E(η|ξ) felt´eteles v´arhat´o ´ert´ek a P (η = yj | ξ = x) = fξ (x) j felt´eteles eloszl´ ashoz tartoz´o k¨oz¨ons´eges v´arhat´o ´ert´ek. Az ebb˝ol y ∈ R q eset´en kaphat´o X fj (x)P (η = yj ) Fη|ξ (y|x) = P (η < y | ξ = x) = ha fξ (x) > 0 fξ (x) y
felt´eteles val´osz´ın˝ us´eget az η (v.)v.v. ξ = x felt´etelre vonatkoz´o felt´eteles eloszl´ asf¨ uggv´eny´enek nevezz¨ uk. A felt´eteles eloszl´asf¨ uggv´ennyel kifejezhetj¨ uk (az eloszl´asf¨ uggv´enyhez hasonl´oan) a X fj (x)P (η = yj ) = Fη|ξ (·|x) I ha fξ (x) > 0 P (η ∈ I|ξ = x) = fξ (x) y ∈I j
K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
´ ANAL´IZIS 9. FEJEZET. REGRESSZIO
102
felt´eteles val´osz´ın˝ us´egeket, ´es egy h (m´erhet˝o) f¨ uggv´eny eset´en E(h ◦ η|ξ = x) =
X j
h(yj ) ·
fj (x)P (η = yj ) fξ (x)
ha fξ (x) > 0
ami megfelel a v´arhat´o ´ert´ek szok´asos kisz´am´ıt´as´anak diszkr´et eloszl´as eset´en. 4. Legyen a (ξ, η) (p + q)-dimenzi´os v.v.v. s˝ ur˝ us´egf¨ uggv´enye f : R p+q → R+ 0 , akkor az ortogonalit´as ellen˝orz´es´evel kapjuk: Z E(η|ξ = x) = y · f (y|x)dy ha fξ (x) > 0 Rq
ahol fξ (x) =
Z
Rq
f (x, y)dy x ∈ Rp
a ξ perem s˝ ur˝ us´egf¨ uggv´enye, ´es f (y|x) =
f (x, y) fξ (x)
ha fξ (x) > 0
az η v.v.v. ξ = x felt´etelre vonatkoz´o un. felt´eteles s˝ ur˝ us´egf¨ uggv´enye. Teh´at a felt´eteles v´arhat´o ´ert´ek a felt´eteles s˝ ur˝ us´egf¨ uggv´enyhez tartoz´o k¨oz¨ons´eges v´arhat´o ´ert´ek. K¨ ovetkezm´ enyek: (a) Az ortogonalit´as ellen˝orz´es´eb˝ol, vagy a 3. kisz´am´ıt´asi formul´ab´ol kapjuk z ∈ Rq eset´en: Z Fη|ξ (z|x) = P (η < z | ξ = x) = f (y|x)dy ha fξ (x) > 0 ]−∞;z]
amit az η (v.)v.v. ξ = x felt´etelre vonatkoz´o felt´eteles eloszl´asf¨ uggv´eny´enek nevez¨ unk. Hasonl´oan kaphatjuk tetsz˝oleges I intervallum eset´en Z P (η ∈ I | ξ = x) = f (y|x)dy = Fη|ξ (·|x) I ha fξ (x) > 0 I
amib˝ol kapjuk a folytonoss´ag felhaszn´al´as´aval egy h (m´erhet˝o) f¨ uggv´eny eset´en a Z E(h ◦ η|ξ = x) = h(y) · f (y|x)dy ha fξ (x) > 0 Rq
kisz´am´ıt´asi formul´at..
¨ ´ 9.3. BAYES DONT ES
103
(b) Legyen a (η, ξ) (q + p)-dimenzi´os v.v.v. eloszl´asa norm´alis V11 V12 q+P ∈ R(q+p)×(q+p) (m1 , m2 ) ∈ R V21 V22 v´arhat´o ´ert´ekkel ´es invert´alhat´o kovariancia m´atrixszal. Ekkor η-nak a ξ-re vonatkoz´o felt´eteles s˝ ur˝ us´egf¨ uggv´enye a 4. kisz´am´ıt´asi formula szerint: −1 1 ∗ T −1 ∗ f (y|x) = C exp − (y − m ) V11 − V12 V22 V21 (y − m ) (9.7) 2
− 21 q ∈ R+ , m∗ = V12 V22−1 (x−m2 )+m1 , ahol C = (2π)− 2 det V11 − V12 V22−1 V21 vagyis a felt´eteles s˝ ur˝ us´egf¨ uggv´eny norm´alis eloszl´as s˝ ur˝ us´ege, a hozz´a tartoz´o v´arhat´o ´ert´ek pedig a line´aris regresszi´os f¨ uggv´eny, teh´at E(η | ξ = x) = V12 V22−1 (x − m2 ) + m1
/x ∈ Rp /
tov´abb´a a marad´ek kovariancia m´atrix a line´aris regresszi´on´al megismert: VR = V11 − V12 V22−1 V21 .
9.3.
Bayes d¨ ont´ es
Feladat: Legyen (Ai )ni=1 ⊂ A teljes esem´enyrendszer, ´es P (Ai ) > 0 i = 1, 2, . . . n, tov´ abb´ a a ξ p-dimenzi´ os v.v.v. Ai felt´etelre vonatkoz´ o felt´eteles s˝ ur˝ us´egf¨ uggv´enye fi : Rp → R + 0
i = 1, 2, . . . n.
Keress¨ uk azt a d : Rp → {1, 2, . . . , n} un. d¨ont´es f¨ uggv´enyt, mellyel a Hd =
n X i=1
{d(ξ) = i} ∩ Ai
d¨ ont´esi hiba val´ osz´ın˝ us´ege a legkisebb. A d¨ont´esi hiba val´osz´ın˝ us´eg´et a´talak´ıtva kapjuk: P (Hd ) = 1 −
n X i=1
P ({d(ξ) = i} ∩ Ai ) = 1 − E
n X i=1
!
P ({d(ξ) = i} ∩ Ai | ξ) .
A felt´eteles v´arhat´o ´ert´ek ill. val´osz´ın˝ us´eg tulajdons´agait haszn´alva kapjuk: n X i=1
P ({d(ξ) = i} ∩ Ai | ξ = x) =
n X i=1
fi (x)P (Ai ) 1{d(x)=i} · Pn ≤ j=1 fj (x)P (Aj )
K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
´ ANAL´IZIS 9. FEJEZET. REGRESSZIO
104
≤ p
ha x ∈ R ´es fξ (x) = teljes¨ ul
Pn
j=1
n X i=1
fi (x)P (Ai ) 1{d∗ (x)=i} · Pn j=1 fj (x)P (Aj )
fj (x)P (Aj ) > 0. Itt d∗ jel¨oli azt a d¨ont´es f¨ uggv´enyt,melyre
fi (x)P (Ai ) fk (x)P (Ak ) ≤ fξ (x) fξ (x)
ha d∗ (x) = k ´es fξ (x) > 0, i = 1, 2, . . . n.
Ezt a d∗ f¨ uggv´enyt Bayes d¨ont´esnek nevezz¨ uk, amivel a kit˝ uz¨ott feladat megold´as´at kapjuk, vagyis n X P ({d∗ (ξ) = i} ∩ Ai ) . P (Hd ) ≥ P (Hd∗ ) = 1 − i=1
K¨ ovetkezm´ enyek:
1. Legyen n = 2, ´es a k´et felt´eteles s˝ ur˝ us´egf¨ uggv´eny legyen V 1 , V2 ∈ Rp×p kovariancia m´atrix´ u m1, m2 ∈ Rp v´arhat´o ´ert´ek˝ u norm´alis eloszl´ashoz tartoz´o, vagyis 1 1 T −1 /x ∈ Rp / i = 1, 2. exp − (x − mi ) Vi (x − mi ) fi (x) = p 2 2π det(Vi ) tov´abb´a
pi = P (Ai ) i = 1, 2 ahol p1 + p2 = 1. Ekkor a d∗ Bayes d¨ont´es megad´asa ekvivalens az f1 (x) · p1 > f2 (x) · p2
x ∈ Rp
egyenl˝otlens´eg megold´ashalmaz´anak megad´as´aval, mely egyenl˝otlens´eg eset¨ unkben 1 1 (x − m1 )T V1−1 (x − m1 ) − (x − m2 )T V2−1 (x − m2 ) < C 2 2 ahol C = ln
p p det(V1 ) − ln det(V2 ) + ln(p2 ) − ln(p1 )
ami az x ∈ Rp pont m1 ´es m2 v´arhat´o ´ert´ekekt˝ol val´o un. Mahalanobis t´ avols´ agok o¨sszehasonl´ıt´as´at jelenti. 2. Ha a k´et kovariancia m´atrix azonos, ez ut´obbi egynel˝otlens´eg ekvivalens az al´abbi, az x ∈ Rp pont un. line´ aris diszkriminancia f¨ uggv´eny´enek l(x) ´ert´ek´et˝ol f¨ ugg˝o egyenl˝otlens´eggel: C < l(x) = xT V −1 (m1 − m2 ) ahol
1 C = (m1 − m2 )T V −1 (m1 + m2 ) − ln(p2 ) + ln(p1 ). 2
105
9.4. FELADATOK
9.4.
Feladatok
1. Legyenek ξ, τ , ε ∈ N (0, 1) f¨ uggetlenek, ´es 1 η = τ+ ε 2 ξ1 = ξ ξ2 = τ − ξ Adjuk meg az η ≈ aξ 1 + bξ 2 + c regresszi´os k¨ozel´ıt´est, a kmarad´ek sz´or´ast ´es a t¨obbsz¨or¨os korrel´aci´os egy¨ utthat´ot! Vizsg´aljuk az η ´es ξ 1 k¨ozti tiszta, ξ 2 hat´as´at´ol mentes o¨sszef¨ ugg´est, sz´am´ıtsuk ki a ρη,ξ1 |ξ2 parci´alis korrel´aci´os egy¨ uthat´ot! 2. Keress¨ uk az x y −1 1 0 0 1 2 2 4 pontokra legjobban illeszked˝o m´asodfok´ u polinomot! 3. A (ξ 1 , ξ 2 , ξ 3 ) v.v.v. kovariancia m´atrixa ´es v´arhat´o ´ert´ek vektora
64 −16 −19 −16 100 126 , −19 126 160
10 20 30
hat´arozza meg a ρξ 1 ,ξ3 |ξ 2 korrel´aci´os egy¨ utthat´ot, adja meg a ξ 2 ≈ aξ 1 + bξ 3 + c regresszi´os f¨ uggv´enyt, a k¨ozel´ıt´es marad´ek sz´or´as´at! 4. K´etf´ele izz´ol´amp´ab´ol 60 illetve 40 van egy rakt´arban. Mindk´et t´ıpus ´elettartama exponenci´alis eloszl´as´ u, v´arhat´o ´elettartamuk pedig (ebben a sorrenben)120 ill. 200 o´ra. V´eletlenszer˝ uen v´alasztunk egy izz´ot a rakt´arb´ol, adjuk meg a m˝ uk¨od´esi id˝o eloszl´as´at! Ha a v´alasztott izz´o 210 o´r´aig m˝ uk¨odik, mennyi annak val´osz´ın˝ us´ege, hogy az egyik ill. m´asik csoportb´ol val´o? Adjuk meg a Bayes d¨ont´est, ´es a d¨ont´es hibaval´osz´ın˝ us´eg´et! 5. Legyen ξ ´es η f¨ uggetlen, skal´ar ´ert´ek˝ u v.v., f : R → R (m´erhet˝o) f¨ uggv´eny, mutassuk meg, hogy P (η < f ◦ ξ | ξ = x) = P (η < f (x)) x ∈ R ! 6. Legyenek ξ : Ω → Rn mutassuk meg, hogy
η1 : Ω → R
f¨ uggetlenek, ´es η 2 = f ◦ ξ : Ω → R v.v.-k,
P (η 1 + η 2 < z | ξ = x) = P (η 1 < z − f (x)) x ∈ R ! K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
´ ANAL´IZIS 9. FEJEZET. REGRESSZIO
106
7. Legyenek η ∈ N (0; σ), εk ∈ N (0; σ0 ) k = 1, 2, . . . , n f¨ uggetlen v.v.-k, ´es ξ k = η + εk
k = 1, 2, . . . , n ,
adjuk meg az E(η | ξ 1 , ξ 2 , . . . , ξ n ) felt´eteles v´arhat´o ´ert´eket! 8. Tudjuk, hogy a lakoss´ag 52%-´at kitev˝o n˝ok testmagass´aga norm´alis eloszl´as´ u 165cm v´arhat´o ´ert´ekkel ´es 8cm sz´or´assal. A f´erfiak magass´ag´an´al ezek a param´eterek 178cm ´es 10cm. Ha valakir˝ol tujuk, hogy 173cm magas, mennyi a val´osz´ın˝ us´ege, hogy n˝o ill. f´erfi az illet˝o? 9. Legyen a (ξ, η) 2-dimenzi´os v.v.v. s˝ ur˝ us´egf¨ uggv´enye: ( c(x + y) x, y ∈ [0, 1] f (x, y) = . 0 egy´ebk´ent Adjuk meg az E(η|ξ = .) felt´eteles v´arhat´o ´ert´eket ´es a marad´ek sz´or´ast! Hasonl´ıtsuk o¨ssze a kapott eredm´enyt az η ∼ aξ + b regresszi´os k¨ozel´ıt´essel! 10. Egy adott term´ekb˝ol h´aromf´ele a´tlagos ´elettartam´ u t´ıpus van forgalomban, melyek mennyis´eg´enek megoszl´asa 50%, 30% ´es 20%. Az ´elettartamokat exponenci´alis eloszl´as´ u, 50, 100 ´es 200 v´arhat´o ´ert´ek˝ u v´eletlen mennyis´egeknek tekintve, adjunk d¨ot´esi szab´alyt egy megfigyelt ´elettartam alapj´an arra, hogy melyik t´ıpus´ u term´ekr˝ol van sz´o! 11. K´et kock´aval dobunk, jel¨olje ξ az eredm´enyek maximum´at, η pedig a minimum´at. Adjuk meg (a) az η ∼ aξ + b regresszi´os k¨ozel´ıt´est!
(b) a {ξ = i} 7→ {η = j} legjobb d¨ont´esi szab´alyt! (c) az E(η|ξ) felt´eteles v´arhat´o ´ert´eket!
10. fejezet Sztochasztikus folyamatok Vektor val´osz´ın˝ us´egi v´altoz´ok eset´eben v´eges sok indexhez tartozott egy-egy val´osz´ın˝ us´egi v´altoz´o (komponens), aminek term´eszetes kiterjeszt´ese az al´abbi fogalom. 10.1. Defin´ıci´ o. A (ξ t )t∈T (n-dimenzi´os) val´osz´ın˝ us´agi v´altoz´ok egy¨ uttes´et sztochasztikus folyamatnak nevezz¨ uk, ahol T − ξ t : Ω → Rn − ξ . (ω) : T → Rn −
az un. param´eterhalmaz ; a t ∈ T -hez tartoz´o a´llapot (v.)v.v. ; az ω ∈ Ω-hoz tartoz´o p´alyag¨orbe, a folyamat egy v´eletlen realiz´aci´oja ;
Egy ilyen folyamat sokszor id˝oben lej´atsz´od´o jelens´egek modellje, ez´ert a T param´eter halmaz, mely legt¨obbsz¨or N, Z,R,R+ esze lesz, elemeit id˝opontoknak 0 , vagy ezek valamely r´ + mondjuk. Ha T ⊂ N, Z id˝osorr´ol, ha T ⊂ R,R0 folyamatr´ol besz´el¨ unk. 10.2. P´ elda. Legyen τ ∈ U (0, 1) v.v., ´es T = [0; 1], tov´abb´a ξ t = 1{τ =t}
t ∈ T.
Ekkor a (ξ t )t∈T folyamat minden realiz´aci´oja egy pont kiv´etel´evel a konstans 0-´ert´eket felvev˝o f¨ uggv´eny, a t = τ (ω ) pontban pedig 1 az ´ert´eke, teh´at ”szakad´asa” van. Tetsz˝oleges t ∈ T -hez tartoz´o ξ t a´llapot eloszl´asa P (ξ t = 0) = 1, de v´eges sok t1 , t2 , . . . , tk ∈ T eset´en is P (ξ t1 = 0, ξ t2 = 0, . . . , ξ tk = 0) = 1. 10.3. P´ elda. Legyen T = [0; 1], ξt = 0 t ∈ T Ekkor a (ξ t )t∈T folyamat minden realiz´aci´oja a konstans 0-´ert´eket felvev˝o folytonos f¨ uggv´eny, ´es a t ∈ T -hez tartoz´o ξ t a´llapot eloszl´asa P (ξ t = 0) = 1, ´es v´eges sok t1 , t2 , . . . , tk ∈ T eset´en P (ξ t1 = 0, ξ t2 = 0, . . . , ξ tk = 0) = 1. 107
108
10. FEJEZET. SZTOCHASZTIKUS FOLYAMATOK
A fenti k´et p´elda szerint, k´et folyamat realiz´aci´oi analitikus viselked´es¨ uket tekintve el´egg´e k¨ ul¨onb¨oz˝oek lehetnek, v´eges-dimenzi´os eloszl´asaik azonban m´egis azonosak. Mivel minden val´osz´ın˝ us´egsz´am´ıt´asi jellemz˝o a v´eges dimenzi´os eloszl´asokkal adott, az ilyen folyamatokat sztochasztikusan ekvivalensnek nevezz¨ uk. Vizsg´aljuk most meg egy (ξ t )t∈T folyamat v´eges dimenzi´os eloszl´asainak tulajdons´agait, az egyszer˝ us´eg kedv´e´ert T ⊂ R esetben: • jel¨olje a t1 < t2 < . . . < tn ∈ T id˝opontokhoz tartoz´o v´eges-dimenzi´os eloszl´ast meghat´aroz´o eloszl´asf¨ uggv´enyt Ft1 ,t2 ,...,tn : Rn → [0; 1] ;
(10.1)
• ekkor limx→+∞ Ft1 ,t2 ,...,tn (x1 , x2 , . . . , xk−1 , x, xk+1 , . . . xn ) = = Ft1 ,t2 ,...,tk−1 ,tk+1 ,...,tn (x1 , x2 , . . . , xk−1 , xk+1 , . . . , xn ) x1 , x2 , . . . , xk−1 , xk+1 , . . . , x ∈ R .
(10.2)
Eloszl´asf¨ uggv´enyek ilyen 10.1-10.2 halmaz´at kompatibilisnek nevezz¨ uk. A k¨ovetkez˝o a´ll´ıt´as szerint, ilyen eloszl´asok ismerete m´ar meghat´aroz a 10.1 defin´ıci´o szerinti sztochasztikus folyamatot, ez´ert a tv´abbiakban legt¨obbsz¨or az eloszl´asokkal kapcsolatos ismereteket helyezz¨ uk el˝ot´erbe. 10.4. T´ etel (Kolmogorov alapt´ etele). Legyen a T ⊂ R index-halmazhoz tartoz´o eloszl´asf¨ uggv´enyek egy (Ft1 ,t2 ,...,tn )t1
´ ´ 10.1. VELETLEN ESEMENYFOLYAMAT, POISSON FOLYAMAT
10.1.
109
V´ eletlen esem´ enyfolyamat, Poisson folyamat
A k¨ovetkez˝o p´elda, v´eletlen id˝opontokban bek¨ovetkez˝o esem´enyek modellj´eu ¨ l szolg´al. Legyen a (ξ t )t∈R+ egy N a´llapotter˝ u folyamat, melyre teljes¨ ulnek a k¨ovetkez˝o felt´etelek: 0
1. ξ 0 = 0. 2. Ha 0 ≤ t1 ≤ t2 ≤ t3 ≤ . . . ≤ tn ⇒ ξ tn − ξ tn−1 , ξ tn−1 − ξ tn−2 , ξ tn−2 − ξ tn−3 , . . . , ξ t2 − ξ t1 teljesen f¨ uggetlenek. 3. Ha 0 ≤ t1 ≤ t2 ≤ t3 ≤ . . . ≤ tn , 0 ≤ h ⇒ ξ tn − ξ tn−1 , ξ tn−1 − ξ tn−2 , ξ tn−2 − ξ tn−3 , . . . , ξ t2 − ξ t1 egy¨ uttes eloszl´asa olyan mint ξ tn +h − ξ tn−1 +h , ξ tn−1 +h − ξ tn−2 +h , ξ tn−2 +h − ξ tn−3 +h , . . . , ξ t2 +h − ξ t1 +h eloszl´asa. Megjegyz´ esek: (a) A ξ t v.v. jelent´es´enek a [0, t[ intervallumban bek¨ovetkez˝o esem´enyek sz´am´at tulajdon´ıtva, az 1. felt´etelez´es term´eszetes. (b) A 2. felt´etel szerint a folyamat un. f¨ uggetlen n¨ ovekm´eny˝ u, azaz az egym´ast k¨ovet˝o id˝ointervallumok alatt ´eszlelt esem´enyek sz´ama egym´ast´ol f¨ uggetlen, ´es 1. miatt ξ t = ξ t − ξ 0 ´es ξ t+h − ξ t f¨ uggetlenek, ha t, h ≥ 0. (c) A 3. felt´etel a folyamat n¨ovekm´enyeinek un. stacion´ arius volt´at jelenti, ami az 1.-2. felt´etelek miatt ekvivalens az al´abbi egyszer˝obb felt´etellel: Ha 0 ≤ t, h ⇒ ξ t+h − ξ t eloszl´asa nem f¨ ugg t-t˝ol, azaz eloszl´asa azonos ξ h eloszl´as´aval. 4. Teljes¨ ul tov´abb´a P (ξ h ≥ 1) = λ · h + r1 (h) h≥0 P (ξ h ≥ 2) = r2 (h) h≥0 ahol λ > 0, ´es 1 lim ri (h) = 0 h→0 h
i = 1, 2. K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
110
10. FEJEZET. SZTOCHASZTIKUS FOLYAMATOK
A tov´abbiakban meghat´arozzuk a folyamat v´eges dimenzi´os eloszl´asait. ξ t eloszl´as´at a pn (t) = P (ξ t = n) n ∈ N,
t≥0
f¨ uggv´enyek hat´arozz´ak meg. Mivel ξ t+h = 0 = {ξ t = 0} ∩ ξ t+h − ξ t = 0 ,
felhaszn´alva a novekm´enyek f¨ uggetlens´eg´et ´es stacion´arius tulajdons´ag´at, kapjuk p0 (t + h) = p0 (t)p0 (h) t, h ≥ 0 amib˝ol a 4. tulajdons´ag felhaszn´al´as´aval kapjuk p0 (t + h) − p0 (t) = −λhp0 (t) − p0 (t)r1 (h) amib˝ol k¨ovetkezik, hogy p0 megold´asa a p00 (t) = −λp0 (t) t ≥ 0 p0 (0) = 1 kezdeti´ert´ek feladatnak, teh´at p0 (t) = e−λt
t ≥ 0.
Tegy¨ uk fel most, hogy a pn−1 f¨ uggv´eny m´ar ismert, ´es keress¨ uk a pn f¨ uggv´enyt. Haszn´aljuk a k¨ovetkez˝oket ξ t+h = n = {ξ t = n} ∩ ξ t+h − ξ t = 0 ∪ {ξ t = n − 1} ∩ ξ t+h − ξ t = 1 ∪ R n [ ahol R = {ξ t = n − k} ∩ ξ t+h − ξ t = k . k=2
Mivel
R ⊂
n [
k=2
ξ t+h − ξ t = k
1 ⇒ lim P (R) = 0 h→0 h
⇒ 0 ≤ P (R) ≤
∞ X k=2
P (ξ h = k) = P (ξ h ≥ 2) = r2 (h),
´es kapjuk
p1 (h) = 1 − p0 (h) − P (ξ h ≥ 2) = 1 − p0 (h) − r2 (h)
pn (t + h) − pn (t) = (p0 (h) − 1) pn (t) − pn−1 (t) (p0 (h) − 1) − pn−1 (t)r2 (h) + P (R) amib˝ol p0n (t) = −λpn (t) + λpn−1 (t) t ≥ 0 pn (0) = 0.
´ ´ 10.1. VELETLEN ESEMENYFOLYAMAT, POISSON FOLYAMAT
Vezess¨ uk be a qn (t) = pn (t) · eλt
111
t ≥ 0 f¨ uggv´enyeket, melyekre
qn0 (t) = λqn−1 (t) t ≥ 0 qn (0) = 0. Felhaszn´alva, hogy q0 (t) = 1, kapjuk (λt)n qn (t) = n!
t≥0
´es ´ıgy
(λt)n −λt e t ≥ 0, n = 0, 1, 2, . . . . n! Haszn´aljuk fel a folyamt n¨ovekm´enyeinek f¨ uggetlens´eg´et ´es a stacion´arius tulajdons´ag´at, igy kapjuk a v´eges dimenzi´os eloszl´asokat a 0 ≤ t1 ≤ t2 ≤ t3 ≤ . . . ≤ tn id˝opontokban: pn (t) =
P (ξ t1 = k1 , ξ t2 = k2 , . . . , ξ tn = kn ) = P (ξ t1 = k1 , ξ t2 − ξ t1 = k2 − k1 , . . . , ξ tn − ξ tn−1 = kn − kn−1 ) = (λt1 )k1 −λt1 e k1 !
(λ(t2 −t1 ))k2 −k1 −λ(t2 −t1 ) e (k2 −k1 )!
kn −kn−1
n−1 )) · . . . (λ(tn −t e−λ(tn −tn−1 ) = (kn −kn−1 )! k1 k2 −k1 kn −kn−1 tn −tn−1 (λtn )kn −λtn t1 t2 −t1 kn ! e · . . . · · = k1 !(k2 −k1 )!·...·(kn −kn−1 )! tn tn tn kn !
=
·
ahol k1 ≤ k2 ≤ . . . ≤ kn ∈ N. K¨ ovetkezm´ enyek: 1. A ξ t v.v. ´es a folyamat ξ t+h − ξ t n¨ovekm´enye f¨ uggetelen Poisson eloszl´as´ u λt illetve λh param´eterrel, ha t, h ≥ 0. 2. A v´eges dimenzi´os eloszl´asb´ol kapjuk, hogy a 0 ≤ t 1 ≤ t2 ≤ t3 ≤ . . . ≤ t n a´ltal meghat´arozott feloszt´as r´eszintervallumaiban bek¨ovetkez˝o esem´enyek sz´ama, felt´eve, hogy o¨sszesen l sz´am´ u esem´eny k¨ovetkezett be, P (ξ t1 = l1 , ξ t2 − ξ t1 = l2 , . . . , ξ tn − ξ tn−1 = ln | ξ tn = l) = l1 l l tn − tn−1 n t1 t2 − t 1 2 l! ... = l1 ! · l 2 ! · . . . · l n ! t n tn tn P ahol l1 , l2 , . . . ln ∈ N, ´es ni=1 li = l. Teh´at ez az eloszl´as l-edrend˝ u polinomi´alis, az intervallumok hossz´aval ar´anyos val´osz´ın˝ us´eg param´eterekkel. K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
112
10. FEJEZET. SZTOCHASZTIKUS FOLYAMATOK
3. A v´eges dimenzi´os perem-eloszl´asok fenti alakja, ´es az el˝oz˝oek szerint, a Poisson folyamat egy (szimul´aci´okban j´ol haszn´alhat´o) k¨ozel´ıt´ese az al´abbiak szerint adhat´o meg: Legyenek τ 1 , τ 2 , . . . , τ N egyenletes eloszl´as´ u, f¨ uggetlen v´eletlen sz´amok a [0; 1] intervallumban, 0 < λ ´es N X ξt = 1{ N τ i ≤t} t ≥ 0 . λ
i=1
Ekkor 0 ≤ t1 ≤ t2 ≤ t3 ≤ . . . ≤ tn ≤
N λ
´es k1 ≤ k2 ≤ . . . ≤ kn ∈ N eset´en
P (ξ t1 = k1 , ξ t2 = k2 , . . . , ξ tn = kn ) = = P (ξ t1 = l1 , ξ t2 − ξ t1 = l2 , . . . , ξ tn − ξ tn−1 = ln ) = = P (ξ t1 = l1 , ξ t2 − ξ t1 = l2 , . . . , ξ tn − ξ tn−1 = ln , ξ N − ξ tn = N − l) = λ l2 ln N N −l l λ( λ −tn ) 1 λ(t2 −t1 ) λ(tn −tn−1 ) = = l1 !·l2 !·...·lNn!!·(N −l)! λtN1 . . . N N N l2 ln l l1 N tn −tn−1 t2 −t1 t1 l! · · . . . · · λl! · 1 − λtNn · · = l1 !·l2 !·...·l tn tn tn n! −l N N −1 · 1 − λtNn · N · N · . . . · N −l+1 N P ahol l1 = k1 , li = ki − ki−1 i = 2, 3, . . . , n ´es l = ni=1 li = kn . Ez pedig N → ∞ eset´en azt jelenti, hogy az ´ıgy defini´alt (ξ t )t≥0 folyamat v´eges-dimenzi´os peremeinek eloszl´asa tart a Poisson folyamat megfelel˝o perem´enek eloszl´as´ahoz. 4. Markov tulajdons´ ag: ha 0 ≤ t1 ≤ t2 ≤ t3 ≤ . . . ≤ tn ≤ t ´es k1 ≤ k2 ≤ . . . ≤ kn ≤ k ∈ N, akkor P (ξ t = k | ξ tn = kn , ξ tn−1 = kn−1 , . . . , ξ t1 = k1 ) = =
(λ(t − tn ))k−kn −λ(t−tn ) e = P (ξ t = k | ξ tn = kn ) (k − kn )!
5. Marting´ al tulajdons´ ag: jel¨olje η t = ξ t − λt a centr´alt folyamatot, ´es legyenek 0 ≤ t1 ≤ t2 ≤ t3 ≤ . . . ≤ tn ≤ t, ´es k1 ≤ k2 ≤ . . . ≤ kn ≤ k ∈ N, tov´abb´a yj = kj − tj λ j = 1, 2, . . . n, ekkor E(η t |η tn = yn , η tn−1 = yn−1 , . . . , η t1 = y1 ) = = E(ξ t |ξ tn = yn + tn λ, η tn−1 = yn−1 + tn−1 λ, . . . , η t1 = y1 + t1 λ) − λt = ∞ X kP (ξ t = k | ξ tn = kn , ξ tn−1 = kn−1 , . . . , ξ t1 = k1 ) − λt = = = =
k=kn ∞ X
k=kn ∞ X
k=kn
kP (ξ t = k | ξ tn = kn ) − λt = (λ(t − tn ))k−kn −λ(t−tn ) (k − kn ) e + kn − λt = (k − kn )!
= λ(t − tn ) + kn − λt = yn .
´ ´ 10.1. VELETLEN ESEMENYFOLYAMAT, POISSON FOLYAMAT
113
6. A Poisson folyamat ”szakad´asi” helyeinek eloszl´asa: A folyamat n−edik szakad´asi hely´et jel¨olje ζ n = sup {t | ξ t = n − 1}
n = 1, 2, . . . ,
t≥0
ami val´osz´ın˝ us´egi v´altoz´o, mivel {ζ n ≤ x} = {ξ x ≥ n}
n ∈ N + , x ∈ R+ .
Itt a sup legyen 0, ha a {t | ξ t = n − 1} halmaz u ¨ res, ´es {ζ n ≤ x} = ∅ ha x < 0. ∞ Ekkor a (ζ n )n=1 monoton nem cs¨okken˝o sorozat, ´es ha 0 < x1 < x2 < . . . < xn , ´es h > 0 olyan, hogy xi + h < xi+1 , akkor P (x1 < ζ 1 < x1 + h ∧ x2 < ζ 2 < x2 + h ∧ . . . ∧ xn < ζ n < xn + h) = = P (ξ x1 = 0) · P (ξ h = 1) · P (ξ x2 −x1 −h = 0) · . . . · P (ξ h = 1) = = λn hn exp (−λxn − λh) .
Ebb˝ol, hn -vel osztva, ´es h → 0 hat´ar´atmenettel kapjuk ζ 1 , ζ 2 , . . . , ζ n egy¨ uttes s˝ ur˝ us´egf¨ uggv´eny´et: ( n −λxn λ e ha 0 < x1 < x2 < . . . < xn , f (x1 , x2 , . . . , xn ) = 0 egy´ebk´ent amib˝ol kapjuk a szomsz´edos szkad´asok k¨oz¨ott eltelt ζ 1 , ζ 2 − ζ 1 , . . . , ζ n − ζ n−1 id˝ok eloszl´as´anak ( n −λ Pn ui i=1 λ e ha 0 < u1 , u2 , . . . , un g(u1 , u2 , . . . , un ) = 0 egy´ebk´ent s˝ ur˝ us´egf¨ uggv´eny´et, teh´at a (ζ n )∞ osor egy-l´ep´eses n=1 id˝ δ1 = ζ 1 δ n = ζ n − ζ n−1
n = 2, 3, . . .
n¨ovekm´enyei (differenci´ai) f¨ uggetlen exponenci´alis eloszl´as´ uak. ´Igy ´ırhatjuk ζn =
n X
δi
n = 1, 2, . . . ,
i=1
teh´at ζ n f¨ uggetlen, azonos λ-param´eter˝ u exponenci´alis eloszl´as´ u v.v.-k o¨sszege. 7. A Poisson folyamat v´arhat´o ´ert´eke ´es kovariancia f¨ uggv´enye: E(ξ t ) = λt t ≥ 0, ´es ha pl. t ≥ s, akkor ξ s ´es ξ t − ξ s f¨ uggetlenek, igy
E(ξ s · ξ t ) = E(ξ s )E(ξ t − ξ s ) + E(ξ 2s ) = λ2 s(t − s) + λs + (λs)2 = λ2 ts + λs,
amib˝ol kapjuk cov(ξ t , ξ s ) = λ min{s, t}. K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
114
10. FEJEZET. SZTOCHASZTIKUS FOLYAMATOK
8. A trajekt´ori´ak folytonoss´aga: (a) n´egyzetes k¨ oz´epben, E (ξ t − ξ s )2 = E ((ξ t − λt) − (ξ s − λs) + λ(t − s))2 =
= cov(ξ t , ξ t ) + cov(ξ s , ξ s ) − 2 cov(ξ t , ξ s ) + (E(ξ t ) − E(ξ s ))2 ,
amib˝ol a v´arhat´o ´ert´ek ´es kovariancia f¨ uggv´enyek folytonoss´aga miatt k¨ovetkezik lim E (ξ t − ξ s )2 = 0. t→s
(b) sztochasztikusan,
E ((ξ t − ξ s )2 ) 0 ≤ P (ξ t − ξ s )2 > ε2 < ε2
amit a Markov egyenl˝otlens´egb˝ol kapunk, ´es felhaszn´alva a n´egyzetes k¨oz´ep szerinti folytonoss´agot, kapjuk ∀ε > 0 eset´en lim P (|ξ t − ξ s | > ε) = 0 t→s
(c) 1-val´ osz´ın˝ us´eggel, ∞ o [ n {ζ n = s} As = lim ξ t 6= ξ s = t→s
n=1
amib˝ol ζ n folytonos eloszl´asa (2λζ n ∈ χ22n ) miatt k¨ovetkezik P (As ) = 0.
10.2.
Brown-mozg´ as, Wiener folyamat
A k¨ovetkez˝o p´elda folyad´ekban v´eletlenszer˝ u mozg´ast v´egz˝o r´eszecsk´ek modelljek´ent v´alt nevezetess´e. Az egyszer˝ us´eg kedv´e´ert, az un. egy-dimenzi´os Brown-mozg´as modellj´et vizsg´aljuk, teh´at a r´eszecske elmozdul´ast´at egyetlen tengely ir´any´aban figyelj¨ uk meg. A (ξ t )t≥0 folyamat legyen R a´llapotter˝ u, ´es felt´etelezz¨ uk az al´abbiakat: 1. ξ 0 = 0. 2. A folyamat f¨ uggetlen n¨ovekm´eny˝ u, ´es a n¨ovekm´enyek stacion´ariusak ´es norm´alis eloszl´as´ uak, teh´at ξ t − ξ s ∈ N (0, d(t − s)) 0 ≤ s < t + ahol d:R+ uggv´eny, melyre 1.miatt d(0) = 0. 0 → R0 folytonos f¨
K¨ ovetkezm´ enyek:
´ WIENER FOLYAMAT 10.2. BROWN-MOZGAS,
115
1. Mivel 0 ≤ s, t eset´en ξ t+s = (ξ t+s − ξ t ) + ξ t , ´es az o¨sszeg tagjai f¨ uggetlenek, d2 (t + s) = d2 (s) + d2 (t), teh´at d2 a fenti f¨ uggv´enyegyenlet megold´asa, amib˝ol k¨ovetkezik, hogy d 2 (t) = σ 2 t t ≥ 0 Teh´at a n¨ovekm´enyek eloszl´as´ara teljes¨ ul: √ ξ t − ξ s ∈ N (0, σ t − s) 0 ≤ s < t. 2. A folyamat v´arhat´o ´ert´eke ´es kovariancia f¨ uggv´enye: mt = 0 Γ(t, s) = σ 2 min{t, s} ami egyszer˝ u sz´amol´assal ellen˝or´ızhet˝o, ´es ´ıgy az un. korrel´aci´os f¨ uggv´eny pedig az al´abbi lesz (r r ) t s . , γ(t, s) = min s t 3. A folyamat v´eges dimenzi´os eloszl´asa a 0 ≤ t1 < t2 < . . . < tn id˝opontokban a n¨ovekm´enyek f¨ uggetlens´ege, ´es stacion´arius volta miatt egy n-dimenzi´os norm´alis eloszl´as lesz: t1 t1 · · · t 1 t t2 · · · t 2 2 1 (ξ t1 , ξ t2 , . . . ξ tn ) ∈ N 0, σ .. .. .. . . . · · · . t1 t2 · · · t n 4. Marting´al tulajdons´ag: ha 0 ≤ t1 < t2 < . . . < tn < t, akkor E(ξ t | ξ t1 , ξ t2 , . . . ξ tn ) = E(ξ t − ξ tn | ξ t1 , ξ t2 , . . . ξ tn ) + E(ξ tn | ξ t1 , ξ t2 , . . . ξ tn ) = ξ tn . 5. Markov tulajdons´ag: ha 0 ≤ t1 < t2 < . . . < tn < t, akkor az fξt |ξt1 ,ξt2 ,...ξ tn (x|x1 , x2 , . . . , xn ) =
fξ t ξ t
,ξt ,...ξtn (x,x1 ,x2 ,...,xn ) 2 ,ξ ,...ξ tn (x1 ,x2 ,...,xn ) 1 t2
1
fξ t
x ∈ R, (x1 , x2 , . . . , xn ) ∈ Rn
felt´eteles s˝ ur˝ us´egf¨ uggv´eny, mivel az egy¨ uttes eloszl´as norm´alis, olyan norm´alis eloszl´as s˝ ur˝ us´egf¨ uggv´enye, melynek v´arhat´o ´ert´eke a felt´eteles v´arhat´o ´ert´ek E(ξ t | ξ t1 = x1 , ξ t2 = x2 , . . . , ξ tn = xn ) = xn , sz´or´asa pedig a marad´ek sz´or´as q p σ R = E (ξ t − ξ tn )2 = D(ξ t−tn ) = σ (t − tn ).
K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
116
10. FEJEZET. SZTOCHASZTIKUS FOLYAMATOK
Teh´at
1 1 2 p (x − xn ) fξ t |ξ t1 ,ξt2 ,...ξ tn (x|x1 , x2 , . . . , xn ) = √ exp − 2 2σ (t − tn ) 2πσ (t − tn ) = fξt |ξ tn (x|xn ) x, xn ∈ R
amib˝ol k¨ovetkezik P (ξ t < x | ξ t1 = x1 , ξ t2 = x2 , . . . , ξ tn = xn ) = = P (ξ t < x | ξ tn = xn ) x, xn ∈ R,
Zx
fξt |ξ tn (u|xn )du =
−∞
vagyis tetsz˝oleges ξ t -vel kapcsolatos {ξ t ∈ A} esem´enyre: P (ξ t ∈ A | ξ t1 = x1 , ξ t2 = x2 , . . . , ξ tn = xn ) = P (ξ t ∈ A | ξ tn = xn ) xn ∈ R. 6. A trajekt´ori´ak folytonoss´aga: (a) n´egyzetes k¨oz´epben lim E (ξ t − ξ s )2 = lim σ 2 |t − s| = 0. t→s
(b) sztochasztikusan
t→s
∀ε > 0 :
lim P (|ξ t − ξ s | > ε) = 0 t→s
mivel a Markov egyenl˝otlens´egb˝ol
Megjegyz´ esek:
E ((ξ t − ξ s )2 ) 0 ≤ P |ξ t − ξ s |2 > ε2 ≤ ε2
1. A folyamat f¨ uggetlen ´es stacion´arius n¨ovekm´eny˝ us´ege miatt tetsz˝oleges n ∈ N + eset´en n ξ i − ξ (i−1) X t t t n n · ξt = t n n i=1 ami azt sugalja, hogy ξ t egyfajta integr´alk¨ozel´ıt˝o o¨sszegek hat´ar´ert´eke, felt´eve a
ξ s+h − ξ s s, h > 0 h differencia h´anyados valamilyen ´ertelemben vett hat´ar´ert´ek´enek l´etez´es´et h → 0 eset´en. Mivel σ D(η s,h ) = √ → ∞ ha h → 0, h ez a hat´ar´ert´ek nem l´etezhet, az eddigi fogalmaink szerint nincs olyen folyamat, melynek ξ t az integr´al-f¨ uggv´enye. Form´alisan ugyanis azt kellene elfogadnunk, hogy a Wiener folyamat olyan, minden id˝opontban v´egtelen nagy sz´or´as´ u Gauss folyamat integr´al f¨ uggv´enye, melynek k¨ ul¨onb¨oz˝o id˝opontokhoz tartoz´o a´llapotai f¨ uggetlenek. Ilyen a´ltal´anosabb ´ertelemben vett folyamat az un. feh´erzaj folyamat. η s,h =
´ WIENER FOLYAMAT 10.2. BROWN-MOZGAS,
117
2. Legyen (Wt )t≥0 az un. standard Wiener folyamat, teh´at amelynek 0 ≤ s < t id˝opontokhoz tartoz´o n¨ovekm´enyei: √ Wt − Ws ∈ N 0, t − s . Ekkor a σ-param´eter˝ u Wiener folyamat h > 0 id˝otartamhoz tartoz´o v´altoz´asaira dξ t = σ · dWt
(*)
ahol dξ t = ξ t+h − ξ t
dWt = Wt+h − Wt .
A (*) egyenletet, mint a sodr´asmentes, csak kaotikus Brown-mozg´ast le´ır´o differencia´legyenletet tekinthetj¨ uk a ξ 0 = 0 kezdeti felt´etellel. Ha van egy a´lland´o v sebess´eg˝ u sodr´as, a (*) egyenlet az al´abbiak szerint m´odosul: dξ t = v · dt + σ · dWt ,
(**)
a ξ 0 kezdeti ´ert´ekr˝ol pedig feltessz¨ uk, hogy f¨ uggetlen a Wt − Ws megv´altoz´asokt´ol, ha 0 ≤ s < t. A (**) egyenlet megold´asa ekkor ξ t = ξ 0 + v · t + σWt , amib˝ol az is l´athat´o, hogy ξ t f¨ uggetlen a t ≤ s < s0 id˝opontokhoz tartoz´o, teh´at a t-t k¨ovet˝o Ws0 − Ws megv´atoz´asokt´ol.
Mindezek term´eszetes a´ltal´anos´ıt´asa a
dξ t = F (t, ξ t ) · dt + G(t, ξ t ) · dWt
(***)
egyenlet, a Wt − Ws megv´altoz´asokt´ol (0 ≤ s < t) f¨ uggetlen ξ 0 kezdeti ´ert´ekkel. Ha ebb˝ol a kis h > 0 id˝otartamhoz tartoz´o n¨ovekm´enyeket ennek megfelel˝oen ´ırjuk: ξ t+h = ξ t + F (t, ξ t ) · h + G(t, ξ t ) · (Wt+h − Wt ) amib˝ol most is k¨ovetkezik, hogy ξ t+h f¨ uggetlen a Wt folyamat t + h-id˝opont ut´ani megv´altoz´asait´ol. Ebben az egyenletben az F az un. sodr´as, ´es G az un. diff´ uzi´os egy¨ utthat´o f¨ uggv´enyek. Term´eszetesen (***) pontos megfogalaz´asa Z t Z t ξt = ξ0 + F (t, ξ t ) · dt + G(t, ξ t ) · dWt 0
0
lenne, ahol az integr´alok, de k¨ ul¨on¨osen a m´asodik integr´al pontos ´ertelmez´ese n´emi el˝ok´esz¨ uletet ig´enyelne, ezzel azonban itt nem foglalkozunk. Ha pl. F line´aris a m´asodik v´altoz´oj´aban, teh´at F (t, ξ t ) = f (t)ξ t , a megold´as-folyamat v´arhat´o ´ert´eke megold´asa az m0 (t) = f (t) · m(t) t ≥ 0, m(0) = E(ξ 0 ) kezdeti´ert´ek feladatnak. K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
118
10. FEJEZET. SZTOCHASZTIKUS FOLYAMATOK
3. Ha a (***) egyenlet megold´as-folyamat´at a 0 < h (kicsiny) id˝otartam t¨obbsz¨or¨oseinek megfelel˝o id˝opontokban η n = ξ nh n = 0, 1, 2, . . . jel¨oli, kapjuk az η n+1 − η n = An (η n ) + bn (η n )εn+1 n ∈ N √ egyenletet, ahol An (x) = F (nh, x)´es bn (x) = hG(nh, x) /n ∈ N, x ∈ R/, tov´abb´a εn+1 = √1h W(n+1)h − Wnh n ∈ N az un. diszkr´et feh´erzaj id˝osora, vagyis f¨ uggetlen, standard norm´alis eloszl´as´ u v.v.-k sorozata. Ha bevezetj¨ uk m´eg az an (x) = An (x) − x f¨ uggv´enyt, kapjuk az η n+1 = an (η n ) + bn (η n )εn+1
n∈N
egyenletet, amib˝ol a line´aris esetben, teh´at amikor F a m´asodik v´altoz´oj´aban line´aris, tov´abb´a ha G nem f¨ ugg az a´llapott´ol, kapjuk η n+1 = an · η n + bn · εn+1
n ∈ N η0 = ξ0
az un. els˝orend˝ u aut´oregresszi´os id˝osort.
10.3.
F¨ uggetlen ´ es stacion´ arius n¨ ovekm´ eny˝ u folyamatok
Az al´abbiakban o¨sszefoglaljuk az el˝oz˝o k´et p´elda kapcs´an megismert tulajdons´agokat, ´es azon k¨ovetkezm´enyeket, amelyek a n¨ovekm´enyek f¨ uggetlens´eg´eb˝ol ´es stacion´arius volt´ab´ol k¨ovetkeznek. 10.5. Defin´ıci´ o. A (ξ t )t∈T , ahol T ⊂ R, sztochasztikus folyamatot f¨ uggetlen n¨ovekm´eny˝ unek nevezz¨ uk, ha tesz˝oleges t1 < t2 < . . . < tn ∈ T,
n∈N
eset´en a ξ tn − ξ tn−1 , ξ tn−1 − ξ tn−2 , . . . ξ t2 − ξ t1
val´osz´ın˝ us´egi v´altoz´ok f¨ uggetlenek.
10.6. Defin´ıci´ o. A (ξ t )t∈T , ahol T ⊂ R, sztochasztikus folyamatot stacion´arius n¨ovekm´eny˝ unek nevezz¨ uk, ha t1 < t 2 < . . . < t n ∈ T
´es t1 + h < t2 + h < . . . < tn + h ∈ T, n ∈ N
eset´en a ξ tn − ξ tn−1 , ξ tn−1 − ξ tn−2 , . . . ξ t2 − ξ t1
n¨ovekm´enyek egy¨ uttes eloszl´asa megegyezik a
ξ tn +h − ξ tn−1 +h , ξ tn−1 +h − ξ tn−2 +h , . . . ξ t2 +h − ξ t1 +h n¨ovekm´enyek egy¨ uttes eloszl´as´aval.
¨ ´ STACIONARIUS ´ ¨ ´ ˝ FOLYAMATOK 10.3. FUGGETLEN ES NOVEKM ENY U
119
Megjegyz´ esek: 1. A tk ´es tk+1 k¨oz¨otti ´eles egyenl˝otlens´eg term´eszetesen mindk´et defin´ıci´oban enyh´ıthet˝o, mivel egyenl˝os´eg eset´en a n¨ovekm´eny a konstans 0 = ξ tk+1 − ξ tk , ami minden val´osz´ın˝ us´egi v´altoz´ot´ol f¨ uggetlen, eloszl´asa pedig nem v´altozik a h-id˝oeltol´assal. 2. Ha a n¨ovekm´enyek stacion´arius eloszl´as´ uak, ´es T = R+ asos 0 vagy T = N, szok´ tov´abbi felt´etelez´es a kezd˝o a´llapotra: ξ 0 = 0. Ha ugyanis ez nem teljes¨ ul, a folyamatot ξ 0t = ξ t − ξ 0
t∈T
m´odos´ıtva, m´ar ilyen folyamatot kapunk. 3. A (ξ t )t∈T folyamat f¨ uggetlen n¨ovekm´eny˝ us´eg´eb˝ol, ha az s < t ∈ T id˝opontokhoz tartoz´o ξt − ξs n¨ovekm´eny eloszl´asa csak a t − s k¨ ul¨onbs´egt˝ol f¨ ugg, k¨ovetkezik a n¨ovekm´enyek stacion´arius tulajdons´aga.
Most felsorolunk n´eh´any, a p´eld´akban is bemutatott k¨ovetkezm´enyt. K¨ ovetkezm´ enyek: 1. Legyen (ξ t )t∈T f¨ uggetlen ´es stacion´arius n¨ovekm´eny˝ u folyamat,´es ξ 0 = 0 ´es T = + R0 , N,R vagy Z, tov´abb´a a v´arhat´o ´ert´ek ´es sz´or´as az id˝o-param´eter folytonos f¨ uggv´enye (ami a diszkr´et id˝o-param´eter eset´en mind´ıg teljes¨ ul), akkor teljes¨ ulnek az al´abbi a´ll´ıt´asok. (a) A folyamat sz´or´asn´egyzete ´es v´arhat´o ´ert´eke D 2 (ξ t ) = σ 2 · |t|
t ∈ T,
m(t) = E(ξ t ) = λ · t t ∈ T. Bizony´ıt´ as. Ha T = N vagy Z, akkor D 2 (ξ n ) = D 2
n X k=1
ξ k − ξ k−1
!
= σ 2 |n|
n∈T
ahol σ 2 = D 2 (ξ 1 ). Ha T = R+ olje d(t) = D 2 (ξ t ) t ∈ T nemnegat´ıv 0 vagy R, jel¨ p´aros f¨ uggv´enyt, ´es ekkor 0 ≤ t, s eset´en teljes¨ ul d(t + s) = d(t) + d(s) K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
120
10. FEJEZET. SZTOCHASZTIKUS FOLYAMATOK
mely egyenlet megold´asa d(t) = σ 2 |t|
t ∈ T.
Hasonl´oan, ha λ = m(1) kapjuk a diszkr´et esetben m(n) = λ · n n ∈ T, ´es a folytonos id˝o-param´eter eset´en ha s, t ∈ T m(t + s) = m(t) + m(s) aminek megold´asa m(t) = λ · t t ∈ T, ahol λ = m(1). (b) A folyamat kovarianciaf¨ uggv´enye Γ(t, s) = σ 2 min{t, s} s, t ∈ T, korrel´aci´os f¨ uggv´enye pedig γ(t, s) = min
(r
t , s
r ) s t
0 < s, t ∈ T.
Bizony´ıt´ as. Ha 0 ≤ t < s ∈ T ξ s = ξ t + (ξ s − ξ t ) k´et f¨ uggetlen v.v. o¨sszege, ´ıgy E(ξ s · ξ t ) = D 2 (ξ t ) + E 2 (ξ t ) + (E(ξ s ) − E(ξ t )) E(ξ t ) = σ 2 t + E(ξ s ) · E(ξ t ) amib˝ol kapjuk a bizony´ıtand´o a´ll´ıt´ast. (c) A folyamat trajekt´ori´ai folytonosak n´egyzetes k¨oz´epben ´es sztochasztikusan. Bizony´ıt´ as. Mint a Wiener-folyamat p´eld´aj´aban. (d) Ha λ = E(ξ 1 ) > 0 akkor a folyamat sztochasztikusan diverg´al +∞-hez, azaz minden K ∈ R eset´en lim P (ξ t ≤ K) = 0 . (10.3) t→∞
Bizony´ıt´ as. Legyen 0 < t0 ∈ T olyan, hogy E(ξ t ) = λt > K ha t > t0 , ekkor a Csebisev egyenl˝otlens´eg 5.4 k¨ovetkezm´eny´et haszn´alva kapjuk P (ξ t ≤ K) = P (λt − ξ t ≥ λt − K) ≤ P (|λt − ξ t | ≥ λt − K) ≤ amib˝ol t → ∞ eset´en k¨ovetkezik az a´ll´ıt´as.
σ2t , (λt − K)2
¨ ´ STACIONARIUS ´ ¨ ´ ˝ FOLYAMATOK 10.3. FUGGETLEN ES NOVEKM ENY U
121
Megjegyz´ es: 10.3 ´ırhat´o lim P (ξ t > K) = 1
t→∞
alakban is, ´es λ < 0 eset´en hasonl´oan nyerhet˝o, hogy a folyamat −∞-be diverg´al, vagyis lim P (ξ t < K) = 1 . t→∞
2. Legyen a (ξ t )t∈T folyamat f¨ uggetlen n¨ovekm´eny˝ u ´es centr´alt, azaz E(ξ t ) = 0, ahol + most T = N vagy R0 ´es ξ 0 = 0, akkor ∀ 0 ≤ t 1 < t2 < . . . < t n < t ∈ T eset´en E(ξ t | ξ t1 , ξ t2 , . . . , ξ tn ) = ξ tn teh´at teljes¨ ul az un. marting´ al tulajdons´ ag. Bizony´ıt´ as. Mivel a folyamat f¨ uggetlen n¨ovekm´eny˝ u E(ξ t − ξ tn | ξ t1 , ξ t2 , . . . , ξ tn ) = E(ξ t − ξ tn ) = 0 ´es E(ξ tn | ξ t1 , ξ t2 , . . . , ξ tn ) = ξ tn kapjuk ezek o¨sszeg´eb˝ol a bizony´ıtand´o a´ll´ıt´ast. 3. Legyen a (ξ t )t∈T folyamat f¨ uggetlen n¨ovekm´eny˝ u, ahol most T = N vagy R+ 0 , ξ 0 = 0, akkor ∀ 0 ≤ t 1 < t2 < . . . < t n < t ∈ T ´es x, x1 , x2 . . . , xn ∈ R eset´en P (ξ t < x | ξ t1 = x1 , ξ t2 = x2 , . . . , ξ tn = xn ) = P (ξ t < x | ξ tn = xn ),
(10.4)
teh´at teljes¨ ul az un. Markov tulajdons´ ag. Bizony´ıt´ as. Mivel η = ξ t − ξ tn f¨ uggetlen a ξ tn − ξ tn−1 , ξ tn−1 − ξ tn−2 , . . . , ξ t1 − ξ 0 = ξ t1 n¨ovekm´enyekt˝ol, ez´ert f¨ uggetlen annak f¨oggv´enyek´ent ´ırhat´o ξ = ξ t1 , ξ t2 , . . . , ξ tn
K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
122
10. FEJEZET. SZTOCHASZTIKUS FOLYAMATOK
v.v.v.-t´ol is, ´es a felt´eteles v´arhat´o ´ertkkkel kapcsolatos 105. oldal 5. feladat szerint, mivel ξ ´es η f¨ uggetlenek, ´es f (x1 , x2 , . . . , xn ) = x − xn jel¨ol´essel kapjuk: P (η < f ◦ ξ | ξ = (x1 , x2 , . . . , xn )) = = P (ξ t − ξ tn < x − ξ tn | ξ = (x1 , x2 , . . . , xn )) = = P (ξ t − ξ tn < x − xn ) , de akkor P (ξ t < x | ξ tn = xn ) = P (ξ t − ξ tn < x − xn ) is teljes¨ ul, amib˝ol k¨ovetkezik 10.4.
10.4.
Stacion´ arius folyamatok
A kor´abbiakban olyan folyamatokat vizsg´altunk, melyek id˝obeni megv´altoz´asai rendelkeztek nevezetes tulajdons´agokkal, f¨ uggetlenek ill. stacion´ariusak. Ilyen folyamatok diszkr´et id˝opontokban val´o megfigyel´ese eset´en a differenci´ak k´epz´es´evel kapott u ´ j folyamat rendelkezik a k¨ovetkez˝o tulajdons´aggal. 10.7. Defin´ıci´ o. A (ξ t )t∈T sztochasztikus folyamatot (er˝osen) stacion´ariusnak nevezz¨ uk, ha t1 , t2 , . . . , tn ∈ T ⊂ R ´es t1 + h, t2 + h, . . . , tn + h ∈ T eset´en a ξ t1 , ξ t2 , . . . , ξ tn
´es ξ t1 +h , ξ t2 +h , . . . , ξ tn +h
v´eges dimenzi´os peremek eloszl´asa megegyezik. Megjegyz´ esek: 1. Stacion´arius folyamat eset´en ξ t eloszl´asa ∀t ∈ T eset´en ugyanaz, teh´at a v´arhat´o ´ert´ek ´es sz´or´as-f¨ uggv´eny m(t) = E(ξ t ) = m, D(ξ t ) = σ
t∈T
a´lland´o, illetve a kovariancia f¨ uggv´eny Γ(t, s) = cov(ξ t , ξ s ) = R(t − s)
t, s ∈ T
ahol R : T − T → R p´aros f¨ uggf´eny, R(0) = σ 2 , ´es T − T = {t − s|t, s ∈ T } . 2. A Γ illetve R kovarianciaf¨ uggv´eny egy un. pozit´ıv szemidefinit f¨ uggv´eny, azaz: ∀t1 , t2 , . . . , tn ∈ T
´es ∀x1 , x2 , . . . , xn ∈ R
´ 10.4. STACIONARIUS FOLYAMATOK
123
eset´en teljes¨ ul n X n X
Γ(tk , tl )xk xl =
k=1 l=1
n X n X k=1 l=1
R(tk − tl )xk xl ≥ 0,
ami egyszer˝ u k¨ovetkezm´enye a megfelel˝o v´eges dimenzi´os perem kovariancia m´atrixa hasonl´o tulajdons´ag´anak. 3. Stacion´arius Gauss folyamat (a v´eges dimenzi´os peremek egy¨ uttes eloszl´asa norm´alis) eset´en a folyamat v´eges dimenzi´os eloszl´asait meghat´arozza az R f¨ uggv´eny, ´es az m a´lland´o. 10.8. Defin´ıci´ o. A (ξ t )t∈T sztochasztikus folyamatot gyeng´en stacion´ariusnak nevezz¨ uk, ha ∀t ∈ T ∀t, s ∈ T
eset´en m(t) = E(ξ t ) = m a´lland´o eset´en Γ(t, s) = cov(ξ t , ξ s ) = R(t − s),
ahol R : T − T → R f¨ uggv´enyt nevezz¨ uk a folyamat (auto-) kovariancia f¨ uggv´eny´enek. Megjegyz´ esek: 1. Ha teljes¨ ul m´eg R(0) = 1, szok´as R-et (auto-) korrel´aci´os f¨ uggv´enynek nevezni, mivel ekkor R(h) a h t´avols´agra l´ev˝o id˝opontokhoz tartoz´o a´llapotok korrel´aci´os egy¨ utthat´oja. Szint´en gyakori egyszer˝ us´ıt´esi lehet˝os´eg, hogy a folyamat centr´altj´at vizsg´aljuk, teh´at m = 0. 2. Az nyilv´anval´o, hogy az er˝osen stacion´arius folyamat gyeng´en is stacion´arius, felt´eve a v´arhat´o ´ert´ekek ´es kovarianci´ak l´etez´eset. Ford´ıtva, pl. Gauss folyamat eset´en a gyeng´en stacion´aris tulajdons´agb´ol k¨ovetkezik az er˝os ´ertelemben vett stacion´arius tulajdons´ag. 3. Komplex ´ert´ek˝ u folyamatok eset´en a kovariancia f¨ uggv´eny h i Γ(t, s) = cov(ξ t , ξ s ) = E (ξ t − m(t)) (ξ s − m(s))
t, s ∈ T
theh´at stacion´arius folyamat eset´en R ∈ R → C pozit´ıv szemidefinit f¨ uggv´eny, azaz ∀t1 , t2 , . . . , tn ∈ T
eset´en
n X n X k=1 l=1
´es ∀x1 , x2 , . . . , xn ∈ C
R(tk − tl )xk x¯l ≥ 0.
A k¨ovetkez˝o egyszer˝ u k¨ovetkezm´enyekben azt soroljuk fel, hogy a stacion´arius (er˝os vagy gyenge) tulajdons´ag megmarad bizonyos transzform´aci´ok eset´en. Megjegyz´ esek: K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
124
10. FEJEZET. SZTOCHASZTIKUS FOLYAMATOK
1. Legyen (ξ t )t∈T stacion´arius er˝os vagy gyenge ´ertelemben, ´es c ∈ R olyan, hogy ha t ∈ T akkor c · t ∈ T, akkor η t = ξ ct t ∈ T folyamat is stacion´arius, melynek v´arhat´o ´ert´ek ´es kovariancia f¨ uggv´enye: mη (t) = m t ∈ T,
Rη (h) = Rξ (c · h) h ∈ T,
ahol m = E(ξ t ). 2. Legyen (ξ t )t∈T stacion´arius er˝os vagy gyenge ´ertelemben, ´es T 0 ⊂ T , akkor az ηt = ξt
t ∈ T0
”lesz˝ uk´ıt´es” is stacion´arius hasonl´o ´ertelemben. Ezt gyakran alkalmazzuk folytons id˝oparam´eter˝ u folyamat diszkr´et id˝opontokban t¨ort´en˝o megfigyel´ese eset´en. Ekkor (η t )t∈T v´arhat´o ´ert´ek ´es kovariancia f¨ uggv´enye egyszer˝ u lesz˝ uk´ıt´ese az eredetinek. 3. Legyen (ξ t )t∈T stacion´arius er˝os vagy gyenge ´ertelemben, ´es a, b ∈ R, akkor ηt = a · ξt + b t ∈ T szint´en stacion´arius a megfelel˝o ´ertelemben. Ekkor (η t )t∈T v´arhat´o ´ert´ek ´es kovariancia f¨ uggv´enye: mη (t) = a · m + b t ∈ T,
Rη (h) = |a|2 Rξ (h) h ∈ T − T,
ahol m = E(ξ t ). 4. Legyenek (ξ t )t∈T , (η t )t∈T f¨ uggetlen stacion´arius folyamatok er˝os vagy gyenge ´ertelemben, akkor ζ t = ξ t + ηt t ∈ T szint´en stacion´arius a megfelel˝o ´ertelemben. Az o¨sszeg v´arhat´o ´ert´ek ´es kovariancia f¨ uggv´enye: mζ (t) = mξ + mη
t ∈ T,
Rζ (h) = Rξ (h) + Rη (h) h ∈ T − T
ahol mξ = E(ξ t ), mη = E(η t ). A k¨ovetkez˝okben n´eh´any nevezetes stacion´arius (gyenge ill. er˝os ´ertelemben) folyamatot mutatunk be. P´ eld´ ak: 1. Legyen ξ egy v.v. E(ξ) = m, D(ξ) = σ, ´es legyen ξ t = ξ t ∈ T (R, vagy Z). Nyilv´an (ξ t )t∈T stacion´arius, er˝os ´ertelemben, melynek trajekt´ori´ai semmi v´altoz´ast nem mutatnak, a´lland´ok. A folyamat v´arhat´o ´ert´eke ´es kovariancia f¨ uggv´enye: m(t) = m R(t) = σ 2
t ∈ T.
´ 10.4. STACIONARIUS FOLYAMATOK
125
2. Legyenek εt ∈ N (0, 1) t ∈ Z f¨ uggetlenek, vagyis a diszkr´et feh´erzaj, ´es legyen ξ t = σεt t ∈ Z. Nyilv´an (ξ t )t∈T stacion´arius, er˝os ´ertelemben. Az el˝oz˝o p´eld´aval ellent´etben a trajekt´ori´ak teljesen v´eletlen v´altakoz´ast mutatnak, mivel a k¨ ul¨onb¨oz˝o id˝opontokhoz tartoz´o a´llapotok teljesen f¨ uggetlenek.A folyamat v´arhat´o ´ert´eke ´es kovariancia f¨ uggv´enye: ( 2 σ ha t = 0 t ∈ Z. m(t) = 0 R(t) = 0 egy´ebk´ent 3. A k¨ovetkez˝o p´elda folyamata az el˝oz˝o sz´els˝os´egekhez k´epest szab´alyos, peri´odikus v´altoz´as´ u trajekt´ori´akkal rendelkezik. ´ ıt´ All´ as: Legyen g : R → R egy T -szerint peri´ odikus f¨ uggv´eny, τ ∈ U (0, T ) (egyenletes eloszl´ as´ u a [0, T ] intervallumon) v.v., ´es legyen ξ t = g(t + τ ) t ∈ R sztochasztikus folyamat, akkor (ξ t )t∈R er˝ osen stacion´ arius. Bizony´ıt´ as. Felhaszn´aljuk, hogy egy ξ : Ω → Rn v.v.v y ∈ Rn ϕξ (y) = E ei
karakterisztikus f¨ uggv´enye egy´ertelm˝ uen meghat´arozza ξ eloszl´as´at. Legyenek t1 , t2 , . . . , tn , h ∈ R, ´es ´ırjuk fel ξ = (ξ t1 , ξ t2 , . . . , ξ tn ) karakterisztikus f¨ uggv´eny´et: 1 ϕξ (y) = T
Z
T
ei
Pn
k=1
yk g(tk +x)
dx
0
amib˝ol x = u + h helyettes´ıt´essel Z 1 T −h i Pnk=1 yk g(tk +h+u) e du = ϕξ (y) = T −h Z Z 1 T −h i Pnk=1 yk g(tk +h+u) 1 0 i Pnk=1 yk g(tk +h+u) = e du + e du T 0 T −h ahol a m´asodik integr´alban helyettes´ıts¨ unk u = v −T -t, ´es kihaszn´alva g peri´odikuss´ag´at kapjuk Z Z 1 T i Pnk=1 yk g(tk +h+v) 1 T −h i Pnk=1 yk g(tk +h+u) e du + e dv = ϕξ (y) = T 0 T T −h Z 1 T i Pnk=1 yk g(tk +h+u) e du = T 0 K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
126
10. FEJEZET. SZTOCHASZTIKUS FOLYAMATOK
ami ´eppen (ξ t1 +h , ξ t2 +h , . . . , ξ tn +h ) karakterisztikus f¨ uggv´enye, teh´at ξ t1 , ξ t2 , . . . , ξ tn
´es ξ t1 +h , ξ t2 +h , . . . , ξ tn +h
egy¨ uttes eloszl´asa megegyezik. K¨ ovetkezm´ enyek: A folyamat a´lland´o v´arhat´o ´ert´eke Z 1 T g(x)dx, m = E(ξ t ) = E(ξ 0 ) = T 0 sz´or´asn´egyzete 1 σ = D (ξ t ) = D (ξ 0 ) = T 2
2
2
Z
T 0
g 2 (x)dx − m2 ,
tov´abb´a a t, s ∈ R id˝opontokhoz tartoz´o kovariancia f¨ uggv´enye Z 1 T g(x)g(t − s + x)dx − m2 , Γ(t, s) = cov(ξ 0 , ξ t−s ) = R(t − s) = T 0 vagyis 1 R(h) = T
Z
T 0
g(x)g(h + x)dx − m2
h ∈ R.
4. Az el˝oz˝o p´elda szerint k¨onnyen konstru´alhatunk v´eletlen peri´odikus folyamatokat a trigonometrikus f¨ uggv´enyek felhaszn´al´as´aval, melyek megjelen´ese term´eszetes sok alkalmaz´as eset´en. (a) Legyen teh´at az ω -frekvenci´aj´ u v´eletlen harmonikus f¨ uggv´eny (az id˝o-param´eter konstanssal val´o szorz´asa nem v´altoztat a stacion´arius tulajdons´agon): √ ξ t = 2σ cos(ω · t + τ ) t ∈ R, ahol τ egyenletes eloszl´as´ u v.v. a [0, 2π] intervallumban. Ekkor a fentiek szerint (ξ t )t∈R stacion´arius, ´es √ Z 2π 2σ cos(x)dx = 0 m(t) = π 0 Z σ 2 2π R(h) = cos(x) cos(ω · h + x)dx = σ 2 cos(ω · h) h ∈ R. π 0 ´Irjuk most az add´ıci´os k´epletek felhaszn´al´as´aval ezt a folyamatot az al´abbi alakba ξ t = A cos(ωt) + B sin(ωt) t ∈ R, ahol az A=
√
2σ cos(τ ) B =
√
2σ sin(τ )
´ 10.4. STACIONARIUS FOLYAMATOK
127
val´osz´ın˝ us´egi v´altoz´okra E(A) = E(B) = cov(A, B) = D 2 (A) = D 2 (B) =
Z
2π
√
2σ cos(x)dx = 0, 2π 0 Z 2π √ 2σ sin(x)dx = 0, 2π 0 Z 2π 2 σ cos(x) sin(x)dx = 0, E(A · B) = π 0 Z 2π 2 σ 2 cos2 (x)dx = σ 2 , E(A ) = π 0 Z 2π 2 σ E(B 2 ) = sin2 (x)dx = σ 2 . π 0
Az itt szerepl˝o ω, A ´es B szeml´eletes jelent´essel b´ırnak, az el˝obbi a harmonikus v´eletlen f¨ uggv´eny frekvenci´aja, az ut´obbiak pedig a v´eletlen f´azissz¨oget (τ ) ´es az amplitud´ot (ami itt most val´oj´aban nem is v´eletlen, mert A2 + B 2 = 2σ 2 ) hat´arozz´ak meg. A jel intenzit´as´anak a D 2 (ξ t ) = 2σ 2 a´lland´o mennyis´eget tekinthetj¨ uk. Vegy¨ uk ´eszre, hogy mindezek m´ar meghat´arozz´ak a folyamat v´arhat´o ´ert´ek´et, ´es kovariancia f¨ uggv´eny´et, teh´at a k¨ovetkez˝o p´elda folyamata, ha nem is lesz felt´etlen¨ ul er˝os ´ertelemben stacion´aris, de gyeng´en igen. (b) Legyenek A, B val´osz´ın˝ us´egi v´altoz´ok ´es E(A) = E(B) = E(A · B) = 0,
D 2 (A) = D 2 (B) = σ 2 ,
ami teljes¨ ul, ha pl. A ´es B f¨ uggetlen azonos sz´or´as´ u, 0 v´arhat´o ´ert´ek˝ u val´osz´ın˝ us´egi v´altoz´o. Ekkor a ξ t = A cos(ωt) + B sin(ωt) t ∈ R v´eletlen harmonikus f¨ uggv´eny gyeng´en stacion´aris, v´arhat´o ´ert´eke ´es kovariancia f¨ uggv´enye: m(t) = 0 t ∈ R R(h) = σ 2 cos(ω · h) h ∈ R.
Ha m´eg feltessz¨ uk, hogy A ´es B norm´alis eloszl´as´ uak, akkor a(ξ t )t∈R folyamat er˝osen stacion´arius. (c) Mivel a stacion´aris tulajdons´ag meg˝orz˝odik f¨ uggetlen folyamatok o¨sszegz´ese eset´en, legyenek Ak , Bk k = 1, 2, . . . korrel´alatlan val´osz´ın˝ us´egi v´altoz´ok (pl. f¨ uggetlenek), ´es legyen D 2 (Ak ) = D 2 (Bk ) = σ 2k
k = 1, 2, . . . K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
128
10. FEJEZET. SZTOCHASZTIKUS FOLYAMATOK
ekkor a ξt =
X k
(Ak cos(ω k · t) + Bk sin(ω k · t))
t∈R
v´eletlen harmonikus folyamat gyeng´en stacion´arius, v´arhat´o ´ert´eke ´es kovariancia f¨ uggv´enye m(t) = 0 t ∈ R X R(h) = σ 2k cos(ω k · h) h ∈ R. k
Ha m´eg felt´etelezz¨ uk, hogy az Ak , Bk k = 1, 2, . . . val´osz´ın˝ us´egi v´altoz´ok norm´alis eloszl´as´ uak, a folyamat er˝os ´ertelemben is stacion´arius. Ilyenkor az {ω 1 , ω 2 , ω 3 , . . .} frekvenci´akat a folyamat spektrum´anak nevezz¨ uk, a (σ 2k )k mennyis´egeket, mivel ezek az egyes frekvenci´akhoz tartoz´o o¨sszetev˝ok v´eletlen amplitud´oj´anak m´ert´ekei, a v´eges diszkr´et eloszl´asok anal´ogi´ajak´ent a spektrum eloszl´as´anak, a kett˝ot egy¨ ut, teh´at a ω k 7→ σ 2k hozz´arendel´est, a folyamat spektr´alis eloszl´ as´anak nevezz¨ uk. Ez term´eszetesen nem val´osz´ın˝ us´egP 2 eloszl´as, teh´at a´ltal´aban k σ k 6= 1. A spektrumot alkot´o frekvenci´akr´ol mind´ıg feltehet˝o, hogy csak nemnegat´ıv elemei vannak, mert egy ω < 0 frekvencia eset´en mind´ıg ´ırhatjuk: A cos(ωt) + B sin(ωt) = A cos(−ωt) + (−B) sin(−ωt) ami ism´et felt´eteleinknek megfelel˝o harmonikus tagot eredm´enyez, az azonos frekvenci´ahoz taroz´o tagokat term´eszetesen o¨sszevonva. Ugyanakkor a spektrumot mint a 0-ra szimmetrikus halmazt is tekinthetj¨ uk, ´es a folyamat pozit´ıv σ 2 frekvenci´aj´ u ω 7−→ σ tagj´ahoz v´alasszuk az A1 , A2 , B1 , B2 ∈ N 0; √2 f¨ uggetlen v.v.-kat, amivel a A1 cos(ωt) + B1 sin(ωt) + A2 cos(−ωt) + B2 sin(−ωt) szochasztikusan ekvivalens szimmetrikus o¨sszetev˝okre bontva kapjuk a 0-ra σ2 szimmetrikus ±ω k 7→ 2k spektr´alis eloszl´ast. Figyelemre m´elt´o ugyanakkor, hogy a kovariancia f¨ uggv´eny ezen spektr´alis eloszl´ashoz tartoz´o ”karakterisztikus f¨ uggv´eny”, ami a spektr´alis eloszl´as szimmetrikuss´aga folyt´an val´os ´ert´ek˝ u ´ lesz, ha ism´et a val´osz´ın˝ us´egsz´am´ıt´asi anal´ogi´akra utalunk. Altal´aban a stacion´aris folyamatok kovariancia f¨ uggv´eny´enek R(h) =
X σ2
k iω k h
±ω k
illetve R(h) =
2
Z+∞
−∞
e
=
X ωk
σ 2k cos(ω k · h) h ∈ R,
f (ω) iωh e dω = 2
Z+∞ f (ω) cos(ωh)dω 0
´ 10.4. STACIONARIUS FOLYAMATOK
129
alak´ u el˝oa´ll´ıt´asa eset´en besz´el¨ unk a folyamat ω k 7→ σ 2k
ω k ≥ 0 illetve
± ω k 7→
σ 2k 2
diszkr´et spektr´alis eloszl´as´ar´ol, illetve az ω 7→ f (ω) ω ≥ 0 illetve
± ω 7→
f (ω) 2
folytonos spekr´alis eloszl´asr´ol, ahol az f f¨ uggv´enyt spekr´alis s˝ ur˝ us´egf¨ uggv´enynek nevezz¨ uk. Utols´o p´eld´ankban eljutottunk egy olyan stacion´arius folyamathoz, mely sok v´eletlen jelens´eg modellj´eu ¨ l szolg´alhat. Ha a spektrummal kapcsolatban elmondottakat figyelembe vessz¨ uk, azt mondhatjuk, hogy az 1. p´ elda egy 0 7→ σ 2 spektr´alis eloszl´as´ u v´eletlen harmonikus folyamat, melyhez minden id˝opontban m´eg hozz´aadtunk egy m a´lland´ot, mivel ezen ”indik´ator” eloszl´as ”karakterisztikus f¨ uggv´enye” lesz az R(h) = σ 2 cos(0 · h) h ∈ R kovariancia f¨ uggv´eny. Mivel a 2. p´ elda kovariancia f¨ uggv´enye σ2 R(h) = 2π
Zπ
−π
e
iω·h
σ2 dω = π
Zπ 0
cos(ω · h)dω
h ∈ Z,
azt mondhatjuk, hogy a diszkr´et feh´erzaj spektr´alis eloszl´asa egyenletes a [0, π] inter2 2 vallumon. Teh´at minden ω ∈ [0, π] frekvencia azonos σπ , illetve ω ∈ [−π, π] eset´en σ2π spektr´alis s˝ ur˝ us´eggel vesz r´eszt a folyamat ”el˝oa´llit´as´aban”. Ezt az el˝oa´ll´ıt´ast u ´ gy ´ertj¨ uk, hogy a X ξt = (Ak cos(ω k t) + Bk sin(ω k t)) t ∈ Z k
folyamat el˝oa´ll´ıt´as´aban az ω k ∈ [0, π] frekvenci´ak halmaz´at minden hat´aron t´ ul finom´ıtva, az Ak, Bk ∈ N (0, σ) k = 1, 2, . . . f¨ uggetlen val´osz´ın˝ us´egi v´altoz´okkal juthatunk olyan v´eletlen harmonikus Gauss folyamathoz, melynek v´egesdimenzi´os eloszl´asai tetsz˝olegesen megk¨ozel´ıtik a diszkr´et feh´erzaj id˝osor´et. Egy m´ar kor´abban eml´ıtett p´eld´ahoz juthatunk, egy olyan stacion´arius (ξ t )t∈R Gauss folyamatb´ol, melyre E (ξ t ) = 0 R(h) = a · e−b|h|
h ∈ R. K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
130
10. FEJEZET. SZTOCHASZTIKUS FOLYAMATOK
Ekkor R(h) =
Z+∞
1 ab eiωh dω 2 2 πb +ω
−∞
h∈R
ab teh´at a folyamat spektr´alis s˝ ur˝ us´ege ω 7→ π1 b2 +ω ω ∈ R. Ha az a → +∞, b → +∞ 2 1 a ur˝ us´eg az eg´esz sz´amegyenesen hat´ar´atmenetet vizsg´aljuk u ´ gy, hogy b → 2 , akkor ez a s˝ 1 a´lland´o 2π spektr´alis s˝ ur˝ us´eghez tart, a kovariancia f¨ uggv´eny pedig ( +∞ ha h = 0 lim R(h) = a→∞,b→∞ 0 egy´ebk´ent
ami a kor´abban m´ar eml´ıtett, k¨oz¨ons´eges ´ertelemben nem l´etez˝o, folytonos feh´erzaj folyamat jellemz˝oje. Mindezt meger˝os´ıti, hogy ekkor az ηt =
Zt 0
ξ t dt t ∈ R
Gauss folyamatra, az integr´al´as ´es v´arhat´o ´ert´ek k´epz´est felcser´elve, kapjuk E(η t ) = 0 t ∈ R ´es ha t ≤ s ∈ R cov(η t , η s ) =
Z t Zs 0
0
a a ae−b|u−v| dudv = 2 · t + 2 e−bt + e−bs − e−b(s−t) b b
amib˝ol lim
a,b→+∞, ab → 21
cov(η t , η s ) = min{t, s} t, s ∈ R,
˙t teh´at a (ξ t )t∈R val´oban a folytonos feh´erzaj, a W
10.5.
t∈R
k¨ozel´ıt´es´enek tekinthet˝o.
Feladatok
1. Mutassuk meg, hogy (ξ t )t∈R pontosan akkor Markov folyamat, ha s1 < s2 < · · · < sr < t < u1 < u2 < · · · < uq ∈ R ´es x1 , x2 , · · · , xr , y1 , y2 , · · · , yq ∈ R eset´en P (ξ s1 < x1 , ξ s2 < x2 , · · · , ξ sr < xr , ξ u1 < y1 , ξ u2 < y2 , · · · , ξ uq < yq | ξ t ) = P (xξ s1 < x1 , ξ s2 < x2 , · · · , ξ sr < xr | ξ t ) · P (ξ u1 < y1 , ξ u2 < y2 , · · · , ξ uq < yq | ξ t ) . 2. Mutassuk meg, hogy ha (ξ t )t∈R Markov folyamat, akkor s < t < u ´es x ∈ R eset´en P (ξ u < x | ξ s ) = E (P (ξ u < x | ξ t ) | ξ s ) . K¨ ovetkezm´ eny: Ha a v´eges dimenzi´os peremek
131
10.5. FELADATOK
(a) diszkr´et eloszl´as´ uak, akkor P (ξ u = x | ξ s = y) =
X z
P (ξ u = x | ξ t = z) · P (ξ t = z | ξ s = y) ;
(b) folytonos eloszl´as´ uak, akkor fξ u |ξs (x | y) =
Z
R
fξ u |ξt (x | z) · fξ t |ξs (z | y)dz .
3. Mutassuk meg, hogy (ξ n )n∈N id˝osor pontosan akkor Markov tulajdons´ag´ u, ha minden n ∈ N ´es x ∈ R eset´en P (ξ n+1 < x | ξ n , ξ n−1 , . . . , ξ 0 ) = P (ξ n+1 < x | ξ n ) . 4. Legyen a (ξ n )n∈N id˝osor Markov tulajdons´ag´ u, ´es az a´llapott´er im(ξ n ) = {1, 2, . . . , n}. Mutassuk meg, hogy a (ξ n )n∈N Markov l´anc v´eges dimenzi´os eloszl´asait meghat´arozz´ak a Πn+1,n = P (ξ n+1 = l | ξ n = k) k=1,2,...,n ∈ Rn×n l=1,2,...,n
un. egy-l´ep´eses a´tmenet val´osz´ın˝ us´egek, ´es a ξ 0 kezdeti a´llapot eloszl´asa.
5. Igazoljuk, hogy ha egy homog´en Markov l´ancnak (Πn+1,n = Π n = 0, 1, . . .) hat´areloszl´asa p ∈ R1×n , akkor p stacion´arius eloszl´as, azaz p·Π=p . 6. Egy urn´aban 3 goly´o van, a k¨ozt¨ uk l´ev˝o pirosak sz´am´at jel¨olje a ξ 0 val´osz´ın˝ us´egi v´altoz´o. Egym´as ut´an v´eletlenszer˝ uen kivesz¨ unk egy goly´ot ´es minden h´ uz´as ut´an egy feh´eret betesz¨ unk a kivett goly´o helyett. Jel¨olje ξ n az n-edik h´ uz´as ut´an az urn´aban l´ev˝o piros goly´ok sz´am´at, n = 1, 2, . . .. Markov l´ancot alkot-e a (ξ n )n∈N id˝osor? Ha igen, adjuk meg az a´tmenetval´osz´ın˝ us´egek m´atrix´at, van-e stacion´arius eloszl´as? Ha P (ξ 0 = 2) = 1 mennyi a P (ξ 2 ≥ 1) val´osz´ın˝ us´eg? 7. Legyenek ε1 , ε2 , ε3 , . . . ∈ N 0, 1) f¨ uggetlenk, ´es ξn =
n X k=1
εk
n ∈ N+
ξ0 = 0
´Irjuk fel az id˝osor v´arhat´o ´ert´ek ´es kovariancia f¨ uggv´eny´et! Milyenek a (ξ n )n∈N folyamat n¨ovekm´enyei? 8. Legyen
1 ξ t = t · (τ − ) t ∈ R 2 ahol τ a [0,1] intervallumin egyenletes eloszl´as´ u val´osz´ın˝ u s´egi v´altoz´o. Adjuk meg a v´arhat´o ´ert´ek ´es kovariancia f¨ uggv´enyeket. Stacion´arius-e a (ξ t )t∈R folyamat? K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
132
10. FEJEZET. SZTOCHASZTIKUS FOLYAMATOK
9. Legyen ξ 0 = 0,
εn ∈ N (0, 1) n = 1, 2, . . . f¨ uggetlenek, ´es ξ n+1 = aξ n + εn+1
n = 0, 1, 2, . . .
Milyen a eset´en lesz (ξ n )n∈N marting´al? Teljes¨ ul-e ekkor a Markov tulajdons´ag? Mutassuk meg, hogy ”el´eg nagy” N ∈ N ´es |a| < 1 eset´en (ξ n )n≥N stacion´arius id˝osor, melynek (folytonos) spektr´alis eloszl´asa ω 7→
1 1 · 2π 1 − 2a cos ω + a2
ω ∈ [0, 2π].
Keress¨ uk a spektr´alis s˝ ur˝ us´egf¨ uggv´enyt az al´abbi alakban: ∞ 1 1X R(n) · cos nω f (ω) = · R(0) + 2π π n=1
ω ∈ [0, 2π]
10. Egy Brown-mozg´ast v´egz˝o r´eszecske egys´egnyi id˝otartam alatti helyv´altoz´as´anak sz´or´asa 0.5 . Mennyi annak val´osz´ın´ us´ege, hogy 4 id˝oegys´eg alatt a r´eszecske 1.645n´el nagyobb elmozdul´ast v´egez? 11. Legyen ξ egyenletes eloszl´as´ u a [-1;1] intervallumban, ´es ξ t = t + ξ t ≥ 0 . Hat´arozza meg a v´arhat´o ´ert´ek ´es kovariancia f¨ uggv´enyeket! Marting´al tulajdons´ag´ u, ill. stacion´arius-e a (ξ t )t∈R+ folyamat ? 0
12. Legyenek ξ 1 , ξ 2 , ξ 3 ∈ N (0; 1), ´es
[ξ 1 ] ha 0 ≤ t < 1 [ξ ] ha 1 ≤ t < 2 . ηt = 2 [ξ 3 ] ha 2 ≤ t < 3
Adjuk meg (η t )t∈[0,3[ v´arhat´o ´ert´ek ´es kovariancia f¨ uggv´eny´et!
II. r´ esz Matematikai statisztika
133
11. fejezet A matematikai statisztika alapfogalmai Az u ´ gynevezett statisztikai feladatok olyan val´osz´ın˝ us´egsz´am´ıt´asi probl´emak´ent is megfogalmazhat´ok, ahol a val´osz´ın˝ us´egi t¨orv´eny (m´ert´ek) nem, vagy csak r´eszben ismert, ´es egy megfigyel´esb˝ol (a v´eletlen kis´erlet eredm´eny´eb˝ol) valamilyen val´osz´ın˝ us´egsz´am´ıt´asi jellemz˝ore, illtve mag´ara a t¨orv´enyre (val´osz´ın˝ us´egi m´ert´ekre) k´ıv´anunk k¨ovetkeztetni.
11.1.
Statisztikai mez˝ o
11.1. Defin´ıci´ o. Statisztikai mez˝onek nevezz¨ uk az (X, A, P) h´armast, ahol • X – az un. mintat´er, elemei a mint´ak; • A – a mintat´er r´eszeinek egy σ-algebr´aja; • P – a lehets´eges val´osz´ın˝ us´egi m´ert´ekek halmaza, ´es P ∈ P eset´en (X, A, P ) egy val´osz´ın˝ us´egi mez˝o; Megjegyz´ esek: 1. A mintat´er a´ltal´aban Rn (vagy Rnxp ) lesz, m´eg akkor is ha annak csak egy val´odi r´esze k¨ovetkezhet be 1-val´osz´ın˝ us´eggel (minden .P ∈ P eset´en). Ennek megfelel˝oen az A esem´enyalgebra mind´ıg az intervallumokat tartalmaz´o legsz˝ ukebb B n σ-algebra lesz. 2. A statisztikai mez˝ot diszkr´etnek illetve folytonosnak fogjuk nevezni, ha P m´ert´ekei diszkr´et illetve folytonos val´osz´ın˝ us´egeloszl´asokkal adottak. P´ eld´ ak: 1. Egy val´osz´ın˝ us´egi v´altoz´o megfigyel´es´evel kapcsolatos s.m.: • X = R (vagy Rp ) 135
136
11. FEJEZET. A MATEMATIKAI STATISZTIKA ALAPFOGALMAI
• A = B 1 (vagy B p )
• P – P ∈ P adott a megfigyelt v.v. F ∈ F lehets´eges eloszl´asf¨ uggv´enyeivel 2. Egy val´osz´ın˝ us´egi v´altoz´o n-ism´etelt megfigyel´es´evel kapcsolatos s.m.: • X = Rn (vagy Rn×p )
• A = B n (vagy B n×p )
• P – P ∈ P adott a megfigyelt v.v. F ∈ F lehets´eges (p-dimenzi´os) eloszl´asf¨ uggv´enyeivel mint szorzat-m´ert´ek, teh´at P (I1 × I2 × . . . × In ) = [F ]I1 · [F ]I2 · . . . · [F ]In
(11.1)
ahol P ∈ P, Ik ⊂ R(Rp ) k = 1, 2, . . . n intervallumok, vagyis a megfigyel´esek f¨ uggetlenek is. 3. Egy val´osz´ın˝ us´egi v´altoz´o sorozatos megfigyel´es´evel kapcsolatos s.m.: • X = R∞ (vagy R∞×p ) v´egtelen (vektor-) sorozatok halmaza
• A = σ {I1 × . . . × In | Ik ⊂ R (vagy Rp ) intervallum k = 1, 2, . . . , n n ∈ N+ } • P – az el˝oz˝o, 11.1 szerint adott
Mindegyik p´eld´aban az ismeretlen val´osz´ın˝ us´egi m´ert´eket a megfigyelt (mintav´etelezett) v.v. F eloszl´asf¨ uggv´enye hat´arozza meg, ez´ert a megfelel˝o m´ert´eket P F jel¨oli. A lehets´eges eloszl´asf¨ uggv´enyek F halmaz´anak alkalmas v´alaszt´as´aval vehet˝ok figyelembe egy´eb ismereteink (felt´etelez´eseink). P´eld´aul egy ismeretlen v´arhat´o ´ert´ek˝ u ´es sz´or´as´ u norm´alis eloszl´as´ u (r¨oviden N (·; ·)) v.v., vagy ismeretlen v´arhat´o ´ert´ek˝ u ´es ismert σ 0 sz´or´as´ u norm´alis eloszl´as´ u (r¨oviden N (·; σ 0 )) v.v. megfigyel´es´er˝ol illetve n-ism´etelt megfigyel´es´er˝ol besz´elhet¨ unk. A 2. ´es 3. p´eld´aban a m´ert´ek 11.1 megad´as´ab´ol k¨ovetkezik az egyes komponensekkel kapcsolatos esem´enyek f¨ uggetlens´ege, ez´ert besz´elhet¨ unk ilyenkor f¨ uggetlen mintav´etelez´es modellj´er˝ol. A 3. p´elda l´enyeg´eben tartalmazza az n-ism´etelt megfigyel´es modellj´et minden n ∈ N+ eset´en, ´es lehet˝ov´e teszi a statisztikai m´odszerek aszimptotikus viselked´es´enek vizsg´alat´at. Ha a megfigyelt minta alapj´an k¨ovetkeztetni akarunk a val´osz´ın˝ us´egi t¨orv´enyre, vagy annak valamely jellemz˝oj´ere, azt az ut´obbi p´elda eset´en az ismeretlen eloszl´asf¨ uggv´ennyel kapcsolatban kell megtenn¨ unk. Ennek eszk¨oze az un. empirikus eloszl´ asf¨ uggv´eny, ami egy skal´ar v.v. n-ism´etelt megfigyel´ese eset´en n
Fxn (z)
1X = 1{xk
x = (x1 , x2 , . . . , xn ) ∈ Rn
z∈R,
(11.2)
ami egy r¨ogz´ıtett x ∈ Rn minta eset´en egy Fxn (·) : R → [0, 1] f¨ uggv´eny, ami egy olyan v´eges diszkr´et eloszl´ashoz tartoz´o eloszl´asf¨ uggv´eny, amely a minta egy x k komponens´ehez annak mintabeli relat´ıv gyakoris´ag´at rendeli, mint bek¨ovetkez´esi val´osz´ın˝ us´eget. Ha pedig
˝ 11.1. STATISZTIKAI MEZO
137
z ∈ R r¨ogz´ıtett, akkor minden F ∈ F eset´en n · F·n (z) : Rn → {0, 1, 2, . . . , n} egy nedrend˝ u F (z)-param´eter˝ u binomi´alis eloszl´as´ u val´osz´ın˝ us´egi v´altoz´o. A nagy sz´amok 5.4 Bernoulli t¨orv´enye szerint ekkor ε > 0 eset´en lim PF (|F·n (z) − F (z)| ≥ ε) = 0
n→∞
ahol a konvergencia z-ben egyenletes, ugyanis a Csebisev egyenl˝otlens´eg szerint PF (|F·n (z) − F (z)| ≥ ε) ≤
F (z) · (1 − F (z)) 1 ≤ . 2 n·ε 4 · n · ε2
(11.3)
Teh´at igen a´ltal´anos k¨or¨ ulm´enyek k¨oz¨ott m´od van az ismeretlen F eloszl´asf¨ uggv´eny fenti ´ertelemben tetsz˝olegesen pontos k¨ozel´ıt´es´ere. Ezt az eredm´enyt a k¨ovetkez˝o, er˝osebb form´aban fogalmazhatjuk meg. 11.2. T´ etel (A matematikai statisztika alapt´ etele). Az n ism´etelt megfigyel´es statisztikai modellj´eben jel¨olje F a minta elemek k¨oz¨os eloszl´asf¨ uggv´eny´et, F ·n (·) az emp´ırikus eloszl´asf¨ uggv´enyt, akkor tetsz˝oleges ε > 0 eset´en teljes¨ ul lim PF
n→∞
sup |F·n (z) z∈R
− F (z)| ≥ ε
=0
(11.4)
ahol PF jel¨oli az F a´ltal meghat´arozott val´osz´ın˝ us´egi m´ert´eket az R n mintat´eren. Bizony´ıt´ as. Jel¨olje ∆n = sup |F·n (z) − F (z)| , z∈R
´es legyen M ∈ N+ egy pozit´ıv term´eszetes sz´am, amivel vezess¨ uk be az xk,M
k−1 k = sup x ∈ R | M ≤ F (x) < M 2 2
k = 1, 2, · · · , 2M
sorozatot,amivel kapjuk M = 1, 2, · · · eset´en ∆− n,M = ∆+ n,M = ∆n,M =
max
k=1,2,··· ,2M
{|F·n (xk,M ) − F (xk,M )|}
max {|F·n (xk,M k=1,2,··· ,2M + max ∆− n,M , ∆n,M
+ 0) − F (xk,M + 0)|}
val´osz´ın˝ us´egi v´altoz´ok monton n¨ovekv˝o, korl´atos sorozat´at, melyekre teljes¨ ul ∆n,M ≤ ∆n ≤ ∆n,M +
1 2M
(11.5)
K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
138
11. FEJEZET. A MATEMATIKAI STATISZTIKA ALAPFOGALMAI
teh´at ∆n = limM →∞ ∆n,M val´osz´ın˝ us´egi v´altoz´o. A val´osz´ın˝ us´eg szubaddit´ıv tulajdons´ag´at ´es a 11.3 egyenl˝otlens´eget haszn´alva, el´eg nagy M eset´en 1 PF (∆n ≥ ε) ≤ PF ∆n,M + M ≥ ε ≤ 2 2M X 1 n ≤ PF |F· (xk,M ) − F (xk,M )| ≥ ε − M + 2 k=1 2M X 1 n PF |F· (xk,M + 0) − F (xk,M + 0)| ≥ ε − M ≤ + 2 k=1 ≤ 2M −1 ·
amib˝ol k¨ovetkezik az a´ll´ıt´as.
1
n ε−
1 2 2M
11.3. Megjegyz´ es. Eredm´eny¨ unket a sorozatos (3. p´elda) mintav´etelez´es statisztikai modellj´eben u ´ gy is fogalmazhatjuk, hogy ∆n sztochasztikusan konverg´al 0-hoz, illetve a 11.5 egyenl˝otlens´egb˝ol, a nagy sz´amok er˝os t¨orv´enye seg´ıts´eg´evel azt kapjuk, hogy ∆ n majdnem biztosan konverg´al 0-hoz.
11.2.
Statisztik´ ak
Statisztikai k¨ovetkeztet´eseink leggyakoribb eszk¨ozei a mint´ab´ol sz´amolhat´o k¨ ul¨onb¨oz˝o menynyis´egek lesznek. 11.4. Defin´ıci´ o. Statisztik´anak nevezz¨ uk a t : X → Rq f¨ uggv´enyt, ha t val´osz´ın˝ us´egi v´altoz´o az (X, A, P ) val´osz´ın˝ us´egi mez˝oben (minden P ∈ P eset´en). A statisztik´ak teh´at a val´osz´ın˝ us´egi v´altoz´ok szerep´et t¨oltik be, ´es mibenl´et¨ uk szempontj´ab´ol k¨oz¨omb¨os a lehets´eges val´osz´ın˝ us´egi m´ert´ekek P halmaza. Val´osz´ın˝ us´egsz´am´ıt´asi jellemz˝oik azonban f¨ ugghetnek a P ∈ P v´alaszt´ast´ol, mint pl. a v´arhat´o ´ert´ek, sz´or´as, eloszl´as, stb., de lehetnek a P ∈ P v´alszt´ast´ol f¨ uggetlenek is, mint pl. statisztik´akat egyszer˝ uen f¨ uggetleneknek, azonos eloszl´as´ uaknak, stb. nevez¨ unk, ha f¨ uggetlenek, azonos eloszl´as´ uak, stb. minden P ∈ P esetben. Ha q = 1, skal´ar statisztik´ar´ol, egy´ebk´ent vektor statisztik´ar´ol besz´el¨ unk. Amint a vektor val´osz´ın˝ us´egi v´altoz´okn´al is, most is el´eg a´ltal´aban a skal´ar eset vizsg´alata, mivel vektor statisztika komponensei mind´ıg skal´ar statisztik´ak. A fenti F.n (z) pl. egy skal´ar statisztika minden z ∈ R eset´en. A sorozatos megfigyel´es (3. p´elda) modellj´eben csak olyan statisztik´ak lesznek fontosak sz´amunkra, melyek v´eges sok megfigyel´est˝ol (minta elemt˝ol) f¨ uggnek, ezeket megengedett statisztik´anak nevezz¨ uk.
´ 11.2. STATISZTIKAK
139
Nevezetes statisztik´ ak: 1. Ha a mintat´er R, vagy Rn , a ξ = idX : X → X x 7→ x f¨ uggv´enyt minta statisztik´ a nak nevezz¨ uk, ´es n > 1 eset´en a ξ k : X → R (x1 , x2 , . . . , xk , . . . , xn ) 7→ xk komponens f¨ uggv´enyeket k = 1, 2, . . . , n; minta elem statisztik´ a knak nevezz¨ uk. 2. Az n-ism´etelt megfigyel´es modellj´eben fel´ırt empirikus eloszl´asf¨ uggv´enyhez tartoz´o • v´arhat´o ´ert´ek
n
X ¯ξ : X → R (x1 , x2 , . . . , xk , . . . , xn ) 7→ x¯ = 1 xk n k=1
az a ´tlag statisztika; • sz´or´as
v u n u1 X s : X → R (x1 , x2 , . . . , xk , . . . , xn ) 7→ s(x) = t (xk − x¯)2 n k=1
az empirikus sz´ or´ as statisztika.
3. Ugyancsak az n-ism´etelt megfigyel´es modellj´eben haszn´alatosak m´eg az al´abbiak: • rendezett minta ξ ∗ : X → R (x1 , x2 , . . . , xn ) 7→ (x∗1 , x∗2 , . . . , x∗n ) ahol
x∗1 = xk1 = min {x1 , x2 , . . . , xn } x∗2 = xk2 = min {x1 , x2 , . . . , xk1 −1 , xk1 +1 , . . . , xn } .. .
• rendezett minta elemek
ξ ∗1 : X → R (x1 , x2 , . . . , xn ) 7→ x∗1 ξ ∗2 : X → R (x1 , x2 , . . . , xn ) 7→ x∗2 .. .
• a minta terjedelme R : X → R (x1 , x2 , . . . , xn ) 7→ x∗n − x∗1 K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
140
11. FEJEZET. A MATEMATIKAI STATISZTIKA ALAPFOGALMAI
• medi´ an
( x∗ + x ∗ k k+1 ha n = 2k me : X → R x = (x1 , x2 , . . . , xn ) 7→ 2 x∗k+1 ha n = 2k + 1
A 2. ´es 3. -ban felsorolt statisztik´ak a sorozatos megfigyel´es modellj´eben is megfogalmazhat´ok minden n ∈ N+ est´en, ´es teljes´ıtik azt a nyilv´anval´o k¨ovetelm´enyt, hogy ´ert´ek¨ uk v´eges sok minta elemb˝ol sz´amolhat´o, teh´at megengedettek. A fenti statisztik´akat a k´es˝obbiekben hasonl´o jel¨ol´essel haszn´aljuk, ´es mint m´as esetben is, gyakran ´ırjuk azokat a minta, iletve minta elem statisztik´ak f¨ uggv´enyek´ent, pl.: n
n
X ¯ξ = 1 ξ n i=1 i
1 X 2 ¯2 s = ξ −ξ n i=1 i 2
ξ ∗n = max{ξ 1 , ξ 2 , . . . , ξ n } n
Fξn (z) =
11.3.
1X 1{ξ i
z∈R.
Param´ eterek
Statisztikai k¨ovetkeztet´eseink c´elja sok esetben az ismeretlen val´osz´ın˝ us´egi m´ert´ek valamilyen mennyis´egi jellemz˝oje, param´etere. 11.5. Defin´ıci´ o. i) Param´eternek nevezz¨ unk egy ϑ : P → Rq
f¨ uggv´enyt. Ha q = 1 skal´ar, egy´ebk´ent vektor param´eterr˝ol besz´el¨ unk. ii) Ha a ϑ param´eter invert´alhat´o, akkor meghat´aroz´o param´eternek nevezz¨ uk. Ekkor a lehets´eges m´ert´ekek ϑ ´ert´ekk´eszlet´enek elemeivel azonos´ıthat´ok, jel¨ol´esben P y ha y ∈ im(ϑ). Nevezetes param´ eterek: 1. A mint´akkal kapcsolatos A ∈ A esem´eny val´ osz´ın˝ us´ege: P(A) : P → R P → P (A) . 2. Legyen t egy skal´ar statisztika, akkor • v´ arhat´ o ´ert´ek e az
E(t) : P → R P 7→ EP (t)
param´eter, ahol Ep jel¨oli a P val´osz´ın˝ us´eggel sz´amolt v´arhat´o ´ert´eket;
¨ ´ 11.4. LIKELIHOOD FUGGV ENY
• sz´ or´ asa a param´eter;
141 q D(t) = E (t − E(t))2
felt´eve az itt szerepl˝o v´arhat´o ´ert´ekek l´etez´es´et minden P ∈ P eset´en. 3. Egy v.v. megfigyel´es´evel kapcsolatos modellben a minta statisztika v´arhat´o ´ert´eke ´es sz´or´asa m = E(ξ) σ = D(ξ), illetve az n-ism´etelt megfigyel´es eset´en a minta elemek k¨oz¨os v´arhat´o ´ert´eke ´es sz´or´asa m = E(ξ k ) σ = D(ξ k ), a megfigyelt (mintav´etelezett) v.v. v´arhat´o ´ert´eke ´es sz´or´asa param´eterek, amit a tov´abbiakban mind´ıg m illetve σ jel¨ol majd, term´eszetesen felt´etelezve a sz¨ uks´eges v´arhat´o ´ert´ekek l´etez´es´et. Egy param´eter kapcs´an fontos lesz sz´amunkra, hogy hogyan f¨ ugg ´ert´eke az ismeretlen m´ert´ekt˝ol. Egy norm´alis eloszl´as´ u (N (., .)) v.v. megfigyel´ese eset´en pl. az eloszl´as v´arhat´o ´ert´ek ´es sz´or´as param´etere (m, σ) meghat´aroz´o, teh´at minden param´eter vele kifejezhet˝o, mint pl. x−m P(ξ < x) = Φ σ ahol ξ a minta statisztika (vagy egy minta elem az n-ism´etelt megfigyel´es eset´en), ´es x ∈ R.
11.4.
Likelihood f¨ uggv´ eny
Statisztikai k¨ovetkeztet´eseinket a Bayes d¨ont´es anal´ogi´ajak´ent, annak alapj´an fogalmazhatjuk meg, hogy egy megfigyelt minta eset´en melyik val´osz´ın˝ us´egi m´ert´ek a ”legval´osz´ın˝ ubb”. Ehhez sz¨ uks´eg¨ unk van a megfigyelt minta (felt´eteles) val´osz´ın˝ us´eg´et megad´o f¨ uggv´enyre. 11.6. Defin´ıci´ o. Likelihood f¨ uggv´enynek nevezz¨ uk azt az L : X × P →R f¨ uggv´enyt, melyre i) diszkr´et statisztikai modell eset´en, amikor is egy P ∈ P m´ert´ek az {x 1 , x2 , . . .} ⊂ X megsz´aml´alhat´o halmaz elemeihez tartoz´o diszkr´et val´osz´ın˝ us´egeloszl´assal adott, L (x; P ) = P ({x})
x ∈ X, P ∈ P; K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
142
11. FEJEZET. A MATEMATIKAI STATISZTIKA ALAPFOGALMAI
ii) folytonos statisztikai modell eset´en, amikor is egy P ∈ P m´ert´ek egy f val´osz´ın˝ us´egi s˝ ur˝ us´egf¨ uggv´ennyel adott (jel¨ol´esben: Pf ), L (x; Pf ) = f (x) x ∈ X, Pf ∈ P; Az L(., .) olyan ”k´et”-v´altoz´os f¨ uggv´eny, melynek parci´alis f¨ uggv´enyei: • r¨ogz´ıtett P ∈ P eset´en L(., P ) : X → R+ 0 egy statisztika; • r¨ogz´ıtett x ∈ X eset´en L(x, .) : P → R+ eter, ami megadja az x megfi0 egy param´ gyelt minta val´osz´ın˝ us´eg´et, illetve egy ”kis” k¨ornyezet´enek val´osz´ın˝ us´eg´evel ar´anyos ´ert´eket; A likelihood f¨ uggv´enyt, ha van ϑ meghat´aroz´o param´eter, annak f¨ uggv´enyek´ent is ´ırhatjuk, mint L : X × im(ϑ)→R t´ıpus´ u f¨ uggv´enyt. Term´eszetesen m´as meghat´aroz´o param´etert v´alsztva, m´as alakhoz jutunk, ez´ert ilyenkor mind´ıg megnevezz¨ uk azon param´etert, amelynek f¨ uggv´enyek´ent ´ırtuk a likelihood f¨ uggv´enyt. Vizsg´aljuk most azt a legegyszer˝ ub esetet, amikor a lehets´eges val´osz´ın˝ us´egekb˝ol pontosan kett˝o van, P = {P1 , P2 }, ´es tekints¨ uk az L(., Pi ) -ket i = 1, 2 , mint felt´eteles eloszl´asokat illetve s˝ ur˝ us´egf¨ uggv´enyeket k´et egyenl˝o val´osz´ın˝ us´eg˝ u esem´enyre vonatkoz´oan, melyek jelzik, hogy melyik val´osz´ın˝ us´egi m´ert´ek az ”igazi”. Ekkor a Bayes-d¨ont´es szerint P1 -et v´alasztjuk egy, x ∈ X eset´en, ha L(x, P1 ) > L(x, P2 ) illetve P2 -t egy´ebk´ent. Ha P tetsz˝oleges, ezen elv alapj´an b´armely k´et val´osz´ın˝ us´egi m´ert´ekr˝ol eld¨onthet˝o egy x megfigyelt minta eset´en, hogy melyik a ”val´osz´ın˝ ubb”, ´es ha ∗ van olyan P ∈ P melyre L(x, P ∗ ) ≥ L(x, P ) P ∈ P,
akkor v´alaszt´asunk nyilv´an P ∗ lesz. Ezt a m´odszert a legnagyobb val´ osz´ın˝ us´eg elv´e nek nevezz¨ uk. A k¨ovetkez˝o t´etel a f¨ uggetlen mintav´etelez´es eset´en ezen elv aszimptotikusan j´o tulajdons´ag´at mondja ki. 11.7. T´ etel. Legyen az n-ism´etelt megfigyel´es modellj´eben L(n) n = 1, 2, . . . az els˝o n megfigyel´eshez tartoz´o likelihood f¨ uggv´eny. Legyen tov´abb´a P 1 6= P2 ∈ P melyekre az L(., Pi ) = L(1) (., Pi ) i = 1, 2 statisztik´ak pozit´ıvak, ´es a z = ln
L(., P1 ) L(., P2 )
¨ ´ 11.4. LIKELIHOOD FUGGV ENY
143
statisztik´anak l´etezzen sz´or´asa P1 ´es P2 eset´en. Jel¨olje tov´abb´a n
L(n) (x, P1 ) X = z(xi ) x = (x1 , x2 , . . . , xn ) ∈ Xn , η n (x) = ln (n) L (x, P2 ) i=1 akkor teljes¨ ul ∀K ∈ R eset´en: lim P1 (η n > K) = 1 illetve
n→∞
lim P2 (η n < K) = 1
n→∞
Bizony´ıt´ as. Jel¨olje ξ 1 , ξ 2 , . . . , ξ n az els˝o n megfigyel´eshez tartoz´o minta elemeket, akkor a ζ i = z(ξ i ) i = 1, 2, . . . n statisztik´ak azonos eloszl´as´ uak ´es f¨ uggetlenek. K¨oz¨os v´arhat´o ´ert´ek¨ uket ´es sz´or´asukat P 1 illetve P2 eset´en jel¨olje µi = EPi (ζ k ),
δ i = DPi (ζ k ) i = 1, 2.
Ekkor δ i > 0 i = 1, 2, mert k¨ ul¨onben, L(., P1 ) = L(., P2 ) k¨ovetkezne pl. P2 szerint 1 val´osz´ın˝ us´eggel, ami ellentmond a P1 6= P2 felt´etelnek. Most megmutatjuk, hogy µ2 < 0. Az ln(t) ≤ t − 1 t ∈ R+ egyenl˝otlens´eget haszn´alva, kapjuk ζk ≤
L(ξ k , P1 ) −1 L(ξ k , P2 )
amib˝ol pl. folytonos statisztikai mez˝o eset´en a v´arhat´o ´ert´ek monotonit´as´at haszn´alva Z L(u, P1 ) L(u, P2 )du − 1 = 0, µ2 ≤ L(u, P2 ) R
k ,P2 ) ahol egyenl˝os´eg δ 2 > 0 miatt nem lehet. Teh´at µ2 < 0, ´es −ζ k = ln L(ξ miatt kapjuk L(ξ ,P1 ) k
EP1 (−ζ k ) = −µ1 < 0 ⇒ µ1 > 0. Jel¨olje tov´abb´a η 0 = 0, akkor az (η n )n∈N id˝osor f¨ uggetlen ´es stacion´arius n¨ovekm´eny˝ u, ´es √ EP1 (η n ) = µ1 n DP1 (η n ) = δ 1 n n ∈ N amib˝ol 10.3 szerint k¨ovetkezik lim P1 (η n > K) = 1.
n→∞
Hasonl´oan kapjuk lim P2 (−η n > −K) = 1 ⇒ lim P2 (η n < K) = 1.
n→∞
n→∞
K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
144
11. FEJEZET. A MATEMATIKAI STATISZTIKA ALAPFOGALMAI
Az a´ll´ıt´as l´enyeg´eben azt fejezi ki, hogy a k¨ ul¨onb¨oz˝o val´osz´ın˝ us´egi m´ert´ekekhez tartoz´o likelihood f¨ uggv´eny ´ert´ekek k¨oz¨ ul az a nagyobb, ´es ez a relat´ıv k¨ ul¨onbs´eg a mintav´etel sz´am´anak n¨ovel´es´evel minden hat´aron t´ ul n˝o, azaz L(., P1 ) n→∞ +∞ P1 eset´en −→ , 0 P2 eset´en L(., P2 ) amely az ”igazi” m´ert´ekhez tartozik. Teh´at el´eg sok megfigyel´est tartalmaz´o x minta eset´en b´ızhatunk abban, hogy a likelihood f¨ uggv´eny az igazi val´osz´ın˝ us´egi m´ert´ekkel adja a legnagyobb ´ert´eket. Az a´ll´ıt´as alapj´an az is vil´agos, hogy ha k´et P 1 ´es P2 val´osz´ın˝ us´egi m´ert´ek k¨oz¨ ul kell v´alasztanunk egy x ∈ X alapj´an, akkor a k´et m´ert´ekhez tartoz´o likelihood f¨ uggv´eny ´ert´ekek h´anyadosa alapj´an ´erdemes d¨onten¨ unk. A likelihood f¨ uggv´eny saj´atos alakja eset´en m´od van arra is, hogy statisztikai k¨ovetkeztet´eseink meghozatal´ahoz kiv´alasszunk bizonyos statisztik´akat, melyek ismerete a fenti t´ıpus´ u d¨ont´esekhez el´egs´eges. 11.8. Defin´ıci´ o. A T : X → Rk statisztik´at el´egs´egesnek nevezz¨ uk, ha a likelihood f¨ uggv´eny az al´abbi alakban ´ırhat´o: L(x, P ) = g(T (x), P ) · f (x)
/x ∈ X, P ∈ P/ .
A defin´ıci´o alapj´an, k´et P1 ´es P2 k¨oz¨otti v´alaszt´ashoz el´eg ismerni a T statisztika ´ert´ek´et, mert a likelihood f¨ uggv´eny ´ert´ekeinek h´anyadosa csak ett˝ol f¨ ugg. Term´eszetesen a defin´ıci´o szerint a minta statisztika nyilv´anval´oan el´egs´eges, de ilyen a f¨ uggetlen mintav´etel modellj´eben a rendezett minta is. A k¨ovetkez˝o a´ll´ıt´as azt fejezi ki, hogy az el´egs´eges statisztika ´ert´ek´enek ismeret´eben a mintat´er esem´enyeinek (felt´eteles) val´osz´ın˝ us´ege, ´es statisztik´ak (felt´eteles) v´arhat´o ´ert´eke m´ar nem f¨ ugg P ∈ P v´alasz´as´at´ol, teh´at bek¨ovetkez´es¨ uk, illetve ´ert´ek¨ uk nem ad tov´abbi inform´aci´ot az ismeretlen val´osz´ın˝ us´egi m´ert´ekr˝ol. 11.9. T´ etel. Legyen η egy tetsz˝oleges, ´es T egy el´egs´eges statisztika. Akkor az E(η|T ) felt´eteles v´arhat´o ´ert´ek megadhat´o u ´ gy, hogy nem f¨ ugg a P ∈ P v´alaszt´ast´ol. Bizony´ıt´ as. Bizony´ıt´as n´elk¨ ul felhaszn´aljuk a k¨ovetkez˝o seg´edt´etelt: 11.10. Lemma. Ha az (X, A, P) statisztikai mez˝o eset´en megadhat´o az L likelihood f¨ uggv´eny, akkor v´alaszthat´o egy olyan (Pn )n=1,2,... ⊂ P sorozat, melyre teljes¨ ul az al´abbi tulajdons´ag minden A ∈ A esem´ennyel kapcsolatban: P (A) = 0 ∀P ∈ P ⇔ Pn (A) = 0 n = 1, 2, . . . , aminek k¨ovetkezm´enyek´ent megadhat´o a P ∗ =
P∞
1 n=1 2n Pn
val´osz´ın˝ us´egi m´ert´ek, mellyel
P (A) = 0 ∀P ∈ P ⇔ P ∗ (A) = 0 .
145
11.5. FELADATOK
Feltehetj¨ uk, hogy η skal´ar ´ert´ek˝ u, ´es pl. a diszkr´et statisztikai modellben bizony´ıtjuk az a´ll´ıt´ast. B˝ov´ıts¨ uk P-t ´es a likelihood f¨ uggv´eny ´ertelmez´esi tartom´any´at a lemma szerinti P ∗ val´osz´ın˝ us´egi m´ert´ekkel, teh´at L(x, P ∗ ) = g(T (x), P ∗ ) · f (x) x ∈ X ahol g(T (x), P ∗) =
X 1 g(T (x), Pn ) x ∈ X. 2n n
us´egi m´ert´ekre vonatkoz´o felt´eteles v´arhat´o Ekkor a fenti lemma szerinti P ∗ val´osz´ın˝ ´ert´eket jel¨olje: t = EP ∗ (η|T ) Legyen P ∈ P, ´es h egy tetsz˝oleges skal´ar ´ert´ek˝ u f¨ uggv´eny, akkor kapjuk X EP ((η − t) · h ◦ T ) = (η(x) − t(x)) · h(T (x))g(T (x), P ) · f (x) = x∈X
=
X
06=g(T (x),P ∗ )
(η(x) − t(x)) ·
h(T (x))·g(T (x),P ) g(T (x), P ∗ ) g(T (x),P ∗ )
· f (x) = 0
a P ∗ -re vonatkoz´o felt´eteles v´arhat´o ´ert´ek ortogonalis tulajdons´aga miatt. Ez pedig azt jelenti, hogy t teljes´ıti a P -re vonatkoz´o felt´eteles v´arhat´o ´ert´ek hasonl´o tulajdons´ag´at, vagyis EP (η|T ) = t.
11.5.
Feladatok
1. Emberek magass´ag´anak n = 10 megfigyel´es´eb˝ol kaptuk az al´abbi mint´at: 182 176 168 192 184 174 185 182 175 190 [cm] Ajuk meg az empirikus eloszl´asf¨ uggv´enyt, sz´am´ıtsuk ki a nevezetes statisztik´ak ´ert´ekeit! 2. Legyen a statisztikai modell egy F (x) =
0 ha x ≤ 0 −αxβ ha 0 < x 1−e
eloszl´asf¨ uggv´eny˝ u v.v. n-ism´etelt megfigyel´es´evel kapcsolatos. (a) ´Irjuk fel a likeihood f¨ uggv´enyt az α, β pozit´ıv param´eterek f¨ uggv´enyek´ent! (b) Keress¨ unk el´egs´eges statisztik´at! 3. ´Irjuk fel a likelihood f¨ uggv´enyt a megfelel˝o param´eter(-ek) f¨ uggv´enyek´ent (a) Bin(ni ; ·) i = 1, 2, . . . , N eloszl´ass´ u (azonos val´osz´ın˝ us´eg param´eterrel) v.v. megfigyel´ese eset´en; K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
146
11. FEJEZET. A MATEMATIKAI STATISZTIKA ALAPFOGALMAI
(b) egy Po (·) eloszl´ass´ u v.v. egy illetve n-ism´etelt megfigyel´ese eset´en; (c) egy Exp(·) eloszl´ass´ u v.v. n-ism´etelt megfigyel´ese eset´en;
(d) egy N (·; ·) eloszl´ass´ u v.v. n-ism´etelt megfigyel´ese eset´en; Keress¨ unk el´egs´eges statisztik´at! 4. Egy Po(·) eloszl´as´ u v.v. n-ism´etelt megfigyel´ese eset´en adjuk meg a ! n X P ξj = k | ξi = K i=1
felt´eteles eloszl´ast! 5. Egy U (0; ·) eloszl´as´ u v.v. n-ism´etelt megfigyel´ese eset´en, mutassuk meg, hogy ξ ∗n el´egs´eges, ´es adjuk meg a P(ξ k < x | ξ ∗n = ·) felt´eteles eloszl´ast, ´es E(ξ k | ξ ∗n = ·) felt´eteles v´arhat´o ´ert´eket!
12. fejezet Param´ eterbecsl´ es 12.1.
Pontbecsl´ es
Statisztikai feladatainkban t¨obbnyire egy param´eter ismeretlen ´ert´ek´ere kell k¨ovetkeztetn¨ unk a megfigyelt mint´ab´ol. 12.1. Defin´ıci´ o. A ϑ : P → Rp param´eter becsl´es´enek nevezz¨ unk egy t : X → Rp statisztik´at. Jel¨ol´ese: ϑ ∼ t . Egy ilyen ϑ ∼ t becsl´est u ´ gy alkalmazunk, hogy x ∈ X megfigyelt minta eset´en a ϑ param´eter ´ert´ek´et a becsl˝o t statisztika t(x) ´ert´ek´evel azonos´ıtjuk, pontosabban azzal k¨ozel´ıtj¨ uk. Jel¨ol´ese: ϑ ≈ t(x). Term´eszetesen egy param´eter sz´am´ara t¨obb becsl´es is adhat´o, melyek k¨oz¨ ul az al´abbi tulajdons´agok alapj´an v´alszthatunk. Mivel vektor param´eter komponenseinek becsl´ese a becsl˝o vektor statisztika megfelel˝o komponense, elegend˝o skal´ar param´eterek becsl´eseinek vizsg´alata. 12.2. Defin´ıci´ o. A ϑ skal´ar param´eter ϑ ∼ t i) becsl´es´et torz´ıtatlannak nevezz¨ uk, ha E(t) = ϑ; ii) torz´ıtatlan becsl´es´enek hat´ekonys´ag´at a becsl´es D(t) standard hib´aj´ aval ”m´erj¨ uk”. iii) Ha a ϑ skal´ar param´eter becsl´ese az n-ism´etelt megfigyel´es modellj´eben ϑ ∼ t n n = 1, 2, . . . , ´es minden ε > 0 eset´en lim P (|tn − ϑ| ≥ ε) = 0 ,
n→∞
akkor ezt a becsl´est, pontosabban becsl´es-sorozatot konzisztensnek nevezz¨ uk. A konzisztencia ellen˝orz´es´ehez torz´ıtatlan becsl´esek eset´en haszn´aljuk az al´abbi a´ll´ıt´asban megfogalmazott el´egs´eges felt´etelt. 147
´ ´ 12. FEJEZET. PARAMETERBECSL ES
148
´ ıt´ 12.3. All´ as. Ha a ϑ skal´ar param´eter becsl´ese az n-ism´etelt megfigyel´es modellj´eben ϑ ∼ tn n = 1, 2, . . . torz´ıtatlan, ´es lim D(tn ) = 0,
n→∞
akkor a becsl´es-sorozat konzisztens. Bizony´ıt´ as. A Csebisev egyenl˝otlens´eg szerint, ha ε > 0 akkor P (|tn − E(tn )| ≥ ε) ≤
D2 (tn ) , ε2
amib˝ol k¨ovetkezik az a´ll´ıt´as. A tov´abbiakban felsorolunk n´eh´any gyakran haszn´alt becsl´est, ´es megvizsg´aljuk tulajdons´agait. 1. Val´ osz´ın˝ us´ eg becsl´ ese. (a) Visszatev´eses mintav´etel, Bernoulli k´ıs´erlet. Egy ismeretlen val´osz´ın˝ us´eg˝ u esem´eny n-ism´etelt megfigyel´ese eset´en legyen a s.m. egy Bin(n; ·) eloszl´as´ u v.v. megfigyel´es´evel kapcsolatos. Jel¨olje ξ − a minta statisztik´at; p − a val´osz´ın˝ us´eg param´etert; Vizsg´aljuk a p∼
ξ n
becsl´est. Mivel ξ ξ 1 p E =p D =√ p · (1 − p), n n n a becsl´es torz´ıtatlan ´es konzisztens. A hat´ekonys´ag m´ert´eke, a becsl´es standard hib´aja f¨ ugg az ismeretlen param´etert˝ol, de 1 1 p √ p · (1 − p) ≤ √ , n 2 n
ez´ert ”tervezhet˝o”, vagyis megadhat´o a megfigyel´esek n sz´ama u ´ gy, hogy a standard hiba egy k´ıv´ant ´ert´ek alatt maradjon. A standard hiba becsl´es´ere a val´osz´ın˝ us´eg becsl´es´et haszn´alva kapjuk: s 1 ξ ξ ξ ∼√ . D · 1− n n n n
´ 12.1. PONTBECSLES
149
(b) Visszatev´es n´elk¨ uli mintav´etel. Legyen a s.m. egy Hip(N, ·, n) eloszl´as´ u v.v. megfigyel´es´evel kapcsolatos. Jel¨olje ξ − a minta statisztik´at; a val´osz´ın˝ us´eg param´etert, M − ahol M az alapsokas´ag ”megjel¨olt” p= N egyedeinek (ismeretlen) sz´ama; Vizsg´aljuk a p∼
ξ n
becsl´est. Mivel s ξ ξ 1 n−1 p · (1 − p) · 1 − E =p D =√ , n n N −1 n a becsl´es torz´ıtatlan ´es konzisztens abban az ´ertelemben, hogy n n¨ovel´es´evel a ξ standard hiba cs¨okken, ´es n = N esetben D n = 0. A hat´ekonys´ag m´ert´eke, a becsl´es standard hib´aja f¨ ugg a p param´etert˝ol, de most is teljes¨ ul r n−1 1 p 1 √ , p · (1 − p) ≤ √ 1− n 2 n N −1 ez´ert ”tervezhet˝o”, pontosabban fels˝o hat´ara el˝ore megadhat´o. A standard hiba becsl´es´ere a val´osz´ın˝ us´eg becsl´es´et haszn´alva kapjuk: s 1 n−1 ξ ξ ξ D ∼√ · 1− . · 1− n n N −1 n n
2. A v´ arhat´ o´ ert´ ek ´ es sz´ or´ as becsl´ ese. (a) Mintav´etel visszatev´essel, illetve v´egtelen alapsokas´agb´ol. Egy ismeretlen v´arhat´o ´ert´ek˝ u ´es sz´or´as´ u v.v. n-ism´etelt megfigyel´ese eset´en jel¨olje ξ = (ξ 1 , ξ 2 , . . . , ξ n ) − a minta statisztik´at; m − a v´arhat´o ´ert´ek param´etert; σ − a sz´or´as param´etert;
Vizsg´aljuk az empirikus eloszl´asf¨ uggv´eny v´arhat´o ´ert´ek´et illetve sz´or´as´at ad´o a´tlaggal illetve empirikus sz´or´assal nyerhet˝o m ∼ ¯ξ σ 2 ∼ s2 becsl´eseket. Mivel a minta elemek f¨ uggetlenek, azonos eloszl´as´ uak, k¨oz¨os v´arhat´o ´ert´ek¨ uk m, sz´or´asuk σ, σ E(¯ξ) = m D(¯ξ) = √ . n K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
´ ´ 12. FEJEZET. PARAMETERBECSL ES
150
Az els˝o becsl´es teh´at torz´ıtatlan ´es konzisztens, de ! ! n n X X 1 1 2 2 ξ − ¯ξ (ξ i − m) − ¯ξ − m =E E(s2 ) = E n i=1 i n i=1 n 1 X 2 σ2 n = σ − = · σ2 , (12.1) n i=1 n n−1 teh´at az ut´obbi becsl´es torz´ıtott. Ez a torz´ıt´as azonban ”korrig´alhat´o”, ´es a σ 2 ∼ s∗2 becsl´es m´ar torz´ıtatlan, ahol v u r n u 1 X 2 n ∗ t s = ξ k − ¯ξ = ·s n − 1 k=1 n−1
az un. korrig´ alt empirikus sz´ or´ as statisztika. Haszn´aljuk ezt az a´tlag standard hib´aj´anak becsl´es´ere: s∗ D(¯ξ) ∼ √ . n (b) Minatv´etel v´eges alapsokas´agb´ol visszatev´es n´elk¨ ul. Egy X = {X1 , X2 , . . . , XN } ⊂ R v´eges halmazb´ol visszatev´es n´elk¨ ul v´alasztott n-elem˝ u minta eset´en jel¨olje ξ = (ξ 1 , ξ 2 , . . . , ξ n ) − a minta statisztik´at; ¯ = 1 PN Xi − a v´arhat´o ´ert´ek param´etert; m=X q P N i=1 ¯ 2 − a sz´or´as param´etert; σ = SX = N1 N i=1 Xi − X
Mivel a minta elemek k¨oz¨os eloszl´asa P(ξ k = Xi ) =
1 N
k = 1, 2, . . . , n i = 1, 2, . . . , N
´es P(ξ k = Xi , ξ l = Xj ) =
1 N (N − 1)
k 6= l = 1, 2, . . . , n i 6= j = 1, 2, . . . , N
egyszer˝ u sz´amol´assal kapjuk (l´asd: 78. oldal 2. feladat): E(ξ k ) = m D(ξ k ) = σ ´es cov(ξ k , ξ l ) = −
σ2 N −1
k = 1, 2, . . . , n
k 6= l = 1, 2, . . . , n
´ 12.1. PONTBECSLES
151
amib˝ol σ E(¯ξ) = m D(¯ξ) = √ · n
r
1−
n−1 . N −1
Teh´at az m ∼ ¯ξ becsl´es torz´ıtatlan, ´es standard hib´aja n → N eset´en null´ahoz k¨ozeledik. Az 12.1 szerinti m´odon sz´amolva az empirikus sz´or´asn´egyzet v´arhat´o ´ert´ek´et N n−1 · , E(s2 ) = σ 2 · n N −1 teh´at a σ 2 ∼ s2 becsl´es most is torz´ıtott, de korrig´alhat´oan, vagyis σ2 ∼
n N −1 2 · · s ≈ s∗2 n−1 N
uk a m´ar torz´ıtatlan becsl´es, ahol az NN−1 korrekci´o elhanyagol´as´aval nyerj¨ ∗2 kor´abbi s becsl´est. Ezt haszn´alva kapjuk a v´arhat´o ´ert´ek becsl´es´enek standard hib´aj´ara: r ∗ s n−1 . D(¯ξ) ∼ √ · 1 − n N −1 Megjegyz´ es: Ha az X v´eges sokas´ag elemei nem mind k¨ ul¨onb¨oznek, de v´alaszt´asuk val´osz´ın˝ us´ege ar´anyos az ism´etl˝od´esek sz´am´aval, eredm´enyeink v´altozatlanul ´erv´enyesek. 3. Kovariancia becsl´ ese (a) Mintav´etel visszatev´essel, illetve v´egtelen alapsokas´agb´ol. Egy (ismeretlen eloszl´as´ u) k´etdimenzi´os v.v.v. n-ism´etelt megfigyel´ese eset´en jel¨olje (ξ, η) = ((ξ 1 , η 1 ), (ξ 2 , η 2 ), . . . , (ξ n , η n )) − a minta statisztik´at; m1 , m2 − a k´et v´arhat´o ´ert´ek param´etert; σ 1 , σ2 a k´et sz´or´as, illetve − σ 12 kovariancia param´etert; A fentiekhez hasonl´oan kaphatjuk a kovariancia becsl´es´ere n
σ 12 ∼ s12 =
n
1X 1X ξ i − ¯ξ (η i − η¯) = ξ · η − ¯ξ · η¯ , n i=1 n i=1 i i
P ahol s12 az un. empirikus kovariancia statisztika, ¯ξ = n1 ni=1 ξ i illetve η¯ = P n 1 o minta elemek a´tlagai, az m1 illetev m2 param´eterek i=1 η i a megfelel˝ n becsl´esei. Vizsg´aljuk most a becsl´es torz´ıtatlans´ag´at, kihaszn´alva a minta elem p´arok f¨ uggetlens´eg´et, az 12.1-ben alkalmazott m´odon kapjuk: E(s12 ) =
n · σ 12 . n−1 K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
´ ´ 12. FEJEZET. PARAMETERBECSL ES
152
Teh´at most is torz´ıtott becsl´est kapunk, de a n σ 12 ∼ s∗12 = s12 n−1 korrig´al´assal ism´et torz´ıtatlan becsl´eshez jutunk.
(b) Minatv´etel v´eges alapsokas´agb´ol visszatev´es n´elk¨ ul. Egy XY = {(X1 , Y1 ), (X2 , Y2 ), . . . , (XN , YN )} ⊂ R2 v´eges halmazb´ol visszatev´es n´elk¨ ul v´alasztott n-elem˝ u minta eset´en jel¨olje
σ 12
(ξ, η) = ((ξ 1 , η 1 ), (ξ 2 , η 2 ), . . . , (ξ n , η n )) − a minta statisztik´at; ¯ = 1 P N Xi m1 = X a k´et v´arhat´o ´ert´ek i=1 N − P N 1 param´etert; m1 = Y¯ = N i=1 Yi q P ¯ 2 σ 1 = SX = N1 N i=1 Xi − X , a k´et sz´or´as, ´es a q P 2 N − kovariancia 1 σ 2 = SY = N i=1 Yi − Y¯ , param´etert; P ¯ · Yi − Y¯ = SXY = 1 N Xi − X i=1
N
Mivel a minta elemek k¨oz¨os eloszl´asa most P(ξ k = Xi , η k = Yi ) =
1 N
k = 1, 2, . . . , n i = 1, 2, . . . , N
´es 1 N (N − 1) k 6= l = 1, 2, . . . , n i 6= j = 1, 2, . . . , N
P(ξ k = Xi , η k = Yi , ξ l = Xj , η l = Yj ) =
a 2b pontban le´ırtakhoz hasonl´oan kapjuk az s12 =
n n 1X 1X ξ · η − ¯ξ · η¯ ξ i − ¯ξ (η i − η¯) = n i=1 n i=1 i i
empirikus kovariancia statisztik´ara:
E(s12 ) = σ 12 ·
N n−1 · . n N −1
Teh´at a σ 12 ∼ s12 becsl´es most is torz´ıtott, de korrig´alhat´oan, vagyis σ 12 ∼
n N −1 n · · s12 ≈ s∗12 = · s12 n−1 N n−1
m´ar torz´ıtatlan becsl´es, ahol az NN−1 korrekci´o elhanyagol´as´aval nyerj¨ uk a kor´abbi s∗12 becsl´est. Megjegyz´ es: Hasonl´oan a 2b pont ut´ani megjegyz´eshez, most is ´erv´enyesek maradnak eredm´enyeink, ha az XY v´eges sokas´ag elemei nem mind k¨ ul¨onb¨oznek, de v´alaszt´asuk val´osz´ın˝ us´ege ar´anyos az ism´etl˝od´esek sz´am´aval.
´ ´ ´ 12.2. BECSLESEK HATEKONYS AGA
153
Megjegyz´ es: A kovariancia most kapott becsl´es´eb˝ol kaphatjuk a korrel´aci´os egy¨ utthat´o becsl´es´et σ 12 s12 s∗ r= ∼ rˆ = = ∗ 12 ∗ σ1 · σ2 s1 · s2 s1 · s2 haszn´alva a sz´or´asok becsl´es´et. Hasonl´oan nyerhet˝ok a kovarianci´ak becsl´es´eb˝ol a regresszi´os feladatokban megismert tov´abbi param´eterek. Azok ugyanis a varianci´akkal (sz´or´asn´egyzetekkel), v´arhat´o ´ert´ekekkel ´es kovarianci´akkal kifejezhet˝ok, ´ıgy az itt megadott becsl´esek megfelel˝o kifejez´eseivel becs¨ ulhet˝ok.
12.2.
Becsl´ esek hat´ ekonys´ aga
Az al´abbiakban becsl´esek hat´ekonys´ag´at, pontosabban torz´ıtatlan becsl´esek standard hib´aj´at vizsg´aljuk, ´es megmutatjuk, hogy a legnagyobb val´osz´ın˝ us´eg elve alapj´an nyerhet˝o becsl´esek a´ltal´aban a leghat´ekonyabbak.
12.2.1.
Maximum likelihood becsl´ es
A legnagyobb val´osz´ın˝ us´eg elve seg´ıts´eg´evel becsl´eseket kaphatunk. 12.4. Defin´ıci´ o. Legyen a ϑ meghat´aroz´o param´eter, ´es irjuk a likelihood f¨ uggv´enyt ennek f¨ uggv´enyek´ent: L(., ϑ) : X → R+ 0. A t : X → im(ϑ) statisztik´at a ϑ param´eter maximum liokelihood becsl´es´enek nevezz¨ uk, ha ∀x ∈ X eset´en teljes¨ ul: L(x, t(x)) ≥ L(x, y) y ∈ im(ϑ). Megjegyz´ esek: 1. Teh´at ilyen becsl´es u ´ gy nyerhet˝o, hogy egy x ∈ X megfigyelt mint´ahoz olyan ´ert´eket rendel¨ unk, mely az L(x, .) : im(ϑ) → R+ uggv´eny glob´alis maximum helye, 0 f¨ term´eszetesen csak ha van ilyen. 2. Ha van el´egs´eges statisztika, akkor a likelihood becsl´es az el´egs´eges statisztika f¨ uggv´enyek´ent adhat´o meg. 3. K¨onnyen ellen˝orzhet˝o, hogy a val´osz´ın˝ us´eg becsl´ese a relat´ıv gyakoris´aggal, tov´abb´a norm´alis eloszl´as´ u v.v. n-ism´etelt megfigyel´ese eset´en az m ∼ ¯ξ σ ∼ s maximum likelihood becsl´esek. 4. Fontos ´eszrev´etel tov´abb´a, hogy ha ϑ ∼ t maximum likelihood becsl´es, akkor h(ϑ) ∼ h(t) is az, minden k¨olcs¨on¨osen egy´ertelm˝ u, im(ϑ)-n ´ertelmezett h f¨ uggv´eny eset´en. K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
154
12.2.2.
´ ´ 12. FEJEZET. PARAMETERBECSL ES
Hat´ ekonyabb becsl´ es mint az el´ egs´ eges statisztika f¨ uggv´ enye
12.5. T´ etel. Legyen a ϑ skal´ar param´eter t bcsl´ese torz´ıtatlan, ´es legyen T el´egs´eges statisztika. Akkor a t∗ = E(t|T ) felt´eteles v´arhat´o ´ert´ek, mely nem f¨ ugg a val´osz´ın˝ us´egi m´ert´ekt˝ol, teh´at a t∗ statisztika, hat´ekonyabb becsl´ese a ϑ param´eternek. Bizony´ıt´ as. A 11.9. t´etel szerint t∗ statisztika megadhat´o (ϑ-t´ol nem f¨ ugg˝o m´odon), v´arhat´o ´ert´eke pedig, mint felt´eteles v´arhat´o ´ert´ek v´arhat´o ´ert´eke: E(t∗ ) = E (E(t|T )) = E(t) = ϑ teh´at ϑ ∼ t∗ torz´ıtatlan becsl´es. Az eredeti becsl´es sz´or´asn´egyzet´et ´ırjuk az al´abbiak szerint: D2 (t) = E ((t − t∗ ) + (t∗ − ϑ))2 = = E (t − t∗ )2 + D2 (t∗ ) ≥ D2 (t∗ ) ahol felhaszn´altuk a felt´eteles v´arhat´o ´ert´ek ortogon´alis tulajdons´ag´at ∀P ∈ P eset´en EP [(t − t∗ )h ◦ T ] = 0. ahol h(y) = EP (t|T = y) − ϑ(P ). Teh´at a hat´ekonyabb torz´ıtatlan becsl´est az el´egs´eges statisztika f¨ uggv´enyek´ent ´erdemes keresni, ´es a maximum likelihood becsl´es mind´ıg ilyen lesz, ha nem is mind´ıg torz´ıtatlan. A bizony´ıt´asb´ol az is kider¨ ul, hogy a standard hiba cs¨okkent´ese ann´al nagyobb, min´el egyszer˝ ubb, de m´eg el´egs´eges, u ´ gynevezett sz¨ uks´eges statisztik´ara ”vet´ıt¨ unk”, mivel ekkor sz´am´ıthatunk nagyobb marad´ek sz´or´asra, ´es ´ıgy kisebb standard hib´ara.
12.2.3.
A hat´ ekonys´ ag inform´ aci´ os hat´ ara
A tov´abbiakban feltessz¨ uk, hogy ϑ egy meghat´aroz´o param´eter (p-dimenzi´os), ξ jel¨oli a minta statisztik´at, ´es a likelihood f¨ uggv´enyt ϑ-f¨ uggv´enyek´ent ´ırva az eg´esz mintat´eren pozit´ıv L(x; ϑ) > 0 x ∈ X,
´es l´eteznek a param´eter szerinti, al´abbiakban szerepl˝o parci´alis deriv´altak. Amint azt m´ar vizsg´altuk, k´et ϑ, ϑ0 param´eter k¨oz¨ ul a v´alaszt´as egy x ∈ X megfigyelt minta eset´en az 0 L(x; ϑ) ´es L(x; ϑ ) k¨ozti k¨ ul¨onbs´egt˝ol f¨ ugg. K¨ ul¨on¨osen fontos ennek m´ert´eke ha ϑ, ϑ 0 ∈ Rp k´et k¨ozeli param´eter ´ert´ek. Ezen k¨ ul¨onbs´eg v´altoz´as´anak relat´ıv m´ert´eke egy ϑ param´eter ´ert´ekb˝ol indulva az : x ∈ X megfigyelt minta eset´en (a deriv´alt-vektort sorvektork´ent ´ırva): Dϑ L(x; ϑ) S(x; ϑ) = = Dϑ ln (L(x; ϑ)) ∈ R1×p L(x; ϑ) P Mivel, p´eld´aul diszkr´et esetben, 1 = E(1) = x∈X L(x; ϑ), ha a ϑ-szerinti driv´al´as ´es az o¨sszegz´es felcser´elhet˝o, kapjuk 0 = E (S(ξ; ϑ)) ∈ R1×p .
´ ´ ´ 12.2. BECSLESEK HATEKONYS AGA
155
ϑ L(.;ϑ) A DL(.;ϑ) = Dϑ ln L(.; ϑ) (vektor) statisztika komponensei v´eletlen ingadoz´as´anak v´arhat´o ´ert´eke teh´at a ϑ-val kapcsolatban nyerhet˝o inform´aci´o m´ert´ek´enek tekinhet˝o, ez´ert az I(ϑ) = E S(ξ; ϑ) · S(ξ; ϑ)T = = cov (S(ξ; ϑ), S(ξ; ϑ)) ∈ Rp×p
v´arhat´o ´ert´eket, ha l´etezik, Fisher f´ele inform´ aci´ o m´ atrix nak nevezz¨ uk. Vegy¨ uk ´eszre, hogy az n-f¨ uggetlen megfigyel´es modellj´eben S(ξ; ϑ) = Dϑ ln L(ξ 1 , ξ 2 , · · · , ξ n ; ϑ) =
n X
Dϑ ln L1 (ξ i ; ϑ) ,
i=1
ahol L1 jel¨oli az n = 1 megfigyel´eshez tartoz´o likleihood f¨ uggv´enyt, az o¨sszeg tagjai f¨ uggetlenek, ez´ert az egy megfigyelt ´ert´ekhez tartoz´o I1 (ϑ) inform´aci´os m´atrixb´ol kapjuk: I(ϑ) = n · I1 (ϑ) . Az inform´aci´os m´atrix megkaphat´o a likelihood f¨ uggv´eny m´asodrend˝ u parci´alis deriv´altjaib´ol is, nevezetesen a B(x; ϑ) = Dϑ S(x; ϑ) ∈ Rp×p deriv´al´assal kaphat´o B(ξ; ϑ) v´eletlen m´atrix v´arhat´o ´ert´eke, p´eld´aul folytonos modell eset´en, felt´etelezve a deriv´al´as ´es integr´al´as sorrendj´enek felcser´elhet˝os´eg´et: Z 1 Dϑ Dϑ L(x; ϑ) · L(x; ϑ) − Dϑ L(x; ϑ)T · Dϑ L(x; ϑ) dx = E (B(ξ; ϑ)) = X L(x; ϑ) T Z Z Dϑ L(x; ϑ) Dϑ L(x; ϑ) = Dϑ Dϑ L(x; ϑ)dx − · L(x; ϑ)dx = −I(ϑ) · L(x; ϑ) L(x; ϑ) X X Felt´etelezz¨ uk tov´abb´a, hogy I(ϑ) regul´aris, teh´at l´etezik az I(ϑ) −1 inverz m´atrix ´es a deriv´al´as ´es v´arhat´o ´ert´ek k´epz´es (¨osszegz´es ill. folytonos esetben integr´al´as) a tov´abbiakban is felcser´elhet˝o. Ekkor az I(ϑ) m´atrix seg´ıts´eg´evel becsl´esek hat´ekonys´ag´ara nyerhet¨ unk korl´atot. Legyen ugyanis a ϕ : Rp → Rq×1 egy differenci´alhat´o f¨ uggv´eny, ´es q×1 a t : X → R statisztika a ϕ(ϑ) param´eter (komponensenk´ent) torz´ıtatlan becsl´ese. Ekkor felt´etelez´es¨ unk szerint, ´es felhaszn´alva, hogy 0q×p = ϕ(ϑ) · E (S(ξ; ϑ)) = E (ϕ(ϑ) · S(ξ; ϑ)) ∈ Rq×p kapjuk: Dϑ ϕ(ϑ) = Dϑ E(t) = E ((t − ϕ(ϑ)) · S(ξ; ϑ)) ∈ Rq×p .
Az a´ttekinthet˝os´eg ´erdek´eben jel¨olje η = S(ξ; ϑ)T , ekkor
E(t) = 0q×1 ∈ Rq×1 , E(η) =0p×1 ∈ Rp×1 , cov(t, η) = Dϑ ϕ(ϑ) ∈ Rq×p , cov(η, η) = I(ϑ) ∈ Rp×p . K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
´ ´ 12. FEJEZET. PARAMETERBECSL ES
156
Vizsg´aljuk az t ≈ Aη + b line´aris regresszi´os probl´em´at, akkor a marad´ek kovariancia m´atrix a VR = cov (t, t) − Dϑ ϕ(ϑ)T I(ϑ)−1 Dϑ ϕ(ϑ) (12.2) egy pozit´ıv szemidefinit szimmetrikus m´atrix, ami pontosan akkor lesz a z´erusm´atrix, ha 1-val´osz´ın˝ us´eggel teljes¨ ul egy A ∈ Rq×p m´atrixszal, ami a mint´at´ol nem, de a param´etert˝ol esetleg f¨ ugghet: t = ϕ(ϑ) + A · S(ξ; ϑ) . (12.3) A (12.2) m´atrix pozit´ıv szemidefinit, ez´ert t komponensei sz´or´asn´egyzet´enek als´o hat´ara a Dϑ ϕ(ϑ)T I(ϑ)−1 Dϑ ϕ(ϑ) ∈ Rq×q m´atrix f˝oa´tl´oj´anak megfelel˝o eleme, illetve a q = 1 esetben:
D2 (t) ≥ Dϑ ϕ(ϑ)T I(ϑ)−1 Dϑ ϕ(ϑ). Ha m´eg ϑ skal´ar param´eter, akkor I(ϑ) egy pzit´ıv param´eter, ´es kapjuk (ϕ0 (ϑ))2 . D (t) ≥ I(ϑ) 2
Ezzel a torz´ıtatlan becsl´es hat´ekonys´ag´anak als´o korl´atj´at kaptuk a Fisher-f´ele inform´aci´o mennyis´eg seg´ıts´eg´evel. Mindezekb˝ol hasznos k¨ovetkeztet´esek vonhat´ok le maximum likelihood becsl´esek eset´en. b maximum likelihood becsl´es, amivel Legyen teh´at ϑ ∼ ϑ ´es
01×p = S(ξ; b ϑ)
b = Dϑ S(ξ; ϑ) b = Dϑ Dϑ ln L(ξ; ϑ b ∈ Rp×p B(ξ; ϑ)
b becsl´es el´eg k¨ozel van a ϑ param´eterhez (pl. negat´ıv definit szimmetrikus m´atrix. Ha a ϑ konzisztens becsl´es nagy minta eset´en), akkor T b b ≈ ϑ − B −1 (ξ; ϑ) · S(ξ; ϑ)T . 0p×1 ≈ S(ξ; ϑ) + B(ξ; ϑ) · ϑ − ϑ =⇒ ϑ
Ami ´eppen a (12.3) esetnek felel meg, ha B(ξ; ϑ) illetve B −1 (ξ; ϑ) k¨ozel a´lland´onak tekinthet˝o (pl. el´eg nagy minta, ´es ϑ szerint el´eg sima likelihodd f¨ uggv´eny eset´en). Ekkor b VR ≈ 0q×q , B(ξ; ϑ) ≈ E (B(ξ; ϑ)) = −I(ϑ), teh´at ϑ komponensei a ϑ param´eter megfelel˝o komponenseinek leghat´ekonyabb becsl´ese lesz, ´es amib˝ol k¨ovetkezik a
b ϑ) b = I(ϑ)−1 ≈ B −1 (ξ; ϑ) cov(ϑ;
b ϑ) b = I(ϑ)−1 ∼ −B −1 (ξ; ϑ) b cov(ϑ;
becsl´es is. Tekints¨ unk most egy p´ed´at a fentiek alkalmaz´as´ara.
´ ´ ´ 12.2. BECSLESEK HATEKONYS AGA
157
12.6. P´ elda. Legyen a statisztikai modell egy N (·; ·) eloszl´as´ u v.v. n-ism´etelt megfigyel´es´evel kapcsolatos. Ekkor n 1 − 2 s2 + (x − m)2 L(x; m, σ 2 ) = n exp n 2σ (2π) 2 (σ 2 ) 2 n S(x; m, σ 2 ) = (x − m) ; − n2 · σ12 + n2 · σ14 s2 (x) + (x − m)2 σ2 n n 2 4 (x − m) 2 σ σ B(x; m, σ ) = − n (x − m) − 2σn4 + σn6 s2 (x) + (x − m)2 σ4 m(x) b = x σb2 (x) = s2 (x) teh´at kapjuk
2
2
I(m, σ ) = −E B(ξ; m, σ ) tov´abb´a −B
−1
n σ2
0 n 2σ 4
0
ξ; ξ, s
2
=
I s2 n
0
−1
0 s4 n2
2
(m, σ ) =
σ2 m
0
σ2 n
0
0 σ 4 n2
.
Teh´at a v´arhat´o ´ert´ek leghat´ekonyabb becsl´es´enek standard hib´aja ξ=
√σ , n
ami a 12.3 szerinti
· S(ξ; m, σ 2 )T + m
es hib´aja. Mivel az m ∼ ξ σ 2 ∼ s2 o¨sszef¨ ugg´es miatt az m ∼ ξ torz´ıtatlan becsl´ −1 2 −1 becsl´esek konzisztensek, a B ugg´ese ξ; ξ, s ´es B (ξ; m, σ 2 ) m´atrix mint´at´ol val´o f¨ elhanyagolhat´o, ez´ert nagy n eset´en haszn´alhatjuk az I −1 (m, σ 2 ) ∼ −B −1 ξ; ξ, s2 becsl´est. Teh´at az m ∼ ξ torz´ıtatlan becsl´es D(ξ) = √σn standard hib´aja ´eppen az inform´aci´os hat´ar, aminek becsl´ese a szok´asos √sn . A σ 2 ∼ s2 asszimptotikusan torz´ıtatlan becsl´es q standard hib´aj´anak becsl´ese pedig s2 n2 . Ez ut´obbi becsl´es az egy´ebk´ent is nagy n ´ert´ek felt´etelez´ese eset´en megfelel az ellen˝or´ızhet˝o (l´asd: 88. oldal 3. feladat) s r 2 2 1 D(s2 ) = σ 2 1− ≈ σ2 n n n
o¨sszef¨ ugg´esnek. A torz´ıtatlans´ag miatt korrig´alt σ 2 ∼ s∗2 becsl´es standard hib´aja s r 2 2 n 1 2 ∗2 2 σ D(s ) = 1− =σ n−1 n n n−1 q 2 2 mind´ıg nagyobb lesz mint a σ inform´aci´os hat´ar, de azt tetsz˝olegesen megk¨ozel´ıti n n → ∞ eset´en.. K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
´ ´ 12. FEJEZET. PARAMETERBECSL ES
158
12.3.
Intervallum becsl´ esek
Egy ismeretlen param´eter becs¨ ult, teh´at nyilv´anval´oan pontatlan ´ert´eke helyet esetenk´ent fontosabb lehet a skal´ar param´eter korl´atainak megad´asa. 12.7. Defin´ıci´ o. A ϑ skal´ar param´eter (1 − α)-szint˝ u intervallum becsl´ese a t1 < t2 statisztika p´ar, ha P (t1 ≤ ϑ ≤ t2 ) = 1 − α . Jel¨ol´ese: ahol t =
t1 +t2 2
ϑ ∼ (t1 ; t2 ) az intervallum k¨ozepe, d =
illetve ϑ ∼ t ± d
t2 −t1 2
pedig a pontoss´ag m´ert´eke.
Az intervallum becsl´est, vagy konfidencia intervallumot u ´ gy alkalmazzuk, hogy kis 0 < α << 1 (α = 0.1, 0.05, . . .) ´ert´ek mellett, az ismeretlen param´eter als´o illetve fels˝o korl´atj´anak az x ∈ X megfigyelt mint´ahoz tartoz´o t1 (x) illetve t2 (x) ´ert´ekeket tekintj¨ uk (1 − α) megb´ızhat´os´agi szint mellett. Jel¨ol´ese ϑ ≈ (t1 (x); t2 (x))
illetve ϑ ≈ t(x) ± d(x) .
Ha a t1 = −∞ illetve t2 = +∞ v´alaszt´ast is megengedj¨ uk, kapjuk az ismeretlen param´eter (1 − α)-szint˝ u fels˝o illetve als´o hat´ar´at. A tov´abbiakban n´eh´any nevezetes eloszl´as param´eter´enek intervallum becsl´es´et adjuk meg. 1. Val´ osz´ın˝ us´ eg intervallum becsl´ ese. (a) (Visszatev´eses mintav´etel, Bernoulli k´ıs´erlet) Egy ismeretlen val´osz´ın˝ us´eg˝ u esem´eny n-ism´etelt megfigyel´ese eset´en legyen a s.m. egy Bin(n; ·) eloszl´as´ u v.v. megfigyel´es´evel kapcsolatos. Jel¨olje ξ − a minta statisztika; p − a val´osz´ın˝ us´eg param´eter; Ha n el´eg nagy (np > 10), a C.H.T. szerint k¨ozel´ıt˝oen teljes¨ ul ξ − np p ∈ N (0; 1) . np(1 − p)
´ gy, hogy ha V´alasszuk az 0 < α << 1 ´ert´ekhez az uα t´abl´azati ´ert´eket u u ∈ N (0; 1) ⇒ P (|u| > uα ) = α. Ekkor
! ξ − np P p ≤ uα = 1 − α, np(1 − p)
´ 12.3. INTERVALLUM BECSLESEK
159
ahol az egyenl˝otlens´eg ekvivalens alak´ıt´as´aval, ´es az ilyenkor elegend˝oen nagy n ´ert´ek miatt megtehet˝o unα elhanyagol´as´aval kapjuk: P
ξ uα −√ n n
s
ξ ξ · 1− n n
ξ uα ≤p≤ +√ n n
teh´at kaptuk a ξ uα p∼ ±√ n n
s
s
! ξ ξ = 1 − α, · 1− n n
ξ ξ · 1− n n
(1−α)-szint˝ u k´etoldali intervallum becsl´est. Az egyik oldali korl´at elhagy´as´aval nyerj¨ uk a s s uα ξ ξ uα ξ ξ ξ ξ · 1− · 1− p≥ −√ illetve p ≤ + √ n n n n n n n n (1 − α2 )-szint˝ u als´o illetve fels˝o hat´arokat. A k´etoldali intervallum becsl´es pontoss´aga f¨ ugg a mint´at´ol, de s uα ξ uα ξ √ ≤ √ · 1− n n n 2 n ez´ert tervezhet˝o, vagyis adott pontoss´ag el´er´es´ehez megadhat´o a sz¨ uks´eges megfigyel´esek n sz´ama.. (b) (Visszatev´es n´elk¨ uli mintav´etel) Legyen a s.m. egy Hyp(N, ·, n) eloszl´as´ u v.v. megfigyel´es´evel kapcsolatos. Jel¨olje ξ − a minta statisztika; a val´osz´ın˝ us´eg param´eter, M − ahol M az alapsokas´ag ”megjel¨olt” p= N egyedeinek (ismeretlen) sz´ama; Mivel E (ξ) = np D (ξ) =
s
n−1 n · p · (1 − p) · 1 − , N −1
´es a hipergeonetrikus eloszl´as el´eg nagy N, M ´ert´ekek eset´en k¨ozel´ıthet˝o a binomi´alis eloszl´assal, amit norm´alis eloszl´assal k¨ozel´ıthet¨ unk, ´es ´ıgy az el˝oz˝oekhez hasonl´oan kapjuk a s ξ uα ξ ξ n−1 p∼ ±√ · 1− · 1− n n n n N −1 (1 − α)-szint˝ u k´etoldali intervallum becsl´est. K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
´ ´ 12. FEJEZET. PARAMETERBECSL ES
160
2. Norm´ alis eloszl´ as v´ arhat´ o´ ert´ ek´ enek intervallum becsl´ ese ismert σ 0 sz´ or´ as eset´ en. Egy N (·; σ 0 ) eloszl´as´ u v.v. n-ism´etelt megfigyel´ese eset´en jel¨olje ξ = (ξ 1 , ξ 2 , . . . , ξ n ) − a minta statisztik´at; m − a v´arhat´o ´ert´ek param´etert; Mivel ξ k ∈ N (m; σ 0 ) k = 1, 2, . . . , n f¨ uggetlenek, ¯ξ − m √ n ∈ N (0; 1) . σ0 V´alasszuk az 0 < α << 1 ´ert´ekhez az uα t´abl´azati ´ert´eket u ´ gy, hogy ha u ∈ N (0; 1) ⇒ P (|u| > uα ) = α. Ekkor
¯ ξ − m√ P n ≤ uα = 1 − α , σ0
amib˝ol az egyenl˝otlens´eg ekvivalens alak´ıt´as´aval kapjuk σ0 σ0 ¯ ¯ P ξ − uα √ ≤ m ≤ ξ + uα √ =1−α , n n teh´at
σ0 m ∼ ¯ξ ± uα √ n
(1 − α)-szint˝ u k´etoldali intervallum becsl´es, ´es σ0 m ≥ ¯ξ − uα √ n
illetve
σ0 m ≤ ¯ξ + uα √ n
(1 − α2 )-szint˝ u f´eloldali megb´ızhat´os´agi hat´arok. A k´etoldali becsl´es pontoss´aga σ0 √ uα n ismert (nem f¨ ugg a mint´at´ol), ez´ert tervezhet˝o. Megjegyz´ es: P A fentiek mint´aj´ara, megadhat´o tov´abbi η = (η 1 , η 2 , . . . , η k ) megfi1 gyel´esek η¯ = k ki=1 η i a´tlag´anak konfidencia intervalluma, ugyanis
amib˝ol hasonl´oan kaphatjuk:
¯ξ − η¯ q σ 0 n1 +
1 k
∈ N (0; 1) ,
η¯ ∼ ¯ξ ± uα · σ 0 · (1 − α)-val´osz´ın˝ us´eggel.
r
1 1 + n k
´ 12.3. INTERVALLUM BECSLESEK
161
3. Norm´ alis eloszl´ as v´ arhat´ o´ ert´ ek´ enek intervallum becsl´ ese ismeretlen sz´ or´ as eset´ en. Egy N (·; ·) eloszl´as´ u v.v. n-ism´etelt megfigyel´ese eset´en jel¨olje ξ = (ξ 1 , ξ 2 , . . . , ξ n ) − a minta statisztik´at; m − a v´arhat´o ´ert´ek param´etert; σ − a sz´or´as param´etert; Mivel ξ k ∈ N (m; σ) k = 1, 2, . . . , n f¨ uggetlenek, ´es a χ2 eloszl´as tulajdons´againak k¨ovetkezm´enyek´ent megfogalmazott 8.3 felhaszn´al´as´aval ¯ ξ−m √ ¯ξ − m √ n σ q n ∈ Tn−1 . = s∗ s∗2 σ2
V´alasszuk az 0 < α << 1 ´ert´ekhez a tα t´abl´azati ´ert´eket u ´ gy, hogy ha t ∈ Tn−1 ⇒ P (|t| > tα ) = α.
Ekkor
¯ ξ − m√ P ∗2 n ≤ tα = 1 − α , s amib˝ol az egyenl˝otlens´eg ekvivalens alak´ıt´as´aval kapjuk ∗ ∗ s s P ¯ξ − tα √ ≤ m ≤ ¯ξ + tα √ =1−α , n n
teh´at
s∗ m ∼ ¯ξ ± tα √ n
(1 − α)-szint˝ u k´etoldali intervallum becsl´es, ´es s∗ m ≥ ¯ξ − tα √ n
illetve
s∗ m ≤ ¯ξ + tα √ n ∗
(1− α2 )-szint˝ u f´eloldali megb´ızhat´os´agi hat´arok. A k´etoldali becsl´es pontoss´aga t α √s n most f¨ ugg a mint´at´ol, ez´ert k¨ozvetlen¨ ul nem tervezhet˝o. Megjegyz´ es: Most is megadhat´o tov´abbi η = (η 1 , η 2 , . . . , η k ) megfigyel´esek η¯ = Pk 1 ´tlag´anak konfidencia intervalluma, ugyanis i=1 η i a k
amib˝ol hasonl´oan kaphatjuk:
¯ξ − η¯ q s∗ n1 +
1 k
∈ Tn−1 ,
η¯ ∼ ¯ξ ± tα · s · ∗
r
1 1 + n k
(1 − α)-val´osz´ın˝ us´eggel. K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
´ ´ 12. FEJEZET. PARAMETERBECSL ES
162
4. Norm´ alis eloszl´ as sz´ or´ as´ anak konfidencia hat´ arai. Egy N (·; ·) eloszl´as´ u v.v. n-ism´etelt megfigyel´ese eset´en jel¨olje ξ = (ξ 1 , ξ 2 , . . . , ξ n ) − a minta statisztik´at; σ − a sz´or´as param´etert; Mivel ξ k ∈ N (m; σ) k = 1, 2, . . . , n f¨ uggetlenek, ´es a χ2 eloszl´as tulajdons´againak k¨ovetkezm´enyek´ent megfogalmazott 8.3 felhaszn´al´as´aval n − 1 ∗2 s ∈ χ2n−1 . 2 σ V´alasszuk az 0 < α << 1 ´ert´ekhez a χ21− α2 < χ2α2 t´abl´azati ´ert´ekeket u ´ gy, hogy ha η ∈ χ2n−1 ⇒ P (η > χ21− α ) = 1 − 2
Ekkor P
χ21− α 2
α 2
´es P (η > χ2α ) = 2
n − 1 ∗2 ≤ s ≤ χ2α 2 σ2
α . 2
=1−α ,
amib˝ol az egyenl˝otlens´eg ekvivalens alak´ıt´as´aval kapjuk ! s s n − 1 n − 1 ≤ σ ≤ s∗ · =1−α , P s∗ · χ2α χ21− α 2
2
teh´at σ∼
∗
s ·
s
n−1 ∗ ;s · χ2α 2
s
n−1 χ21− α 2
!
(1 − α)-szint˝ u k´etoldali intervallum becsl´es, ´es s s n − 1 n−1 σ ≥ s∗ · illetve σ ≤ s∗ · 2 χα χ21− α 2
2
(1 − α2 )-szint˝ u f´eloldali megb´ızhat´os´agi hat´arok. 12.8. Megjegyz´ es. A ut´obbi intervallum becsl´esek a norm´alis eloszl´as felt´etelez´ese n´elk¨ ul is megadhat´ok, ´es el´eg nagy minta eset´en, mivel az itt szerepl˝o a´tlag ´es empirikus sz´or´asn´egyzet statisztik´ak a C.H.T. miatt ekkor k¨ozel norm´alis eloszl´as´ uak, a norm´alis eloszl´as eset´enek megfelel˝o konfidencia szintet kapunk.
12.4.
Feladatok
1. U (0; ·) eloszl´as´ u v.v. n-ism´etelt megfigyel´ese eset´en becs¨ ulj¨ uk az eloszl´as intervallum´anak d fels˝o hat´ar´at! Adjuk meg a likelihood f¨ uggv´enyt, keress¨ unk el´egs´eges statisztik´at, adjunk maximum likelihood becsl´est a d param´eterre! Vizsg´aljuk a becsl´esek torz´ıtatlans´ag´at ´es hat´ekonys´ag´at!
163
12.4. FELADATOK
2. Adjunk intervallum becsl´est (a) Poisson eloszl´as param´eter´ere; (b) exponenci´alis eloszl´as v´arhat´o ´ert´ek´ere; (c) k´et azonos sz´or´as´ u norm´alis eloszl´as v´arhat´o ´ert´ek´enek k¨ ul¨onbs´eg´ere; 3. Legyen egy alkatr´esz ´elettartam´anak eloszl´asf¨ uggv´enye: 0 ha x ≤ 0 F (x) = . −αx2 1−e ha x > 0
ahol α > 0 ismeretlen param´eter. 6db ilyen alkatr´esz ´elettartam´at megfigyelve kaptuk: 12.5 4.5 17.6 6.8 21.2 16.4 Keress¨ unk el´egs´eges statisztik´at, adjuk meg α maximum likelihood becsl´es´et!
4. Egy folytonos eloszl´as´ u v.v. s˝ ur˝ us´egf¨ uggv´enye α · xα−1 ha 0 < x < 1 f (x) = 0 egy´ebk´ent
ahol α > 0 ismeretlen param´eter. n-ism´etelt megfigyel´es eset´en (a) adjuk meg a likelihood f¨ uggv´enyt, keress¨ unk el´egs´eges statisztik´at! (b) k´esz´ıts¨ unk maximum likelihood becsl´est az α1 param´eterre, torz´ıtatlan-e ez a becsl´es?
5. Egy ismeretlen val´osz´ın˝ us´eg˝ u esem´enyt az els˝o bek¨ovetkez´es´eig figyel¨ unk meg. K´esz´ıts¨ unk maximum likelihood becsl´est a val´osz´ın˝ us´eg param´eterre! Torzitatlan-e ez a becsl´es? 6. Legyen a statisztikai modell egy F (x) =
0 ha x ≤ 0 −αxβ 1−e ha 0 < x
eloszl´asf¨ uggv´eny˝ u v.v. n-ism´etelt megfigyel´es´evel kapcsolatos. (a) (b) (c)
´Irjuk fel a likeihood f¨ uggv´enyt az α, β pozit´ıv param´eterek f¨ uggv´enyek´ent! Keress¨ unk el´egs´eges statisztik´at! Adjuk meg a maximum likelihood becsl´esek implicit egyenlet´et!
7. Hasonl´ıtsuk o¨ssze a szok´asos becsl´esek hat´ekonys´ag´at (a) binomi´alis (b) exponenci´alis (c) norm´alis eloszl´asok param´eterei eset´en az inform´aci´os hat´arral! K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
164
´ ´ 12. FEJEZET. PARAMETERBECSL ES
13. fejezet Hipot´ ezis vizsg´ alat 13.1.
Alapfogalmak
13.1. Defin´ıci´ o. i) A lehets´eges val´osz´ın˝ us´egi m´ert´ekek H0 ⊂ P r´esz´et hipot´ezisnek nevezz¨ uk. A H0 hipot´ezis P-re vonatkoz´o H1 = P \ H0 komplementer´et alternat´ıv hipot´ezisnek nevezz¨ uk. ii) Egy hipot´ezist egyszer˝ unek nevez¨ unk, ha egy eleme van, egy´ebk´ent o¨sszetettnek mondjuk. iii) Egy H0 hipot´ezis eld¨ont´es´ere szolg´al´o α ∈]0; 1[ terjedelm˝ u kritikus tartom´anynak nevezz¨ uk a mintat´er K ∈ A r´eszhalmaz´at, melyre teljes¨ ul PH0 (K) = α vagyis P (K) = α P ∈ P . iv) Egy H0 hipot´ezis eld¨ont´es´ere szolg´al´o K kritikus tartom´any´ u pr´oba er˝of¨ uggv´enye, illetve jellegg¨orb´eje az E = P(K) illetve J = 1 − P(K) param´eter. Megjegyz´ esek: 1. A fenti fogalmakat u ´ gy alkalmazzuk, hogy ha x ∈ K ⇒ elutas´ıtjuk H0 -t, vagyis az ”igazi” val´osz´ın˝ us´egi m´ert´eket H1 -belinek fogadjuk el. Ha pedig x∈ / K ⇒ elfogadjuk H0 -t, vagyis az ”igazi” val´osz´ın˝ us´egi m´ert´eket H0 -belinek tekintj¨ uk. K¨ovetkeztet´es¨ unket az els˝o esetben az indokolja, a szok´asos α < 0.1 esetben, hogy kis val´osz´ın˝ us´eg˝ u esem´eny bek¨ovetkez´es´eben k´etelked¨ unk, m´ıg a m´asodik esetben erre nincs okunk. Ezt az elj´ar´ast statisztikai pr´ ob´ a nak nevezz¨ uk. 165
´ ´ 13. FEJEZET. HIPOTEZIS VIZSGALAT
166
2. Param´eterekkel kapcsolatos hipot´eziseket gyakran haszn´alunk, ilyen lehet pl. a ϑ skal´ar param´eterrel kapcsolatos H0 = {P ∈ P | ϑ(P ) = ϑ0 }
r¨oviden H0 : ϑ = ϑ0
ahol ϑ0 egy adott, hipotetikus ´ert´ek. Ilyen hipot´ezist t¨obbnyire a H1 = {P ∈ P | ϑ(P ) 6= ϑ0 }
r¨oviden H1 : ϑ 6= ϑ0
un. k´etoldali alternat´ıv hipot´ezissel, de esetenk´ent a H1+ = {P ∈ P | ϑ(P ) > ϑ0 }
r¨oviden H1+ : ϑ > ϑ0
H1− = {P ∈ P | ϑ(P ) < ϑ0 }
r¨oviden H1− : ϑ < ϑ0
illetve un. f´eloldali alternat´ıv hipot´ezissel egy¨ utt fogalmazunk meg. 3. A pr´oba sor´an, egy x ∈ X megfigyelt minta eset´en, k´etf´elek´eppen d¨onthet¨ unk hib´asan: (a) Els˝ ofaj´ u hiba – ha x ∈ K ´es az ”igazi” val´osz´ın˝ us´egi m´ert´ek H 0 -beli; Ennek m´ert´eke az α = PH0 (K) adott terjedelem. (b) M´ asodfaj´ u hiba – ha x ∈ / K ´es az ”igazi” val´osz´ın˝ us´egi m´ert´ek H 1 -beli; Ennek m´ert´eke a β = PH1 (K) = 1 − PH1 (K) = 1 − E|H1 = J|H1 alternat´ıv hipot´ezisre lesz˝ uk´ıtett param´eter. Ez´ert olyan pr´oba k´ıv´anatos, melynek er˝of¨ uggv´enye H0 -on konstans α ´ert´ek˝ u, a H1 alternat´ıv hipot´ezis eset´en pedig nagy, egyhez k¨ozeli ´ert´ek˝ u. Teh´at a kritikus tartom´any kijel¨ol´ese hat´arozza meg egy pr´oba erej´et (j´os´ag´at), ´es az α-terjedelm˝ u K1 , K2 kritikus tartom´any´ u pr´ob´ak k¨oz¨ ul az els˝ot er˝osebbnek (illetve az ut´obbit gyeng´ebbnek) mondjuk, ha E1 illetve E2 er˝of¨ uggv´enyeikre teljes¨ ul E1|H1 = PH1 (K1 ) ≥ E2|H1 = PH1 (K2 ) , vagyis azonos alternat´ıva eset´en az els˝on´el kisebb a m´asodfaj´ u hiba m´ert´eke. 4. Ha ϑ egy skal´ar param´eter, ´es ϑ ∼ (t1 ; t2 )
egy (1 − α)-szint˝ u intervallum becsl´es, akkor a H0 : ϑ = ϑ0 hipot´ezis eld¨ont´es´ere szolg´al´o α-terjedelm˝ u kritikus tartom´any lesz: K = {x ∈ X | ϑ0 < t1 (x) vagy t2 (x) < ϑ0 } .
´ ´INUS ˝ EGH ´ ´ ´ 13.2. VALOSZ ANYADOS PROBA
13.2.
167
Val´ osz´ın˝ us´ egh´ anyados pr´ oba
A k¨ovetkez˝o a´ll´ıt´asban, egy egyszer˝ u esetben megmutatjuk, hogy a fenti ´ertelemben leger˝osebb pr´oba megad´as´ahoz a legnagyobb val´osz´ın˝ us´eg elve vezet. 13.2. T´ etel (Neyman–Pearson lemma). Legyenek P = {P0 , P1 } ´es H0 = {P0 }, H1 = {P1 }. Jel¨olje tov´abb´a L a likelihood f¨oggv´enyt, KC = {x ∈ X | L(x; P0 ) < C · L(x; P1 )} ,
(13.1)
ahol C > 0, ´es α = P0 (KC ) a KC kritikus tartom´any´ u pr´oba terjedelme. Ekkor tetsz˝oleges, a H0 hipot´ezis eld¨ont´es´ere szolg´al´o legfeljebb α-terjedelm˝ u K kritikus tartom´any´ u pr´oba gyeng´ebb, azaz P1 (KC ) ≥ P1 (K), ´es az egyenl˝os´eg nem teljes¨ ulhet, ha P0 (K) < α. Bizony´ıt´ as. Legyen K ∈ A ´es P0 (K) ≤ α, ´es vizsg´aljuk a H(x) = [1KC (x) − 1K (x)] · [C · L(x; P1 ) − L(x; P0 )]
x∈X
f¨ uggv´enyt. Mivel x ∈ KC ⇒ 1KC (x) − 1K (x) ≥ 0 ´es C · L(x; P1 ) − L(x; P0 ) > 0 tov´abb´a x∈ / KC ⇒ 1KC (x) − 1K (x) ≤ 0 ´es C · L(x; P1 ) − L(x; P0 ) ≤ 0 teljes¨ ul H(x) ≥ 0 x ∈ X , amit rendezve kapjuk C · [1Kc (x) · L(x; P1 ) − 1K (x) · L(x; P1 )] ≥ 1KC (x) · L(x; P0 ) − 1K (x) · L(x; P0 ) x ∈ X. Az egyenl˝otlens´eg mindk´et oldal´at integr´alva X-en a folytonos statisztikai modell eset´en, illtve o¨sszegezve X-elemeire a diszkr´et esetben, kapjuk C · [P1 (KC ) − P1 (K)] ≥ P0 (KC ) − P0 (K) = α − P0 (K) ≥ 0, amit bizony´ıtani kellett. A 13.2 t´etel szerint teh´at olyan 1 > C > 0 konstanshoz tartoz´o KC kritikus tartom´anyt ´erdemes keresni, amelyre teljes¨ ul 13.1 a ”legval´osz´ın˝ ubb” P 0 ∈ H0 ´es P1 ∈ H1 eset´en, vagyis KC =
x ∈ X | sup L(x; P0 ) < C · sup L(x; P1 ) P0 ∈H0
P1 ∈H1
K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
´ ´ 13. FEJEZET. HIPOTEZIS VIZSGALAT
168 ami pozit´ıv likelihood f¨ uggv´eny eset´en a λ(x) =
supP0 ∈H0 L(x; P0 ) supP ∈P L(x; P )
x∈X
statisztik´aval is megadhat´o: Kc = {x ∈ X | λ(x) < c} . Az ilyen kritikus tartom´any´ u pr´ob´at val´ osz´ın˝ us´egh´ anyados pr´ ob´ a nak nevezz¨ uk, ´es mint a legnagyobb val´osz´ın˝ us´eg elve alapj´an hozott m´as k¨ovetkeztet´eseinkn´el is, a kritikus tartom´any bek¨ovetkez´ese eld¨onhet˝o az el´egs´eges statisztika (ha van!) ismeret´eben. Term´eszetesen a c konstans megad´as´anak lehet˝os´ege egy adott α terjedelemhez mindebb˝ol m´eg nem k¨ovetkezik, de esetenk´ent tal´alhatunk erre megold´ast. Bizony´ıt´as n´elk¨ ul kimondjuk a k¨ovetkez˝o a´ll´ıt´ast, mely el´eg a´ltal´anos felt´etelek mellett lehet˝ov´e teszi ilyen pr´ob´ak k´esz´ıt´es´et az n-ism´etelt megfigyel´es modellj´eben. ´ ıt´ 13.3. All´ as. Ha a H0 hipot´ezis a ϑ = (ϑ1 , ϑ2 , . . . , ϑr ) meghat´aroz´o param´eterrel kapcsolatos, m´egpedig H0 : ϑ1 = ϑ01 , ϑ2 = ϑ02 , . . . , ϑp = ϑ0p ahol ϑ01 , ϑ02 , . . . , ϑ0p adott ´ert´ekek, p ≤ r, akkor el´eg nagy minta eset´en −2 ln(λ) eloszl´asa H0 teljes¨ ul´esekor k¨ozel´ıt˝oen χ2 eloszl´as´ u p szabas´agi fokkal.
13.2.1.
Bartlett pr´ oba
Haszn´aljuk az el˝obbi a´ll´ıt´ast a k¨ovetkez˝o feladatban. Legyen a statisztikai modell r sz´am´ u f¨ uggetlen norm´alis eloszl´as´ u val´osz´ın˝ us´egi v´altoz´o n1, n2 , . . . , nr ism´etelt megfigyel´es´evel kapcsolatos. Jel¨olje a minta elemeket ξ ij
j = 1, 2, . . . ni
i = 1, 2, . . . r,
az r sz´am´ u minta v´arhat´o ´ert´ek ´es sz´or´as param´eter´et pedig mi , σ i
i = 1, 2, . . . r,
teh´at ξ ij ∈ N (mi , σ i ) j = 1, 2, . . . ni
i = 1, 2, . . . r.
Vizsg´aljuk a H0 : σ 1 = σ 2 = . . . = σ r hipot´ezist. A val´osz´ın˝ us´egh´anyados pr´ob´ahoz hat´arozzuk meg a liklehood f¨ uggv´eny maximum´at. Ez a maximum P ∈ P eset´en, mivel azt mint´ank´ent hat´arozhatjuk meg n no 1 exp − n n 2 (2π) 2 s1 1 sn2 2 · · · snr r ahol s2i
ni 2 1 X = ξ ij − ¯ξ i. ni j=1
i = 1, 2, . . . r,
´es n =
r X i=1
ni .
´ ´INUS ˝ EGH ´ ´ ´ 13.2. VALOSZ ANYADOS PROBA
169
H0 eset´en a maximum´at kell venni az al´abbi kifejez´esnek, ahol σ jel¨oli a k¨oz¨os sz´or´as param´etert: ) ( r X ni 1 s2i + (¯ξ i. − mi )2 . exp − n 2 2σ (2π) 2 σ n i=1 Maximum helyen nyilv´an mi = ¯ξ i. , ´es igy σ-szerinti maximumhelyk´ent kapjuk v u r u1 X S=t ni s2i , n i=1 teh´at a maximum ´ert´eke
n no 1 . exp − n 2 (2π) 2 S n Th´at a statisztika, amire a pr´ob´at alapozzuk sup L(.; P0 )
λ=
P0 ∈H0
sup L(.; P )
=
sn1 1 sn2 2 · · · snr r . Sn
P ∈P
Ha a sz´or´asok helyett param´eterk´ent a σ 1, σ 2 − σ 1 , σ 3 − σ 1 , . . . , σ r − σ 1 param´etereket vezetj¨ uk be, hipot´ezis¨ unk r − 1 sz´am´ u pram´eterre vonatkoz´oan H0 : σ 2 − σ 1 = 0, σ 3 − σ 1 = 0, . . . , σ r − σ 1 = 0
alakban ´ırhat´o. Kor´abbi a´ll´ıt´asunk szerint a 2
−2 ln(λ) = n ln S − χ2r−1
r X
ni ln s2i
i=1
eloszl´as, ez´ert v´alasszunk egy 0 < α < 1 sz´amot, statisztika eloszl´asa H0 eset´en k¨ozel 2 ´es t´abl´azatb´ol egy χα ´ert´eket, melyre P (η > χ2α ) = α ha η ∈ χ2r−1 , ´es ekkor PH0 (−2 ln(λ) > χ2α ) = α.
Teh´at K = {x ∈ X | −2 ln(λ(x)) > χ2α } α-terjedelm˝ u kritikus tartom´any H0 eld¨ont´es´ere. M. S. Bartlett megmutatta, hogy a korrig´alt empirikus sz´or´asokat haszn´alva, a k¨ovetkez˝o m´odos´ıtott pr´oba-statisztika m´ar kis minta eset´en is kiel´eg´ıt˝oen χ 2r−1 eloszl´as´ u a H0 hipot´ezis eset´en: ! r X 2.3026 (n − r) ln S ∗2 − (ni − 1) ln s∗2 i c i=1
ahol
r
X 1 1 1 − c = 1+ 3(r − 1) i=1 ni − 1 n − r ni 2 s i = 1, 2, . . . r s∗2 = i ni − 1 i r 1 X ∗2 S = (ni − 1)s∗2 i . n − r i=1
!
K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
´ ´ 13. FEJEZET. HIPOTEZIS VIZSGALAT
170
13.2.2.
Val´ osz´ın˝ us´ eg pr´ ob´ aja, (n;c) terv
T¨omeggy´art´as min˝os´egellen˝orz´es´enek alapvet˝o feladata, hogy egy minta alapj´an eld¨ontend˝o, nem tartalmaz e a term´ekhalmaz a megengedettn´el t¨obb hib´as darabot. Ha a selejth´anyadot p jel¨oli, akkor ez annak val´osz´ın˝ us´ege, hogy egy kiv´alasztott term´ek hib´as. Vizsg´alnunk kell teh´at azt a hipot´ezist, hogy az ismeretlen selejth´anyad meghaladja-e az el˝oir´as szerinti p0 ´ert´eket, teh´at vizsg´aljuk a H0 : p = p0 hipot´ezist a H1 : p > p0 alternat´ıv´aval szemben. Feladatunk olyan kritikus tartom´any kijel¨ol´ese, melyhez tartoz´o els˝ofaj´ u hiba α. Legyenek 0 < p0 < p1 < 1, ´es vizsg´aljuk el˝osz¨or azt az esetet, amikor H0 : p = p0 , H1 : p = p1 . A likelihood f¨ uggv´enyt a p param´eter f¨ ugv´eny´eben ´ırva (k¨ozel´ıtve a c) ´es d) esetben), n elem˝ u mint´at v´eve: a) visszatev´es n´elk¨ uli mintav´etel eset´en M N −M L(k; p) =
k
n−k N n
k = 0, 1, 2, . . . n
´es N jel¨oli a sokas´ag elemsz´am´at, melyb˝ol az n elem˝ u mint´at ahol p = M N v´alasztottuk, M pedig a hib´as darabok sz´am´at. Teh´at egy hipergeometrikus eloszl´as´ u v.v. megfigyel´es´evel kapcsolatos a s.m., ahol p meghat´aroz´o param´eter, ha M ´es N k¨oz¨ ul az egyik ismeretlen. b) visszatev´eses mintav´etel eset´en n k p (1 − p)n−k L(k; p) = k
k = 0, 1, 2, . . . n.
Ekkor egy n-edrend˝ u binomi´alis eloszl´as´ u v.v.-t figyel¨ unk meg, melynek p param´etere ismeretlen. c) nagy minta, ´es kis p eset´en ( np < 10 ) L(k; p) ≈
(np)k −np e k!
k = 0, 1, 2, . . . .
Teh´at a megfigyelt v.v. Poisson eloszl´as´ u, ismeretlen λ = np param´eterrel. d) nagy minta ´es np > 10 eset´en L(k; p) ≈ Φ
k + 1 − np p 2 np(1 − p)
1 ≈ p ϕ np(1 − p)
!
! k − 21 − np −Φ p ≈ np(1 − p) ! k − np p k = 0, 1, 2, . . . . np(1 − p)
p Ekkor egy np v´arhat´o ´ert´ek˝ u ´es np(1 − p) sz´or´as´ u norm´alis eloszl´ast figyel¨ unk meg, ahol p az ismeretlen param´eter.
´ ´INUS ˝ EGH ´ ´ ´ 13.2. VALOSZ ANYADOS PROBA
171
Egyszer˝ u sz´amol´assal kapjuk, hogy a C konstans´ u val´osz´ın˝ us´egh´anyados pr´oba kritikus tartom´any´ara mindegyik esetben KC = {k ∈ {1, 2, . . .} | L(k; p0 ) ≤ C · L(k; p1 )} = = Kc = {k | k > c, k = 1, 2, . . .} , figyelembe v´eve, hogy 0 < C < 1, ´es p0 < p1 , ´es c egy alkalmasan v´alasztott pozit´ıv eg´esz sz´am. Teh´at keress¨ uk c-t u ´ gy, hogy a Kc = {k | k > c, k = 1, 2, . . . , n} kritikus tartom´any α val´osz´ın˝ us´eg˝ u legyen H0 eset´en. Egy α ´ert´ekhez azonban nem felt´etlen tal´alhat´o ilyen eg´esz sz´am, ez´ert keress¨ uk azt a legkisebb c ∈ N sz´amot, melyre n X
k=c+1
vagy m´ask´eppen:
c X k=0
L(k; p0 ) ≤ α
L(k; p0 ) ≥ 1 − α.
Ekkor a Kc kritikus tartom´any´ u pr´oba β m´asodfaj´ u hib´aja: c X
L(k; p1 ) = β.
k=0
Ha a tov´abbiakban tetsz˝oleges p ∈]0; 1[ ´ert´eket megengd¨ unk, a pr´oba jellegg¨orb´eje, ami annak val´osz´ın˝ us´ege, hogy a H0 hipot´ezist elfogadjuk J (p) =
c X k=0
L(k; p) p ∈]0; 1[.
K¨onnyen ellen˝orizhet˝o, hogy ez p-nek monoton cs¨okken˝o f¨ uggv´enye, lim 0 J (p) = 1 ´es lim1 J (p) = 0, teh´at p0 -n´al kisebb p eset´an m´eg α-n´al is kisebb els˝ofaj´ u hib´aval, p1 -n´el nagyobb p eset´en pedig β-n´al kisebb m´asodfaj´ u hib´aval d¨onthet¨ unk t´evesen. Igaz ugyan, hogy p0 ´es p1 k¨oz¨ott a d¨ont´esi hiba nagy, de ha a val´oban vesz´elyes alternat´ıva ´ert´eke p1 -n´el kezd˝odik, akkor az ilyen fajta rossz d¨ont´es m´eg nem jelenthet megengedhetetlen kock´azatot. Ha β ´ert´ek´et is el˝o´ırjuk, a minta elemsz´ama tervezhet˝o. Ezt nevezz¨ uk az α, β-hib´akhoz tartoz´o (n; c)-tervnek. Azt a legkisebb n eg´eszet kell v´alasztani, melyre egyszerre teljes¨ ulnek c X
k=0 c X k=0
L(k; p0 ) ≥ 1 − α, L(k; p1 ) ≤ β.
Egy lehets´eges algoritmus n meghat´aroz´as´ara, ha egy kezd˝o n = n 0 ´ert´ekb˝ol indulunk, ´es a gyakorlati eseteknek megfelel˝oen a c)-beli likelihood f¨ uggv´eny alakot hasznlva: K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
´ ´ 13. FEJEZET. HIPOTEZIS VIZSGALAT
172
1. n eset´en meghat´arozzuk azt a legkisebb c eg´eszt, melyre c X k=0
2. Ha
L(k; p0 ) ≥ 1 − α.
c X k=0
L(k; p1 ) ≤ β
teljes¨ ul, megvan a keresett n, ha nem n + 1 ´ert´ek´evel folytatjuk az 1. l´ep´esn´el. Mindez a d) esetben egyszer˝ ubben alakul, ugyanis c X
k=0 c X k=0
13.3.
L(k; p0 ) ≈ Φ L(k; p1 ) ≈ Φ
c − np0
p np0 (1 − p0 ) c − np1
p np1 (1 − p1 )
! !
≥1−α ≤β .
Norm´ alis eloszl´ as param´ etereinek pr´ ob´ ai
Megmutathat´o, hogy az al´abbi pr´ob´ak ekvivalensek egy val´osz´ın˝ us´egh´anyados pr´ob´aval, de a kritikus tartom´anyokat egyszer˝ ubben, k¨ozel´ıt˝o eloszl´as felhaszn´al´asa n´elk¨ ul adjuk meg. 1. (Egymint´ as) u-pr´ oba. Legyen a s.m. egy N (·; σ 0 ) eloszl´as´ u v.v. n ism´etelt megfigyel´es´evel kapcsolatos, ahol σ 0 adott. Jel¨olje a minta statisztik´at ξ = (ξ 1 , ξ 2 , . . . , ξ n ), ´es m a v´arhat´o ´ert´ek param´etert, ´es vizsg´aljuk a H0 : m = m0 hipot´ezist a H1 : m 6= m0 alternat´ıv´aval szemben. Mivel H0 eset´en ¯ξ − m0 √ σ0 ¯ξ ∈ N m0 ; √ ⇒ n ∈ N (0; 1) , n σ0 v´alasszuk a 0 < α << 1 ´ert´ekhez t´abl´azatb´ol uα ´ert´ek´et u ´ gy, hogy u ∈ N (0; 1) eset´en P (|u| > uα ) = α, akkor ¯ ξ − m0 √ PH0 n > uα = α , σ0 teh´at kaptuk a ¯ − m0 √ n x K= x∈R | n > uα σ0 α-terjedelm˝ u, k´etoldali kritikus tartom´anyt. Hasonl´oan nyerhet˝ok ¯ − m0 √ + n x K = x∈R | n > u2α σ0 ¯ − m0 √ − n x K = x∈R | n < −u2α σ0
´ ´ PARAMETEREINEK ´ ´ AI ´ 13.3. NORMALIS ELOSZLAS PROB
173
ugyancsak α-terjedelm˝ u, f´eloldali kritikus tartom´anyok. Adjuk meg a megfelel˝o er˝of¨ uggv´enyeket a k¨ ul¨onb¨oz˝o pr´ob´ak o¨sszehasonl´ıt´as´ahoz, teh´at ¯ ξ − m0 √ E = P(K) = 1 − P n ≤ uα = σ0 ¯ξ − m √ m0 − m √ m0 − m √ n≤ n ≤ uα + n = = 1 − P −uα + σ0 σ0 σ0 m0 − m √ m0 − m √ = 1 − Φ uα + n + Φ −uα + n , σ0 σ0 illetve hasonl´oan nyerhet˝ok E
m0 − m √ n = 1 − Φ u2α + σ0 m0 − m √ n . = Φ −u2α + σ0
+
E−
Egyszer˝ uen ellen˝or´ızhet˝o, hogy E az m param´eter m0 -ra szimmetrikus f¨ uggv´enye, ´es E E E E
< > < >
E + ha α > E+ E − ha α > E−
m0 ha m0 ha
<m m0 > m >m m0 < m .
Teh´at a H1+ : m0 < m illetve H1− : m0 > m alternat´ıv hipot´ezisek eset´en er˝osebb pr´ob´akat kapunk a K + illetve K − kritikus tartom´anyok alkalmaz´as´aval. Teljes¨ ulnek tov´abb´a lim E = lim E + = lim E − = 1
m→±∞
m→+∞
m→−∞
´es lim E = 1 ha m 6= m0
n→∞
lim E + = 1 ha m > m0
n→∞
lim E − = 1 ha m < m0
n→∞
ami azt jelenti, hogy a m´asodfaj´ u hiba adott alternat´ıva eset´en tetsz˝olegesen kicsiv´e tehet˝o a minta n elemsz´am´anak n¨ovel´es´evel. 2. Egymint´ as T -pr´ oba. Legyen a s.m. egy N (·; ·) eloszl´as´ u v.v. n ism´etelt megfigyel´es´evel kapcsolatos. Jel¨olje a minta statisztik´at ξ = (ξ 1 , ξ 2 , . . . , ξ n ), ´es m, σ a v´arhat´o ´ert´ek ´es sz´or´as param´etert, ´es K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
´ ´ 13. FEJEZET. HIPOTEZIS VIZSGALAT
174
vizsg´aljuk a H0 : m = m0 hipot´ezist a H1 : m 6= m0 alternat´ıv´aval szemben. Mivel H0 eset´en (l´asd 8.3) ¯ξ − m0 √ n ∈ Tn−1 s∗ v´alasszuk a 0 < α << 1 ´ert´ekhez t´abl´azatb´ol tα ´ert´ek´et u ´ gy, hogy t ∈ Tn−1 eset´en P (|t| > tα ) = α, akkor ¯ ξ − m0 √ n > tα = α , PH0 s∗ teh´at kaptuk a
K = x ∈ Rn
x¯ − m0 √ | n > t α s∗
α-terjedelm˝ u, k´etoldali kritikus tartom´anyt. Hasonl´oan nyerhet˝ok ¯ − m0 √ + n x K = x∈R | n > t2α s∗ ¯ − m0 √ − n x n < −t2α K = x∈R | s∗ ugyancsak α-terjedelm˝ u, f´eloldali kritikus tartom´anyok. Az er˝of¨ uggv´enyek viselked´ese + − hasonl´o az el˝obbi esethez, ez´ert a H1 : m0 < m illetve H1 : m0 > m alternat´ıv hipot´ezisek eset´en most is er˝osebb pr´ob´akat kapunk a K + illetve K − kritikus tartom´anyok alkalmaz´as´aval. Tov´abb´a az er˝of¨ uggv´enyek j´o k¨ozel´ıt´ese adhat´o az u-pr´oba megfelel˝o er˝of¨ uggv´enyeivel a t´abl´azati ´ert´ekek (uα x tα ), illetve a sz´or´as ´es becsl´ese (σ 0 x s∗ ) kicser´el´es´evel. 3. Sz´ or´ as χ2 pr´ ob´ aja. Legyen a s.m. egy N (·; ·) eloszl´as´ u v.v. n ism´etelt megfigyel´es´evel kapcsolatos. Jel¨olje a minta statisztik´at ξ = (ξ 1 , ξ 2 , . . . , ξ n ), ´es σ a sz´or´as param´etert, ´es vizsg´aljuk a H0 : σ = σ 0 hipot´ezist a H1 : σ 6= σ 0 alternat´ıv´aval szemben. Mivel H0 eset´en (l´asd 8.3) n − 1 ∗2 s ∈ χ2n−1 σ 20 v´alasszuk a 0 < α << 1 ´ert´ekhez t´abl´azatb´ol χ21− α < χ2α ´ert´ek´et u ´ gy, hogy η ∈ χ2n−1 2 2 eset´en P (η > χ21− α ) = 1 − α2 ´es P (η > χ2α ) = α2 , akkor 2
K=
2
n − 1 ∗2 n − 1 ∗2 s < χ21− α ∨ χ2α < s x∈R | 2 2 2 σ0 σ 20 n
α-terjedelm˝ u, k´etoldali kritikus tartom´any. 4. K´ etmint´ as T -pr´ oba.
´ ´ PARAMETEREINEK ´ ´ AI ´ 13.3. NORMALIS ELOSZLAS PROB
175
Legyen a s.m. k´et azonos sz´or´as´ u norm´alis eloszl´as´ u v.v. n1 illetve n2 ism´etelt megfigyel´es´evel kapcsolatos. Jel¨olje a minta statisztik´at (ξ, η) = (ξ 1 , ξ 2 , . . . , ξ n1 , η 1 , η 2 , . . . , η n2 ), ´es m1 , m2 a k´et v´arhat´o ´ert´ek param´etert, σ a k¨oz¨os sz´or´as param´etert, ´es vizsg´aljuk a H0 : m1 = m2 hipot´ezist a H1 : m1 6= m2 alternat´ıv´aval szemben. Mivel H0 eset´en r 1 1 ¯ξ − η¯ ∈ N 0; σ · , + n1 n2 ´es ett˝ol f¨ uggetlen ∗2 (n1 − 1) · s∗2 1 + (n2 − 1) · s2 ∈ χ2n1 +n2 −2 , 2 σ ∗ ∗ ahol s1 illetve s2 jel¨oli a k´et minta korrig´alt empirikus sz´or´ast ´es ezekb˝ol kaphatjuk a k¨oz¨os sz´or´asn´egyzet ∗2 (n1 − 1) · s∗2 1 + (n2 − 1) · s2 σ2 ∼ S 2 = n1 + n 2 − 2
torz´ıtatlan becsl´es´et. Teh´at H0 eset´en
¯ξ − η¯ r n1 · n2 t= ∈ Tn1 +n2 −2 · S n1 + n 2 amib˝ol kaphatjuk a
K = (x; y) ∈ Rn1 +n2 | |t(x; y)| > tα
k´etoldali kritikus tartom´anyt, ahol tα a Tn1 +n2 −2 eloszl´ashoz tartoz´o megfelel˝o kritikus ´ert´ek. 5. K´ et sz´ or´ as egyenl˝ os´ eg´ enek F pr´ ob´ aja. Legyen a s.m. k´et (nem felt´etlen¨ ul azonos sz´or´as´ u) norm´alis eloszl´as´ u v.v. n 1 illetve n2 ism´etelt megfigyel´es´evel kapcsolatos. Jel¨olje a minta statisztik´at (ξ, η) = (ξ 1 , ξ 2 , . . . , ξ n1 , η 1 , η 2 , . . . , η n2 ), ´es σ 1 , σ 2 a k´et sz´or´as param´etert, ´es vizsg´aljuk a H0 : σ 1 = σ 2 hipot´ezist a H1 : σ 1 6= σ 2 alternat´ıv´aval szemben. Mivel (n1 − 1) · s∗2 1 ∈ χ2n1 −1 2 σ1
(n2 − 1) · s∗2 2 ∈ χ2n2 −1 , 2 σ2
ahol az s∗1 ´es s∗2 korrig´alt empirikus sz´or´as statisztik´ak f¨ uggetlenek, ez´ert H0 eset´en s∗2 1 ∈ F(n1 −1;n2 −1) . s∗2 2 K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
´ ´ 13. FEJEZET. HIPOTEZIS VIZSGALAT
176
´ gy, hogy η ∈ V´alasszuk a 0 < α << 1 ´ert´ekhez t´abl´azatb´ol f1− α2 < f α2 ´ert´ek´et u α α α α F(n1 −1;n2 −1) eset´en P (η > f1− 2 ) = 1 − 2 ´es P (η > f 2 ) = 2 , akkor K=
(x; y) ∈ R
n1 +n2
s∗2 s∗2 1 < f1− α2 ∨ f α2 < 1∗2 | ∗2 s2 s2
α-terjedelm˝ u, k´etoldali kritikus tartom´any H0 eld¨ont´es´ere. Mivel a szok´asos terjedelmekhez tartoz´o t´abl´azati ´ert´ekekre f1− α2 < 1 < f α2 teljes¨ ul, a pr´ob´at u ´ gy c´elszer˝ u elv´egezni, hogy a nagyobb empirikus sz´or´asn´egyzetet osztva a kisebbel, csup´an az s∗2 f α2 < 1∗2 s2 egyenl˝otlens´eg teljes¨ ul´es´et ellen˝or´ızz¨ uk. 13.4. Megjegyz´ es. A 12.8 megjegyz´es¨ unk most is ´erv´enyes, ez´ert a fenti hipot´ezis vizsg´alatok el´eg nagy minta eset´en a norm´alis eloszl´as felt´etelez´ese n´elk¨ ul is elv´egezhet˝ok.
13.4.
Feladatok
1. Ha az (n; c) tervet u ´ gy alkalmazzuk sorozatosan, hogy N elem˝ u t´eteleket elfogadunk illetve visszautas´ıtunk a d¨ont´est˝ol f¨ ugg˝oen, adjuk meg a kibocs´ajtott selejth´anyad v´arhat´o ´ert´ek´et a p f¨ uggv´eny´eben! Mennyi ennek maximuma? 2. Mutassuk meg, hogy a norm´alis eloszl´as param´etereinek itt megadott pr´ob´ai val´osz´ın˝ us´egh´anyados pr´ob´ak! 3. K´esz´ıts¨ unk pr´ob´at exponenci´alis eloszl´as param´eter´ere! 4. Adjuk meg a val´osz´ın˝ us´eg pr´ob´aj´at, ´es a pr´oba erej´et a norm´alis eloszl´assal val´o k¨ozel´ıt´es eset´en! 5. Adjuk meg a sz´or´as χ2 pr´ob´aj´anak er˝of¨ uggv´eny´et! 6. Adjuk meg a k´etmint´as u-pr´ob´at a k´etmint´as t-pr´ob´ahoz hasonl´oan!
14. fejezet Line´ aris f¨ ugg˝ os´ egi kapcsolat Vizsg´aljuk a k¨ovetkez˝o feladatot: egy y mennyis´eget egy x mennyis´egt˝ol f¨ ugg˝oen tudunk megfigyelni y = f (x) + , (14.1) ahol f a regresszi´ os f¨ uggv´eny, a megfigyel´esi hiba. Eset¨ unkben felt´etelezz¨ uk, hogy f az x-nek line´aris f¨ uggv´enye, teh´at ha pl. x egy p-dimenzi´os vektor-mennyis´eg: f (t1, t2, . . . , tp ) = a1 t1 + a2 t2 + . . . + ap tp
x = (t1, t2 , . . . , tp ) ∈ D ⊂ Rp
ahol az a1 , a2 , . . . ap ismeretlen regresszi´ os egy¨ uthat´ o kat kell becs¨ ulni az Y mennyis´eg x ∈ D ismert helyekhez tartoz´o megfigyel´ese alapj´an. Itt a D halmaz az X mennyis´eg lehets´eges ´ert´ekeit tartalmaz´o halmaz, melyben ha pl. az els˝o koordin´ata mind´ıg 1, azaz D = (1, t2 , t3 , . . . , tp )|(t2 , t3 , . . . , tp ) ∈ D 0 ⊂ Rp−1 , akkor a szok´asos orig´on nem a´tmen˝o regresszi´os f¨ uggv´enyt kapjuk. Ha pedig D = (1, t, t2 , . . . , tp )|t ∈ J ⊂ R ,
akkor a p-edfok´ u polinom regresszi´os f¨ uggv´enyt kapjuk. Az hib´ar´ol azt t´etelezz¨ uk fel, hogy k¨ ul¨onb¨oz˝o x ∈ D helyekhez tartoz´o x hib´ak f¨ uggetlenek, ´es N (0, σ) eloszl´as´ uak azonos σ (ismeretlen) sz´or´assal.
14.1.
Egyenl˝ o m´ ert´ ek˝ u, f¨ uggetlen megfigyel´ esi hiba
Legyen teh´at a statisztikai mez˝o az Y mennyis´eg x1 , x2 , . . . , xn ∈ D ⊂ Rp (adott) helyekhez tartoz´o ´ert´ek´enek f¨ uggetlen megfigyel´es´evel kapcsolatos, teh´at a mintat´er R n , ´es jel¨olje η = (η 1 , η 2 , . . . , η n ) a minta statisztik´at, a = (a1 , a2 , . . . ap ) a regresszi´os egy¨ utthat´ok, ´es σ a megfigyel´esi hiba sz´or´asa param´etereket. Jel¨olje tov´abb´a xT1 xT 2 X = .. ∈ Rn×p . xTn 177
´ ¨ ˝ EGI ´ 14. FEJEZET. LINEARIS FUGG OS KAPCSOLAT
178
az un. terv m´ atrix ot, ´es feltessz¨ uk, hogy rang(X) =p. Ekkor η ∈ N (Xa, σ 2 In ) , ahol In az n × n-t´ıpus´ u egys´egm´atrix. Irjuk a likelihood f¨ uggv´enyt az a ´es σ param´eterek f¨ uggv´eny´eben: 1 1 T L(y; a, σ) = exp − 2 (y − Xa) (y − Xa) y ∈ Rn . n n 2σ (2π) 2 · σ Kerress¨ uk a likelihood f¨ uggv´eny maximum hely´et a ∈ Rp , ´es σ > 0 esetben. Ekkor a minimum helye a n X i=1
yı − xTı a
2
= (y − Xa)T (y − Xa) = y T y − 2y T Xa + aT XT Xa
p-v´altoz´os m´asodfok´ u polinomf¨ uggv´enynek. Ez a minimum feladat, a szok´asos orig´on nem a´tmen˝o regresszi´os f¨ uggv´eny eset´en, a legkisebb n´egyzetek m´odszere (l´asd: 92. oldal) kapcs´an megfogalmazott probl´ema megold´as´at jelenti. Felt´eteleinkb˝ol k¨ovetkezik, hogy XT X pozit´ıv definit, ez´ert a keresett (y-t´ol f¨ ugg˝o) minimum hely b a(y) = XT X
−1
XT y
y ∈ Rn
´es a minimum ´ert´eke −1 T −1 T T T SS(y) = y In − X X X X y = y T y − y T X XT X X y
y ∈ Rn .
Ezt a likelihood f¨ uggv´eny logaritmus´aba ´ırva, ´es σ-szerint deriv´alva n 1 ∂ ln ◦L (y; b a, σ) = − + 3 SS(y) ∂σ σ σ
amib˝ol kapjuk a σ-szerinti maximum helyet: r Kaptuk teh´at az
σ b (y) =
1 SS(y). n
−1 T a ∼ b a = XT X X η −1 T −1 T 1 1 1 T σ2 ∼ σ b2 = SS = η T In − X XT X η η − η T X XT X X η X η= n n n
maximum likelihood becsl´eseket. Vizsg´aljuk most a kapott becsl´esek tulajdons´agait. Az b a statisztika eloszl´asa norm´alis, ´es −1 T E(b a ) = XT X X E(η) = a, −1 T −1 −1 T cov(b a, b a) = X X X cov(η, η)X XT X = σ 2 XT X ,
˝ MERT ´ EK ´ U, ˝ FUGGETLEN ¨ ´ HIBA 14.1. EGYENLO MEGFIGYELESI
179
teh´at az a ∼ b a becsl´es torz´ıtatlan. Legyenek tov´abb´a −1 T −1 T Q 1 = X XT X X , Q 2 = I n − X XT X X
szimmetrikus m´atrixok, melyekre In = Q1 + Q2 . Mivel Q1 mint line´aris lek´epez´es olyan ´ert´ekk´eszlettel rendelkezik, melynek minden vektora az X m´atrix oszlopvektorainak line´aris kombin´aci´oja, ez´ert Q1 rangja legfeljebb p, m´asr´eszt Q1 X = X, teh´at ´ert´ekk´eszlet´eben van p sz´am´ u line´arisan f¨ uggetlen vektor, vagyis rangja legal´abb p. Teh´at rang (Q 1 ) = p, ´es k¨onnyen ellen˝or´ızhet˝o, hogy teljes¨ ul Q1 · Q2 = 0n×n ∈ Rn×n amib˝ol a χ2 eloszl´as part´ıci´os tulajdons´agak´ent bizony´ıtott (Fisher-Cochran) t´etel szerint k¨ovetkeznek az al´abbiak: rang (Q2 ) = n − p Q1 Q1 = Q 1 , Q2 Q2 = Q 2 tov´abb´a az
1 1 T SS = η Q2 η σ2 σ2 n´egyzet¨osszeg χ2 -eloszl´as´ u n − p szabads´agi fokkal, mivel Q2 Xa = 0n×n ∈ Rn . Teh´at E(b σ2) = vagyis a σ 2 ∼ σ b2 becsl´es torz´ıtott, ´es ez´ert a
n−p 2 σ , n
σ 2 ∼ s2R =
1 SS n−p
becsl´es torz´ıtatlan. Tov´abb cov (b a, Q2 η) = XT X
−1
XT cov(η, η)Q2 = 0 ∈ Rp×n ,
ez´ert b a ´es Q2 η, ´es ´ıgy b a ´es s2R is f¨ uggetlenek. Mindezek fontos k¨ovetkezm´enyei az al´abbi intervallum becsl´esek:
1. A regresszi´ os egy¨ uthat´ ok line´ aris f¨ uggv´eny´enek intervallum becsl´ese. p T Legyen c ∈ R , ´es becs¨ ulj¨ uk az a c skal´ar param´etert! Mivel q −1 T T b a c∈N b a c; σ cT (XT X) c ez´ert aT c ∼ b aT c is torz´ıtatlan becsl´es, tov´abb´a
b aT c − a T c q ∈ Tn−p , −1 T T sR c (X X) c K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
´ ¨ ˝ EGI ´ 14. FEJEZET. LINEARIS FUGG OS KAPCSOLAT
180 amib˝ol kapjuk az (1 − α)-szint˝ u
q a c∼b a c ± tα sR cT (XT X)−1 c T
intervallum becsl´est.
T
Speci´ alis esetek: (a) Ha c = ek a k-adik egys´egvektor, kapjuk a k-adik egy¨ utthat´o √ ak ∼ b ak ± tα sR qkk intervallum becsl´es´et, ahol qkk az . XT X
−1
m´atrix f˝oa´tl´oj´anak k-adik eleme.
(b) Ha c = x a f¨ uggetlen v´altoz´o egy lehets´eges ´ert´eke, kapjuk az ehhez tertoz´o f¨ ugg˝o v´altoz´o v´arhat´o ´ert´ek´enek q T T f (x) = a x ∼ b a x ± tα sR xT (XT X)−1 x becsl´es´et.
2. A f¨ ugg˝ o v´ altoz´ o v´eletlen ´ert´ek´enek becsl´ese. p Legyen x ∈ R , P becs¨ ulj¨ uk az ehhez tartoz´o tov´abbi r-sz´am´ u y1 , y2 , . . . , yr v´eletlen ´ert´ekekek y¯ = 1r ri=1 yi a´tlag´at! Mivel σ T y¯ ∈ N a x; √ , r kapjuk y¯ − b aT x ∈ N
0; σ
amib˝ol nyerhet˝o az (1 − α)-szint˝ u T
intervallum becsl´es.
y¯ ∼ b a x ± t α sR
r
r
! 1 −1 + xT (XT X) x , r
1 + xT (XT X)−1 x r
(14.2)
3. A f¨ uggetlen v´ altoz´ o ´ert´ek´enek becsl´ese. Legyen most x ∈ Rp egy ismeretlen hely, melyhez tartoz´o r-sz´am´ u y 1 , y2 , . . . , yr v´eletlen ´ert´ekek adottak. 14.2 a´trendez´es´evel kapjuk 2 −1 1 T 2 2 T T P y¯ − b a x ≤ t α sR +x X X x =1−α , r
ahol az egyenl˝otlens´eg a´trendez´es´evel nyerhet˝o az ismeretlen f¨ uggetlen v´altoz´o (1 − α)-szint˝ u konfidencia tartom´anya.
˝ MERT ´ EK ´ U, ˝ FUGGETLEN ¨ ´ HIBA 14.1. EGYENLO MEGFIGYELESI
181
Megjegyz´ es: A felsorolt intervallum becsl´esek lehet˝os´eget adnak a megfelel˝o param´eterrel kapcsolatos hipot´ezisek vizsg´alat´ara. Vizsg´aljuk most azt az esetet, amikor az a param´eter vektor n´eh´any, pl. utols´o r sz´am´ u 0 komponense 0. Ez l´enyeg´eben azt jelenti, hogy az Y f¨ ugg˝o v´altoz´o kevesebb p = p − r sz´am´ u f¨ uggetlen v´altoz´oval k¨ozel´ıthet˝o. Ennek megfelel˝oen jel¨olje az X m´atrix els˝o p 0 oszlop´at tartalmaz´o m´atrixot X1 , melynek rangja p0 , ´es a els˝o p0 komponens´et tartalmaz´o vektort a1 , teh´at η ∈ N (X1 a1 , σ 2 In ) . Az ´ıgy nyert marad´ek n´egyzet¨osszeg statisztika −1 T SS1 = η T In − X1 XT1 X1 X1 η, amire nyilv´anval´oan teljes¨ ul SS ≤ SS1 . A n¨ovekm´eny pedig −1 T −1 T SS2 = η T X XT X X − X1 XT1 X1 X1 η , teh´at SS1 = SS + SS2 . Ekkor irhatjuk
0
In = Q + Q 1 + Q 2 ahol Q = X XT X 0
−1
−1
XT1 , −1 T X = I n − X XT X
Q1 = X1 XT1 X1 Q2
XT − X1 XT1 X1
−1
XT1 ,
szimmetrikus n × n t´ıpus´ u m´atrixok, melyekr˝ol a kor´abbiak szerint tudjuk, hogy 0
rang(Q1 ) = p0 .
rang(Q2 ) = n − p ´es Mint azt m´ar l´attuk, a Q2 m´atrixra
0 = Q2 Q1 ⇒ 0 = Q2 X =Q2 Q1 X, 0
teh´at a Q2 m´atrix az X m´atrix oszlopait z´erus vektorba viszi a´t. Ez´ert Q2 X1 ∈ Rn×p is z´erus m´atrix. Ezt felhaszn´alva kapjuk 0
0
QQ1 = QQ2 = Q1 Q2 = 0 amib˝ol a m´ar eml´ıtett Fisher-Cochran t´etel szerint k¨ovetkeznek: rang(Q) SS 1 SS2 σ2 1 SS σ2
= n − p0 − (n − p) = p − p0 = r, = η T Q2 η, SS2 = η T Qη f¨ uggetlenek,
(14.3)
∈ χ2r , mivel QE(η) = QX1 a1 = 0 ∈ Rn ∈ χ2n−p , mivel Q2 E(η) = Q2 X1 a1 = 0 ∈ Rn . K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
´ ¨ ˝ EGI ´ 14. FEJEZET. LINEARIS FUGG OS KAPCSOLAT
182
Haszn´aljuk most ezt az eredm´enyt a szok´asos orig´on nem a´tmen˝o regeresszi´os f¨ uggv´eny eset´eben annak eld¨ont´es´ere, hogy a f¨ uggetlen v´altoz´ok befoly´asolj´ak-e a f¨ ugg˝o v´altoz´ot, vagyis az a0 + a1 xk1 + a2 xk2 + · · · + ap xkp k = 1, 2, . . . , n
regresszi´os f¨ uggv´eny kapcs´an vizsg´aljuk a H0 : a1 = a2 = · · · = ap hipot´ezist. Ekkor a H0 szerint sz˝ uk´ıtett modellben a marad´ek n´egyzet¨osszeg SS1 =
n X k=1
(η k − η¯)2 ,
amivel k´epezhetj¨ uk a meghat´arozotts´ag fok´at m´er˝o un. determin´ aci´ os egy¨ utthat´ ot: R2 = 1 − Mivel H0 eset´en σ2 ∼ torz´ıtatlan becsl´esek, a
SS n−p−1 R∗2 = 1 −
SS . SS1 σ2 ∼
SS1 n−1
SS n−p−1 SS1 n−1
korrig´alt ´ert´ekkel (is) szok´as jellemezni a f¨oggetlen v´altoz´ok hat´as´anak m´ert´ek´et. A H 0 hipot´ezis ellen˝orz´es´ehez 14.3 szerint haszn´alhatjuk az SS2 n − p − 1 R2 n−p−1 · = · ∈ F(p;n−p−1) 2 SS p 1−R p
(14.4)
ilyenkor F eloszl´as´ u pr´oba statisztik´at. K¨ ovetkezm´ eny: Eredm´enyeinket felhaszn´alhatjuk az un. korrel´aci´os-regresszi´os (l´asd: 9.1 szakasz) statisztikai feladatok megold´as´ahoz. Legyen a statisztikai modell¨ unk egy 1 + p dimenzi´os norm´alis eloszl´as´ u v.v.v. n ism´etelt megfigyel´es´evel kapcsolatos, jel¨olje a minta statisztik´at η = [η 1 , η 2 , . . . , η n ]T ξ = [ξ kl ]l=1,2,...,p k=1,2,...,n . n o l=1,2,...,p Ha a mintat´eren a ξ = [xkl ]k=1,2,...,n felt´etelre vonatkoz´o felt´eteles eloszl´as melletti val´osz´ın˝ us´egi m´ert´eket tekintj¨ uk, 9.7 szerint ekkor η ∈ N Xa, σ 2 In ahol
X =
1 x11 · · · x1p 1 x21 · · · x2p .. .. .. .. . . . . 1 xn1 · · · xnp
˝ MERT ´ EK ´ U, ˝ FUGGETLEN ¨ ´ HIBA 14.1. EGYENLO MEGFIGYELESI
183
a nem orig´on a´tmen˝o line´aris regresszi´os probl´ema terv m´atrixa. Ennek megfelel˝oen fenti eredm´enyeink a megelel˝o felt´eteles eloszl´as mellett ´erv´enyesek. Ekkor pl. az b a statisztika felt´eteles v´arhat´o ´ert´eke a, de akkor felt´etel n´elk¨ uli v´arhat´o ´ert´eke is, mivel a konstans (m´ar nem f¨ uggv´enye ξ-nek), teh´at a regresszi´os egy¨ utthat´ok a∼b a
becsl´ese most is torz´ıtatlan. Egy m´asik fontos k¨ovetkezm´eny a t¨obbsz¨or¨os korrel´aci´os egy¨ utthat´o pr´ob´aja. Vizsg´aljuk a H0 : ρη|ξ = 0 hipot´ezist, ami 9.2 miatt az a1 = a2 = · · · = ap = 0 felt´etellel ekvivalens, teh´at H0 eset´en (a felt´etel mellett, de akkor n´elk¨ ule is) n−p−1 R2 · ∈ F(p;n−p−1) . 2 1−R p Vegy¨ uk ´eszre tov´abb´a, hogy σ 2R ∼
SS n−p−1
D2 (η k ) ∼
SS1 n−1
torz´ıtatlan becsl´esek a felt´eteles eloszl´as mellett, de akkor felt´etel n´elk¨ ul is, teh´at 9.1 szerint kapjuk a t¨obbsz¨or¨os korrel´aci´os egy¨ utthat´o ρη|ξ ∼ R∗ korrig´alt, illeve ρη|ξ ∼ R nem korrig´alt becs´es´et. Ha p = 1, kapjuk k´et norm´alis eloszl´as´ u v.v. r korrel´aci´os egy¨ utthat´oj´anak pr´ob´aj´at. Vegy¨ uk figyelembe, hogy 9.3 szerint ρη|ξ = |r|, ´es 9.5 felhaszn´al´as´aval a marad´ek n´egyzeto¨sszeg 2 P 1 ¯ξ¯ X ξ η − η k k SS = η 2k − n¯ η2 − n n 1 P 2 , 2 ξ − ¯ξ n
k
´es ´ıgy most R2 = rˆ2 , ahol
rˆ = r P 1 n
P
ξ k η k − ¯ξ¯ η q P 2 1 ξ 2k − ¯ξ η 2k − η¯2 n 1 n
az un. emp´ırikus korrel´ aci´ os egy¨ utthat´ o. Tov´abb´a egy F (1;n−2) elosz´as´ u v.v. egy Tn−2 eloszl´as´ u n´egyzete, teh´at H0 : r = 0 eset´en kapjuk a √
√ rˆ · n − 2 ∈ Tn−2 1 − rˆ2
pr´oba statisztik´at. K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
´ ¨ ˝ EGI ´ 14. FEJEZET. LINEARIS FUGG OS KAPCSOLAT
184
14.2.
Korrel´ alt megfigyel´ esi hib´ ak
Vizsg´aljuk most azt az esetet, amikor az megfigyel´esi hib´ak nem f¨ uggetlenek, iletve sz´or´asaik k¨ ul¨onb¨oz˝oek. Ez az eset fordul el˝o akkor, amikor adott x i ∈ D helyhez t¨obb, Pegy i η ij j = 1, 2, . . . , kı megfigyel´es tartozik, ´es ezek η¯i. = n1i nj=1 η ij a´tlaga a´ll rendelkez´esre. Tegy¨ uk fel teh´at, hogy most a minta statisztika eloszl´asa: η ∈ N Xa, σ 2 Λ 1
ahol Λ ∈ Rn×n adott pozit´ıv definit szimmetrikus m´atrix. Ekkor van olyan Λ 2 ∈ Rp×n pozit´ıv definit szimmetrikus m´atrix az un. s´ ulym´ atrix, melyre 1
1
Λ = Λ2 · Λ2. 1 1 Ekkor a ζ = Λ− 2 η minta vektorra m´ar ζ ∈ N Λ− 2 Xa, σ 2 In teljes¨ ul. Ezt felhaszn´alva, hasonl´oan nyerhet˝oek az −1 T −1 a ∼ b a = XT Λ−1 X X Λ η −1 T −1 1 T −1 1 η Λ η − η T Λ−1 X XT Λ−1 X X Λ η σ2 ∼ σ b2 = SS = n n 1 σ 2 ∼ s2R = SS n−p ahol most is teljes¨ ul
1 σ2
−1 b a ∈ N a, σ 2 XT Λ−1 X
SS ∈ χ2n−p
uggetlenek. ´es b a ´es s2R f¨ Vizsg´aljuk most az ism´etelt megfigyel´es eset´et, amikor minden xi ´ert´ekhez ki sz´am´ u η ij megfigyel´es tartozik (i = 1, 2, . . . n). Ekkor
´es az εi ∈ N 0;
√σ ki
amivel a k¨ovetkez˝o
η¯i· = aT · xi + εi
i = 1, 2, . . . n
i = 1, 2, . . . n hiba tagok f¨ uggetlenek. Teh´at
Λ = p ki η¯i. ,
1 k1
0 .. .
0
0 1 k2
.. . 0
p k i xi
··· ··· .. .
0 0 .. .
···
1 kn
,
i = 1, 2, . . . n
(14.5)
´ ´ HIBAK ´ 14.2. KORRELALT MEGFIGYELESI
185
s´ ulyozott minta elemeket ´es f¨ uggetlen v´altoz´o vektorokat haszn´aljuk. sz´or´asn´egyzet´enek becsl´es´ere haszn´alhatjuk az
Ekkor a hiba
k
si∗2 statisztik´akat, melyekb˝ol
i 2 1 X η ij − η¯i. i = 1, 2, . . . , n = ki − 1 j=1
1 σ2
Pn
2 − 1) · s∗2 i ∈ χN −n miatt kapjuk a
i=1 (ki
n
σ2 ∼ S 2 = torz´ıtatlan becsl´est, ahol N = ahol most
Pn
i=1
SS =
1 X (ki − 1) · s∗2 i N − n i=1
ki , ´es nyilv´anval´oan S 2 ´es SS (ill. b a) f¨ uggetlenek, n X i=1
2 ki η¯i. − xTi b a .
Mivel az (N − n) · S 2 ´es SS n´egyzet¨osszegek f¨ uggetlenek, ´es ha modell¨ unk helyes, akkor (N − n) · S 2 ∈ χ2N −n σ2
SS ∈ χ2n−p σ2
vagyis mindk´et n´egyzet¨osszegb˝ol azonos sz´or´asra k¨ovetkeztethet¨ unk. Ezt felhaszn´alva, a k´et sz´or´as azonoss´ag´anak, vagy m´ask´eppen a linearit´as hipot´ezis´enek ellen˝orz´es´ere haszn´alhatjuk az ilyenkor SS 1 ∈ Fn−p,N −n S2 n − p
eloszl´as´ u pr´oba statisztik´at. A hipot´ezis elfogad´asa eset´en ezeket o¨sszevonva nyerhet˝o a σ 2 ∼ s2R =
1 (N − n) · S 2 + SS N −p
(14.6)
m´eg nagyobb szabads´agfok´ u χ2 eloszl´asra alapozott (teh´at pontosabb) torz´ıtatlan becsl´es. K¨onnyen ellen˝or´ızhet˝o, hogy az itt szerepl˝o k´et n´egyzet¨osszeg o¨sszevon´as´aval pontosan az η ij xi i = 1, 2, . . . , n j = 1, 2, . . . , ki (14.7) minta elemekre vonatkoz´o regresszi´os feladat marad´ek´at kapjuk, ugyanis ki n X X i=1 j=1
T
η ij − a xi
2
=
ki n X X i=1 j=1
η ij − η¯i· ) + (¯ η i· − aT xi
= (N − n) · S 2 + SS .
2
=
Mindez azt is jelenti, hogy a 14.5 ´es 14.7 mint´akb´ol azonos becsl´est kapunk a regresszi´os egy¨ utthat´okra, ´es a modell helyes volta eset´en az 14.6 becsl´est haszn´alhatjuk a kor´abban t´argyalt intervallum becsl´esekhez ´es hipot´ezis vizsg´alatokhoz. K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
´ ¨ ˝ EGI ´ 14. FEJEZET. LINEARIS FUGG OS KAPCSOLAT
186
14.3.
Ridge becsl´ es
T´erj¨ unk ism´et vissza az egyenl˝o ´es f¨ uggetlen hib´ak eset´ehez, teh´at amikor a minta statisztika η ∈ N Xa, σ 2 In . Mint l´attuk, az
a∼b a = XT X
−1
XT η
becsl´es torz´ıtatlan, ´es a becsl´es kovariancia m´atrix´anak nyoma, a komponensek sz´or´asn´egyzet´enek o¨sszege −1 tr (cov(b a, b a)) = σ 2 tr XT X
mint egyfajta ”¨ossz-”hat´ekonys´agi mutat´o ´ert´ekelhet˝o. Jel¨olje λı i = 1, 2, . . . p az XT X m´atrix saj´at´ert´ekeit, ´es v1 , v2 , . . . , vp ∈ Rp a megfelel˝o saj´atvektorok ortonorm´alt rendszer´et. Ezekkel a k¨ovetkez˝o, ugynevezett ridge becsl´est vizsg´aljuk: ! p X 1 T vı vı XT η ε ≥ 0. a ∼ aε = ε + λı i=1 Mivel
aε = XT X + εIn
−1
XT η,
a ridge becsl´es ugy nyerhet˝ o, hogy a f¨ uggetlen v´altoz´ok X-ben felsorolt vektoraihoz √ hozz´avessz¨ uk m´eg a εIn m´atrixot, ´es a megfelelˆo f¨ ugg˝o v´altoz´okat 0-nak v´alasztjuk. Ez a becsl´es minden ε ≥ 0 eset´en megadhat´o, ´es ε = 0 esetben a kor´abbi maximum likelihood becsl´est kapjuk vissza. Vizsg´aljuk most ezt a becsl´est, melyre ! p X 1 E(aε ) = vi viT XT Xa = ε + λ i i=1 ! ! ! p p p X λi X 1 X λi vi viT a = vi viT vi viT a ε + λ ε + λ i i i=1 i=1 i=1
ami csak akkor lehet torz´ıtatlan, ha ε = 0. A becsl´es kovariancia m´atrixa ! p X λi vi viT , cov(aε , aε ) = σ 2 2 (ε + λi ) i=1
a becs¨ ulni k´ıv´ant param´etert˝ol val´o elt´er´es´ere pedig kapjuk: 2
T
d (ε) = E (aε − a) (aε − a) = E |aε − E(aε )|
2
2
+ |E(aε ) − a| =
p X σ 2 λi + ε2 (aT vi )2 i=1
(ε + λi )2
mely az ε = 0 esetben a maximum likelihood becsl´es t´avols´ag´at adja az a param´etert˝ol. Ezt a kifelyez´est ε-szerint deriv´alva kapjuk p X −2λi σ 2 − (aT vi )2 ε , (*) 3 (ε + λ ) i i=1
´ ´ FUGGV ¨ ´ 14.4. NEMLINEARIS REGRESSZIOS ENYEK
187
mely kifejez´es ε-nak folytonos f¨ uggv´enye, ´es ε = 0 esetben negat´ıv, teh´at a fenti ´ertelemben vett t´avols´ag cs¨okkenthet˝o a maximum likelihood becsl´eshez k´epest egy alkalmas 0 < ε v´alaszt´as´aval. Sajnos (*) z´erushelye, ´es igy d2 minimum helye az a ´es σ ismerete n´elk¨ ul nem ahat´o meg, de a maximum likelihood becsl´esek j´o kiindul´o pontot adnak, ´es a szok´asos elj´ar´as az, hogy ε ´ert´ek´et ezen indul´o ´ert´ek k¨ornyezet´eben v´altoztatva, vizsg´aljuk a becsl´esek v´altoz´as´at. Ha a saj´at´ert´ekek el´eg nagyok, az optim´alis ridge becsl´es nem k¨ ul¨onb¨ozik l´enyegesen az b a becsl´est˝ol, de az ugynevezett gyeng´en meghat´arozott esetben, amikor van k¨ozel z´erus saj´at´ert´ek, az optim´alis ridge becsl´es m´ar jelent˝osen elt´erhet ett˝ol, ´es l´enyegesen jobb eredm´enyre vezethet. Bizony´ıt´as n´elk¨ ul megjegyezz¨ uk, hogy minden ridge becsl´es az a 7→ |a| 2 f¨ uggv´eny minimum´at adja a n X (η i − aT xi )2 = c i=1
felt´etel mellett, ahol c egy (ε-t´ol f¨ uggˆo) a´lland´o. Mag´at az elnevez´est (ridge=gerinc) ez indokolja, az alkalmaz´oi gyakorlatban pedig az a jelent˝os´ege, hogy a gyeng´en meghat´arozott esetekben a sz´els˝os˝ogesen nagy hib´aj´ u becsl´esek helyet, torz´ıtott, de m´egis pontosabb becsl´es nyerhet˝o.
14.4.
Nemline´ aris regresszi´ os f¨ uggv´ enyek
T´erj¨ unk most vissza az eredeti 14.1 feladathoz, de most az f regresszi´os f¨ uggv´enyt nemline´aris f¨ uggv´enyek valamilyen halmaz´aban keress¨ uk. A polinom f¨ uggv´eny eset´et m´ar l´attuk, amikor u ´ j v´altoz´ok bevezet´es´evel line´aris regresszi´os f¨ uggv´eny keres´es´ere vezett¨ uk azt vissza. Vizsg´aljuk pl. az un. exponenci´alis regresszi´os f¨ uggv´eny eset´et, amikor f (x) = eax+b
x∈R,
ahol a, b ismeretlen param´eterek. Ha teh´at η i = eaxi +b + i
i = 1, 2, . . . n
mindk´et oldal logaritmus´at v´eve, a jobboldalt k¨ozel´ıtve els˝orend˝ u Taylor polinomj´aval az axı +b e pontban, kapjuk τ i = ln(η i ) = axi + b + δ i ahol
δ i ∈ N 0;
σ eaxi +b
i = 1, 2, . . . n ,
i = 1, 2, . . . n
f¨ uggetlenek,
´es σ az eredeti megfigyel´esi hib´ak a´lland´o sz´or´as, melynek kis ´ert´eke eset´en elhanyagolhat´o a k¨ozel´ıt´esb˝ol ered˝o hiba. Ekkor a hib´ak sz´or´asa f¨ ugg a becs¨ uln´ı k´ıv´ant param´eterekt˝ol K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
´ ¨ ˝ EGI ´ 14. FEJEZET. LINEARIS FUGG OS KAPCSOLAT
188
is, teh´at az ilyenkor sz¨ uks´eges s´ ulym´atrixot csak k¨ozel´ıteni megfigyelt mint´ab´ol 1 1 0 ··· 0 y1 eax1 +b 1 0 0 ··· 0 1 eax2 +b Λ2 = ≈ .. .. .. .. .. . . . . . 1 0 0 ··· 0 eaxn +b
tudjuk az y = (y 1 , y2 , . . . yn )
0
···
1 ··· y2 .. . . . . 0
Teh´at az
···
0 0 . .. . 1 yn
y˜ = (y1 ln(y1 ), y2 ln(y2 ), · · · , yn ln(yn )) ”megfigyelt mint´aval”, ´es
˜ = X
x1 · y 1 y 1 x2 · y 2 y 2 .. .. . . xn · y n y n
s´ ulyozott terv m´atrixszal kell a line´aris regresszi´os f¨ uggv´eny param´etereit becs¨ ulni. Ha az eredeti megfigyel´esi hib´ak σ=
D(η ı ) eaxi +b
i = 1, 2, . . . n
relat´ıv sz´or´asa a´lland´o, ami sok esetben elfogadhat´o, nincs sz¨ uks´eg a s´ ulyokra, az y˜ = (ln(y1 ), ln(y2 ), · · · , ln(yn )) megfigyelt mint´aval ´es az
X=
x1 1 x2 1 .. .. . . xn 1
terv m´atrixszal kell a param´etereket becs¨ ulni. M´as, nemline´aris regresszi´os f¨ uggv´eny eset´en is tal´alhatunk alkalmas transzform´aci´ot az 14.1 lineariz´al´as´ara. Most egy a´ltal´anos esetben haszn´alhat´o iter´aci´os elj´ar´ast mutatunk, melynek kezd˝o´ert´ekei meghat´aroz´as´ara haszn´alhatjuk a fenti m´odszereket. Legyen a regresszi´os f¨oggv´eny f : Rq+p → R (x, a1 , a2 , . . . , ap ) 7→ f (x, a1 , a2 , . . . , ap ) ahol x ∈ Rq ´es a1 , a2 , . . . , ap ∈ R az ismeretlen param´eterek. Tegy¨ uk fel tov´abb´a, hogy f a q param´eterek szerint differenci´alhat´o, akkor az xı ∈ R i = 1, 2, . . . n pontok ismeret´eben
189
14.5. FELADATOK
az f f¨ uggv´enyt a Taylor formul´aval k¨ozel´ıtve egy a01 , a02 , . . . , a0p ∈ R kezd˝o´ert´ekkel, kapjuk az ηi −
f (xi , a01 , a02 , . . . , a0p )
≈
p X j=1
4aj ·
∂ f (xi , a01 , a02 , . . . , a0p ) + i ∂aj
line´aris regresszi´os feladatot, melynek 4aj = aj − a0j ”jav´ıt´asokkal” kapjuk az u ´j a ˜0j = a0j + 4aj
i = 1, 2, . . . n
j = 1, 2, . . . p megold´asaval mint
j = 1, 2, . . . p
kezd˝o´ert´ekeket, ´es ha az elj´ar´as konvergensnek bizonyul, az utols´o l´ep´es ∂ 0 0 0 f (xi , a1 , a2 , . . . , ap ) X= ∂aj i=1,2,...,n j=1,2,...,p
terv m´atrixsz´aval ´es az 2 n X ∂ 0 0 0 0 0 0 SS(y) = yi − f (xi , a1 , a2 , . . . , ap ) − 4aj · f (xi , a1 , a2 , . . . , ap ) ∂a j i=1 marad´ek n´egyzet¨osszegb˝ol sz´amolhatjuk a line´aris esetben ´erv´enyes, most pedig j´o k¨ozel´ıt´esk´ent haszn´alhat´o sz´or´asokat, intervallum becsl´eseket. Egy ilyen algoritmus konvergenci´aj´ara a´ltal´aban nem biztos´ıtott, ez´ert l´ep´esenk´ent esetleg egy´eb m´odon, pl. ridge becsl´essel ezen jav´ıthatunk. A konvergencia t´enye illetve sebess´ege sokszor er˝osen f¨ ugg a j´o kezd˝o´ert´ek v´alaszt´ast´ol, ez´ert azt esetleg egy alkalmas lineariz´al´assal ´erdemes megv´alasztani.
14.5.
Feladatok
1. Egy egyenletesen gyorsul´o mozg´ast v´egz˝o pont a´ltal megtett utat m´erve, a mozg´as kezdete o´ta eltelt t = 1, 2, 3, 4 [s] id˝opontokban, kaptuk s = 1, 5, 8, 16 [m]. Becs¨ ulj¨ uk a gyorsul´ast, a kezd˝osebess´eget ´es az u ´ t m´er´es´enek hib´aj´at! 2. Ha az el˝oz˝o feladat m´er´esei 2,2,3, illetve 3 ism´etelt m´er´es a´tlagai, adjuk meg a param´eterek becsl´eseit!
K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
190
´ ¨ ˝ EGI ´ 14. FEJEZET. LINEARIS FUGG OS KAPCSOLAT
15. fejezet Sz´ or´ asanal´ızis Vizsg´aljuk a k¨ovetkez˝o probl´em´at. Egy megfigyelhet˝o skal´ar v.v. ´ert´eke n´eh´any tov´abbi v´altoz´o, u ´ gynevezett faktor, v´eges sok lehets´eges ´ert´ek´et˝ol, vagy m´ask´eppen szintj´et˝ol az al´abbi m´odon f¨ ugg: ξ i,j,k,... = µ + ai + bj + abij + . . . + εi,j,k,... (i, j, k, . . .) ∈ J
(15.1)
ahol a szerepl˝o modell tagok jelent´ese a k¨ovetkez˝o µ: ai : bj : .. .
az un. teljes v´erhat´o ´ert´ek az A faktor i-edik szintj´enek addit´ıv hat´asa a B faktor j-edik szintj´enek addit´ıv hat´asa .. .
abij : az A ´es B faktorok i ´es j szintj´ehez tartoz´o k¨olcs¨on¨os hat´as, interakci´o εi,j,k,... : a megfigyel´es v´eletlen hib´aja A J halmaz a faktorok olyan szintjeinek kombin´aci´oit tartalmazza, melyekkel megfigyel´est v´egezt¨ unk, ez´ert ennek megad´asa az un. kis´erlet tervet, vagy kis´erleti elrendez´est jelenti. A statisztikai modellben ξ i,j,k,... jelenti a mintaelem statisztik´akat, J elemsz´ama pedig a mintat´er dimenzi´oja. A tov´abbiakban mind´ıg felt´etelezz¨ uk, hogy µ egy ismeretlen skal´ar param´eter, a megfigyel´es v´eletlen hib´aja pedig εi,j,k,... ∈ N (0, σ) (i, j, k, . . .) ∈ J
f¨ uggetlenek,
a faktorok hat´asainak megfelel˝o t¨obbi tagr´ol pedig az al´abbi k´et lehet˝os´eg egyik´et t´etelezz¨ uk fel: 1. ismeretlen skal´ar param´eterek, egy´ertelm˝ us´eg¨ uk ´erdek´eben feltessz¨ uk X X X X ai = bj = abij = abij = . . . = 0 J
J
J
(15.2)
J
jelezve ezzel azt is, hogy ezek a param´eterek a faktorok megfelel˝o szintjeihez tartoz´o elt´er´est okoz´o hat´asok m´ert´ekei (fix vagy r¨ ogz´ıtett hat´ asok modellje, 15.2 teljes¨ ul´ese mind´ıg felt´etelezhet˝o, ha ugyanis nem teljes¨ ul, egyszer˝ u a´t-param´eterez´essel az u ´j param´eterekre m´ar teljes¨ ul 15.2); 191
´ ASANAL ´ ´IZIS 15. FEJEZET. SZOR
192
2. f¨ uggetlen, centr´alt norm´alis eloszl´as´ u v´eletlen mennyis´egek ai ∈ N (0, σ A ), bj ∈ N (0, σ B ), abij ∈ N (0, σ AB ) (i, j, k, . . .) ∈ J
f¨ uggetlenek,
(v´eletlen hat´ asok modellje); Mindk´et esetben fontos szerepe van a J index-halmaznak, vagy m´ask´eppen kis´erlettervnek. Ennek megfelel˝oen a statisztikai modell¨ unkben egy ξ i,j,k,... mintaelem J egy (i, j, k, . . .) elem´evel azonos´ıthat´o, ez´ert fogjuk a minta statisztik´at ξ = ξ i,j,k,... (i,j,k,...)∈J m´odon jel¨olni, vagy ha a J halmazt m´ar azonos´ıtottuk, r¨oviden a ξ = ξ i,j,k,... jel¨ol´est haszn´aljuk, ´es a megfigyelt mint´at pedig x = (xi,j,k,...) jel¨oli. A J halmaz elemsz´am´at, vagyis a mintat´er dimenzi´oj´at mind´ıg n jel¨oli majd.
15.1.
R¨ ogz´ıtett hat´ asok modellje
A faktorok sz´am´aban ´es kapcsolat´aban, vagy a kis´erleti elrendez´esben (J) k¨ ul¨onb¨oz˝o modell vizsg´alhat´o az 1. felt´etelez´es mellett. A k¨ovetkez˝okben megadjuk a param´eterek becsl´eseit, ´es vizsg´aljuk a faktorok hat´as´aval kapcsolatos hipot´eziseket a legegyszer˝ ubb esetben. Egyszer˝ u oszt´ alyoz´ as, k¨ ul¨ onb¨ oz˝ o ism´ etl´ esekkel. Legyen az (15.1) egyenlet, ´es ennek megfelel˝oen most a minta-elem statisztik´ak ξ ij = µ + ai + εij
j = 1, 2, . . . ni
i = 1, 2, . . . r
vagyis az egyetlen A faktor ai elt´er´ıt˝o hat´asai szerepelnek a modellben. Mindez u ´ gy is ´ertelmezhet˝o, hogy t¨obb, r-sz´am´ u f¨ uggetlen norm´elis eloszl´asb´ol vett, r i elem˝ u mint´ank van, k¨oz¨os σ sz´or´assal ´es µ + ai v´arhat´o ´ert´ekkel. 1. A param´eterek becsl´ese. Vezess¨ uk be a ni X ¯ξ = 1 ξ i. ni j=1 i,j
statisztik´akat, ahol n =
r
i = 1, 2, . . . r Pr
i=1
r
n
i X XX ¯ξ = 1 ¯ξ = 1 ξ n i .. i. n i=1 n i=1 j=1 i,j
ni ekkor a µ + ai ∼ ¯ξ i. ai ∼ ¯ξ i. − ¯ξ .. µ ∼ ¯ξ ..
(15.3)
¨ ´ITETT HATASOK ´ 15.1. ROGZ MODELLJE
193
becsl´esek torz´ıtatlanok. Mivel ezek a statisztik´ak egy x = (xi,j ) ∈ Rn megfigyelt minta line´aris f¨ uggv´enyei, megadhat´ok a Q1 , Q2 , ´es Q3 n × n t´ıpus´ u m´atrixok, melyekre Q1 x = (¯ x.. )
Q2 x = (¯ xi. − x¯.. )
Q3 x = (xij − x¯i. )
x ∈ Rn .
Ekkor a Q1 m´atrix minden eleme n1 , teh´at rangja r1 = 1, ´es szimmetrikus. Q2 els˝o n1 , majd k¨ovetkez˝o n2, stb. sora azonos, de m´eg ezekb˝ol is kikombin´alhat´o a z´erusvektor az ni egy¨ uthat´okkal, ez´ert rangja r2 ≤ r − 1. K¨onnyen ellen˝or´ızhet˝o, hogy Q2 szimmetrikus, ugyanis n
T
∀x, y ∈ R : y Q2 x =
r X i=1
ni y¯i.x¯i. − n¯ x.. y¯.. = xT Q2 y.
Ebb˝ol, ´es az In = Q 1 + Q 2 + Q 3 o¨sszef¨ ugg´esb˝ol k¨ovetkezik, hogy Q3 is szimmetrikus, tov´abb´a Q3 z (k) = 0 ∈ Rn , ahol 1 ha i = k ´es j = 1, 2, . . . ni (k) zij = k = 1, 2, . . . r 0 egy´ebk´ent miatt z (k) ∈ Rn line´arisan f¨ uggetlen vektorok, te´at Q3 rangja r3 ≤ n − r. Teh´at teljes¨ ul a χ2 eloszl´as part´ıci´os tulajdons´agak´ent megismert Fisher-Cochran t´etel 1. felt´etele, amib˝ol k¨ovetkeznek: n = r1 + r2 + r3 ami csak u ´ gy teljes¨ ulhet, hogy r2 = r − 1 ´es r3 = n − r. A minta statisztika most 2 ξ ∈ N ((µ + ai ), σ In ), ´es ´ıgy Q1 ξ = (¯ξ .. ),
Q2 ξ = (¯ξ i. − ¯ξ .. ),
Q3 ξ = (ξ ij − ¯ξ i. )
f¨ uggetlenek, mint ahogyan a teljes (T ) n´egyzet¨osszeg felbomlik a teljes a´tlagnak (M ) megfelel˝o, a csoportok k¨oz¨otti (B), ´es csoportokon bel¨ uli (W ) n´egyzet¨osszeg f¨ uggetlen o¨sszeg´ere: T
T = ξ ξ= T
M = ξ Q1 ξ
ni r X X
ξ 2i.j
i=1 j=1 2 = n¯ξ .. r X
B = ξ T Q2 ξ =
i=1
W = ξ T Q3 ξ =
ni ¯ξ i. − ¯ξ ..
ni r X X i=1 j=1
2
ξ ij − ¯ξ i.
2
K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
´ ASANAL ´ ´IZIS 15. FEJEZET. SZOR
194 Tov´abb´a teljes¨ ul Q3 (µ + ai ) = 0 ∈ Rn , teh´at hiba sz´or´asn´egyzet´enek
1 W σ2
∈ χ2n−r , amib˝ol kapjuk a v´eletlen
W σ 2 ∼ s∗2 = n−r torz´ıtatlan becsl´es´et. Mivel ¯ξ i. ∈ N µ + ai , √σni ´es ¯ξ .. ∈ N µ, √σn ,a szok´asos m´odon nyerhet˝ok az s∗ µ + ai ∼ ¯ξ i. ± tα √ ni
i = 1, 2, . . . r r 1 1 ∗ i = 1, 2, . . . r − ai ∼ ¯ξ i. − ¯ξ .. ± tα s ni n s∗ µ ∼ ¯ξ .. ± tα √ n
(1−α) szint˝ u intervallum becsl´esek, ahol tα a Tn−r eloszl´as megfelel˝o kritikus ´ert´eke. P P Tov´abbi fontos probl´ema egy ri=1 ci (µ+ ai ) = ri=1 c ese, i ai u.n. kontraszt becsl´ qP 2 Pr Pr ci r , kapjuk a ahol i=1 ci = 0. Mivel i=1 ci ¯ξ i. ∈ N ai , σ i=1 ni r X i=1
ci a i ∼
r X i=1
intervallum becsl´est.
v u r 2 u X ci ∗ ci ¯ξ i. ± tα s t ni i=1
2. Hipot´ezis vizsg´alat. Vizsg´aljuk most a HA : a1 = a2 = . . . = ar = 0 hipot´ezist, vagyis azt, hogy a faktornak nincs elt´er´ıt˝o hat´asa, vagy m´ask´eppen, a mint´ak v´arhat´o ´ert´eke azonos. A χ2 -eloszl´as mint n´egyzet¨osszeg eloszl´asa alapj´an B v´arhat´o ´ert´ek´ere kapjuk: 2
T
E(ξ Q2 ξ) = E(B) = σ (r − 1) +
r X
ni a2i .
(15.4)
i=1
Teh´at az
B n−r · W r−1 statisztika eloszl´asa F(r−1,n−r) ⇔ha HA teljes¨ ul, amib˝ol a HA hipot´ezis eld¨ont´es´ere szolg´al´o α terjedelm˝ u (egy-oldali) kritikus tartom´any: B(x) n − r n · > bα , K = x = (xij ) ∈ R | W (x) r − 1 f=
ahol bα az F(r−1,n−r) eloszl´as megfelel˝o kritikus ´ert´eke. A kritikus tartom´anyt az´ert v´alasztjuk ´ıgy, mert az alternat´ıv hipot´ezis eset´en, amikor is legal´abb egy a i > 0, az f pr´obastatisztika ´ert´eke v´arhat´o ´ert´ekben n˝o, mivel B ´es F ilyenkor is f¨ uggetlenek,
¨ ´ITETT HATASOK ´ 15.1. ROGZ MODELLJE
195
´es B v´arhat´o ´ert´ek´enek n¨ovekm´enye (15.4) szerint o¨sszefoglal´oja az al´abbi
Pr
i=1
ni a2i . A fentiek t´ablazatos
Sz´ or´ asanal´ızis t´ abl´ azat Sz´or´od´as oka ´ Atlag Faktor V´eletlen Teljes
Szabads´agi fok 1 r−1 n−r n
N´egyzet¨osszeg 2 M = n¯ξ .. 2 P B = ri=1 ni ¯ξ i. − ¯ξ .. 2 P P i ξ ij − ¯ξ i. W = ri=1 nj=1 P P i 2 ξ ij T = M + B + W = ri=1 nj=1
F(r−1,n−r) B W
·
n−r r−1
Vizsg´aljuk most a HA0 : a1 = a2 = . . . = ar0 = 0 hipot´ezist, ha r < r. ´Irjuk a fenti n´egyzet¨osszegeket az al´abbi alakban: 0
B =
r X i=1
W =
ni ¯ξ i. − ¯ξ ..
ni r X X
2
ξ ij − ¯ξ i.
i=1 j=1
=
2
r X i=1
=
2 2 ni ¯ξ i. − n¯ξ ..
ni r X X
ξ 2ij
i=1 j=1
−
r X i=1
ezeket figyelembe v´eve, a sz˝ uk´ıtett modellben, amikor is a ξ ij meket figyelmen k´ıv˝ ul hagyjuk, nyerj¨ uk a 0
B
0
=
r X
2 ni ¯ξ i.
i=1
W
0
−
02 n0 ¯ξ .. 0
=
i=1 j=1
ξ 2ij
ahol n =
r X
ni ,
¯ξ 0 ..
i=1
0
ni r X X
0
0
−
r X
2
ni ¯ξ i. 0
i > r minta ele-
0
ni r 1 XX ξ = 0 n i=1 j=1 ij
2
ni ¯ξ i.
i=1
0
f¨ uggetlen n´egyzet¨osszegeket, melyek k¨oz¨ ul W ∈ χ2n0 −r0 , ´es 0
W =W +
ni r X X
i=r 0 +1 j=1
ξ 2ij
−
r X
2
ni ¯ξ i.
i=r 0 +1
u, ha HA0 teljes¨ ul, miatt B 0 W f¨ uggetlenek. Mivel B 0 pontosan akkor χ2r0 −1 eloszl´as´ kapjuk az B0 n − r · f0 = W r0 − 1 pr´oba statisztik´at, mely HA0 eset´en F(r0 −1,n−r) eloszl´as´ u. K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
´ ASANAL ´ ´IZIS 15. FEJEZET. SZOR
196
15.2.
V´ eletlen hat´ asok modellje
Az al´abbiakban a 2. felt´etelez´esnek megfelel˝o legegyszer˝ ubb modellel foglalkozunk, vagyis egy (v´eletlen hat´as´ u) faktor van, ´es minden szinthez azonos sz´am´ u ism´etelt megfigyel´es. A minta elemek most ξ ij = µ + ai + εij
j = 1, 2, . . . t,
i = 1, 2, . . . r
ahol t > 1 az ism´etl´esek k¨oz¨os sz´ama, teh´at n = r · t, ´es most ai ∈ N (0, σ A ), N (0, σ) j = 1, 2, . . . t, i = 1, 2, . . . r f¨ uggetlenek. Mivel 2 σ + σ 2A ha i = k ´es j = l σ 2A ha i = k ´es j 6= l , cov(ξ ij , ξ kl ) = 0 egy´ebk´ent
εij ∈
a kor´abbi 15.1 szakasz jel¨ol´eseit haszn´alva (figyelembe v´eve, hogy n i = t i = 1, 2, . . . r), kapjuk a ξ = (ξ ij ) minta statisztik´ara µ ξ ∈ N ... , σ 2 In + tσ 2A (Q1 + Q2 ) . µ Teh´at
amib˝ol nyerhet˝ok a
µ Q1 ξ = (¯ξ .. ) ∈ N ... , (σ 2 + tσ 2A )Q1 µ Q2 ξ = (¯ξ i. − ¯ξ .. ) ∈ N 0, (σ 2 + tσ 2A )Q2 Q3 ξ = (ξ ij − ¯ξ i. ) ∈ N 0, σ 2 Q3 µ ∼ ¯ξ ..
1 W n −r 1 1 1 B− W ∼ t r−1 n−r
σ2 ∼ σ 2A
torz´ıtatlan becsl´esek. Itt az utols´o becsl´es csak akkor sz¨ uks´eges, ha σ A > 0. Vizsg´aljuk most a HA : σ A = 0 hipot´ezist. A fentiekb˝ol az is k¨ovetkezik, hogy az f=
B n−r · W r−1
statisztika eloszl´asa F(r−1,n−r) ⇔ha HA teljes¨ u, teh´at pontosan az 15.1-ben kapott m´odon kell a pr´ob´at v´egrehajtani. A kritikus tartom´any v´altozatlan, csup´an a pr´oba ereje v´altozik.
197
15.3. FELADATOK:
15.3.
Feladatok:
1. Egy m´erend˝o mennyis´eget h´arom k¨ ul¨onb¨oz˝o helyen, 3-3 p´arhuzamos m´er´essel pr´ob´altak meghat´arozni. Az al´abbi statisztik´akat kaptuk: x¯1. = 12.13 s∗1 = 0.015 x¯2. = 12.10 s∗2 = 0.011 x¯3. = 12.14 s∗2 = 0.012 Van-e kimutathat´o k¨ ul¨onbs´eg a h´arom helyen kapott eredm´enyek k¨oz¨ott? Ha igen, van-e legal´abb k´et hely, ahol a kapott eredm´enyek nem k¨ ul¨onb¨oznek szignifik´ansan? 2. 30 v´eletlenszer˝ uen v´alasztott egypet´ej˝ u ikerp´ar inteligecia h´anyados´at m´ert´ek ugyanazon IQ feladatlappal. Tekints¨ uk a m´ert ´ert´ekeket 30, egyenk´ent k´et-elemˆ u csoport tagjainak. Mennyi a csoportok k¨ozti (teh´at az embrek k¨ozti v´eletlen) k¨ ul¨onb¨ozˆosg m´ert´eke (sz´or´asa), illetve van-e, ´es mennyi a feladatlap hib´aj´ab´ol eredˆo pontatlans´ag (sz´or´as), ha a csoportok k¨oz¨otti ´es csoporton bel¨ uli n´egyzet¨osszegek: SB = 25.921
SW = 6.050
¨ egyenk´ent n´egyfˆos csoport o¨t k¨ 3. Ot ul¨onb¨oz˝o ´etrend szeint t´apl´alkozik. Egy h´et m´ ulva a s´ ulyv´altoz´asok az al´abbiak voltak: 1 2 +3 +2 -2 0 0 +2 -2 +1
3 4 5 +4 +3 +1 0 0 -1 +1 -1 -2 +2 +1 -1
Van-e kimutathat´o k¨ ul¨onbs´eg az egyes ´etrendek hat´asa k¨oz¨ott? Ha igen, milyen hat´arok k¨oz¨ott van ez a hat´as ´etrendenk´ent 90%-os biztons´aggal?
K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
198
´ ASANAL ´ ´IZIS 15. FEJEZET. SZOR
16. fejezet Nem param´ eteres pr´ ob´ ak Eddigi vizsg´alataink c´elja param´eterek becsl´ese, illetve vel¨ uk kapcsolatos hipot´ezisek eld¨ont´ese volt. A tov´abbiakban n´eh´any olyan pr´ob´at ismertet¨ unk, ahol (m´eg ha param´eterek is szerepelnek majd) nem a param´eterek ´ert´eke a vizsg´alat c´elja, hanem a megfigyelt val´osz´ın˝ us´egi v´altoz´ok eloszl´asa vagy f¨ uggetlens´ege.
16.1.
Illeszked´ es vizsg´ alat
Illeszked´es vizsg´ alaton olyan hipot´ezis eld¨ont´es´et ´ertj¨ uk, hogy a megfigyelt val´osz´ın˝ us´egi v´altoz´o ismeretlen eloszl´asf¨ uggv´enye azonos-e (illeszkedik) egy adott F 0 hipotetikus eloszl´asf¨ uggv´ennyel. Jel¨ol´ese: H0 : F = F0 . Egyszer˝ u val´osz´ın˝ us´egi v´altoz´o eset´en a statisztikai modellr˝ol, mint egy teljes esem´enyrendszer megfigyel´es´er˝ol is besz´elhet¨ unk, ´es a hipot´ezist H0 : pk = pk0 k = 1, 2, . . . .r jel¨oli, ahol (pk )k=1,2,....r az ismeretlen, (pk0 )k=1,2,....r pedig a hipotetikus (v´eges) diszkr´et val´osz´ın˝ us´egeloszl´as. Ha a hipotetikus eloszl´asf¨ uggv´eny, illetve p k0 n´eh´any ismertlen param´eter f¨ uggv´enyek´ent adott, becsl´eses illeszked´es vizsg´ alatr´ol besz´el¨ unk. 1. Illeszked´ es vizsg´ alat χ2 pr´ ob´ aval Legyen a s.m. egy r tag´ u teljes esem´enyrendszer n-ism´etelt megfigyel´es´evel kapcsolatos. Jel¨olje a minta statisztik´at ν = (ν 1 , ν 2 , . . . , ν r ) ahol a pk val´osz´ın˝ us´eg˝ u k-adik esem´eny megfigyelt gyakoris´aga ν k . Vizsg´aljuk a H0 : pk = pk0 k = 1, 2, . . . .r hipot´ezist, ahol (pk0 )k=1,2,....r adott hipotetikus (v´eges) diszkr´et val´osz´ın˝ us´egeloszl´as. Ekkor ν polinomi´alis eloszl´as´ u, ´es el´eg nagy n eset´en (n · p k > 10) 8.4 szerint H0 eset´en: r X (ν k − npk0 )2 ∈ χ2r−1 . np k0 k=1 199
´ ´ AK ´ 16. FEJEZET. NEM PARAMETERES PROB
200
V´alasszuk 0 < α << 1 ´ert´ekhez a χ2α kritikus ´ert´eket u ´ gy, hogy ha η ∈ χ2r−1 akkor P (η > χ2α ) = α, ´ıgy ! r X (ν k − npk0 )2 > χ2α = α, P H0 npk0 k=1
teh´at kaptuk a
K=
(
(n1 , n2 , . . . , nr ) ∈ X |
r X (nk − npk0 )2 k=1
npk0
>
χ2α
)
α terjedelm˝ u kritikus tartom´anyt. Megjegyz´ esek: 1. A f´eloldali kritikus tartom´any alkalmaz´as´at az indokolja, hogy H0 eset´en E(ν k ) = npk0 k = 1, 2, . . . .r, ´es ez´ert a v´arhat´o ´ert´ek minimum tulajdons´aga miatt E (ν k − npk0 )2 ≥ E (ν k − npk )2 , teh´at az alternat´ıv hipot´ezis eset´en a pr´oba statisztika v´arhat´o ´ert´eke nagyobb lesz.
2. Ezt a pr´ob´at tetsz˝oleges val´osz´ın˝ us´egi v´altoz´o n-ism´etelt megfigyel´ese eset´en u ´ gy alkalmazhatjuk, hogy a sz´amegyenes egy R = ∪rk=1 Ik
(16.1)
(p´eld´aul intervallumokra) t¨ort´en˝o feloszt´as´aval, a νk =
n X i=1
1{ξ i ∈Ik }
k = 1, 2, . . . .r,
gyakoris´agokkal vizsg´aljuk a H0 : F = F0 hipot´ezis helyett a H0∗ : pk = [F0 ]Ik k = 1, 2, . . . .r hipot´ezist. Ha ugyanis H0∗ -ot elutas´ıtjuk, H0 sem teljes¨ ulhet, tov´abb´a H0∗ elfogad´asa eset´en H0 -ban sincs okunk k´etelkedni. Teh´at az ´ıgy v´egrehajtott pr´oba els˝ofaj´ u hib´aja α, de a m´asodfaj´ u hiba m´ert´eke igen nagy is lehet, hiszen k´et eloszl´asf¨ uggv´eny lehet att´ol m´eg k¨ ul¨onb¨oz˝o, ha megv´altoz´asaik azonosak a sz´amegyenes v´eges sok intervallum´an. Ez ellen u ´ gy v´edekezhet¨ unk, hogy a 16.1 feloszt´ast finom´ıtjuk, aminek g´atat szab az a korl´at, hogy a megfigyelt gyakoris´agok v´arhat´o ´ert´eke legal´abb 10 legyen. 3. Ha a hipotetikus val´osz´ın˝ us´egeloszl´as n´eh´any ϑ1 , ϑ2 , . . . , ϑs meghat´aroz´o param´eter f¨ uggv´enyek´ent adott, teh´at vizsg´alnunk kell a H0 : pi = pi0 (ϑ1 , ϑ2 , . . . , ϑs ) i = 1, 2, . . . .r hipot´ezist, a val´osz´ın˝ us´egh´anyados pr´oba alkalmaz´as´aval kapjuk a k¨ovetkez˝o becsl´eses illeszked´esi pr´ob´at. Vezess¨ uk be a ϑs+1 , ϑs+2 , . . . , ϑr−1 (r −1−s)-sz´am´ u param´etert, melyekkel ps+i = ps+i 0 (ϑ1 , ϑ2 , . . . , ϑs ) + ϑs+i
i = 1, 2, . . . .r − 1 − s,
´ VIZSGALAT ´ 16.1. ILLESZKEDES
201
teh´at az ´ıgy nyert ugyancsak meghat´aroz´o (r − 1)-sz´am´ u param´eterrel hipot´ezis¨ unk H0 : ϑs+i = 0 i = 1, 2, . . . .r − 1 − s alakban ´ırhat´o. Elj´ar´asunk teh´at a k¨ovetkez˝o: (a) H0 eset´en megadjuk a
ˆi ϑi ∼ ϑ
i = 1, 2, . . . .s
maximum likelihood becsl´eseket, amivel ˆ1, ϑ ˆ2, . . . , ϑ ˆ s ) i = 1, 2, . . . .r , pi0 ∼ pˆi0 = pˆi0 (ϑ ´es a likelihood f¨ uggv´eny logaritmus´anak maximuma ekkor r
X n! sup ln L = ln + ν i · ln pˆi0 , ν1 · ν2 · . . . · νr H0 i=1 egy´ebk´ent pedig r
X n! νi . sup ln L = ln + ν i · ln ν1 · ν2 · . . . · νr n i=1 A 13.3 a´ll´ıt´as szerint −2 ln λ = 2
r X i=1
ν i · ln
νi nˆ pi0
(16.2)
eloszl´asa k¨ozel´ıt˝oen χ2r−1−s . Haszn´aljuk tov´abb´a az x ln
x 1 ≈ (x − a) + (x − a)2 a 2a
m´asodfok´ u Taylor polinommal nyerhet˝o k¨ozel´ıt´est, akkor a pr´oba statisztika −2 ln λ ≈
r X (ν i − nˆ pi0 )2 i=1
nˆ pi0
(16.3)
alakra hozhat´o. (b) Haszn´aljuk a r X (ν i − nˆ pi0 )2 i=1
nˆ pi0
pr´oba statisztik´at, melynek eloszl´asa H0 eset´en most χ2r−1−s . 2. Kolmogorov pr´ oba K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
´ ´ AK ´ 16. FEJEZET. NEM PARAMETERES PROB
202
Legyen a s.m. egy folytonos eloszl´asf¨ uggv´eny˝ u v.v. n-ism´etelt megfigyel´es´evel kapcsolatos. Jel¨olje a minta statisztik´at ξ = (ξ 1 , ξ 2 , . . . , ξ n ) , az ismeretlen eloszl´asf¨ uggv´anyt F , ´es vizsg´aljuk a H0 : F = F0 hipot´ezist, ahol F0 adott hipotetikus (folytonos) eloszl´asf¨ uggv´eny. Jel¨olje tov´abb´a az empirikus eloszl´asf¨ uggv´enyt (l´asd 11.2) a minta f¨ uggv´enyek´ent n
Fξn (z) ´es vizsg´aljuk a
1X = 1{ξ
z∈R,
∆ = sup Fξn (z) − F0 (z) z∈R
statisztik´at. Mivel
{ξ k < z} = {F0 (ξ k ) < F0 (z)} \ {F0 (ξ k ) = F0 (z)}
z∈R,
´es F0 folytonoss´aga miatt {F0 (ξ k ) = F0 (z)} = {a ≤ ξ k ≤ b} ahol a = inf {y | F0 (y) = F0 (z)} y∈R
b = sup {y | F0 (y) = F0 (z)} , y∈R
tov´abb´a H0 eset´en 3.3 szerint τ k = F0 (ξ k ) ∈ U (0; 1) k = 1, 2, . . . .r . Teh´at P H0
! n 1 X 1{τ k
vagyis H0 eset´en ∆ eloszl´asa olyan, mint egy U (0; 1) eloszl´asb´ol vett mint´ab´ol sz´armaz´o empirikus eloszl´asf¨ uggv´eny ´e√s az ”igazi” eloszl´asf¨ uggv´eny elt´er´es´enek supr´emum´a´e. Kolmogorov megmutatta, hogy n·∆ eloszl´asf¨ uggv´enye megadhat´o (n ´ert´ek´et˝ol f¨ uggetlen¨ ul), ez az un. Kolmogorov f´ele K f¨ uggv´eny (l´asd: T´abl´azatok mell´eklet). V´alasszunk teh´at egy 0 < α << 1 ´ert´eket, akkor kapjuk az √ n n x∈R |K n · sup |Fx (z) − F0 (z)| > 1 − α z∈R
α terjedelm˝ u kritikus tartom´anyt H0 eld¨ont´es´ere.
16.2.
F¨ uggetlens´ eg vizsg´ alat
Legyen a s.m. k´et teljes esem´enyrendszer n ism´etelt megfigyel´es´evel kapcsolatos, jel¨olje ν kl
k = 1, 2, . . . r
l = 1, 2, . . . , s
¨ ´ VIZSGALAT ´ 16.2. FUGGETLENS EG
203
az els˝o esem´enyrendszer k-adik ´es a m´asik l-edik tagja egy¨ uttes bek¨ovetkez´es´enek gyakoris´ag´at, ´es pkl k = 1, 2, . . . r l = 1, 2, . . . , s ennek val´osz´ın˝ us´eg´et. Vizsg´aljuk a H0 : pkl = pk· · p·l hipot´ezist, ahol pk· =
s X
pkl
l=1
p·l =
r X
pkl
k = 1, 2, . . . r
k = 1, 2, . . . r
l = 1, 2, . . . , s
l = 1, 2, . . . , s
k=1
az esem´enyrendszerekhez tartoz´o k´et val´osz´ın˝ us´egeloszl´as. Teh´at egy r · s tag´ u teljes esem´enyrendszer megfigyel´ese eset´en egy becsl´eses illeszked´es vizsg´alatot kell elv´egezn¨ unk. Haszn´aljuk az r − 1 + s − 1 sz´am´ u meghat´aroz´o param´eter ν ·l ν k· p·l ∼ pˆ·l = k = 1, 2, . . . r − 1 l = 1, 2, . . . , s − 1 pk· ∼ pˆk· = n n maximum likelihood becsl´es´et, amib˝ol pr· ∼ pˆr· = ahol ν k· =
s X l=1
ν kl
ν ·l =
r X
ν r· n
ν kl
p·s ∼ pˆ·s =
ν ·s , n
k = 1, 2, . . . r
l = 1, 2, . . . , s .
k=1
A becsl´eses illeszked´es vizsg´alat pr´oba statisztik´aj´anak szabads´agi foka r · s − 1 − (r − 1) − (s − 1) = (r − 1) · (s − 1) lesz, teh´at v´alasszunk 0 < α << 1 ´ert´ekhez χ 2α kritikus ´ert´eket u ´ gy, hogy ha η ∈ χ2(r−1)·(s−1) akkor P (η > χ2α ) = α, ekkor ν k· · ν ·l 2 r s ν − X X kl n P H0 > χ2α = α, ν k· · ν ·l k=1 l=1 n teh´at kaptuk a
nk· · n·l 2 r X s nkl − X l=1,...s 2 n K = (nkl )k=1,...,r ∈ X | > χ α nk· · n·l k=1 l=1 n
kritikus tartom´anyt, ahol az nkl megfigyelt gyakoris´agokat az al´abbi t´abl´azatba rendezhetj¨ uk: II.es.r. 1 2 ··· s Σ I.es.r. 1 n11 n12 · · · n1s n1· 2 n21 n22 · · · n2s n2· (16.4) .. .. .. . .. .. . .. . . . . r Σ
nr1 n·1
nr2 n·2
··· ···
nrs n·s
nr· n
K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
´ ´ AK ´ 16. FEJEZET. NEM PARAMETERES PROB
204 Megjegyz´ esek:
1. A pr´oba elv´egezhet˝os´eg´enek felt´etele, mint a χ 2 -es illeszked´es vizsg´alatn´al m´ar eml´ıtett¨ uk, hogy a v´arhat´o gyakoris´ag a fenti t´abla minden cell´aj´aban legal´abb 10 legyen. 2. Mint azt m´ar kor´abban jelezt¨ uk, a f´eloldali kritikus tartom´anyt a m´asodfaj´ u hiba cs¨okkent´ese miatt alkalmazzuk. 3. Tetsz˝oleges val´osz´ın˝ us´egi v´altoz´ok eset´en, a kor´abbi esethez hasonl´oan, most mindk´et v´altoz´o ´ert´ekk´eszlete sz´am´ara kell a sz´amegyenes egy-egy feloszt´as´at megadnunk.
16.3.
Homogenit´ as vizsg´ alat
Most k´et vagy t¨obb esem´enyrendszerhez illetve val´osz´ın˝ us´egi v´altoz´ohoz tartoz´o eloszl´as azonoss´ag´at vizsg´aluk. 1. Homogenit´ as vizsg´ alat χ2 pr´ ob´ aval. Legyen a statisztikai modell N sz´am´ u, egyenk´ent r tag´ u teljes esem´enyrendszer megfigyel´es´evel kapcsolatos. Jel¨olje i=1,2,...,r ν = (ν ki )k=1,2,...,N
i=1,2,...,r (pki )k=1,2,...,N
a mint´at illetve a megfelel˝o val´osz´ın˝ us´egeloszl´asokat, ahol ν ki jel¨oli a k-adik esem´enyrendszer i-edik tagja gyakoris´ag´at, illetve pki ennek val´osz´ın´ us´eg´et. Vizsg´aljuk a H0 : p1i = p2i = . . . pN i i = 1, 2, . . . , r hipot´ezist a becsl´eses illeszked´es vizsg´alathoz hasonl´oan. Az N sz´am´ u mint´ab´ol H0 eset´en kapjuk a pki ∼
ν ·i n
k = 1, 2, . . . , N
i = 1, 2, . . . , r
maximum likelihood becsl´eseket, ahol ν ·i =
N X
ν ki
i = 1, 2, . . . , r ´es n =
k=1
N X
nk .
k=1
A val´osz´ın˝ us´egh´anyados pr´oba, a becsl´eses illeszked´es vizsg´alatn´al l´atott m´odon, 16.2 szerint a N X r X ν ki 2 ν ki · ln ν i nk n i=1 k=1
pr´oba statisztik´at eredm´enyezi, amib˝ol a f¨ uggetlens´eg vizsg´alatn´al m´ar megismert pr´oba statisztik´ahoz jutunk, azzal a k¨ ul¨onbs´eggel, hogy az ott szerepl˝o ν k· statisztika szerep´et most az nk (nem v´eletlen) minta elemsz´am veszi a´t. A szabads´agi fok is v´altozatlan, mivel az N · (r − 1) sz´am´ u meghat´aroz´o param´eterb˝ol r − 1 sz´am´ u becs¨ ult param´eter
´ VIZSGALAT ´ 16.3. HOMOGENITAS
205
van, a t¨obbi pedig ezekkel azonos (H0 eset´en elt´er´ese ezekt˝ol 0), kapjuk teh´at H0 eset´en a 2 N X r X ν ki − nkn·ν ·i ∈ χ2(N −1)·(r−1) nk ·ν ·i k=1 i=1
n
pr´oba statisztik´at. Vl´asszunk teh´at 0 < α << 1 ´ert´ekhez χ2α kritikus ´ert´eket u ´ gy, hogy ha η ∈ χ2(N −1)·(r−1) akkor P (η > χ2α ) = α, akkor ! 2 N X r X ν ki − nkn·ν ·i > χ2α = α , P H0 nk ·ν ·i n
k=1 i=1
vagyis kaptuk a H0 eld¨ont´es´ehez az α terjedelm˝ u (egyoldali) kritikus tartom´anyt. Speci´alisan N = 2 esetben a pr´oba statisztika a k¨ovetkez˝o alakban ´ırhat´o 2 r X 1 µi νi − n1 · n2 · · ∈ χ2r−1 , ν + µ n n 1 2 i i=1 i ahol ν i ´es µi jel¨oli a k´et esem´enyrendszerhez tartoz´o gyakoris´agokat. Egy m´asik speci´alis eset amikor r = 2, teh´at N sz´am´ u esem´eny val´osz´ın˝ us´eg´enek azonoss´ag´at vizsg´aljuk, ekkor a pr´oba statisztika a k¨ovetkez˝o alakban ´ırhat´o: 2 N X ν k − nk · νn· ∈ χ2N −1 ν· ν· n · · 1 − n k=1 k n
P ahol ν k jel¨oli az egyes esem´enyek gyakoris´ag´at, ´es ν · = N k=1 ν k . 2 Megjegyz´ es: A kor´abbi, χ pr´ob´akhoz f˝ uz¨ott, alkalmazhat´os´aggal illetve folytonos eloszl´as eset´evel kapcsolatos megjegyz´eseink most is ´erv´enyesek. A f¨ uggetlens´eg vizsg´alat kapcs´an megismert (16.4) gyakoris´agi t´abl´azat v´altozatlan form´aban haszn´alhat´o a pr´oba statisztika sz´am´ıt´as´ahoz, csup´an a H0 hipot´ezis ´ertelmez´ese jelent itt m´ast, nevezetesen nem k´et v´altoz´o f¨ uggetlens´eg´et, hanem a mint´ak azonos eloszl´asb´ol sz´armaz´as´at jelenti. 2. Wilcoxon pr´ oba. Legyen a statisztikai modell k´et folytonos eloszl´asf¨ uggv´eny˝ u val´osz´ın˝ us´egi v´altoz´o n 1 illetve n2 ism´etelt megfigyel´es´evel kapcsolatos, jel¨olje (16.5) (ξ, η) = ξ 1 , ξ 2 , . . . , ξ n1 , η 1 , η 2 , . . . , η n2
a minta statisztik´at, ´es vizsg´aljuk a H0 : F = G hipot´ezist, ahol F az els˝o n1 , G pedig a tov´abbi n2 sz´am´ u minta elem ismeretlen (folytonos) eloszl´asf¨ uggv´enye. Rendezz¨ uk a 16.5 minta elemeit n¨ovekv˝o sorba, amit 1-val´osz´ın˝ us´eggel egy´ertelm˝ uen megtehet¨ unk (l´asd: 36. oldal 11. feladat). Jel¨olje a ξ 1 , ξ 2 , . . . , ξ n1 minta elemek hely´et, azaz rangj´at ebben az n1 + n2 elem˝ u rendezett mint´aban r1 , r2 , . . . , rn1 , ´es vizsg´aljuk a W n1 n2 =
n1 X k=1
rk −
n1 (n1 + 1) 2 K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
´ ´ AK ´ 16. FEJEZET. NEM PARAMETERES PROB
206
statisztik´at. Ha r1∗ < r2∗ < . . . < rn∗ 1 a rendezett rangokat jel¨oli, ´ırhatjuk W n1 n2 =
n1 X k=1
(rk∗ − k) ,
teh´at Wn1 n2 a ξ k > η l felt´etelt teljes´ıt˝o p´arok sz´ama, vagyis a {Wn1 n2 = k} esem´eny annak val´osz´ın˝ us´ege, hogy az egyes´ıtett rendezett mint´aban, melyben minden sorrend egyform´an val´osz´ın˝ u H0 eset´en, a ξ · minta elemeket o¨sszesen k sz´am´ u η · minta elem el˝ozi meg. Teh´at Wn1 n2 eloszl´asa H0 eset´en megadhat´o (l´asd: 12. oldal 9. feladat), tov´abb´a megmutathat´o, hogy el´eg nagy n1 ´es n2 mellett Wn1 n2 eloszl´asa k¨ozel norm´alis. ´Irjuk ehhez p´eld´aul n1 ≤ n2 esetben W n1 n2 = + .. . + .. . +
1{ξ 1 >η1 } 1{ξ 1 >η2 } .. . 1{ξ1 >η n −n +1 } 2 1 .. . 1{ξ1 >η n }
+ + .. . + .. . +
1{ξ2 >η 2 } 1{ξ2 >η 3 } .. . 1{ξ 2 >η n −n +2 } 2 1 .. . 1{ξ 2 >η n −1 }
2
+ + .. . + .. . +
2
··· ··· .. . ··· .. . ···
+ + .. . + .. . +
+ 1{ξ n >η n } 1 1 + 1{ξ >η n1 n1 +1 } .. .. . . + 1{ξ n >η n } 1 2 .. .. . . 1{ξ n >η 1 } 1
ahol soronk´ent f¨ uggetlen, H0 eset´en 12 val´osz´ın˝ us´eg˝ u esem´enyek indik´atorainak o¨sszege szerepel, ami a C.H.T. szerint k¨ozel norm´alis eloszl´as´ u lesz el´eg nagy n1 (≤ n2 ) eset´en, ´es ´ıgy ezek o¨sszege Wn1 n2 is k¨ozel norm´alis eloszl´as´ u. Hat´arozzuk most meg Wn1 n2 v´arhat´o ´ert´ek´et ´es sz´or´as´at H0 eset´en. ´Irjuk ehhez most + · · · + 1{ξ 1 >η n } + 2 + 1{ξ 2 >η 1 } + 1{ξ2 >η2 } + · · · + 1{ξ 2 >η n } + 2 .. .. .. .. .. . . .. .. .. . . . . . . . . . + 1{ξ >η } + 1{ξ >η } + · · · + 1{ξ >η } , n1 1 n1 2 n1 n2
Wn1 n2 = 1{ξ 1 >η 1 }
+ 1{ξ1 >η2 }
akkor Wn1 n2 pontosan n1 · n2 sz´am´ u
1 2
(16.6)
val´osz´ın˝ us´eg˝ u esem´eny indik´ator´anak o¨sszege, ez´ert
EH0 (Wn1 n2 ) =
n1 · n 2 . 2
A sz´or´as megad´as´ahoz vegy¨ uk ´eszre, hogy 16.6 o¨sszeg sor¨osszegei azonos eloszl´as´ uak, ´es egy sor¨osszeg sz´or´asn´egyzete n2 ·
1 n2 (n2 + 2) 1 + n2 (n2 − 1) · = , 4 12 12
k´et sor¨osszeg kovarianci´aja pedig n2 ·
1 n2 2 n2 1 + n2 (n2 − 1) · − = , 3 4 2 12
207
16.4. FELADATOK
amib˝ol kapjuk D2H0 (Wn1 n2 ) = n1 ·
n2 n1 n2 (n1 + n2 + 1) n2 (n2 + 2) + n1 (n1 − 1) · = . 12 12 12
Teh´at nagy n1 , n2 est´en v´alasszuk az 0 < α << 1 ´ert´ekhez az uα t´abl´azati ´ert´eket u ´ gy, hogy u ∈ N (0; 1) eset´en P (|u| > uα ) = α, akkor n ·n 1 2 Wn n − 2 > uα = α , PH0 q 1 2 n1 n2 (n1 +n2 +1) 12
vagyis kaptuk a H0 eld¨ont´es´ehez az α terjedelm˝ u (k´etoldali) kritikus tartom´anyt. Megjegyz´ esek:
1. Figyelemre m´elt´o k¨or¨ ulm´eny, hogy a Wn1 n2 statisztika megad´as´ahoz a minta pontos ismerete sem sz¨ uks´eges, csup´an az egyes´ıtett minta elemeinek rangsor´ara van sz¨ uks´eg. 2. Ha a minta elemek pontatlan ismerete miatt a rangsor nem egy´ertelm˝ uen adhat´o meg, az egyes ξ · minta elemek lehets´eges rangjaib´ol sz´amolt a ´tlagos ranggal szok´as sz´amolni. Ennek csak akkor van jelent˝os´ege, ha vannak azonos ξ · ´es η · minta elemek.
16.4.
Feladatok
1. K´esz´ıts¨ unk pr´ob´at egy r tag´ u teljes esem´enyrendszer s < r−1 sz´am´ u tagja val´osz´ın˝ us´eg´evel kapcsolatos H0 : p1 = p10 , p2 = p20 , . . . , ps = ps0 hipot´ezis vizsg´alat´ara!
K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
208
´ ´ AK ´ 16. FEJEZET. NEM PARAMETERES PROB
A. F¨ uggel´ ek M´ ert´ ek ´ es integr´ al A.1.
M´ ert´ ek
A.1. Defin´ıci´ o. Az Ω halmaz r´eszhalmazainak nem u ¨ res H rendszere i) f´elgy˝ ur˝ u, ha A, B ∈ H ⇒ A ∩ B ∈ H, A \ B =
r S
Hi
i=1
Hi ∈ H H i ∩ H j = ∅ i 6= j = 1, 2, . . . r ;
ii) gy˝ ur˝ u, ha A, B ∈ H ⇒ A ∪ B, A \ B ∈ H ; iii) σ-gy˝ ur˝ u, ha gy˝ ur˝ u ´es A1 , A2 , . . . , An , . . . ∈ H ⇒
∞ S
n=1
An ∈ H ;
iv) algebra (σ-algebra), ha gy˝ ur˝ u (σ-gy˝ ur˝ u) ´es Ω∈H. v) Az (Ω, H) p´art m´erhet˝o t´ernek nevezz¨ uk, ha H σ-algebra. ´ ıt´ All´ asok: 1. Az Ω r´eszeinek H halmazrendszere pontosan akkor algebra illetve σ-algebra, ha (a) Ω ∈ H
(b) A ∈ H ⇒A = Ω \ A ∈ H 209
¨ ´ MERT ´ EK ´ ES ´ INTEGRAL ´ A. FUGGEL EK.
210 (c) A1 , A2 ∈ H ⇒ A1 ∪ A2 ∈ H illetve
A 1 , A2 , . . . , An , . . . ∈ H ⇒
∞ S
n=1
An ∈ H .
2. Ha H gy˝ ur˝ u, akkor A1 , A2 , . . . , An ∈ H ⇒ A 1 ∪ A 2 ∪ . . . ∪ A n ,
A1 ∩ A 2 ∩ . . . ∩ A n ∈ H .
3. Az Ω r´eszeinek legegyszer˝ ubb halmazai {∅} illetve
{∅, Ω}
gy˝ ur˝ u, illetve algebra, a 2Ω = {A | A ⊂ Ω} hatv´anyhalmaz pedig σ-algebra. 4. Ω r´eszeib˝ol a´ll´o, tetsz˝olegesen sok gy˝ ur˝ u, σ-gy˝ ur˝ u, algebra, σ-algebra k¨oz¨os r´esze szint´en gy˝ ur˝ u, σ-gy˝ ur˝ u, stb. Speci´alisan az A ⊂ 2Ω halmazrendszer a´ltal gener´alt legsz˝ ukebb σ-algebr´at a tov´abbiakban σ (A) =
T
A⊂H⊂2Ω H σ-algebra
H
jel¨oli. 5. Ha H f´elgy˝ ur˝ u, akkor 0
H =
r S
i=1
+
Hi | r ∈ N ,
Hi ∈ H i = 1, 2, . . . r
(A.1)
a legsz˝ ukebb gy˝ ur˝ u, amely tartalmazza H-t, ´es ekkor σ (H) = σ (H 0 ). 6. Legyen Ω = Rn , ekkor (a) Rn korl´atos (esetleg elfajult, pl. {x} x ∈ Rn , ∅) intervallumainak In halmaza f´elgy˝ ur˝ u, ´es a legsz˝ ukebb In -t tartalmaz´o gy˝ ur˝ u Hn = I 1 ∪ I 2 ∪ . . . ∪ I r | r ∈ N + ,
ami m´eg mind´ıg nem algebra ´es nem σ-gy˝ ur˝ u.
I1 , I2 , . . . , I r ∈ In ,
(b) Rn intervallumait tartalmaz´o legsz˝ ukebb σ-algebra (Borel halmazok): Bn = σ (In ) = σ (Hn ) . (B1 helyett egyszer˝ uen B-t ´ırunk a tov´abbiakban.)
´ EK ´ A.1. MERT
211
7. Legyenek (Ω1 , A1 ) , (Ω2 , A2 ) , . . . , (Ωn , An ) m´erhet˝o terek, akkor H = A1 × A2 × . . . × A n f´elgy˝ ur˝ u, ´es H 0 = A1 ∪ A 2 ∪ . . . ∪ A r | r ∈ N + ,
A1 , A2 , . . . , Ar ∈ H
(A.2)
algebra. Jel¨olje Ω = Ω1 × Ω2 × . . . × Ωn ´es A = σ (H) = σ (H0 ), ekkor az (Ω, A) m´erhet˝o teret a fenti m´erhet˝o terek szorzat´anak nevezz¨ uk. Jel¨ol´ese: (Ω, A) = (Ω1 , A1 ) × (Ω2 , A2 ) × . . . × (Ωn , An ) . A.2. Defin´ıci´ o. A µ ∈ 2Ω → Rb = R ∪ {−∞, +∞} halmazf¨ uggv´enyt, melyre ∅ ∈ dom(µ), ´es µ(∅) = 0, i) addit´ıvnak nevezz¨ uk, ha A1 , A2 , . . . An , A1 ∪ A2 ∪ . . . ∪ An ∈ dom(µ)
∧ A i ∩ Aj = ∅ i 6= j = 1, 2, . . . n
eset´en teljes¨ ul µ (A1 ∪ A2 ∪ . . . ∪ An ) = µ (A1 ) + µ (A2 ) + . . . µ (An ) ; ii) σ-addit´ıvnak nevezz¨ uk, ha A1 , A2 , . . . An , . . .
∞ S
n=1
An ∈ dom(µ)
⇒µ
∞ S
n=1
An
∧ =
∞ X
Ai ∩ Aj = ∅ i 6= j = 1, 2, . . . µ (An ) ;
n=1
iii) folytonosnak nevezz¨ uk, ha dom(µ) 3 ⇒
A1 ⊂ A2 ⊂ . . . ⊂ An ⊂ . . . , ´es lim µ(An ) = µ(A) ;
n→∞
∞ S
n=1
An = A ∈ dom(µ) (A.3)
iv) elemi m´ert´eknek nevezz¨ uk, ha dom(µ) gy˝ ur˝ u, µ addit´ıv, ´es A ∈ dom(µ) ⇒ 0 ≤ µ(A) < +∞ ∞ S ∃B1 , B2 , . . . ∈ dom(µ) : Ω = Bn ; n=1
v) A µ ∈ 2Ω → Rb σ-addit´ıv, ´es
halmazf¨ uggv´enyt m´ert´eknek nevezz¨ uk, ha dom(µ) σ-algebra, µ A ∈ dom(µ) ⇒ 0 ≤ µ(A) K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
¨ ´ MERT ´ EK ´ ES ´ INTEGRAL ´ A. FUGGEL EK.
212 A µ m´ert´eket v´egesnek nevezz¨ uk ha
µ(Ω) < +∞, σ-v´egesnek nevezz¨ uk, ha ∃B1 , B2 , . . . ∈ dom(µ) : Ω =
∞ S
Bn
µ(Bn ) < +∞ n = 1, 2, . . . .
n=1
vi) Ha µ m´ert´ek ´es A = dom(µ), az (Ω, A, µ) h´armast m´ert´ekt´ernek nevezz¨ uk. ´ ıt´ All´ asok: 1. Ha µ elemi m´ert´ek, teljes¨ ulnek az al´abbi ”sz´amol´asi szab´alyok”: (a) µ(∅) = 0 ; (b) A, B ∈ dom(µ) ⇒ µ(A ∪ B) + µ(A ∩ B) = µ(A) + µ(B) ; (c) A ⊃ B ∈ dom(µ) ⇒ µ(A \ B) = µ(A) − µ(B) ;
2. σ-addit´ıv elemi m´ert´ek ”v´egesen addit´ıv”, azaz A1 , A2 , . . . An
∈
dom(µ) ∧ Ai ∩ Aj = ∅ i 6= j = 1, 2, . . . n n X n S µ (Ai ) . Ai = ⇒ µ i=1
i=1
3. A µ elemi m´ert´ek pontosan akkor σ-addit´ıv, ha folytonos. 4. Ω r´eszeinek egy H f´elgy˝ ur˝ uj´en ´ertelmezett nemnegat´ıv ´es addit´ıv µ halmazf¨ uggv´eny egy´ertelm˝ uen kiterjeszthet˝o (A.1) szerinti H0 -re. Ha megadhat´ok B1 , B2 , . . . ∈ H , hogy ∞ S µ(Bi ) < +∞ i = 1, 2, . . . ´es Ω = Bn n=1
akkor a µ kiterjeszt´ese elemi m´ert´ek. Ha µ folytonos, akkor a kiterjeszt´ese is az, vagyis σ-addit´ıv.
5. Rn korl´atos intervallumainak In halmaz´an ´ertelmezett m n : In → R + 0
I 7→ az I intervallum hossza, ter¨ ulete, . . .
halmazf¨ uggv´eny folytonos ´es addit´ıv. Ekkor mn egy´ertelm˝ uen kiterjeszhet˝o Hn -re az I1 ∪ I2 ∪ . . . ∪ IN 7→ mn (I1 ) + mn (I2 ) + . . . + mn (IN ) (A.4) hozz´arendel´essel, ha I1 , I2 , . . . , IN ∈ In ´es Ii ∩ Ij = ∅ i 6= j. ´ıgy mn σ-addit´ıv elemi m´ert´ek Hn -en.
´ EK ´ A.1. MERT
213
6. Legyen f : Rn → R+ alhat´o (esetleg impropriusan) minden korl´atos 0 (Rieman-) integr´ intervallumon, akkor Z mf (I) =
I ∈ In
f
(A.5)
I
halmazf¨ uggv´eny folytonos ´es addit´ıv. Ekkor mf egy´ertelm˝ uen kiterjeszhet˝o Hn -re az I1 ∪ I2 ∪ . . . ∪ IN 7→ mf (I1 ) + mf (I2 ) + . . . + mf (IN ) hozz´arendel´essel, ha I1 , I2 , . . . , IN ∈ In ´es Ii ∩ Ij = ∅ i 6= j. ´ıgy mf σ-addit´ıv elemi m´ert´ek Hn -en.
A.3. T´ etel (Kiterjeszt´ esi t´ etel). Legyen H ⊂ 2Ω gy˝ ur˝ u, µ σ-addit´ıv elemi m´ert´ek H-n, akkor µ egy´ertelm˝ uen kiterjeszthet˝o A =σ (H)-ra, azaz ha (Ω, A, µ1 )
(Ω, A, µ2 )
m´ert´ekterek, ´es µ(A) = µ1 (A) = µ2 (A) akkor µ1 (A) = µ2 (A)
A∈H
(A.6)
A∈A.
(A.7)
Ekkor az egy´ertelm˝ u kiterjeszt´est is µ-vel jel¨olve, (Ω, A, µ) egy σ-v´eges m´ert´ekt´er. A.4. Megjegyz´ es. Az (A.6) felt´etel enyh´ıthet˝o a µ(A) = µ1 (A) = µ2 (A)
A ∈ H0
felt´etellel, ha H a legsz˝ ukebb H0 f´elgy˝ ur˝ ut tartalmaz´o gy˝ ur˝ u. A.5. K¨ ovetkezm´ eny. Legyenek (Ω1 , A1 , µ1 ) , (Ω2 , A2 , µ2 ) , . . . , (Ωn , An , µn ) v´eges m´ert´ekterek, akkor a H0 = A 1 × A 2 × . . . × A n f´elgy˝ ur˝ un defini´alt addit´ıv ´es folytonos
µ (A1 × A2 × . . . × An ) = µ1 (A1 ) · µ2 (A2 ) · . . . · µn (An ) Ai ∈ Ai
i = 1, 2, . . . n
halmazf¨ uggv´eny egy´ertelm˝ uen kiterjeszthet˝o az A = σ (H0 ) σ-algebr´ara, mint az ugyancsak µ-vel jel¨olt un. szorzatm´ert´ek, mellyel (Ω, A, µ) egy v´eges illetve σ-v´eges m´ert´ekt´er, ahol Ω = Ω1 × Ω2 × . . . × Ωn . Ezt a fenti m´ert´ekterek szorzat´anak nevezz¨ uk, ´es (Ω, A, µ) = (Ω1 , A1 , µ1 ) × (Ω2 , A2 , µ2 ) × . . . × (Ωn , An , µn ) jel¨ol´est haszn´aljuk. A.6. K¨ ovetkezm´ eny. A kor´abbi (A.4) kiterjeszt´ese Bn -re az un. Lebesgue m´ert´ek, mely egyben az (R, B, m) m´ert´ekt´er n-t´enyez˝os szorzat m´ert´ektere, ahol m jel¨oli az egydimenzi´os Lebesgue m´ert´eket. A.7. K¨ ovetkezm´ eny. Ha mf az (A.5) szerinti halmazf¨ uggv´eny In -en, akkor mf egy´ertelm˝ uen meghat´aroz egy v´eges vagy σ-v´eges m´ert´eket Bn -en. K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
¨ ´ MERT ´ EK ´ ES ´ INTEGRAL ´ A. FUGGEL EK.
214
A.2.
M´ erhet˝ o f¨ uggv´ eny
A.8. Defin´ıci´ o. Legyen (Ω, A) m´erhet˝o t´er, az f : Ω → Rnb f¨ uggv´enyt Borel-m´erhet˝onek, vagy egyszer˝ uen m´erhet˝onek nevezz¨ uk az (Ω, A) m´erhet˝o t´erre vonatkoz´oan, ha f −1 (B) ∈ A B ∈ Bn .
Egy h : Rq → Rn f¨ uggv´enyt az (Rq , Bq ) m´erhet˝o t´erre vonatkoz´oan nevez¨ unk m´erhet˝onek. ´ ıt´ All´ asok (Borel-m´ erhet˝ o f¨ uggv´ enyek strukt´ ur´ aja):
1. Vektor ´ert´ek˝ u f¨ uggv´eny pontosan akkor m´erhet˝o, ha komponensf¨ uggv´enyei m´erhet˝ok. n
2. Legyen (Ω, A) m´erhet˝o t´er, az f : Ω → Rn egy f¨ ugv´eny ´es H ⊂ 2R , akkor σ f −1 (H) = f −1 (σ (H)) , amib˝ol k¨ovetkezik, hogy f pontosan akkor m´erhet˝o, ha f −1 (I) ∈ A I ∈ In . Teh´at egy h : Rq → Rq folytonos f¨ uggv´eny m´erhet˝o. 3. Legyen (Ω, A) m´erhet˝o t´er, az f : Ω → Rn m´erhet˝o f¨ uggv´enyek halmaz´at jel¨olje M. Ekkor M vektorh´al´o, mely z´art a pontonk´enti hat´ar´ert´ekre, azaz ha c ∈ R, f, g ∈ M, akkor c · f, f + g, min {f, g} , max {f, g} , |f | ∈ M tov´abb´a fn ∈ M n = 1, 2, . . . ´es limn→∞ fn = f : Ω → Rn eset´en f ∈ M.
4. Legyen (Ω, A) m´erhet˝o t´er, az A ∈ A halmaz 1 ha $ ∈ A 1A ($) = 0 ha $ ∈ /A
indik´atora m´erhet˝o, amib˝ol k¨ovetkezik, hogy xk ∈ Rn eset´en r X f= xk · 1 A k
Ak ∈ A k = 1, 2, . . . r
k=1
szint´en m´erhet˝o f¨ uggv´eny.
5. Legyen (Ω, A) m´erhet˝o t´er, az f : Ω → Rn v´eges
im(f ) = {x1 , x2 , . . . , xr } ⊂ Rn
´ert´ekk´eszlet˝ u f¨ uggv´eny pontosan akkor m´erhet˝o, ha {f = xk } = f −1 ({xk }) ∈ A k = 1, 2, . . . r . Ekkor az f=
r X k=1
xk · 1{f =xk }
m´erhet˝o f¨ uggv´enyt egyszer˝ u nek nevezz¨ uk.
(A.8)
´ A.3. INTEGRAL
215
6. Legyen (Ω, A) m´erhet˝o t´er, f : Ω → R+ ıv m´erhet˝o f¨ uggv´eny, akkor 0 nemnegat´ megadhat´o nemnegat´ıv egyszer˝ u f¨ uggv´enyek Ω-n konvergens monoton n¨ovekv˝o (f n )∞ n=1 sorozata, hogy f = lim fn . n→∞
7. Legyen (Ω, A) m´erhet˝o t´er, az f : Ω → Rn ´es h : Rn → R m´erhet˝o f¨ uggv´enyek, akkor h◦f :Ω→R m´erhet˝o f¨ uggv´eny. A.9. Megjegyz´ es (Gener´ alt m´ ert´ ekt´ er). Legyen (Ω, A, µ) egy m´ert´ekt´er, ´es f : Ω → n n R m´erhet˝o f¨ uggv´eny, akkor R , Bn , µf m´ert´ekt´er, ahol a µf (B) = µ f −1 (B))
B ∈ Bn .
A.10. Megjegyz´ es (Gener´ alt m´ erhet˝ o t´ er). Legyen (Ω, A) egy m´erhet˝o t´er, ´es f : n Ω → R m´erhet˝o f¨ uggv´eny, akkor (Ω, Af ) m´erhet˝o t´er, ahol Af = f −1 (Bn ) = σ f −1 (In ) ⊂ A .
A.3.
Integr´ al
A.11. Defin´ıci´ o. Legyen (Ω, A, µ) egy m´ert´ekt´er, ´es M a skal´ar ´ert´ek˝ u m´erhet˝o f¨ uggv´enyek halmaza, ´ertelmezz¨ uk az I ∈ M →Rb (integr´al-) f¨ uggv´enyt a k¨ovetkez˝ok szerint: i) ha f ∈ M nemnegat´ıv egyszer˝ u f¨ uggv´eny, legyen I(f ) =
X
x∈im(f )
x · µ ({f = x}) ;
ii) ha f ∈ M nemnegat´ıv m´erhet˝o f¨ uggv´eny, ´es (fn )∞ u f¨ ugv´enyek monoton n=1 egyszer˝ n¨ovekv˝o sorozata, melyre limn→∞ fn = f , akkor legyen I(f ) = lim I(fn ) ; n→∞
iii) ha f ∈ M m´erhet˝o f¨ uggv´eny, ´es f + = max{0; f } f − = max{0; −f } eset´en I(f + ) ´es − I(f ) k¨oz¨ ul legal´abb az egyik v´eges, akkor legyen I(f ) = I(f + ) − I(f − ) ; A.12. Megjegyz´ es. K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
¨ ´ MERT ´ EK ´ ES ´ INTEGRAL ´ A. FUGGEL EK.
216
1. A fenti defin´ıci´oval egy´ertelm˝ uen defini´alt az integr´alnak nevezett f¨ uggv´eny, jel˝ol´ese Z Z I(f ) = f dµ = f ($)dµ($) , Ω
Ω
´ertelmez´esi tartom´anya pedig LΩ (µ) = dom(I) , vagy egyszer˝ uen L. 2. Ha A ∈ A, az 1A indik´ator integr´alja Z 1A dµ = µ(A) . Ω
3. Ha E ∈ A egy m´erhet˝o halmaz, ´es f ∈ M egy m´erhet˝o f¨ uggv´eny, akkor az (E, AE , µE ) m´ert´ekt´erre n´ezve f|E egy m´erhet˝o f¨ uggv´eny, melynek integr´alj´at jel¨olje: Z f dµ , E
ahol AE = {A ∩ E | A ∈ A} ,
µE (B) = µ(B) B ∈ AE .
4. Ha az I(f ) integr´al v´eges, f -et integr´alhat´onak nevezz¨ uk, ´es jel¨olje L1Ω (µ) = {f ∈ LΩ (µ) | I(f ) 6= +∞, −∞} , vagy egyszer˝ uen L1 . A tov´abbiakban mind´ıg az (Ω, A, µ) m´ert´ekt´eren ´ertelmezett skal´ar ´ert´ek˝ u m´erhet˝o f¨ uggv´enyeket vizsg´alunk, ha nem jelezz¨ uk az ett˝ol val´o elt´er´est. Az integr´ al tulajdons´ agai: 1. Legyen f ≥ 0, akkor I(f ) ≥ 0, ´es I(f ) = 0 pontosan akkor teljes˝ ul, ha µ(f 6= 0) = 0 . 2. Legyen f ∈ L ´es c ∈ R, akkor c · f ∈ L ´es I(c · f ) = c · I(f ) . 3. Legyenek f, g ∈ L1 , akkor f + g ∈ L1 ´es I(f + g) = I(f ) + I(g) .
´ A.3. INTEGRAL
217
4. Legyenek f ≤ g ∈ L1 , akkor I(f ) ≤ I(g), ´es I(f ) = I(g) pontosan akkor, ha µ(f 6= g) = 0 . 5. Legyen f ∈ L, akkor |f | ∈ L ´es |I(f )| ≤ I (|f |) . 6. Legyenek f1 ≤ f2 ≤ . . . ≤ fn ≤ . . . ∈ L ´es f1 ∈ L1 , akkor limn→∞ fn = f ∈ L ´es lim I(fn ) = I(f ) .
n→∞
7. Legyen az (fn )∞ esz Ω halmazon, ´es g ∈ L1 olyan, hogy n=1 sorozat konvergens az eg´ |fn | ≤ g, akkor limn→∞ fn = f ∈ L1 ´es lim I(fn ) = I(f ) .
n→∞
K¨ ovetkezm´ eny: Legyen az f : Ω × Rp → R f¨ uggv´eny f (·, x) parci´alis f¨ uggv´enye m´erhet˝o minden x ∈ Rp eset´en, ´es az f (ω, ·) parci´alis f¨ uggv´eny folytonos az a ∈ Rp pontban majdnem minden ω ∈ Ω eset´en. Ha van egy olyan h ∈ L1 f¨ uggv´eny, ´es az a pont olyan K ⊂ Rp k¨ornyezete, mellyel |f (ω, x)| ≤ h(ω) ω ∈ Ω x ∈ K, akkor lim I (f (·, x)) = I (f (·, a)) .
x→a
(A.9)
Megjegyz´ es: A k¨ovetkezm´eny szerint, ha az integrandusnak van (a param´etert˝ol nem f¨ ugg˝o) integr´alhat´o major´ansa, akkor a param´eter szerinti hat´ar´ert´ek k´epz´es ´es az integr´al´as sorrendje felcser´elhet˝o. Kisz´ am´ıt´ asi formul´ ak: 1. A Lebesgue m´ ert´ ek szerinti integr´ al kisz´ am´ıt´ asa Riemann integr´ allal. Legyen a m´ert´ekt´er (Rn , Bn , mn ) , f : Rn → R egy m´erhet˝o f¨ uggv´eny, ´es E ∈ Bn . Ha az f f¨ uggv´eny Riemann-integr´alhat´o az E halmazon, vagy |f | impropriusan integr´alhat´o az E-n, akkor f ∈ L1E (mn ) ´es Z Z I(f ) = · · · f (x)dx . E
2. Abszolut folytonos m´ ert´ ek szerinti integr´ al. Ha a m´ert´ekt´er (Rn , Bn , mf ) ahol mf az (A.5)-szerint meghat´arozott m´ert´ek, ´es h : Rn → R m´erhet˝o, akkor h ∈ L1 (mf ) ⇔ h · f ∈ L1 (mn ) ´es ekkor Z Z hdmf = h · f dmn . Rn
Rn
K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
¨ ´ MERT ´ EK ´ ES ´ INTEGRAL ´ A. FUGGEL EK.
218
¨ 3. Osszetett f¨ uggv´ eny integr´ alj´ anak kisz´ am´ıt´ asa a bels˝ o f¨ uggv´ eny ´ altal gener´ alt m´ ert´ ekt´ erben. Legyen (Ω, A, µ) egy m´ert´ekt´er, f : Ω → Rn ´es h : Rn → R m´erhet˝o f¨ uggv´enyek, akkor h ◦ f ∈ L1Ω (µ) ⇔ h ∈ L1Rn (µf ) ´es ekkor Z Z h ◦ f dµ = hdµf . Rn
Ω
4. Integr´ al kisz´ am´ıt´ asa a szorzat m´ ert´ ekt´ erben ism´ etelt integr´ al´ assal. Legyenek (Ω1 , A1 , µ1 ) , (Ω2 , A2 , µ2 ) v´eges illetve σ-v´eges m´ert´ekterek, f : Ω1 ×Ω2 → R+ erhet˝o a szorzat m´ert´ekt´erben, ´es jel¨olje µ = µ1 × µ2 szorzatm´ert´eket, akkor 0 m´ Z Z f1 (ω) = f (ω, ·)dµ2 ´es f2 (ω) = f (·, ω)dµ1 Ω2
Ω1
m´erhet˝o f¨ uggv´enyek, ´es ZZ
Ω1 ×Ω2
f dµ =
Z
f1 dµ1 =
Ω1
Z
f2 dµ2 .
Ω2
N´ egyzetesen integr´ alhat´ o f¨ uggv´ enyek Hilbert tere: Jel¨olje a n´egyzetesen integr´alhat´o m´erhet˝o f¨ uggv´enyek halmaz´at L2 = f ∈ L | f 2 ∈ L 1 ,
akkor min´ıg teljes¨ ul
f, g ∈ L2 ⇒ f · g ∈ L1 , ez´ert bevezethetj¨ uk a k¨ovetkez˝o ”majdnem” skal´aris szorzatot < f, g >= I(f · g). Ez teljes´ıti a szok´asos tulajdons´agokat egyetlen kiv´etellel, nevezetesen < f, f >= 0 ⇔ µ(f 6= 0) = 0 teljes¨ ul. Ez´ert ebb˝ol csak egy kf k =< f, f > un. f´elnorma sz´armaztathat´o, mely pontosan akkor z´erus, ha f = 0 teljes¨ ul µ-majdem minden¨ utt. Ha nem tesz¨ unk k¨ ul¨onbs´eget a µ-majdem minden¨ utt egyenl˝o f¨ uggv´enyek k¨oz¨ott, egy skal´aris szorzattal ell´atott line´aris teret kapunk, amely teljes.
B. F¨ uggel´ ek T´ abl´ azatok Kolmogorov-f´ele K-f¨uggv´eny
P z 0.4 0.5 0.6 0.7 0.8 0.9 1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9
.00 .003 .036 .136 .289 .456 .607 .730 .822 .888 .932 .960 .978 .988 .994 .997 .999
.01 .004 .043 .149 .305 .472 .621 .741 .830 .893 .935 .962 .979 .989 .994 .997 .999
√
n · sup F n (x) − F (x) < z x∈R
.02 .005 .050 .163 .322 .488 .634 .751 .837 .898 .939 .965 .980 .989 .995 .997 .999
ξ
.03 .007 .059 .178 .339 .504 .647 .761 .845 .903 .942 .967 .981 .990 .995 .998 .999
.04 .010 .068 .193 .356 .519 .660 .770 .851 .908 .945 .968 .983 .991 .995 .998 .999
219
.05 .013 .077 .208 .373 .535 .673 .780 .858 .912 .948 .970 .984 .991 .996 .998 .999
= K(z)
.06 .016 .088 .224 .390 .550 .685 .789 .864 .916 .951 .972 .985 .992 .996 .998 .999
.07 .020 .099 .240 .406 .565 .696 .798 .871 .921 .953 .973 .986 .992 .996 .998 .999
.08 .025 .110 .256 .423 .579 .708 .806 .877 .925 .956 .975 .986 .993 .996 .998 .999
.09 .030 .123 .272 .440 .593 .719 .814 .882 .928 .958 .976 .987 .993 .997 .998 .999
¨ ´ TABL ´ AZATOK ´ B. FUGGEL EK.
220
Norm´alis eloszl´as eloszl´asf¨uggv´enye x .0 .1 .2 .3 .4 .5 .6 .7 .8 .9 1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2.0 2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9 3.0 3.1 3.2 3.3 3.4 3.5 3.6 3.7 3.8
.00 .5000 .5398 .5793 .6179 .6554 .6915 .7257 .7580 .7881 .8159 .8413 .8643 .8849 .9032 .9192 .9332 .9452 .9554 .9641 .9713 .9772 .9821 .9861 .9893 .9918 .9938 .9953 .9965 .9974 .9981 .9987 .9990 .9993 .9995 .9997 .9998 .9998 .9999 .9999
.01 .5040 .5438 .5832 .6217 .6591 .6950 .7291 .7611 .7910 .8186 .8438 .8665 .8869 .9049 .9207 .9345 .9463 .9564 .9649 .9719 .9778 .9826 .9864 .9896 .9920 .9940 .9955 .9966 .9975 .9982 .9987 .9991 .9993 .9995 .9997 .9998 .9998 .9999 .9999
P (ξ < x) = Φ(x) .02 .03 .04 .5080 .5120 .5160 .5478 .5517 .5557 .5871 .5910 .5948 .6255 .6293 .6331 .6628 .6664 .6700 .6985 .7019 .7054 .7324 .7357 .7389 .7642 .7673 .7704 .7939 .7967 .7995 .8212 .8238 .8264 .8461 .8485 .8508 .8686 .8708 .8729 .8888 .8907 .8925 .9066 .9082 .9099 .9222 .9236 .9251 .9357 .9370 .9382 .9474 .9484 .9495 .9573 .9582 .9591 .9656 .9664 .9671 .9726 .9732 .9738 .9783 .9788 .9793 .9830 .9834 .9838 .9868 .9871 .9875 .9898 .9901 .9904 .9922 .9925 .9927 .9941 .9943 .9945 .9956 .9957 .9959 .9967 .9968 .9969 .9976 .9977 .9977 .9982 .9983 .9984 .9987 .9988 .9988 .9991 .9991 .9992 .9994 .9994 .9994 .9995 .9996 .9996 .9997 .9997 .9997 .9998 .9998 .9998 .9999 .9999 .9999 .9999 .9999 .9999 .9999 .9999 .9999
ξ ∈ N (0; 1) .05 .06 .5199 .5239 .5596 .5636 .5987 .6026 .6368 .6406 .6736 .6772 .7088 .7123 .7422 .7454 .7734 .7764 .8023 .8051 .8289 .8315 .8531 .8554 .8749 .8770 .8944 .8962 .9115 .9131 .9265 .9279 .9394 .9406 .9505 .9515 .9599 .9608 .9678 .9686 .9744 .9750 .9798 .9803 .9842 .9846 .9878 .9881 .9906 .9909 .9929 .9931 .9946 .9948 .9960 .9961 .9970 .9971 .9978 .9979 .9984 .9985 .9989 .9989 .9992 .9992 .9994 .9994 .9996 .9996 .9997 .9997 .9998 .9998 .9999 .9999 .9999 .9999 .9999 .9999
.07 .5279 .5675 .6064 .6443 .6808 .7157 .7486 .7794 .8078 .8340 .8577 .8790 .8980 .9147 .9292 .9418 .9525 .9616 .9693 .9756 .9808 .9850 .9884 .9911 .9932 .9949 .9962 .9972 .9979 .9985 .9989 .9992 .9995 .9996 .9997 .9998 .9999 .9999 .9999
.08 .5319 .5714 .6103 .6480 .6844 .7190 .7517 .7823 .8106 .8365 .8599 .8810 .8997 .9162 .9306 .9429 .9535 .9625 .9699 .9761 .9812 .9854 .9887 .9913 .9934 .9951 .9963 .9973 .9980 .9986 .9990 .9993 .9995 .9996 .9997 .9998 .9999 .9999 .9999
.09 .5359 .5753 .6141 .6517 .6879 .7224 .7549 .7852 .8133 .8389 .8621 .8830 .9015 .9177 .9319 .9441 .9545 .9633 .9706 .9767 .9817 .9857 .9890 .9916 .9936 .9952 .9964 .9974 .9981 .9986 .9990 .9993 .9995 .9997 .9998 .9998 .9999 .9999 .9999
221
T-eloszl´as kritikus ´ert´ekei P (|t| > tα ) = α t ∈ Tn n
α
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 25 30 35 40 50 60 70 80 90 100 ∞
0.2 3.078 1.886 1.638 1.533 1.476 1.440 1.415 1.397 1.383 1.372 1.363 1.356 1.350 1.345 1.341 1.337 1.333 1.330 1.328 1.325 1.316 1.310 1.306 1.303 1.299 1.296 1.294 1.292 1.291 1.290 1.282
0.1 0.05 0.025 0.01 0.001 6.314 12.706 25.452 63.657 636.621 2.920 4.303 6.205 9.925 31.599 2.353 3.182 4.177 5.841 12.924 2.132 2.776 3.495 4.604 8.610 2.015 2.571 3.163 4.032 6.869 1.943 2.447 2.969 3.707 5.959 1.895 2.365 2.841 3.499 5.408 1.860 2.306 2.752 3.355 5.041 1.833 2.262 2.685 3.250 4.781 1.812 2.228 2.634 3.169 4.587 1.796 2.201 2.593 3.106 4.437 1.782 2.179 2.560 3.055 4.318 1.771 2.160 2.533 3.012 4.221 1.761 2.145 2.510 2.977 4.140 1.753 2.131 2.490 2.947 4.073 1.746 2.120 2.473 2.921 4.015 1.740 2.110 2.458 2.898 3.965 1.734 2.101 2.445 2.878 3.922 1.729 2.093 2.433 2.861 3.883 1.725 2.086 2.423 2.845 3.850 1.708 2.060 2.385 2.787 3.725 1.697 2.042 2.360 2.750 3.646 1.690 2.030 2.342 2.724 3.591 1.684 2.021 2.329 2.704 3.551 1.676 2.009 2.311 2.678 3.496 1.671 2.000 2.299 2.660 3.460 1.667 1.994 2.291 2.648 3.435 1.664 1.990 2.284 2.639 3.416 1.662 1.987 2.280 2.632 3.402 1.660 1.984 2.276 2.626 3.390 1.645 1.960 2.241 2.576 3.291
K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
¨ ´ TABL ´ AZATOK ´ B. FUGGEL EK.
222
χ2 -eloszl´as kritikus ´ert´ekei
n
α
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 25 30 35 40 50 60 70 80 90 100
0.999 .00 .00 .02 .09 .21 .38 .60 .86 1.15 1.48 1.83 2.21 2.62 3.04 3.48 3.94 4.42 4.90 5.41 5.92 8.65 11.59 14.69 17.92 24.67 31.74 39.04 46.52 54.16 61.92
0.99 .00 .02 .11 .30 .55 .87 1.24 1.65 2.09 2.56 3.05 3.57 4.11 4.66 5.23 5.81 6.41 7.01 7.63 8.26 11.52 14.95 18.51 22.16 29.71 37.48 45.44 53.54 61.75 70.06
0.975 .00 .05 .22 .48 .83 1.24 1.69 2.18 2.70 3.25 3.82 4.40 5.01 5.63 6.26 6.91 7.56 8.23 8.91 9.59 13.12 16.79 20.57 24.43 32.36 40.48 48.76 57.15 65.65 74.22
P χ2 > χ2α = α χ2 ∈ χ2n 0.95 .00 .10 .35 .71 1.15 1.64 2.17 2.73 3.33 3.94 4.57 5.23 5.89 6.57 7.26 7.96 8.67 9.39 10.12 10.85 14.61 18.49 22.47 26.51 34.76 43.19 51.74 60.39 69.13 77.93
0.90 0.10 0.05 0.025 0.01 0.001 .02 2.71 3.84 5.02 6.63 10.83 .21 4.61 5.99 7.38 9.21 13.82 .58 6.25 7.81 9.35 11.34 16.27 1.06 7.78 9.49 11.14 13.28 18.47 1.61 9.24 11.07 12.83 15.09 20.52 2.20 10.64 12.59 14.45 16.81 22.46 2.83 12.02 14.07 16.01 18.48 24.32 3.49 13.36 15.51 17.53 20.09 26.12 4.17 14.68 16.92 19.02 21.67 27.88 4.87 15.99 18.31 20.48 23.21 29.59 5.58 17.28 19.68 21.92 24.72 31.26 6.30 18.55 21.03 23.34 26.22 32.91 7.04 19.81 22.36 24.74 27.69 34.53 7.79 21.06 23.68 26.12 29.14 36.12 8.55 22.31 25.00 27.49 30.58 37.70 9.31 23.54 26.30 28.85 32.00 39.25 10.09 24.77 27.59 30.19 33.41 40.79 10.86 25.99 28.87 31.53 34.81 42.31 11.65 27.20 30.14 32.85 36.19 43.82 12.44 28.41 31.41 34.17 37.57 45.31 16.47 34.38 37.65 40.65 44.31 52.62 20.60 40.26 43.77 46.98 50.89 59.70 24.80 46.06 49.80 53.20 57.34 66.62 29.05 51.81 55.76 59.34 63.69 73.40 37.69 63.17 67.50 71.42 76.15 86.66 46.46 74.40 79.08 83.30 88.38 99.61 55.33 85.53 90.53 95.02 100.43 112.32 64.28 96.58 101.88 106.63 112.33 124.84 73.29 107.57 113.15 118.14 124.12 137.21 82.36 118.50 124.34 129.56 135.81 149.45
223
F -eloszl´ as
kritikus ´ert´ekei
P (f > f0.1 ) = 0.1 f ∈ F(n1 ;n2 )
n2
n1
1 2 3 4 5 6 7 8 9 10 12 15 20 25 30 35 40 60 120 ∞
1 2 3 4 5 6 7 8 9 10 39.86 49.50 53.59 55.83 57.24 58.20 58.91 59.44 59.86 60.19 8.53 9.00 9.16 9.24 9.29 9.33 9.35 9.37 9.38 9.39 5.54 5.46 5.39 5.34 5.31 5.28 5.27 5.25 5.24 5.23 4.54 4.32 4.19 4.11 4.05 4.01 3.98 3.95 3.94 3.92 4.06 3.78 3.62 3.52 3.45 3.40 3.37 3.34 3.32 3.30 3.78 3.46 3.29 3.18 3.11 3.05 3.01 2.98 2.96 2.94 3.59 3.26 3.07 2.96 2.88 2.83 2.78 2.75 2.72 2.70 3.46 3.11 2.92 2.81 2.73 2.67 2.62 2.59 2.56 2.54 3.36 3.01 2.81 2.69 2.61 2.55 2.51 2.47 2.44 2.42 3.29 2.92 2.73 2.61 2.52 2.46 2.41 2.38 2.35 2.32 3.18 2.81 2.61 2.48 2.39 2.33 2.28 2.24 2.21 2.19 3.07 2.70 2.49 2.36 2.27 2.21 2.16 2.12 2.09 2.06 2.97 2.59 2.38 2.25 2.16 2.09 2.04 2.00 1.96 1.94 2.92 2.53 2.32 2.18 2.09 2.02 1.97 1.93 1.89 1.87 2.88 2.49 2.28 2.14 2.05 1.98 1.93 1.88 1.85 1.82 2.85 2.46 2.25 2.11 2.02 1.95 1.90 1.85 1.82 1.79 2.84 2.44 2.23 2.09 2.00 1.93 1.87 1.83 1.79 1.76 2.79 2.39 2.18 2.04 1.95 1.87 1.82 1.77 1.74 1.71 2.75 2.35 2.13 1.99 1.90 1.82 1.77 1.72 1.68 1.65 2.71 2.30 2.08 1.94 1.85 1.77 1.72 1.67 1.63 1.60
K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
¨ ´ TABL ´ AZATOK ´ B. FUGGEL EK.
224
F -eloszl´ as
kritikus ´ert´ekei
P (f > f0.1 ) = 0.1 f ∈ F(n1 ;n2 )
n2
n1
1 2 3 4 5 6 7 8 9 10 12 15 20 25 30 35 40 60 120 ∞
12 15 20 25 30 35 40 60 120 ∞ 60.71 61.22 61.74 62.05 62.26 62.42 62.53 62.79 63.06 63.33 9.41 9.42 9.44 9.45 9.46 9.46 9.47 9.47 9.48 9.49 5.22 5.20 5.18 5.17 5.17 5.16 5.16 5.15 5.14 5.13 3.90 3.87 3.84 3.83 3.82 3.81 3.80 3.79 3.78 3.76 3.27 3.24 3.21 3.19 3.17 3.16 3.16 3.14 3.12 3.11 2.90 2.87 2.84 2.81 2.80 2.79 2.78 2.76 2.74 2.72 2.67 2.63 2.59 2.57 2.56 2.54 2.54 2.51 2.49 2.47 2.50 2.46 2.42 2.40 2.38 2.37 2.36 2.34 2.32 2.29 2.38 2.34 2.30 2.27 2.25 2.24 2.23 2.21 2.18 2.16 2.28 2.24 2.20 2.17 2.16 2.14 2.13 2.11 2.08 2.06 2.15 2.10 2.06 2.03 2.01 2.00 1.99 1.96 1.93 1.90 2.02 1.97 1.92 1.89 1.87 1.86 1.85 1.82 1.79 1.76 1.89 1.84 1.79 1.76 1.74 1.72 1.71 1.68 1.64 1.61 1.82 1.77 1.72 1.68 1.66 1.64 1.63 1.59 1.56 1.52 1.77 1.72 1.67 1.63 1.61 1.59 1.57 1.54 1.50 1.46 1.74 1.69 1.63 1.60 1.57 1.55 1.53 1.50 1.46 1.41 1.71 1.66 1.61 1.57 1.54 1.52 1.51 1.47 1.42 1.38 1.66 1.60 1.54 1.50 1.48 1.45 1.44 1.40 1.35 1.29 1.60 1.55 1.48 1.44 1.41 1.39 1.37 1.32 1.26 1.19 1.55 1.49 1.42 1.38 1.34 1.32 1.30 1.24 1.17 1.00
225
F -eloszl´ as
kritikus ´ert´ekei
P (f > f0.05 ) = 0.05 f ∈ F(n1 ;n2 )
n2
n1
1 2 3 4 5 6 7 8 9 10 12 15 20 25 30 35 40 60 120 ∞
1 2 3 4 5 6 7 8 9 10 161.5 199.5 215.7 224.6 230.2 234.0 236.8 238.9 240.5 241.9 18.51 19.00 19.16 19.25 19.30 19.33 19.35 19.37 19.38 19.40 10.13 9.55 9.28 9.12 9.01 8.94 8.89 8.85 8.81 8.79 7.71 6.94 6.59 6.39 6.26 6.16 6.09 6.04 6.00 5.96 6.61 5.79 5.41 5.19 5.05 4.95 4.88 4.82 4.77 4.74 5.99 5.14 4.76 4.53 4.39 4.28 4.21 4.15 4.10 4.06 5.59 4.74 4.35 4.12 3.97 3.87 3.79 3.73 3.68 3.64 5.32 4.46 4.07 3.84 3.69 3.58 3.50 3.44 3.39 3.35 5.12 4.26 3.86 3.63 3.48 3.37 3.29 3.23 3.18 3.14 4.96 4.10 3.71 3.48 3.33 3.22 3.14 3.07 3.02 2.98 4.75 3.89 3.49 3.26 3.11 3.00 2.91 2.85 2.80 2.75 4.54 3.68 3.29 3.06 2.90 2.79 2.71 2.64 2.59 2.54 4.35 3.49 3.10 2.87 2.71 2.60 2.51 2.45 2.39 2.35 4.24 3.39 2.99 2.76 2.60 2.49 2.40 2.34 2.28 2.24 4.17 3.32 2.92 2.69 2.53 2.42 2.33 2.27 2.21 2.16 4.12 3.27 2.87 2.64 2.49 2.37 2.29 2.22 2.16 2.11 4.08 3.23 2.84 2.61 2.45 2.34 2.25 2.18 2.12 2.08 4.00 3.15 2.76 2.53 2.37 2.25 2.17 2.10 2.04 1.99 3.92 3.07 2.68 2.45 2.29 2.18 2.09 2.02 1.96 1.91 3.84 3.00 2.61 2.37 2.21 2.10 2.01 1.94 1.88 1.83
K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
¨ ´ TABL ´ AZATOK ´ B. FUGGEL EK.
226
F -eloszl´ as
kritikus ´ert´ekei
P (f > f0.05 ) = 0.05 f ∈ F(n1 ;n2 )
n2
n1
1 2 3 4 5 6 7 8 9 10 12 15 20 25 30 35 40 60 120 ∞
12 15 20 25 30 35 40 60 120 ∞ 243.9 246.0 248.0 249.3 250.1 250.7 251.1 252.2 253.3 254.7 19.41 19.43 19.45 19.46 19.46 19.47 19.47 19.48 19.49 19.50 8.74 8.70 8.66 8.63 8.62 8.60 8.59 8.57 8.55 8.53 5.91 5.86 5.80 5.77 5.75 5.73 5.72 5.69 5.66 5.63 4.68 4.62 4.56 4.52 4.50 4.48 4.46 4.43 4.40 4.37 4.00 3.94 3.87 3.83 3.81 3.79 3.77 3.74 3.70 3.67 3.57 3.51 3.44 3.40 3.38 3.36 3.34 3.30 3.27 3.23 3.28 3.22 3.15 3.11 3.08 3.06 3.04 3.01 2.97 2.93 3.07 3.01 2.94 2.89 2.86 2.84 2.83 2.79 2.75 2.71 2.91 2.85 2.77 2.73 2.70 2.68 2.66 2.62 2.58 2.54 2.69 2.62 2.54 2.50 2.47 2.44 2.43 2.38 2.34 2.30 2.48 2.40 2.33 2.28 2.25 2.22 2.20 2.16 2.11 2.07 2.28 2.20 2.12 2.07 2.04 2.01 1.99 1.95 1.90 1.84 2.16 2.09 2.01 1.96 1.92 1.89 1.87 1.82 1.77 1.71 2.09 2.01 1.93 1.88 1.84 1.81 1.79 1.74 1.68 1.62 2.04 1.96 1.88 1.82 1.79 1.76 1.74 1.68 1.62 1.56 2.00 1.92 1.84 1.78 1.74 1.72 1.69 1.64 1.58 1.51 1.92 1.84 1.75 1.69 1.65 1.62 1.59 1.53 1.47 1.39 1.83 1.75 1.66 1.60 1.55 1.52 1.50 1.43 1.35 1.25 1.75 1.67 1.57 1.51 1.46 1.42 1.39 1.32 1.22 1.00
227
F -eloszl´ as
kritikus ´ert´ekei
P (f > f0.025 ) = 0.025 f ∈ F(n1 ;n2 )
n2
n1
1 2 3 4 5 6 7 8 9 10 12 15 20 25 30 35 40 60 120 ∞
1 647.8 38.51 17.44 12.22 10.01 8.81 8.07 7.57 7.21 6.94 6.55 6.20 5.87 5.69 5.57 5.48 5.42 5.29 5.15 5.02
2 3 4 5 6 7 8 9 10 799.5 864.2 899.6 921.8 937.1 948.2 956.7 963.3 968.6 39.00 39.17 39.25 39.30 39.33 39.36 39.37 39.39 39.40 16.04 15.44 15.10 14.88 14.73 14.62 14.54 14.47 14.42 10.65 9.98 9.60 9.36 9.20 9.07 8.98 8.90 8.84 8.43 7.76 7.39 7.15 6.98 6.85 6.76 6.68 6.62 7.26 6.60 6.23 5.99 5.82 5.70 5.60 5.52 5.46 6.54 5.89 5.52 5.29 5.12 4.99 4.90 4.82 4.76 6.06 5.42 5.05 4.82 4.65 4.53 4.43 4.36 4.30 5.71 5.08 4.72 4.48 4.32 4.20 4.10 4.03 3.96 5.46 4.83 4.47 4.24 4.07 3.95 3.85 3.78 3.72 5.10 4.47 4.12 3.89 3.73 3.61 3.51 3.44 3.37 4.77 4.15 3.80 3.58 3.41 3.29 3.20 3.12 3.06 4.46 3.86 3.51 3.29 3.13 3.01 2.91 2.84 2.77 4.29 3.69 3.35 3.13 2.97 2.85 2.75 2.68 2.61 4.18 3.59 3.25 3.03 2.87 2.75 2.65 2.57 2.51 4.11 3.52 3.18 2.96 2.80 2.68 2.58 2.50 2.44 4.05 3.46 3.13 2.90 2.74 2.62 2.53 2.45 2.39 3.93 3.34 3.01 2.79 2.63 2.51 2.41 2.33 2.27 3.80 3.23 2.89 2.67 2.52 2.39 2.30 2.22 2.16 3.69 3.12 2.79 2.57 2.41 2.29 2.19 2.11 2.05
K´ezirat, m´ odos´ıtva: 2006. okt´ ober 24.
¨ ´ TABL ´ AZATOK ´ B. FUGGEL EK.
228
F -eloszl´ as
kritikus ´ert´ekei
P (f > f0.025 ) = 0.025 f ∈ F(n1 ;n2 )
n2
n1
1 2 3 4 5 6 7 8 9 10 12 15 20 25 30 35 40 60 120 ∞
12 15 20 25 30 35 40 60 120 ∞ 976.7 984.9 993.1 998.1 1001 1003 1006 1010 1014 1018 39.41 39.43 39.45 39.46 39.46 39.47 39.47 39.48 39.49 39.50 14.34 14.25 14.17 14.12 14.08 14.06 14.04 13.99 13.95 13.90 8.75 8.66 8.56 8.50 8.46 8.43 8.41 8.36 8.31 8.26 6.52 6.43 6.33 6.27 6.23 6.20 6.18 6.12 6.07 6.02 5.37 5.27 5.17 5.11 5.07 5.04 5.01 4.96 4.90 4.85 4.67 4.57 4.47 4.40 4.36 4.33 4.31 4.25 4.20 4.14 4.20 4.10 4.00 3.94 3.89 3.86 3.84 3.78 3.73 3.67 3.87 3.77 3.67 3.60 3.56 3.53 3.51 3.45 3.39 3.33 3.62 3.52 3.42 3.35 3.31 3.28 3.26 3.20 3.14 3.08 3.28 3.18 3.07 3.01 2.96 2.93 2.91 2.85 2.79 2.73 2.96 2.86 2.76 2.69 2.64 2.61 2.59 2.52 2.46 2.40 2.68 2.57 2.46 2.40 2.35 2.31 2.29 2.22 2.16 2.09 2.51 2.41 2.30 2.23 2.18 2.15 2.12 2.05 1.98 1.91 2.41 2.31 2.20 2.12 2.07 2.04 2.01 1.94 1.87 1.79 2.34 2.23 2.12 2.05 2.00 1.96 1.93 1.86 1.79 1.70 2.29 2.18 2.07 1.99 1.94 1.90 1.88 1.80 1.72 1.64 2.17 2.06 1.94 1.87 1.82 1.78 1.74 1.67 1.58 1.48 2.05 1.94 1.82 1.75 1.69 1.65 1.61 1.53 1.43 1.31 1.94 1.83 1.71 1.63 1.57 1.52 1.48 1.39 1.27 1.00
C. F¨ uggel´ ek K´ epletek 1. Val´osz´ın˝ us´eg becsl´ese (a) Visszatev´eses mintav´etel p ∼ pˆ =
ν n
1 p 1 p D (ˆ p) = √ p · (1 − p) ∼ √ pˆ · (1 − pˆ) n n
(b) Visszatev´es n´elk¨ uli mintav´etel
p= 1 D (ˆ p) = √ n
s
ν M ∼ pˆ = N n
n−1 p · (1 − p) · 1 − N −1
1 ∼√ n
s
n−1 pˆ · (1 − pˆ) 1 − N −1
2. V´arhat´o ´ert´ek ´es sz´or´as becsl´ese (a) Visszatev´eses, f¨ uggetlen mintav´etel 1 Pn m ∼ ¯ξ = ξ σ ∼ s∗ = n i=1 ı
r
1 Pn ¯ 2 i=1 ξ ı − ξ n−1
σ s∗ D ¯ξ = √ ∼ √ n n
(b) Visszatev´es n´elk¨ uli mintav´etel v´eges sokas´agb´ol r 1 Pn 1 Pn ∗ ¯ ¯ξ 2 m∼ξ= ξ σ ∼ s = ξ − n i=1 ı n − 1 i=1 ı r r ∗ s σ n − 1 n−1 ∼ √ · 1− D ¯ξ = √ · 1 − N −1 N −1 n n 229
¨ ´ KEPLETEK ´ C. FUGGEL EK.
230 3. Konfidencia intervallumok s∗ m ∼ ¯ξ ± tα · √ n
r
1 1 + n k r σ 1 1 0 m ∼ ¯ξ ± uα · √ η¯ ∼ ¯ξ ± uα · σ 0 · + n n k ! n − 1 n − 1 σ 2 ∼ s∗2 · 2 ; s∗2 · 2 χα χ1− α η¯ ∼ ¯ξ ± tα · s∗ ·
2
2
4. Pr´ob´ak (a) Param´eterek pr´ob´ai (n − 1) · s∗2 s∗2 ∈ χ2n−1 H0 : σ 1 = σ 2 ⇒ s1∗2 ∈ F(n1−1 ;n2 −1) 2 2 σ0 ¯ξ − m0 √ ¯ξ − m0 √ H0 : m = m 0 ⇒ t = · · n ∈ N (0; 1) n ∈ T u = n−1 s∗ σ r ¯ξ − η¯ n1 n2 · ∈ Tn1 +n2 −2 H0 : m 1 = m 2 ⇒ t = S n1 + n 2 r ∗2 (n1 − 1)s∗2 1 + (n2 − 1)s2 ahol σ ∼ S = n1 + n 2 − 2 (b) Az u-pr´oba er˝of¨ uggv´enye √ m0 − m √ m0 − m E = 1−Φ n· + uα + Φ n· − uα σ0 σ0 H0 : σ = σ 0 ⇒ χ 2 =
(c) Illeszked´esi pr´ob´ak r (ν − n · p )2 P i i0 ∈ χ2r−1 n · p i0 i=1 √ n · supx∈R Fξn (x) − F0 (x) < z = K(z) H0 : F = F 0 ⇒ P
H0 : pi = pi0 ⇒
(d) F¨ uggetlens´eg vizsg´alat
H0 : pij = pi. · p.j ⇒ n ·
r X s X i=1 j=1
ν i. · ν .j 2 n ∈ χ2(r−1)·(s−1) ν i. · ν .j
ν ij −
(e) Sz´or´asanal´ızis ¯ξ i. − ¯ξ .. 2 n − r n ı HA : a1 = a2 = . . . = ar = 0 ⇒ f = Pr i=1 ∈ F(r−1,n−r) · P nı ¯ξ 2 r − 1 ξ − ij i. j=1 i=1 2 Pr ¯ t · i=1 ξ i. − ¯ξ .. r(t − 1) ∈ F(r−1,rt−r) HA : σ A = 0 ⇒ f = P r P t 2 · r−1 ξ ij − ¯ξ i. Pr
i=1
j=1