Val´osz´ın˝us´egsz´am´ıt´as ´es Matematikai statisztika Dr. Kar´acsony Zsolt Miskolci Egyetem, Alkalmazott Matematikai Tansz´ ek
2013-2014 tan´ev 1. f´el´ev Miskolci Egyetem 2013. november 11 - 18 - 25.
Dr. Kar´ acsony Zsolt — Val´ osz´ın˝ us´ egsz´ am´ıt´ as ´ es Matematikai statisztika
1/62
Tartalom
1 10. el˝ oad´as 2 11. el˝ oad´as 3 12. el˝ oad´as
Dr. Kar´ acsony Zsolt — Val´ osz´ın˝ us´ egsz´ am´ıt´ as ´ es Matematikai statisztika
2/62
Tartalom
1 10. el˝ oad´as 2 11. el˝ oad´as 3 12. el˝ oad´as
Dr. Kar´ acsony Zsolt — Val´ osz´ın˝ us´ egsz´ am´ıt´ as ´ es Matematikai statisztika
3/62
10. el˝oad´as Statisztika
Alapfeladat ”K¨ovetkeztet´es tapasztalati adatokb´ ol esem´enyek ismeretlen val´osz´ın˝ us´eg´ere vagy val´ osz´ın˝ us´egi v´altoz´ ok ismeretlen eloszl´asf¨ uggv´eny´ere ´es ezek param´etereire.” (Vincze, 1975)
Dr. Kar´ acsony Zsolt — Val´ osz´ın˝ us´ egsz´ am´ıt´ as ´ es Matematikai statisztika
4/62
10. el˝oad´as Minta, mintav´etel
Bevezet´es A val´osz´ın˝ us´eg-sz´am´ıt´as t´argyal´asa sor´an felt´etelezt¨ uk, hogy a h´att´erben egy (Ω, A, P) val´ osz´ın˝ us´egi mez˝ o ´all, az X vagy ξ val´osz´ın˝ us´egi v´altoz´o Ω-n ´ertelmezett, X eloszl´asf¨ uggv´enye F ´es F ismert. A statisztikai megfigyel´eseket ´eppen az´ert v´egezz¨ uk, hogy az F eloszl´asf¨ uggv´enyt megismerj¨ uk. Defin´ıci´o Legyen Θ egy nem¨ ures halmaz, minden θ ∈ Θ legyen (Ω, A, Pθ ) val´osz´ın˝ us´egi mez˝o. Az (Ω, A, Pθ ), θ ∈ Θ ¨ osszes´eget statisztikai mint´anak nevezz¨ uk. Θ-t param´etert´ernek, elemeit pedig param´etereknek nevezz¨ uk.
Dr. Kar´ acsony Zsolt — Val´ osz´ın˝ us´ egsz´ am´ıt´ as ´ es Matematikai statisztika
5/62
10. el˝oad´as Minta, mintav´etel
Defin´ıci´o Az X1 , X2 , . . . , Xn f¨ uggetlen, azonos eloszl´as´ u val´ osz´ın˝ us´egi v´altoz´okat mint´anak nevezz¨ uk. R¨ ogz´ıtett ω ∈ Ω eset´en az x1 = X1 (ω), x2 = X2 (ω), . . . , xn = Xn (ω) sz´am n-est minta realiz´aci´oj´anak nevezz¨ uk. Emp´ırikus eloszl´asf¨ uggv´eny Pr´ob´aljuk meg rekonstru´alni a minta alapj´an az F eloszl´asf¨ uggv´enyt! Defin´ıci´o Legyen ω ∈ Ω r¨ogz´ıtett, jel¨ olje X1∗ (ω) ≤ X2∗ (ω) ≤ . . . ≤ Xn∗ (ω) az X1 (ω), X2 (ω), . . . , Xn (ω) minta realiz´aci´ o elemeinek nagys´ag szerint n¨ovekv˝o permut´aci´ oja. Az X1∗ ≤ X2∗ ≤ . . . ≤ Xn∗ val´osz´ın˝ us´egi v´altoz´okat rendezett mint´anak nevezz¨ uk. Dr. Kar´ acsony Zsolt — Val´ osz´ın˝ us´ egsz´ am´ıt´ as ´ es Matematikai statisztika
6/62
10. el˝oad´as Emp´ırikus eloszl´asf¨ uggv´eny
Defin´ıci´o Legyen X1∗ , X2∗ , . . . , Xn∗ rendezett minta. Az ∗ 0, ha x ≤ X1 , k ∗ ∗ Fn∗ (x) = n , ha Xk ≤ x ≤ Xk+1 , k = 1, 2, . . . , n − 1 1, ha x > Xn∗ . f¨ uggv´enyt emp´ırikus eloszl´asf¨ uggv´enynek nevezz¨ uk.
Dr. Kar´ acsony Zsolt — Val´ osz´ın˝ us´ egsz´ am´ıt´ as ´ es Matematikai statisztika
7/62
10. el˝oad´as Emp´ırikus eloszl´asf¨ uggv´enynekk
T´etel R¨ogz´ıtett x ∈ R eset´en az al´abbiak teljes¨ ulnek: a.) nFn∗ (x) binomi´alis eloszl´as´ u; b.) Fn∗ (x) v´arhat´o ´ert´eke F (x); c.) Fn∗ (x) sz´or´asa 0-hoz tart, ha n → ∞; d.) Fn∗ (x) → F (x) sztochasztikusan, ha n → ∞. T´etel B´armely r¨ogz´ıtett x ∈ R eset´en lim Fn∗ (x) = F (x) majdnem biztosan;
n→∞
lim Fn∗ (x + 0) = F (x + 0) majdnem biztosan.
n→∞
Dr. Kar´ acsony Zsolt — Val´ osz´ın˝ us´ egsz´ am´ıt´ as ´ es Matematikai statisztika
8/62
10. el˝oad´as A matematikai statisztika alapt´etele
Glivenko-t´etele Ha az X1 , X2 , . . . , Xn f¨ uggetlen minta, akkor sup |Fn∗ (x) − F (x)| → 0,
x∈R
ha n → ∞ teljes¨ ul 1 val´ osz´ın˝ us´eggel.
Dr. Kar´ acsony Zsolt — Val´ osz´ın˝ us´ egsz´ am´ıt´ as ´ es Matematikai statisztika
9/62
10. el˝oad´as Statisztik´ak
Sokf´ele statisztika haszn´alatos, ki kell emelni ezek k¨oz¨ ul is a hisztogramokat. Tekints¨ unk egy X1 , X2 , . . . , Xn mint´at! Osszuk fel a sz´amegyenest y0 < y1 < . . . < yr oszt´ opontokkal. Tegy¨ uk fel, hogy minden mintaelem beleesik az (y0 , yr ) intervallumba. Jel¨ olje νi az [yi−1 , yi ) intervallumba es˝o elemek sz´am´at. (i = 1, 2, . . . , r ) Rajzoljunk az [yi−1 , yi ) intervallum fel´e νi -vel ar´anyos ter¨ ulet˝ u t´eglalapot.(i = 1, 2, . . . , r ) ´Igy megkapjuk a hisztogramot. Ha a t´eglalapok ¨osszter¨ ulete n, akkor a gyakoris´ agi-hisztogramhoz jutunk. Ha a t´eglalapok ¨oszter¨ ulete 1, akkor a s˝ ur˝ us´ eg-hisztogramhoz jutunk.
Dr. Kar´ acsony Zsolt — Val´ osz´ın˝ us´ egsz´ am´ıt´ as ´ es Matematikai statisztika
10/62
10. el˝oad´as Statisztik´ak
Defin´ıci´o A gyakoris´agi-hisztogram az az fn val´ os f¨ uggv´eny, melyre ( νi yi −yi−1 , ha x ∈ [yi−1 , yi ], i = 1, 2, . . . , n fn (x) = 0, ha x ∈ / [y0 , yr ].
Megjegyz´es S˝ ur˝ us´eg-hisztogram eset´en az i-dik t´eglalap magass´aga: νi . n(yi − yi−1 )
Dr. Kar´ acsony Zsolt — Val´ osz´ın˝ us´ egsz´ am´ıt´ as ´ es Matematikai statisztika
11/62
10. el˝oad´as Statisztik´ak
Defin´ıci´o Legyen x1 , x2 , . . . , xn minta X -re. Az X =
1 (x1 + x2 + . . . + xn ) n
val´osz´ın˝ us´egi v´altoz´ot emp´ırikus k¨ oz´epnek nevezz¨ uk. Defin´ıci´o Legyen x1 , x2 , . . . , xn minta X -re. Az n
sn2
1X = (xi − X )2 n i=1
mennyis´eget emp´ırikus sz´ or´asn´egyzetnek nevezz¨ uk. Dr. Kar´ acsony Zsolt — Val´ osz´ın˝ us´ egsz´ am´ıt´ as ´ es Matematikai statisztika
12/62
10. el˝oad´as Statisztik´ak
Defin´ıci´o Legyen x1 , x2 , . . . , xn minta X -re. Az n
sn∗2 =
1 X (xi − X )2 n−1 i=1
mennyis´eget korrig´alt emp´ırikus sz´ or´asn´egyzetnek nevezz¨ uk. Megjegyz´es Az emp´ırikus sz´or´asn´egyzet seg´ıts´eg´evel k¨ ovetkeztethet¨ unk az X ismeretlen sz´or´asn´egyzet´ere.
Dr. Kar´ acsony Zsolt — Val´ osz´ın˝ us´ egsz´ am´ıt´ as ´ es Matematikai statisztika
13/62
10. el˝oad´as Steiner-formula
T´etel (Steiner-formula) Tetsz˝oleges a ∈ R eset´en nsn2 =
n X
(xi − a)2 − n(X − a)2 .
i=1
Bizony´ıt´as nsn2 n X i=1
n X
n X = [(xi − a) − (X − a)]2 = i=1
(xi − a)2 − 2
n n X X (xi − a)(X − a) + (X − a)2 = i=1
i=1
(xi − a)2 − n(X − a)2 .
i=1 Dr. Kar´ acsony Zsolt — Val´ osz´ın˝ us´ egsz´ am´ıt´ as ´ es Matematikai statisztika
14/62
10. el˝oad´as Steiner-formula
Megjegyz´es Sz´amolhatjuk ki az sn∗2 v´arhat´ o ´ert´ek´et, ha a Steiner formul´aba a = m-et ´ırunk. T´etel Legyen E (X ) = m, D 2 (X ) = σ 2 . Ekkor E (sn∗2 ) = σ 2 . Bizony´ıt´as # n 1 X n 2 2 =E (xi − m) − (X − m) = n−1 n−1 i=1 n 1 X n E (xi − m)2 − E (X − m)2 . n−1 n−1 "
E (sn∗2 )
i=1
Dr. Kar´ acsony Zsolt — Val´ osz´ın˝ us´ egsz´ am´ıt´ as ´ es Matematikai statisztika
15/62
10. el˝oad´as Steiner-formula
Bizony´ıt´as Mivel E (xi − m)2 = σ 2 , illetve n −nm 2 = E (X − m)2 = E x1 +...+x n E (sn∗2 ) =
1 nσ 2 , n2
ez´ert
n σ2 n σ2 − = σ2, n−1 n−1 n
teh´at a korrig´alt emp´ırikus sz´ or´asn´egyzet v´arhat´ o ´ert´eke ´eppen az elm´eleti sz´or´asn´egyzet.
Dr. Kar´ acsony Zsolt — Val´ osz´ın˝ us´ egsz´ am´ıt´ as ´ es Matematikai statisztika
16/62
10. el˝oad´as Statisztik´ak
Defin´ıci´o Legyen x1 , x2 , . . . , xn minta X -re. A k-dik tapasztalati momentum n 1X k alatt a k¨ovetkez˝o kifejez´est ´ertj¨ uk: xi . n i=1
Defin´ıci´o Legyen x1 , x2 , . . . , xn minta X -re. A minta terjedelme alatt a xn∗ − x1∗ mennyis´eget ´ertj¨ uk. Defin´ıci´o Legyen x1 , x2 , . . . , xn minta X -re. A sz´ or´asi egy¨ utthat´o alatt a mennyis´eget ´ertj¨ uk.
Dr. Kar´ acsony Zsolt — Val´ osz´ın˝ us´ egsz´ am´ıt´ as ´ es Matematikai statisztika
sn X
17/62
10. el˝oad´as Statisztik´ak
Defin´ıci´o Legyen x1 , x2 , . . . , xn minta X -re. A minta medi´anja alatt a ( ∗ xm+1 , ha n = 2m + 1, med(x) = ∗ +x ∗ xm m+1 , ha n = 2m 2 mennyis´eget ´ertj¨ uk. Defin´ıci´o Legyen x1 , x2 , . . . , xn minta X -re. A minta medi´an abszol´ ut elt´er´ese alatt a MAD(x) = med(|xi − med(x)|) mennyis´eget ´ertj¨ uk. Dr. Kar´ acsony Zsolt — Val´ osz´ın˝ us´ egsz´ am´ıt´ as ´ es Matematikai statisztika
18/62
10. el˝oad´as Kvantilis
Defin´ıci´o Adott az F eloszl´asf¨ uggv´eny ´es a p val´ osz´ın˝ us´eg. Az xp p-kvantilis, ha p = F (xp ). Ha p = 0.5, akkor medi´annak, m´eg p = 0.25 ´es 0.75 eset´en als´o illetve fels˝o kvartilisnek nevezz¨ uk. Egy sokas´ag p tapasztalati kvartilise xp = (1 − q)xA∗ + qxB∗ , A = [np]; B = [np] + 1; q = {np}.
P´elda Ha p = 0.21, n = 40, akkor xp = (1 − 0.4)x8∗ + 0.4x9∗ .
Dr. Kar´ acsony Zsolt — Val´ osz´ın˝ us´ egsz´ am´ıt´ as ´ es Matematikai statisztika
19/62
10. el˝oad´as Becsl´esi m´ odszerek
Bevezet´es A becsl´eselm´eletben gyakran felt´etelezz¨ uk, hogy a megfigyelt mennyis´egek f¨ uggetlen val´ osz´ın˝ us´egi v´altoz´ ok, k¨ oz¨ os Fθ0 eloszl´assal, amely egy meghat´arozott {Fθ |θ ∈ Θ} eloszl´ashalmazba tartozik. Θ ´altal´aban Rk egy r´eszhalmaza. Megpr´ob´aljuk θ0 ´ert´ek´et a megfigyel´esek alapj´an meghat´arozni. Legyen adott az X1 , X2 , . . . , Xn minta, melynek s˝ ur˝ us´egf¨ uggv´enye f ´es ez a Θ param´etert˝ol f¨ ugg. Teh´at adott a {f (., θ)|θ ∈ Θ ⊂ Rk }.
Dr. Kar´ acsony Zsolt — Val´ osz´ın˝ us´ egsz´ am´ıt´ as ´ es Matematikai statisztika
20/62
10. el˝oad´as Becsl´esi m´ odszerek
Defin´ıci´o Pontbecsl´esnek nevezz¨ uk a mintaelemek m´erhet˝ o f¨ uggv´eny´et, ahol a becsl´es ´es a param´eter koordin´at´ainak a sz´ama megegyezik, azaz cn (X1 , X2 , . . . , Xn ) ∈ Θ. Θ Defin´ıci´o Intervallumbecsl´esnek nevezz¨ uk a Γ tartom´anyt 1 − α megb´ızhat´os´agi szinttel, ha Γ ∈ Θ ´es P(θ ∈ Γ) = 1 − α.
Dr. Kar´ acsony Zsolt — Val´ osz´ın˝ us´ egsz´ am´ıt´ as ´ es Matematikai statisztika
21/62
10. el˝oad´as Pontbecsl´es
Defin´ıci´o Legyen adott az x1 , x2 , . . . , xn minta f (x1 , x2 , . . . , xn ; Θ) s˝ ur˝ us´egf¨ uggv´ennyel. c cn ) a Θ param´eter torz´ıtatlan A Θn (x1 , x2 , . . . , xn ) (r¨ oviden Θ cn ) = Θ. becsl´ese, ha E (Θ cn a Θ param´eter aszimptotikusan torz´ıtatlan becsl´ese, ha Θ cn ) = Θ. lim E (Θ
n→∞
Megjegyz´es Az ´atlag a v´arhat´o ´ert´ek torz´ıtatlan becsl´ese. A korrig´alt tapasztalati sz´ or´asn´egyzet torz´ıtatlan becsl´ese a sz´or´asn´egyzetnek. Dr. Kar´ acsony Zsolt — Val´ osz´ın˝ us´ egsz´ am´ıt´ as ´ es Matematikai statisztika
22/62
10. el˝oad´as Pontbecsl´es
Defin´ıci´o cn ´es a Θ fn torz´ıtatlan becsl´es. A Θ cn hat´asosabb a Θ fn Adott a Θ 2 2 c f becsl´esn´el, ha D (Θn ) ≤ D (Θn ). Defin´ıci´o cn (x1 , x2, . . . , xn ) sorozat konzisztens becsl´essorozata a Θ AΘ param´eterre, ha cn − Θ| > ε = 0, lim P |Θ
n→∞
minden ε > 0 eset´en. cn (x1 , x2, . . . , xn ) sorozat er˝ AΘ osen konzisztens becsl´essorozata a Θ param´eterre, ha ∀n eset´en cn ) = Θ, ´es lim D 2 (Θ cn ) = 0. E (Θ n→∞
Dr. Kar´ acsony Zsolt — Val´ osz´ın˝ us´ egsz´ am´ıt´ as ´ es Matematikai statisztika
23/62
10. el˝oad´as Likelihood-becsl´es
Defin´ıci´o Tekints¨ unk egy X -re adott x1 , x2 , . . . , xn mint´at. Az L(x1 , x2 , . . . , xn ; θ) =
n Y
f (xi , θ)
i=1
f¨ uggv´enyt az x1 , x2 , . . . , xn mint´ahoz tartoz´ o likelihood-f¨ uggv´enynek nevezz¨ uk. Defin´ıci´o b statisztik´at a Θ param´eter maximum likelihood-becsl´es´enek AΘ b glob´alis maximumhelye a likelihood-f¨ nevezz¨ uk, ha Θ uggv´enynek, azaz b 1 , x2 , . . . , xn )) ≥ L(x1 , x2 , . . . , xn , θ) L(x1 , x2 , . . . , xn ; Θ(x
minden θ ∈ Θ eset´en. Dr. Kar´ acsony Zsolt — Val´ osz´ın˝ us´ egsz´ am´ıt´ as ´ es Matematikai statisztika
24/62
10. el˝oad´as Likelihood-becsl´es
P´elda: λ param´eter˝ u Poisson-eloszl´as Legyen adott az x1 , x2 , . . . , xn minta. Az ´altal´anos´ıtott s˝ ur˝ us´egf¨ uggv´enyhez haszn´aljuk az λk −λ f (k, λ) = e . k! n n X X logL(x1 , x2 , . . . , xn ; λ) = log λ · xi − logxi ! − nλ, ennek kell i=1
i=1
meghat´arozni a maximum´at. n
1X A sz´am´ıt´asok elv´egz´ese ut´an kapjuk, hogy xi − n = 0, λ i=1 cn = x. M´eg ellen˝ ahonnan λ orizni kell, hogy ∂2 logL(x1 , x2 , . . . , xn , λ) ∂xi2
= − λ12
Pn
i=1 xi
Dr. Kar´ acsony Zsolt — Val´ osz´ın˝ us´ egsz´ am´ıt´ as ´ es Matematikai statisztika
< 0.
25/62
10. el˝oad´as Likelihood-becsl´es
P´elda: λ param´eter˝ u exponenci´alis-eloszl´as f (x, λ) = λe −λx logL(x1 , x2 , . . . , xn , λ) = nlog λ − λ
n X
xi
i=1 n
n X b = 1. − xi = 0 ⇒ λ λ x i=1
Dr. Kar´ acsony Zsolt — Val´ osz´ın˝ us´ egsz´ am´ıt´ as ´ es Matematikai statisztika
26/62
10. el˝oad´as Momentumok m´ odszere
Ha egy val´osz´ın˝ us´egi v´altoz´ onak l´etezik a v´arhat´ o ´ert´eke, akkor a nagy sz´amok t¨orv´enye alapj´an, ha x1 , x2 , . . . f¨ uggetlen, vele azonos eloszl´as´ u val´osz´ın˝ us´egi v´altoz´ ok sorozata, akkor a r´eszlet¨osszegek ´atlaga tart a v´arhat´o ´ert´ekhez. Tov´abb´a tudjuk, hogy ha ´altal´aban nem is, de el´eg gyenge felt´etelek mellett a momentumok x k +x k +...+xnk meghat´arozz´ak az eloszl´ast. µk = E (x k ) ´es mk = 1 2 n ´es µ k = mk .
Dr. Kar´ acsony Zsolt — Val´ osz´ın˝ us´ egsz´ am´ıt´ as ´ es Matematikai statisztika
27/62
K¨osz¨on¨om a figyelmet!
Dr. Kar´ acsony Zsolt — Val´ osz´ın˝ us´ egsz´ am´ıt´ as ´ es Matematikai statisztika
28/62
Tartalom
1 10. el˝ oad´as 2 11. el˝ oad´as 3 12. el˝ oad´as
Dr. Kar´ acsony Zsolt — Val´ osz´ın˝ us´ egsz´ am´ıt´ as ´ es Matematikai statisztika
29/62
11. el˝oad´as Intervallum becsl´es
Bevezet´es Az eddigiek sor´an arra t¨ orekedt¨ unk, hogy megfigyel´eseink alapj´an egyetlen ´ert´ekkel becs¨ ulj¨ uk az ismeretlen param´etert. Ebben a szakaszban a feladat megadni egy Γ ⊂ Θ tartom´anyt, amelyre P(θ ∈ Γ) = 1 − α. Defin´ıci´o Legyen a Θ ∈ R, az x1 , x2 , . . . , xn minta. A cn (x1 , x2 , . . . , xn ) ≤ Θ ≤ Θ fn (x1 , x2 , . . . , xn ) Θ 1 − α megb´ızhat´os´ag´ u konfidencia intervallum a Θ param´eterre, ha cn ≤ Θ ≤ Θ fn ) = 1 − α. PΘ (Θ
Dr. Kar´ acsony Zsolt — Val´ osz´ın˝ us´ egsz´ am´ıt´ as ´ es Matematikai statisztika
30/62
11. el˝oad´as Intervallum becsl´es
1. Tekints¨ unk egy x1 , x2 , . . . , xn mint´at az m ismeretlen v´ arhat´ o ´ ert´ ek˝ u ´es σ 2 ismert sz´ or´asn´egyzet˝ u norm´alis eloszl´asra. (X ∼ N (m, σ 2 )) √
Tudjuk, hogy X ∼ N (m, σn ), ´ıgy n(Xσ−m) standard norm´alis eloszl´as´ u. Ez´ert egy adott 1 − ε megb´ızhat´ os´agi szinthez v´alasszunk √olyan u ∈ R-t, hogy Pm (−u ≤ n(Xσ−m) ≤ u) = 1 − ε, Φ(u) = 1 − 2ε , ahonnan Pm (X − u ε2 √σn < m < X + u ε2 √σn ) = 1 − ε. Teh´at az m-re kapott 1 − ε megb´ızhat´os´agi szint˝ u konfidencia intervallum: σ σ X − u ε2 √ ; X + u ε2 √ n n 2
Dr. Kar´ acsony Zsolt — Val´ osz´ın˝ us´ egsz´ am´ıt´ as ´ es Matematikai statisztika
31/62
11. el˝oad´as Intervallum becsl´es
2. Szerkessz¨ unk konfidencia intervallumot a σ 2 sz´ or´ asn´ egyzetre, ha az m v´arhat´o ´ert´ek ismert. Felhaszn´aljuk, hogy n X (xi − m)2 σ2 i=1
statisztika χ2 eloszl´as´ u n szabads´agi fokkal, ´ıgy n 1 X
χ2ε
i=1
n 1 X (xi − m) ; 2 (xi − m)2 χε 2
! .
i=1
Dr. Kar´ acsony Zsolt — Val´ osz´ın˝ us´ egsz´ am´ıt´ as ´ es Matematikai statisztika
32/62
11. el˝oad´as Intervallum becsl´es
3. Adjunk meg konfidencia intervallumot m-re, ha σ 2 is ismeretlen! Mivel √ n(X − m) sn∗ t-eloszl´as´ u n − 1 szabads´agi fokkal, ´ıgy √ n(X − m) P(−t ε2 < < t ε2 ) = 1 − ε, sn∗ ahonnan a konfidencia intervallum: sn∗ sn∗ X − t ε2 √ ; X + t ε2 √ n n
Dr. Kar´ acsony Zsolt — Val´ osz´ın˝ us´ egsz´ am´ıt´ as ´ es Matematikai statisztika
33/62
11. el˝oad´as Intervallum becsl´es
4. Szerkessz¨ unk konfidencia intervallumot egy A esem´eny ismeretlen P(A) = p val´ osz´ın˝ us´ eg´ ere az A esem´enyre v´egzett n sz´am´ u f¨ uggetlen k´ıs´erlet alapj´an. A Csebisev-egyenl˝ otlens´egb˝ol kapjuk, hogy ! r P
X − p < ε
p(1 − p) n
valamint felhaszn´alva, hogy p(1 − p) ≤ P
>1− 1 4
1 , ε2
kapjuk, hogy
r ! X − p < ε 1 > 1 − 1 . 4n ε2
´Igy a kapott intervallum
1 1 X − ε √ ;X + ε √ 2 n 2 n
Dr. Kar´ acsony Zsolt — Val´ osz´ın˝ us´ egsz´ am´ıt´ as ´ es Matematikai statisztika
34/62
11. el˝oad´as Hipot´ezisvizsg´alat
Defin´ıci´o A vizsg´aland´o felt´etelez´est nullhipot´ezisnek nevezz¨ uk (jele: H0 ), ezzel ellent´etes ´all´ıt´as az alternat´ıv hipot´ezis (jele: H1 ). Defin´ıci´o Azt az elj´ar´ast, amelynek sor´an a minta seg´ıts´eg´evel d¨ont¨ unk a hipot´ezisr˝ol, statisztikai pr´ ob´anak nevezz¨ uk. Ha az eloszl´as jellege ismert ´es a nullhipot´ezis¨ unk az eloszl´as valamely param´eter´ere vonatkozik, akkor param´eteres pr´ob´ar´ol besz´el¨ unk.
Dr. Kar´ acsony Zsolt — Val´ osz´ın˝ us´ egsz´ am´ıt´ as ´ es Matematikai statisztika
35/62
11. el˝oad´as Hipot´ezisvizsg´alat
Defin´ıci´o Ha Θ0 egy pontb´ol ´all´ o halmaz, a nullhipot´ezis egyszer˝ u, ellenkedz˝o esetben ¨osszetett. Defin´ıci´o A H0 : Θ = Θ0 nullhipot´ezis ´es H1 : Θ > Θ0 (H1 : Θ < Θ0 ) ellenhipot´ezis eset´en egyoldali nullhipot´ ezisr˝ ol illetve egyoldali pr´ ob´ ar´ ol besz´el¨ unk. A H0 : Θ = Θ0 nullhipot´ezis ´es H1 : Θ 6= Θ0 alak´ u hipot´ezis eset´en k´ etoldali pr´ ob´ ar´ ol besz´el¨ unk.
Dr. Kar´ acsony Zsolt — Val´ osz´ın˝ us´ egsz´ am´ıt´ as ´ es Matematikai statisztika
36/62
11. el˝oad´as Hipot´ezisvizsg´alat
Defin´ıci´o Bontsuk fel a teret C0 ´es C1 diszjunkt halmazokra. Ha a minta x1 , x2 , . . . , xn realiz´aci´oja a C0 halmaz eleme, akkor elfogadjuk a nullhipot´ezist, ha x1 , x2 , . . . , xn a C1 eleme, akkor H1 alternat´ıv hipot´ezist fogadjuk el. Defin´ıci´o A C0 halmazt elfogad´asi tartom´anynak, a C1 halmazt kritikus tartom´anynak nevezz¨ uk. Defin´ıci´o A Pθ (C1 ) ≤ α, θ ∈ Θ0 realiz´aci´ ot teljes´ıt˝ o α sz´amot a pr´oba terjedelm´enek (kritikus tartom´any) nevezz¨ uk.
Dr. Kar´ acsony Zsolt — Val´ osz´ın˝ us´ egsz´ am´ıt´ as ´ es Matematikai statisztika
37/62
11. el˝oad´as Hipot´ezisvizsg´alat
Defin´ıci´o Ha adott C1 tartom´any eset´en elfogadjuk vagy elvetj¨ uk a hipot´ezist a param´eterre vagy az F alakj´ara, akkor azt statisztikai pr´ob´anak nevezz¨ uk. Defin´ıci´o Egy pr´ob´at α-szint˝ unek nevez¨ unk, ha P((x1 , x2 , . . . , xn ) ∈ C1 |H0 ) ≤ α.
Dr. Kar´ acsony Zsolt — Val´ osz´ın˝ us´ egsz´ am´ıt´ as ´ es Matematikai statisztika
38/62
11. el˝oad´as Hipot´ezisvizsg´alat
Defin´ıci´o Ha H0 igaz ´es ennek ellen´ere elvetj¨ uk, akkor azt mondjuk, hogy els˝ofaj´ u hib´at k¨ovet¨ unk el. Megjegyz´es Az els˝ofaj´ u hiba elk¨ovet´es´enek val´ osz´ın˝ us´ege P((x1 , x2 , . . . , xn ) ∈ C1 |H0 ) = α. Teh´at a pr´oba szintj´evel egy¨ utt az els˝ ofaj´ u hiba elk¨ovet´es´enek a val´osz´ın˝ us´eg´et is r¨ogz´ıtj¨ uk. Defin´ıci´o Ha a H1 hipot´ezis az igaz ´es m´egis elfogadjuk H0 -t, akkor azt mondjuk, hogy m´asodfaj´ u hib´at k¨ ovet¨ unk el. Dr. Kar´ acsony Zsolt — Val´ osz´ın˝ us´ egsz´ am´ıt´ as ´ es Matematikai statisztika
39/62
11. el˝oad´as Hipot´ezisvizsg´alat
Defin´ıci´o Jel¨olje H0 azt, hogy Θ a val´ odi param´eter. R¨ ogz´ıtett C1 kritikus tartom´any eset´en a γ(Hθ ) = P((x1 , x2 , . . . , xn ) ∈ C1 |H0 ), θ ∈ Θ val´osz´ın˝ us´eget a pr´oba er˝ of¨ uggv´eny´enek nevezz¨ uk.
Dr. Kar´ acsony Zsolt — Val´ osz´ın˝ us´ egsz´ am´ıt´ as ´ es Matematikai statisztika
40/62
11. el˝oad´as Pr´ ob´ak
U-pr´oba (1 mint´as eset) Az U-pr´oba seg´ıts´eg´evel ismert sz´ or´as´ u, norm´alis eloszl´as´ u val´osz´ın˝ us´egi v´altoz´o v´arhat´ o ´ert´ek´ere vonatkoz´ o hipot´ezisr˝ol d¨onthet¨ unk. E (X ) = m ismeretlen D(X ) = σ0 ismert param´eter. Hipot´ezis: H0 : E (X ) = m0 H1 : E (X ) = m1 6= m0 .
Dr. Kar´ acsony Zsolt — Val´ osz´ın˝ us´ egsz´ am´ıt´ as ´ es Matematikai statisztika
41/62
11. el˝oad´as Pr´ ob´ak
U-pr´oba (1 mint´as eset) Ha a nullhipot´ezis¨ unk igaz, akkor a pr´ obastatisztika U=
X − m0 √ n σ0
standard norm´alis eloszl´as´ u val´ osz´ın˝ us´egi v´altoz´ o. Ha teh´at igaz a nullhipot´ezis, akkor az U statisztika konkr´et ´ert´eke 1 − α val´osz´ın˝ us´eggel (−u α2 , u α2 ) intervallumba esik.
Dr. Kar´ acsony Zsolt — Val´ osz´ın˝ us´ egsz´ am´ıt´ as ´ es Matematikai statisztika
42/62
11. el˝oad´as Pr´ ob´ak
U-pr´oba (1 mint´as eset) ´Igy az elfogad´asi tartom´any: X − m0 √ α C0 = (x1 , x2 , . . . , xn ) : n < u 2 σ0 Kritikus tartom´any: X − m0 √ α C1 = (x1 , x2 , . . . , xn ) : n ≥ u 2 σ0
Dr. Kar´ acsony Zsolt — Val´ osz´ın˝ us´ egsz´ am´ıt´ as ´ es Matematikai statisztika
43/62
11. el˝oad´as Pr´ ob´ak
U-pr´oba (2 mint´as eset) K´et f¨ uggetlen, ismert sz´ or´as´ u, norm´alis eloszl´as´ u val´osz´ın˝ us´egi v´altoz´o v´arhat´o ´ert´ekeinek azonoss´ag´ar´ ol d¨ onthet¨ unk. (X ∼ N (m1 , σ12 ); Y ∼ N (m2 , σ22 ); n1 illetve n2 elem˝ u mint´at tekintve.) Hipot´ezis: H0 : m1 = m2 ; H1 := m1 6= m2 . U-pr´obastatisztika: X −Y . U=q 2 σ1 σ22 + n1 n2
Dr. Kar´ acsony Zsolt — Val´ osz´ın˝ us´ egsz´ am´ıt´ as ´ es Matematikai statisztika
44/62
11. el˝oad´as Pr´ ob´ak
t-pr´oba (1 mint´as eset) Legyen X ∼ N (m, σ 2 ), ahol m ´es σ 2 is ismeretlenek. Tekints¨ unk egy x1 , x2 , . . . , xn n elem˝ u mint´at. A hipot´ezis¨ unk a v´arhat´o ´ert´ekre vonatkozik: H 0 : m = m0 ; H1 := m 6= m0 . X −m √
n val´ osz´ın˝ us´egi v´altoz´ o (n − 1) Ismert, hogy az s ∗ n szabads´agfok´ u t- eloszl´as´ u.
Dr. Kar´ acsony Zsolt — Val´ osz´ın˝ us´ egsz´ am´ıt´ as ´ es Matematikai statisztika
45/62
11. el˝oad´as Pr´ ob´ak
t-pr´oba (1 mint´as eset) √ Teh´at, ha a nullhipot´ezis igaz, akkor a t = X s−m n ∗ n pr´obastatisztika (n − 1) param´eter˝ u t eloszl´as´ u. A kritikus tartom´any: n α o C1 = (x1 , x2 , . . . , xn ) : |t| ≥ tn−1 2 Az elfogad´asi tartom´any: n α o C0 = (x1 , x2 , . . . , xn ) : |t| < tn−1 2
Dr. Kar´ acsony Zsolt — Val´ osz´ın˝ us´ egsz´ am´ıt´ as ´ es Matematikai statisztika
46/62
11. el˝oad´as Pr´ ob´ak
t-pr´oba (2 mint´as eset) Legyen X ´es Y f¨ uggetlen, norm´alis eloszl´as´ u val´ osz´ın˝ us´egi v´altoz´o. (E (x) = m1 ; D(X ) = σ1 ; E (Y ) = m2 ; D(Y ) = σ2 ahol m1 , m2 , σ1 , σ2 ismeretlenek.) Az X val´ osz´ın˝ us´egi v´altoz´o n1 , m´eg az Y n2 elem˝ u egym´ast´ ol f¨ uggetlen mint´ak. A hipot´ezis a v´arhat´o ´ert´ekek azonoss´ag´ara vonatkozik: H0 : m1 = m2 ; H1 := m1 6= m2 . A pr´oba szintje 1 − α.
Dr. Kar´ acsony Zsolt — Val´ osz´ın˝ us´ egsz´ am´ıt´ as ´ es Matematikai statisztika
47/62
11. el˝oad´as Pr´ ob´ak
t-pr´oba (2 mint´as eset) A nullhipot´ezisr˝ol fenn´al, hogy X −Y
t=q (n1 − 1)sn∗21 + (n2 − 1)sn∗22
s
n1 n2 (n1 + n2 − 2) n1 + n2
statisztika n1 + n2 − 2 param´eter˝ u t-eloszl´as´ u. A n α o C1 = (x1 , x2 , . . . , xn1 , y1 , y2 , . . . , yn2 ) : |t| ≥ tn1 +n2 −2 2
Dr. Kar´ acsony Zsolt — Val´ osz´ın˝ us´ egsz´ am´ıt´ as ´ es Matematikai statisztika
48/62
11. el˝oad´as Pr´ ob´ak
F-pr´oba K´et f¨ uggetlen, norm´alis eloszl´as´ u val´ osz´ın˝ us´egi v´altoz´o sz´or´asainak egyenl˝os´eg´et ellen˝orzi az F -pr´ oba. X ∼ N (m1 , σ12 ), n1 elem˝ u minta; Y ∼ N (m2 , σ22 ), n2 elem˝ u minta; A pr´oba szintje: 1 − α. H0 : σ12 = σ22 ; H1 := σ12 6= σ22 .
Dr. Kar´ acsony Zsolt — Val´ osz´ın˝ us´ egsz´ am´ıt´ as ´ es Matematikai statisztika
49/62
11. el˝oad´as Pr´ ob´ak
F-pr´oba Felhaszn´alva, hogy
n1 −1 ∗2 s σ12 1
´es
n2 −1 ∗2 s σ22 2
χ2 eloszl´as´ uak (n1 − 1)
illetve (n2 − 1) param´eterekkel ´es f¨ uggetlenek, kapjuk, hogy a nullhipot´ezisre fenn´all az F =
s1∗2 s2∗2
pr´obastatisztika F -eloszl´as´ u (n1 − 1, n2 − 1) param´eterekkel.
Dr. Kar´ acsony Zsolt — Val´ osz´ın˝ us´ egsz´ am´ıt´ as ´ es Matematikai statisztika
50/62
11. el˝oad´as Pr´ ob´ak
χ2 -pr´oba A χ2 -pr´oba seg´ıts´eg´evel norm´alis eloszl´as´ u val´ osz´ın˝ us´egi v´altoz´ok ismeretlen sz´or´asn´egyzet´er˝ ol d¨ onthet¨ unk. Legyen X ∼ N (m, σ 2 ) eloszl´as´ u, ahol m ´es σ is ismeretlen param´eterek. A hipot´ezis: H0 : σ = σ0 ; H1 := σ 6= σ0 . A pr´oba szintje: 1 − α.
Dr. Kar´ acsony Zsolt — Val´ osz´ın˝ us´ egsz´ am´ıt´ as ´ es Matematikai statisztika
51/62
11. el˝oad´as Pr´ ob´ak
χ2 -pr´oba Tudjuk, hogy
(n−1)s ∗2 σ2
χ2 -eloszl´as´ u (n − 1) param´eterrel. Ha a
nullhipot´ezis igaz, akkor h =
(n−1)s ∗2 σ2
pr´ obastatisztika χ2 eloszl´as´ u.
Dr. Kar´ acsony Zsolt — Val´ osz´ın˝ us´ egsz´ am´ıt´ as ´ es Matematikai statisztika
52/62
K¨osz¨on¨om a figyelmet!
Dr. Kar´ acsony Zsolt — Val´ osz´ın˝ us´ egsz´ am´ıt´ as ´ es Matematikai statisztika
53/62
Tartalom
1 10. el˝ oad´as 2 11. el˝ oad´as 3 12. el˝ oad´as
Dr. Kar´ acsony Zsolt — Val´ osz´ın˝ us´ egsz´ am´ıt´ as ´ es Matematikai statisztika
54/62
12. el˝oad´as Regresszi´ os egyenesek
Bevezt´es Adott 2 m´er´esi adatsor, amelyek alapj´an elk´esz´ıthet˝o a regresszi´os egyenes. Adott (x1 , y1 ), (x2 , y2 ), . . . , (xn , yn ). Keress¨ uk az y = bx + a egyenest, melyre Q(a, b) =
n X (yi − bxi − a)2 → min . i=1
Dr. Kar´ acsony Zsolt — Val´ osz´ın˝ us´ egsz´ am´ıt´ as ´ es Matematikai statisztika
55/62
12. el˝oad´as Regresszi´ os egyenesek
Vezess¨ uk be a k¨ovetkez˝ o jel¨ ol´eseket: Pn Pn xi yi X = i=1 ; Y = i=1 n n Qx =
n X
xi2
2
− nX ; Qy =
i=1
n X
yi2 − nY
2
i=1
Qxy =
n X
xi yi − nX Y .
i=1
Ekkor a regresszi´os egyenes egyenlete: b=
Qxy ; a = Y − bX . Qx
Dr. Kar´ acsony Zsolt — Val´ osz´ın˝ us´ egsz´ am´ıt´ as ´ es Matematikai statisztika
56/62
12. el˝oad´as Regresszi´ os egyenesek
´ anosan Altal´ y = b0 + b1 x1 + . . . + bn xn . Vezess¨ uk be a β > = (b0 , b1 , . . . , bn ) jel¨ ol´est. b A β becsl´es´et szeretn´enk meghat´arozni. Ez az X > X βb = X > y egyenletrendszer megold´as´aval ad´odik.
Dr. Kar´ acsony Zsolt — Val´ osz´ın˝ us´ egsz´ am´ıt´ as ´ es Matematikai statisztika
57/62
12. el˝oad´as Regresszi´ os egyenesek
Defin´ıci´o Az X > X βb = X > y egyenletrendszert norm´al-egyenletrendszernek nevezz¨ uk. Megjegyz´es X > X egy pozit´ıv definit m´atrix, ez´ert βb = (X > X )−1 X > y .
Dr. Kar´ acsony Zsolt — Val´ osz´ın˝ us´ egsz´ am´ıt´ as ´ es Matematikai statisztika
58/62
12. el˝oad´as Regresszi´ os egyenesek
P´elda Adottak a k¨ovetkez˝o (1,2); (2,4); (3,5); (4,8) pontok. Hat´arozzuk meg az y = a + bx alak´ u regresszi´ os egyenest! (Megold´as: y=0+1.9x) P´elda Tekints¨ uk a ξ val´osz´ın˝ us´egi v´altoz´ ot, melyr˝ ol tudjuk a k¨ovetkez˝oket: 1 → 38; 2 → 53; 3 → 61; 4 → 48. 95%-os szinten ellen˝orizz¨ uk, hogy a minta egyenletes eloszl´as´ u-e?
Dr. Kar´ acsony Zsolt — Val´ osz´ın˝ us´ egsz´ am´ıt´ as ´ es Matematikai statisztika
59/62
12. el˝oad´as Cramer-Rao egyenl˝ otlens´eg
T´etel Legyen az (Ω, A, Pθ ), θ ∈ Θ statisztikai mez˝ on a T statisztika g (θ) torz´ıtatlan becsl´ese, ahol g egy adott f¨ uggv´eny Θ-n ´es legyen E (T )2 lok´alisan korl´atos f¨ uggv´eny Θ-n. Ekkor g folytonosan differenci´alhat´o Θ-n, I (θ) 6= 0 minden θ ∈ Θ eset´en ´es D 2 (T ) ≥
(g 0 (θ))2 I (θ),
ahol I (θ) a Fisher-f´ele inform´aci´ omennyis´eg.
Dr. Kar´ acsony Zsolt — Val´ osz´ın˝ us´ egsz´ am´ıt´ as ´ es Matematikai statisztika
60/62
12. el˝oad´as Rao-Blackwell t´etel
Defin´ıci´o Legyen (Ω, A, Pθ ), θ ∈ Θ statisztikai mez˝ o. A T : Ω → Rk statisztik´at el´egs´egesnek nevezz¨ uk, ha a Pθ (A|T = t), A ∈ A, t ∈ Rk felt´eteles val´ osz´ın˝ us´egeknek megadhat´o θ-t´ol f¨ uggetlen k¨ oz¨ os ´ert´eke. Rao-Blackwell t´etel Legyen T el´egs´eges statisztika az (Ω, A, Pθ ) statisztikai mez˝on ´es legyen gb(θ) a g (θ) v´eges sz´ or´as´ u, torz´ıtatlan becsl´ese. Ekkor a h(t) = E (b g (θ)|T = t) f¨ uggv´enyre fenn´allnak az al´abbiak h csak t-t˝ol f¨ ugg ´es nem f¨ ugg θ-t´ ol; h(T ) torz´ıtatlan becsl´ese g (θ)-nak; D 2 (h(T )) ≤ D 2 (b g (θ)).
Dr. Kar´ acsony Zsolt — Val´ osz´ın˝ us´ egsz´ am´ıt´ as ´ es Matematikai statisztika
61/62
K¨osz¨on¨om a figyelmet!
Dr. Kar´ acsony Zsolt — Val´ osz´ın˝ us´ egsz´ am´ıt´ as ´ es Matematikai statisztika
62/62