Folytonos valószínűségi változók Értékkészletük a számegyenes egy folytonos (véges vagy végtelen) intervalluma. Valamennyi lehetséges érték 0 valószínűségű, pozitív valószínűségek csak értéktartományokhoz tartoznak. Az eloszlás nem írható le az értékek és valószínűségek felsorolásával, mint a diszkrét esetben, mivel az értékek halmaza nem megszámlálhatóan végtelen. A valószínűségeket a lehetséges értéktartományokhoz sűrűségfüggvénnyel vagy az eloszlásfüggvénnyel.
tudjuk
megadni
a
Sűrűségfüggvény: olyan függvény, amelynek függvénygörbe alatti területe (integrálja) bármely tartományon egyenlő a változónak ahhoz a tartományhoz tartozó valószínűségével: x2
A valószínűség tulajdonságaiból következik, hogy egy sűrűségfüggvény sehol sem negatív: f(x) ≥ 0, ∞
a teljes tartományon (-∞-től +∞-ig) az integrálja 1: ∫ f (x )dx = 1. −∞
Példa:
Az [a,b] intervallumon folytonos egyenletes eloszlású változó sűrűségfüggvénye 1 , ha a ≤ x ≤ b f (x ) = b − a 0 , egyébként. x2
x2
x1
x1
P(x1 < X < x 2 ) = ∫ f (x )dx = ∫
P(x1 < X < x 2 ) = ∫ f (x )dx x1
(x − x1 ) 1 dx = 2 . b−a b−a
(ha a≤x1≤x2≤b)
Az eloszlásfüggvény x-beli értéke a (–∞, valószínűség
x) végtelen intervallumhoz tartozó
F(x) = P(X < x) Ebből következik, hogy bármely x1, x2 érték-párra
P(x1< X ≤ x2) = F(x2) – F(x1)
Példa:
Az [a,b] intervallumon folytonos egyenletes eloszlású változó eloszlásfüggvénye
0 ha x < a (x − a ) F (x ) = ha a ≤ x < b (b − a ) ha b ≤ x 1
1 a
Az eloszlásfüggvény tulajdonságai (a valószínűség tulajdonságaiból következnek):
monoton növő határértéke –∞-ben 0, ∞-ben 1 folytonos valószínűségi változóra folytonos
b
Az eloszlásfüggvény és a sűrűségfüggvény kapcsolata
Helyzeti mutatók folytonos változókra
Eloszlásfüggvénye minden valószínűségi változónak van, sűrűségfüggvénye nem (de amelyekről tanulni fogunk, azoknak van).
Várható érték
Ha van sűrűségfüggvény, akkor integrálfüggvénye az eloszlásfüggvény:
Ahol a diszkrét esetben összegezni kellett, ott a folytonos esetben integrálni kell:
E(X ) =
x
F ( x) = ∫ f (t ) dt
f(x) = F’(x)
∫ xf ( x )dx
−∞
−∞
Ha az eloszlásfüggvény deriválható, akkor deriváltja a sűrűségfüggvény:
∞
Módusz Az az x érték, amelyre a változó sűrűségfüggvényének lokális maximuma van. Folytonos változókra sem mindig egyértelmű, az eloszlás itt is lehet bimodális vagy multimodális. 0,45 0,45
0,4 0,4
0,35 0,35
0,3 0,3
0,25 0,25
0,2 0,2
0,15
0,15
0,1
0,1
0,05
0,05
0
0
1
4
7
10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55 58 61
1
5
9
13 17 21 25 29 33 37 41 45 49 53 57 61 65 69 73 77 81 85
Szóródási mutatók folytonos változókra
Medián és kvantilisek A medián az az x érték, amelyre P(X<x) = P(X>x) = 1/2, a p-kvantilis pedig olyan x érték, amelyre P(X<x) = p, P(X>x) = 1-p. 0,45
0,45
0,4
0,4
0,35
0,35
0,3
0,3
0,25
0,25
0,2
0,2
0,15
0,15
0,1
0,1
0,05
0,05
Szórásnégyzet A várható értékhez hasonlóan az összegzés helyett integrálunk:
var ( X ) =
∞
∞
−∞
−∞
2 2 2 ∫ ( x − E ( X )) f ( x )dx = ∫ x f ( x )dx − E ( X )
0
0 1
4
7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55 58 61
1
4
7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55 58 61
Szórás S ( X ) = var ( X )
Kvartilisek Alsó kvartilis, Q1, vagy LQ (lower quartile) vagy LH (lower hinge): ¼-kvantilis Felső kvartilis, Q3, vagy UQ (upper quartile) vagy UH (upper hinge): ¾-kvantilis
Interkvartilis terjedelem Interkvartilis terjedelem, (interquartile range) IQR=Q3-Q1
A normális eloszlás
A sűrűségfüggvény görbéje az úgynevezett haranggörbe vagy Gauss-görbe.
szimmetrikus (közepe a µ = várható érték = módusz = medián) A legfontosabb, a gyakorlatban leggyakrabban használt folytonos eloszlás a normális eloszlás vagy Gauss-eloszlás. Kétparamétes család. A sűrűségfüggvény képlete: − 1 f (x ) = e 2π σ
(
( x − µ )2 2σ 2
,
2
e–x nagyságrendben közeledik 0-hoz mindkét oldalon a 0-hoz közeledés sebessége a σ -tól függ (azaz a szórástól) Különböző µ és σ paraméter-értékekhez tartozó haranggörbék:
)
ahol µ és σ 2 az eloszlás paraméterei, X ~ N µ , σ 2 . σ=5
Jegyezzük meg, hogy µ épp a várható érték, σ 2 pedig a variancia (tehát σ a szórás).
µ=-10
µ=0
µ =20
A családtagokat azonosíthatjuk µ és σ 2 helyett µ-vel és σ-val is, csak konkrét számok esetén egyértelmű legyen, hogy pl. σ 2 = 2 vagy σ = 2 közül melyikre gondolunk.
σ=10
-10
A család µ = 0, σ = 1 paraméterű tagja a standard normális eloszlás. Eloszlástáblázatot csak ehhez készítettek, a többi mind egyszerűen visszavezethető a standard normálisra. Ez a standardizálás. Ugyanis ha X normális eloszlású valószínűségi változó µ és σ paraméterekkel, akkor Y = aX + b is normális eloszlású µ’ = aµ + b és σ’ = a σ paraméterekkel. ⇓
Ha X normális eloszlású valószínűségi változó µ és σ paraméterekkel, akkor a X −µ Z= standard normális eloszlású. Visszatranszformálás: X = σZ + µ .
σ
0
20
x
µ
x
Miért fontos a normális eloszlás? Központi határeloszlás tétel: Legyen H n = X 1 + X 2 + ... + X n , ahol X 1 , X 2 , ... , X n olyan valószínűségi változók, amelyek egymástól függetlenek és azonos eloszlásúak. Ekkor Hn közelítőleg normális eloszlású (ha n→∞, akkor Hn eloszlása tart a normális eloszláshoz – ennél pontosabban nem mondjuk ki). Példák:
Emberek magassága nagyon sok genetikai és környezeti változó összege, ezért közelítőleg normális eloszlású. Sok kockát dobunk egyszerre. A dobott számok összege közelítőleg normális eloszlású.
Normális eloszlású változók összege és számtani közepe 1. Normális eloszlású változók összege is normális eloszlású, és mind a várható értékek, mind a varianciák összeadódnak, pl. két változó esetén
µX+Y = µX +µY és
σ X2 +Y
= σ X2
+ σ Y2
2. Normális eloszlású változók számtani közepe is normális eloszlású, várható értéke és varianciája pedig
∑σ X i µ µ X = ∑ i és σ X2 = 2 2
n
Csörgőkígyók hossza közelítőleg normális eloszlást követ 1.4 m átlaggal és 0.2 m szórással. Mennyi a valószínűsége, hogy 25 találomra választott példány hosszának átlaga nagyobb 1.5 méternél? Megoldás:
X tehát normális eloszlású,
0,45 0,4
µ X = µ = 1.4 σX =
σ n
0,35 0,3
=
0.2 = 0.04 25
0,25 0,2 0,15 0,1
n
0,05
3. Ha a változók eloszlása azonos (azaz közös a µ és a σ), akkor a számtani közép várható értéke és varianciája
µX =
Példa:
nσ σ nµ σ = µ és σ X2 = 2 = , ahonnan σ X = n n n n 2
2
0
Továbbiak a szokásos módon:
X − µ X 1.5 − µ X P ( X > 1.5) = P > σX σX
1
Mekkora valószínűség tartozik az E ( X ) ± S ( X ) , azaz az átlag ± szórás tartományhoz?
P (E ( X ) − S ( X ) ≤ X ≤ E ( X ) + S ( X ) )
P (E ( X ) − S ( X ) ≤ X ≤ E ( X ) + S ( X ) )
P (E ( X ) − 2 S ( X ) ≤ X ≤ E ( X ) + 2 S ( X ) )
Mekkora valószínűség tartozik az E ( X ) ± 2 S ( X ) , azaz az átlag ± 2szórás tartományhoz?
7
10 13
16 19 22 25 28
31 34 37
1.4
40 43
46 49 52 55 58 61
1.5
= P(Z > 2.5) = 0.0062
Mennyit tudunk egy változóról, ha csak az átlagát és szórását ismerjük?
E( X )
4
P (E ( X ) − 3S ( X ) ≤ X ≤ E ( X ) + 3S ( X ))
M P (E ( X ) − kS ( X ) ≤ X ≤ E ( X ) + kS ( X ) )
Ha a változó normális eloszlású tetszőleges kb. 2/3 nem tudni 3 ≥ kb. 95% 4 8 ≥ szinte biztos 9 M 1 ≥1− 2 k
és így tovább... „empirikus szabály” (empirical rule)
Csebisevegyenlőtlenség
Exponenciális eloszlás Folytonos eloszlás (-család, egy paraméterrel, amit λ-val jelölünk), legtöbbször időtartamok modellezésére használják: „két esemény / meghibásodás / stb. között eltelt idő, ha az eseményeket az öregedés nem befolyásolja” Példa:
Villanykörte, ha nem kapcsolgatják, stb. (amikor a meghibásodások nem öregedéssel, kopással, elhasználódással kapcsolatosak)
1 − e − λx Eloszlásfüggvénye: F ( x ) = P( X < x ) = 0
λ = 0.5:
ha x > 0 egyébként
1
1
0.5
0.5
λ=1
0 -5
0
5
10
0 -5
λe −λx Sűrűségfüggvénye: f ( X ) = F ' ( x ) = 0
10
egyébként 1
0.5
0.5
λ=1
0 -5
5
ha x > 0
1
λ = 0.5:
0
0
5
10
0 -5
0
Várható értéke és szórása (integrálással kijön): E ( X ) =
5
1
λ
10
, var ( X ) =
1
λ2