= dx 0,45 0,4 0,35 0,3 0,25 0,2 0,15 0,1 0,05 0,45 0,4 0,35 0,3 0,25 0,2 0,15 0,1 0,05 0,45 0,4 0,35 0,3 0,25 0,2 0,15 0,1 0,05

Folytonos valószínűségi változók Értékkészletük a számegyenes egy folytonos (véges vagy végtelen) intervalluma. Valamennyi lehetséges érték 0 valószínűségű, pozitív valószínűségek csak értéktartományokhoz tartoznak. Az eloszlás nem írható le az értékek és valószínűségek felsorolásával, mint a diszkrét esetben, mivel az értékek halmaza nem megszámlálhatóan végtelen. A valószínűségeket a lehetséges értéktartományokhoz sűrűségfüggvénnyel vagy az eloszlásfüggvénnyel.

tudjuk

megadni

a

Sűrűségfüggvény: olyan függvény, amelynek függvénygörbe alatti területe (integrálja) bármely tartományon egyenlő a változónak ahhoz a tartományhoz tartozó valószínűségével: x2

A valószínűség tulajdonságaiból következik, hogy egy sűrűségfüggvény sehol sem negatív: f(x) ≥ 0, ∞

a teljes tartományon (-∞-től +∞-ig) az integrálja 1: ∫ f (x )dx = 1. −∞

Példa:

Az [a,b] intervallumon folytonos egyenletes eloszlású változó sűrűségfüggvénye  1 , ha a ≤ x ≤ b f (x ) =  b − a  0 , egyébként. x2

x2

x1

x1

P(x1 < X < x 2 ) = ∫ f (x )dx = ∫

P(x1 < X < x 2 ) = ∫ f (x )dx x1

(x − x1 ) 1 dx = 2 . b−a b−a

(ha a≤x1≤x2≤b)

Az eloszlásfüggvény x-beli értéke a (–∞, valószínűség

x) végtelen intervallumhoz tartozó

F(x) = P(X < x) Ebből következik, hogy bármely x1, x2 érték-párra

P(x1< X ≤ x2) = F(x2) – F(x1)

Példa:

Az [a,b] intervallumon folytonos egyenletes eloszlású változó eloszlásfüggvénye

 0 ha x < a (x − a ) F (x ) =  ha a ≤ x < b  (b − a ) ha b ≤ x  1

1 a

Az eloszlásfüggvény tulajdonságai (a valószínűség tulajdonságaiból következnek):

monoton növő határértéke –∞-ben 0, ∞-ben 1 folytonos valószínűségi változóra folytonos

b

Az eloszlásfüggvény és a sűrűségfüggvény kapcsolata

Helyzeti mutatók folytonos változókra

Eloszlásfüggvénye minden valószínűségi változónak van, sűrűségfüggvénye nem (de amelyekről tanulni fogunk, azoknak van).

Várható érték

Ha van sűrűségfüggvény, akkor integrálfüggvénye az eloszlásfüggvény:

Ahol a diszkrét esetben összegezni kellett, ott a folytonos esetben integrálni kell:

E(X ) =

x

F ( x) = ∫ f (t ) dt

f(x) = F’(x)

∫ xf ( x )dx

−∞

−∞

Ha az eloszlásfüggvény deriválható, akkor deriváltja a sűrűségfüggvény:

∞

Módusz Az az x érték, amelyre a változó sűrűségfüggvényének lokális maximuma van. Folytonos változókra sem mindig egyértelmű, az eloszlás itt is lehet bimodális vagy multimodális. 0,45 0,45

0,4 0,4

0,35 0,35

0,3 0,3

0,25 0,25

0,2 0,2

0,15

0,15

0,1

0,1

0,05

0,05

0

0

1

4

7

10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55 58 61

1

5

9

13 17 21 25 29 33 37 41 45 49 53 57 61 65 69 73 77 81 85

Szóródási mutatók folytonos változókra

Medián és kvantilisek A medián az az x érték, amelyre P(X<x) = P(X>x) = 1/2, a p-kvantilis pedig olyan x érték, amelyre P(X<x) = p, P(X>x) = 1-p. 0,45

0,45

0,4

0,4

0,35

0,35

0,3

0,3

0,25

0,25

0,2

0,2

0,15

0,15

0,1

0,1

0,05

0,05

Szórásnégyzet A várható értékhez hasonlóan az összegzés helyett integrálunk:

var ( X ) =

∞

∞

−∞

−∞

2 2 2 ∫ ( x − E ( X )) f ( x )dx = ∫ x f ( x )dx − E ( X )

0

0 1

4

7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55 58 61

1

4

7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55 58 61

Szórás S ( X ) = var ( X )

Kvartilisek Alsó kvartilis, Q1, vagy LQ (lower quartile) vagy LH (lower hinge): ¼-kvantilis Felső kvartilis, Q3, vagy UQ (upper quartile) vagy UH (upper hinge): ¾-kvantilis

Interkvartilis terjedelem Interkvartilis terjedelem, (interquartile range) IQR=Q3-Q1

A normális eloszlás

A sűrűségfüggvény görbéje az úgynevezett haranggörbe vagy Gauss-görbe.

szimmetrikus (közepe a µ = várható érték = módusz = medián) A legfontosabb, a gyakorlatban leggyakrabban használt folytonos eloszlás a normális eloszlás vagy Gauss-eloszlás. Kétparamétes család. A sűrűségfüggvény képlete: − 1 f (x ) = e 2π σ

(

( x − µ )2 2σ 2

,

2

e–x nagyságrendben közeledik 0-hoz mindkét oldalon a 0-hoz közeledés sebessége a σ -tól függ (azaz a szórástól) Különböző µ és σ paraméter-értékekhez tartozó haranggörbék:

)

ahol µ és σ 2 az eloszlás paraméterei, X ~ N µ , σ 2 . σ=5

Jegyezzük meg, hogy µ épp a várható érték, σ 2 pedig a variancia (tehát σ a szórás).

µ=-10

µ=0

µ =20

A családtagokat azonosíthatjuk µ és σ 2 helyett µ-vel és σ-val is, csak konkrét számok esetén egyértelmű legyen, hogy pl. σ 2 = 2 vagy σ = 2 közül melyikre gondolunk.

σ=10

-10

A család µ = 0, σ = 1 paraméterű tagja a standard normális eloszlás. Eloszlástáblázatot csak ehhez készítettek, a többi mind egyszerűen visszavezethető a standard normálisra. Ez a standardizálás. Ugyanis ha X normális eloszlású valószínűségi változó µ és σ paraméterekkel, akkor Y = aX + b is normális eloszlású µ’ = aµ + b és σ’ = a σ paraméterekkel. ⇓

Ha X normális eloszlású valószínűségi változó µ és σ paraméterekkel, akkor a X −µ Z= standard normális eloszlású. Visszatranszformálás: X = σZ + µ .

σ

0

20

x

µ

x

Miért fontos a normális eloszlás? Központi határeloszlás tétel: Legyen H n = X 1 + X 2 + ... + X n , ahol X 1 , X 2 , ... , X n olyan valószínűségi változók, amelyek egymástól függetlenek és azonos eloszlásúak. Ekkor Hn közelítőleg normális eloszlású (ha n→∞, akkor Hn eloszlása tart a normális eloszláshoz – ennél pontosabban nem mondjuk ki). Példák:

Emberek magassága nagyon sok genetikai és környezeti változó összege, ezért közelítőleg normális eloszlású. Sok kockát dobunk egyszerre. A dobott számok összege közelítőleg normális eloszlású.

Normális eloszlású változók összege és számtani közepe 1. Normális eloszlású változók összege is normális eloszlású, és mind a várható értékek, mind a varianciák összeadódnak, pl. két változó esetén

µX+Y = µX +µY és

σ X2 +Y

= σ X2

+ σ Y2

2. Normális eloszlású változók számtani közepe is normális eloszlású, várható értéke és varianciája pedig

∑σ X i µ µ X = ∑ i és σ X2 = 2 2

n

Csörgőkígyók hossza közelítőleg normális eloszlást követ 1.4 m átlaggal és 0.2 m szórással. Mennyi a valószínűsége, hogy 25 találomra választott példány hosszának átlaga nagyobb 1.5 méternél? Megoldás:

X tehát normális eloszlású,

0,45 0,4

µ X = µ = 1.4 σX =

σ n

0,35 0,3

=

0.2 = 0.04 25

0,25 0,2 0,15 0,1

n

0,05

3. Ha a változók eloszlása azonos (azaz közös a µ és a σ), akkor a számtani közép várható értéke és varianciája

µX =

Példa:

nσ σ nµ σ = µ és σ X2 = 2 = , ahonnan σ X = n n n n 2

2

0

Továbbiak a szokásos módon:

 X − µ X 1.5 − µ X P ( X > 1.5) = P > σX  σX

1

Mekkora valószínűség tartozik az E ( X ) ± S ( X ) , azaz az átlag ± szórás tartományhoz?

P (E ( X ) − S ( X ) ≤ X ≤ E ( X ) + S ( X ) )

P (E ( X ) − S ( X ) ≤ X ≤ E ( X ) + S ( X ) )

P (E ( X ) − 2 S ( X ) ≤ X ≤ E ( X ) + 2 S ( X ) )

Mekkora valószínűség tartozik az E ( X ) ± 2 S ( X ) , azaz az átlag ± 2szórás tartományhoz?

7

10 13

16 19 22 25 28

31 34 37

1.4

40 43

46 49 52 55 58 61

1.5

  = P(Z > 2.5) = 0.0062 

Mennyit tudunk egy változóról, ha csak az átlagát és szórását ismerjük?

E( X )

4

P (E ( X ) − 3S ( X ) ≤ X ≤ E ( X ) + 3S ( X ))

M P (E ( X ) − kS ( X ) ≤ X ≤ E ( X ) + kS ( X ) )

Ha a változó normális eloszlású tetszőleges kb. 2/3 nem tudni 3 ≥ kb. 95% 4 8 ≥ szinte biztos 9 M 1 ≥1− 2 k

és így tovább... „empirikus szabály” (empirical rule)

Csebisevegyenlőtlenség

Exponenciális eloszlás Folytonos eloszlás (-család, egy paraméterrel, amit λ-val jelölünk), legtöbbször időtartamok modellezésére használják: „két esemény / meghibásodás / stb. között eltelt idő, ha az eseményeket az öregedés nem befolyásolja” Példa:

Villanykörte, ha nem kapcsolgatják, stb. (amikor a meghibásodások nem öregedéssel, kopással, elhasználódással kapcsolatosak)

1 − e − λx Eloszlásfüggvénye: F ( x ) = P( X < x ) =   0

λ = 0.5:

ha x > 0 egyébként

1

1

0.5

0.5

λ=1

0 -5

0

5

10

0 -5

λe −λx Sűrűségfüggvénye: f ( X ) = F ' ( x ) =   0

10

egyébként 1

0.5

0.5

λ=1

0 -5

5

ha x > 0

1

λ = 0.5:

0

0

5

10

0 -5

0

Várható értéke és szórása (integrálással kijön): E ( X ) =

5

1

λ

10

, var ( X ) =

1

λ2

= dx 0,45 0,4 0,35 0,3 0,25 0,2 0,15 0,1 0,05 0,45 0,4 0,35 0,3 0,25 0,2 0,15 0,1 0,05 0,45 0,4 0,35 0,3 0,25 0,2 0,15 0,1 0,05

Recommend Documents