ELŐADÁS ÁTTEKINTÉSE Egyenletes eloszlás Binomiális eloszlás Normális eloszlás Standard normális eloszlás
STATISZTIKA 7. Előadás Normális eloszlás mint modell
2/56
Matematikai statisztika
Mi a modell?
Reprezentatív mintavétel alapján a sokaság jellemző paramétereinek becslése. Minta alapján az alapsokaságra vonatkozó feltételezések, hipotézisek igazolása. Összefüggés vizsgálatok sztochasztikus modellekkel
A modell összetett, bonyolult természeti képződmények, objektumok működésének megismerésére létrehozott „egyszerűsített helyettesítő”. Modellformák: Mechanikus analógok, elektromos analógok, fizikai, kémiai, matematikai modellek, modellek, stb.
3/56
4/56
Egyenletes eloszlás sűrűségfüggvénye
300 dobás 70
f ( x) =
60
50
1 , ha a ≤ x ≤ b, egyébként f ( x ) = 0 b−a
40
1/(b-a)
30
20
10
0 1
2
3
4
5
0
6 5/56
a
b 6/56
1
Egyenletes eloszlás eloszlásfüggvénye
Egyenletes eloszlás Egy valószínűségi változót az (a, b) intervallumon belül egyenletes eloszlású, ha eloszlásfüggvénye:
1,00
0,80
0, x −a F ( x) = , b − a 1,
0,60
0,40
0,20
0,00
A
B
ha x ≤ a, ha a < x ≤ b, ha b < x.
7/56
8/56
Binomiális eloszlás sűrűségfüggvény
Binomiális eloszlás Visszatevéses mintavételezés n = minta száma k = sikeres események száma p = sikeres esemény valószínűsége E=np D2=np(1=np(1-p)
0,20
n=50, p=0,1
0,15
n=50, p=0,5 0,10
0,05
0,00
9/56
0,00
5,00
Binomiális eloszlás gyakorlati alkalmazása 70
Binomial Test
30
Category Tõszám
N
Group 1
<= 60
36
Group 2
> 60
36
.50
72
1.00
Total
.50
Test Prop. .50
15,00
20,00
25,00
30,00
10/56 10/56
300 dobás
Érme feldobása, a születendő gyerek neme, betegség kimenetele, környezetszennyezés Binomiális tesztek: két csoport relatív gyakoriságának összehasonlítása Observed Prop.
10,00
60
50
40
Asymp. Sig. (2-tailed)
20
1.000a 10
a. Based on Z Approximation.
0 1 11/56 11/56
2
3
4
5
6 12/56 12/56
2
300 dobás 6 dobókocka
6 dobókocka, variációk száma 5000
35
4500 4000
30
3500
25
3000 20
2500 2000
15
1500 10
1000 5
500
Normális eloszlás felfedezői
36
34
32
30
28
26
24
22
20
18
16
14
12
8
6 36
32
34
30
28
26
22
24
18
20
16
14
12
10
6
8
13/56 13/56
10
0
0
14/56 14/56
Abraham de Moivre (1667(1667-1754)
Abraham de Moivre fedezte fel és közölte le 17331733-ban PierrePierre-Simon Laplace Carl Friedrich Gauss
15/56 15/56
PierrePierre-Simon Laplace (1749(1749-1827)
17/56 17/56
16/56 16/56
Carl Friedrich Gauss (1777(1777-1855)
18/56 18/56
3
Számtani sorozat összege
( n + 1)
A normális eloszlás mint modell A természetben nagyon sok mért paraméter normális eloszlással írható le, mint például az egyének magassága, vérnyomása, súlya, stb. Ez a modell jól leírja a mérési értékeknek a középérték (várható érték) körüli szóródását. A normális elnevezés arra utal, hogy a mért adatainktól ezt várjuk, mert ez a természetes viselkedésük.
n ( n + 1)n = 2 2 19/56 19/56
20/56 20/56
Normális eloszlás sűrűségfüggvénye
Normális eloszlás sűrűségfüggvénye 45% 40%
2σ
35% 30%
2
25% p
1 f ( x) = e σ 2π
( x − µ )2 −
20% 15% 10% 5% 0% 46
47
48
49
50
51
52
53
(cm)
21/56 21/56
Eloszlásfüggvény
54 22/56 22/56
Valószínűségek 1 0,9
1 F (x) = σ 2π
x
∫e
( x − µ )2 − 2σ
2
0,8 0,7
dx
−∞
0,6
átlag
0,5 0,4 0,3 0,2 0,1 0 20
23/56 23/56
30
40
50
60
70
80 24/56 24/56
4
Normális eloszlás jelölése
Standard normális eloszlás jelölése
N(0, 1)
N(µ, σ)
25/56 25/56
26/56 26/56
Standard normáleloszlás sűrűségfüggvénye
Standardizálás
zi =
xi − µ
1 2π
0.400
µ , medián, módusz
0.350 0.300
σ
0.250 0.200
1 e 2π
φ(x) =
0.150 0.100
−
x2 2
0.050 0.000 27/56 27/56
Standard normáleloszlás sűrűségfüggvénye 1 2π
0.400
0
2
4
28/56 28/56
µ , medián, módusz
Φ (x) =
0.300 0.250
1 e 2π
φ(x) =
0.150
-2
Standard normális eloszlás eloszlásfüggvénye
0.350
0.200
-4
0.100
x2 − 2
1 2π
x
∫e
−
x2 2
dx
−∞
0.050 0.000 -4
-2
0
2
4
29/56 29/56
30/56 30/56
5
Standard normáleloszlás eloszlásfüggvénye
Standard normáleloszlás 68%68%-os valószínűsége
1
0.400
0,84
0,9
0.350
0,8 0,7
0.300
0,6
0.250
0,5
0.200
0,4
0.150
0,3
0,68
0,16
0,2
0.100 0.050
0,1
0.000
0 -4
-3
-2
-1
0
1
2
3
4
-4
-2
0
2
4
31/56 31/56
A normál eloszlás nevezetes értékei Megbízhatóság %
µ ± z%σ
68
1
95
1,96
99
2,58
99,9
3,29
32/56 32/56
Alapvető összefüggések x
F ( x) =
∫ f ( x )dx
F ( x) =
x → −∞
∫ f ( x)dx = 1
−∞
−∞
lim F ( x ) = 0
+∞
lim F ( x ) = 1 x → +∞
33/56 33/56
Az eloszlás alakjának jellemzése
34/56 34/56
Ferdeség számítása n n xi − x ∑ (n − 1)(n − 2 ) i =1 s
Ferdeség (skewness (skewness,, normális eloszlás=0 körüli érték) Csúcsosság (kurtosis (kurtosis,, normális eloszlás=0 körüli érték)
35/56 35/56
3
Aszimmetria mérőszáma Értéke: mínusz és plusz tartomány Nulla esetén szimmetrikus eloszlás 36/56 36/56
6
Balra ferde eloszlás
Jobbra ferde eloszlás
0,80
0,45 0,4 0,35 0,3 0,25 0,2 0,15 0,1 0,05 0
0,60
0,40
0,20
0
0,2
0,4
0,6
0,8
1
1,2
0,00 -3,00
-2,00
-1,00
0,00
1,00
2,00
3,00
37/56 37/56
Mikor ferde az eloszlás?
38/56 38/56
Egyéb aszimmetria mutatók
Statisztikailag igazolt ferdeség, ha a ferdeségi mutató értéke meghaladja a ferdeségi érték szórásának kétszeresét. Az eloszlás nem szimmetrikus
Aszimmetria hányados PearsonPearson-mutató BowleyBowley-mutató F-mutató
F=
A=
x − Mo
σ
(Q3 − Me) − ( Me − Q1 ) (Q3 − Me) + ( Me − Q1 )
39/56 39/56
Csúcsos és lapos eloszlás
40/56 40/56
Csúcsosság számítása
0,80
4 2 n n (n + 1) 3(n − 1) xi − x − ∑ (n − 1)(n − 2 )(n − 3) i =1 s (n − 2 )(n − 3)
0,60
0,40
0,20
0,00 -3,00
-2,00
-1,00
0,00
1,00
2,00
3,00
41/56 41/56
42/56 42/56
7
A csúcsossági érték értelmezése
KolmogorovKolmogorov-Smirnov teszt
Nulla esetén normális eloszlás Pozitív érték esetén az adatok szélesebb csoportban helyezkednek el Negatív érték esetén az adatok szűkebb csoportban helyezkednek el. Statisztikailag igazolt eltérés: a csúcsosság értéke meghaladja a szórásának kétszeresét 43/56 43/56
KolmogorovKolmogorov-Smirnov teszt eredménye
44/56 44/56
Egyéb normalitás vizsgálat KolmogorovKolmogorov-Smirnov és ShapiroShapiro-Wilk próba
One-Sample Kolmogorov-Smirnov Test Termés t/ha N
72 a,b
Normal Parameters
Mean
9.69609
Std. Deviation Most Extreme Differences
Tests of Normality
1.843756
Absolute
.075
Positive
.047
Negative
Kolmogorov-Smirnova Talajmûvelés termés t/ha
-.075
Kolmogorov-Smirnov Z
.635
Asymp. Sig. (2-tailed)
.814
Statistic
df
Sig.
Shapiro-Wilk Statistic
df
Sig.
õszi szántás
.127
48
.050
.916
48
.002
tavaszi szántás
.227
48
.000
.845
48
.000
tárcsás
.263
48
.000
.817
48
.000
a. Lilliefors Significance Correction
a. Test distribution is Normal. b. Calculated from data. 45/56 45/56
Grafikus normalitás vizsgálat 1.
46/56 46/56
Grafikus normalitás vizsgálat 2. Detrended Normal Q-Q Plot of termés t/ha
Normal Q-Q Plot of termés t/ha
For TALAJMUV= őszi szántás
For TALAJMUV= őszi szántás .4
3 2
.2
1
0.0 -.2
Dev from Normal
Expected Normal
0 -1 -2 -3 6
8
Observed Value
10
12
14
-.4 -.6 -.8 7
16 47/56 47/56
8
9
Observed Value
10
11
12
13
14
15
48/56 48/56
8
Összefoglalás
NORM.ELOSZLÁS NORM.ELOSZL( NORM.ELOSZL(x;középérték; középérték;szórás; szórás;eloszlásfv) eloszlásfv) X: Az az érték, amelynél az eloszlást ki kell számítani. Középérték: Az eloszlás középértéke (várható értéke). Szórás: Az eloszlás szórása. Eloszlásfv: Eloszlásfv: Logikai érték. Ha értéke IGAZ, akkor a NORM.ELOSZL függvény az eloszlásfüggvény értékét számítja ki, ha értéke HAMIS, akkor a sűrűségfüggvényét. 49/56 49/56
50/56 50/56
Példa 1.
Példa 2.
Átlag: 100 kg Szórás: 10 kg NORM.ELOSZL(x;100;10;hamis)
Átlag: 100 kg Szórás: 10 kg NORM.ELOSZL(x;100;10;igaz)
0,045
1,2
0,04 1
0,035 0,8
0,03 0,025
0,6
0,02 0,4
0,015 0,01
0,2
0,005 0
0 50
60
70
80
90
100
110
120
130
140
150
51/56 51/56
Példa 3.
50
60
70
80
90
100
110
120
130
140
150
52/56 52/56
INVERZ.NORM
Átlag: 100 kg Szórás: 10 kg Mi a valószínűsége, hogy 80 kgkg-nál kisebb lesz? 2% 53/56 53/56
INVERZ.NORM( INVERZ.NORM(valószínűség; valószínűség;középérték; középérték;szórás) szórás) Valószínűség: A standard normális eloszláshoz tartozó valószínűség. Középérték: Az eloszlás középértéke (várható értéke). Szórás: Az eloszlás szórása. Megjegyzés Ha bármelyik argumentum értéke nem szám, akkor az INVERZ.NORM az #ÉRTÉK! hibaértéket adja vissza. Ha valószínűség < 0 vagy valószínűség > 1, akkor az INVERZ.NORM eredménye a #SZÁM! hibaérték lesz. Ha szórás ≤ 0, akkor az INVERZ.NORM a #SZÁM! hibaértéket adja eredményül. Az INVERZ.NORM a standard normális eloszlást használja, ha középérték = 0 és szórás = 1 (lásd INVERZ.STNORM). 54/56 54/56
9
STNORMELOSZL
INVERZ.STNORM
Z:
Az az érték, amelynél az eloszlást ki kell számítani. Megjegyzés Ha a z argumentum értéke nem szám, akkor a STNORMELOSZL az #ÉRTÉK! hibaértéket adja eredményül.
55/56 55/56
INVERZ.STNORM( INVERZ.STNORM(valószínűség) valószínűség) Valószínűség: A standard normális eloszláshoz tartozó valószínűség. Megjegyzés Ha a valószínűség értéke nem szám, akkor az INVERZ.STNORM az #ÉRTÉK! hibaértéket adja eredményül. Ha valószínűség < 0 vagy valószínűség > 1, akkor az INVERZ.NORM eredménye a #SZÁM! hibaérték lesz. Az INVERZ.STNORM függvény adott valószínűségértékkel olyan z értéket keres, amelynél STNORMELOSZL(z) = valószínűség. Így az INVERZ.STNORM pontossága függ az STNORM.ELOSZL pontosságától. Az INVERZ.STNORM függvény iterációs keresési eljárást alkalmaz. Amennyiben a keresés nem konvergál 100 lépés után, a függvény #HIÁNYZIK hibaértékkel tér vissza. 56/56 56/56
10