MATEMATIKAI STATISZTIKA elemei Dr. Kausay Tibor Budapest, 2012. február
1
PÉLDA A gyakoriságfüggvény szerkesztésére
[tömeg%]
2
Ez nem egy jól sikerült gyakorisági hisztogram, mert az abszcissza tengely xi+1 – xi osztásközeit túl kicsire vettem fel. xi+1 – xi
xi +1=
=
x
3
xi
k
Az x abszcissza tengely felosztására nincs pontos szabály, de az osztáspontok megválasztása általában akkor szerencsés, ha minden xi+1 – xi intervallumba körülbelül
3
n
mintaelem jut, ahol n a mintaelemek száma. Példánk esetén az elemek száma n = 10, és ideális esetben 3 n = 3 10 = 2,154 elem jut egy intervallumba. A 19,0 – 15,5 = 3,5 terjedelmet tehát n/2,154 = 10/2,154 = = 4,6 ~ 5 intervallumra a legcélszerűbb osztani. Ehhez igazodva az új ábrán 7 darab xi+1 – xi = 0,5 terjedelmű intervallumot alkalmaztunk.
4
k
Várhatóérték = átlag = 17,17
Szimmetrikus görbe
Szórás = 0,936958
Gyakorisági hisztogram Gyakorisági polinom Gyakorisági görbe
x Ez a gyakorisági hisztogram már jobban néz ki, mert az abszcissza 5 tengely xi+1 – xi osztásközei nagyobbak, mint az előző ábrán voltak.
Ez az ábra a gyakorisági ábra „felülnézeteként” értelmezhető. Az ábra nagyon jól szemlélteti, hogy a mérési eredmények elhelyezkedése az abszcissza tengelyen nem szimmetrikus.
6
Ez az ábra is a gyakorisági ábra „felülnézeteként” értelmezhető
Max. Medián
Terjedelem
Gyakoriság, k
Felső, 75 %-os kvantilis Ide esik a mérési eredmények 50 %-a Alsó, 25 %-os kvantilis
Min. Medián = Az 50 %-os kvantilis neve, illetve értéke. A páratlan számú rendezett minta 7 esetén a középső elem értéke, a páros számú esetén a két középső elem átlagértéke.
Ha a k tapasztalati gyakorisági értékeket elosztjuk a mintaelemek n számával (ez példánk esetén n = 10 volt), akkor a p’ = k/n tapasztalati relatív gyakoriságokat kapjuk. Az ordináta tengelyre a p’ = k/n tapasztalati relatív gyakoriságokat felrakva a tapasztalati eloszlásfüggvényre, más néven tapasztalati sűrűségfüggvényre (p’) jutunk. A sűrűségfüggvény alatti terület értéke 1,0, 1,0 vagy százalékban kifejezve 100 %. A p’ sűrűségfüggvény egyes xi abszcissza értékeitől balra vett görbe alatti területek értékét koordinátarendszerbe felhordva a (tapasztalati) p eloszlásfüggvényt kapjuk. 8
Eloszlásfüggvény és jellemzői (az MSZ 18288-5:1981 szabvány szerint) kőanyag szemhalmazok esetén általában
adalékanyagok esetén
9
Valahol olvastam: A brüsszeli városvezetés a Brüsszelben élő Carl Friedrich Gauss német matematikust felkérte arra, hogy végezzen matematikai módszerrel lakossággal kapcsolatos felmérést. Könnyen lehetséges az, hogy a világ első ilyen felmérése született Gauss módszerével, és talán Brüsszel városa volt az első, aki megbízást adott a tudományos megalapozottságot igénylő munkára. Gauss Brüsszel lakosait kirendeltette a templom előtti térre, és ott a toronyból irányítva nagyságrend alapján rendezte őket, mégpedig úgy, hogy középen a legmagasabbak és két oldalra csökkenő magasságúakat állította. Így alakult ki a Gauss görbe, mely harang alakú. Ebből a görbéből számításokkal meghatározta, hogy a lakosságnak hány %-a nagyon alacsony, alacsony 10 középméretű, magasabb és igen magas.
Carl Friedrich Gauss német matematikus portréja (Gottlieb Biermann festménye, 1887) Született: Német-római Birodalom, Braunschweig-Lüneburgi hercegség, Braunschweig, 1777. április 30. Meghalt: Hannoveri Királyság, Göttingen, 1855. február 23. Forrás: Wikipédia
11
A német márkát 2001. december 31-én kivonták a forgalomból, mert 2002. január 1-én az euro lett a fizetőeszköz Németországban. Tessék megfigyelni a pénzen a Gauss-görbét és egyenletét. Ezt a példányt 2001. június 19-én vásároltam az OTP-ben: 12
A σ szórás 1,645-szeresét levonva az m várhatóértékből megkapjuk az 5 %-os alsó „küszöbértéket” („jellemző értéket”, „karakterisztikus értéket”), amelynél kisebb értékek előfordulásának valószínűsége 5 %. Görbe alatti terület: 0,05
A Gauss függvény megadásához elég a várhatóérték (m) és a szórás (σ) ismerete.
90 % 1,645·σ
1,0
13
14
Ha az építőanyagok tulajdonságait valószínűségi változóként fogjuk fel, akkor megfelelőségüket általában az 5 %-os alsó küszöbértékük alapján ítéljük meg. Kérdés, hogy az építőmérnök a valószínűségi eloszlás felső küszöbértékét használja-e a méretezés során? A válasz: Igen. A hatásokat (például szélteher, hóteher, födémek terhe, vízépítésben a legmagasabb vízszint stb.) általában felső küszöbértékükkel szokás figyelembe venni.
15
Sű
Említettük, hogy a Gauss függvény megadásához elég a várhatóérték (m) és a szórás (σ) ismerete. sé rű gf gv üg én
El os zlá sfü gg vé ny
y
Az elméleti várhatóérték (m) a Gauss görbe helyét, az elméleti szórás (σ) a Gauss görbe terjedelmét (terpesztését) határozza meg.
16
Néhány fogalom (1) • Alulmaradási hányad: Az előzőekben említett görbe alatti terület (0,05, illetve 5 %) neve. Meghatározás: A teljes tételben a megfelelőségi feltételt ki nem elégítő rész részaránya. • Alulmaradási tényező: Az előzőekben szerepelt 1,645 vagy más értékű szorzó. Meghatározás: Szorzó, amellyel a szórást megszorozva, és a szorzatot a várhatóértékből (az átlagból) kivonva, a küszöbértékre jutunk. Jele általában: λn. Ilyen a későbbiekben tárgyalásra kerülő tn Student tényező is. • Alulmaradási tágasság: Az alulmaradási tényező és a szórás szorzata. Meghatározás: Az alulmaradási tágasságot a várhatóértékből (az átlagból) kivonva a küszöbértéket (jellemző értéket, karakterisztikus értéket) kapjuk. Más szóval a várhatóérték (az átlag) és a küszöbérték különbsége. Jele a tapasztalati szórás esetén általában: 17 λn·s
Néhány fogalom (2) •Valószínűségi változó: A független statisztikában. Jele: ξ (kszi) vagy x
változó
elnevezése
a
matematikai
• Várhatóérték: A tapasztalati átlagnak (számtani középértéknek) megfelelő elméleti fogalom a matematikai statisztikában, tehát a valószínűségi változó várhatóértéke, amely a p’ gyakoriságfüggvény alatti területnek az ordinátatengelyre vett elsőrendű nyomatéka:
M (ξ ) = ò ξ × p'×dξ •Jele: M(ξ) vagy m •Átlag (számtani átlag): A várhatóérték elnevezése, ha nem elméleti, hanem tapasztalati érték. A mindennapok gyakorlatából ismert fogalom. Jele például: x • Szórás: A valószínűségi változó felvett értéke (ξ) és várhatóértéke (M(ξ) vagy m) közötti eltérés négyzetének várhatóértékéből vont négyzetgyök: n
D(ξ ) =
M (( M (ξ ) - ξ ) ) = 2
å (m - ξ i )
2
i =1
n Jele: D(ξ) vagy σ A szórás lehet elméleti szórás, vagy tapasztalati szórás. A fenti képlet és 18 jel az elméleti szórás képlete, illetve jele. A tapasztalati szórást s-sel szokták jelölni.
Szórás meghatározása Az elméleti szórást úgy határozzuk meg, hogy 1. minden mérési eredményre (xi) képezzük a várhatóérték (m) az egyes mérési eredmények (xi) különbségét: (m – xi), és ezt eltérésnek* nevezzük, 2. ezeket a különbségeket négyzetre emeljük: (m – xi)2, ezek neve eltérésnégyzet*, 3. a négyzet értékeket összegezzük: Σ(m – xi)2, ezt eltérésnégyzetösszegnek* hívjuk, 4. és az elméleti szórás esetén az eltérésnégyzetösszeget* elosztjuk az n mintaelemszámmal: (Σ(m – xi)2)/n, 5. majd a hányadosból négyzetgyököt vonunk: n
σ=
2 m x ( ) å i
i =1
n
Az elméleti szórás számításának feltétele, hogy n → ∞. •
Megjegyzés: Amit itt „eltérés”-nek hívunk, azt a regresszió számításnál „hiba”-nak nevezzük!
19
A gyakorlatban az n → ∞ feltétel nem teljesül, az n a gyakorlatban általában egy nagyon kis szám, és ezt a tapasztalati szórás számítása során figyelembe kell venni. Ez úgy történik, hogy az eltérésnégyzetösszeget nem n-nel, hanem (n-1)-gyel kell elosztani, tehát a tapasztalati (empirikus, korrigált) szórás (s) értéke: n
å ( x - xi )
2
Mennél kisebb az n értéke, s= annál jobban eltér az n -1 (n-1)/n hányados az 1-től, azaz adott eltérésnégyzetösszeg esetén minél kisebb az n mintaelemszám, – a √[(n-1)/n] aránynak megfelelően – annál nagyobb a tapasztalati szórás (s), és ennek folytán kisebb küszöbérték adódik. i =1
Ez már csak azért is így van, mert ha az n értéke csökken, akkor nem csak a szórás (s), hanem az alulmaradási tényező (λn) is megnő, és ezáltal az alulmaradási tágasság (λn·s) növekedésének már oka 20 is van.
A Gauss-féle sűrűségfüggvény ábrán Gauss (emlékeztetésül itt balra látszik lekicsinyítve) bemutatott elméleti törvényszerűségek akkor igazak, ha n → ∞, illetve gyakorlatilag több mint 40, azaz n > 40 (n = mintaelem szám). Ha n → ∞ (azaz n tart a végtelenhez), akkor • a gyakorisági hisztogram és a gyakorisági polinom → a gyakorisági görbéhez (azaz a gyakorisági hisztogram és a gyakorisági polinom tart a gyakorisági görbéhez); • a tapasztalati átlag ( x ) → tart az elméleti átlaghoz, amit várhatóértéknek hívunk (m); • a tapasztalati szórás (s) → tart az elméleti szóráshoz (σ). A laboratóriumi mérési (vizsgálati) eredményekből a tapasztalati átlagot és a tapasztalati szórást tudjuk kiszámítani, ezekből az elméleti átlagra (várhatóértékre) és az elméleti szórásra csak következtetni tudunk, és a mérési eredményekből a küszöbértéket (jellemző értéket, karakterisztikus értéket) a vonatkozó termékszabvány előírása alapján 21 határozzuk meg.
Tételezzük fel például, hogy egy hatalmas doboz (mondjuk akkora, mint a Műegyetem aulája) tele van egyforma, de különböző, fekete, fehér színű golyóval (például pingpong labdával), amelyek a hatalmas dobozban véletlenszerűen helyezkednek el, és amelyek arányát nem ismerjük. Vegyünk mintát képzeletben a hatalmas dobozból például egy kis szakajtóval (kenyértészta kelesztésére való fületlen kosárkával), számoljuk meg a mintában lévő fekete és fehér golyókat, és tegyük fel a kérdést: Mi a valószínűsége annak, hogy a mintában lévő fekete és fehér golyók aránya ugyanaz, mint a hatalmas doboz halmazában? Könnyű elképzelni, hogy vizsgálódásunk megbízhatósága annál nagyobb lesz, minél nagyobb a szakajtónk, azaz minél nagyobb a mintában lévő golyók n mintaelem száma. Teljes bizonysággal azonban csak akkor tudnánk a kérdésre válaszolni, ha a hatalmas dobozban lévő valamennyi golyót megvizsgálnánk. A gyakorlatban erre persze nincs lehetőségünk, de az n mintaelemszám növelésére törekednünk kell.22
A vizsgálati minta n elemszáma a vizsgálatnak nagyon fontos jellemzője, mert jelentősen befolyásolja a vizsgálati eredmények értékelésével végzett termék-minősítés megbízhatóságát. Az n mintaelemszámot a vizsgálati (mérési) eredmények értékelése során a Student-féle eloszlás (nevezik t-eloszlásnak is) alkalmazásával lehet figyelembe venni. A Student eloszlás jellegzetessége, hogy az n mintaelemszámnak is függvénye, és ha n → ∞, akkor a Student görbe egyre jobban megközelíti a Gauss görbét, azaz Student görbe → Gauss görbe
23
A Student-eloszlást William Sealy Gosset (Canterbury, Kent, 1876. június 13. – Beaconsfield, Buckinghamshire, 1937. október 16.) angol statisztikus írta fel, és 1908-ban Student álnéven publikálta. W. S. Gosset 1908-ban
W. S. Gosset a híres, 1382-ben alapított Winchester College magángimnázium oxfordi kollégiumában kémiát és matematikát tanult, majd 1899-ben az ír Arthur Guinness (1725. szeptember 24. – 1803. január 23.) és fia világhírű dublini sörfőzdéjében helyezkedett el. Itt dolgozta ki matematikai statisztikai módszerét az árpa minőség vizsgálati eredmények megbízhatóságának megítélésére. Minthogy korábban egy másik munkatárs publikációjával kárt okozott a sörfőzdének, megtiltották az alkalmazottaknak, hogy tanulmányokat tegyenek közzé. Ez az oka annak, hogy W. S. Gosset álnéven írt. 24
A történethez tartozik, hogy Gosset nagyon jó munkakapcsolatba került az élettani laboratórium vezetőjével, Karl Pearson angol matematikussal (1857. március 27. – 1936. április 27.), a χ2-eloszlás és a korrelációs együttható kidolgozójával, akitől sokat tanult. A Student-féle eloszlás jelentőségét mégsem K. Pearson, hanem Ronald Aylmer Fisher (1890. február 17. – 1962. július 29.) angol genetikus és statisztikus, az F-eloszlás vagy Fisher-eloszlás Fisher kidolgozója ismerte fel. W. S. Gosset 1908-ban a Student-féle eloszlást a „t” betűvel jelölte, ezért azt t-eloszlásnak is nevezzük. A Student-féle vagy t-eloszlás sűrűségfüggvényének alakja: ænö n Gç ÷ 2 æ ö 2 t 2ø è ÷÷ f ( n -1) ( t ) = × çç1 + 1 n ( n - 1) ø æ ö Gç ÷ π × ( n - 1) è è 2 ø
ahol Γ a gamma-eloszlást jelöli:
¥
G( n ) ( t ) = ò t n -1 × e - t × dt 0
ahol t = - logx és G (n+1) = n·G (n) G (1) = 1 G (n) = (n – 1)! 25
Az egyoldali 5 %-os alulmaradási hányadhoz tartozó Student tényező (tn), 50 %-os elfogadási valószínűség mellett (Stange, K. – Henning, H.-J., 1966) Mintaelem szám n
Szabadságfok n-1
Studenttényező tn
Mintaelem szám n
Szabadságfok n-1
Studenttényező tn
2
1
6,314
12
11
1,796
3
2
2,920
13
12
1,782
4
3
2,353
14
13
1,771
5
4
2,132
15
14
1,761
6
5
2,015
20
19
1,729
7
6
1,943
30
29
1,699
8
7
1,895
35
34
1,691
9
8
1,860
100
99
1,660
10
9
1,833
500
499
1,648
11
10
1,812
∞
1,645
Esetünkben a Student-tényező az N(0,1) eloszlású t-eloszlás — egyoldali 5 %-os alulmaradási hányadához tartozó — tn valószínűségi változója (p = 0,05 értékhez 26 tartozó kvantilise, küszöbértéke).
Fogalommeghatározás (3) Standardizált valószínűségi változó: A ξ valószínűségi változó standardizáltja:
ξ sta =
M (ξ ) - ξ D(ξ )
azaz képezni kell az M(ξ) várhatóérték és a ξ valószínűségi változó különbségét, amelyet eltérésnek neveztünk (ezáltal a függvényt az origóba toljuk), és el kell osztani a D(ξ) szórással. Ez tulajdonképpen függvénytranszformáció.
A standardizált valószínűségi függvény várhatóértéke: 0, szórása: 1.
27
28
Standardizált eloszlásfüggvény 100 %ból kivont ordinátája. Például 95 %, ha a standardizált eloszlásfüggvény ordinátája p% = 5 %, vagy 97,5 %, ha p% = 2,5 % stb.
Ez a sor az f = 4 szabadság fokú (n = 5) standardizált Student-féle eloszlásfüggvény abszcisszáit (t) adja. Például tn=5 = 2,132 esetén p% = 5 %, vagy tn=2,5 = 2,776 esetén p% = 2,5 % stb.
Ez a sor (f = ∞) a standardizált Gaussféle eloszlásfüggvény abszcisszáit adja. Például t∞ = 1,645 esetén p% = 5 %, vagy t∞ = 1,960 esetén p% = 2,5 % stb.
29
p% = 10 5
2,5
1 0,5 0,1 0,05 %
Ha n → ∞, akkor Student görbe → Gauss görbe (sűrűségfüggvények bal oldala) 0,40 0,35
y = Relatív gyakoriság
0,30 0,25
Student(x;2) n=3 Student(x;5) n=6 Student(x;8) n=9 Student(x;11) n=12 Student(x;14) n=15
0,20 0,15 0,10
Student(x;34) n=35 Student(x;99) n=100 Student(x;499) n=500 Gauss(x;0;1)
0,05 0,00
x = Valószínűségi változó 30
Gauss- és Student-eloszlások standardizált sűrűségfüggvénye
Ga St uss St n=5 St n=1 0 0 St n= 00 St n=1 35 St n = 5 St n=9 1 2 St n=6 n= 3
p’
x1
x3
x5
x7
x9
x 11
x 13
x 15
x 17
31
Gauss- és Student-eloszlások standardizált sűrűségfüggvényének (az előző oldalon lévő térbeli hisztogram) adatai (p’ ordináták)
32
Ha n → ∞, akkor Student görbe → Gauss görbe (eloszlásfüggvények bal széle) és a 0,05 értékű (5 %-os) küszöbérték jobbra tolódik (nagyobb lesz)
p = A lu lm a r a d á s i h á n y a d u
0,7
Gauss- és Student-elszlások standardizált eloszlásfüggvénye Student(x;2) n=3
0,6 0,5
Student(x;5) n=6
Küszöbérték
0,4
Student(x;8) n=9 Student(x;11) n=12 Student(x;14) n=15 Student(x;34) n=35
0,3
Student(x;99) n=100
0,2
Student(x;499) n=100
0,1
Gauss(x;0;1) p=0,05
0,05
0
x = Valószínűségi változó
33
Gauss- és Student-eloszlások standardizált eloszlásfüggvénye
G St aus St n= s St n= 500 St n= 100 St n= 35 St n= 15 St n= 12 St n= 9 n= 6 3
p
x1
x3
x5
x7
x9
x 11
x 13
x 15
x 17
34
Gauss- és Student-eloszlások standardizált eloszlásfüggvényének (az előző oldalon lévő térbeli hisztogram) adatai (p ordináták)
35
EGY KIS JÁTÉK Ezt a horgászt 1998-ban nagy szerencse érte, mert óriási, 2 m hosszú harcsát fogott. Az év őszén arra kértem 55 főiskolai hallgatót, hogy becsülje meg a hal súlyát. súlyát Idézzük emlékezetünkbe, amit a mértékegységek tárgyalása során megbeszéltünk: az SI mértékegységrendszerben a súly mértékegysége N, a kg 36 pedig a tömeg mértékegysége.
Az óriás harcsa becsült súlya, 1. oldal Minta 500 750 1500 200 700 650 800 800 800 540 500 540 850 700 750 1200 400 780 870 600 200 1000 500 500 800 800 300 800
Rendezett minta 180 200 200 200 200 250 300 300 350 400 400 450 500 500 500 500 500 500 540 540 540 570 600 600 600 630 650 650
Sorszám 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28.
1998. szeptember 14-16-án 55 főiskolai hallgató a bemutatott fényképről megbecsülte a 2 m hosszú harcsa súlyát 5 %-os alsó küszöb, 0,05*55=2,75 N
Hisztogram
Hétfő 14 óra, Menedzser 6. csoport Hétfő 16 óra, Menedzser 2. csoport Szerda 12 óra, Magasépítő 6. csoport Szerda 14 óra, Magasépítő 3. csoport Szerda 16 óra, Magasépítő 7. csoport 25 %-os alsó kvantilis, 0,25*55=13,75 N
Hisztogram
A hallgatók közül huszonnégyen a súly helyett a tömeget adták meg, ugyanis [kg]-ban fejezték ki a kérdezett mennyiséget. Ez a megkérdezett hallgatók 43,6 %-a. A feltett kérdésre a helyes válasz: A hal súlya körülbelül 450 N, mert a hal tömege 46 kg volt. Súly = Tömeg * Nehézségi gyorsulás = = 46 kg * 9,81 m/sec2 = = 451,26 kg*m/sec2 = 451,26 N
Medián = 650
Hisztogram A rendezett minta középső elemének értéke.
37
Az óriás harcsa becsült súlya, 2. oldal Minta 600 400 540 700 500 1100 300 950 350 720 700 180 250 810 650 1000 800 450 600 700 630 500 570 650 660 200 200
Rendezett minta 650 660 700 700 700 700 700 720 750 750 780 800 800 800 800 800 800 800 810 850 870 950 1000 1000 1100 1200 1500
Sorszám 29. 30. 31. 32. 33. 34. 35. 36. 37. 38. 39. 40. 41. 42. 43. 44. 45. 46. 47. 48. 49. 50. 51. 52. 53. 54. 55.
Matematikai statisztikai jellemzők A becsült értékek átlaga: 637,090909 N A becsült értékek szórása: 263,724553 N A becsült értékek ferdesége: 0,49453691 A becsült értékek csúcsossága: 1,153008 Tehát a hallgatók a harcsa súlyát jelentős szórással túlbecsülték, a ferdeség a nagy értékek irányába nyúló aszimmetrikus eloszlást jelez, az eloszlás a normális eloszláshoz viszonyítva csúcsos eloszlás.
75 %-os felső kvantilis, 0,75*55=41,25
Hisztogram
38
Az óriás harcsa becsült súlya, 3. oldal Valószínűségi
Valószínűség
változó, N
180 200 200 200 200 250 300 300 350 400 400 450 500 500 500 500 500 500 540 540 540 570 600 600 600 630 650
Relatív valószínűség
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27
0,0182 0,0364 0,0545 0,0727 0,0909 0,1091 0,1273 0,1455 0,1636 0,1818 0,2000 0,2182 0,2364 0,2545 0,2727 0,2909 0,3091 0,3273 0,3455 0,3636 0,3818 0,4000 0,4182 0,4364 0,4545 0,4727 0,4909
Várhatóérték- 1,96* szórás: 123,1 N 5 %-os alsó küszöb valószínűsége: Hisztogram 0,05*55=2,75 Az 5 %-os alsó küszöb valószínűségi változója: Átlag - 1,645*szórás: 206,2 N Ekkor a szórások tartományában a valószínűségek 90 %-a található. Várhatóérték - egyszeres szórás: 376,3 N
25 %-os alsó kvantilis: 500 N és valószínűsége: 0,25*55=13,75
Hisztogram
Módusz, a lognormális eloszlás legnagyobb gyakoriságához tartozó valószínűségi változó: 455 N Ez valamivel több, mint az óriás harcsa tényleges, mért súlya (451,26 N).
Medián, lognormális eloszlás esetén: 556 N
A becsült értékek várhatóértéke: 640 N
A becsült értékek szórása: 39 263,7 N
Az óriás harcsa becsült súlya, 4. oldal Valószínűségi
Valószínűség
változó, N
650 650 660 700 700 700 700 700 720 750 750 780 800 800 800 800 800 800 800 810 850 870 950 1000 1000 1100 1200 1500
Relatív valószínűség
28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55
0,5091 0,5273 0,5455 0,5636 0,5818 0,6000 0,6182 0,6364 0,6545 0,6727 0,6909 0,7091 0,7273 0,7455 0,7636 0,7818 0,8000 0,8182 0,8364 0,8545 0,8727 0,8909 0,9091 0,9273 0,9455 0,9636 0,9818 1,0000
További matematikai statisztikai jellemzők A becsült értékek ferdesége: 0,495 A becsült értékek csúcsossága: 1,153
Hisztogram
55 főiskolai hallgató fénykép után megbecsülte az óriás harcsa súlyát. Ezen az oldalon a becslés matematikai statisztikai feldolgozása található. A hisztogramot és a közelítő normális, illetve lognormális eloszlások gyakoriságfüggvényeit négy ábrán mutatjuk be. 75 %-os alsó kvantilis: 800 N és valószínűsége. 0,75*55=41,25
Hisztogram
Normális eloszlás esetén az egyszeres szórások tartományában a valószínűségek 68,27 %-a, az 1,96-szoros szórások tartományában a valószínűségek 95 %-a található.
Várhatóérték + egyszeres szórás: 903,7 N
Várhatóérték + 1,96* szórás: 1156,9 N
40
Variabl e VAR 1 ; d istri bution: N orm al
Az óriás harcsa súlya valószínűségének gyakorisági görbéje K olm ogorov-Sm irnov d = . 1047420 , p = n. s. (szimmetrikus) normális Chi-Square: 4.027308, df = 1,eloszlás p = .0447777feltételezésével 24
Mó = Me = Várhatóérték
Normális eloszlás sűrűségfüggvény jellemzői Módusz = Medián = = Várhatóérték = 643,9 N
22 20 18
No of obs
16 14
Szimmetrikus görbe
12 10 8 6 4 2 0
0
200
400
Osztásköz: 200 N
600
800
1000
Category (upper lim its)
1200
1400
1600
1800
Valószínűségi változó, N
Y Expected 41
Variabl e VAR 1 ; d istri bution: N orm al
Az óriás harcsa súlya valószínűségének gyakorisági görbéje K olm ogorov-Sm irnov d = . 1047420 , p = n. s. (szimmetrikus) normális Chi-Square: 5.596978, df = 4,eloszlás p = .2313624feltételezésével 13
Mó = Me = Várhatóérték
12 11 10 9
Normális eloszlás sűrűségfüggvény jellemzői Módusz = Medián = = Várhatóérték = 643,8 N
No of obs
8 7
Szimmetrikus görbe
6 5 4 3 2 1 0
0
200 100
400 300
Osztásköz: 100 N
600 500
800 700
1000 900
1200 1400 1600 1800 1100 1300 1500 1700
Category (upper lim its)
Valószínűségi változó, N
Y Expected 42
Variable VAR1 ; distribution: Lognorm al
Az óriás harcsa súlya valószínűségének gyakorisági görbéje K olm ogorov-Sm irnov d = . 0849594 , p = n. s. (jobbra Chi-Square: ferde) lognormális 9.705349, df = 2, peloszlás = .0078132 feltételezésével 24
Mó Me Várhatóérték
22 20 18
No of obs
16
Lognormális eloszlás sűrűségfüggvény jellemzői Módusz = 455,0 N Medián = 555,6 N Várhatóérték = 636,8 N
14 12
Jobbra ferde görbe
10 8 6 4 2 0
0
200
400
Osztásköz: 200 N
600
800
1000
Category (upper lim its)
1200
1400
1600
1800
Valószínűségi változó, N
Y Expected
43
Variable VAR1 ; distribution: Lognorm al
Az óriás harcsa súlya valószínűségének gyakorisági görbéje K olm ogorov-Sm irnov d = . 0849596 , p = n. s. (jobbra Chi-Square: ferde) lognormális 10.87659, df = 4, peloszlás = .0280043 feltételezésével 13
Mó Me Várhatóérték
12 11 10 9
No of obs
8
Lognormális eloszlás sűrűségfüggvény jellemzői Módusz = 455,0 N Medián = 555,8 N Várhatóérték = 633,6 N
7 6
Jobbra ferde görbe
5 4 3 2 1 0
0
200 100
400 300
Osztásköz: 100 N
600 500
800 700
1000 900
1200 1400 1600 1800 1100 1300 1500 1700
Category (upper lim its)
Valószínűségi változó, N
Y Expected
44
Néhány fogalom (4) Módusz: A környezetében a legnagyobb (relatív) gyakorisághoz tartozó valószínűségi változó, magyarán a (relatív) gyakorisági görbe csúcsához tartozó abszcissza érték, amelyből akár több is lehet. Medián (latin = középső): A p = 0,5 értékhez tartozó kvantilis. Mindig a módusz és az átlag (várhatóérték) közé esik. A kilógó adatokkal szembeni kis érzékenysége miatt jobban jellemzi a nem normális eloszlásokat, mint az átlag vagy a várhatóérték. Kvantilis: Az a valószínűségi változó, amely adott arányban osztja fel a (relatív) gyakorisági görbe alatti területet, vagy a rendezett mintát stb. Lapultsági együttható (vagy nevezik csúcsossági együtthatónak is): Szimmetrikus gyakorisági görbe esetén a normál eloszlás alakjától való eltérést fejezi ki.
γ kurtosis
4
n × ( n - 1) æ x - xi ö ( n - 1)2 = × åç ÷ - 3× ( n - 1) × ( n - 2) × ( n - 3) i =1è s ø ( n - 2) × ( n - 3) n
A normális eloszlásénál laposabb gyakorisági görbe lapultsági együtthatója negatív szám: γkurtosis < 0. A normális eloszlás lapultsági együtthatója zérus: γkurtosis = 0. A normális eloszlásénál csúcsosabb gyakorisági görbe lapultsági együtthatója pozitív szám: γkurtosis > 0.
45
Néhány fogalom (5) Szimmetrikus eloszlás: Eloszlás, amelynek a ferdeségi együtthatója zérus: γskewness = 0. Ferdeség (skewness ejtsd: szkjunesz): Jobbra vagy balra ferde eloszlás tulajdonsága. Ferdeségi együttható:
γ skewness
n æ x - xi ö = × åç ÷ ( n - 1) × ( n - 2) i =1è s ø n
3
Jobbra ferde eloszlás: Ha az eloszlás gyakorisági görbéje hosszan jobbra elnyúlik, akkor azt mondjuk, hogy jobbra dől, ekkor ferdeségi együtthatója pozitív szám: γskewness > 0. (Általában ilyen a kisebb szilárdságú anyagok szilárdsági eloszlása.) Balra ferde eloszlás: Ha az eloszlás gyakorisági görbéje hosszan balra elnyúlik, akkor azt mondjuk, hogy balra dől, ekkor ferdeségi együtthatója negatív szám: γskewness < 0. (Általában ilyen a nagyobb szilárdságú anyagok szilárdsági eloszlása.)
46
Néhány fogalom (6) Módusz – medián – átlag (várhatóérték) viszonya ferde eloszlás esetén: • Ferde eloszlás esetén a medián (középső valószínűségi változó) a gyakorisági görbe csúcsától – a módusztól – a ferdeség irányába esik. • A medián mindig a módusz és a számtani átlag (várhatóérték) közé esik. • Jobbra ferde eloszlás esetén a számtani átlag (várhatóérték) nagyobb, mint a medián (Me): m > Me • Balra ferde eloszlás esetén a számtani átlag (várhatóérték) kisebb, mint a medián (Me): m < Me
47
Magyarországon 1980-2002 között, az MSZ 4720-2:1980 szabvány szerint a beton nyomószilárdságának jellemző értékét (küszöbértékét, Rk) a beton nyomószilárdsági eloszlása ferdeségének feltételezésével (k tényező) számítottuk ki.
Szórás Student tényező
Jobbra ferde
Szimmetrikus
Balra ferde
48
Beton próbatestek vizsgálati eredménye Nyomószilárdság 2
N/mm 32,8 35,1 31,9 34,2 28,7 31,7
R m = 32,4 átlag s =
2,24 szórás
Számpélda a vizsgálati eredmények eloszlása ferdeségének figyelembevételére a k tényezővel Értékelés a régi, ma már érvénytelen MSZ 4719:1982 és MSZ 4720/2:1980 szabvány alapján Eloszlás tényező: k = 1,125 Student tényező: t = 2,015 k ·t ·s szorzat = 5,1 Jellemző érték: R k = 2 = R m - k ·t ·s = 27,3 N/mm Megfelel, ha a megkövetelt minősítési 2
érték: R k,nom = 25 N/mm
A példa beli vizsgálati eredmények eloszlása balra (a kisebb szilárdságok tartománya felé) ferde.
49
Histogramm (Tabelle2 in Arbeitsmappe1.stw 699v*699c) Var1 = 699*0,5*gamma(x/0,1494; 46,2111)/0,1494 25,8%
180
24,7%
22,9%
% der Beob.
20,0%
18,3%
160
Példa a jobbra ferde gamma eloszlásra
19,2%
140
17,2%
120
14,3%
100
11,4%
80
10,7%
8,6%
7,3%
6,7%
5,6%
5,7%
40
3,3%
2,9% 0,0%
60
3,0% 1,1%
0,0% 4,5
5,0
5,5
6,0
6,5
7,0
7,5 A gt
8,0
8,5
9,0
9,5
20 0,0%
10,0 10,5
50
0
Histogramm (Tabelle2 in Arbeitsmappe1.stw 699v*699c) Var1 = 699*0,5*lognorm(x; 1,921; 0,1456) 25,8%
180
24,7%
22,9%
% der Beob.
20,0%
18,3%
160
Példa a jobbra ferde lognormális eloszlásra
19,2%
140
17,2%
120
14,3%
100
11,4%
80
10,7%
8,6%
7,3%
6,7%
5,6%
5,7%
40
3,3%
2,9% 0,0%
60
3,0% 1,1%
0,0% 4,5
Var1: N = 699
5,0
5,5
6,0
6,5
7,0
7,5 A gt
8,0
8,5
9,0
9,5
20 0,0%
10,0 10,5
51
0
Histogramm (Tabelle2 in Arbeitsmappe1.stw 699v*699c) Var1 = 699*0,5*extreme(x; 6,426; 0,7925) 25,8%
180
24,7%
22,9%
% der Beob.
20,0%
18,3%
160
Példa a jobbra ferde extrém (Gumbel) eloszlásra
19,2%
140
17,2%
120
14,3%
100
11,4%
80
10,7%
8,6%
7,3%
6,7%
5,6%
5,7%
40
3,3%
2,9% 0,0%
60
3,0% 1,1%
0,0% 4,5
5,0
5,5
6,0
6,5
7,0
7,5 A gt
8,0
8,5
9,0
9,5
20 0,0%
10,0 10,5
52
0
Hi sto g ra m m (T a b e l l e 2 i n A rb e i tsm a p p e 1 .stw 6 9 9 v*6 9 9 c) Fp 0 ,2 = Di sta n z-g e wi chte te kl e i n ste Q u a d ra te 40%
280 3 7 ,2 %
37% 34% 31%
240
Példa a balra ferde legkisebb négyzetek eloszlásra
220 2 8 ,0 %
29%
% der Beob.
260
200
26%
180
23%
160
20%
140
1 8 ,5 %
17%
120 1 3 ,4 %
14% 11%
100
9%
80 Va r2 : N = 6 9 9 ; M w. = 1 8 1 ,5 5 4 2 2 ; S td a b w. = 5 ,1 1 3 4 0 0 9 9 ; M a x. = 1 9 5 ,6 ; M i n . = 1 6 3 ,6 ; D = 0 ,0 9 6 5 1 8 4 8 1 6 ; p < 0 ,0 1 0 0 ; L i l li e fo rs-p < 0 ,0 0 9 9 9 9 9 9 9 7 8 60
6%
40
3% 0%
1 ,4 %
0 ,3 % 160
165
20
1 ,0 % 170
175
180 Fp0,2
185
190
0 ,1 % 195
2 0 0 53
0
Regressziós közelítés a legkisebb hibanégyzet összegek módszerével Egyenes együtthatóinak kétismeretlenes egyenletrendszere
y = a*x+b
← Ez a függvény alak
F = å ( yi - y ) = å ( yi - a * xi - b ) Þ min 2
2
¶F = - 2 * å ( y i - a * x i - b )* x i = 0 ¶a
¶F = -2 * ¶b
å (y
i
- a * xi - b )= 0
åx * y -a*åx -b*åx = 0 å y - a*å x -b*n = 0 2
i
i
i
i
i
i
Elnevezések: (yi – y) = hiba (yi – y)2 = hibanégyzet Σ(yi – y)2 = hibanégyzet összeg Módszer neve ezért: Legkisebb hibanégyzet összegek módszere Az F hibanégyzet összeg függvénynek ott van szélső értéke, esetünkben minimuma, ahol a deriváltjainak (¶F/¶a és ¶F/¶b) az értéke zérus (érintője vízszintes):
54
å
Db =
n
å x* y åy
2 x å
åx
Összefüggés az ultrahang sebessége és a beton nyomószilárdsága között
30
åx n
å x* y åy
y = 0,0132*x - 33,759 2
25
R = 0,6317 R = 0,7948
yi
2
Da =
Regressziós közelítés egyenessel
Nyomószilárdság, N/mm
D =
x
20
15
yi - y
åx åx
2
y 10
5
Da a = D
Db b = D
Meghatározandó részmennyiségek:
0 3000
3500
4000
4500
Ultrahang sebessége, m/s
x Sxi i y Syi i
2 x Sxi i2 x Sxi*y i i i*y
55
Másodfokú parabola együtthatóinak háromismeretlenes egyenletrendszere
y = a * x2 + b * x + c
← Ez a közelítő függvény alakja
F = å ( yi - y ) = å ( yi - a * xi - b * xi - c) Þ min 2
2
2
¶F = - 2 * å ( yi - a * xi 2 - b * xi - c ) * xi 2 = 0 ¶a
¶F = - 2 * å yi - a * xi 2 - b * xi - c * x i = 0 ¶b
(
)
¶F = - 2 * å yi - a * x i 2 - b * xi - c = 0 ¶c
(
)
56
åx
2
i
* yi - a * å xi 4 - b * å xi 3 - c * å xi 2 = 0
Regressziós közelítés másodfokú parabolával
3 2 x * y a * x b * x å i i å i å i - c * å xi = 0
å
yi - a * å xi 2 - b * å xi - c * n = 0
D =
åx åx åx
åx = åx åx
4
i
Db
3
i
2
2
i
i
Da
n
i
2
i
i
i
2
i
i
Dc =
i
Da a = D Meghatározandó részmennyiségek:
åx åx åx
4 i
i
3
3
2 i
2
2
i
n
i
åx *y åx *y åy 2
i
2
i
Db b = D xi i øSx yi i øSy
åx åx åx
åx åx i
i
i
i
3
i
i
åx *y åx åx *y åx n åy i
åx * y åx = åx * y åx åy åx 2
2
i
i
i
2
åx åx
3
i
3
i
åx åx åx i
i
i
4 i
i
i
i
i
i
Dc c = D
xi2i2 xi3i3 øSx øSx 2 *yi i xi*y xi2i *y øSx i*yi i øSx
xi4i4 øSx
57
A közelítés pontosságáról a korrelációs együttható (egyenes esetén), illetve a korrelációs index (görbe esetén) ad felvilágosítást.
2 å ( yi - y ) R = 12 å yi ö æ y åç i ÷ n ø è
30
y = 0,0132*x - 33,759 2
R = 0,6317 R = 0,7948 25 2
Nyomószilárdság, N/mm
Mennél pontosabb a közelítés, az R korrelációs együttható, illetve index annál nagyobb és értéke mind inkább tart az 1,0hez: R → 1,0
Összefügg és az ultrahang sebessége és a beton nyomószilárdsága között
20
15
10 2
5
y = (4E-06)*x - 0,0171*x + + 19,984 2
R = 0,6399
A korrelációs együtthatót, illetve indexet az irodalomban I-vel is jelölik.
0 3000
3500
R = 0,7999
4000
Ultrahang se be ssége , m/s
4500
58
KÖSZÖNÖM A FIGYELMÜKET
59