Berzsenyi Dániel Főiskola
ÁLTALÁNOS STATISZTIKA műszaki menedzser alapszak
Írta: Dr. Kövesi János Tóth Zsuzsanna Eszter
Budapest 2006
Tartalomjegyzék 1.
VALÓSZÍNŰSÉGSZÁMÍTÁSI ALAPOK ............................................................................................... 4 1.1. A VALÓSZÍNŰSÉGSZÁMÍTÁS TÁRGYA ............................................................................................................ 5 1.2. A VALÓSZÍNŰSÉG FOGALMA ......................................................................................................................... 6 1.3. A VALÓSZÍNŰSÉGSZÁMÍTÁS AXIÓMARENDSZERE.......................................................................................... 6 1.4. A VALÓSZÍNŰSÉG MEGHATÁROZÁSÁNAK MÓDSZEREI .................................................................................. 7 1.5. A VALÓSZÍNŰSÉGSZÁMÍTÁS JELENTŐSÉGE A MŰSZAKI-GAZDASÁGI ELEMZÉSEKBEN .................................... 8
2. VALÓSZÍNŰSÉGSZÁMÍTÁSI TÉTELEK, FELTÉTELES VALÓSZÍNŰSÉG, ESEMÉNYEK FÜGGETLENSÉGE............................................................................................................................................. 9 2.1. VALÓSZÍNŰSÉGSZÁMÍTÁSI TÉTELEK ........................................................................................................... 10 2.2. A FELTÉTELES VALÓSZÍNŰSÉG FOGALMA ................................................................................................... 12 2.3. A TELJES VALÓSZÍNŰSÉG TÉTELE ................................................................................................................ 15 2.4. BAYES-TÉTEL ("AZ OKOK VALÓSZÍNŰSÉGÉNEK TÉTELE")........................................................................... 18 2.5. ESEMÉNYEK FÜGGETLENSÉGE .................................................................................................................... 22 3.
LEÍRÓ STATISZTIKA ............................................................................................................................ 23 3.1. A LEÍRÓ STATISZTIKA HELYE, SZEREPE A STATISZTIKA VILÁGÁBAN ........................................................... 24 3.2. A STATISZTIKAI LEÍRÁS CÉLJA, MÓDSZEREI ................................................................................................ 24 3.3. AZ ADATOK ÁBRÁZOLÁSA .......................................................................................................................... 25 3.4. TAPASZTALATI ELOSZLÁSOK ...................................................................................................................... 28 3.5. A TAPASZTALATI ELOSZLÁSOK KÖZÉPÉRTÉK-MUTATÓI ............................................................................. 34 3.6. AZ INGADOZÁS MÉRŐSZÁMAI ..................................................................................................................... 42 3.7. AZ ELOSZLÁS ALAKJÁT JELLEMZŐ EGYÉB MUTATÓSZÁMOK ....................................................................... 45 3.8. ESETTANULMÁNY – LEÍRÓ STATISZTIKAI ELEMZÉS ..................................................................................... 47 3.9. VISZONYSZÁMOK........................................................................................................................................ 53
4.
KORRELÁCIÓ- ÉS REGRESSZIÓSZÁMÍTÁS I. ............................................................................... 56 4.1. DETERMINISZTIKUS ÉS SZTOCHASZTIKUS KAPCSOLATOK ........................................................................... 57 4.2. A KAPCSOLAT SZEMLÉLTETÉSE................................................................................................................... 58 4.3. AZ ELŐJEL–KORRELÁCIÓS EGYÜTTHATÓ .................................................................................................... 59 4.4. A LINEÁRIS REGRESSZIÓ ÉS A KORRELÁCIÓ ................................................................................................ 61 4.5. AUTO- ÉS KERESZTKORRELÁCIÓ IDŐSOROK ELEMZÉSÉNÉL ......................................................................... 65
5.
VALÓSZÍNŰSÉGI VÁLTOZÓ, ELMÉLETI ELOSZLÁSOK............................................................ 68 5.1. A VALÓSZÍNŰSÉGI VÁLTOZÓ ....................................................................................................................... 69 5.2. VALÓSZÍNŰSÉGI VÁLTOZÓ JELLEMZŐI ........................................................................................................ 70 5.3. BINOMIÁLIS ELOSZLÁS................................................................................................................................ 73 5.4. POISSON-ELOSZLÁS .................................................................................................................................... 75 5.5. EXPONENCIÁLIS ELOSZLÁS ......................................................................................................................... 77 5.6. NORMÁLIS (GAUSS-) ELOSZLÁS .................................................................................................................. 81 5.7. A KÖZPONTI HATÁRELOSZLÁS TÉTELE ........................................................................................................ 87
6.
STATISZTIKAI DÖNTÉSEK ALAPELVEI ......................................................................................... 89 6.1. ESETPÉLDA................................................................................................................................................. 90 6.2. DÖNTÉSI ALAPMODELL ............................................................................................................................... 90 6.3. DÖNTÉSI MÁTRIX ........................................................................................................................................ 92 6.4. A DÖNTÉSI FOLYAMAT LOGIKÁJA ............................................................................................................... 92 6.5. DÖNTÉSI OSZTÁLYOK ÉS DÖNTÉSI KRITÉRIUMOK........................................................................................ 93 6.6. A MINTAVÉTEL ÉS A KÖVETKEZTETÉS HIBÁI ............................................................................................... 98
7.
BECSLÉS ................................................................................................................................................. 102 7.1. A BECSLÉS TULAJDONSÁGAI ..................................................................................................................... 103 7.2. A PONTBECSLÉS MÓDSZEREI ..................................................................................................................... 107 7.3. INTERVALLUMBECSLÉS ............................................................................................................................ 109
2
8.
HIPOTÉZISVIZSGÁLATOK I. NEMPARAMÉTERES PRÓBÁK ................................................. 117 8.1. A HIPOTÉZISVIZSGÁLAT ÁLTALÁNOS MENETE .......................................................................................... 118 8.2. ILLESZKEDÉSVIZSGÁLAT χ2-PRÓBÁVAL.................................................................................................... 120
9.
HIPOTÉZISVIZSGÁLATOK II. SZÓRÁSOK ÖSSZEHASONLÍTÁSA......................................... 124 9.1. AZ ALAPSOKASÁG VARIANCIÁJÁRA VONATKOZÓ EGYMINTÁS PRÓBA ...................................................... 125 9.2. KÉT SZÓRÁSNÉGYZET ÖSSZEHASONLÍTÁSA: F-PRÓBA ............................................................................... 126 9.3. TÖBB SZÓRÁS ÖSSZEHASONLÍTÁSÁRA VONATKOZÓ PRÓBÁK .................................................................... 127
10.
HIPOTÉZISVIZSGÁLATOK III. KÖZÉPÉRTÉKRE VONATKOZÓ PRÓBÁK ......................... 129
10.1. VÁRHATÓ ÉRTÉKRE IRÁNYULÓ PRÓBÁK ................................................................................................. 130 10.2. KÉT FÜGGETLEN MINTA VÁRHATÓ ÉRTÉKÉNEK ÖSSZEHASONLÍTÁSA...................................................... 132 10.3. PÁROS MINTÁK VÁRHATÓ ÉRTÉKÉNEK ÖSSZEHASONLÍTÁSA ................................................................... 137 10.4. VARIANCIAANALÍZIS .............................................................................................................................. 138 11.
KORRELÁCIÓ- ÉS REGRESSZIÓSZÁMÍTÁS II............................................................................. 141
11.1. A (LINEÁRIS) KORRELÁCIÓS EGYÜTTHATÓ ............................................................................................. 142 11.2. AZ R(X,Y) ÉS A REGRESSZIÓS EGYENES ÖSSZEFÜGGÉSE .......................................................................... 144 11.3. A REGRESSZIÓS BECSLÉS PONTOSSÁGA ................................................................................................... 145 12.
FELHASZNÁLT ÉS AJÁNLOTT IRODALOM ................................................................................. 151
13.
FÜGGELÉK: TÁBLÁZATOK .............................................................................................................. 153
3
1. VALÓSZÍNŰSÉGSZÁMÍTÁSI ALAPOK
Valószínűségszámítás Valószínűségszámítás Valószínűségelmélet Valószínűségelmélet
Matematikai Matematikai statisztika statisztika
Axiómák, Axiómák, alaptételek alaptételek
Minta Minta vétel vétel
Kombinatorika Kombinatorika
Leíró Leíró statisztika statisztika
Geometriai Geometriai val.sz. val.sz.
Becslés Becslés
Val.szám Val.szám tételek tételek
Hipotézisvizsgálat Hipotézisvizsgálat
Elméleti Elméletieloszlások eloszlások
Összefüggésvizsgálat Összefüggésvizsgálat
4
1.1. A VALÓSZÍNŰSÉGSZÁMÍTÁS TÁRGYA
A véletlen jelenség fogalma:
A tömegjelenség fogalma:
5
1.2. A VALÓSZÍNŰSÉG FOGALMA
A valószínűség fogalma A
n
f(A)
g ( A) =
f ( A) n
lim g ( A) = P( A) n →∞
¾
Készítette: Erdei János
1. ábra: A valószínűség fogalma
1.3. A VALÓSZÍNŰSÉGSZÁMÍTÁS AXIÓMARENDSZERE
(Kolmogorov 1931/32) I. Egy tetszőleges A esemény bekövetkezési valószínűsége 0 ≤ P(A). II. A biztos esemény valószínűsége 1, azaz P(Ω) = 1. III. Ha A és B egymást kizáró események, azaz A⋅B = 0, akkor P(A+B)= P(A) + P(B).
6
1.4. A VALÓSZÍNŰSÉG MEGHATÁROZÁSÁNAK MÓDSZEREI
Klasszikus valószínűség-meghatározás:
Geometriai úton:
Valószínűségszámítási tételek segítségével:
Empirikus adatokból:
Elméleti eloszlások segítségével:
Szubjektív becsléssel:
7
1.5. A VALÓSZÍNŰSÉGSZÁMÍTÁS JELENTŐSÉGE A MŰSZAKI-GAZDASÁGI ELEMZÉSEKBEN
8
2. VALÓSZÍNŰSÉGSZÁMÍTÁSI TÉTELEK, FELTÉTELES VALÓSZÍNŰSÉG, ESEMÉNYEK FÜGGETLENSÉGE
Valószínűségszámítás Valószínűségszámítás Valószínűségelmélet Valószínűségelmélet
Matematikai Matematikai statisztika statisztika
Axiómák, Axiómák, alaptételek alaptételek
Minta Minta vétel vétel
Kombinatorika Kombinatorika
Leíró Leíró statisztika statisztika
Geometriai Geometriai val.sz. val.sz.
Becslés Becslés
Val.szám Val.szám tételek tételek
Hipotézisvizsgálat Hipotézisvizsgálat
Elméleti Elméleti eloszlások eloszlások
Összefüggésvizsgálat Összefüggésvizsgálat
9
2.1. VALÓSZÍNŰSÉGSZÁMÍTÁSI TÉTELEK
Tétel: Ha A és B egy eseményalgebra két tetszőleges eseménye, akkor annak valószínűsége, hogy közülük legalább egy bekövetkezik:
P ( A + B ) = P( A) + P( B ) − P( A ⋅ B ) Bizonyítás:
Tétel: Ha A esemény bekövetkezése maga után vonja a B esemény bekövetkezését, azaz A⊂B, akkor:
P ( B − A) = P( B ) − P( A) és
P( A) ≤ P( B ) Bizonyítás:
Feladat: Mutassuk ki, hogy P(A)≥0,7 és P(B)≥0,9 esetén P(A⋅B)≥0,6.
10
Feladat: Próbagyártás után két szempontból vizsgáljuk a késztermékeket. Az A esemény azt jelenti, hogy a vizsgált gyártmány anyaghibás, a B esemény pedig azt, hogy mérethibás. Az A esemény P(A)=0,15, a B esemény P(B)=0,3 és az A·B esemény P(A·B)=0,08 valószínűséggel következik be. Mi a valószínűsége annak, hogy valamely késztermék hibátlan?
Feladat: Egy iskola tanulóinál a jeles matematika és a jeles fizika osztályzatokat figyeljük. A következő eseményeket vezetjük be tetszőlegesen kiválasztott tanulókra: A: jeles osztályzata van matematikából, B: jeles osztályzata van fizikából. Ismeretesek a következők: annak valószínűsége, hogy egy véletlen kiválasztott tanulónak jelese van fizikából: P(B)=0,11; hogy jelese van matematikából és fizikából: P(A·B)=0,09; hogy a matematika és fizika tárgyak közül legalább egyikből jeles az osztályzata: P(A+B)=0,16. Mi a valószínűsége annak, hogy egy tetszőlegesen kiválasztott tanulónak jeles osztályzata van matematikából?
11
2.2. A FELTÉTELES VALÓSZÍNŰSÉG FOGALMA
Definíció: Ha A és B egy eseményalgebra két eseménye és P(B)>0, akkor a
P ( A| B ) =
P( A ⋅ B) P( B)
hányadost az A eseménynek a B eseményre vonatkoztatott feltételes valószínűségének nevezzük.
12
Feladat: Egy szállítmány 96 %-a megfelel a minőségi előírásoknak, s ezek 75 %-a első osztályú. Mekkora a valószínűsége annak, hogy egy találomra kiválasztott darab első osztályú?
Feladat: Egy telefonfülke előtt állunk és várjuk, hogy az előttünk beszélő befejezze a beszélgetést. Az illető beszélgetési időtartama (τ) véletlen esemény, melyre érvényes a következő:
P(τ 〈t ) = 1 − e
−
t 3
a.) Határozzuk meg annak a valószínűségét, hogy a beszélgetés 3 percnél tovább tart! b.) Mennyi annak a valószínűsége, hogy a beszélgetés további 3 percnél tovább tart, feltéve, hogy eddig 3 percnél tovább tartott? c.) Mennyi annak a valószínűsége, hogy a beszélgetés t+3 percnél tovább tart, feltéve, hogy t percnél tovább tartott?
13
Feladat: Egy börtönben három elítéltet tartanak fogva: A-t, B-t és C-t. A következő napon egyiküket felakasztják. A börtönőr tudja kit akasztanak fel, de nem szabad elárulnia. Az A fogoly a következőt kérdezi a börtönőrtől: "Áruld el a másik két fogoly közül egy olyannak a nevét, akit holnap nem akasztanak fel. Ha mindketten szabadok lesznek, akkor döntsd el magadban, hogy kinek a nevét mondod. Ezzel nem árulsz el titkot, mert azt már tudom, hogy egyikük szabad lesz." A börtönőr némi gondolkodás után így válaszolt: "Nem, ez nem volna emberséges veled szemben. Most úgy gondolod, hogy 1/3 valószínűséggel akasztanak fel. Ha elárulom a többiek közül egy olyannak a nevét, akit nem akasztanak fel, akkor az esélyeid megnövekednek, úgy fogod gondolni, hogy 1/2 valószínűséggel akasztanak fel. Nem tudnál nyugodtan aludni". Helyesen érvelt-e a börtönőr?
14
2.3. A TELJES VALÓSZÍNŰSÉG TÉTELE
Tétel: Ha B1, B2, ........Bn teljes eseményrendszer és P(Bk)>0 (k=1,2,...n), A pedig egy tetszőleges esemény, akkor: n
P ( A) = ∑ P ( A|Bk ) ⋅ P ( Bk ) k =1
Bizonyítás:
15
Feladat: Az MBA programban a "Kvantitatív módszerek" vizsgán a férfiak 60 %-a, a hölgyek 80 %-a szerepel sikeresen. A férfiak az évfolyam 45 %-át teszik ki. Mekkora a valószínűsége, hogy egy találomra kiválasztott hallgató sikeresen szerepel a vizsgán?
Feladat: Három műszak azonos terméket gyárt. Egy adott napon az összes termékből az I. műszakban 40%, a II. és III. műszakban 30-30% készül. Az átlagos selejtarányok: I. műszak = 5%, II. műszak = 7%, III. műszak = 10%. Az összes termékből a MEO egy darabot kiválaszt, mekkora a valószínűsége, hogy az hibátlan?
16
Feladat: Egy gyártóberendezés munkaidejének 1/3 részében az „A” terméket, 1/6 részében a „B” terméket, a többiben pedig a „C” terméket gyártja. Az „A” termék gyártásakor az erre fordított idő 10%-ában áll a berendezés, a „B” termék gyártása közben végig dolgozik, míg a „C” termék gyártásakor a munkaidő 25%-ában áll. Mekkora a valószínűsége annak, hogy egy találomra kiválasztott időpontban áll a berendezés?
Feladat: Egy üzem 8 berendezése egyforma terméket gyárt. Az első három gép együttvéve 4% selejtet termel, a következő négy gépnél együttvéve 3% a selejt, míg az utolsó gép selejtaránya 1,5%. Az elkészült termékeket egy helyen gyűjtik. Mekkora a valószínűsége, hogy egy véletlenszerűen kiválasztott darab selejtes lesz?
17
2.4. BAYES-TÉTEL ("AZ OKOK VALÓSZÍNŰSÉGÉNEK TÉTELE") Tétel: Ha B1, B2, ........Bn teljes eseményrendszer és P(Bk)>0 (k=1,2,...n), A pedig egy olyan esemény, amelyre P(A)>0, akkor:
P ( Bk |A ) =
P ( A| Bk ) ⋅ P ( Bk ) n
∑ P( A| B ) ⋅ P ( B ) i
i
i =1
ahol: P(BkA) P(Bk)
”posteriori" valószínűségek, ”priori" valószínűségek.
Bizonyítás:
18
Feladat: Alkatrész-ellátásnál a pótalkatrészt 40%-ban a I. szállító szállítja 10% selejttel, 60%-ban pedig a II. szállító szállítja 20% selejttel. Az alkatrészraktárból kivettünk egy pótalkatrészt és azt találtuk, hogy hibás. Mekkora a valószínűsége, hogy a kiválasztott alkatrész a II. szállítótól jött?
Feladat: Egy üzemből kikerülő áru 75% valószínűséggel I. osztályú. A készterméket megvizsgálják. Annak a valószínűsége, hogy a vizsgálat során az I. osztályú terméket nem I. osztályúnak minősítik 2%. Annak a valószínűsége, hogy egy nem I. osztályú terméket I. osztályúnak minősítenek 5%. Mekkora a valószínűsége annak, hogy egy olyan termék, amelyik egy vizsgálat során I. osztályú minősítést kapott, valóban I. osztályú?
19
Feladat: Egy folyóban bekövetkező halpusztulásért 3 ipari üzem lehet felelős. Tapasztalatok szerint a mérgező anyag kibocsátásának valószínűsége az egyes üzemeknél: 20%, 50% és 30%. A mérések szerint az egyes üzemek szennyvízkibocsátása esetén a halpusztulás valószínűsége: 60%, 15% és 25%. Mennyi a halpusztulás teljes valószínűsége? Mekkora bírságot szabjon ki a 2.500.000 Ft-os halkárért a bíróság, ha nem ismeretes, ki a szennyezés kibocsátója a három üzem közül? (A bírságok összege a teljes halkár.)
Feladat: Bertrand problémája: tekintsünk három szekrényt, amelyek mindegyikében két fiók van. Az első szekrény mindkét fiókjában egy-egy aranygolyó, a második szekrény egyik fiókjában arany-, a másodikban ezüstgolyó, a harmadik szekrény mindkét fiókjában ezüstgolyó van. Találomra választunk egy szekrényt (azaz bármelyiket egyenlő valószínűséggel választhatjuk), kihúzunk egy fiókot és abban aranygolyót találunk. Mekkora a valószínűsége annak, hogy az első szekrényt választottuk?
20
Feladat: Egy irodában 3 munkatárs dolgozik párhuzamosan azonos típusú ügyiratok intézésén. Az első naponta 10 aktával végez, a második napi 15, a harmadik napi 25 aktával. Az egyes munkatársaknál naponta átlagosan 0,3; 0,9; 0,5 db hibásan kezelt ügyirat található. Az összesített napi mennyiségből találomra kiveszünk egy aktát és azt rossznak találjuk. Mekkora a valószínűsége, hogy azt az első munkatárs készítette?
21
2.5. ESEMÉNYEK FÜGGETLENSÉGE
Definíció: A és B események (sztochasztikusan) függetlenek, ha P(A⋅B)=P(A)·P(B). Az A esemény független B eseménytől, ha a P(AB) feltételes valószínűség nem függ a feltételtől:
P ( A| B ) =
P ( AB ) = P ( A) P( B)
Tétel: Ha A és B függetlenek, akkor A és B , A és B, valamint A és B is függetlenek. Bizonyítás:
Tétel: Ha három esemény páronként független, még nem biztos, hogy "teljesen függetlenek", azaz még teljesül az is, hogy: P(A·B·C)=P(A)⋅P(B)⋅P(C)
Feladat: Két kockával dobunk. Jelentse A azt az eseményt, hogy az első kockával párost dobunk, B azt az eseményt, hogy a második kockával páratlant dobunk és C azt az eseményt, hogy mindkettővel párost, vagy mindkettővel páratlant dobunk. A, B és C események teljesen függetlenek-e?
Definíció: Az A1, A2, ... An események teljesen függetlenek, ha közülük kiválasztott tetszőleges számú eseményre teljesül, hogy az együttes bekövetkezésük valószínűsége egyenlő az egyes valószínűségek szorzatával.
22
3. LEÍRÓ STATISZTIKA
Valószínűségszámítás Valószínűségszámítás Valószínűségelmélet Valószínűségelmélet
Matematikai Matematikai statisztika statisztika
Axiómák, Axiómák, alaptételek alaptételek
Minta Minta vétel vétel
Kombinatorika Kombinatorika
Leíró Leíró statisztika statisztika
Geometriai Geometriai val.sz. val.sz.
Becslés Becslés
Val.szám Val.szám tételek tételek
Hipotézisvizsgálat Hipotézisvizsgálat
Elméleti Elméleti eloszlások eloszlások
Összefüggésvizsgálat Összefüggésvizsgálat
23
3.1. A LEÍRÓ STATISZTIKA HELYE, SZEREPE A STATISZTIKA VILÁGÁBAN A számszerű információ, annak mérése és elemzése alapvető szerepet játszik a társadalmi és gazdasági jelenségek elemzésében. E számszerű adatok a legtöbb esetben azzal a sajátossággal rendelkeznek, hogy a megfigyelésük, a feldolgozásuk, elemzésük és az elemzés eredményeinek felhasználása tudományos módszereket igényel. A statisztikai módszerek között említhetünk meglehetősen egyszerű eljárásokat, és természetesen vannak ennél bonyolultabb, összetettebb matematikai-statisztikai módszerek. Magának a statisztikai módszertannak -a konkrét vizsgálat tárgya alapján- szokás többféle ágát megkülönböztetni, a sokféle csoportosítási lehetőség közül a mi szempontunkból célszerű különválasztani a leíró és a következtető statisztika világát. A kettő közötti lényegi különbség a következőkben ragadható meg: • a leíró statisztika célja a vizsgálat tárgyát képező jelenség tömör, számszerű jellemzése az adatok elemzése és rendezése alapján (pl. 10 évente tartott népszámlálások adatainak feldolgozása); • míg a következtető statisztika célja – mint azt a későbbi fejezetekben látni fogjuk – a mintából történő következtetés és általánosítás a teljes sokaságra vonatkozóan (pl. néhány ezer háztartás jövedelmi adataiból megfelelő pontossággal megbecsülhető, hogy a magyar lakosság körében milyen jövedelmi különbségek vannak). A leíró statisztika a megfigyelt adatok bemutatását, összefoglaló jellemzését tűzi ki célul, és ehhez az elemzéshez sokoldalú eszköztárt kínál, ebben a fejezetben célunk ennek az eszköztárnak a bemutatása.
3.2. A STATISZTIKAI LEÍRÁS CÉLJA, MÓDSZEREI Ha a célnak megfelelően összegyűjtött adathalmaz áll rendelkezésünkre, akkor a következtetések felé tett első lépésünk a minta feldolgozása, ennek kérdéskörével foglalkozik a leíró statisztika. A statisztikai leírás célja a minta adatainak áttekinthető formába történő rendezése, tömörítése, az adatok grafikus megjelenítése, ábrázolása és egyes jellemző értékeinek meghatározása. Így az adatok feldolgozásának kettős célja van: egy grafikus kép, pontosabban egy tapasztalati eloszláskép produkálása; a másik pedig statisztikai mutatók meghatározása. A leíró statisztika e területei közül egyedül a rendezés, tömörítés pusztán technikainak tűnő, az adatok ábrázolása és a statisztikai jellemzők meghatározása lényeges szemléleti, a sztochasztikus gondolkodást, “látást” megalapozó területek. A statisztikai jellemzők segítségével a nagyszámú adat jellegzetességeit néhány adatba sűrítve próbáljuk megragadni. A statisztikai jellemzőket általában három fő csoportba soroljuk, éppen az alapján, hogy az adatok milyen jellegzetességét ragadják meg: • • •
a középértékek: az adathalmaz közös, tipikus, jellegzetes, általános vonásait kísérlik megragadni egy-egy szám segítségével. az ingadozásmutatók: az egyedi, különös, speciális, sajátos, eltérő jellegzetességek mértékét mutatják meg. az eloszlás alakjára jellemző egyéb mérőszámok: aszimmetria mértékét, az adatok eloszlásának lapultságát, csúcsosságát jellemző mutatók.
Bármilyen adathalmaz esetén a feladatunk az, hogy alkalmas módon jelenítsük meg az adatokat, számítsunk jellemző középérték-mutatót és ingadozásmutatót is, mivel a középértékek átlagoló, összemosó hatását éppen az ingadozásmutatók tudják ellensúlyozni, míg az ingadozásmutatók pont ezt
24
a jellemző értéket nem tudják megragadni. Ezért a korrekt statisztikai leíráshoz legalább egy-egy jellemző szükséges mindkét mutatócsoportból. Az egyedi mérésekből származó adatok lehetnek diszkrétek és folytonosak. A diszkrét adatok szükségképpen ugrásszerűen változnak. Például a számlálás alapján nyert adatok diszkrét típusúak (pl. téves telefonhívások száma, balesetek száma, adott időszak alatt bekövetkező gépmeghibásodások száma stb.). A folytonos adatok általában mérésből származnak. Jellemzőjük, hogy egy adott intervallumon belül elvileg bármilyen értéket felvehetnek. A mérés korlátai miatt ezek az adatok is ugrásszerűen változnak, de az ugrások nagysága a mérőeszköztől függ, maguk az adatok lényegüket tekintve folytonosak (pl. átmérő, nyúlás, gépkocsi abroncsok futásteljesítménye, nedvességtartalom).
3.3. AZ ADATOK ÁBRÁZOLÁSA
A leíró statisztika jelentős részben az adatok áttekinthető ábrázolásával foglalkozik, így fontos eszközei a táblázatok és diagramok. Ezeknél a diagramoknál, táblázatoknál az egyes értékek összehasonlítása áll előtérben, a grafikus ábrázolásoknál azonban nem mindig fontosak az értékek, sok esetben a vizsgált jelenséggel kapcsolatban azok megoszlása, egymáshoz való viszonya, aránya ”árulkodóbb”. A táblázatok, diagramok lehetővé teszik nagyobb adathalmazok áttekintő ábrázolását, és viszonylag egyszerű őket elkészíteni. A grafikonok a pontos értékek megadása nélkül is gyors áttekintést adnak, nagy terjedelmű minták egészen egyszerű grafikai elemekre támaszkodva válnak áttekinthetővé. Néhány példa:
A hiba típusa Gömb alakú gázzárvány Gázzárvány-halmaz Átolvadási hiány Összeolvadási hiány Gyökátfolyás Hernyó alakú gázzárvány Gyökoldali szélkiolvadás Egy oldalról hegesztett kötésben átolvadási hiány Helyi szélkiolvadás, éles bemetszés nélkül Alapanyag-varrat közötti összeolvadási hiány Wolfrám zárvány Egyenetlen varratfelület
Szabvány Kum. Relatív Kum. rel. Gyakoriság jelölése gyakoriság gyakoriság gyak. 2011 2013 402 401 504 2016 5013
78 26 14 12 4 3 3
78 104 118 130 134 137 140
53,1% 17,7% 9,5% 8,2% 2,7% 2,0% 2,0%
53,1% 70,7% 80,3% 88,4% 91,2% 93,2% 95,2%
4021
2
142
1,4%
96,6%
515
2
144
1,4%
98,0%
4011
1
145
0,7%
98,6%
3041 514
1 1
146 147
0,7% 0,7%
99,3% 100,0%
2. ábra: Az adatok táblázatba rendezése
25
3. ábra: Oszlopdiagram
4. ábra: Kördiagram
5. ábra: Sávdiagram
26
6. ábra: Vonaldiagram Adatok ábrázolása piktogram segítségével: Az összes szőlőtermelés felhasználása
7. ábra
27
3.4. TAPASZTALATI ELOSZLÁSOK
A nagy számú statisztikai adat áttekinthetőségét lehetővé teszi, feldolgozását egyszerűsíti, ha az értékeket nagyság szerinti osztályokba soroljuk. A mérési sorozat legkisebb és legnagyobb értéke közötti intervallumot k számú osztályra bontjuk. Ha összesen n adatunk van, fi pedig az i-edik osztályba eső elemek számát jelenti, akkor n kiinduló adat f1 + f2 + ……..+ fk = n részsokaságok összegeként értelmezhető. Általános lépései a következők: • • •
osztálybasorolás (folytonos adatok és nagyszámú diszkrét megfigyelés esetén), a gyakoriságok (fi) megállapítása. Gyakoriság a sokaságban levő azonos tulajdonságú (azonos osztályba tartozó) elemek száma, a relatív gyakoriságok (gi) megállapítása:
gi = • • • •
fi n
az összegzett (kumulált) gyakoriságok (fi‘) , illetve összegzett relatív gyakoriságok (gi‘) megállapítása, gyakorisági táblázat készítése (fi , gi , fi‘ , gi‘ adataiból), a gyakorisági (relatív gyakorisági), illetve összegzett gyakorisági (relatív gyakorisági) hisztogramok (folytonos adatok esetén a poligon és az ogiva) felvétele (tapasztalati eloszlások elkészítése). Grafikus ábrázolás
Feladat: Egy folyamatos üzemben 24 órán keresztül feljegyezték a gépleállások számát. A leállásokra vonatkozóan az alábbi értékek adódtak óránkénti megoszlásban: Óra 1 2 3 4 5 6 7 8 9 10 11 12 Leállások 5 3 1 2 0 3 4 5 2 6 1 1 száma Óra 13 14 15 16 17 18 19 20 21 22 23 24 Leállások 4 0 2 3 2 0 2 3 1 4 1 6 száma 1. Táblázat A példa adatai a következő gyakorisági táblázatba és hisztogramba rendezhetők: Ahhoz, hogy az előbbi táblázatunkat áttekinthetőbb formába öntsük, célszerű az adatainkat a diszkrét valószínűségi változó által felvehető értékek szerint csoportosítani:
28
leállások száma óránként 0 1 2 3 4 5 6 összesen
az előfordulások gyakorisága (fi) 3 5 5 4 3 2 2 24 2. Táblázat
relatív gyakoriság (gi) 0,125 0,208 0,208 0,168 0,125 0,083 0,083 1,000
Ha viszonylag kevés adatunk van, akkor célszerű az alapján elkészíteni az osztályba sorolást, hogy e diszkrét valószínűségi változó milyen értékeket vehet fel.
8. ábra: Gyakoriságok ábrázolása diszkrét adatok esetén Diszkrét adatok esetén a gyakoriságok az y tengely csak egy meghatározott pontjához tartoznak, és nem egy értéksávhoz, ezért diszkrét eloszlások esetében a gyakoriságot általában függőleges vonalakkal jelölik. A kumulált (összegzett) gyakorisági táblázat és hisztogram: leállások száma 0 1 2 3 4 5 6
kumulált gyakoriság (fi’) 3 8 13 17 20 22 24 3. Táblázat
kumulált relatív gyakoriság (gi’) 0,125 0,333 0,541 0,709 0,834 0,917 1,000
A kumulatív gyakoriságok grafikus ábrázolással nyert képét tapasztalati eloszlásfüggvénynek szokták nevezni.
29
9. ábra: Kumulált relatív gyakoriságok ábrázolása diszkrét adatok esetén
30
Feladat: Mint későbbi tanulmányaink (Vállalati pénzügyek) során látni fogjuk, gazdasági elemzéseinknél gyakran szükség van a részvényektől elvárt hozam becslésére. (A részvények elvárt hozama időben viszonylag stabil, így a jövőre vonatkozó becsléseinket múltbeli adatainkra alapozhatjuk). A Budapesti Értéktőzsde Részvényindexét (BUX) - az ideiglenes index némi változtatásával és 1991ig visszafelé is meghatározva - 1995 január 1-i hatállyal vezették be. Az index bázisa az 1991. január 2-án számított 1000 pont. Egy 5 éves időszak havi hozamainak értékeit az alábbi táblázatban foglaltuk össze. dátum
BUX[%]
dátum
BUX[%]
február 1.
-7,54
november 1.
2,03
március 1. április 5. május 2. június 1. július 1. augusztus 1. szeptember 1. október 3. november 1. december 1. január 5. február 1. március 1. április 3. május 2. június 1. július 3. augusztus 1. szeptember 1. október 2. november 1. december 1. január 4. február 1. március 1. április 1. május 2. június 3. július 1. augusztus 1. szeptember 3. október 1.
-0,17 -11,02 -2,5 -8,24 4,91 13,01 -8,45 16,88 -5,08 -4,89 -18,98 4,05 1,62 11,68 5,44 -4,79 2,06 5,16 1,81 -6,05 -0,93 2,92 35,26 7,81 9,75 7,67 11,06 12,39 -12,85 21,26 18,57 6,46
december 2. január 6. február 3. március 3. április 1. május 5. június 2. július 1. augusztus 1. szeptember 2. október 1. november 3. december 1. január 7. február 2. március 2. április 1. május 4. június 2. július 1. augusztus 3. szeptember 1. október 1. november 2. december 1. január 7. február 1. március 1. április 1. május 3. június 1.
12,51 32,3 2,44 -2,91 10,03 3,79 12,9 15,99 -8,2 6,34 -7,26 -6,75 20,24 -7,22 11,27 4,84 -1,21 -17,48 10,63 3,45 -36,06 -12,97 26,91 12,53 5,51 3,16 -13,63 -2,37 9,02 4,58 4,59
4. Táblázat Dolgozzuk fel a havi hozam adatokat leíró statisztikai eszközökkel!
31
Folytonos adatokból készítendő gyakorisági eloszlásoknál (és egyébként nagyszámú diszkrét adat esetén is) szükséges a rendelkezésre álló adatok osztályközökbe történő sorolása. Osztályba sorolásnak nevezzük az adathalmaz valamennyi értékét magába foglaló teljes értékköz felosztását azonos nagyságú rész-értékközökre, és az adatoknak ezen belüli csoportosítását. Az osztályköz középső értékét osztályköznek nevezzük, mivel az osztályba sorolás eredményeként az adatok elvesztik egyedi értékeiket, és az azonos osztályba sorolt adatokra az azonos osztályközép lesz a jellemző. Az osztályközt határoló két érték az alsó és a felső osztályhatár. Az osztályozás kritériumai: • Teljes • Átfedésmentes • Homogén csoportokat eredményezzen Az Y szerint képzett osztály alsó
felső
Osztályközép
abszolút
relatív
gyakoriság
határa Y10
Y11
Y1
f1
g1
Y20
Y21
Y2
f2
g2
Yi0
Yi1
fi
g i =gi
fk
gk
N
1
Yk0
Yi =
1Y (Yi i 0 + Yi1 ) 2
Yk1
Yk
Összesen
fi N
10. ábra: Gyakorisági sor Ahol: • • • • •
Y (adatainkat jellemző) mennyiségi ismérv, Adathalmazunkból k db osztályt képzünk, A 0-s index az osztály alsó határát, az 1-es index pedig az osztályköz felső határát jelenti, Yi az osztályközép, fi az abszolút vagy tapasztalati gyakoriság, gi pedig a relatív gyakoriság.
Akár egy, akár több ismérv szerint csoportosítjuk az adatainkat, mindig kardinális kérdés az osztályok számának a megválasztása. Ez alapos megfontolást igényel, és a vizsgált sokaság nagyságától nem függetleníthető. Mérlegelendő szempontok az osztályozásnál: • Mi a célunk az osztályozással? • A teljes értékközt hány rész-értékközre bontsuk fel, vagyis hány osztályt alakítsunk ki? • Az osztályhatárok megállapításánál, kialakításánál milyen szempontokat célszerű figyelembe venni? A fenti példánk alapján a gyakoriság táblázat: osztályhatárok -40,00 ≤ x <-30,00 -30,01 ≤ x <-20,00 -20,01 ≤ x <-10,00 -10,01 ≤ x < 0,00 0,01 ≤ x < 10,00 10,01 ≤ x < 20,00 20,01 ≤ x < 30,00 30,01 ≤ x < 40,00 összesen
fi 1 0 6 17 23 13 3 2 65
f’i 1 1 7 24 47 60 63 65
gi [%] 1,54 0,00 9,23 26,15 35,38 20,00 4,62 3,08 100,00
5. Táblázat
32
g’i [%] 1,54 1,54 10,77 36,92 72,30 92,30 96,92 100,00
A gyakorisági hisztogram: Az egyes értékközök felé emelt téglalapok területe arányos az egyes osztályokhoz tartozó tapasztalati gyakoriságokkal. A piros vonallal jelölt függvényt sűrűségfüggvénynek nevezzük.
11. ábra: Sűrűségfüggvény A kumulált relatív gyakorisági hisztogram: n = 65 x = 3 ,19 % s * = 12 ,05 %
12. ábra: Eloszlásfüggvény A kumulált gyakoriságok grafikus ábrázolással nyert képét tapasztalati eloszlásfüggvénynek is szokás nevezni, ez megmutatja, hogy milyen valószínűséggel fordul elő egy adott értéknél kisebb érték. A folytonos adatok eloszlásfüggvényét folytonos vonallal is összeköthetjük, és az így kapott görbét ogivának nevezzük. Ez azt mutatja meg, hogy megközelítően milyen lenne a tapasztalati eloszlásfüggvény, ha az osztályközöket minden határon túl csökkentenénk, az osztályközökbe eső adatok számát pedig minden határon túl növelnénk. Az ogivát felhasználhatjuk egy adott értéknél kisebb értékek számának vagy relatív gyakoriságának meghatározására. Fordítva is eljárhatunk, vagyis megállapíthatjuk azt az értéket, amelyik alá adott relatív gyakorisággal esnek az adatok. Az ilyen értékeket kvantiliseknek nevezzük.
33
3.5. A TAPASZTALATI ELOSZLÁSOK KÖZÉPÉRTÉK-MUTATÓI A középérték-mutatókat gyakran helyzetmutatóknak is nevezik. A középérték-mutatók a gyakorisági eloszlás helyzetét egyetlen, az adatokkal azonos mértékegységű számértékkel jellemzik. E középértékekkel kapcsolatos elvárásaink, hogy legyenek: • Közepes helyzetűek • Tipikusak • Egyértelműen meghatározhatóak • Könnyen értelmezhetőek A középértémutatóknak két nagy csoportja ismeretes: • Helyzeti középértékek: az adatok közötti elhelyezkedésüknél fogva jellemzik a vizsgált gyakorisági eloszlás helyzetét. • Számított középértékek: az adatokkal kapcsolatos számszerű összefüggésük révén jellemzik vizsgált gyakorisági eloszlás helyzetét. Az alábbiakban bemutatásra kerülő középérték mutatók a medián, a módusz, a számtani átlag, a harmonikus átlag, a mértani átlag és a négyzetes átlag. Medián (Me): Jellemzői: helyzeti középérték, közepes helyzetű. A medián a változó azon számértéke, amelynél az összes előforduló számérték fele kisebb, fele pedig nagyobb, tehát a rangsorba állított sokasági számértékeket két egyenlő gyakoriságú osztályra bontja. Röviden: a nagyságrend szerint rendezett adatok középső értéke (páros számú adat esetén a két középső érték átlaga). Példa: 6, 8, 4, 9, 7, 3, 5, 4, 9, 7, 8, 11, 5, 7, 9, 3, 10, 5, 2, 5,
3, 4, 5, 6, 7, 8, 9 4, 5, 7, 8, 9, 11 2, 3, 5, 5, 7, 9, 10
Me=6 Me=7,5 Me=5
Ha a BUX index korábbi, 65 havi hozamadatait vesszük alapul, akkor e 65 adatot sorba állítva, a rangsor 33. tagja lesz a medián, hiszen ennél 32 kisebb, és 32 nagyobb érték lesz a rangsorban, ez pedig 3,79. Felmerül a kérdés: hogyan határozható meg a medán akkor, amikor nem ismerjük egyenként az adatokat, hanem ”csak” osztályközös gyakorisági sor áll rendelkezésünkre? Ilyen esetekben a medián legegyszerűben a következő formulával becsülhető:
N − f me' −1 Meˆ = Yme ,0 + 2 ⋅ hme f me ahol me annak a legelső osztályköznek a sorszáma, amelyre igaz, hogy
f me' ≥
N 2
és Yme,0 az me sorszámú osztályköz alsó határa, és a hme pedig ennek az osztálynak az osztályközhosszúsága, ami egyszerűen a felső és alsó osztályhatár értékének a különbsége.
34
Példa: Vegyük a korábbi BUX-indexes példánkat, és tegyük fel, hogy csak a gyakorisági táblázat áll rendelkezésünkre, és nem ismerjük egyenként az összes hozamadatot. osztályhatárok -40,00 ≤ x <-30,00 -30,01 ≤ x <-20,00 -20,01 ≤ x <-10,00 -10,01 ≤ x < 0,00 0,01 ≤ x < 10,00 10,01 ≤ x < 20,00 20,01 ≤ x < 30,00 30,01 ≤ x < 40,00 összesen
f me' ≥
fi 1 0 6 17 23 13 3 2 65
f’i 1 1 7 24 47 60 63 65
gi [%] 1,54 0,00 9,23 26,15 35,38 20,00 4,62 3,08 100,00
g’i [%] 1,54 1,54 10,77 36,92 72,30 92,30 96,92 100,00
N Æ N/2=32,5 Æ a mediánt tartalmazó osztály az ötödik osztály: 0,01 ≤ x < 10. 2 N − f me' −1 32,5 − 24 Meˆ = Yme,0 + 2 ⋅ hme = 0,01 + ⋅ (10,00 − 0,01) = 3,7 f me 23
Ha összehasonlítjuk a korábbi eredményünkkel, láthatjuk, hogy a medián jól becsülhető osztályközös gyakorisági sorból is. A medián előnye, hogy mindig egyértelműen meghatározható, és mivel valódi középérték, így érzéketlen az adathalmazunkban szereplő szélsőértékekre, amely szélsőségesen nagy vagy kicsi értékeket általában a véletlen ”szeszélyei” alakítják, és nem függ a többi ismérvértéktől sem. Ha az adathalmazunkban sok az egyforma ismérvérték, akkor sem tanácsos használni. Módusz (Mo): A módusz - a mediánhoz hasonlóan - helyzeti középérték. A módusz nem mindig határozható meg egyértelműen, és nem is mindig létezik. Diszkrét változó esetén a változó leggyakrabban előforduló értéke. A 24 óra alatti gépleállásokhoz tartozó gyakorisági táblázatot alapul véve látható, hogy a 24 órás megfigyelés alatt egyaránt 5-5 alkalommal fordult elő, hogy 1 vagy 2 leállás volt az adott órában. Ebben az esetben a módusz nem határozható meg egyértelműen. leállások száma óránként 0 1 2 3 4 5 6 összesen
az előfordulások gyakorisága 3 5 5 4 3 2 2 24
35
Folytonos ismérv esetén a módusz a gyakorisági görbe maximum helye. Folytonos változó esetén a mediánhoz hasonló módon osztályközös gyakorisági sorból becsülhető.
Moˆ = Ymo ,0 +
da ⋅ hmo da + d f
Ebben a képletben mo a móduszt tartalmazó osztályköz sorszáma és
d f = f mo − f mo +1
d a = f mo − f mo −1
A móduszt mindig az az osztályköz tartalmazza, amelyikhez a hisztogram legmagasabb oszlopa tartozik. osztályhatárok -40,00 ≤ x <-30,00 -30,01 ≤ x <-20,00 -20,01 ≤ x <-10,00 -10,01 ≤ x < 0,00 0,01 ≤ x < 10,00 10,01 ≤ x < 20,00 20,01 ≤ x < 30,00 30,01 ≤ x < 40,00 összesen
fi 1 0 6 17 23 13 3 2 65
f’i 1 1 7 24 47 60 63 65
gi [%] 1,54 0,00 9,23 26,15 35,38 20,00 4,62 3,08 100,00
g’i [%] 1,54 1,54 10,77 36,92 72,30 92,30 96,92 100,00
Ebben a példánkban a móduszt a legnagyobb gyakoriságú osztály tartalmazza, ez pontosan ugyanaz az osztály, ahol a medián is volt.
Moˆ = Ymo ,0 +
da ( 23 − 17) ⋅ hmo = 0,01 + ⋅ (10,00 − 0,01) ≈ 3,76 da + d f ( 23 − 17) + ( 23 − 13)
Megjegyzés: néha a módusz becslésének egyszerűen a móduszt tartalmazó osztályköz osztályközepét tekintik (példánkban ez 5,00 lenne), ezt nyers módusznak hívják. Bárhogyan is határozzuk meg a móduszt, az arra kapott közelítő érték esetleges, mert függ az osztályközök számától és hosszától. A módusz előnye, hogy a mediánhoz hasonlóan nem függ sem az összes, sem a kiugró ismérvértékektől. A módusz hátránya, hogy nem mindig egyértelműen meghatározható, és nem is mindig létezik.
()
Számtani átlag x : A leggyakrabban használt középértékmutató: az ”átlag”, számított középérték. Az a szám, amellyel az átlagolandó számértékeket helyettesítve azok összege változatlan marad. Számítása: n
x=
∑x i =1
n
r
i
=
∑fx i =1 r
∑f i =1
36
i
i
r
= ∑ g i xi i =1
i
ahol: xi = az i-ik tag számértéke fi = az i-ik tag gyakorisága gi = az i-ik tag relatív gyakorisága r = osztályok száma Diszkrét adatok esetén a számtani átlag kiszámítható oly módon is, hogy az osztályba sorolás után mindegyik értéket szorozzuk a hozzá tartozó gyakorisággal, az eredményeket összegezzük, majd osztjuk a gyakoriságok összegével. Folytonos adatok esetén a gyakoriságokat az osztályközepekkel szorozzuk. Az így számított számtani átlag kis mértékben eltérhet a nem csoportosított adatokból számolt átlagtól. A gyakoriság felhasználásával számolt számtani átlagot súlyozott számtani átlagnak is nevezik. Diszkrét példa: leállások száma óránként 0 1 2 3 4 5 6 összesen 6
x=
∑f i =0
i
⋅ xi
6
∑f i =0
=
az előfordulások gyakorisága 3 5 5 4 3 2 2 24
0 ⋅ 3 + 1⋅ 5 + 2 ⋅ 5 + 3 ⋅ 4 + 4 ⋅ 3 + 5 ⋅ 2 + 6 ⋅ 2 = 2,54 24
i
Folytonos példa: Vegyük ismét a korábbi BUX-indexes példánkat! Ha a rendelkezésre álló 65 egyedi adatunkból számítjuk ki a számtani átlagot: 65
x=
∑x
i
i =1
65
=
− 7,54 + ( −0,17) + ( −11,02) + ... + 9,02 + 4,58 + 4,59 207,37 = = 3,19 %-ot kapunk. 65 65
Ha az osztályközös gyakorisági táblázatunkat vesszük alapul: osztályhatárok -40,00 ≤ x <-30,00 -30,01 ≤ x <-20,00 -20,01 ≤ x <-10,00 -10,01 ≤ x < 0,00 0,01 ≤ x < 10,00 10,01 ≤ x < 20,00 20,01 ≤ x < 30,00 30,01 ≤ x < 40,00 összesen
fi 1 0 6 17 23 13 3 2 65
f’i 1 1 7 24 47 60 63 65
gi [%] 1,54 0,00 9,23 26,15 35,38 20,00 4,62 3,08 100,00
37
g’i [%] 1,54 1,54 10,77 36,92 72,30 92,30 96,92 100,00
8
x=
∑fx
i i
i =1 8
∑f i =1
=
1 ⋅ ( −35,00) + 0 ⋅ ( −25,00) + 6 ⋅ ( −15,00) + 17 ⋅ ( −5,00) + 65
i
+ 23 ⋅ 5,00 + 13 ⋅ 15,00 + 3 ⋅ 25,00 + 2 ⋅ 35,00 = 3,77 65 8
x = ∑ gi xi = 0,0154 ⋅ ( −35,00) + 0 ⋅ ( −25,00) + 0,0923 ⋅ ( −15,00) + 0,2615 ⋅ ( −5,00) + 0,3538 ⋅ 5,00 + i =1
+ 0,20 ⋅ 15,00 + 0,0462 ⋅ 25,00 + 0,0308 ⋅ 35,00 = 3,77 Ebben az esetben a két eredmény (3,19 és 3,77) közötti eltérés összefüggésben van a sokaság számosságával, az osztályközök hosszával, és az osztályközepek megválasztásával. A számtani átlag előnye, hogy bármely alapadathalmazból egyértelműen meghatározható, minden alapadatot felhasznál. A hátránya –a módusszal és mediánnal szemben-, hogy érzékeny a szélsőértékekre. Bizonyos esetekben az adatok között kiugróan magas és alacsony értékek vannak, amelyek jelentősen befolyásolják az átlagot. Ezt úgy küszöbölik ki, hogy az adathalmaz egy meghatározott %-át elhagyják az átlag számításánál: pl. elhagynak 5%-ot az alsó értékek és 5%-ot a felső értékek közül, így az adatok 90%-ának az átlagát számítják. Egyéb átlagfajták: Adathalmazunkból az eddig említett móduszon, mediánon és számtani átlagon kívül egyéb átlagok is számíthatóak. Harmonikus átlag ( x h ) : Az a szám, amellyel az átlagolandó értékeket helyettesítve ezek reciprokainak összege változatlan marad. Számítása: r
xh =
n n
1 ∑ i =1 xi
=
∑f i =1
r
∑f i =1
i
i
1 xi
Alkalmazása: Leggyakrabban akkor használjuk, ha az értékek reciprokainak összege értelmezhető. Ilyen esetekkel elsősorban a leíró statisztikai viszonyszámok és indexek számításánál találkozunk. Mértani átlag ( x g ) : Az a szám, amellyel az átlagolandó értékeket helyettesítve azok szorzata változatlan marad. Számítása:
x g = n π x i = ∑ i πx i f
fi
ahol:π (produktum) az összeszorzás jele. Egy n tagú sokaság x1, x2, …, xn megfigyelt értékeinek mértani átlagát úgy számítjuk ki, hogy az értékeket összeszorozzuk, és a szorzatból annyiadik gyököt vonunk, ahány értéket összeszoroztunk. Megjegyzés: ha az értékek között 0 is szerepel, akkor a mértani átlagot nem használhatjuk.
38
Alkalmazása: A mértani átlagot akkor használjuk, ha az értékek szorzata értelmezhető, illetve az átlagolandó értékek exponenciálisan nőnek vagy csökkennek. Leggyakrabban az időbeli fejlődés átlagos ütemének vizsgálatakor használjuk. Idősorok elemzése során (pl. termelés évenkénti alakulása, tőzsdeindex havi változása, stb.) általában az időszakról időszakra bekövetkezett növekedést, vagy csökkenést vizsgáljuk. Négyzetes átlag ( x q ) : Az a szám, amellyel az átlagolandó értékeket helyettesítve azok négyzetösszege változatlan marad. Számítása:
xq =
∑x
2 i
n
Egy n tagú sokaság x1, x2, …, xn értékeiből a négyzetes átlagot úgy számítjuk ki, hogy az átlagolandó értékek négyzeteinek számtani átlagát vesszük és ebből négyzetgyököt vonunk. Természeténél fogva a négyzetes átlag a kiugróan magas értékekre reagál érzékenyen. Alkalmazása: A négyzetes átlag alkalmazására leginkább akkor kerül sor, amikor az értékek között pozitív és negatív értékek egyaránt előfordulnak, de az előjeleknek a vizsgálat szempontjából nincs jelentőségük, az értékek abszolút nagyságát kívánjuk a középértékekkel jellemezni. Tipikus alkalmazási területe a szórásszámítás. Választás a középértékek között Bebizonyítható, hogy ugyanazon pozitív xi értékekből számított különböző fajta átlagok között a következő nagyságrendi reláció áll fenn:
xmin ≤ xh ≤ x g ≤ x ≤ xq ≤ xmax A harmonikus és a mértani átlag a nagyon alacsony, a négyzetes átlag a magas értékekre mutat fokozott érzékenységet. Az átlagolandó értékek jellege, és az átlag számításához rendelkezésre álló információ együttesen határozza meg, hogy milyen esetben melyik átlagfajtát célszerű használni. A választás során érdemes mérlegelni a következőket: • Egyértelműen meghatározható-e? • Az összes rendelkezésre álló adattól függ-e vagy sem? • Mennyire érzékeny a szélsőségesen nagy vagy kicsi értékekre? • Mekkora és milyen módon értelmezhető hibával képes helyettesíteni az alapadatokat?
39
Mo Me x
13. ábra: Középértékek összehasonlítása
x Me Mo
Kvantilisek Eddig egyenlő osztályköz-hosszúságú gyakorisági sorokat képeztünk, az ilyen osztályközök relatív gyakoriságai eltértek egymástól. Lehetőség van olyan osztályhatárok keresésére, amelyek egyenlő relatív gyakoriságokat fognak közre. Az ilyen osztályközök – általában – nem egyenlő hosszúságúak. Ezen osztályhatárok megállapításához használjuk a kvantiliseket. A kvantilisek azok az értékek, amelyek különböző adott arányokban bontják fel az adathalmazt. A pedrendű kvantilis az eloszlást p, 1-p arányban osztja ketté. Meghatározásuk úgy történik, hogy adatainkat nagyság szerint növekvő sorrendbe rendezzük (rangsort készítünk), majd az értékeket k számú egyenlő gyakoriságú csoportra osztjuk és az egyes csoportok felső határán lévő ismérvértékeket vesszük. Ezek lesznek a kvantilis értékek. A különböző számú csoportba rendezéshez a kvantilisek konkrét elnevezései tartoznak. Ha az adatokat két részre osztjuk, akkor a mediánt (Me) kapjuk. Négy részre való osztásnál kvartiliseket (Qi, i=1,2,3) ad, öt rész esetén kvintiliseket (Ki, i=1, 2, 3, 4), tíz rész esetén deciliseket (Di, i=1,2,…,9) száz részre való osztásnál percentiliseket (Pi, i=1,2,3,…,99) nyerünk. Ha például az egyetemre jelentkezők pontszámát értékelve 112 pont a hatodik decilis érték, ez azt jelenti, hogy a jelentkezők hatvan százaléka 112 pontnál kevesebbel, 40%-a pedig többel rendelkezik. k
Elnevezés
Általános jelölés
i lehetséges értéke
Lehetséges kvantilisek
2
Medián
-
1
Me
4
Kvartilis
Qi
1,2,3
Q1, Q 2, Q 3
5
Kvintilis
Ki
1,2,3,4,
K1, K 2, K 3, K4
10
Decilis
Di
1,2,…,9
D 1, D 2, … D 9
100
Percentilis
Pi
1,2,…,99
P 1, P 2, …,P 99
6. Táblázat: A leggyakrabban használt kvantilisek
Számítása: Rangsorba rendezett adataink i/k-ik tagja.
si / k =
i ( N + 1) k 40
Értéke: X i / k = X [∗si / k ] + {si / k }( X [∗si / k ]+1 − X [∗si / k ] )
A BUX-indexes példánk alapján számítsuk ki a következő kvantiliseket! Alsó kvartilis: 1 s1 / 4 = ⋅ (1 + 65) = 16,5 4 Tehát az alsó kvartilisünk a rangsorba rendezett 65 db havi hozamadat 16,5-ik tagja. Számítása: Q1 = X [∗s1 / 4 ] + {s1 / 4 }( X [∗s1 / 4 ]+1 − X [∗s1 / 4 ] ) = −5,08 + 0,5( −4,89 − ( −5,08)) = −4,985 Értelmezése: a rangsorba rendezett adatok 1/4-e kisebb, mint -4,985, és 3/4-e pedig nagyobb. Felső kvartilis: 3 s3 / 4 = ⋅ (1 + 65) = 49,5 4 Tehát a felső kvartilisünk a rangsorba rendezett 65 db havi hozamadat 49,5-ik tagja. Q3 = X [∗s3 / 4 ] + {s3 / 4 }( X [∗s3 / 4 ]+1 − X [∗s3 / 4 ] ) = 10,63 + 0,5(11,06 − 10,63) = 10,845 Értelmezése: a rangsorba rendezett adatok 3/4-e kisebb, mint 10,845, és 1/4-e pedig nagyobb. Alsó decilis 1 s1 / 10 = ⋅ (1 + 65) = 6,6 10 D1 = X [∗s1 / 10 ] + {s1 / 10 }( X [∗s1 / 10 ]+1 − X [∗s1 / 10 ] ) = −12,85 + 0,1( −11,02 − ( −12,85)) = −12,667 Értelmezése: a rangsorba rendezett adatok 1/10-e kisebb, mint -12,667, és 9/10-e pedig nagyobb. Felső decilis: 9 s9 / 10 = ⋅ (1 + 65) = 59,4 10 D9 = X [∗s9 / 10 ] + {s9 / 10 }( X [∗s9 / 10 ]+1 − X [∗s9 / 10 ] ) = 16,88 + 0,1(18,57 − 16,88) = 17,049 Értelmezése: a rangsorba rendezett adatok 9/10-e kisebb, mint 17,049, és 1/10-e pedig nagyobb.
41
3.6. AZ INGADOZÁS MÉRŐSZÁMAI
A fentiekben megismert középérték-mutatók alkalmasak arra, hogy a megfigyelt adathalmazunkat tömören, egy számmal jellemezzék, és kifejezzék az adathalmaz közös, tipikus, általános vonásait. Azonban adathalmazunkat nemcsak a közös vonások jellemzik, hanem arra is kíváncsiak vagyunk, hogy ezek az adatok milyen mértékű változékonyságot mutatnak, hiszen természetszerűleg eltérnek a középértéktől, és különböznek egymástól is. Az értékek különbözőségét, változékonyságát szóródásnak nevezzük. A most bemutatásra kerülő legfontosabb ingadozásmutatók: a terjedelem, az interkvantilis terjedelem, az átlagos abszolút különbség, az átlagos abszolút eltérés, a tapasztalati szórás, a korrigált tapasztalati szórás és a relatív szórás. A rendelkezésre álló adathalmazunkban szereplő értékek változékonysága, szóródása kétféleképpen is megragadható: az egyes értékek egymás közötti különbségein, vagy pedig az egyes értékeknek egy kitüntetett értéktől (középérték) való eltérésein keresztül. A másik csoportosítási lehetőség: léteznek abszolút és relatív ingadozásmutatók. Az abszolút szóródási mutatók mértékegysége ugyanaz, mint az alapadatoké. A relatív szóródási mutatók elvonatkoztatnak az eredeti mértékegységtől, és különböző ismérvértékek szóródásának az összehasonlítását szolgálják. Terjedelem (R): Az adathalmazban szereplő legnagyobb és legkisebb adat különbsége. Számítása:
R = xmax − xmin Előnye: könnyű számítás; Hátránya: csak a két legszélsőségesebb ismérvértéktől függ. A hátránya miatt gyakran használják az interkvantilis terjedelemmutatót, mivel a két szélső k-adrendű kvantilis jelentősen csökkenti a véletlennek a szélsőértékeket alakító szerepét. Pl. Az interkvartilis terjedelemmutató a felső és alsó kvartilis különbségeként adódik:
R1 / 2 = Q3 − Q1 Vegyük ismét a korábbi BUX-indexes példánkat, és számítsuk ki a terjedelmet:
R = 35,26 − ( −36,06) = 71,32 Az interkvartilis terjedelem:
R1 / 2 = 10,845 − ( −4,985) = 15,83 Átlagos abszolút különbség (G): Ez a szóródási mutató a minden lehetséges módon párba állított értékek különbségeinek abszolút értékéből számított számtani átlag. Ez a G ingadozásmutató azt mutatja meg, hogy az Y ismérv értékei átlagosan mennyire különböznek egymástól. Mértékegysége ugyanaz, mint az alapadatoké.
G=
N N 1 Xi − X j ∑∑ N ( N − 1) i =1 j =1
ahol N az adatok számát jelenti.
42
Speciális felhasználási területe a koncentrációelemzés, hátránya, hogy számítása meglehetősen kényelmetlen. Mivel a BUX-indexes példában meglehetősen kényelmetlen számítani, így egy egyszerűbb példán keresztül mutatjuk be: Véletlenszerűen kiválasztunk 5 MBA hallgatót, és kiszámítjuk a Kvantitatív módszerek tárgy vizsgáján elért eredményük átlagos abszolút különbségét. Az elért pontok: 45, 52, 76, 87, 92 45 0 7 31 42 47
45 52 76 87 92
G=
52 76 7 31 0 24 24 0 35 11 40 16 7. Táblázat
87 42 35 11 0 5
92 47 40 16 5 0
516 = 25,8 , azaz az 5 MBA hallgató Kvantitatív módszerek tárgy vizsgán elért pontja 5(5 − 1)
átlagosan 25,8 ponttal tér el egymástól. Átlagos abszolút eltérés (∆): Az átlagos abszolút eltérés az ingadozásmutatók azon csoportjába tartozik, amelyek a szóródást az értékeknek egy kitüntetett értéktől való eltéréseire támaszkodva jellemzik. Tulajdonképpen az egyes értékek és a számtani átlag különbségeinek abszolút értékeiből számított számtani átlag. Számítása: n
∆ =
∑ di
i =1
n
r
=
∑ fi d i
i =1 r
∑ fi
i =1
ahol: d i = xi − x A képlet második részéből látható, hogy ez a mutató is becsülhető osztályközös gyakorisági sorból a tapasztalati gyakoriságok felhasználásával. Ebben az esetben a di eltérések számításánál az osztályközepeket kell alapul vennünk. A BUX-indexes példánk átlagos abszolút eltérése: n
∆ =
∑ di
i =1
n
=
− 7 , 54 − 3 ,19 + − 0 ,17 − 3 ,19 + ... + 4 , 59 − 3 ,19 = 8 , 93 65
Azaz az egyes hozamadatok átlagosan 8,93%-kal térnek el a számtani átlagtól. Hátránya: az abszolút érték matematikailag nehezen kezelhető.
43
Tapasztalati szórás (s), korrigált tapasztalati szórás (s*): Ahogy a számtani átlag “az átlag”, úgy a tapasztalati és a korrigált tapasztalati szórás “a szórás”. A szórás az adathalmazunk változékonyságának legfontosabb mérőszáma. Nagyon hasonlít az előbbi mutatóhoz, és jelentése is hasonló: annyiban tér el, hogy a di eltérések előjelét nem abszolút érték képzésével, hanem négyzetre emeléssel “oldja meg”, majd a négyzetreemelést gyökvonással “teszi jóvá”. A szórás az átlagtól vett di eltérések négyzetes átlaga. Ennek megfelelően azt mutatja, hogy az értékek mennyire térnek el a számtani átlagtól. Számítása:
)
(
n 2 n 2 r 2 ∑ xi − x ∑ di ∑ fi di s = i =1 = i =1r = i =1 n n ∑ f i =1 i n
s* =
(
∑ xi − x
i =1
)
2
n −1
Sok esetben nem is a szórás, hanem annak a négyzete (variancia) bír jelentőséggel. Természetesen a szórás – az összes eddigi mutatóhoz hasonlóan- szintén becsülhető osztályközös gyakorisági sorból is. BUX-indexes példánk szórása az egyedi adatokból számolva:
(
)
n 2 ∑ xi − x = s = i =1 n −1
(− 7,54 − 3,19)2 + (− 0,17 − 3,19)2 + ... + (4,58 − 3,19)2 + (4,59 − 3,19)2 64
=12,05
Osztályközös gyakorisági sorból becsülve: osztályhatárok -40,00 ≤ x <-30,00 -30,01 ≤ x <-20,00 -20,01 ≤ x <-10,00 -10,01 ≤ x < 0,00 0,01 ≤ x < 10,00 10,01 ≤ x < 20,00 20,01 ≤ x < 30,00 30,01 ≤ x < 40,00 összesen
fi 1 0 6 17 23 13 3 2 65
f’i 1 1 7 24 47 60 63 65
gi [%] 1,54 0,00 9,23 26,15 35,38 20,00 4,62 3,08 100,00
g’i [%] 1,54 1,54 10,77 36,92 72,30 92,30 96,92 100,00
8 2 ∑ fi di 1 ⋅ ( −35 − 3,19) 2 + 0 + 6 ⋅ ( −25 − 3,19) 2 + ... + 3 ⋅ ( 25 − 3,19) 2 + 2 ⋅ (35 − 3,19) 2 = ≈ 12,35 s = i =18 65 ∑ fi i =1
44
Relatív szórás (v): A szórás és a számtani átlag hányadosa. Elsősorban különböző sokaságok vagy ismérvek szóródásának összehasonlítására használják. A relatív szórás úgy is értelmezhető, mint az értékek átlagtól vett átlagos eltérése, ezért minél kisebb a relatív szórás, a számtani átlag annál jobban jellemzi az alapadatokat. Számítása:
v=
s ⋅ 100[% ] x
3.7. AZ ELOSZLÁS ALAKJÁT JELLEMZŐ EGYÉB MUTATÓSZÁMOK
A gyakorisági eloszlások alakmutatói annak tömör és számszerű jellemzésére szolgálnak, hogy azok milyen tekintetben és milyen mértékben térnek el az ebből a szempontból etalonnak tekintett normális eloszlás jellegzetes gyakorisági görbéjétől (a haranggörbétől). Megjegyzés: mivel a normális eloszlás egy móduszú, így ennek az összehasonlításnak csak szintén egy móduszú gyakorisági eloszlások esetén van értelme. Ha egy gyakorisági görbének több módusza van, akkor az arra enged következtetni bennünket, hogy az elemzést a sokaság részekre bontásával célszerű folytatni, mert az eddig megismert mutatószámok nem alkalmasak a vizsgált jelenség tömör, számszerű jellemzésére. Az eltérések fajtái: • az etalonnak tekintett normális eloszlás haranggörbéjéhez képest bal ill. jobb oldali aszimmetria; • a gyakorisági eloszlás ábrájának csúcsosabb, vagy lapultabb, mint a normális eloszlásé.
14. ábra: Eloszlások alakjának lehetséges eltérése a normál eloszlástól Aszimmetria mutató A bal oldali aszimmetriával rendelkező eloszlásokat sok szakkönyv jobbra hosszan elnyúló eloszlásoknak nevezi. Az ilyen eloszlások grafikus ábrája a módusztól jobbra hosszan elnyúlik. Ennek megfelelően a jobb oldali aszimmetriát mutató eloszlásokat pedig balra hosszan elnyúló eloszlásoknak nevezik. A társadalmi-gazdasági jelenségek elemzésekor általában bal oldali aszimmetriával találkozunk. Ennek oka, hogy a 0 érték, vagy a vizsgált társadalmi-gazdasági jelenség természetéből adódóan
45
valamilyen minimális érték kemény alsó korlátot képez, míg felülről nem létezik ilyen korlát. Pl. a jövedelmek vagy a vagyon nagyságának eloszlása tipikusan bal oldali aszimmetriát mutat. Többféle aszimmetria mérőszám létezik, mi ezek közül most egyet mutatunk be: Pearson-féle mutatószám:
P=
3 ⋅ (Y − Me) s
A Pearson-féle mutatószám mérsékelten aszimmetrikus eloszlásoknál nem szokott 1-nél nagyobb lenni. Ez a mutató az átlag és a medián különbségére alapozza az aszimmetria jellemzését.1 Nézzük a BUX-indexes példánkat! (egyedi adatokból indulunk ki, és nem osztályközös gyakorisági sorból)
P=
3 ⋅ (Y − Me) 3 ⋅ (3,79 − 3,19) = = 0,15 s 12,05
Mérsékelt bal oldali aszimmetria. (14. ábra) Csúcsossági mutató A csúcsossági mutatók közül is egy mutatót emelünk ki. Ez a bemutatásra kerülő mutató azon a megfigyelésen alapszik, hogy minél csúcsosabb egy eloszlás, annál kisebb a felső és alsó kvartilis különbségének a fele a két szélső decilis különbségéhez viszonyítva. Normális eloszlás esetén ennek értéke 0,263, ami a mutató értékeléséhez támpontot ad. Minél lapultabb a vizsgált gyakorisági eloszlás, annál nagyobb K értéket kapunk. A BUX-indexes példánk csúcsosságának kiszámításához felhasználjuk a korábban kiszámított kvartiliseket és deciliseket:
K=
10,845 − ( −4,985) 15,83 Q3 − Q1 = = = 0,266 2 ⋅ ( D9 − D1 ) 2 ⋅ (17,049 − ( −12,667)) 59,432
Esetünkben valamivel laposabb a gyakorisági eloszlás, mint a normális eloszlásé. Összefoglalás: A gyakorisági eloszlások helyzetének, szóródásának és alakjának jellemzésére szolgáló mutatószámok közül gyakorlati szempontból az átlag és a szórás a legfontosabb. Az átlag és a szórás ismeretében a valószínűségszámítás egyes eredményeire támaszkodva elég jó becslés adható arra, hogy az értékek milyen intervallumon belül ingadoznak. Ha az átlag és a szórás mellett még ismert néhány alkalmasan megválasztott kvantilis, vagy az aszimmetria és a csúcsosság valamilyen mutatószáma is, egészen jól felvázolható a vizsgált gyakorisági eloszlás grafikus képe még akkor is, ha sem az alapadatokat, sem a gyakorisági sort nem ismerjük.
1
A mérsékelt bal vagy jobb oldali aszimmetriát mutató gyakorisági sorok esetén a medián többnyire harmadolja a módusz és az átlag közötti távolságot úgy, hogy az átlaghoz esik közelebb. A Pearson-féle mutatószám valójában az átlag és a módusz különbségére alapozza az aszimmetria jellemzését, de a medián könnyebben becsülhető osztályközös gyakorisági sorból, mint a módusz.
46
3.8. ESETTANULMÁNY – LEÍRÓ STATISZTIKAI ELEMZÉS
Végezzük el a 8. Táblázat alapján 100 MBA hallgató bérének leíró statisztikai elemzését! Ssz. BrBér/hó Pozíció 1 300 Felső 2 810 Felső 3 220 Közép 4 500 Közép 5 250 Beoszt. 6 375 Beoszt. 7 210 Beoszt. 8 145 Beoszt. 9 100 Beoszt. 10 400 Beoszt. 11 110 Beoszt. 12 350 Közép 13 164 Beoszt. 14 104 Közép 15 340 Beoszt. 16 650 Közép 17 250 Felső 18 600 Közép 19 1000 Felső 20 331 Beoszt. 21 500 Felső 22 278 Beoszt. 23 1100 Felső 24 835 Felső 25 240 Beoszt. 26 450 Beoszt. 27 400 Beoszt. 28 350 Felső 29 550 Beoszt. 30 80 Felső 31 700 Beoszt. 32 250 Közép 33 400 Beoszt. 34 355 Közép 35 380 Beoszt. 36 450 Felső 37 330 Beoszt. 38 520 Közép 39 150 Beoszt. 40 800 Közép 41 790 Közép 42 330 Közép 43 390 Közép 44 850 Felső 45 500 Beoszt. 46 370 Beoszt. 47 400 Közép 48 350 Beoszt. 49 65 Beoszt. 50 70 Felső
Nem Életkor Férfi 28 Férfi 43 Nő 28 Férfi 44 Nő 25 Férfi 36 Nő 28 Nő 27 Nő 26 Nő 28 Férfi 24 Nő 40 Nő 30 Nő 29 Férfi 39 Férfi 25 Nő 36 Férfi 28 Férfi 41 Férfi 33 Nő 39 Férfi 30 Férfi 53 Nő 39 Férfi 31 Nő 26 Nő 28 Férfi 33 Férfi 26 Férfi 44 Férfi 28 Férfi 34 Nő 32 Férfi 38 Nő 27 Nő 34 Nő 26 Férfi 39 Nő 33 Nő 45 Nő 33 Férfi 26 Nő 30 Férfi 33 Nő 30 Nő 31 Nő 34 Nő 45 Nő 25 Férfi 35
Ssz. BrBér/hó Pozíció 51 350 Beoszt. 52 222 Beoszt. 53 900 Közép 54 120 Beoszt. 55 400 Felső 56 450 Közép 57 340 Közép 58 320 Közép 59 200 Közép 60 730 Közép 61 300 Felső 62 210 Beoszt. 63 451 Közép 64 103 Beoszt. 65 65 Felső 66 230 Beoszt. 67 340 Beoszt. 68 255 Beoszt. 69 600 Közép 70 425 Közép 71 320 Közép 72 195 Beoszt. 73 707 Közép 74 225 Beoszt. 75 400 Közép 76 342 Beoszt. 77 200 Közép 78 370 Közép 79 575 Beoszt. 80 500 Felső 81 510 Felső 82 90 Közép 83 120 Felső 84 810 Felső 85 80 Beoszt. 86 250 Beoszt. 87 260 Beoszt. 88 700 Felső 89 550 Közép 90 500 Beoszt. 91 275 Beoszt. 92 900 Felső 93 280 Közép 94 182 Beoszt. 95 250 Közép 96 350 Felső 97 200 Közép 98 625 Közép 99 250 Beoszt. 100 720 Beoszt.
8. Táblázat
47
Nem Férfi Férfi Nő Férfi Férfi Férfi Férfi Férfi Férfi Férfi Férfi Férfi Férfi Nő Férfi Nő Férfi Férfi Férfi Nő Nő Nő Férfi Férfi Férfi Férfi Férfi Férfi Férfi Férfi Férfi Férfi Nő Férfi Nő Nő Nő Férfi Férfi Férfi Férfi Férfi Férfi Nő Nő Férfi Nő Férfi Férfi Nő
Életkor 29 31 38 33 45 36 45 32 32 40 38 32 36 25 46 33 31 34 35 35 35 27 40 31 50 33 29 45 29 32 25 31 42 45 27 32 27 42 28 26 31 40 37 30 26 48 25 33 28 29
A leíró statisztikai elemzés menete:
1. Osztályok számának meghatározása. (egy lehetséges módszer) 2k 0 > N Y − Ymin h 0 = max k0
27 = 128 > 100 1100 − 65 h0 = = 147,85 ≈ 150 7
2. Gyakorisági táblázat osztályhatárok 65 215 215 365 365 515 515 665 665 815 815 965 965 1115 Összesen:
fi 22 33 22 8 9 4 2 100
gi 0,22 0,33 0,22 0,08 0,09 0,04 0,02 1,00
f i’ 22 55 77 85 94 98 100
gi’ 0,22 0,55 0,77 0,85 0,94 0,98 1,00
f i’ 15 38 60 76 83 89 94 98 99 100
gi’ 0,15 0,38 0,6 0,76 0,83 0,89 0,94 0,98 0,99 1,00
9. Táblázat
Egy kicsit „gyakorlatiasabb” osztályba sorolással: Legyen h0 = 110 k0 = 10 osztályhatárok 65 175 175 285 285 395 395 505 505 615 615 725 725 835 835 945 945 1055 1055 1165 Összesen:
fi 15 23 22 16 7 6 5 4 1 1 100
gi 0,15 0,23 0,22 0,16 0,07 0,06 0,05 0,04 0,01 0,01 1,00 10. Táblázat
3. Medián 1 s1 / 2 = (100 + 1) = 50,5 2 Me = 350 + 0,5(350 − 350) = 350 Medián becslése a gyakorisági táblázat (2. osztályba sorolást alkalmazva) alapján
48
N − f me' −1 2 Meˆ = Yme ,0 + ⋅ hme f me N 2
! f me ≥
Meˆ = 285 +
50 − 38 ⋅ 110 = 345 22
4. Kvartilisek meghatározása 1 (100 + 1) = 25,25 4 Q1 = 225 + 0,25 ⋅ ( 230 − 225) = 226,25 s1 / 4 =
3 (100 + 1) = 75,75 4 Q3 = 500 + 0,75 ⋅ (500 − 500) = 500 s3 / 4 =
5. Módusz mo=2 Moˆ = Ymo ,0 +
da ⋅ hmo da + d f
d a = f mo − f mo −1 d f = f mo − f mo +1 Moˆ = 175 +
23 − 15 ⋅ 110 = 273 ( 23 − 15) + ( 23 − 22)
6. Számtani átlag S=39189 (ezt megadjuk, de meg kell becsülni gyakorisági táblázat alapján) Y =
S 39189 = = 391,89 100 N
49
Becslés gyakorisági táblázatból: Osztályhatárok 65 175 175 285 285 395 395 505 505 615 615 725 725 835 835 945 945 1055 1055 1165
Y =
Osztályközép 120 230 340 450 560 670 780 890 1000 1110 Összesen: 11. Táblázat
fi 15 23 22 16 7 6 5 4 1 1 100
fiYi 1800 5290 7480 7200 3920 4020 3900 3560 1000 1110 39280
Σf iYi 39280 = = 392,8 Σf i 100
7. Grafikus ábrázolás, hisztogram 7 osztályba sorolva: Hisztogram 35
Gyakoriság
30 25 20 15 10 5
11 15 To vá bb
96 5
81 5
66 5
51 5
36 5
21 5
0
15. ábra
10 osztályba sorolva: Hisztogram 25
15 10 5
16. ábra
50
94 5 10 55 11 6 To 5 vá bb
83 4
72 5
61 5
50 5
39 5
28 5
0 17 5
Gyakoriság
20
8. Terjedelem R = Ymax − Ymin = 1100 − 65 = 1035 Interkvartilis terjedelemmutató R0,5 = Q3 − Q1 = 500 − 226,25 = 273,75 9. Átlagos abszolút eltérés:
∑d δ=
i
= 17964,8
1 1 1 Yi − Y = ∑ d i = 17964,8 = 179,65 ∑ N N 100
10. Tapasztalati szórás N
∑ (Y − Y ) i =1
N
s=
= 5279635,8
2
i
∑ (Y i =1
i
− Y )2
N N
s∗ =
∑ (Y − Y ) i =1
5279635,8 = 229,8 100
= 2
i
=
N −1
5279635,8 = 230,93 99
Becslés a gyakorisági táblázat segítségével: Osztályhatárok Osztályközép 65 175 120 175 285 230 285 395 340 395 505 450 505 615 560 615 725 670 725 835 780 835 945 890 945 1055 1000 1055 1165 1110 Összesen:
fi fiYi 15 1800 23 5290 22 7480 16 7200 7 3920 6 4020 5 3900 4 3560 1 1000 1 1110 100 39280
di -272,8 -162,8 -52,8 57,2 167,2 277,2 387,2 497,2 607,2 717,2
12. Táblázat 10
∑f i =1
sˆ =
2
i
⋅ d i = 5117816 5117816 = 226,2 100
51
di 2 74419,84 26503,84 2787,84 3271,84 27955,84 76839,84 149923,8 247207,8 368691,8 514375,8
fi*di2 1116298 609588,3 61332,48 52349,44 195690,9 461039 749619,2 988831,4 368691,8 514375,8 5117816
11. Relatív szórás V=
s 229,8 = = 0,586 Y 391,9
A relatív szórás önmagában nem árul el sok mindent. Ha egy másik évfolyam 100 főből álló mintájának relatív szórásával össze tudnánk hasonlítani, akkor a két relatív szórás közül a kisebbik esetén a számtani átlag jobban reprezentálja az alapadatokat. 12. Aszimmetria P=
3(Y − Me) 3(392,8 − 350) = = 0,5587 s 229,8
Mérsékelt bal oldali aszimmetria (jobbra elnyúló eloszlás). 13. Lapultság, csúcsosság 1 (100 + 1) = 10,1 10 D1 = 110 + 0,1(120 − 110) = 111
s1 / 10 =
9 (100 + 1) = 90,9 10 D9 = 730 + 0,9(790 − 730) = 784
s9 / 10 =
K=
500 − 226,25 Q3 − Q1 = = 0,2034 2( D9 − D1 ) 2(784 − 111)
Mivel 0,2034<0.263, csúcsosabb, mint a normál eloszlás.
52
3.9. VISZONYSZÁMOK
A viszonyszámok, mint a gazdasági elemzések gyakran használt leíró statisztikai mutatói, két statisztikai adat hányadosaként értelmezhetők:
A B
V=
ahol B a viszonyítási alap (bázis), A pedig a viszonyítás tárgyának adata. V alapvető fajtái: a megoszlási-, a dinamikus- és az intenzítási viszonyszámok. A megoszlási viszonyszám valamilyen résznek az egészhez viszonyított arányát mutatja (pl. relatív gyakoriság). Ezek a viszonyszámok a sokaság, illetve az általa képviselt jelenség struktúráját jellemzik. A dinamikus viszonyszám az időbeli változás mutatója, hiszen két különböző időszak, vagy időpont azonos fajta adatainak egymáshoz viszonyított aránya. Az alapot képező időszak a bázisidőszak, az összehasonlítás időszaka pedig a tárgyi, vagy beszámolási időszak. Dinamikus viszonyszámokat az időrend szerint felsorolt adatokból (idősorokból) a bázis állandóságától, vagy változásától függően számolhatunk. Így megkülönböztetünk bázisviszonyszámokat és láncviszonyszámokat. A bázisviszonyszámok állandó bázisú dinamikus viszonyszámok. Az állandó bázis legtöbbször az idősor első adata, de más időszakot is választhatunk bázisként. A láncviszonyszámok az idősor adatainak a közvetenül megelőző időszakhoz való arányát mutatják. A láncviszonyszámok és a bázisviszonyszámok egymásból kiszámíthatók. Ha az idősor adatait yi-vel (i=0, 1, 2, …n), a láncviszonyszámokat li-vel, a bázisviszonyszámokat bi-vel jelöljük, akkor: yi
li =
yi−1
bi =
yi yo
ha y0 a bázis, így b0=1. Nyilvánvaló, hogy a láncviszonyszámok szorzataként bázisviszonyszámot kapunk: k
l1 ⋅ l2 ⋅ ...⋅ lk = Π li = bk i=1
ugyanis:
y1 y 2 y y ⋅ ⋅ ... k = k = bk y 0 y1 y k −1 y 0 Az intenzítási viszonyszám két különböző fajta, de egymással összefüggő adat hányadosa (pl. egy dolgozóra jutó bérhányad, népességstatisztikai arányszámok, stb).
53
Feladat: Az alábbi táblázatban a BUX 1991-1998 közötti éves jellemzőit, illetve változásait foglaltuk össze. Határozza meg az átlagos abszolút- és relatív változás értékét. Adjon becslést a hozam rövid (pl. 1 év) és hosszú távú várható alakulására. év
BUX (Ft)
induló 91 92 93 94 95 96 97 98
1000,0 803,3 828,8 1229,4 1481,1 1557,9 4291,3 8347,9 6773,0 -
x
változás az előző változás az előző BUX hozam %/év évhez képest (Ft) évi %-ban (Ft) -196,7 80,3 -19,7 +25,5 103,1 +3,1 +400,6 148,3 +48,3 +251,7 120,5 +20,5 +76,8 105,2 +5,2 +2733,4 275,5 +175,5 +4056,6 194,5 +94,5 -1574,9 81,1 -18,9 721,6 138,6 38,6 13. Táblázat
Átlagos abszolút változás: x=
6773 − 1000 = 721 ,6 8
Ha minden évben 721,6 ponttal nőtt volna, akkor is 5773 pont lett volna a növekedés 8 év alatt. Átlagos relatív változás: Az évenkénti relatív változások (láncviszonyszámok) sorozatszerűen függnek össze. Szorzatuk egyenlő az idősor egészében tapasztalt relatív fejlődéssel (az utolsó bázisviszonyszámmal, vagyis az utolsó és első adat hányadosával).
x g = 8 0,8033 ⋅1,0317 ⋅ ... ⋅ 0,8113 = 8 6,77 = 1,27 xg = 8
6773 8 = 6,77 = 1,27 1000
A BUX évente átlagosan 27 %-al változott (növekedett). Ha a növekedés minden évben 27 % lett volna, akkor is 677 % lett volna a növekedés 8 év alatt. Mindez azt is jelenti, hogy az átlagos abszolút és relatív változás független attól, hogy az első és utolsó év között az idősor hogyan alakul. Ezért az alkalmazott átlagok csak akkor lehetnek jellemzőek, ha az idősor alapvető tendenciája egyenletes (növekedés vagy csökkenés).
54
Számításainkat általánosságban (a viszonyszámoknál használt jelölésekkel) a következők szerint irhatjuk fel:
l=n
n
Πl i =1
i
= n bn = n
yn y0
Becslés a hozam várható alakulására: Az éves hozamok számtani átlaga:
x = 38 ,6% Ez az átlag csak egy rövid távú (pl. 1 éves) várható hozam változás előrejelzéséhez adhat támpontot. Hosszabb távon a mértani átlag ad reálisabb becslést, hiszen figyelembe veszi a "kamatos kamat" jelleget (láncviszonyszámok) is:
x g = 27%
55
4. KORRELÁCIÓ- ÉS REGRESSZIÓSZÁMÍTÁS I.
Valószínűségszámítás Valószínűségszámítás Valószínűségelmélet Valószínűségelmélet
Matematikai Matematikai statisztika statisztika
Axiómák, Axiómák, alaptételek alaptételek
Minta Minta vétel vétel
Kombinatorika Kombinatorika
Leíró Leíró statisztika statisztika
Geometriai Geometriai val.sz. val.sz.
Becslés Becslés
Val.szám Val.szám tételek tételek
Hipotézisvizsgálat Hipotézisvizsgálat
Elméleti Elméleti eloszlások eloszlások
Összefüggésvizsgálat Összefüggésvizsgálat
56
4.1. DETERMINISZTIKUS ÉS SZTOCHASZTIKUS KAPCSOLATOK
A társadalmi, a műszaki és a gazdasági jelenségek törvényszerűségeit nemcsak önmagunkban, hanem a jelenségekkel szoros kapcsolatban lévő más tényezők összefüggésében is vizsgálhatjuk. Az eddigi fejezetekben a véletlen tömegjelenségek leírását mindig egy már bekövetkezett állapot valószínűségelméleti, matematikai-statisztikai vizsgálatával végeztük el. A korreláció- és regresszió- számítás során arra keressük a választ, hogy egy adott állapot milyen tényezők hatására jött létre, az egyes tényezők milyen mértékben befolyásolják a jelenség alakulását, a tényezők milyen szoros kapcsolatban vannak egymással. A változók közötti összefüggés szorosságát, a sztochasztikus kapcsolat erősségét, intenzitását korrelációszámítással, míg az összefüggés jellegét regresszió-számítással határozzuk meg. Utóbbi esetben az összefüggésekben lévő sztochasztikus tendenciát, a kapcsolat természetét valamilyen függvénnyel írjuk le. Ha a vizsgálatok során az idő a független változó, a számításokat trendszámításnak nevezzük. A determinisztikus („függvényszerű”) és a sztochasztikus jelenség, kapcsolat fogalmával az 1. fejezetben foglalkoztunk. Ugyancsak megismerkedtünk a sztochasztikus függetlenség fogalmával is. Emlékeztetünk arra, hogy determinisztikus kapcsolatnál X változó adott értékeihez Y változó meghatározott értéke tartozik, míg sztochasztikus kapcsolatnál Y változónak több lehetséges értéke is létezhet. Ezek az értékek és a hozzá tartozó valószínűségék az Y változónak az X változóra, mint feltételre vonatkozó feltételes valószínűségek, amelyek a feltételre vonatkozó feltételes valószínűség eloszlást alkotják. A gyakorlati számítások során azonban csak az eloszlások feltételes várható értékével és varianciájával jellemezzük a sztochasztikus kapcsolatot. Így röviden azt is mondhatjuk, hogy X és Y közötti sztochasztikus kapcsolat (korreláció) esetén csak az egyik tényező (X) és a másik tényező (Y) átlagos értéke között van határozott kapcsolat. Ez azt is jelenti, hogy a két változó nem független, de nincs közöttük funkcionális (determinisztikus) összefüggés, vagyis az egyik változó értékét az X változó nagysága mellett még bizonyos egyéb véletlen hatások is befolyásolják. Hangsúlyozni kell, hogy a korrelációs és regressziós számítás a kapcsolatot jellemzi, de semmit nem mond az oksági viszonyról. Tehát két, vagy több változó közötti sztochasztikus kapcsolat megállapításából nem következik, hogy a változók oksági összefüggésben vannak, azaz, hogy egyik tényező változása oka a másik tényező változásának. Az oksági kapcsolatot csak alapos szakmai és statisztikai vizsgálattal lehet megállapítani.
57
4.2. A KAPCSOLAT SZEMLÉLTETÉSE
A nagyobb számítási munkát igénylő matematikai módszerek alkalmazása előtt a kapcsolat létezésére vonatkozó szakmai feltevésünket grafikus ábrázolással célszerű szemléltetni. Az xi; yi értékpárok által meghatározott pontdiagram, illetve empirikus regressziófüggvény szemlélteti a kapcsolatot.
Y = 5.07E-02 - 0.647872X
Y = -8.6E-02 + 0.690286X R-Sq = 62.5 %
R-Sq = 70.9 %
3
3
2
2
1
1
0
0
-1
-1
-2
-2
-3
-3 -3
-2
-1
0
1
2
-3
3
-2
-1
0
1
2
3
Negatív korreláció
Pozitív korreláció
Y = -7.4E-02 + 0.208348X
Y = 12.0958 + 6.07684X + 1.16686X**2
R-Sq = 3.4 %
R-Sq = 88.4 %
3
40
2 30
1
0
20
-1 10
-2
-3
0
-2
-1
0
1
-3
2
Nincs korreláció
-2
-1
0
1
2
3
Nem lineáris korreláció
17. ábra: Pontdiagramok Ha a pontok vonulási iránya (képzeletbeli tengelye) felfelé mutat, pozitív korrelációról beszélünk (növekvő xi értékekhez növekvő yi értékek tartoznak), ellenkező esetben a korreláció negatív. A görbevonali korreláció azt jelzi, hogy nem lehet minden korrelációt egyértelműen pozitívnak, vagy negatívnak tekinteni.
58
4.3. AZ ELŐJEL–KORRELÁCIÓS EGYÜTTHATÓ A sztochasztikus kapcsolat szorosságát – a grafikus ábrázolást követően – viszonylag kevés számítási munkával ellenőrizhetjük. Az előjel–korrelációs együttható, mint szorossági mérőszám, az igényesebb elemzések előtt nyújthat hasznos információt. Feladat: 14 év adatai alapján vizsgáljuk meg az 1ha szántóterületre vonatkoztatott műtrágya felhasználás (xi=kg/ha) és az évi búza termés átlagok (yi=q/ha) közötti kapcsolatok jellegét és szorosságát. (Az alábbi táblázat a későbbiekben felhasználásra kerülő részszámításokat is tartalmaz).
i
xi
1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. ∑
19,9 31,9 31,6 41,4 53,5 58,7 67,2 70,4 76,3 101,3 124,4 136,2 166,6 195,0 1174,3
yi 12,5 17,0 16,9 19,1 17,9 15,6 18,6 21,7 21,7 25,9 25,2 27,1 21,3 30,7 291,2
dxi = xi − x dyi = yi − y -64,1 -52,0 -52,3 -42,5 -30,4 -25,2 -16,7 -13,5 -7,6 17,4 40,5 52,3 82,7 111,1
-8,3 -3,8 -3,9 -1,7 -2,9 -5,2 -2,2 0,9 0,9 5,1 4,4 6,3 0,5 9,9 14. Táblázat
x = 83,9 y = 20,8
59
d x2i 4108,8 2704,0 2735,3 1806,2 924,2 635,0 278,9 182,2 57,8 302,8 1640,2 2735,3 6839,3 12343,2 37293,2
d y2i 68,9 14,4 15,2 2,9 8,4 27,0 4,8 0,8 0,8 26,0 19,4 39,7 0,2 98,0 326,5
d xi ⋅ d yi 532,0 197,6 204,0 72,2 88,2 131,0 36,7 -12,1 -6,8 88,7 178,2 329,5 41,3 1099,9 2980,4
18. ábra A grafikus ábrázolás pozitív korrelációt és feltehetően lineáris összefüggést mutat. (Szakmai szempontból ez a feltételezés csak az adott műtrágya felhasználási szinten lehet igaz, hiszen közismert a növekvő műtrágya felhasználás csökkenő hatékonysága is). Az előjel-korrelációs együttható értelmezéséhez és meghatározásához vegyük figyelembe, hogy pozitív korreláció esetén xi átlagosnál alacsonyabb értékeihez általában az átlagosnál alacsonyabb yi értékek tartoznak és ez fordítva is igaz. Ha tehát d xi és d yi eltéréseket hasonlítjuk össze, akkor pozitív korreláció esetén az esetek nagy részében az eltérések előjele megegyezik. (Negatív korreláció esetén a helyzet fordított lesz). Ebből lehet következtetni a kapcsolat irányára és szorosságára is. (Az azonos és eltérő előjelű eltérés párok egyenlő aránya a kapcsolat hiányát jelzi). Az előjel-korrelációs együtthatást (re) az alábbiak szerint értelmezzünk:
re =
u −v u+v
ahol: u = az előjel egyezések száma, v = az előjel eltérések száma (u + v = n). Nyilvánvaló, hogy re értéke (-1) és (+1) között helyezkedik el. Függvényszerű (determinisztikus) kapcsolat esetén re=1, de ez fordítva nem feltétlenül igaz. (Megjegyezzük, ha valamelyik eltérés párban az egyik, vagy mindkét eltérés nulla, akkor az adott egységnél u = 0,5 és v = 0,5 értékekkel számolunk). Mintapéldánkban u=12, v=2, ezért:
re =
12 − 2 = 0,71 14
amelyből a két változó közepesnél jóval erősebb, pozitív irányú kapcsolatára következtethetünk.
60
Ha a pontdiagramban behúzzuk az y = y és x = x egyeneseket, akkor u az I. és III. negyedbe eső pontok számának az összessége, míg v a II. és IV. negyedben található pontok összege lesz.
4.4. A LINEÁRIS REGRESSZIÓ ÉS A KORRELÁCIÓ
A regresszió számítás feladata a változók közötti összefüggés jellegének meghatározása. Ennek során a pontdiagramos ábrázolással érzékeltetett tendenciát valamilyen analitikusan ismert függvénnyel próbáljuk leírni. A Y = f ( X ) regressziós függvényt a legkisebb négyzetek elve és módszere alapján határozzuk meg. Ez azt a követelményt támasztja, hogy az adott függvénytípust (egyenes, parabola, exponenciális, stb.) használata során a n
∑(y i =1
− ˆy i )
2
i
összeg minimális legyen. Az yi − yˆ i eltérések (reziduumok) négyzeteinek összege jól jellemzi a ponthalmaz és a regressziós vonal kölcsönös viszonyát. A leggyakrabban alkalmazott lineáris regressziós modellben a legkisebb négyzetek módszere azt a regressziós egyenest tekinti a legjobban illeszkedőnek, amely a pontdiagram egyes pontjaitól átlagosan a lehető legkisebb merőleges távolságban halad (19. ábra).
19. ábra: Merőleges távolságok Egy ilyen egyenesnek az egyenletét azonban csak bonyolult számításokkal lehet meghatározni. Másik megoldási lehetőségnek adódik, ha nem a merőleges távolságok minimalizálására törekszünk, hanem a pontoknak a regressziós egyenestől vett függőleges, vagy vizszintes távolságainak négyzetes összegét választjuk a lehető legkisebbre (20. ábra, 21. ábra, 22. ábra).
61
20. ábra: Függőleges távolságok
21. ábra: Négyzetes (függőleges) távolságok
22. ábra: Négyzetes (vízszintes) távolságok
62
A legkisebb négyzetek módszerével előállított egyenest első regressziós egyenesnek nevezzük, ha a függőleges távolságokra minimalizálunk, illetve második regressziós egyenesnek nevezzük, ha a vizszintes távolságokra minimalizálunk. Ez a két egyenes általában nem esik egybe (23. ábra, 24. ábra).
23. ábra: Erős lineáris kapcsolat
24. ábra: Gyenge lineáris kapcsolat Nyilvánvaló, hogy a két regressziós egyenes között annál nagyobb a különbség, minél jobban szóródnak a ponthalmaz pontjai. Kvalitatív módon belátható az is, hogy annál erősebb a lineáris kapcsolat a két változó között, minél kevésbé tér el egymástól a két regressziós egyenes. Az egyik szélső esetben, ha az összes pont egy egyenesre esik, akkor a két regressziós egyenes meredeksége egyenlő (25. ábra). Ebben az esetben abszolút lineáris kapcsolatról beszélünk. A másik szélső esetben a regresszis egyenesek merőlegesek egymásra (26. ábra), azaz semmilyen lineáris kapcsolatról nem beszélhetünk.
25. ábra: Abszolút lineáris kapcsolat
63
26. ábra: Nincs lineáris kapcsolat A lineáris korreláció analízis lényegében azt vizsgálja, hogy mennyire tér el az első regressziós egyenes meredeksége a másodiktól. Ha a meredekségek aránya r 2 ( x, y ) , akkor ennek négyzetgyöke a Pearson-féle tapasztalati korrelációs együttható. (Ennek valószínűségelméleti értelmezésére a 11. fejezetben térünk vissza.) A korrelációs együttható értéke nulla, ha X és Y függetlenek (2.5 pont). Ez fordítva általában nem igaz: abból, hogy két valószínűségi változó korrelációs együtthatója nulla, nem feltétlenül következik, hogy a két változó független is egymástól (kivétel, ha X és Y együttes eloszlása normális). Ha a két változónál csak azt tudjuk, hogy r(x,y)=0, akkor korrelálatlannak nevezzük őket. A korrelációs együttható abszolút értéke legfeljebb 1, azaz
− 1 ≤ r ( x , y ) ≤ +1 és a ± 1 értéket akkor és csak akkor éri el, ha X és Y között lineáris kapcsolat van:
y = b⋅ x + a Ha b > 0, akkor r (x, y) =1, ha b < 0, akkor r (x, y) = –1. Pozitív sztochasztikus kapcsolatnál 0< r (x, y) < 1, míg negatív sztochasztikus kapcsolatnál –1 < r (x, y) < 0. Természetesen, minél szorosabb a kapcsolat, r ( x, y ) annál jobban közelíti az 1-et. A korrelációs együtthatót a mintabeli, tapasztalati adatokból az alábbi módon becsülhetjük: n
r ( x, y ) =
∑d i =1
xi
⋅ d yi
n
n
i =1
i =1
∑ d x2i ⋅ ∑ d y2i ahol:
d xi = xi − x és d yi = y i − y .
64
Feladat: Számítsuk ki a mintapéldában szereplő változó korrelációs együtthatóját! A táblázatban (4.3 pont) közölt adatok alapján:
r( x , y ) =
2980 ,4 37293 ,2 ⋅ 326 ,5
= 0 ,85
A lineáris regressziós vizsgálat során általában az első regressziós egyenest alkalmazzuk. Ekkor az ”a” és ”b” becsült értékeire a legkisebb négyzetek módszerét alkalmazva – a levezetések mellőzésével – az alábbi eredményt kapjuk: n
b=
∑d i =1
xi
n
⋅ d yi
∑d i =1
2 xi
a = y −b⋅ x A regressziós egyenes „b” együtthatóját regressziós együtthatónak nevezzük. Mint az egyenes iránytangense statisztikai értelemben megadja, hogy x egységnyi változása mekkora átlagos változást idéz elő y-ban. A „a” együttható pedig az x=0 helyhez ad regressziós becslést. Feladat: Mintapéldánkban határozzuk meg a regressziós egyenes egyenletét!
2980 ,4 = 0 ,08 37293 ,2 a = 20 ,8 − 0 ,08 ⋅ 83 ,9 = 14 ,1
b=
Így a regressziós egyenes egyenlete: y = 0,08 x + 14,1
4.5. AUTO- ÉS KERESZTKORRELÁCIÓ IDŐSOROK ELEMZÉSÉNÉL Az idősor fogalmával korábban már megismerkedtünk (3.9 pont). Gazdasági idősorok adatainak elemzése (Befektetések, Vállalatgazdaságtan) a korrelációszámítás szempontjából számos speciális problémát vet fel. Gyakran előfordul, hogy egy, vagy több idősor egymást követő adatai egymástól nem függetlenek, hanem szoros korrelációban állnak egymással. Ez a jelenség az autokorreláció, amennyiben egy változó egymást követő adatainak kapcsolatát vizsgáljuk, és keresztkorreláció, ha több változó hasonló kapcsolatát nézzük. A regressziós modellben ez úgy jelentkezik, hogy az egymást követő reziduális értékek között korrelációs kapcsolat mutatkozik. Az autokorreláció különböző rendű lehet. Elsőrendű az autokorreláció, ha az idősorban a hibatényező t-edik értéke a (t1)-edik, közvetlen szomszédos értékkel van korrelációs kapcsolatban.
65
Feladat: A következőkben az 1995-2000 közötti időszakban rögzített tőzsde adatokból a MINITAB alkalmazásával készült különböző eloszlás- és regressziós modelleket mutatunk be. Értelmezzük az eredményeket!
66
67
5. VALÓSZÍNŰSÉGI VÁLTOZÓ, ELMÉLETI ELOSZLÁSOK
Valószínűségszámítás Valószínűségszámítás Valószínűségelmélet Valószínűségelmélet
Matematikai Matematikai statisztika statisztika
Axiómák, Axiómák, alaptételek alaptételek
Minta Minta vétel vétel
Kombinatorika Kombinatorika
Leíró Leíró statisztika statisztika
Geometriai Geometriai val.sz. val.sz.
Becslés Becslés
Val.szám Val.szám tételek tételek
Hipotézisvizsgálat Hipotézisvizsgálat
Elméleti Elméleti eloszlások eloszlások
Összefüggésvizsgálat Összefüggésvizsgálat
68
5.1. A VALÓSZÍNŰSÉGI VÁLTOZÓ
A valószínűségi változó fogalma:
A valószínűségi változó jellege:
69
5.2. VALÓSZÍNŰSÉGI VÁLTOZÓ JELLEMZŐI
Valószínűség-eloszlás függvény: Diszkrét esetben a ξ valószínűségi változó eloszlását egyértelműen az jellemzi, hogy a változó a lehetséges értékeit milyen valószínűséggel veszi fel. Ezt adja meg a pk valószínűség-eloszlás:
pk = p(ξ = k ) Tulajdonságai: I. 0 ≤ pk ≤ 1 ∞
II.
∑p
k = −∞
k
=1 b −1
III.
P ( a ≤ ξ < b ) = ∑ pk k =a
Feladat: Rajzolja fel a kockadobás valószínűség-eloszlás függvényét!
Eloszlásfüggvény: Az eloszlásfüggvény [jelölése: F(k) v. folytonos változó esetén F(x)] megadja, hogy a ξ valószínűségi változó mekkora valószínűséggel vesz fel egy adott k-nál, vagy x-nél kisebb értéket, azaz: F(k) = P(ξ < k) ill. F(x) = P(ξ < x). Tulajdonságai: • • •
monoton növekvő, azaz F(a) ≤ F(b), ha a < b F(-∞) = 0, F(∞) = 1 balról folytonos
pk és F(k) kapcsolata:
pk = F ( k + 1) − F ( k ) F (k ) =
k −1
∑p
i = −∞
i b −1
P ( a ≤ ξ < b ) = F ( b ) − F ( a ) = ∑ pk k =a
Feladat: Rajzolja fel a kockadobás eloszlásfüggvényét!
70
Sűrűségfüggvény: Ha a ξ folytonos valószínűségi változó eloszlásfüggvénye F(x), akkor az
f ( x) = F ' ( x) függvényt a ξ sűrűségfüggvényének nevezzük. Tulajdonságai:
f ( x) ≥ 0 ∞
∫ f ( x )dx = 1
−∞
f(x) és F(x) kapcsolata: x
F ( x) =
∫ f ( x)dx; f ( x ) = F ( x ) '
−∞
b
P ( a ≤ ξ < b) = F (b) − F ( a ) = ∫ f ( x )dx a
Várható érték: A ξ diszkrét valószínűségi változó lehetséges értékei legyenek k1, k2, k3, …. , akkor ξ várható értékének az
M ( ξ ) = ∑ pi k i i
összeget nevezzük; Ha ξ folytonos valószínűségi változó és sűrűségfüggvénye f(x), akkor a ξ várható értéke
M (ξ ) =
∞
∫ x ⋅ f ( x )dx.
−∞
Feladat: Számítsa ki a kockadobás várható értékét!
A várható érték egy fontos tulajdonsága: ha ξ1 ,ξ 2 ...ξ n tetszőleges valószínűségi változók, akkor összegük várható értéke egyenlő a valószínűségi változók várható értékének összegével:
M (ξ 1 + ξ 2 + ... + ξ n ) = M (ξ 1 ) + M (ξ 2 ) + ... + M (ξ n ), Szórás, szórásnégyzet: Ha a ξ-M(ξ) valószínűségi változó négyzetének létezik a várható értéke, akkor ezt ξ szórásnégyzetének nevezzük:
([
)
D 2 ( ξ ) = M ξ − M ( ξ )] .
Ennek négyzetgyöke a D( ξ ) =
2
D 2 ( ξ ) a ξ valószínűségi változó szórása. 71
Feladat: Számítsa ki a kockadobás szórását!
A szórásnégyzet egy fontos tulajdonsága: ha ξ 1 ,ξ 2 ...ξ n független valószínűségi változó és szórásaik léteznek, akkor összegük és különbségük szórásnégyzete egyenlő a valószínűségi változók szórásnégyzetének összegével:
D 2 (ξ 1 + ξ 2 + ... + ξ n ) = D 2 (ξ 1 ) + D 2 (ξ 2 ) + ... + D 2 (ξ n ) Medián: Valamely ξ valószínűségi változó mediánja (Me) az a valós szám, amelyre P(ξ<Me) = 0,5. Kvantilisek: A mediánhoz hasonlóan értelmezhetjük a p-kvantilist. A p-kvantilis az a valós szám, mely az eloszlást p/(1-p) arányban osztja ketté. A fentiek alapján a medián a 0,5-kvantilis. Módusz: Ha ξ valószínűségi változó lehetséges értékei között van olyan, amelyet nagyobb valószínűséggel vesz fel, mint a többit, akkor ezt az értéket ξ móduszának nevezzük. Folytonos valószínűségi változó esetén ξ módusza a sűrűségfüggvény (lokális) maximumhelye(i). Momentumok: A ξ valószínűségi változó momentumainak nevezzük a következő számértékeket: • • • •
k-adik momentum M(ξk), k-adik abszolút momentum M(|ξk|), k-adik centrális momentum M{[ξ-M(ξ)]k}, k-adik centrális abszolút momentum M[|ξ-M(ξ)|k], ahol k =1,2,3,….
Látható, hogy ξ első momentuma M(ξ), a valószínűségi változó várható értéke, s második centrális momentuma M{[ξ-M(ξ)]2}, a szórásnégyzete.
72
5.3. BINOMIÁLIS ELOSZLÁS
Ha egy kísérlet során az A esemény bekövetkezését ill. be nem következését vizsgáljuk – azaz alternatív, két kimenetelű eseményről beszélünk -, s az A esemény bekövetkezési valószínűsége P(A) = p, és a kísérletet n-szer egymástól függetlenül megismételjük, akkor ha a vizsgált ξ valószínűségi változó az A esemény bekövetkezésének száma, a ξ valószínűség-eloszlását binomiális eloszlásnak nevezzük, s az alábbi összefüggéssel határozhatjuk meg:
n p k = P( ξ = k ) = p k q n − k , ahol q = 1 − p k Az eloszlás várható értéke és szórásnégyzete:
M (ξ ) = n ⋅ p D 2 (ξ ) = n ⋅ p ⋅ q Minőségmenedzsment területén elsősorban a visszatevéses mintavétel során alkalmazzuk a binomiális eloszlást ill. bizonyos feltételek esetén a hipergeometrikus eloszlás helyettesítésére. Ha p·(n+1) szorzat egész szám, akkor az eloszlásnak két módusza van, az (n+1)·p-1 és az (n+1)·p helyen. Ha p·(n+1) nem egész, akkor az eloszlás unimodális és a módusz az (n+1)·p egész része. Ha n nagy, akkor az eloszlás módusza az eloszlás várható értékéhez közeli szám, azaz a binomiális eloszlás legnagyobb valószínűséggel a várható értékéhez közeli értéket vesz fel. Feladat: Mekkora valószínűséggel találunk egy 5%-os selejtaránnyal jellemezhető tömeggyártásból kivett 20 elemű véletlen mintában 1 db selejtes terméket?
73
Feladat: Az UEFA szigorú előírásai alapján állít elő a Minőségi Bőr Kft. labdarúgó labdákat 500 darabos tételekben. Az átadás-átvételi eljárás során két előírás szerint járhatunk el: a.) két 10 darabos mintában egyetlen hibás darab sem lehet, b.) három 20 darabos mintában mintánként legfeljebb 1 darab selejtes lehet. Melyik eljárást választaná az UEFA és melyiket a Minőségi Bőr Kft. helyében, ha a selejtarány várhatóan 5 %?
74
5.4. POISSON-ELOSZLÁS Diszkrét eloszlások közül ez az egyik leggyakrabban előforduló eloszlás a gyakorlatban. A Poisson-eloszlást kis valószínűségű, vagyis ritka események eloszlástörvényének is nevezik, mivel ezzel az eloszlással írhatók le az ún. véletlen pontelhelyezkedések: • Az egyenesen, síkon, térben véletlenszerűen elhelyezkedő pontok esetén egy adott tartományba eső pontok száma, • vagy a véletlenszerű időpontokban bekövetkező eseményeknél adott időtartam alatt bekövetkező események száma igen gyakran Poisson-eloszlású. (Ilyen eloszlás például ezen jegyzetben a gépelési hibák száma.) Az eloszlás valószínűség-eloszlás függvénye:
p k = P( ξ = k ) =
λk k!
e −λ ,
ahol λ>0 valós szám, az eloszlás paramétere; k = 1, 2, 3, …. Az eloszlás várható értéke és szórásnégyzete:
M (ξ ) = λ D 2 (ξ ) = λ A Poisson-eloszlás segítségével bizonyos esetekben közelíthetjük a binomiális eloszlást. Ha n elég nagy és p kicsi, akkor aránylag kis k értékekre a binomiális eloszlást a λ = n·p paraméterű Poissoneloszlás megfelelő tagjaival közelíthetjük. Az eloszlás módusza, ha λ egész szám, akkor az eloszlás bimodális Mo1 = λ-1 és Mo2 = λ. Ha λ nem egész szám, akkor a módusz λ egész részénél van, az eloszlás unimodális. Ez azt jelenti, hogy a Poisson-eloszlás legnagyobb valószínűséggel a várható értékét vagy ahhoz közeli (annál kisebb) értéket vesz fel. Feladat: Egy készülék meghibásodásainak átlagos száma 10000 működési óra alatt 10. Határozzuk meg annak a valószínűségét, hogy a készülék 200 működési óra alatt nem romlik el!
75
Feladat: Egy készülék szavatossági ideje egy év. A készülék 2000 darab azonos, különlegesen megbízható elemet tartalmaz, amelyek a szavatossági idő alatt egymástól függetlenül 0,0005 valószínűséggel romlanak el. A szavatosság alapján a gyártó vállalat az egy éven belül bekövetkezett meghibásodások javítására esetenként a teljes ár 1/4 részét fizeti vissza. Ha a javítások száma az év során eléri az ötöt, akkor a gyártó vállalat a már kifizetett négy javítási költségen felül a teljes árat is visszafizeti. Számítsuk ki, hogy előreláthatólag az eredeti vételár hány százaléka marad a gyártó vállalatnál!
Feladat: 100 méter hosszú szövetanyagon átlagosan 5 hibát találtunk, s a mérések a szövethibák számát Poisson-eloszlásúnak mutatták. 300 méter hosszú szövetet 4 méter hosszú terítékekre osztanak. Minden 4 méteres darabból egy-egy öltöny készül. A hibátlan öltönyt darabonként 40000 forintért árusítják, a szövethibásat 30000 forintért. a.) Várhatóan hány hibátlan van a 300 méteres szövetvégből készült öltönyök között? b.) Mennyi az öltönyök eladásából származó árbevétel?
76
5.5. EXPONENCIÁLIS ELOSZLÁS
Az exponenciális eloszlás leginkább bizonyos véletlen hosszúságú időtartamok eloszlásaként lép fel. Általában exponenciális eloszlású, például: •
egy olyan berendezés, ritkább esetben alkatrész élettartama, hibamentes működési ideje, amelynek tönkremenetelét, meghibásodását nem kopás vagy természetes elhasználódás okozza, hanem váratlan törés, szakadás illetve egyéb véletlen ok,
•
egy radioaktív atom élettartama (azaz keletkezésétől az elbomlásáig terjedő időszakasz hossza),
•
bizonyos esetekben egy kémiai kötés felszakadásáig eltelt idő,
•
véletlentől függő hosszúságú telefonbeszélgetések időtartama,
•
egyéb, a véletlentől függő hosszúságú működési-, javítási-, kiszolgálási-, várakozási- és követési idő, illetve időköz.
Az exponenciális eloszlású valószínűségi változó: •
sűrűségfüggvénye:
0 , f(x)= λe -λx
•
ha x〈0 ha x ≥ 0
eloszlásfüggvénye:
0 , F( x ) = 1 − e -λx •
ha x〈0 ha x ≥ 0
várható értéke: M(ξ) =
•
szórásnégyzete és szórása: D2(ξ) = D(ξ) =
77
Feladat: Egy automatizált gépsor hibamentes működésének valószínűsége 120 működési órára 0,9. Tegyük fel, hogy a működési idő exponenciális eloszlású. Számítsa ki a λ meghibásodási rátát és a működési idő várható értékét, valamint annak a valószínűségét, hogy a gépsor a 150. és a 200. óra között meghibásodik.
78
Feladat: Egy radioaktív anyag (sugárforrás) bomlási viszonyait vizsgáljuk. Legyen a valószínűségi változó egy tetszőleges atom bomlásáig eltelt idő és annak valószínűsége, hogy az anyag egy tetszőleges atomja x éven belül elbomlik: P( ξ 〈 x ) = 1 − e − x / 2 ,
ha x〉0
a.) Határozza meg a valószínűségi változó várható értékét, szórását, valamint a bomlás felezési idejét! b.) Számítsa ki annak a valószínűségét, hogy egy tetszőleges atom túléli a 3 évet!
79
Feladat: Számítsa ki az F (x=1/λ) eloszlásfüggvény értékét!
80
5.6. NORMÁLIS (GAUSS-) ELOSZLÁS A leggyakoribb eloszlás a menedzsment területén előforduló elméleti eloszlások közül. Ha egy valószínűségi változó értékét nagyszámú, egymástól függetlenül ható véletlen tényező határozza meg úgy, hogy az egyes tényezők külön-külön csak igen kis mértékben járulnak hozzá az összes véletlen hatásból eredő ingadozáshoz, és az egyes tényezők hatásai összeadódnak, akkor általában normális eloszlású valószínűségi változót kapunk (központi határeloszlás tétel). Normális eloszlással írható le például: • arányos skálán mérhető termékjellemző (például: szélesség, hosszúság, vastagság, tömeg, összetétel) és technológiai paramétere (például: hőmérséklet, nyomás, sebesség) matematikai modellezése, • egyéb, több tényező összegződése révén előálló mennyiség eloszlásának modellezése (például: testmagasság, munkabérek, eseményidő a hálótervezésben, élettartam, két meghibásodás között eltelt idő), • véletlen jellegű mérési hibák matematikai leírása, • technológiai folyamatok irányítási algoritmusának kialakítása (például: számtani átlag alapján történő szabályozás). A normális eloszlású valószínűségi változó sűrűségfüggvénye:
f(x)=
1
σ 2π
e
−
( x − µ )2 2σ 2
, ahol − ∞ < x < ∞ ,
eloszlásfüggvénye:
F( x ) =
x0
1
σ 2π
∫e
−
( x − µ )2 2σ 2
dx
−∞
várható értéke:
M(ζ) = µ
szórása:
D (ζ) = σ.
Az F(x) függvény nem elemi függvény, értékeit táblázat alapján határozhatjuk meg. A µ, σ paraméterű normális eloszlást röviden N(µ;σ)–val jelöljük. A µ=0, σ=1 paraméterű normális eloszlású valószínűségi változót standard normális eloszlásúnak nevezzük. Normális eloszlás esetén ennek eloszlásfüggvénye adott táblázattal, s tetszőleges N(µ;σ)-ra vonatkozó valószínűségeket az N(0,1) táblázat segítségével határozzuk meg. A normális eloszlással történő gyakorlati számításokat jelentősen megkönnyítjük, ha az
u=
x−µ
σ
transzformációval az x változó helyett bevezetjük az u változót, s az így kapott standard normális eloszlás valószínűségi függvényeivel számolunk. A standard normális eloszlás jelentőségét az adja, hogy bármely N(µ;σ) eloszlás F(x) eloszlásfüggvénye mindig kifejezhető az N(0;1) eloszlás Φ(u) eloszlásfüggvényével:
F ( x ) = Φ (u )
Mivel a standard normális eloszlás 0 körül szimmetrikus, ezért:
Φ ( −u ) = 1 − Φ ( u ) 81
Feladat: Határozzuk meg annak valószínűségét, hogy az N(µ;σ) eloszlású valószínűségi változó a várható értékétől legfeljebb szórásnyira, két szórásnyira, három szórásnyira tér el!
P( µ − σ < ξ < µ + σ ) = F ( µ + σ ) − F ( µ − σ ) = µ +σ − µ µ −σ − µ = Φ − Φ = Φ (1) − Φ ( −1) = Φ (1) − (1 − Φ (1)) = 2Φ (1) − 1 = σ σ = 2 ⋅ 0,8143 − 1 = 0,6826 A fenti számolási menetet alkalmazva 2 ill. 3-szoros szórásnyira való eltérésre az alábbi eredmények adódnak:
P ( µ − 2σ < ξ < µ + 2σ ) = 2 ⋅ 0,9772 − 1 = 0,9544 P ( µ − 3σ < ξ < µ + 3σ ) = 2 ⋅ 0,99865 − 1 = 0,9973 Vagyis a ξ a várható értékétől legfeljebb szórásnyira kb. 0,68, legfeljebb két szórásnyira kb. 0,95 ill. legfeljebb három szórásnyira kb. 0,997 valószínűséggel tér el. A normális eloszlás fenti tulajdonságát nevezzük „háromszigma szabálynak”. Ezt mutatja a 27. ábra.
µ-3σ
µ-2σ
µ-1σ
µ 68,26 % 95,44 % 99,73 %
µ+1σ
27. ábra: A „háromszigma” szabály
82
µ+2σ
µ+3σ
Feladat: 200 g névleges tömegű mosópor töltésekor előírás szerint az ATH=190g, amely alá a legyártott mennyiség 4%-a kerülhet. A jelenlegi töltési folyamatban µ=204,4g, σ=9,4g. a.) Megfelel-e a gyártás az előírásoknak? Ha nem, akkor milyen optimális töltési szintet kell elérni, hogy megfeleljen? b.) Mekkora legyen a szórás, hogy a µ=204,4g lehessen a töltés várható értéke?
83
Feladat: A bélszínrolót négyesével csomagolják tasakokba. A rolók súlya N(50g; 5g) eloszlást követ. Mekkora a valószínűsége annak, hogy a tasak valamennyi rolója 55 grammnál nehezebb?
Feladat: Export konyak töltésénél az 510 ml alatti palackok aránya legfeljebb 3% lehet. Megvizsgáltak egy n=20000 db-os tételt: x =532,4 ml, σ=6 ml. Határozzuk meg az optimális töltési szintet. Mekkora az adott tételnél a töltési veszteség értéke, ha á=1000 Ft/palack?
84
Feladat: Egy bankfiókban a napi kifizetések összege N(3,6mFt; 0,9mFt) eloszlást követ. a.) Mennyi a valószínűsége annak, hogy a napi kifizetések összege a µ±σ intervallumba esik? b.) Mekkorára kellene a kifizetések szórásának megváltozni ahhoz, hogy az 5 mFt feletti kifizetések valószínűsége 4% legyen? c.) Mennyi pénzt kell tartani a fiókban, ha 95%-os valószínűséggel akarjuk biztosítani a kifizetések teljesítését?
85
Feladat: Egy termék mérethibája (eltérés a névleges mérettől) normális eloszlású valószínűségi változó, amelynek várható értéke 0. Megállapították, hogy a mérethiba abszolút értéke 0,8 valószínűséggel nem éri el a 20 mm-es határt, amelyen belül a termék még elfogadható minőségű. A termék I. osztályúnak minősül, ha a mérethiba abszolút értéke a 10 mm-t nem haladja meg. Mekkora a valószínűsége ennek egy találomra kivett termék esetén?
Feladat: Egy elektronikai gyárban tesztekkel igazolták, hogy egy TV képcső élettartama N(5,8 év; 2,3 év) eloszlású. A vállalat 2 év cseregaranciát vállal a képcsövekre. A képcsövek hány százalékát kell kicserélni a garancia időtartama alatt? Mekkorára kell növelni a képcsövek élettartamát (a szórás nem változik), ha a cég legfeljebb 2 %-os garanciális cserét szeretne elérni? Legfeljebb mekkora szórása lehet az élettartamnak - ha a várható érték nem változik (5,8 év) - ahhoz, hogy a 2 %-os célt elérjék?
86
5.7. A KÖZPONTI HATÁRELOSZLÁS TÉTELE
A központi határeloszlás tétele a sok véletlen komponens különféle függvényeinek (például összegének, szorzatának, maximumának) aszimptotikus eloszlásaival foglalkozó határeloszlástételek közül a legfontosabb a gyakorlat számára. A tétel magyarázatot ad arra, hogy miért találkozunk oly gyakran a természet és a társadalom jelenségeinek törvényszerűségeit vizsgálva a normális eloszlással. A központi határeloszlás tétele értelmében, ha η1, η2,....., ηn azonos eloszlású, véges M(ηi ) várható értékű és véges D(ηi) szórású független valószínűségi változók, akkor a belőlük képzett
valószínűségi változó n→ ∞ esetén N(0;1) eloszlású. Amennyiben az η1, η2,....., ηn, azonos várható értékű és szórású valószínűségi változók, akkor ξ kifejezhető a következő alakban:
A tapasztalat azt mutatja, hogy már aránylag kis n esetén is az előbbiekben felsorolt tulajdonságokkal rendelkező valószínűségi változók összegéből képzett ξ* =
valószínűségi változó közelítőleg normális eloszlású M(ξ*) =
várható értékkel és D2 (ξ*) =
szórásnégyzettel.
87
28. ábra: A kockadobás összegének valószínűsége eloszlása
88
6. STATISZTIKAI DÖNTÉSEK ALAPELVEI
Valószínűségszámítás Valószínűségszámítás Valószínűségelmélet Valószínűségelmélet
Matematikai Matematikai statisztika statisztika
Axiómák, Axiómák, alaptételek alaptételek
Minta Minta vétel vétel
Kombinatorika Kombinatorika
Leíró Leíró statisztika statisztika
Geometriai Geometriai val.sz. val.sz.
Becslés Becslés
Val.szám Val.szám tételek tételek
Hipotézisvizsgálat Hipotézisvizsgálat
Elméleti Elméleti eloszlások eloszlások
Összefüggésvizsgálat Összefüggésvizsgálat
89
6.1. ESETPÉLDA Egy kezdő vállalkozás az "A" és "B" jelű termékek gyártását végzi. A vállalkozó minden hónap végén a rendelkezésre álló információk alapján dönt, hogy a gyártósor kapacitását a következő hónapban az "A" vagy a "B" termékkel köti-e le, mivel csak az egyik gyártható, ha a gyártósort erre állították át. A vállalkozó súlyos raktározási gondokkal küzd, ezért ha az adott hónapban gyártott terméket nem tudja elhelyezni azonnal a tervezett áron, akkor árengedménnyel értékesíti azt. Rendelkezésre állnak a következő műszaki és gazdasági adatok:
kapacitás (db/hó) kprop (Ft/db) Kfix (Ft/hó) átervezett (Ft/db) áengedmény (Ft/db)
"A" 15.000 100 106 200 160
"B" 25.000 80 106 150 110
Milyen döntést hozna, ha a.) Nincs információnk a piaci elhelyezhetőségről? b.) A korábbi időszak statisztikája szerint az esetek 70 %-ában az "A", 30 %-ában a "B" terméket keresték a piacon? c.) Piackutatók véleményére támaszkodunk, és ismert, hogy ha a piac az "A" terméket kereste, azt a piackutatók 90 %-ban sikeresen jelezték előre, a "B" termék keresletét pedig 80 %-ban találták el. d.) Tökéletes információval rendelkezünk?
6.2. DÖNTÉSI ALAPMODELL
Döntés, döntéshozó:
A döntéshozatal alapvető folyamat. Valamennyi emberi tevékenységgel egybefonódik valamennyi emberi tevékenység döntési helyzetek elemzésével tanulmányozható. Néhány szilárd elvre támaszkodva feltárhatjuk azoknak a kritikus döntési elemeknek a halmazát, amelyek minden döntési problémában újra és újra megjelennek. Döntési helyzetnek nevezzük az olyan helyzeteket, amelyekben az egyén vagy csoport, azaz a döntést hozó legalább két cselekvési változat (cselekvési mód) közötti választás problémájával áll szemben. A döntés: választás legalább két cselekvési változat között. A döntési helyzet elemzésének különféle közelítései egy bizonyos modell felé mutatnak, amelyet döntési alapmodellnek nevezünk. A döntési alapmodell elemei viszonylag könnyen feltárhatók. A döntési helyzet első eleme, a döntést hozó. Döntéshozónak nevezzük azt a személyt (vagy csoportot), aki a cselekvési változatok közül választ egyet. A döntéshozó választását, azaz döntését, az motiválja, hogy vannak céljai (de legalább egy célja), amelyeket – vagy amelyet – el akar érni. A cél elérésére több cselekvési változat közül választhat. Ha csak egyetlen cselekvési változatot tekint, akkor nem beszélünk döntésről, mert meghatározásunk értelmében a döntés választást jelent, márpedig választáshoz legalább két cselekvési változat kell.
90
Cselekvési változatok, stratégiák: si Egy cselekvési változat (cselekvési mód) a döntéshozó rendelkezésére álló erőforrások bizonyos formában való felhasználását jelenti. Más fogalmazásban, egy cselekvési változat a döntéshozó hatáskörébe tartozó szabályozható változók bizonyos módon való együttese. A cselekvési változatoknak különböző következményeik vannak. Ha a cselekvési változatok következményei között nincs különbség, akkor döntési problémáról sem beszélhetünk, hiszen mindegyik azonos (vagy azonosnak tekintett) következménnyel jár. A következményeket másképpen a cselekvési változatok eredményeinek is nevezik. A cselekvési változatok azonban az esetek többségében nem határozzák meg egyértelműen következményeiket. A következményekre ugyanis hatással vannak a döntéshozó által nem, vagy csak részlegesen szabályozható külső körülmények. Ezeket a külső körülményeket tényállapotoknak nevezzük. Tényállapotok: ti A tényállapotok olyan eseményeknek tekinthetők, amelyek nem a cselekvési változat tényezőinek hatására következnek be, de a cselekvési változat következményére hatással vannak. Egy tényállapotot (eseményt) a döntés hozó által nem, (vagy csak részlegesen) szabályozható változók együttesének tekintünk. Következmények, eredmények: oij A cselekvési változatok és tényállapotok együttesen határozzák meg a cselekvési változat következményét (eredményét). Egy következmény egy cselekvési változat és egy tényállapot együttes hatásának eredménye. Tényállapotok valószínűségei: p(ti) A külső körülmények, tényállapotok (események) jelenlétének vagy későbbi bekövetkezésének megállapítása vagy előrejelzése nem könnyű feladat. Rendszerint nem is tudjuk biztosan megmondani, hogy milyen tényállapot (esemény) van jelen, illetve milyen következik be később. Megállapításaink csak bizonyos valószínűséggel érvényesek. A cselekvési változatok és tényállapotok együttesen határozzák meg a következményeket és ezért a tényállapotok valószínűségei egyúttal a következmények valószínűségei is, abban az esetben, ha a tényállapotok és cselekvési változatok egymástól függetlenek. Döntési kritériumok: A fentiekben azonosított döntési tényezőkön kívül igen lényeges tényező még a döntési kritérium, amely alapján a lehetséges cselekvési változatok közül kiválasztjuk a megfelelőt. A döntési kritérium olyan előírás, amely megmondja, hogyan használjuk fel az előbbi információkat egyetlen cselekvési változat kiválasztására.
91
6.3. DÖNTÉSI MÁTRIX
A döntés lényeges elemeinek ismertetése után rendezett formában feltárhatjuk a döntés statikus szerkezetét. A szerkezetet a döntéselemzésben használt két formával jellemzik: a döntési mátrix-szal és a döntési fával. Esetünkben:
6.4. A DÖNTÉSI FOLYAMAT LOGIKÁJA
A döntés szerkezetének feltárásával a döntéshozó látja a cselekvési változatokat következményeikkel együtt, s ezután döntése előtt (egy cselekvési változat kiválasztása a cselekvési változatok halmazából) gondolkodik, pontosabban szólva: átgondolja, vagy megfontolja, a szóban forgó, ismert szerkezetű, döntési problémát. A megfontolás során figyelembe veszi, hogy az egyes tényállapotok mekkora valószínűséggel következnek be (vagy vannak jelen). Ha a cselekvési változatok és a tényállapotok egymástól nem függetlenek, akkor a következmények valószínűségét tekinti. A függetlenséget úgy értelmezzük, hogy a cselekvési változatok nem változtatják meg a tényállapotok valószínűségeit. Kérdés, hogy miképpen határozzuk meg a tényállapotok bekövetkezésének (vagy a következményeknek) valószínűségét? A legegyszerűbb a döntést hozó korábbi tapasztalataira alapozott szubjektív becslés. A korábbi tapasztalatok nyomán megfogalmazott valószínűséget „a priori” valószínűségnek nevezik (2.4 pont). A valószínűségek számszerű megfogalmazásában azonban a döntést hozó nem járhat el önkényesen. A valószínűségszámítás axiómáinak megfelelően kell a valószínűségek számértékeit hozzárendelni a tényállapotokhoz (vagy következményekhez). A tényállapotok egymást kizárják, továbbá un. teljes eseményrendszert alkotnak, azaz valamelyik biztosan bekövetkezik közülük. A tényállapotok valószínűségei összegének tehát egyet kell adniuk (mivel a biztos esemény valószínűsége egy). A valószínűségi számérték megállapításának másik módja az új információk szerzése. Az információk mennyisége lehet teljes vagy részleges. Az esetek túlnyomó hányadában csak részleges információmennyiséget szerezhetünk. A részleges információmennyiség érdekes következménye, hogy a döntést erre alapozva fennáll a tévedés lehetősége. A tévedés – azaz hiba – kétféle típusú lehet. Igaz hipotézist utasítunk el, úgynevezett elsőfajú hibát vétünk, vagy hamis hipotézist fogadunk el igazként – másodfajú hibát követünk el. Részleges információt mindig mintavételes eljárással szerzünk. Ebben az esetben mindig fennáll a kétfajta hiba elkövetésének kockázata.
92
A valószínűségi számérték megállapításának harmadik lehetősége az a priori és az új információk ötvözése. Erre lehetőséget nyújt az un. Bayes-féle logika. A gondolat nagyjelentőségű: a tapasztalatokon nyugvó megállapítások módosítása az új információk tükrében. Belátható ugyanis, hogy a tapasztalati (korábbi tapasztalatokról van szó) információkat nem szabad (illetve nem célszerű) elvetni akkor, ha az új információk szerzésében korlátozottak vagyunk elvi vagy gyakorlati okok miatt. Előnyösebb tehát a „régi” és az „új” ötvözése. A Bayes-féle logika matematikai alapja a valószínűségszámításban szereplő Bayes-tétel. A Bayes-féle következtetés jelentősége a modern döntéselméletben rohamosan nő (2.4 pont).
6.5. DÖNTÉSI OSZTÁLYOK ÉS DÖNTÉSI KRITÉRIUMOK
Egységes döntési kritérium nincs. Tudjuk, hogy vannak kifejezetten szubjektív (a rossz értelemben vett szubjektív) döntési kritériumok is. Ilyen például a tekintélyi elv kritériuma, amikor valaki a tekintélyt tekinti döntő kritériumnak (saját vagy mások tekintélyét), vagy ilyen az önkényesség (autark kritérium). A „rossz értelemben vett szubjektív” kifejezéssel arra utalunk, hogy ezek a kritériumok nem tartoznak a racionális kritériumok közé, de nem jelenti azt, hogy az ilyen döntési kritériumok mindig helytelenek. A döntési kritériumok döntési osztályonként változnak. Döntési osztályokat a tényállapotokra (vagy következményekre) vonatkozó valószínűségek alapján állítunk fel. Három döntési osztályt szokás megkülönböztetni: a bizonytalan, a kockázatos és a biztos döntések osztályát. Bizonytalan döntések osztálya: A bizonytalan döntések osztályába soroljuk azokat a döntési problémákat, amelyekben nem ismerjük a tényállapotok (illetve következmények) valószínűségeit. A bizonytalan döntések osztályában nincs egységes döntési kritérium. A döntést hozó pszichológiai beállítottságától függően definiálhatunk döntési kritériumokat. A legismertebbek a Wald-féle, a Savage-féle, a Hurvicz-féle és a Laplace-féle kritériumok. A Wald-kritériumot másképpen minimax (illetve maximin) kritériumnak is nevezik. A pesszimista és óvatos döntést hozó kritériuma. A pesszimista döntést hozó a legrosszabb következményt tekinti, de mivel óvatos is, igyekszik magát a lehető legrosszabbtól megvédeni. Eljárásának lényege: minden egyes cselekvési változat esetében a legrosszabb következményt tekintve ezek közül a legjobbat, azaz a relatíve legkisebb rosszat választja. Esetünkben: A Savage kritérium az un. minimális regret kritériuma. (A regret angol szó, megbánást jelent.) Pszichológiai alapja az elmulasztott lehetőségen érzett megbánás. (A lottózók, illetve totózók gyakran vannak ilyen pszichológiai állapotban.) A regret mértéke az adott körülmények közötti optimális (tehát a legjobb) és a tényleges döntés közötti különbség a következmények értékében mérve. A regretmatrixra ezután a Wald kritériumot alkalmazzuk: a legnagyobb regretek közül választjuk a legkisebbet (minimáljuk a maximumokat, innét a minimax elnevezése a Wald-kritériumnak).
93
Esetünkben:
A Hurvicz-féle kritérium az un. optimizmus együtthatóval súlyozva számítja ki a legmegfelelőbb cselekvési változatot. Az optimizmus együttható az elnevezéssel asszociálódó „komolytalan” felhanggal ellentétben, egzakt matematikai gondolatmenet alapján határozható meg. Pszichológiai alapja a két végletes álláspont – a teljes pesszimizmus és a teljes optimizmus – közötti „arany középút” keresése. A Laplace-kritérium alapja az elégtelen megokolás elvében gyökeredzik. Eszerint, ha nincs elégséges indokunk a különböző események bekövetkezési valószínűségének megállapítására, akkor a Laplace-féle álláspont szerint legcélszerűbb, ha minden egyes eseményt azonos valószínűséggel tekintünk. Példánkban:
Kockázatos döntések osztálya: A legtöbb valóságos döntési probléma a kockázatos döntések osztályába esik. A kockázatos döntések osztályába tartoznak mindazok a döntések, amelyek esetében a tényállapotok (vagy következmények) valószínűségei ismertek, azaz ismeretes a valószínűségeloszlásuk. A kockázatos döntések osztályában alkalmazott döntési kritérium az un. Bayes-féle kritérium, másnéven az optimális várható érték kritériuma. A várható érték a valószínűségszámítás igen pontosan kidolgozott fogalma. Bayes ismerte fel először – és fogalmazta meg egzakt módon – ,hogy abban az esetben, ha a döntési problémában az „esélyeknek”, azaz valószínűségeknek szerepe van, akkor a döntést hozók az optimális várható érték alapján döntenek. Másszóval, azt a cselekvési változatot választják, amelyiknek a „várható kilátása” a legjobb.
94
Kockázatos döntés az elsődleges információk alapján:
Kockázatos döntés a pótlólagos információk alapján:
95
Kockázatos döntés az etikai neutralitás elve alapján: A kockázatos döntések esetében igen figyelemreméltóak az un. etikai neutralitás elvéből levezethető következmények. (Az etikai neutralitás gondolatának kidolgozása Ramsey nevéhez fűződik.) Ha egy kockázatos döntési probléma esetében a döntést hozó közömbös (etikailag neutrális) a cselekvési változatok között, akkor a cselekvési változatok várható értékei számára azonosak. Ebből a magatartásból – a megfelelő számítási eljárással – kiszámíthatók az eseményekhez rendelt latens valószínűségek. Ekkor a közömbösség azt jelenti, hogy a döntést hozó számára a két cselekvési változat várható értéke azonos, tehát:
M s1 = M s 2 Nézzük meg, hogy ebben az esetben mekkora valószínűségértéket rendelt az egyes tényállapotokhoz – intuitíve és impliciten – a döntést hozó.
96
Biztos döntések osztálya: A biztos döntések osztályába tartoznak mindazok a döntési problémák, amelyek esetében biztosan tudjuk, hogy egy cselekvési változat esetében melyik következmény lesz az eredmény. Ez kétféleképpen állhat elő: biztosan (tehát egyes valószínűséggel) tudjuk, hogy melyik tényállapot következik be, vagy pedig a cselekvési változathoz tartozó egyetlen eredmény (következmény) bekövetkezését tekintjük biztosnak. Gyakorlatilag a két eset azonos, mert ha csak egyetlen tényállapotot tekintünk biztosnak, akkor egy cselekvési változat és egy biztos tényállapot biztos körülményt határoz meg. A biztos döntések osztályában használt döntési kritérium maximum vagy minimum kritérium. Az ilyen problémák megoldására dolgozták ki a matematikai programozás néven ismert eljárásokat, amelyekkel véges számú lépésben közvetlenül megtalálható, (illetve kiszámítható) a maximális (vagy minimális) eredményt nyújtó cselekvési változat. A matematikai programozás eljárásai közül a legismertebb a lineáris programozás. Esetünkben:
Az információ értéke:
97
6.6. A MINTAVÉTEL ÉS A KÖVETKEZTETÉS HIBÁI
Mintavételi alapelvek Következtetés
Sokaság
Fn(x), Me, Me, s*...
Minta
F(x), M(ξ M(ξ), D(ξ D(ξ) ….
Mintavétel
¾ 29. ábra: Mintavételi alapelvek
Következtetés Következtetés hibái hibái Sokaság Sokaság
„jó” „jó”
„rossz” „rossz”
Nincs Nincs hiba hiba εε
Másodfajú Másodfajú hiba, hiba, ββ
„rossz” „rossz”
A minta minta minősítése minősítése A sokaságról aa sokaságról
„jó” „jó”
Elsőfajú Elsőfajú hiba, α hiba, α
Nincs Nincs hiba hiba ee ¾ ¾
30. ábra: Következtetés hibái
98
Az elkövethető hiba kétféle lehet: elsőfajú hiba és másodfajú hiba. Az elsőfajú hibát csak igaz hipotézisek vizsgálata során követhetünk el. Akkor fordul elő, ha igaz hipotézist a minta adatai alapján nem fogadunk el. Az elsőfajú hiba elkövetésének valószínűségét α-val jelöljük, s értéke egy adott próba során tetszőleges kicsinyre csökkenthető. A másodfajú hibát csak hamis hipotézisek vizsgálata során követhetünk el. Másodfajú hiba akkor jelentkezik, ha a hamis hipotézist a minta adatai alapján nem utasítjuk el. A másodfajú hiba valószínűségét β-val jelöljük, s értéke egy adott próba során bármely konkrét – a feltett hipotetikustól eltérő – alapsokasági paraméterre vonatkozóan kiszámítható. A másodfajú hiba veszélye csökken a hipotetikus és a tényleges várható érték eltérésének növekedésével, viszont nő, ha adott próba esetén az elsőfajú hibát csökkentjük. Az első- és másodfajú hiba egyidejűleg csak a mintaelemek számának növelésével csökkenthető. A próbák tervezésénél és az eredmények értelmezése során ezekre tekintettel kell lennünk.
99
Feladat: Egy szabályozott gyártási folyamatban a kritikus minőségi jellemző µ0=3,1 cm3, σ0=0,08 cm3 normális eloszlást követ. a.) Számolja ki a µ0 ± 2σ0 beavatkozási határok esetén n = 1 elemű mintavétel mellett az elsőfajú hiba valószínűségét! b.) Mekkora a másodfajú hiba valószínűsége, ha a várható érték µ1=3,3 cm3 -re változott? c.) Mekkora az első és másodfajú hiba valószínűsége, µ0 ± 3σ0 beavatkozási határok valamint n=1 és n=4 elemű mintavétel mellett?
Első-, másodfajú hiba számolása
Első-, másodfajú hiba számolása
nn == 11
α/2 µ0=3,1
2,94 − 3,1 = 0,08
3,26 − 3,3 2,94 − 3,3 − Φ = 0,08 0,08
α = 2· 2,28 = 4,56%
Φ (− 0,5) − Φ (− 4,5) = 1 − 0,6915 =
Készítette: Erdei János
¾
Első-, másodfajú hiba számolása n=4
α/2
ABH=2,86 cm3
α
2,86 − 3,1 = Φ = 2 0,08 Φ(-3) = 0,13%
α = 0,26% Készítette: Erdei János
ABH=2,86 cm3 ABH=2,98 cm3
µµ00±±3σ 3σ00
FBH=3,22 cm3
FBH=3,34 cm3
α/2
30,85%
Készítette: Erdei János
Első-, másodfajú hiba számolása
µ0=3,1 → µ1=3,3
µµ00±±2σ 2σ00
β=P(ABH<ξ1
=Φ(-2) = 2,28%
nn == 11
ABH=2,94 cm3
FBH=3,26 cm3
α/2
P(ξ0
α/2
β
µ0=3,1 → µ1=3,3
FBH=3,26 cm3
α/2
nn == 11
α/2
ABH=2,94 cm3
FBH=3,34 cm3
α/2
3,34 − 3,3 2,86 − 3,3 − Φ = 0,08 0,08
3,22− 3,3 2,98− 3,3 = − Φ 0,04 0,04
β = Φ
β = Φ
Φ (0,5 ) − Φ (− 5,5) = 69,15%
= Φ (− 2 ) − Φ (− 8) = 2,28% ¾
Készítette: Erdei János
100
σx =
0,08 = 0,04 4
Feladat: Egy statisztikai folyamatszabályozás során a szimmetrikus beavatkozási határokat 10 %-os kockázati szint mellett alakították ki. A folyamat normális eloszlást követ, szabályozott állapotban N(190; 5) paraméterekkel. a.) Mekkora a másodfajú hiba n=1 elemű mintavétel mellett, ha a folyamat elállítódik. Az elállítódott folyamat eloszlása N(194; 9). b.) Végezze el az előző számítást n=9 elemű minta átlagára is.
Feladat: Igazoljuk, hogy σ x =
σ n
!
101
7. BECSLÉS
Valószínűségszámítás Valószínűségszámítás Valószínűségelmélet Valószínűségelmélet
Matematikai Matematikai statisztika statisztika
Axiómák, Axiómák, alaptételek alaptételek
Minta Minta vétel vétel
Kombinatorika Kombinatorika
Leíró Leíró statisztika statisztika
Geometriai Geometriai val.sz. val.sz.
Becslés Becslés
Val.szám Val.szám tételek tételek
Hipotézisvizsgálat Hipotézisvizsgálat
Elméleti Elméleti eloszlások eloszlások
Összefüggésvizsgálat Összefüggésvizsgálat
102
Az előzőekben láthattuk, hogy az elméleti eloszlásokkal történő számoláshoz elsősorban azok paramétereinek ismerete szükséges. A gyakorlatban egy adott probléma elemzésénél többnyire tapasztalatból tudjuk az eloszlás jellegét, de nem ismerjük az eloszlás alakját pontosan meghatározó paramétereket. Tudjuk például, hogy a labdarúgó mérkőzéseken a gólok száma jó közelítéssel Poisson-eloszlású. Ugyanilyen eloszlással írható le mondjuk a Tiszán egy év alatt levonuló árhullámok száma, csak éppen más λ paraméterrel. Minden – majdnem minden – elméleti eloszlásnak van(nak) paramétere(i), melyeket általában nem ismerünk, azokat a ξ-re vonatkozó statisztikai mintából kell közelítőleg meghatároznunk, becsülnünk, mert csak ezek ismeretében tudunk a vizsgált jelenséggel kapcsolatos valószínűségi kérdésekre válaszolni. A mintából számított mutatókat (átlag, szórás, stb.) a sokasági jellemzőkre való következtetésre, az ismeretlen paraméterek becslésére (is) használjuk. Nem arról van tehát szó, hogy a mintából kiszámoljuk az ismeretlen paramétert. A mintából számolt mutatók értékei függnek a véletlentől, mintáról mintára változnak, így maguk is valószínűségi változónak tekinthetők. A mintából számolt mutatók eloszlását mintavételi eloszlásnak nevezzük. Annak megítélése, hogy a mintából számolt mutató (amit minta statisztikának vagy röviden statisztikának is neveznek) mikor tekinthető az ismeretlen elméleti paraméter „jó” becslésének, többféle szempontból történhet.
7.1. A BECSLÉS TULAJDONSÁGAI2
Tudjuk, hogy a sokaság paramétereit általában több statisztikával is becsülhetjük. Így pl. a várható értéket - normális eloszlású alapsokaság esetében - a mintaátlaggal és a mediánnal is becsülhetjük, a szórást a minta szórásával, de a terjedelem segítségével is becsülhetjük stb. Természetesen felmerül a kérdés, hogy ezek közül melyik becslést kell választanunk. Hogy ilyen esetekben a legmegfelelőbb becslést választhassuk, kritériumokat kell felállítanunk arra vonatkozólag, hogy mikor fogadjunk el egy becslést jónak, illetve mikor tartsuk jobbnak az egyik becslést a másiknál. A statisztikai becslés Fisher-féle kritériumait az alábbiakban foglaljuk össze. Torzítatlan becslés: A legfontosabb tulajdonság, amit egy „jónak” minősített becsléstől megkívánunk, hogy a becslés a szóban forgó paraméterérték körül ingadozzék. Pontosabban azt kívánjuk meg, hogy a becslés (az illető statisztika) várható értéke éppen a megfelelő paraméterérték legyen. Ha egy becslésre ez a követelmény teljesül, akkor torzítatlan becslésről beszélünk. Így pl. torzítatlan a becslés, ha a mintaátlagok várható értéke megegyezik az alapsokaság várható
()
értékével: M x = M ( ξ ) , vagy a korrigált tapasztalati szórásnégyzet várható értéke az elméleti varianciával egyenlő: M ( s *2 ) = D 2 ( ξ ) . Ez azonban nem igaz a tapasztalati szórásnégyzetre. A tapasztalati szórásnégyzet várható értéke (az elméleti varianciát az egyszerűség kedvéért σ2-el jelölve):
M( s2 ) =
n −1 2 1 σ = 1 − σ 2 . Az empirikus (tapasztalati) szórásnégyzet tehát elméleti variancia n n
torzított becslése. Látható, hogy a „torzítás mértéke” függ a mintaszámtól, s a mintaszám növekedésével csökken. Az ilyen tulajdonságú becsléseket aszimptotikusan torzítatlan becslésnek nevezzük. A torzítatlanság nem azt jelenti, hogy egy adott mintából kapott becslés egyenlő az ismeretlen paraméterrel, sőt arra sem ad feleletet, hogy a mintából kapott becslés értéke közel, vagy távol esik-e a valódi paramétertől. A torzítatlanság esetében csupán abban lehetünk biztosak, hogy nincs semmiféle szisztematikus, egyirányú eltérés a becslés és a becsült paraméter között. 2
A 7.1. pontban található 31. ábra, 32. ábra, 33. ábra, és 34. ábra a STATISTICA for Windows programmal készült
103
Feladat: Vizsgáljuk meg n=3 elemű statisztikai minták alapján a kockadobás tapasztalati és korrigált tapasztalati szórását. Korábban már meghatároztuk a kockadobás elméleti szórását, s azt találtuk, hogy D(ξ) ≈ 1,71). A kísérletet 50-szer megismételve a számított tapasztalati ill. korrigált tapasztalati szórásokat a 31. ábra láthatjuk. n=3 elemû minták szórásai 3.0
2.5
2.0 1,73 1.5
1,41
1.0
0.5
0.0
0
4
8
12
16
20
24
28
32
36
40
44
48
T_SZ3 K_TSZ3
31. ábra: Tapasztalati szórások összehasonlítása Az ábrán folytonos vonal mutatja a tapasztalati ill. szaggatott vonal a korrigált tapasztalati szórásokat a mintaszám függvényében. Vízszintes folytonos vonallal jelöltük a kétfajta szórás (5050 elem) átlagát. A korrigált tapasztalati szórások átlaga 1,73, a tapasztalati szórásoké 1,41. Jól látható, hogy a korrigált tapasztalati szórások az elméleti (1,71) szórás körül ingadoznak (átlaguk közel esik az elméleti értékhez), míg a tapasztalati szórások átlaga 1,41, jóval nagyobb az eltérés az elméleti értéktől. Konzisztens becslés: Konzisztensnek (összetartónak) nevezzük a becslést akkor, ha ingadozása a becsült paraméter körül a minta elemszámának növelésével egyre csökken. A korábbiakban láttuk, hogy a számtani átlag torzítatlan becslése a várható értéknek, s szórása σ x =
σ
n
. Nyilvánvaló, hogy n → ∞ esetén
σ x → 0 , vagyis a számtani átlag konzisztens becslése a várható értéknek. Feladat: Az előző példához hasonlóan „kevésbé matematikai módon”, tapasztalati adatokból vizsgáljuk meg a kockadobás esetén a két empirikus szórás viselkedését a mintaszám növekedésének függvényében. A 32. ábra mutatja a kapott eredményeket. Az ábrán folytonos vízszintes vonal jelzi az elméleti értéket [D(ξ) ≈ 1,71]. Az ábrából egyértelműen látszik, hogy a mintaszám növekedésével mind a korrigált tapasztalati, mind a tapasztalati szórás az elméleti érték körül ingadozik (torzítatlan ill. aszimptotikusan torzítatlan becslés), s az ingadozás mértéke a mintaszám növekedésével egyre kisebb (konzisztens a becslés).
104
Kockadobás szórása
2.0
1.6
1.2
0.8
0
5 10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95 100
T_SZ_ K_T_SZ
32. ábra: Kockadobás szórása a mintaszám függvényében (n=100) Megfigyelhetjük, hogy kb. 30-35 elemű minták esetén a különbség a két szórás között, már gyakorlatilag elhanyagolható. A 33. ábra csak az első 50 adatot ábrázolva, a két szórás közötti különbség jobban megfigyelhető. Kockadobás szórása
2.4
2.0
1.6
1.2
0.8
0
5
10
15
20
25
30
35
40
45
50
T_SZ_ K_T_SZ
33. ábra: Kockadobás szórása a mintaszám függvényében (n=50)
Hatásos becslés: Két becslés összehasonlításakor a hatásosság vagy más néven efficiencia kritériuma alapján döntjük el, hogy a kettő közül melyik a jobb. A hatásosságot nagyon fontos becslési kritériumnak tekintjük. Két becslés közül a kevésbé ingadozót nevezzük hatásosabbnak. Az ingadozás mértéke a szórás, ezért a becslések ingadozását is a szórásukkal jellemezzük. Tehát két becslés közül a kisebb szórású becslést tekintjük hatásosabbnak, jobbnak. Gyakran előfordul, hogy a torzítatlan becslések között van olyan, amelyiknek a szórása az összes többi becslés szórásánál kisebb (adott n mellett). Ekkor ezt a minimális szórású, torzítatlan becslést hatásosnak nevezzük, és a többi becslés hatásfokát ehhez mérjük.
105
Feladat:
Tapasztalati adatokból hasonlítsuk össze (n=5 elemű minták alapján) a kockadobás átlagát és mediánját. A kísérletet 50-szer megismételve, a minták átlagait és mediánjait a 34. ábra mutatja. n=5 elemû minták átlaga és mediánja 6.5
5.5
4.5
3.5
2.5
1.5
0.5
0
5
10
15
20
25
30
35
40
45
50
ATL MED
34. ábra: Kockadobás átlaga és mediánja Az ábrán szaggatott vonallal összekötve a négyzetek a mediánokat, s folytonos vonallal összekötve körök jelölik az egyes minták átlagait. Vízszintesen behúzott folytonos vonal a várható értéket mutatja (M(ξ) = 3,5). Megfigyelhetjük, hogy a medián is és az átlag is az elméleti érték körül ingadozik (torzítatlan becslések), ugyanakkor az átlagok eltérése, ingadozása kisebb, mint a mediánoké. Kiszámolva a két adatsor korrigált tapasztalati szórásait, az eredmények az alábbiak: s *átlag = 0 ,794 ;
s *medián = 1,320 . Az átlag szórása valóban kisebb, mint a mediáné, az adatok alapján kb. 40%-kal. Az átlag tehát hatásosabb becslés, mint a medián. Elégséges becslés: Egy becslés elégséges, ha az lényegében minden információt tartalmaz a paraméterre vonatkozóan. Ez más szóval annyit jelent, nincs más olyan becslés, amelyik a paraméterről több információt szolgáltatna, mint az elégségesnek minősülő becslés.
106
7.2. A PONTBECSLÉS MÓDSZEREI
Az eddigiek során is használtunk különféle becslőfüggvényeket pontbecslés céljára, de ezeket csak „ösztönösen” választottuk. Így természetesen adódott, hogy pl. a várható értéket a mintából számított átlaggal vagy más középértékkel becsüljük. Ez az ún. analógia elve, ami azt jelenti, hogy a mintából a becsülendő jellemzővel megegyező tartalmú mutatót számítunk ki, és ennek segítségével becsüljük a megfelelő sokasági jellemzőt. Léteznek azonban olyan általános elvek, módszerek, amelyek segítségével olyan esetekben is tudunk jó tulajdonságú becslőfüggvényeket készíteni, amikor a megérzés vagy az analógia már nem segít. A legegyszerűbb grafikus becslést kivéve nem célunk ezek részletes ismertetése, csak röviden felsoroljuk, illetve ismertetjük lényegüket. ♦ Maximum-likelihood módszer (a legnagyobb valószínűség elve): az eljárás lényege az ún. likelihood függvény felállítása, amely nem más, mint a mintaelemek együttes sűrűségfüggvénye, s az ismeretlen paraméter becslésére azt a statisztikát használjuk, melyre ez a függvény maximális értéket vesz fel. Ez az egyik legjobb és leggyakrabban alkalmazott eljárás. ♦ Legkisebb négyzetek módszere nem pusztán a statisztikai becslésre szolgáló eljárás, hanem alkalmazható más becslési feladatok megoldására is. A módszer lényege, hogy egy elméleti modellnek (ez lehet egy eloszlás vagy sűrűségfüggvény, de lehet egy egyszerű konstans függvény is) a paramétereit határozza meg úgy, hogy a tényleges és a becsült paraméterekkel illesztett modellek négyzetes eltérése, azaz az eltérések négyzetösszege minimális legyen (pl.: regresszió-számítás). ♦ Momentumok módszere abban áll, hogy ha k számú paramétert akarunk becsülni, akkor az eloszlás első k számú elméleti momentumát egyenlővé tesszük a mintából számított tapasztalati momentumokkal. Így az ismeretlen paraméterekre egyenletrendszert nyerünk, amely kedvező esetben megoldható. ♦ Grafikus paraméterbecslés az előző matematikai eljárásokhoz képest, ez inkább a gyakorlat számára könnyebben kezelhető eljárás. Bár pontossága természetesen a grafikus ábrázolás adta lehetőségektől függ, de egyszerűsége miatt sokszor jól használható. Lényege, hogy valamilyen módon (többnyire logaritmizálással) linearizáljuk az eloszlásfüggvényt, s az adatokat grafikusan ábrázolva az egyenes meredekségéből és/vagy tengelymetszetéből következtetünk az eloszlás ismeretlen paraméteré(ei)re. Exponenciális eloszlás paraméterének grafikus becslése: Az exponenciális eloszlást viszonylag egyszerűen „kiegyenesíthetjük”. Az eloszlás eloszlásfüggvénye: F ( x ) = 1 − e − λx . Mindkét oldalból 1-et kivonva, -1-el megszorozva, majd az egyenletet logaritmizálva és újra megszorozva –1-gyel, az alábbi összefüggést kapjuk: -ln[1-F(x)]= λx Ha x függvényében ábrázoljuk a baloldalon lévő kifejezést, egy egyenest kapunk, melynek tengelymetszete 0, s iránytangense (meredeksége) éppen az ismeretlen λ paraméter. (35. ábra)
107
-ln[1-F(x)]
tgα ≈ λ
α
x 35. ábra: Exponenciális eloszlás λ paraméterének grafikus becslése Normális eloszlás paramétereinek grafikus becslése: Normális eloszlás eloszlásfüggvényének „kiegyenesítése” már nem végezhető el egyszerű logaritmizálással, mivel az eloszlásfüggvénynek elemi függvényét nem ismerjük. Speciális beosztású ordinátatengelyű koordinátarendszert alkalmazva azonban az eloszlásfüggvény képe linearizálható. A függőleges tengelyen az eloszlásfüggvény értékeit ábrázoljuk úgy, hogy az eloszlásfüggvény középértékéből (0,5) kiindulva az egységnyi távolság 1 szórásnyi legyen. Az egyszerűség kedvéért ábrázoljuk most a standard normális eloszlás eloszlásfüggvényét. Tudjuk, hogy a függvény (–3), (-2), (-1), 0, 1, 2, 3 helyen felvett értékei a következők 0,00135; 0,0228; 0,1587; 0,5; 0,8413; 0,9772 és 0,99865. Ábrázoljuk ezeket a pontokat úgy, hogy a Φ(1) egy távolságegységgel feljebb, a Φ(-1) egy távolságegységgel lejjebb, a Φ(2) 2 távolságegységgel feljebb, a Φ(-2) 2 távolságegységgel lejjebb stb. kerüljön, mint a Φ(0) =0,5. Az ordináta tengely skálázása ezáltal egyenlőtlen lett, viszont így a Φ(u) függvény képe egyenes, ahol nyilván a többi érték is ezen az egyenesen fekvő pontot határoz meg (36. ábra)
0,998 0,97 0,84 0,5
0,15 0,0228 0,0013
-3
-2
-1
0
1
36. ábra: Gauss-papíros ábrázolás
108
2
Ha az x tengelyt most átskálázzuk (-3 helyébe -3σ, -2 helyébe -2σ stb. kerül), akkor az előző pontok egy 0 várható értékű, σ szórású normális eloszlású változó eloszlásfüggvényének a pontjai. Végül toljuk el az ordinátatengelyt eredeti helyzetével párhuzamosan az x tengely mentén -µ egységgel. Az így kapott koordinátarendszerben a µ várható értékű σ szórású normális eloszlású változó F(x) eloszlásfüggvényének képe egyenes. Ha a minta adatai alapján kapott tapasztalati eloszlásfüggvényt az előbbi koordinátarendszerben (un. Gauss-papíron) ábrázoljuk, normális eloszlás esetén a pontok közelítőleg egy egyenesre esnek. Behúzva az egyenest, a normális eloszlás tulajdonságait ismerve becsülhetjük az ismeretlen paramétereket. Az egyenes és a függőleges tengely (ill. gyakrabban az y = 0,5 ordináta érték) metszéspontjánál leolvasva az x tengely értékét kapjuk az eloszlás µ paraméterét. A 0,1587 ill. a 0,8413 y érték és az egyenes metszéspontjánál pedig a µ-σ ill. a µ+σ értékeket olvashatjuk le az x tengelyen, amiből a µ ismeretében σ könnyen meghatározható.
7.3. INTERVALLUMBECSLÉS
A becslésről szóló eddigi fejtegetéseink során az eloszlás valamely ismeretlen paraméterét egyetlen mennyiséggel, a mintaelemekből számított statisztika numerikus értékével, tehát egyetlen számadattal becsültük, azaz pontbecslést alkalmaztunk. Mivel a mintából számolt statisztika is valószínűségi változó, aktuális értéke általában eltér a becsült paramétertől. Ha sokszor (sok n-es mintából) végezzük a becslést, akkor a mintastatisztika értékei – torzítatlan becslés esetén – az elméleti érték körül szóródnak. A szóródás mértéke természetesen függ a minta nagyságától. Bár egyetlen mintából nem tudjuk megmondani a becsült paraméter pontos értékét, a mintastatisztika eloszlásának ismeretében (ezeket neveztük mintavételi eloszlásoknak) sokszor meg tudunk adni egy olyan intervallumot, amely az ismeretlen paramétert nagy – mondjuk 95 %-os – valószínűséggel tartalmazza. Az ilyen intervallumot az adott paraméterre vonatkozó 95 %-os konfidencia-intervallumnak (megbízhatósági intervallumnak) nevezzük. A továbbiakban a különböző paraméterekre vonatkozó intervallumbecsléssel foglalkozunk. Konfidencia-intervallum a normális eloszlás várható értékére ismert alapsokasági szórás esetén: Tegyük fel, hogy a ξ valószínűségi változó N(µ;σ) eloszlású, ahol σ szórás ismert. A µ paramétert statisztikai mintából a számtani átlaggal becsüljük. Tudjuk, hogy az átlag eloszlása (mintavételi eloszlás) szintén normális eloszlású M ( x ) = µ várható értékkel, és σ x =
σ
n
szórással. A normális
eloszlás ismert tulajdonsága, az ún 2σ-szabály alapján az átlag értéke 95,44% valószínűséggel a
várható érték ± 2 szórás tartományba, vagyis a µ − 2
σ n
,µ + 2
σ
intervallumba esik: n
σ σ P µ − 2 < x<µ+2 = 0 ,9544 . n n Ha ismernénk tehát a µ várható értéket, és a számegyenesen megrajzolnánk a fenti intervallumot, akkor az n elemű minták számtani közepét kiszámolva 100 esetből kb. 95 mintaközép ebbe az intervallumba esik. Sajnos azonban µ értékét nem ismerjük (éppen ezt szeretnénk becsülni), a fenti intervallumot nem tudjuk megrajzolni. Rendezzük át az összefüggést a következő formára:
σ σ <µ < x+2 P x − 2 = 0 ,9544 . n n
109
Ezen összefüggés valószínűségelméleti értelme a következő. Az ismeretlen µ paraméter nem valószínűségi változó, hanem egy állandó, a számegyenes egy adott pontja. Valószínűségi változó
viszont az x − 2
σ
,x + 2
σ
intervallum két végpontja. Azaz annak a valószínűsége, hogy ez a n véletlen helyzetű intervallum tartalmazza (lefedi) a µ pontot, közelítőleg 95 %. (37. ábra)
n
µ
37. ábra: Konfidencia-intervallumok a µ várható értékre
Az x − 2
σ n
,x + 2
σ
intervallumot a normális eloszlás várható értékére vonatkozó 95 %-os n
(pontosabban 95,44 %-os) konfidencia intervallumnak nevezzük. Természetesen nemcsak 95 %-os intervallumot lehet szerkeszteni. Ha a sokaság elméleti szórása ismert (σ), akkor az átlag mintavételi eloszlása alapján tetszőleges kicsiny α > 0 számhoz meghatározható olyan uα/2 mennyiség, hogy a
(
)
σ σ P x − uα / 2 < µ < x + uα / 2 = P x − ∆ < µ < x + ∆ = 1 − α . n n
Normális eloszlás esetén tehát az x − uα / 2
σ n
, x + uα / 2
σ
intervallum (1-α) szintű konfidencia n
intervallum a µ várható értékre. Adott eloszlás esetén minél nagyobb a megbízhatósági szint (1-α), annál szélesebb intervallumot kapunk. Nagy biztonsággal csak viszonylag hosszabb intervallumról állíthatjuk, hogy valóban tartalmazza az ismeretlen paramétert. Mint látható az intervallum hossza függ még a minta nagyságától és az alapsokasági (σ) szórástól.
110
Az eddigiekben csak kétoldali intervallumról beszéltünk, mivel a gyakorlatban ez az elterjedtebb. Ha csak alsó vagy csak felső határokat kívánunk becsülni, akkor a követendő eljárás az eddigiekhez hasonló lesz. A részletek mellőzésével belátható, hogy felső korlát esetén
σ P µ < x + uα = 1 − α kapható, ahol uα a standard normális eloszlás táblázatból kereshető ki. n Azaz annak a valószínűsége, hogy az ismeretlen sokasági paraméter az x + uα
Hasonló módon az alsó korlátra a P µ > x − uα
σ
n
érték alá esik, 1-α.
σ
= 1 − α összefüggést kapunk. n
Feladat: ROM chipek előállításánál az égetőkemence maximum hőmérsékletét vizsgálták. Korábbi vizsgálatok alapján tudják, hogy a folyamatban a maximum hőmérsékletek elméleti szórása 12°C. A vizsgálat céljára 8 elemű véletlen mintát vettek és az átlag hőmérséklet 492°C-ra adódott. Adjunk 95%-os szinten intervallumbecslést a kemence hőmérsékletének várható értékére! n=8
x = 492°C σ= 12°C ε = 0,95 → α = 0,05 → kétoldali becslés: α/2 = 0,025 → uα/2 = 1,96 behelyettesítve a fenti összefüggésbe:
12
492 − 1,96
< µ < 492 + 1,96
8 483,68 < µ < 500,32
12 8
,
A ROM chipek érzékenysége miatt a chipeket nem szabad tartósan túl magas hőhatásnak kitenni, ezért a technológiát úgy kell beállítani, hogy a hőmérséklet hosszabb távon ne haladja meg az 500°C-ot. A minta alapján – 95%-os megbízhatósággal – teljesíti-e ezt a feltételt az égetőkemence? n=8
x = 492°C σ= 12°C ε = 0,95 → α = 0,05 → egyoldali becslés → uα = 1,645
µ < x + uα
σ
n
= 492 + 1,645
111
12 8
≈ 499 °C
Feladat: Az Egis részvény n=59 havi adatából az USD-ben megadott hozam átlaga: x =3,57%, szórása: σ=16,72%. Adjunk 95ó %-os szinten intervallumbecslést a hozam várható értékére!
Konfidencia-intervallum a normális eloszlás várható értékére ismeretlen alapsokaság szórás esetén: Ebben az esetben továbbra is feltételezzük, hogy a sokaság N(µ;σ) eloszlású, de sem µ-t sem σ-t nem ismerjük. A problémát ezúttal az okozza, hogy bár az átlag továbbra is normális eloszlású, de az elméleti szórás nem ismert, így kénytelenek vagyunk a szórást a mintából becsülni (s*). Ennélfogva az
x−µ
σ
n
helyett kénytelenek vagyunk a
x−µ s*
n
változót használni. Ez viszont már nem normális
eloszlású, hanem t- (Student-) eloszlású valószínűségi változó, DF= n-1 szabadságfokkal. A Student-eloszlás a normális eloszláshoz hasonlóan szimmetrikus eloszlás, az eloszlás egy paramétere az ún. szabadságfok (DF) jellemzi. A t-eloszlás ismeretében nézzük tehát az intervallumbecslés határainak meghatározását. Az előző esethez képest „csak” annyi a különbség, hogy normális eloszlás helyett a t-eloszlást kell alkalmaznunk.
s* s* = 1−α P x − tα / 2 ( DF ) < µ < x + tα / 2 ( DF ) n n A tα/2(DF) értéket a DF = n-1 szabadságfokú t-eloszlás táblázatából kereshetjük ki. Az s* – az eddigieknek megfelelően – a korrigált tapasztalati szórást jelöli.
112
Feladat: Tegyük fel, hogy az előző - ROM égetőkemencés – példánál nem ismerjük az elméleti szórást, de továbbra is tudjuk, hogy a maximum hőmérsékletek normális eloszlással írhatók le. A nyolc elemű minta korrigált tapasztalati szórása s*= 4,5°C, az átlag továbbra is 492°C. Adjunk becslést 95%-os megbízhatósági szinten a kemence hőmérsékletének várható értékére! n=8
x = 492°C s*= 4,5°C DF = n –1 = 8 – 1 = 7 ε = 0,95 → α = 0,05 → kétoldali becslés: α/2 = 0,025 → tα/2 = 2,365
492 − 2 ,365
4 ,5 8
< µ < 492 + 2 ,365
2 ,5 8
,
488,24 < µ < 495,76 Feladat: Az Egis részvény várható értékére vonatkozó becslést végezzük el ismeretlen alapsokasági szórás esetén is!
113
Számításainkat a MINITAB szoftver eredményeivel is összevethetjük (38. ábra).
38. ábra: Konfidencia-intervallum az Egis hozam várható értékére
Sokasági arány becslése: A vizsgált egyedek (pl. a férfiak aránya a népességen belül, a selejtes termékek aránya stb.) sokasági arányát jelöljük nagy P-vel. Ennek torzítatlan (pont)becslése a p = k/n relatív gyakoriság, ahol n a mintaszám, k a mintában talált „kedvező” esetek száma. Mivel n rögzített (nem valószínűségi változó), k binomiális eloszlást követ, így p is binomiális eloszlású lesz, M(p)= P várható értékkel és D2(p) = P(1-P)/n varianciával. Mivel az elméleti variancia eleve ismeretlen az sp2 = p(1-p)/n értékkel becsüljük. A mintából számított p ismeretében a binomiális eloszlás táblázatából könnyen megkaphatjuk a keresett intervallumot. Ezt az eljárást azonban a gyakorlatban ritkán alkalmazzuk, mert diszkrét jellege meglehetősen pontatlanná teszi. Bizonyos feltételek mellett a binomiális eloszlás jól közelíthető normális eloszlással. Ha például p közel van 0,5-hez, akkor már n = 20 elemű minta is elegendő a normális közelítéshez. Ekkor a kétoldali konfidenciaintervallum:
P p − uα / 2
p( 1 − p ) < P < p + uα / 2 n
114
p( 1 − p ) = 1 −α n
Feladat: A Felvillanyozzuk Kft. napi termeléséből vett n=200 elemű mintában a hibás égők száma 24 db. 95%-os megbízhatósági szint mellett adjunk intervallumbecslést a sokasági arányra. n = 200 p = 24/200 = 0,12 ε = 0,95 → α = 0,05 → kétoldali becslés: α/2 = 0,025 → uα/2 = 1,96
0 ,12 − 1,96
0 ,12 ⋅ 0 ,88 0 ,12 ⋅ 0 ,88 < P < 0 ,12 + 1,96 200 200 0,075 < P < 0,165
Sokasági variancia becslése: Ebben a részben a normális eloszlású sokaság szórásnégyzetének intervallumbecslését mutatjuk be. Ha a sokaság eloszlása nem normális, akkor még nagy minták esetén sem érvényes az itt következő intervallumbecslés. A σ2 (pont)becslésére használt tapasztalati és korrigált tapasztalati szórásnégyzetek közelítőleg az ún. χ2-eloszlással írhatók le. A χ2-eloszlás jellemzőit, alakját egy paramétere – a t-eloszláshoz hasonlóan – a szabadságfok határozza meg. Különböző χ2-eloszlásokat mutat a 39. ábra. Sajnálatos módon az eddig „megszokott”, „kényelmes” mintavételi eloszlásoktól eltérően, a χ2-eloszlás csak pozitív értékekre van értelmezve, nem szimmetrikus, de ettől eltekintve ugyanúgy használhatjuk intervallumbecslésre, mint a standard normál ill. a t-eloszlásokat. A szabadságfok növekedésével az eloszlás közelít a normális eloszláshoz, amit a későbbiekben a konfidencia intervallumok meghatározásánál is kihasználunk. Chi-négyzet eloszlás sûrûségfüggvénye
f(x) 0.5
0.4
DF = 2
0.3
DF = 4 DF = 7
0.2
0.1
0.0
0
2
4
6
8
10
12
14
x
16
39. ábra: χ2-eloszlás sűrűségfüggvénye3 Mivel az eloszlás nem szimmetrikus, kétoldali becslés esetén az eloszlás alsó és felső oldalán kijelölt α/2 valószínűség nem egyforma hosszúságú intervallumokat jelent, ennélfogva az előzőekben vizsgált esetekkel ellentétben a konfidencia-intervallum nem lesz szimmetrikus a pontbecslésre. Normális eloszlású valószínűségi változó ismeretlen varianciájának megbízhatósági intervallumát az alábbi összefüggéssel határozhatjuk meg:
(n − 1)s*2 ( n − 1)s*2 2 = 1 − α . P 2 <σ < 2 χ χ α /2 1 −α / 2
3
Készült a STATISTICA for Windows program segítségével
115
A χ α2 / 2 és a χ 12−α / 2 értékeket a DF = n-1 szabadságfokú χ2 táblázatból lehet meghatározni. Ha a konfidencia-határokat az eloszlás elméleti szórására szeretnénk vonatkoztatni, akkor mindkét határ pozitív előjelű négyzetgyökét kell képeznünk. Ha σ becslését a tapasztalati szórással végezzük, akkor a számlálóban (n-1) helyett n-nel szorozzuk a szórást. Feladat: A Felvillanyozzuk Kft. karácsonyfa égőinek élettartamát n = 16 elemű mintából vizsgálva azt találták, hogy az élettartamok korrigált tapasztalati szórása 10 óra. Határozzuk meg az égők varianciájára ill. szórására vonatkozó 95%-os konfidencia-határokat! n = 16 s*= 10 óra DF = n –1 = 16 – 1 = 15 ε = 0,95 → α = 0,05 → kétoldali becslés: α/2 = 0,025 → 1-α/2 = 0,975
(16 − 1)10 2 < σ 2 < (16 − 1)10 2 27 ,5
6 ,26
2
54,5 < σ < 239,6 7,38 < σ < 15,5 Nagy szabadsági fok (nagy mintaszám) esetén a χ2-eloszlás közelíthető normális eloszlással. Ha a mintaszám n>30, akkor felhasználva azt az eredményt, hogy a
( 2χ
2
)
− 2 DF − 1 mennyiség 2
közelítőleg standard normális eloszlású változó, adott α valószínűséghez tartozó χα értéke kifejezhető a standard normális eloszlás uα értékéből: χ α2 =
(
)
2 1 uα + 2 DF − 1 . 2
Feladat: Tegyük fel, hogy az előző példában említett vizsgálatot n=50 elemű mintából végezték. 95 %-os megbízhatósági szinten milyen intervallumban található az elméleti szórás? n = 50 s*= 10 óra DF = n –1 = 50 – 1 = 49 ε = 0,95 → α = 0,05 → kétoldali becslés: α/2 = 0,025 → 1-α/2 = 0,975
(50 − 1)10 2 < σ 2 < (50 − 1)10 2 71,4
32 ,4
68,6 < σ2 < 151,2 8,28 < σ < 12,3 Mivel n elég nagy, ezért a χ2 értékeket normális eloszlással közelítve azt kapjuk, hogy
χ 02,025
( (
)
2 1 1,96 + 2 ⋅ 50 − 1 = 70 ,9 ill. 2 2 1 = − 1,96 + 2 ⋅ 50 − 1 = 31,9 . 2
χ 02,975 =
)
Ezeket behelyettesítve a konfidencia-határok képletébe a szórásnégyzetre ill. szórásra az alábbi intervallumok adódnak. 69,1 < σ2 < 153,6 és 8,31 < σ < 12,4.
116
8. HIPOTÉZISVIZSGÁLATOK I. NEMPARAMÉTERES PRÓBÁK
Valószínűségszámítás Valószínűségszámítás Valószínűségelmélet Valószínűségelmélet
Matematikai Matematikai statisztika statisztika
Axiómák, Axiómák, alaptételek alaptételek
Minta Minta vétel vétel
Kombinatorika Kombinatorika
Leíró Leíró statisztika statisztika
Geometriai Geometriai val.sz. val.sz.
Becslés Becslés
Val.szám Val.szám tételek tételek
Hipotézisvizsgálat Hipotézisvizsgálat
Elméleti Elméleti eloszlások eloszlások
Összefüggésvizsgálat Összefüggésvizsgálat
117
8.1. A HIPOTÉZISVIZSGÁLAT ÁLTALÁNOS MENETE
Statisztikai hipotézisen a vizsgált sokaság(ok)ra (valószínűség-eloszlásra) vagy ennek paramétere(i)re vonatkozó valamilyen feltevést értünk. Ha ennek ellenőrzésére (ill. bizonyítására) mintát használunk, akkor statisztikai hipotézisvizsgálatról (statisztikai próbáról) beszélünk. Ebben az esetben – mivel a minta csak része a sokaságnak, de nem azonos vele – az első- és másodfajú hiba elkövetésének lehetősége mindig fennáll. Attól függően, hogy a feltételezésünk (hipotézisünk) mire vonatkozik, a statisztikai próbák két csoportját különböztethetjük meg. • Ha a vizsgált valószínűségi változó eloszlása ismert, de ismeretlen paraméter(eke)t tartalmaz, akkor a hipotézisvizsgálat az ismeretlen paraméter(ek)re irányul. (Például a Gauss eloszlás µ paraméterére, azaz az eloszlás várható értékére.) Ekkor paraméteres próbáról beszélünk. • Ha az eloszlás típusa nem ismert, akkor a feltevés magára az eloszlásra vonatkozik. (Például két vagy több valószínűségi változó eloszlása megegyezik-e; vagy feltehető-e, hogy a valószínűségi változó adott eloszlással írható le.) A hipotézisvizsgálatoknak ezt a csoportját nemparaméteres próbáknak nevezzük. A hipotézisvizsgálatok általános menetét röviden az alábbiakban vázolhatjuk: • • •
• •
Szakmai megfontolások alapján felállítjuk az igazolandó hipotézist. Kiválasztjuk a legmegfelelőbb statisztikai próbát. Felállítjuk az un. nullhipotézist - jelölése: H0 - (ez gyakran, főleg a paraméteres próbáknál, a szakmai feltételezés ellentéte) és az un. alternatív vagy ellenhipotézist – jelölése: H1. A hipotéziseket úgy kell megfogalmazni, hogy egyszerre ne lehessenek igazak, így a nullhipotézisről hozott döntésünk közvetetten a H1-re vonatkozó döntést is jelent. Mind a null-, mind az ellenhipotézis lehet egyszerű és összetett hipotézis. Egy hipotézist egyszerűnek mondunk, ha fennállásának feltételezése a sokaság eloszlását egyértelműen meghatározottá teszi. Egyszerű hipotézisre példa: M(ξ) = µ= 500°C, mert normális eloszlásról lévén szó, a szórást ismerjük, így µ értéke az eloszlást egyértelműen meghatározza. A 450°C < M(ξ) = µ < 500°C állítás ellenben összetett hipotézis, mert a hipotézist mindazon σ szórású normális eloszlások kielégítik, amelyek várható értéke 450 és 500 között van; A továbbiakban azt tételezzük fel, hogy a nullhipotézis egyszerű, az ellenhipotézis pedig mindig összetett. Meghatározzuk az elsőfajú hibát (szignifikancia szintet), a mintanagyságot, és végrehajtjuk a mintavételt. Meghatározzuk az előző pontban választott feltételek melletti elfogadási, ill. elutasítási (kritikus) tartományokat. Elfogadási tartománynak nevezzük azt a tartományt, amelybe a nullhipotézis fennállása esetén α szignifikancia szint mellett a statisztikai jellemző számított értéke legalább ε = 1-α valószínűséggel kerül. Az elutasítási tartomány viszont az, amelybe a nullhipotézis fennállása esetén, α szignifikancia szint mellett a jellemző számított értéke legfeljebb α valószínűséggel kerülhet. A kritikus tartomány lehet egyoldali vagy kétoldali (40. ábra). Kétoldali kritikus tartomány felvételére akkor kerül sor, ha a nullhipotézisben feltételezett helyzettől való eltérés ténye érdekel bennünket, s az eltérés iránya nem. Egyoldalú tartományt pedig akkor alkalmazunk, ha a H0-ban rögzített állapottól való meghatározott irányú eltérésre számítunk.
118
elfogadási
elutasítási 40. ábra: Kritikus tartományok egy- és kétoldali esetben •
•
Meghatározzuk a próbához szükséges jellemző számított értékét; A becsléselmélethez hasonlóan a minta adataiból egy meghatározott összefüggés (próbafüggvény) felhasználásával meghatározunk egy számértéket, amely H0 és bizonyos kiindulási feltételek fennállása esetén adott elméleti eloszlást követ, így értéke csak kis valószínűséggel (α) esik a kritikus tartományba. Megvizsgáljuk, hogy a jellemző számított értéke az elfogadási, illetve az elutasítási tartományba esik-e, és ez alapján döntünk a nullhipotézis elfogadásáról vagy elutasításáról (41. ábra).
Statisztikai próbák elve f(χ2)
2 P(χ < χ22krit(α)|H P(χ2szám (α)|H00 igaz) igaz) == 11- αα == εε szám< χ krit
DF (szabadsági fok) α
ε =1- α
χ2 szám
χ2 krit
χ2 szám
Készítette: Erdei János
χ2 ¾
41. ábra: Döntés a nullhiptézisről •
Értelmezzük az előző pont eredményét a szakmai hipotézisre, és megtesszük a konkrét intézkedéseket a gyakorlatban.
A hipotézisvizsgálat logikája szerint tehát azt vizsgáljuk meg egy adott próbával, hogy a mintából kapott eredmény eltérése a hipotézistől a véletlennek tulajdonítható-e, vagy az eltérést a ténylegesen fennálló különbség okozza. Ha a mintából számított érték az elfogadási tartományba esik, akkor az adott szignifikancia szinten, az adott minta (minták) alapján az eltérést a véletlennek tulajdonítjuk, azaz statisztikailag nem tartjuk szignifikánsnak. Meg kell azonban jegyeznünk, hogy a statisztikailag szignifikáns eltérés nem azonos a gyakorlatilag jelentős eltéréssel. Lehet, hogy egy adott vizsgált eltérésre mindkettő fennáll, de lehet, hogy csak az egyik. Előfordulhat például, hogy egy statisztikailag szignifikáns eltérés gyakorlatilag nem minősül jelentősnek, ill. fordítva.
119
2
8.2. ILLESZKEDÉSVIZSGÁLAT χ -PRÓBÁVAL Az olyan statisztikai próbát, amelynek alapján arról döntünk, hogy valamely ξ valószínűségi változó eloszlása lehet-e adott F(x) eloszlásfüggvénnyel jellemzett eloszlás, illeszkedésvizsgálatnak nevezzük. Ilyenkor a H0 nullhipotézis:
H 0 : F ( x) Ha a nullhipotézis az eloszlás paramétereinek ismeretét is feltételezi, akkor tiszta illeszkedésvizsgálatról beszélünk. Ha viszont hipotézisünk csak az eloszlás jellegét (normalitás, exponencialitás stb.) tételezi fel, és a paramétereket a mintából kell becsülnünk, akkor becsléses illeszkedésvizsgálatot végzünk. Az illeszkedésvizsgálatra szolgáló próbák alkotják a nemparaméteres próbák egyik nagy csoportját. E próbák közül legelterjedtebb a χ2-próba és a Kolmogorov-próba. A χ2-próba mind diszkrét, mind folytonos eloszlások esetében alkalmazható, de nagy mintaelemszámot igényel. A próba segítségével azt tudjuk eldönteni, hogy adott szignifikancia szinten a tapasztalati gyakoriságok szignifikánsan eltérnek-e a feltételezett elméleti gyakoriságoktól, avagy az eltérés csupán a véletlen következménye. χ2-próbával történő illeszkedésvizsgálatnál az un. próbastatisztikát (a számított értéket) az alábbi képlet szolgáltatja: r
( f i − Fi )2
i =1
Fi
χ sz2 = ∑
DF = r − l − 1 ahol: • • • •
DF: a szabadságfok, az eloszlás paramétere fi : a tapasztalati gyakoriság Fi : az elméleti gyakoriság l : a becsült paraméterek száma
Feladat: A Tiszán egy adott időszakban levonuló árhullámok számát vizsgálva az elmúlt 68 év során az alábbi eredményeket kapták: 30 év volt amikor nem volt árhullám, 25 olyan év volt, amikor 1 árhullám vonult le az adott időszakban, 9 év volt amikor 2 és 4 olyan év volt, amikor 3 vagy több árhullám következett be. Feltehető-e, hogy a folyón levonuló árhullámok száma modellezhető Poissoneloszlással? 0 30
árhullámok száma gyakoriság [db]
1 25
2 9
3 v. több 4
λ = ? nem ismerjük → a mintából kell becsülnünk Poisson-eloszlás esetén M (ξ ) = λ ← x Mivel az elmúlt 68 év során a kérdéses időszakban összesen 55 árhullám volt: λ ≈
120
55 ≈ 0,8 68
•
Nullhipotézis felállítása:
H0: az árhullámok száma λ=0,8 paraméterű Poisson-eloszlású H1: az árhullámok száma nem λ=0,8 paraméterű Poisson-eloszlású •
Mintavétel, adatok feldolgozása, kritikus érték meghatározása:
Ha az árhullámok száma valóban λ≈0,8 paraméterű Poisson-eloszlással írható le, akkor annak valószínűsége, hogy az adott időszakban nem lesz árhullám (Poisson-eloszlás táblázatából) 0,4493, 1 árhullám levonulásának valószínűsége: 0,3595, 2-nek: 0,1438, és annak, hogy 3 vagy több árhullám vonul le (1-az eddigi valószínűségek összege): 0,0474. Az elméleti gyakoriságok ebből már „automatikusan” adódnak, hiszen ha 0,4493 valószínűséggel nincs árhullám az adott időszakban, akkor ez elméletileg 68 év során összesen 68⋅0,4493 = 30,55 alkalommal következik be. Hasonló módon a többi elméleti gyakoriságot kiszámolva az eredményeket az alábbi táblázat tartalmazza: K 0 1 2 3 v. több Σ
fk 30 25 9 4 68
pk 0,4493 0,3595 0,1438 0,0474 1
Fk 30,55 24,45 9,78 3,22 68
DF = r − l − 1 = 4 − 1 − 1 = 2 2 α = 5% → táblázatból: χ elm = 5,99 •
Számított érték meghatározása: 2 ( 30 − 30 ,55 ) χ = 2 sz
•
30 ,55
+
0 ,55 2 0 ,78 2 0 ,78 2 + + ≈ 0 ,27 24 ,45 9 ,78 3 ,22
A számított és a kritikus érték összehasonlítása: 2 2 χ elm = 5,99 >> χ szám = 0,27
•
Döntés a nullhipotézisről:
Mivel a számított érték jóval kisebb, mint a kritikus érték- vagyis a számított érték az elfogadási tartományba esik, ezért 95%-os megbízhatósági szinten nincs okunk a H0-t elutasítani. A folyón levonuló árhullámok száma modellezhető λ=0,8 paraméterű Poisson-eloszlással.
121
Feladat: A 3. fejezetben megismerkedtünk a BUX 5 éves időszak alatti havi hozamértékeinek (%) tapasztalati eloszlásával. Leírható-e az eloszláskép N(3,19; 12,05) elméleti eloszlással? Ennek a vizsgálatnak a későbbiek során (lásd. Korreláció- és regresszió-számítás) meghatározó jelentősége lehet. A számításokat a Quality and Mathematics szoftver segítségével végeztük el, amelyet a mai Menedzsment és Vállalatgazdaságtan Tanszék elődjén, az Ipari Menedzsment és Vállalkozásgazdaságtan Tanszéken fejlesztettek ki.
42. ábra: A χ2-próba számításai Ugyancsak bemutatjuk a Statistica for Windows szoftver eredménylapját is, amely a KolmogorovSzmirnov próba eredményét is közli. Variable BUX% eloszlás: Normal (buxindex.sta) Kolmogorov-Smirnov d = .0290951, p = n.s. Chi-Square: .6816982, df = 2, p = .7111688 (df módosított)
<= -30 -20. -10. 0. 10. 20. 30. Infinity
observed freq-cy
cumulatv percent observed observed
cumul. % expected observed freq-cy
cumulatv percent expected expected
cumul. % observdexpected expected
1 0 6 17 23 13 3 2
1 1 7 24 47 60 63 65
1.5385 .19066 1.5385 1.57176 10.7692 7.12876 36.9231 16.82349 72.3077 20.70212 92.3077 13.29065 96.9231 4.44644 100.0000 .84612 15. Táblázat
.19066 1.76242 8.89118 25.71467 46.41679 59.70744 64.15388 65.00000
.2933 2.7114 13.6787 39.5610 71.4104 91.8576 98.6983 100.0000
1.53846 0.00000 9.23077 26.15385 35.38462 20.00000 4.61538 3.07692
122
.29333 2.41809 10.96733 25.88230 31.84941 20.44716 6.84067 1.30172
.80934 -1.57176 -1.12876 .17651 2.29788 -.29065 -1.44644 1.15388
Feladat: Egy kritikus termékjellemző vizsgálatára vett n=60 elemű mintában x =3,326cm3, s * =0,083cm3. Származhat-e a minta normális eloszlásból?
Osztályok
fk
P( x A ≤ ξ 〈 x F )
Fk
( f k − Fk ) 2 Fk
3,00 – 3,10 3,10 – 3,20 3,20 – 3,30 3,30 – 3,40 3,40 – 3,50 3,50 – 3,60 Σ
1 4 15 27 10 3 60
0,0032 0,0613
0,19 3,68
3,34 0,03
0,4366 0,1683 0,0180 1,0000
26,20 10,10 1,08 60
0,02 0,00 3,40 7,55
123
9. HIPOTÉZISVIZSGÁLATOK II. SZÓRÁSOK ÖSSZEHASONLÍTÁSA
Valószínűségszámítás Valószínűségszámítás Valószínűségelmélet Valószínűségelmélet
Matematikai Matematikai statisztika statisztika
Axiómák, Axiómák, alaptételek alaptételek
Minta Minta vétel vétel
Kombinatorika Kombinatorika
Leíró Leíró statisztika statisztika
Geometriai Geometriai val.sz. val.sz.
Becslés Becslés
Val.szám Val.szám tételek tételek
Hipotézisvizsgálat Hipotézisvizsgálat
Elméleti Elméleti eloszlások eloszlások
Összefüggésvizsgálat Összefüggésvizsgálat
124
9.1. AZ ALAPSOKASÁG VARIANCIÁJÁRA VONATKOZÓ EGYMINTÁS PRÓBA A normális eloszlású sokaság varianciájára (szórására) vonatkozó H0: σ2 = σ02 hipotézist a
( n − 1)s * 2 χ = 2 2 sz
σ0
próbastatisztikával vizsgálhatjuk, ahol n a mintaszám, s* pedig a mintából számolt korrigált tapasztalati szórás. A próba alkalmazása során különösen fontos a sokaság normalitására vonatkozó feltétel betartása. Ekkor, H0 fennállása esetén a fenti próbafüggvény n-1 szabadságfokú χ2-eloszlást követ. A nullhipotézist egy- és kétoldali módon is vizsgálhatjuk. Figyelembe véve a χ2-eloszlás már ismert sajátosságait, a próba kritikus tartományai az alábbiak: 2 H1 : σ 2 > σ 02 ⇒ χ szám > χ12−α 2 H1 : σ 2 < σ 02 ⇒ χ szám < χα2
2 2 H1 : σ 2 ≠ σ 02 ⇒ χ szám < χα2 / 2 vagyχ szám > χ12−α / 2
Feladat: A sör töltési folyamatában a töltési szintre vonatkozó szabványelőírások betartása miatt – a betöltött mennyiség mellett –, fontos paraméter a töltési szint ingadozása is. Ezért a minőségbiztosítási osztály előírásai szerint a töltési szint szórásának 2 ml alatt kell lennie. Ennek ellenőrzésére a töltőüzem minőségellenőre n = 10 elemű mintát vett a folyamatból és kiszámolta a minta szórását: s*= 2,5 ml. Feltehető-e 5%-os szignifikancia szinten, hogy a töltési folyamat szórása nem éri el 2 ml-t?
n = 10 2
s ∗ = 2,5ml → s ∗ = 6,25ml H 0 : σ 2 = 4ml 2 H1 : σ > 4ml 2
2
(valójában a nullhipotézisünk σ2 ≤ 4 ml2)
α = 5%, DF = n − 1 = 10 − 1 = 9 → χ12−α = 16,9 2 elfogadási tartomány: 16,9 > χ szám
a próbastatisztika értéke: χ sz2 =
9 ⋅ 6,25 = 14,06 4
χ2sz az elfogadási tartományba esik, H0-t 5%-os szignifikancia szinten elfogadjuk
125
9.2. KÉT SZÓRÁSNÉGYZET ÖSSZEHASONLÍTÁSA: F-PRÓBA Szórásokra vonatkozó próbákat szórásnégyzetek segítségével végezhetünk. A szórásnégyzetekre vonatkozó próbák a normális alapeloszlástól való eltérésre sokkal érzékenyebbek, mint az átlagpróbák. Általános esetben – mivel a varianciák azonossága a várható értékek összehasonlítására leggyakrabban alkalmazott kétmintás t-próba feltétele – a szórásokra vonatkozó próbákat az átlagpróbák előtt célszerű elvégezni. Két független, ismeretlen várható értékű és szórású, normális eloszlást követő valószínűségi változó varianciáinak azonosságára vonatkozó hipotézisünket az un. F próbával ellenőrizhetjük. A két alaposzlásból vett n1 és n2 elemű minták s1*2 illetve s*22 korrigált varianciái torzítatlan becslései az alapeloszlás σ 12 illetve σ 22 varianciáinak. A fenti feltételek mellett a H 0 : σ 12 = σ 22 nullhipotézist az
F= 2
s1*2 s*2 2
2
próbastatisztikával vizsgálhatjuk, ahol s1∗ > s2∗ . Ha H0 és a kiindulási feltételek teljesülnek, akkor az így képzett F érték az un. Fisher-Snedecor féle Feloszlást követi, amely a számláló (DF1) és a nevező (DF2) szabadságfokától (DF1,2=n1,2 - 1) függ. A számítást mindig úgy kell végeznünk, hogy a számlálóban a nagyobb variancia szerepeljen. Az F próbát ily módon mindig egyoldali próbaként végezzük, hiszen azt vizsgáljuk, hogy s1*2 szignifikánsan nagyobb-e s2*2 értéknél, vagyis ellenhipotézisünk H1 : σ 12 > σ 22 . (Megjegyezzük, hogy az F-próbát baloldali és kétoldali alternatíva esetén is elvégezhetjük, de ez most nem témája jegyzetünknek.) Táblázataink is egyoldali próbára vonatkoznak (mégpedig Fα, DF1, DF2, kritikus értékeit adják meg). Feladat: Vizsgáljuk meg, hogy az alábbi minták esetén valóban feltételezhető-e a szórások egyezése?
Mintaszám Átlag Korrigált tapasztalati szórás
„A” 11 16,4 mg 1,2 mg
„B” 10 15,6 mg 1,1 mg
H 0 : σ 12 = σ 22 H 1 : σ 12 > σ 22 mivel az első („A” jelű) minta szórása a nagyobb, ez kerül majd a számlálóba
α = 5%
DF1 = 11 − 1 = 10 DF2 = 10 − 1 = 9 Fα = 3,14 elfogadási tartomány: Fsz < 3,14
1,2 2 próbastatisztika értéke: Fsz = 2 = 1,19 1,1 Fsz az elfogadási tartományba esik, H0-t 5 %-os szignifikancia szinten elfogadjuk, azaz az alapsokasági szórások nem különböznek egymástól.
126
9.3. TÖBB SZÓRÁS ÖSSZEHASONLÍTÁSÁRA VONATKOZÓ PRÓBÁK
Az F-próbát csak abban az esetben alkalmazzuk, ha két minta szórását hasonlítjuk össze. Ha több normális eloszlásból származó mintát kell összehasonlítanunk, akkor az un. Bartlettpróbát, vagy Cohran-próbát alkalmazzuk. Bartlett-próba: Legyen r darab mintánk és a megfelelő mintadarabszámok n1, n2, ...., nr, a j-edik minta k-adik eleme xjk, a j-edik minta átlaga x j , korrigált tapasztalati szórásnégyzete s*j2 . Számítsuk ki a következő mennyiséget:
χ sz2 = r
r 2 ,3026 2 *2 f log s − ∑ ( n j − 1 ) log s j , ahol A j =1
f = ∑ n j − r, s2 = j =1
1 f
r
∑( n j =1
j
− 1 )s *j 2
A = 1+
r 1 1 1 ∑ − . 3( r − 1 ) j =1 n j −1 f
A fenti képletből nyert χ2 értéket a χ2-táblázatban az r-1 szabadságfokhoz tartozó kritikus (a megállapodás szerinti α szinthez tartozó) elméleti χ2 értékekkel kell összehasonlítani. Ha a táblázatban talált χ2 érték nem kisebb, mint a képlettel számított, akkor megmaradhatunk a nullhipotézisünk mellett (amely természetesen a szórások egyezését állítja), ellenkező esetben a próba szignifikáns eltérésre mutat (azaz legalább egy szórás szignifikánsan eltér a többitől), s így a nullhipotézist elvetjük, vagyis kijelentjük, hogy a minták nem tekinthetők egyforma szórású normális eloszlású sokaságból származóknak. Feladat: Egy laboratóriumban próbatesteken keménységvizsgálatokat végeznek. 5 szériát vizsgálnak, és ezek szórásnégyzetét kívánják összehasonlítani. A keménységet Rockwellben mérik. Az alábbi táblázat feltünteti az összehasonlítandó szórásnégyzeteket, a mintadarabszámokat (mindjárt eggyel csökkentve, mert a számításban így szerepelnek) és a számításhoz szükséges részeredményeket. j 1 2 3 4 5 ∑ innen:
sj*2 4,00 2,59 2,89 5,86 1,61
log sj*2 06021 0,4133 0,4609 0,7679 02069
f=249 s2=3,28 A=1,014 χ2=10,324
nj-1 84 93 39 18 15 249
(nj-1)sj*2 336,00 240,87 112,71 105,48 24,15 819,21
(nj-1) log sj*2 50,5764 38,4369 17,9751 13,8222 3,1035 123,9141
1/(nj-1) 0,0119 0,0108 0,0256 0,0556 0,0667 0,1706
r=5 szabadságfok = 4
A számított χ2 érték a 95%-os szintnél található 9,49-nél nagyobb, tehát ekkora χ2 előfordulásának kevesebb a valószínűsége, mint 5 % azonos szórású alapsokaságok esetén. Ezért az összehasonlítás eredményeképpen megállapíthatjuk, hogy a szórások közötti eltérések szignifikánsak.
127
Cochran-próba: E módszer segítségével azt dönthetjük el, hogy a szórások között talált legnagyobb érték tekinthető-e a többivel azonos eloszlásból származónak. A Cochran-próbát akkor alkalmazhatjuk, ha az alapeloszlás normális és a minták mind azonos darabszámúak. A közös mintadarabszámot most n-el jelöljük (a szabadságfok DF = n-1), az r darab különböző minta korrigált szórásnégyzetét pedig ismét s1*2, s2*2, …sr*2 - tel, utóbbiak közül a legnagyobb legyen smax*2. Kiszámítjuk a 2
g sz =
* s max 2
2
s1* + s 2* + ... + s r*
2
próbastatisztikát.
A kiértékeléshez szükséges diagram, vagy táblázat segítségével a már ismert módon eldönthetjük, hogy a legnagyobb szórás jelentős mértékben különbözik-e a többitől. Ha a legnagyobb érték túllépi a számára megengedett határt, akkor nem tekinthetjük az összes alapsokaságot egyenlő szórásúnak. Ilyenkor vagy teljesen elejtjük a homogenitásra vonatkozó feltevésünket, vagy pedig csak ezt a kiugró szórással rendelkező mintát (vagy, ha több minta szórása lépte át a szignifikancia-határt, mindegyik ilyent) kizárjuk a sokaságból és megvizsgáljuk, hogy a megmaradó sokaságra eredeti feltevésünk fenntartható-e. Ezt tehát semmi esetre sem tekinthetjük természetesnek, hanem a megmaradó sokaságra meg kell ismételnünk a Cochran-próbát, azaz g értékét a megmaradó adatokból újra ki kell számítani és r új értékének figyelembevételével összevetni az ábrával. A megmaradó sokaságot a szórás szempontjából homogénnek csak akkor tekinthetjük, ha az utoljára végzett Cohran-próba „nem szignifikáns” eredményt mutat. Feladat: Műselyem szakítóerő vizsgálatánál (n = 10) kapott r = 20 vizsgálat adataiból számolt korrigált tapasztalati szórások között, található-e kiugró érték? Az adatokat az alábbi táblázat mutaja: i
*2
si i si*2
1 24,9 11 12,5
2 8,4 12 11,4
3 21,2 13 4,8
4 8,0 14 22,2
5 8,4 15 22,6
6 6,0 15 16,1
7 26,3 17 10,9
8 26,7 18 9,6
9 6,8 19 60,5
10 12,5 20 10,9
H0: a szórások nem különböznek H1: a legnagyobb szórás (19. minta) különbözik a többitől
α = 5% → DF = n − 1 = 10 − 1 = 9 r = 20 → g kr = 0,136 2
* smax = 60,5
g sz =
60,5 60,5 = = 0,183 24,93 + 8,4 + ... + 10,9 330,7
A számított g érték nagyobb, mint a kritikus érték, így 5%-os szignifikancia szinten elutasítjuk H0-t, azaz a szórások egyezését.
128
10. HIPOTÉZISVIZSGÁLATOK III. KÖZÉPÉRTÉKRE VONATKOZÓ PRÓBÁK
Valószínűségszámítás Valószínűségszámítás Valószínűségelmélet Valószínűségelmélet
Matematikai Matematikai statisztika statisztika
Axiómák, Axiómák, alaptételek alaptételek
Minta Minta vétel vétel
Kombinatorika Kombinatorika
Leíró Leíró statisztika statisztika
Geometriai Geometriai val.sz. val.sz.
Becslés Becslés
Val.szám Val.szám tételek tételek
Hipotézisvizsgálat Hipotézisvizsgálat
Elméleti Elméleti eloszlások eloszlások
Összefüggésvizsgálat Összefüggésvizsgálat
129
10.1. VÁRHATÓ ÉRTÉKRE IRÁNYULÓ PRÓBÁK
A feltételek függvényében több próbát is alkalmazhatunk. Nullhipotézisünk természetesen minden esetben: H 0 : µ = m0 , vagyis a várható érték egy adott m0 értékkel egyenlő. Abban az esetben, ha ismerjük az alapsokasági szórást (σ), vagy ha nem ismerjük, de nagy mintával dolgozunk (n>30 és a σ-t a korrigált tapasztalati szórással becsüljük), egymintás u-próbával, ha nem ismerjük az alapsokasági szórást, és kis mintánk van, akkor egymintás t-próbával vizsgálhatjuk a fenti nullhipotézist. Szakmai feltevésünktől függően, mindkét próba esetén alkalmazhatunk egy- vagy kétoldali ellenhipotézist. A két statisztikai próbával kapcsolatos alapismereteket az alábbi táblázat foglalja össze. u-próba egyoldali H0 H1 próbastatisztika elutasítási tartomány feltételek
µ > m0 (µ < m0)
u sz =
t-próba kétoldali µ = m0 µ ≠ m0
x−µ x−µ ≈ * σ n s n
usz > uα usz < -uα/2 vagy (usz < -uα) usz > uα/2 σ ismert v. n > 30 16. Táblázat
egyoldali
kétoldali
µ > m0 (µ < m0)
µ ≠ m0
t sz =
x−µ (DF = n-1) s* n
tsz > tα (tsz < -tα)
tsz < -tα/2 vagy tsz > tα/2
Feladat: A már bemutatott példában a ROM chipek gyártása során a kemence hőmérsékletére vonatkozó n=8 elemű minta alapján, átlag hőmérséklet 492°C-ra adódott. Korábbi vizsgálatok alapján tudjuk, hogy a folyamatban a maximum hőmérsékletek elméleti szórása 12°C. Feltehető-e, hogy a maximum hőmérséklet 500°C?
n=8 x = 492°C
σ = 12D C H 0 : µ = 500D C H 1 : µ ≠ 500D C ismert az elméleti szórás → u-próbát használhatunk
α = 5% → uα / 2 = 1,96
elfogadási tartomány: − 1,96 < usz < 1,96 a próbastatisztika értéke: usz =
492 − 500 = −1,89 12 8
usz az elfogadási tartományba esik, H0-t 5 %-os szignifikancia szinten elfogadjuk
130
Szakmai tapasztalatunk alapján úgy gondoljuk, hogy a kemence maximum hőmérséklete kisebb, mint 500°C. Vizsgáljuk meg ezt a feltevésünket, az előző minta adatai alapján.
H 0 : µ = 500D C H 1 : µ < 500D C A próbastatisztika értéke természetesen nem változott: usz = −1,89
α = 0,05 → uα = −1,645 elfogadási tartomány: − 1,645 < usz A próbastatisztika értéke a kritikus tartományba esik, ezért 5%-os szignifikancia szinten H0-t elutasítjuk. Feladat: A Szovjetunió hagyományos fegyverzet terén szerzett előnyének csökkentésére az USA Védelmi Minisztériuma kiválasztott egy a Chrysler Corporation-nél tervezett új harckocsi típust. Kiterjedt vizsgálatok azt mutatták, hogy az új harckocsi átlagosan 45 mérföld/órás sebességet képes elérni. A szovjetek leggyorsabb tankjával (T-72) való összehasonlítás érdekében a Védelmi Minisztérium adatokat szerzett n = 16 T-72-es tank maximum sebességéről, s az alábbi statisztikai eredményeket kapták: az átlag sebesség 43,5 mérföld/óra, s* = 3,0 mérföld/óra szórással. Feltehető-e α=5 %-os szignifikancia szinten, hogy a T-72-esek maximális sebessége kisebb az új amerikai harckocsik sebességénél, azaz 45 mérföld/óránál?
n = 16
x = 43,5m / h s ∗ = 3,0m / h H 0 : µ = 45m / h H1 : µ < 45m / h Nem ismert az elméleti szórás, n < 30 (s feltételezve természetesen, hogy a maximális sebesség normális eloszlású) → t-próbát használhatunk:
α = 0,05, DF = n − 1 = 16 − 1 = 15 → tα = −1,753
elfogadási tartomány: − 1,753 < tsz a próbastatisztika értéke: tsz =
43,5 − 45 = −2,00 3,0 16
Mivel tsz az elutasítási tartományba esik, H0-t 5%-os szignifikancia szinten nem fogadjuk el
131
10.2. KÉT FÜGGETLEN MINTA VÁRHATÓ ÉRTÉKÉNEK ÖSSZEHASONLÍTÁSA
A minta függetlensége azt jelenti, hogy az egyik sokaságban egy elem mintába kerülése ill. be nem kerülése semmilyen módon nem befolyásolja a másik sokaságban az elemek mintába kerülésének valószínűségét. Az egymintás esethez hasonlóan ebben az esetben is több próba közül választhatunk. Nullhipotézisünk természetesen minden esetben: H 0 : µ1 = µ2 , vagyis a két várható érték egyenlő. Abban az esetben, ha ismerjük az alapsokasági szórásokat (σ1 és σ2), vagy ha nem ismerjük, de nagy mintával dolgozunk (n1>30 és n2>30, s az elméleti szórásokat a korrigált tapasztalati szórással becsüljük), kétmintás u-próbával, ha nem ismerjük az alapsokasági szórást, de feltehető a szórások egyezése, akkor kétmintás t-próbával vizsgálhatjuk a fenti nullhipotézist. Ha mindkét sokaság normális eloszlású, az elméleti szórásokat nem ismerjük, de a szórások különböznek egymástól, akkor a kétmintás t-próba nem alkalmazható, helyette a Welch-próbát használhatjuk. Szakmai feltevésünktől függően, mindhárom próba esetén alkalmazhatunk egy- vagy kétoldali ellenhipotézist. Az első két statisztikai próbával kapcsolatos alapismereteket az alábbi táblázat foglalja össze. u-próba egyoldali
t-próba kétoldali
H1
µ1 > µ2 ( µ1 < µ2 )
próbastatisztika
u sz =
elutasítási tartomány
feltételek
egyoldali
kétoldali
µ1 > µ2 ( µ1 < µ2 )
µ1 ≠ µ2
µ1 = µ2
H0
µ1 ≠ µ2 x1 − x 2
σ 12
n1
+
σ 22
x1 − x 2
t sz =
2
s1*
n2
2
n1
+
s 2*
n2
usz > uα
usz < −uα / 2
tsz > tα
tsz < −tα / 2
(usz < −uα )
vagy usz > uα / 2
(tsz < −tα )
vagy tsz > tα / 2
σ1 = σ 2
σ1 és σ2 ismert v. n1 és n2 > 30
DF = n1 + n2 − 2 17. Táblázat
Feladat: A Fogyasztóvédelmi Felügyelőség két fajta cigaretta („A” és „B”) szén-monoxid (CO) emisszióját hasonlította össze. A minták statisztikai adatait az alábbi táblázat tartalmazza. Hasonlítsuk össze, hogy a két fajta cigaretta CO kibocsátása eltér-e egymástól?
Mintaszám Átlag Korrigált tapasztalati szórás
H 0 : µ1 = µ2 H1 : µ1 ≠ µ2
132
„A” 11 16,4 mg 1,2 mg
„B” 10 15,6 mg 1,1 mg
Mivel az elméleti szórásokat nem ismerjük → kétmintás t-próbát használhatunk. A próba elvégzése előtt meg kell győződnünk arról, hogy a két sokaságban a szórások megegyeznek. Ezt F-próbával (lásd. 9.2 pont) már ellenőriztük.
α = 0,02, DF = 11 + 10 − 2 = 19 → tα / 2 = 2,539 elfogadási tartomány: − 2,54 < tsz < 2,54 a próbastatisztika értéke: t sz = 1,59 Mivel tsz az elfogadási tartományba esik, H0-t 2%-os szignifikancia szinten elfogadjuk.
Feladat: Két gyártó egy-egy kávéfajtájának kiskereskedelmi egységárát (1lb-ra vonatkoztatva) szeretnénk összehasonlítani. Véletlenszerű mintát véve országszerte ezen kávéfajtákat áruló boltok közül, s feldolgozva az adatokat a kapott statisztikai jellemzőket a következő táblázat mutatja: „A” 63 $2,98 $0,11
Mintaszám Átlag Korrigált tapasztalati szórás
„B” 58 $2,93 $0,07
1%-os szignifikancia szinten feltehető-e, hogy az „A” típusú kávé drágább, mint a „B”?
H 0 : µ1 = µ2 H1 : µ1 > µ2
Az elméleti szórásokat nem ismerjük, de a mintaszám elég nagy mindkét mintában → kétmintás u-próbát használhatunk
α = 0,01 → uα = 2,33 elfogadási tartomány: 2,33 > usz a próbastatisztika értéke: u sz =
2 ,98 − 2 ,93 0 ,112
63
2 + 0 ,07
= 3,01 58
Mivel usz az elutasítási tartományba esik, H0-t 1%-os szignifikancia szinten nem fogadjuk el
133
Feladat: A BUX százalékos hozama 65 hónap adatai alapján x1 =3,18%,
s1* =12,05% paraméterekkel
jellemezhető (lásd. 3. fejezet). Az utolsó 12 hónapban x2 =0,39%, s*2 =15,7%. Szignifikánsan különbözik-e a két várható érték egymástól?
43. ábra: A BUX 65 havi hozamadatának ábrázolása F-próba:
t-próba:
134
Feladat: Szeretnénk eldönteni, hogy – a megkötött biztosítások számát tekintve – két ügyfélszolgálati iroda között van-e különbség. A két iroda adatai az alábbiak:
I. iroda II. iroda
Mintaszám 11 13
Átlag 19,15 22,49
135
Korrigált tapasztalati szórás 12,45 15,36
Mint korábban is utaltunk rá, ha a két alapsokasági szórás ismeretlen, s ráadásul nem tételezhető fel a két szórás egyezése (ill. az ezt vizsgáló statisztikai próba elutasítja a szórások egyezését), akkor nem alkalmazhatjuk a kétmintás t-próbát. Ilyen esetekben a két sokaság várható értékének összehasonlítására a Welch-próbát használhatjuk, melynek próbastatisztikája:
tf =
x1 − x 2 s1* 2 s*2 2 + n1 n2
.
s *22 Az DF paraméter értékét a következő módon számíthatjuk ki. Legyen c =
DF =
(n1 − 1) ⋅ (n2 − 1) . Ha a H0 (n1 − 1) ⋅ c 2 + (n2 − 1) ⋅ (1 − c )2
s
*2 1
n1
n2 *2 + s2
, ekkor
n2
hipotézis igaz, akkor a tf statisztika közelítőleg DF
szabadságfokú Student-(t-) eloszlású, vagyis adott ε = (1-α) megbízhatósági szinthez a t-táblázatból az DF szabadságfoknak megfelelő kritikus érték könnyen meghatározható. Ha mindkét minta elemszáma elég nagy (> 40), akkor a tf statisztika közelítőleg normális eloszlású, azaz a kritikus értékek a normális eloszlás táblázatából kereshető ki. Feladat: Tegyük fel, hogy a cigaretták CO emissziójának vizsgálatakor a szórások nem azonosak. Végezzük el így az összehasonlítást!
H 0 : µ1 = µ2 H1 : µ1 ≠ µ2 az elméleti szórásokat nem ismerjük, nem azonosak → Welch-próba
α = 2%, DF = ? c=
(1,12 / 10) = 0,48 (1,2 2 / 11 + 1,12 / 10) (11 − 1)(10 − 1) = 18,99 ≈ 19 (11 − 1)0,482 + (10 − 1)(1 − 0,482 ) = ±2,54
DF = tα / 2
[
]
elfogadási tartomány: − 2,54 < tsz < 2,54
tf =
16,4 − 15,6 = 1,59 0,131 + 0,121
A próbastatisztika (tf) értéke tsz elfogadási tartományba esik, H0-t 2 %-os szignifikancia szinten elfogadjuk. Figyeljünk fel rá, hogy mind a kritikus, mind a számított értékre ugyanazt az eredményt kaptuk, mint az első példában. Valószínűleg a szórások különbözőségére vonatkozó feltételezésünk nem helytálló, így a kétmintás t-próba is alkalmas volt a vizsgálat elvégzésére.
136
10.3. PÁROS MINTÁK VÁRHATÓ ÉRTÉKÉNEK ÖSSZEHASONLÍTÁSA
Az eddig tárgyalt kétmintás statisztikai próbák alkalmazásánál fontos feltétel volt a minták függetlensége. Ez a feltétel a gyakorlatban legtöbbször teljesül, de vannak bizonyos speciális esetek, amikor a két minta elemei között van valamilyen kapcsolat. Az un. páros minták esetén a mintaelemek nem függetlenek egymástól, „van bennük valamilyen közös tényező” (pl.: ugyanaz a mérőeszköz, ugyanaz az alkatrész, ember stb. vizsgáljuk). Páros mintáknál az egyik minta elemeinek kiválasztása maga után vonja a másik minta elemeinek kiválasztását, s így a két minta elemei nem tekinthetők egymástól függetleneknek. Az ilyen páros (összefüggő) sokaságokban a két sokaság (s ebből következően természetesen a minta) elemei egymással kölcsönös és egyértelmű megfeleltetésbe hozhatók. A páros elnevezés onnan származik, hogy a két sokaság egymáshoz rendelt egységeinek összessége egy elempárokból álló, egyetlen sokaságnak is tekinthető. Ha például két iskola tanulóinak testsúlyát szeretnénk összehasonlítani, akkor csak nehezen és mesterkélten képzelhető el a tanulók párokba rendezése, már csak a két iskola létszámának különbsége miatt is. Ugyanakkor, ha egy új fogyókúra eljárás hatékonyságát szeretnénk értékelni, akkor célszerű ugyanazon személyek testsúlyát megmérni két időpontban, a fogyókúra előtt és után. Ebben az esetben annak megítélésére, hogy valóban csökkent-e a fogyókúra után a testsúly, már nem véletlenszerűen választunk a fogyókúrázók közül, az első minta elemei meghatározzák a második mintát is. Természetesen az összefüggő sokaságokból is vehetünk független mintákat, de ez általában nem célszerű, mert így elveszítjük az elempárok egyenkénti összehasonlításával nyerhető információt. Mivel a páros minták elemei egymásnak megfeleltethetők, így természetesen a két minta nagysága azonos. Az ilyen mintákat rendszerint oly módon kezeljük, hogy az egymásnak megfeleltethető elemeik különbségét (vagy hányadosát) képezzük, majd a továbbiakban e különbségeket (vagy hányadosokat) már egyetlen minta elemeinek tekintjük. Páros minták várható értékeinek összehasonlítására is ezt az eljárást követjük. Képezzük a két minta különbségét, s ha a kapott eltérések eloszlása normális, akkor kiszámolva a különbségek átlagát és tapasztalati szórását, az így kapott minta alapján végezhetünk egy egymintás t-póbát annak megállapítására, hogy a különbségek szignifikánsan eltérnek-e nullától. (Természetesen nem csak a nullától való eltérést, azaz a két sokaság várható értékének egyezését, hanem egy adott különbség meglétét is vizsgálhatjuk.) Képezve tehát páronként a különbségeket (di), majd a különbségek átlagát ( d ) és korrigált tapasztalati szórását(sd), a nullhipotézisünket, vagyis a két várható érték egyezését (H0: µ1 = µ2), az alábbi próbastatisztikával vizsgálhatjuk: t sz =
d sd
. Ha H0 igaz, tsz értéke DF = n-1 szabadságfokú
n
t-eloszlást követ. A H0 hipotézis vizsgálatát egy- és kétoldali alternatívával szemben is vizsgálhatjuk. Feladat: Egy sportcipőket gyártó cég szeretné meghatározni, hogy egy új típusú cipő („A”) élettartama nagyobb-e az előzőtől („B”)? Felkértek tíz kocogót, hogy teszteljék a termékeket. Az eredményeket [az élettartamokat hetekben mérve] a következő táblázat mutatja (az élettartamok normális eloszlást követnek). Kocogó 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. Minta 27 35 19 39 34 32 15 26 18 17 „A”cipő 23 28 16 31 38 30 17 22 15 16 „B” cipő
137
95%-os megbízhatósági szinten vizsgálva feltehető-e az élettartamok különbözősége?
H 0 : µ1 = µ2 H1 : µ1 > µ2
n = 10 képezzük az eltéréseket : di
1. 4
2. 7
3. 3
4. 8
5. -4
6. 2
7. -2
8. 4
9. 3
10. 1
az eltérések átlaga: d = 2,6 a különbségek korrigált tapasztalati szórása
( 4 − 2,6) 2 + (7 − 2,6) 2 + ... + (1 − 2,6) 2 = 3,66 10 − 1 α = 5% → DF = n − 1 = 10 − 1 = 9 → tα = 1,83 elfogadási tartomány: 1,83 > tsz 2,6 a próbastatisztika értéke: tsz = = 2,25 (3,66 / 10) sd∗ =
Mivel tsz az elutasítási tartományba esik, H0-t 5%-os szignifikancia szinten nem fogadjuk el, azaz az új cipők élettartama valóban nagyobb, mint a régieké.
10.4. VARIANCIAANALÍZIS
A varianciaanalízis a matematikai statisztikai eljárások között kiemelkedő jelentőséggel bír. Nem csak egy „egyszerű” hipotézisvizsgálat, hanem bonyolult gyakorlati problémák (elsősorban kísérlettervek) elemzésére, értékelésére használható módszer. Ennek ellenére most a hipotézisvizsgálatok között tárgyaljuk, mivel a legegyszerűbb esetben, az un. egyszeres osztályozású varianciaanalízis, lényegében több normális eloszlású sokaság várható értékének összehasonlítására alkalmazható, azaz a H0: µ1 = µ2 = … µr nullhipotézis helyességének a sokaságokból egymástól függetlenül vett minták alapján történő ellenőrzésére szolgál. Ellenhipotézisünk minden esetben az lesz, hogy nem minden várható érték egyforma. A próba elvégzéséhez előfeltétel még – a normalitáson kívül – , hogy az ismeretlen alapsokasági szórások megegyezzenek (Cohran- v. Bartlett-próba). A próba elvégzéséhez mindenekelőtt (természetesen a csoportok átlagának és szórásának meghatározása után, amik már a szórások egyezésének vizsgálatához is szükségesek) képezzük az összes megfigyelés számtani átlagát ( x ), ami megegyezik a mintaátlagoknak ( x i) a minta elemszámával súlyozott számtani közepével: x =
1 r ni 1 r x = ni x i , ahol ni az i-edik minta ∑∑ ij n ∑ n i =1 j = 1 i =1
elemszáma, n az összes minta elemszáma n = n1+n2+ …nr.
138
Ezek után képezzük az összes mért értéknek (xij) az összes adat átlagától ( x ) való eltérésének a
∑∑ (x ni
r
négyzetösszegét az un teljes négyzetösszeget:
i = 1 j =1
∑ n (x r
bontható. Az egyik az un. csoportok közötti
i =1
i
i
ij
−x
)
− x , ami két négyzetösszeg összegére
)
2
négyzetösszeg, ami a csoportok közti
∑∑ (x r
eltéréseket magyarázza, méri, a másik a csoportokon belüli
ni
i =1 j =1
ij
− xi
)
2
négyzetösszeg, ami a
csoportokon belüli eltéréseket, a véletlen hatásokat mutatja. Ha H0 igaz, s a kiindulási feltételek is teljesülnek, akkor bizonyítható, hogy a csoporton belüli négyzetösszeg χ2-eloszlású n - r szabadságfokkal, s a csoportok közötti négyzetösszeg független a csoporton belüli négyzetösszegtől, és szintén χ2-eloszlású r-1 szabadságfokkal. Ha ez igaz, akkor a négyzetösszegek és a megfelelő szabadságfokok hányadosából képzett un külső (sk2), ill. belső (sb2) szórásnégyzetek egymástól függetlenek, s a közös várható értékük az ismeretlen, de egyenlő alapsokasági szórás: M(sk2) = M(sb2) = σ. A két szórás egyezésének vizsgálatával így ellenőrizhetjük eredeti hipotézisünket, a várható értékek azonosságát. Két szórás összehasonlítására a korábban megismert F-próba használható, képezve az F= sk2/sb2 statisztikát, amely - H0 fennállása esetén - (r - 1, n - r) paraméterű F-eloszlású. A varianciaanalízis eredményeinek összefoglalására gyakran alkalmazzák az un. szórásfelbontó táblázatot, amit a varianciaanalízis angol nevének rövidítéséből ANOVA táblának is szokás nevezni. Az egyszeres osztályozású varianciaanalízis ANOVA táblájának felépítését mutatja a következő táblázat: négyzetösszeg neve csoportok közötti * csoporton belüli ** teljes
négyzetösszegek i
−x
)
r-1
szórás becslése sk2
∑∑ (x
ij
− xi
)
n-r
sb2
-
-
∑ ∑ (x
n-1
-
-
-
ij
∑ n (x r
i
i =1 r
ni
i =1 j =1
r
ni
i =1 j =1
szabadságfok 2
2
−x
)
F érték
p-érték
sk2/sb2
p
18. Táblázat *: a kísérlettervezésből vett szóhasználattal szokták faktornak v. kezelésnek is nevezni ill. **: a csoporton belüli ingadozást hibának Feladat: Egy áruházláncnál megvizsgálták, hogy 3 boltjukban azonos-e az egy vásárlásnál fizetett összeg. Minden boltban kiválasztottak 6 véletlen mintát. A vásárláskor fizetett összegeket az alábbi táblázat mutatja [dollárban]: 1. bolt 2. bolt 3. bolt 12,05 15,17 9,48 23,94 18,52 6,92 14,63 19,57 10,47 25,78 21,4 7,63 17,52 13,59 11,90 18,45 20,57 5,92
139
Feltételezve, hogy a kifizetések normális eloszlásúak, s szórásuk egyenlő, van-e különbség a 3 üzlet között?
H 0 : µ1 = µ2 = µ3
H1: legalább az egyik várható érték eltér a többitől n1 = n2 = n3 = 6 r= 3 Az átlagok boltonként: $18,73, $18,14, $8,72, az összes adat átlaga: $15,2. A számításokat elvégezve, az ANOVA tábla:
csoportok közötti csoporton belüli teljes
négyzetösszegek
szabadságfok
378,4 214,1 592,5
2 15 17
szórás becslése 189,2 14,3 -
F érték 13,26 -
p érték 0,0005 -
Az Fsz számított értéke tehát 13,26. α = 0,05 a számláló szabadságfoka: 2 a nevező szabadságfoka: 15 A kritikus érték: Fkr= 3,68 A Fsz >>Fkr a H0 nullhipotézist 5 %-os szignifikancia szinten elutasítjuk, azaz az átlagok ill. legalább egy átlag szignifikánsan különbözik a többitől. Esetünkben ez értelemszerűen a 3. bolt, ahol az egy vásárlásnál kifizetett összeg nagysága átlagosan kevesebb, mint a fele a másik két bolt átlagánál.
140
11. KORRELÁCIÓ- ÉS REGRESSZIÓSZÁMÍTÁS II.
Valószínűségszámítás Valószínűségszámítás Valószínűségelmélet Valószínűségelmélet
Matematikai Matematikai statisztika statisztika
Axiómák, Axiómák, alaptételek alaptételek
Minta Minta vétel vétel
Kombinatorika Kombinatorika
Leíró Leíró statisztika statisztika
Geometriai Geometriai val.sz. val.sz.
Becslés Becslés
Val.szám Val.szám tételek tételek
Hipotézisvizsgálat Hipotézisvizsgálat
Elméleti Elméleti eloszlások eloszlások
Összefüggésvizsgálat Összefüggésvizsgálat
141
11.1. A (LINEÁRIS) KORRELÁCIÓS EGYÜTTHATÓ A 2.5 pontban megismertük az események függetlenségének alapvető jellemzőit. Ezekből – többek között – az is következik (a bizonyítást mellőzzük), hogy két független valószínűségi változó (X és Y) szorzatának várható értéke egyenlő várható értékeinek szorzatával:
M ( XY ) = M ( X ) ⋅ M (Y ) Mivel azonban egy valószínűségi változónak a saját várható értékétől vett eltérésének a várható értéke mindig nulla, az előbbi szorzat várható értéke is zérus. Definíció: A C ( XY ) = M {[ X − M ( X )] ⋅ [Y − M (Y )]} várható értéket az X és Y valószínűségi változók kovarianciájának nevezzük. Ha a C(XY) kifejezésében elvégezzük a szorzást és tagonként vesszük a várható értéket, akkor:
C ( XY ) = M ( XY ) − M ( X ) ⋅ M (Y )
Ugyancsak igazolható, hogy
C ( XY ) ≤ D( X ) ⋅ D( Y )
azaz, két valószínűségi változó kovarianciájának abszolút értéke nem lehet nagyobb a két szórás szorzatánál. Az elméleti korrelációs együttható R (X,Y) fogalmához úgy juthatunk el, ha a kovarianciát elosztjuk a két szórás szorzatával, hiszen ekkor olyan kifejezést kapunk, amely a valószínűségi változók értékeitől nem függő abszolút határok között mozog:
R( X ,Y ) =
C ( XY ) D( X ) ⋅ D(Y )
A korrelációs együttható értéke nulla, ha X és Y függetlenek. Ez fordítva általában nem igaz: abból, hogy két valószínűségi változó korrelációs együtthatója nulla, nem feltétlenül következik, hogy a két változó független is egymástól (kivétel, ha X és Y együttes eloszlása normális). Ha a két változónál csak azt tudjuk, hogy R(X,Y)=0, akkor korrelálatlannak nevezzük őket (4. fejezet). A korrelációs együttható abszolút értéke legfeljebb 1, azaz
− 1 ≤ R ( X ,Y ) ≤ +1 és a ± 1 értéket akkor és csak akkor éri el, ha X és Y között lineáris kapcsolat van:
y = bx + a Ha b > 0, akkor R (X, Y) =1, ha b < 0, akkor R (X, Y) = –1. Pozitív sztochasztikus kapcsolatnál 0< R (X, Y) < 1, míg negatív sztochasztikus kapcsolatnál –1 < R (X, Y) < 0.
142
Természetesen, minél szorosabb a kapcsolat, R( X ,Y ) annál jobban közelíti az egységet. Az elméleti korrelációs együtthatót a mintabeli, tapasztalati korrelációs együtthatóból becsülhetjük: n
r ( x, y ) =
∑d i =1
xi
⋅ d yi
n
n
i =1
i =1
∑ d x2i ⋅ ∑ d y2i ahol: d xi = xi − x és d yi = y i − y . Természetesen azt is meg kell vizsgálnunk, hogy a r(x,y) tapasztalati korrelációs együttható szignifikánsnak tekinthető-e. Ekkor a Ho: R (X, Y) = 0 nullhipotézisből indulunk ki, vagyis az lesz az alapfeltételezésünk, hogy a két változó egymástól független normális eloszlású. Igazolható, hogy normális alapeloszlás mellett az R (X, Y) = 0 nullhipotézis esetén r (x, y)-nek az alábbi függvénye DF=n-2 szabadsági fokkal t- eloszlást követ:
t sz = r ⋅
n−2 1− r2
A függelékben található tkrit kritikus értékek alapján, adott α szignifikancia szinten a tsz > tkrit esetben elvetjük az R (X, Y) = 0 nullhipotézist és ezzel a kapcsolat fennállásának hipotézisét fogadjuk el. A szignifikáns korrelációs együttható csak azt jelenti, hogy R (X, Y) értéke nagy valószínűséggel nem zérus, de az összefüggés szoros, vagy laza voltára nem ad felvilágosítást! Feladat: Számítsuk ki a mintapéldában (4. fejezet) szereplő változók korrelációs együtthatóját és végezzük el a szignifikancia vizsgálatot! A táblázatban közölt adatok alapján:
r( x , y ) =
2980 ,4 37293 ,2 ⋅ 326 ,5
= 0 ,85
A lineáris korrelációs együttható szignifikancia vizsgálata: Ho: R (X, Y) = 0 DF= n-2 =14-2 = 12 α =0,05
t sz = 0 ,85 ⋅
12 = 5 ,56 1 − 0 ,85 2
tkrit = 2,17 Mivel tsz > tkrit, ezért a nullhipotézist elvetjük és nagy biztonsággal állíthatjuk, hogy a két változó között korrelációs (sztochasztikus) kapcsolat van. (Emlékeztetőül: az előjel – korrelációs együttható értéke 0,71 volt).
143
11.2. AZ R(X,Y) ÉS A REGRESSZIÓS EGYENES ÖSSZEFÜGGÉSE A 4. fejezetben az Y változót felírtuk úgy, mint az Yˆ regressziós függvény és az "e" reziduum összege:
Y = Yˆ + e ahol: "e" a véletlenszerű eltérést képviseli. Bizonyítható, hogy az összefüggés a változók szórásnégyzeteire is érvényes:
()
σ 2 (Y ) = σ 2 Yˆ + σ 2 (e ) Tapasztalati adatokból számolva:
s y2 =
1 n ⋅ ∑ yi − y n i =1
(
)
(
)
és
1 n s = ⋅ ∑ ˆy i − y n i =1 2 ˆy
2
2
ahol: yˆ i az xi értékekből a regressziós függvénnyel számolt becsült érték. Végül a reziduumokból számolt szórásnégyzet:
s e2 =
1 n 2 ⋅ ∑ ei n i =1
Látható, hogy s y2ˆ képviseli s y2 azon részét, amelyet x változásával magyarázhatunk és s e2 a „magyarázatlan” (x-hatás kikapcsolása után) részt jelenti. Bizonyíthatóak még az alábbi összefüggések is:
r 2 (x , y ) =
s ˆy2 s y2
= 1−
s e2 s y2
Az r2(x, y) – amelyet determinációs együtthatónak is neveznek – azt fejezi ki, hogy a sztochasztikus kapcsolatban a teljes változás hányad része tulajdonítható x-nek. Értékét %-os formában is megadhatjuk. Feladat: A mintapélda adatai alapján határozzuk meg a determinációs index értékét!
r 2 ( x , y ) = 0 ,85 2 = 0 ,72 Az eredményt úgy értelmezhetjük, hogy a termésátlagok változásában a műtrágya felhasználás 72 %ban játszott szerepet.
144
11.3. A REGRESSZIÓS BECSLÉS PONTOSSÁGA
Nyilvánvaló, hogy a sztochasztikus kapcsolat mérőszámaiból csak akkor vonhatunk le helyes következtetéseket, ha megfelelően nagy mintánk van. Így, az eredmények értékeléséhez hozzátartozik a mérőszámok hibájának vizsgálata is. A pontosság jellemzése céljából tehát most az a, b, yˆ paraméterek becslésének szórását (standard hibáját) kell meghatároznunk.
A regressziós együttható standard hibái: Levezetés nélkül, de a 11.2 pontban ismertetett összefüggések felhasználásával, a regressziós együtthatók standard hibaképletei: n
∑e
se =
2
(
= s y2 1 − r 2
i =1
n
)
A reziduális szórás becslésére az alábbi torzítatlan becslést is használják: n
se =
∑e
∑ (y n
2
i =1
n−2
=
i =1
− ˆy y )
2
i
n−2
A regressziós együtthatók hibái: n
sa = se ⋅
∑⋅ x i =1 n
2 i
n ⋅ ∑ d x2 i =1
sb =
i
se d xe i
A standard hibák azt mutatják meg, hogy végtelen sok n elemű mintát véve az alapsokaságból az egyes mintákból becsült „a” paraméterek átlagosan sa egységgel, a „b” paraméterek pedig sb egységgel szóródnak az alapsokasági regressziófüggvény körül. Konfidencia intervallum a becsült paraméterekre: A becsült paraméterekre konfidencia intervallumokat is konstruálhatunk. Nagy minták esetén normális eloszlás táblázatot-, kis minták esetén a Studen-eloszlás t- táblázatát használjuk (DF= n2):
ao = a ± t bo = b ± t
1−
1−
145
α 2
α 2
⋅ sa ⋅ sb
A konfidencia intervallum úgy értelmezhető [(pl: ( 1 − α ) =95 %)], hogy sok ismételt mintavétel végrehajtása során (pl.: 100 mintavétel) átlag 95 esetben a becsült regresszió együtthatóhoz rendelt konfidencia tartomány lefedi a valóságos értékeket. A lineáris kapcsolat szignifikancia vizsgálata: A t- próba segítségével azt is ellenőrizhetjük, hogy az Y és X változók között szignifikáns lineáris kapcsolat van-e. Nullhipotézisünk és ellenhipotézisünk:
Ho : b = 0 H1 : b ≠ 0 A próbastatisztika: t sz =
b sb
A tkrit értéket α szignifikancia szinten DF= n –2 szabadsági foknál találjuk meg. Ha tsz > tkrit, elvetjük Ho-t, és valós lineáris összefüggést tételezünk fel X és Y között. Az átlagos, vagy az egyedi yi értékek becslése: Az eddigiekben mindig feltételezzük, hogy az adott xi értékek rögzített értékek, azaz nem valószínűségi változók. (Mintapéldánkban ez úgy értelmezhető, hogy a műtrágya mennyiségét tudatosan mi állítjuk be, azaz X változik, de nem a véletlen hatására). Ebben az esetben minden egyes xi értékhez az yi értékeknek egy eloszlása tartozik. Előfordulhat azonban olyan eset is, amikor xi értékek is a véletlen hatására ingadoznak egy általunk ismeretlen M(xi) várható érték körül. Ilyenkor mind az xi, mind az yi értékek mintáról mintára változhatnak. (Mintapéldánkban ez úgy állhat elő, ha X értékeit a gazdálkodók sokaságára értelmezzük, így ezek az értékek a mi számunkra valószínűségi változóként viselkednek.) A regresszió becslés pontosságának vizsgálatakor a modellben szereplő paraméterek standard hibái alapján következtethetünk a számított yˆ i függvényértékek pontosságára is. Az X változó értelmezési tartományában minden egyes xi értékhez tartozik egy regresszió-érték, amelyet az
yˆ i = a + b ⋅ xi becslés alapján állíthatunk elő. Ez a becslés – az előzőek alapján – két különböző célra használható fel.
146
Becsülhetjük vele Y átlagos volumenét, vagyis egy adott xi értékhez tartozó feltételes várható értéket (átlagos yi értéket). Mintapéldánkban ekkor azt vizsgáljuk, hogy egy adott xi műtrágya felhasználáshoz átlagosan mekkora terméshozam várható. Az „a” és „b” paraméterek mintavételi hibáiból fakadóan ennek a becslésnek is van standard hibája, mégpedig:
s ˆy = se ⋅
( xi − x ) 2 1 + n ∑ ( xi − x ) 2
A feltételes várható érték (1-α) szintű konfidencia intervalluma:
M ( yˆ / xi ) = yˆ i ± t
1−
α
⋅ sy
2
Becsülhetünk azonban egy egyedi yi értéket is. Ekkor a standard hiba:
s yi = s e ⋅
( xi − x ) 2 1 + +1 n ∑ ( xi − x ) 2
A konfidencia intervallum pedig:
yi = yˆ i ± t
1−
α
⋅ s yi
2
Mindkét esetben x1 értékeit végigfuttatva egy konfidencia sávot kapunk, amelynek szélessége ( 1 − α ) -tól függ.
44. ábra: A várható értékek és egyedi értékek konfidencia intervalluma
147
A regressziós vonalhoz közelebb eső sáv a várható érték-, a távolabb eső pedig az egyedi értékek konfidencia intervallumát mutatja. Így, ha a lineáris regresszióra megfogalmazott feltételeink teljesülnek, akkor (1-α) valószínűséggel állíthatjuk, hogy egy megfigyelt pont a szélesebb sávba esik, azaz a pontoknak csak α %-a eshet-e sávon kívül. Feladat:
Korábban már többször foglalkoztunk a BUX havi hozamainak statisztikai elemzésével (leíró statisztika, hipotézisvizsgálatok). Az alábbi táblázat alapján vizsgáljuk meg, hogy az 1998. VII.-1999.VI. közötti időszakban a havi hozam (%) alapján kimutatható-e sztochasztikus kapcsolat a BUX és a Zwack hozamai között? Adjunk – előzetes – szakmai magyarázatot az eredményekre!
45. ábra
148
i 98.VII. VIII. IX. X. XI. XII. 99.I. II. III. IV. V. VI. ∑
xi (BUX yi (Zwack) %) 3,45 4,58 36 -15,32 -12,97 -7,19 26,91 5 12,53 28,45 5,51 2,87 3,16 -2,7 -13,63 -3,8 -2,37 2,79 9,02 8,43 4,58 -6,05 4,59 2,76 4,72 19,82
dxi
dyi
dx i2
dy i2
3,06 -36,45 -13,36 26,52 12,14 5,12 2,77 -14,02 -2,76 8,63 4,19 4,2
2,93 -16,97 -8,84 3,35 26,8 1,22 -4,35 -5,45 1,14 6,78 -7,7 1,11
9,36 1328,6 178,49 703,31 147,38 26,21 7,67 196,56 7,62 74,48 17,56 17,64 2714,88
8,58 287,98 78,15 11,22 718,24 1,49 18,92 29,7 1,3 45,97 59,29 1,23 1262,07
dx i ⋅ dy i 8,97 618,56 118,1 88,84 325,35 6,25 -12,05 76,41 -3,15 58,51 -32,26 4,66 1258,19
x i2 11,9 1300,32 168,22 724,15 157 30,36 9,99 185,78 5,62 81,36 20,98 21,07 2717,25
ˆy
( y i − ˆy ) ( y i − yˆ ) 2
3,078 -15,262 -4,55 13,96 7,28 4,03 2,94 -4,85 0,37 5,66 3,6 3,6
0,14 -0,058 -2,64 -8,96 21,17 -1,16 0,24 1,05 2,42 2,77 -2,45 -0,84
0,14 0 6,97 80,25 448,1 1,34 0,06 1,11 5,86 7,69 6 0,71 558,23
A diagram és/vagy a táblázat alapján határozzuk meg az előjel – korrelációs együtthatót! re = Határozzuk meg a tapasztalati korrelációs együtthatót és α = 5 % mellett végezzük el a szignifikancia vizsgálatot! r (x, y) =
Ho :
DF =
α= tsz = tkrit = Következtetés: Becsüljük meg a lineáris regressziófüggvény együtthatóit! b= a=
149
Határozzuk meg a determinációs együtthatót és értelmezzük az eredményt! r2 (x, y) = Következtetés:
Határozzuk meg a regressziós becslés pontosságát! se = sa = sb = Készítsünk 95 %-os konfidencia intervallumot a becsült paraméterekre! α=
t
1−
α 2
=
ao =
bo = Ellenőrizzük α = 5 % mellett, hogy a lineáris kapcsolat szignifikáns-e? DF =
tsz =
tkrit = Következtetés:
150
12. FELHASZNÁLT ÉS AJÁNLOTT IRODALOM
151
1. Kröpfl B. – Peschek W. – Schneider E. – Schönlieb A.: Alkalmazott statisztika. Műszaki Könyvkiadó, Budapest, 2000. 2. Prékopa A.: Valószínűségelmélet műszaki alkalmazásokkal. Műszaki Könyvkiadó, Budapest, 1974. 3. Vincze I.: Matematikai statisztika ipari alkalmazásokkal. Műszaki Könyvkiadó, Budapest, 1975. 4. Solt Gy.: Valószínűségszámítás. Példatár. Műszaki Könyvkiadó, Budapest, 1973. 5. Meszéna Gy. - Ziermann M.: Valószínűségelmélet és matematikai statisztika. Közgazdasági és Jogi Könyvkiadó, Budapest, 1981. 6. Kindler J.: Matematikai statisztika I. Tankönyvkiadó, Budapest, 1981. (J4-722) 7. Köves P. - Párniczky G.: Általános statisztika Közgazdasági és Jogi Könyvkiadó, Budapest, 1973. 8. Hunyadi L. - Vita L.: Statisztika közgazdászoknak KSH, Budapest, 2002. 9. Hunyadi - Mundruczó - Vita: Statisztika. Aula Kiadó, Budapest, 1996. 10. Kerékgyártó Gy-né - Mundruczó Gy.: Statisztikai módszerek a gazdasági elemzésben. Aula Kiadó, Budapest, 1999. 11. Szabó G.Cs. (szerk.): Alkalmazott statisztika I. Műegyetemi Kiadó, Budapest, 1994. 12. Reimann J. - Tóth J.: Valószínűségszámítás és matematikai statisztika. Tankönyvkiadó, Budapest, 1985. 13. Lukács O.: Matematikai statisztika. Példatár. Műszaki Könyvkiadó, Budapest, 1987. 14. Spiegel, Murray R.: Statisztika: Elmélet és gyakorlat. Panem - McGraw - Hill, Budapest, 1995. 15. Banks J.: Principles of Quality Control. Wiley, New York, 1989. 16. Sincich T.: Statistics by Example. Dellen Publishing Company, San Francisco, 1990. 17. Fleming M.C. - Nellis J.G.: The Essence of Statistics for Business. Prentice Hall, New York, 1991. 18. Curwin J. - Slater R.: Quantitative Methods for Business Decisions. Third Edition, Chapman & Hall, London, 1991.
152
13. FÜGGELÉK: TÁBLÁZATOK
I. II. III. IV. V. VI. VII. VIII. IX.
táblázat: Binomiális eloszlás táblázat: Poisson-eloszlás táblázat: Standard normális eloszlás táblázat: χ2-eloszlás táblázat: Student-eloszlás (t-eloszlás) táblázat: F-eloszlás (α=0,05) táblázat: F-eloszlás (α=0,01) táblázat: Cochran-próba (α=0,05) táblázat: Cochran-próba (α=0,01)
153
I. táblázat: Binomiális eloszlás n 1
k 0 1
p 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50 0,9500 0,9000 0,8500 0,8000 0,7500 0,7000 0,6500 0,6000 0,5500 0,5000 0,0500 0,1000 0,1500 0,2000 0,2500 0,3000 0,3500 0,4000 0,4500 0,5000
2
0 1 2
0,9025 0,8100 0,7225 0,6400 0,5625 0,4900 0,4225 0,3600 0,3025 0,2500 0,0950 0,1800 0,2550 0,3200 0,3750 0,4200 0,4550 0,4800 0,4950 0,5000 0,0025 0,0100 0,0225 0,0400 0,0625 0,0900 0,1225 0,1600 0,2025 0,2500
3
0 1 2 3
0,8574 0,1354 0,0071 0,0001
0,7290 0,2430 0,0270 0,0010
0,6141 0,3251 0,0574 0,0034
0,5120 0,3840 0,0960 0,0080
0,4219 0,4219 0,1406 0,0156
0,3430 0,4410 0,1890 0,0270
0,2746 0,4436 0,2389 0,0429
0,2160 0,4320 0,2880 0,0640
0,1664 0,4084 0,3341 0,0911
0,1250 0,3750 0,3750 0,1250
4
0 1 2 3 4
0,8145 0,1715 0,0135 0,0005 0,0000
0,6561 0,2916 0,0486 0,0036 0,0001
0,5220 0,3685 0,0975 0,0115 0,0005
0,4096 0,4096 0,1536 0,0256 0,0016
0,3164 0,4219 0,2109 0,0469 0,0039
0,2401 0,4116 0,2646 0,0756 0,0081
0,1785 0,3845 0,3105 0,1115 0,0150
0,1296 0,3456 0,3456 0,1536 0,0256
0,0915 0,2995 0,3675 0,2005 0,0410
0,0625 0,2500 0,3750 0,2500 0,0625
5
0 1 2 3 4 5
0,7738 0,2036 0,0214 0,0011 0,0000 0,0000
0,5905 0,3281 0,0729 0,0081 0,0005 0,0000
0,4437 0,3915 0,1382 0,0244 0,0022 0,0001
0,3277 0,4096 0,2048 0,0512 0,0064 0,0003
0,2373 0,3955 0,2637 0,0879 0,0146 0,0010
0,1681 0,3602 0,3087 0,1323 0,0284 0,0024
0,1160 0,3124 0,3364 0,1811 0,0488 0,0053
0,0778 0,2592 0,3456 0,2304 0,0768 0,0102
0,0503 0,2059 0,3369 0,2757 0,1128 0,0185
0,0313 0,1563 0,3125 0,3125 0,1563 0,0313
6
0 1 2 3 4 5 6
0,7351 0,2321 0,0305 0,0021 0,0001 0,0000 0,0000
0,5314 0,3543 0,0984 0,0146 0,0012 0,0001 0,0000
0,3771 0,3993 0,1762 0,0415 0,0055 0,0004 0,0000
0,2621 0,3932 0,2458 0,0819 0,0154 0,0015 0,0001
0,1780 0,3560 0,2966 0,1318 0,0330 0,0044 0,0002
0,1176 0,3025 0,3241 0,1852 0,0595 0,0102 0,0007
0,0754 0,2437 0,3280 0,2355 0,0951 0,0205 0,0018
0,0467 0,1866 0,3110 0,2765 0,1382 0,0369 0,0041
0,0277 0,1359 0,2780 0,3032 0,1861 0,0609 0,0083
0,0156 0,0938 0,2344 0,3125 0,2344 0,0938 0,0156
7
0 1 2 3 4 5 6 7
0,6983 0,2573 0,0406 0,0036 0,0002 0,0000 0,0000 0,0000
0,4783 0,3720 0,1240 0,0230 0,0026 0,0002 0,0000 0,0000
0,3206 0,3960 0,2097 0,0617 0,0109 0,0012 0,0001 0,0000
0,2097 0,3670 0,2753 0,1147 0,0287 0,0043 0,0004 0,0000
0,1335 0,3115 0,3115 0,1730 0,0577 0,0115 0,0013 0,0001
0,0824 0,2471 0,3177 0,2269 0,0972 0,0250 0,0036 0,0002
0,0490 0,1848 0,2985 0,2679 0,1442 0,0466 0,0084 0,0006
0,0280 0,1306 0,2613 0,2903 0,1935 0,0774 0,0172 0,0016
0,0152 0,0872 0,2140 0,2918 0,2388 0,1172 0,0320 0,0037
0,0078 0,0547 0,1641 0,2734 0,2734 0,1641 0,0547 0,0078
8
0 1 2 3 4 5 6 7 8
0,6634 0,2793 0,0515 0,0054 0,0004 0,0000 0,0000 0,0000 0,0000
0,4305 0,3826 0,1488 0,0331 0,0046 0,0004 0,0000 0,0000 0,0000
0,2725 0,3847 0,2376 0,0839 0,0185 0,0026 0,0002 0,0000 0,0000
0,1678 0,3355 0,2936 0,1468 0,0459 0,0092 0,0011 0,0001 0,0000
0,1001 0,2670 0,3115 0,2076 0,0865 0,0231 0,0038 0,0004 0,0000
0,0576 0,1977 0,2965 0,2541 0,1361 0,0467 0,0100 0,0012 0,0001
0,0319 0,1373 0,2587 0,2786 0,1875 0,0808 0,0217 0,0033 0,0002
0,0168 0,0896 0,2090 0,2787 0,2322 0,1239 0,0413 0,0079 0,0007
0,0084 0,0548 0,1569 0,2568 0,2627 0,1719 0,0703 0,0164 0,0017
0,0039 0,0313 0,1094 0,2188 0,2734 0,2188 0,1094 0,0313 0,0039
154
n 9
k 0 1 2 3 4 5 6 7 8 9
0,05 0,6302 0,2985 0,0629 0,0077 0,0006 0,0000 0,0000 0,0000 0,0000 0,0000
0,10 0,3874 0,3874 0,1722 0,0446 0,0074 0,0008 0,0001 0,0000 0,0000 0,0000
0,15 0,2316 0,3679 0,2597 0,1069 0,0283 0,0050 0,0006 0,0000 0,0000 0,0000
0,20 0,1342 0,3020 0,3020 0,1762 0,0661 0,0165 0,0028 0,0003 0,0000 0,0000
p 0,25 0,0751 0,2253 0,3003 0,2336 0,1168 0,0389 0,0087 0,0012 0,0001 0,0000
0,30 0,0404 0,1556 0,2668 0,2668 0,1715 0,0735 0,0210 0,0039 0,0004 0,0000
0,35 0,0207 0,1004 0,2162 0,2716 0,2194 0,1181 0,0424 0,0098 0,0013 0,0001
0,40 0,0101 0,0605 0,1612 0,2508 0,2508 0,1672 0,0743 0,0212 0,0035 0,0003
0,45 0,0046 0,0339 0,1110 0,2119 0,2600 0,2128 0,1160 0,0407 0,0083 0,0008
0,50 0,0020 0,0176 0,0703 0,1641 0,2461 0,2461 0,1641 0,0703 0,0176 0,0020
10
0 1 2 3 4 5 6 7 8 9 10
0,5987 0,3151 0,0746 0,0105 0,0010 0,0001 0,0000 0,0000 0,0000 0,0000 0,0000
0,3487 0,3874 0,1937 0,0574 0,0112 0,0015 0,0001 0,0000 0,0000 0,0000 0,0000
0,1969 0,3474 0,2759 0,1298 0,0401 0,0085 0,0012 0,0001 0,0000 0,0000 0,0000
0,1074 0,2684 0,3020 0,2013 0,0881 0,0264 0,0055 0,0008 0,0001 0,0000 0,0000
0,0563 0,1877 0,2816 0,2503 0,1460 0,0584 0,0162 0,0031 0,0004 0,0000 0,0000
0,0282 0,1211 0,2335 0,2668 0,2001 0,1029 0,0368 0,0090 0,0014 0,0001 0,0000
0,0135 0,0725 0,1757 0,2522 0,2377 0,1536 0,0689 0,0212 0,0043 0,0005 0,0000
0,0060 0,0403 0,1209 0,2150 0,2508 0,2007 0,1115 0,0425 0,0106 0,0016 0,0001
0,0025 0,0207 0,0763 0,1665 0,2384 0,2340 0,1596 0,0746 0,0229 0,0042 0,0003
0,0010 0,0098 0,0439 0,1172 0,2051 0,2461 0,2051 0,1172 0,0439 0,0098 0,0010
11
0 1 2 3 4 5 6 7 8 9 10 11
0,5688 0,3293 0,0867 0,0137 0,0014 0,0001 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
0,3138 0,3835 0,2131 0,0710 0,0158 0,0025 0,0003 0,0000 0,0000 0,0000 0,0000 0,0000
0,1673 0,3248 0,2866 0,1517 0,0536 0,0132 0,0023 0,0003 0,0000 0,0000 0,0000 0,0000
0,0859 0,2362 0,2953 0,2215 0,1107 0,0388 0,0097 0,0017 0,0002 0,0000 0,0000 0,0000
0,0422 0,1549 0,2581 0,2581 0,1721 0,0803 0,0268 0,0064 0,0011 0,0001 0,0000 0,0000
0,0198 0,0932 0,1998 0,2568 0,2201 0,1321 0,0566 0,0173 0,0037 0,0005 0,0000 0,0000
0,0088 0,0518 0,1395 0,2254 0,2428 0,1830 0,0985 0,0379 0,0102 0,0018 0,0002 0,0000
0,0036 0,0266 0,0887 0,1774 0,2365 0,2207 0,1471 0,0701 0,0234 0,0052 0,0007 0,0000
0,0014 0,0125 0,0513 0,1259 0,2060 0,2360 0,1931 0,1128 0,0462 0,0126 0,0021 0,0002
0,0005 0,0054 0,0269 0,0806 0,1611 0,2256 0,2256 0,1611 0,0806 0,0269 0,0054 0,0005
12
0 1 2 3 4 5 6 7 8 9 10 11 12
0,5404 0,3413 0,0988 0,0173 0,0021 0,0002 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
0,2824 0,3766 0,2301 0,0852 0,0213 0,0038 0,0005 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
0,1422 0,3012 0,2924 0,1720 0,0683 0,0193 0,0040 0,0006 0,0001 0,0000 0,0000 0,0000 0,0000
0,0687 0,2062 0,2835 0,2362 0,1329 0,0532 0,0155 0,0033 0,0005 0,0001 0,0000 0,0000 0,0000
0,0317 0,1267 0,2323 0,2581 0,1936 0,1032 0,0401 0,0115 0,0024 0,0004 0,0000 0,0000 0,0000
0,0138 0,0712 0,1678 0,2397 0,2311 0,1585 0,0792 0,0291 0,0078 0,0015 0,0002 0,0000 0,0000
0,0057 0,0368 0,1088 0,1954 0,2367 0,2039 0,1281 0,0591 0,0199 0,0048 0,0008 0,0001 0,0000
0,0022 0,0174 0,0639 0,1419 0,2128 0,2270 0,1766 0,1009 0,0420 0,0125 0,0025 0,0003 0,0000
0,0008 0,0075 0,0339 0,0923 0,1700 0,2225 0,2124 0,1489 0,0762 0,0277 0,0068 0,0010 0,0001
0,0002 0,0029 0,0161 0,0537 0,1208 0,1934 0,2256 0,1934 0,1208 0,0537 0,0161 0,0029 0,0002
155
0 1 2 3 4 5 6 7 8 9 10 11 12 13
0,05 0,05 0,5133 0,3512 0,1109 0,0214 0,0028 0,0003 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
0,10 0,10 0,2542 0,3672 0,2448 0,0997 0,0277 0,0055 0,0008 0,0001 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
0,15 0,15 0,1209 0,2774 0,2937 0,1900 0,0838 0,0266 0,0063 0,0011 0,0001 0,0000 0,0000 0,0000 0,0000 0,0000
0,20 0,20 0,0550 0,1787 0,2680 0,2457 0,1535 0,0691 0,0230 0,0058 0,0011 0,0001 0,0000 0,0000 0,0000 0,0000
p 0,25 0,25 0,0238 0,1029 0,2059 0,2517 0,2097 0,1258 0,0559 0,0186 0,0047 0,0009 0,0001 0,0000 0,0000 0,0000
0,30 0,30 0,0097 0,0540 0,1388 0,2181 0,2337 0,1803 0,1030 0,0442 0,0142 0,0034 0,0006 0,0001 0,0000 0,0000
0,35 0,35 0,0037 0,0259 0,0836 0,1651 0,2222 0,2154 0,1546 0,0833 0,0336 0,0101 0,0022 0,0003 0,0000 0,0000
0,40 0,40 0,0013 0,0113 0,0453 0,1107 0,1845 0,2214 0,1968 0,1312 0,0656 0,0243 0,0065 0,0012 0,0001 0,0000
0,45 0,45 0,0004 0,0045 0,0220 0,0660 0,1350 0,1989 0,2169 0,1775 0,1089 0,0495 0,0162 0,0036 0,0005 0,0000
0,50 0,50 0,0001 0,0016 0,0095 0,0349 0,0873 0,1571 0,2095 0,2095 0,1571 0,0873 0,0349 0,0095 0,0016 0,0001
14
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
0,4877 0,3593 0,1229 0,0259 0,0037 0,0004 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
0,2288 0,3559 0,2570 0,1142 0,0349 0,0078 0,0013 0,0002 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
0,1028 0,2539 0,2912 0,2056 0,0998 0,0352 0,0093 0,0019 0,0003 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
0,0440 0,1539 0,2501 0,2501 0,1720 0,0860 0,0322 0,0092 0,0020 0,0003 0,0000 0,0000 0,0000 0,0000 0,0000
0,0178 0,0832 0,1802 0,2402 0,2202 0,1468 0,0734 0,0280 0,0082 0,0018 0,0003 0,0000 0,0000 0,0000 0,0000
0,0068 0,0407 0,1134 0,1943 0,2290 0,1963 0,1262 0,0618 0,0232 0,0066 0,0014 0,0002 0,0000 0,0000 0,0000
0,0024 0,0181 0,0634 0,1366 0,2022 0,2178 0,1759 0,1082 0,0510 0,0183 0,0049 0,0010 0,0001 0,0000 0,0000
0,0008 0,0073 0,0317 0,0845 0,1549 0,2066 0,2066 0,1574 0,0918 0,0408 0,0136 0,0033 0,0005 0,0001 0,0000
0,0002 0,0027 0,0141 0,0462 0,1040 0,1701 0,2088 0,1952 0,1398 0,0762 0,0312 0,0093 0,0019 0,0002 0,0000
0,0001 0,0009 0,0056 0,0222 0,0611 0,1222 0,1833 0,2095 0,1833 0,1222 0,0611 0,0222 0,0056 0,0009 0,0001
15
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
0,4633 0,3658 0,1348 0,0307 0,0049 0,0006 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
0,2059 0,3432 0,2669 0,1285 0,0428 0,0105 0,0019 0,0003 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
0,0874 0,2312 0,2856 0,2184 0,1156 0,0449 0,0132 0,0030 0,0005 0,0001 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
0,0352 0,1319 0,2309 0,2501 0,1876 0,1032 0,0430 0,0138 0,0035 0,0007 0,0001 0,0000 0,0000 0,0000 0,0000 0,0000
0,0134 0,0668 0,1559 0,2252 0,2252 0,1651 0,0917 0,0393 0,0131 0,0034 0,0007 0,0001 0,0000 0,0000 0,0000 0,0000
0,0047 0,0305 0,0916 0,1700 0,2186 0,2061 0,1472 0,0811 0,0348 0,0116 0,0030 0,0006 0,0001 0,0000 0,0000 0,0000
0,0016 0,0126 0,0476 0,1110 0,1792 0,2123 0,1906 0,1319 0,0710 0,0298 0,0096 0,0024 0,0004 0,0001 0,0000 0,0000
0,0005 0,0047 0,0219 0,0634 0,1268 0,1859 0,2066 0,1771 0,1181 0,0612 0,0245 0,0074 0,0016 0,0003 0,0000 0,0000
0,0001 0,0016 0,0090 0,0318 0,0780 0,1404 0,1914 0,2013 0,1647 0,1048 0,0515 0,0191 0,0052 0,0010 0,0001 0,0000
0,0000 0,0005 0,0032 0,0139 0,0417 0,0916 0,1527 0,1964 0,1964 0,1527 0,0916 0,0417 0,0139 0,0032 0,0005 0,0000
n
k
13
156
n k 16 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
0,05 0,4401 0,3706 0,1463 0,0359 0,0061 0,0008 0,0001 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,4181 0,3741 0,1575 0,0415 0,0076 0,0010 0,0001 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,3972 0,3763 0,1683 0,0473 0,0093 0,0014 0,0002 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
0,10 0,1853 0,3294 0,2745 0,1423 0,0514 0,0137 0,0028 0,0004 0,0001 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,1668 0,3150 0,2800 0,1556 0,0605 0,0175 0,0039 0,0007 0,0001 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,1501 0,3002 0,2835 0,1680 0,0700 0,0218 0,0052 0,0010 0,0002 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
0,15 0,0743 0,2097 0,2775 0,2285 0,1311 0,0555 0,0180 0,0045 0,0009 0,0001 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0631 0,1893 0,2673 0,2359 0,1457 0,0668 0,0236 0,0065 0,0014 0,0003 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0536 0,1704 0,2556 0,2406 0,1592 0,0787 0,0301 0,0091 0,0022 0,0004 0,0001 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
0,20 0,0281 0,1126 0,2111 0,2463 0,2001 0,1201 0,0550 0,0197 0,0055 0,0012 0,0002 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0225 0,0957 0,1914 0,2393 0,2093 0,1361 0,0680 0,0267 0,0084 0,0021 0,0004 0,0001 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0180 0,0811 0,1723 0,2297 0,2153 0,1507 0,0816 0,0350 0,0120 0,0033 0,0008 0,0001 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
p 0,25 0,0100 0,0535 0,1336 0,2079 0,2252 0,1802 0,1101 0,0524 0,0197 0,0058 0,0014 0,0002 0,0000 0,0000 0,0000 0,0000 0,0000 0,0075 0,0426 0,1136 0,1893 0,2209 0,1914 0,1276 0,0668 0,0279 0,0093 0,0025 0,0005 0,0001 0,0000 0,0000 0,0000 0,0000 0,0000 0,0056 0,0338 0,0958 0,1704 0,2130 0,1988 0,1436 0,0820 0,0376 0,0139 0,0042 0,0010 0,0002 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 p
157
0,30 0,0033 0,0228 0,0732 0,1465 0,2040 0,2099 0,1649 0,1010 0,0487 0,0185 0,0056 0,0013 0,0002 0,0000 0,0000 0,0000 0,0000 0,0023 0,0169 0,0581 0,1245 0,1868 0,2081 0,1784 0,1201 0,0644 0,0276 0,0095 0,0026 0,0006 0,0001 0,0000 0,0000 0,0000 0,0000 0,0016 0,0126 0,0458 0,1046 0,1681 0,2017 0,1873 0,1376 0,0811 0,0386 0,0149 0,0046 0,0012 0,0002 0,0000 0,0000 0,0000 0,0000 0,0000
0,35 0,0010 0,0087 0,0353 0,0888 0,1553 0,2008 0,1982 0,1524 0,0923 0,0442 0,0167 0,0049 0,0011 0,0002 0,0000 0,0000 0,0000 0,0007 0,0060 0,0260 0,0701 0,1320 0,1849 0,1991 0,1685 0,1134 0,0611 0,0263 0,0090 0,0024 0,0005 0,0001 0,0000 0,0000 0,0000 0,0004 0,0042 0,0190 0,0547 0,1104 0,1664 0,1941 0,1792 0,1327 0,0794 0,0385 0,0151 0,0047 0,0012 0,0002 0,0000 0,0000 0,0000 0,0000
0,40 0,0003 0,0030 0,0150 0,0468 0,1014 0,1623 0,1983 0,1889 0,1417 0,0840 0,0392 0,0142 0,0040 0,0008 0,0001 0,0000 0,0000 0,0002 0,0019 0,0102 0,0341 0,0796 0,1379 0,1839 0,1927 0,1606 0,1070 0,0571 0,0242 0,0081 0,0021 0,0004 0,0001 0,0000 0,0000 0,0001 0,0012 0,0069 0,0246 0,0614 0,1146 0,1655 0,1892 0,1734 0,1284 0,0771 0,0374 0,0145 0,0045 0,0011 0,0002 0,0000 0,0000 0,0000
0,45 0,0001 0,0009 0,0056 0,0215 0,0572 0,1123 0,1684 0,1969 0,1812 0,1318 0,0755 0,0337 0,0115 0,0029 0,0005 0,0001 0,0000 0,0000 0,0005 0,0035 0,0144 0,0411 0,0875 0,1432 0,1841 0,1883 0,1540 0,1008 0,0525 0,0215 0,0068 0,0016 0,0003 0,0000 0,0000 0,0000 0,0003 0,0022 0,0095 0,0291 0,0666 0,1181 0,1657 0,1864 0,1694 0,1248 0,0742 0,0354 0,0134 0,0039 0,0009 0,0001 0,0000 0,0000
0,50 0,0000 0,0002 0,0018 0,0085 0,0278 0,0667 0,1222 0,1746 0,1964 0,1746 0,1222 0,0667 0,0278 0,0085 0,0018 0,0002 0,0000 0,0000 0,0001 0,0010 0,0052 0,0182 0,0472 0,0944 0,1484 0,1855 0,1855 0,1484 0,0944 0,0472 0,0182 0,0052 0,0010 0,0001 0,0000 0,0000 0,0001 0,0006 0,0031 0,0117 0,0327 0,0708 0,1214 0,1669 0,1855 0,1669 0,1214 0,0708 0,0327 0,0117 0,0031 0,0006 0,0001 0,0000
n
k
0,05
0,10
0,15
0,20
0,25
0,30
0,35
0,40
0,45
0,50
19
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
0,3774 0,3774 0,1787 0,0533 0,0112 0,0018 0,0002 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
0,1351 0,2852 0,2852 0,1796 0,0798 0,0266 0,0069 0,0014 0,0002 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
0,0456 0,1529 0,2428 0,2428 0,1714 0,0907 0,0374 0,0122 0,0032 0,0007 0,0001 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
0,0144 0,0685 0,1540 0,2182 0,2182 0,1636 0,0955 0,0443 0,0166 0,0051 0,0013 0,0003 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
0,0042 0,0268 0,0803 0,1517 0,2023 0,2023 0,1574 0,0974 0,0487 0,0198 0,0066 0,0018 0,0004 0,0001 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
0,0011 0,0093 0,0358 0,0869 0,1491 0,1916 0,1916 0,1525 0,0981 0,0514 0,0220 0,0077 0,0022 0,0005 0,0001 0,0000 0,0000 0,0000 0,0000 0,0000
0,0003 0,0029 0,0138 0,0422 0,0909 0,1468 0,1844 0,1844 0,1489 0,0980 0,0528 0,0233 0,0083 0,0024 0,0006 0,0001 0,0000 0,0000 0,0000 0,0000
0,0001 0,0008 0,0046 0,0175 0,0467 0,0933 0,1451 0,1797 0,1797 0,1464 0,0976 0,0532 0,0237 0,0085 0,0024 0,0005 0,0001 0,0000 0,0000 0,0000
0,0000 0,0002 0,0013 0,0062 0,0203 0,0497 0,0949 0,1443 0,1771 0,1771 0,1449 0,0970 0,0529 0,0233 0,0082 0,0022 0,0005 0,0001 0,0000 0,0000
0,0000 0,0000 0,0003 0,0018 0,0074 0,0222 0,0518 0,0961 0,1442 0,1762 0,1762 0,1442 0,0961 0,0518 0,0222 0,0074 0,0018 0,0003 0,0000 0,0000
20
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
0,3585 0,3774 0,1887 0,0596 0,0133 0,0022 0,0003 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
0,1216 0,2702 0,2852 0,1901 0,0898 0,0319 0,0089 0,0020 0,0004 0,0001 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
0,0388 0,1368 0,2293 0,2428 0,1821 0,1028 0,0454 0,0160 0,0046 0,0011 0,0002 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
0,0115 0,0576 0,1369 0,2054 0,2182 0,1746 0,1091 0,0545 0,0222 0,0074 0,0020 0,0005 0,0001 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
0,0032 0,0211 0,0669 0,1339 0,1897 0,2023 0,1686 0,1124 0,0609 0,0271 0,0099 0,0030 0,0008 0,0002 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
0,0008 0,0068 0,0278 0,0716 0,1304 0,1789 0,1916 0,1643 0,1144 0,0654 0,0308 0,0120 0,0039 0,0010 0,0002 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
0,0002 0,0020 0,0100 0,0323 0,0738 0,1272 0,1712 0,1844 0,1614 0,1158 0,0686 0,0336 0,0136 0,0045 0,0012 0,0003 0,0000 0,0000 0,0000 0,0000 0,0000
0,0000 0,0005 0,0031 0,0123 0,0350 0,0746 0,1244 0,1659 0,1797 0,1597 0,1171 0,0710 0,0355 0,0146 0,0049 0,0013 0,0003 0,0000 0,0000 0,0000 0,0000
0,0000 0,0001 0,0008 0,0040 0,0139 0,0365 0,0746 0,1221 0,1623 0,1771 0,1593 0,1185 0,0727 0,0366 0,0150 0,0049 0,0013 0,0002 0,0000 0,0000 0,0000
0,0000 0,0000 0,0002 0,0011 0,0046 0,0148 0,0370 0,0739 0,1201 0,1602 0,1762 0,1602 0,1201 0,0739 0,0370 0,0148 0,0046 0,0011 0,0002 0,0000 0,0000
158
II. táblázat. Poisson-eloszlás
λ
k 0 1 2 3 4 5 6 7
0,1 0,904 0,090 0,004 0,000 0,000 0,000 0,000 0,000
0,2 0,818 0,163 0,016 0,001 0,000 0,000 0,000 0,000
0,3 0,740 0,222 0,033 0,003 0,000 0,000 0,000 0,000
0,4 0,670 0,268 0,053 0,007 0,000 0,000 0,000 0,000
0,5 0,606 0,303 0,075 0,012 0,001 0,000 0,000 0,000
0,6 0,548 0,329 0,098 0,019 0,003 0,000 0,000 0,000
0,7 0,496 0,347 0,121 0,028 0,005 0,000 0,000 0,000
0,8 0,449 0,359 0,143 0,038 0,007 0,001 0,000 0,000
0,9 0,406 0,365 0,164 0,049 0,011 0,002 0,000 0,000
1,0 0,367 0,367 0,183 0,061 0,015 0,003 0,000 0,000
k 0 1 2 3 4 5 6 7 8 9
1,1 0,332 0,366 0,201 0,073 0,020 0,004 0,000 0,000 0,000 0,000
1,2 0,301 0,361 0,216 0,086 0,026 0,006 0,001 0,000 0,000 0,000
1,3 0,272 0,354 0,230 0,099 0,032 0,008 0,001 0,000 0,000 0,000
1,4 0,246 0,345 0,241 0,112 0,039 0,011 0,002 0,000 0,000 0,000
1,5 0,223 0,334 0,251 0,125 0,047 0,014 0,003 0,000 0,000 0,000
1,6 0,201 0,323 0,258 0,137 0,055 0,017 0,004 0,001 0,000 0,000
1,7 0,182 0,310 0,264 0,149 0,063 0,021 0,006 0,001 0,000 0,000
1,8 0,165 0,297 0,267 0,160 0,072 0,026 0,007 0,002 0,000 0,000
1,9 0,149 0,284 0,270 0,171 0,081 0,030 0,009 0,002 0,000 0,000
2,0 0,135 0,270 0,270 0,180 0,090 0,036 0,012 0,003 0,000 0,000
k 0 1 2 3 4 5 6 7 8 9 10 11 12
2,1 0,122 0,257 0,270 0,189 0,099 0,041 0,014 0,004 0,001 0,000 0,000 0,000 0,000
2,2 0,110 0,243 0,268 0,196 0,108 0,047 0,017 0,005 0,001 0,000 0,000 0,000 0,000
2,3 0,100 0,230 0,265 0,203 0,116 0,053 0,020 0,006 0,001 0,000 0,000 0,000 0,000
2,4 0,090 0,217 0,261 0,209 0,125 0,060 0,024 0,008 0,002 0,000 0,000 0,000 0,000
2,5 0,082 0,205 0,256 0,213 0,133 0,066 0,027 0,009 0,003 0,000 0,000 0,000 0,000
2,6 0,074 0,193 0,251 0,217 0,141 0,073 0,031 0,011 0,003 0,001 0,000 0,000 0,000
2,7 0,067 0,181 0,245 0,220 0,148 0,080 0,036 0,013 0,004 0,001 0,000 0,000 0,000
2,8 0,060 0,170 0,238 0,222 0,155 0,087 0,040 0,016 0,005 0,001 0,000 0,000 0,000
2,9 0,055 0,159 0,231 0,223 0,162 0,094 0,045 0,018 0,006 0,002 0,000 0,000 0,000
3,0 0,049 0,149 0,224 0,224 0,168 0,100 0,050 0,021 0,008 0,002 0,000 0,000 0,000
k 0 1 2 3 4 5 6 7 8
3,1 0,045 0,139 0,216 0,223 0,173 0,107 0,055 0,024 0,009
3,2 0,040 0,130 0,208 0,222 0,178 0,114 0,060 0,027 0,011
3,3 0,036 0,121 0,200 0,220 0,182 0,120 0,066 0,031 0,012
3,4 0,033 0,113 0,192 0,218 0,185 0,126 0,071 0,034 0,014
3,5 0,030 0,105 0,185 0,215 0,188 0,132 0,077 0,038 0,016
3,6 0,027 0,098 0,177 0,212 0,191 0,137 0,082 0,042 0,019
3,7 0,024 0,091 0,169 0,208 0,193 0,142 0,088 0,046 0,021
3,8 0,022 0,085 0,161 0,204 0,194 0,147 0,093 0,050 0,024
3,9 0,020 0,078 0,153 0,200 0,195 0,152 0,098 0,055 0,026
4,0 0,018 0,073 0,146 0,195 0,195 0,156 0,104 0,059 0,029
λ
λ
λ
159
9 10 11 12 13 14
0,003 0,001 0,000 0,000 0,000 0,000
0,004 0,001 0,000 0,000 0,000 0,000
0,004 0,001 0,000 0,000 0,000 0,000
0,005 0,001 0,000 0,000 0,000 0,000
0,006 0,002 0,000 0,000 0,000 0,000
0,007 0,002 0,000 0,000 0,000 0,000
0,008 0,003 0,001 0,000 0,000 0,000
0,010 0,003 0,001 0,000 0,000 0,000
0,011 0,004 0,001 0,000 0,000 0,000
0,013 0,005 0,001 0,000 0,000 0,000
k 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
4,1 0,016 0,067 0,139 0,190 0,195 0,160 0,109 0,064 0,032 0,015 0,006 0,002 0,000 0,000 0,000 0,000
4,2 0,015 0,063 0,132 0,185 0,194 0,163 0,114 0,068 0,036 0,016 0,007 0,002 0,000 0,000 0,000 0,000
4,3 0,013 0,058 0,125 0,179 0,193 0,166 0,119 0,073 0,039 0,018 0,008 0,003 0,001 0,000 0,000 0,000
4,4 0,012 0,054 0,118 0,174 0,191 0,168 0,123 0,077 0,042 0,020 0,009 0,003 0,001 0,000 0,000 0,000
4,5 0,011 0,050 0,112 0,168 0,189 0,170 0,128 0,082 0,046 0,023 0,010 0,004 0,001 0,000 0,000 0,000
4,6 0,010 0,046 0,106 0,163 0,187 0,172 0,132 0,086 0,050 0,025 0,011 0,004 0,001 0,000 0,000 0,000
4,7 0,009 0,042 0,100 0,157 0,184 0,173 0,136 0,091 0,053 0,028 0,013 0,005 0,002 0,000 0,000 0,000
4,8 0,008 0,039 0,094 0,151 0,182 0,174 0,139 0,095 0,057 0,030 0,014 0,006 0,002 0,000 0,000 0,000
4,9 0,007 0,036 0,089 0,146 0,178 0,175 0,143 0,100 0,061 0,033 0,016 0,007 0,003 0,001 0,000 0,000
5,0 0,006 0,033 0,084 0,140 0,175 0,175 0,146 0,104 0,065 0,036 0,018 0,008 0,003 0,001 0,000 0,000
k 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
5,1 0,006 0,031 0,079 0,134 0,171 0,175 0,149 0,108 0,069 0,039 0,020 0,009 0,003 0,001 0,000 0,000 0,000 0,000
5,2 0,005 0,028 0,074 0,129 0,168 0,174 0,151 0,112 0,073 0,042 0,022 0,010 0,004 0,001 0,000 0,000 0,000 0,000
5,3 0,005 0,026 0,070 0,123 0,164 0,174 0,153 0,116 0,077 0,045 0,024 0,011 0,005 0,002 0,000 0,000 0,000 0,000
5,4 0,004 0,024 0,065 0,118 0,160 0,172 0,155 0,120 0,081 0,048 0,026 0,012 0,005 0,002 0,000 0,000 0,000 0,000
5,5 0,004 0,022 0,061 0,113 0,155 0,171 0,157 0,123 0,084 0,051 0,028 0,014 0,006 0,002 0,001 0,000 0,000 0,000
5,6 0,003 0,020 0,058 0,108 0,151 0,169 0,158 0,126 0,088 0,055 0,030 0,015 0,007 0,003 0,001 0,000 0,000 0,000
5,7 0,003 0,019 0,054 0,103 0,147 0,167 0,159 0,129 0,092 0,058 0,033 0,017 0,008 0,003 0,001 0,000 0,000 0,000
5,8 0,003 0,017 0,050 0,098 0,142 0,165 0,160 0,132 0,096 0,062 0,035 0,019 0,009 0,004 0,001 0,000 0,000 0,000
5,9 0,002 0,016 0,047 0,093 0,138 0,163 0,160 0,135 0,099 0,065 0,038 0,020 0,010 0,004 0,001 0,000 0,000 0,000
6,0 0,002 0,014 0,044 0,089 0,133 0,160 0,160 0,137 0,103 0,068 0,041 0,022 0,011 0,005 0,002 0,000 0,000 0,000
k 0 1 2 3
6,1 0,002 0,013 0,041 0,084
6,2 0,002 0,012 0,039 0,080
6,3 0,001 0,011 0,036 0,076
6,4 0,001 0,010 0,034 0,072
6,5 0,001 0,009 0,031 0,068
6,6 0,001 0,009 0,029 0,065
6,7 0,001 0,008 0,027 0,061
6,8 0,001 0,007 0,025 0,058
6,9 0,001 0,007 0,024 0,055
7,0 0,000 0,006 0,022 0,052
λ
λ
λ
160
4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
0,129 0,157 0,160 0,139 0,106 0,072 0,044 0,024 0,012 0,005 0,002 0,001 0,000 0,000 0,000 0,000
0,124 0,154 0,160 0,141 0,109 0,075 0,046 0,026 0,013 0,006 0,002 0,001 0,000 0,000 0,000 0,000
0,120 0,151 0,159 0,143 0,113 0,079 0,049 0,028 0,015 0,007 0,003 0,001 0,000 0,000 0,000 0,000
0,116 0,148 0,158 0,145 0,116 0,082 0,052 0,030 0,016 0,008 0,003 0,001 0,000 0,000 0,000 0,000
0,111 0,145 0,157 0,146 0,118 0,085 0,055 0,033 0,017 0,008 0,004 0,001 0,000 0,000 0,000 0,000
0,107 0,142 0,156 0,147 0,121 0,089 0,058 0,035 0,019 0,009 0,004 0,002 0,000 0,000 0,000 0,000
0,103 0,138 0,154 0,148 0,124 0,092 0,061 0,037 0,021 0,010 0,005 0,002 0,001 0,000 0,000 0,000
0,099 0,134 0,152 0,148 0,126 0,095 0,064 0,040 0,022 0,011 0,005 0,002 0,001 0,000 0,000 0,000
0,095 0,131 0,151 0,148 0,128 0,098 0,067 0,042 0,024 0,013 0,006 0,002 0,001 0,000 0,000 0,000
0,091 0,127 0,149 0,149 0,130 0,101 0,071 0,045 0,026 0,014 0,007 0,003 0,001 0,000 0,000 0,000
k 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21
7,1 0,000 0,005 0,020 0,049 0,087 0,124 0,146 0,148 0,132 0,104 0,074 0,047 0,028 0,015 0,007 0,003 0,001 0,000 0,000 0,000 0,000 0,000
7,2 0,000 0,005 0,019 0,046 0,083 0,120 0,144 0,148 0,133 0,107 0,077 0,050 0,030 0,016 0,008 0,004 0,001 0,000 0,000 0,000 0,000 0,000
7,3 0,000 0,004 0,018 0,043 0,079 0,116 0,142 0,148 0,135 0,109 0,080 0,053 0,032 0,018 0,009 0,004 0,002 0,000 0,000 0,000 0,000 0,000
7,4 0,000 0,004 0,016 0,041 0,076 0,113 0,139 0,147 0,136 0,112 0,082 0,055 0,034 0,019 0,010 0,005 0,002 0,001 0,000 0,000 0,000 0,000
7,5 0,000 0,004 0,015 0,038 0,072 0,109 0,136 0,146 0,137 0,114 0,085 0,058 0,036 0,021 0,011 0,005 0,002 0,001 0,000 0,000 0,000 0,000
7,6 0,000 0,003 0,014 0,036 0,069 0,105 0,133 0,145 0,138 0,116 0,088 0,061 0,038 0,022 0,012 0,006 0,003 0,001 0,000 0,000 0,000 0,000
7,7 0,000 0,003 0,013 0,034 0,066 0,102 0,131 0,144 0,138 0,118 0,091 0,064 0,041 0,024 0,013 0,006 0,003 0,001 0,000 0,000 0,000 0,000
7,8 0,000 0,003 0,012 0,032 0,063 0,098 0,128 0,142 0,139 0,120 0,094 0,066 0,043 0,026 0,014 0,007 0,003 0,001 0,000 0,000 0,000 0,000
7,9 0,000 0,002 0,011 0,030 0,060 0,095 0,125 0,141 0,139 0,122 0,096 0,069 0,045 0,027 0,015 0,008 0,004 0,001 0,000 0,000 0,000 0,000
8,0 0,000 0,002 0,010 0,028 0,057 0,091 0,122 0,139 0,139 0,124 0,099 0,072 0,048 0,029 0,016 0,009 0,004 0,002 0,000 0,000 0,000 0,000
k 0 1 2 3 4 5 6
8,1 0,000 0,002 0,010 0,026 0,054 0,088 0,119
8,2 0,000 0,002 0,009 0,025 0,051 0,084 0,116
8,3 0,000 0,002 0,008 0,023 0,049 0,081 0,112
8,4 0,000 0,001 0,007 0,022 0,046 0,078 0,109
8,6 0,000 0,001 0,006 0,019 0,042 0,072 0,103
8,7 0,000 0,001 0,006 0,018 0,039 0,069 0,100
8,8 0,000 0,001 0,005 0,017 0,037 0,066 0,097
8,9 0,000 0,001 0,005 0,016 0,035 0,063 0,094
9,0 0,000 0,001 0,005 0,015 0,033 0,060 0,091
λ
λ 8,5 0,000 0,001 0,007 0,020 0,044 0,075 0,106
161
7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22
0,137 0,139 0,125 0,101 0,074 0,050 0,031 0,018 0,009 0,005 0,002 0,001 0,000 0,000 0,000 0,000
0,135 0,139 0,126 0,104 0,077 0,053 0,033 0,019 0,010 0,005 0,002 0,001 0,000 0,000 0,000 0,000
0,133 0,138 0,128 0,106 0,080 0,055 0,035 0,021 0,011 0,006 0,002 0,001 0,000 0,000 0,000 0,000
0,131 0,138 0,129 0,108 0,082 0,057 0,037 0,022 0,012 0,006 0,003 0,001 0,000 0,000 0,000 0,000
k 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
9,1 0,000 0,001 0,004 0,014 0,031 0,058 0,088 0,114 0,130 0,131 0,119 0,099 0,075 0,052 0,034 0,020 0,011 0,006 0,003 0,001 0,000 0,000 0,000 0,000 0,000
9,2 0,000 0,000 0,004 0,013 0,030 0,055 0,085 0,111 0,128 0,131 0,121 0,101 0,077 0,054 0,036 0,022 0,012 0,006 0,003 0,001 0,000 0,000 0,000 0,000 0,000
9,3 0,000 0,000 0,004 0,012 0,028 0,053 0,082 0,109 0,126 0,131 0,121 0,103 0,079 0,057 0,038 0,023 0,013 0,007 0,003 0,001 0,000 0,000 0,000 0,000 0,000
9,4 0,000 0,000 0,003 0,011 0,026 0,050 0,079 0,106 0,125 0,130 0,122 0,104 0,082 0,059 0,039 0,025 0,014 0,008 0,004 0,002 0,001 0,000 0,000 0,000 0,000
0,129 0,137 0,129 0,110 0,085 0,060 0,039 0,024 0,013 0,007 0,003 0,001 0,000 0,000 0,000 0,000
λ 9,5 0,000 0,000 0,003 0,010 0,025 0,048 0,076 0,103 0,123 0,130 0,123 0,106 0,084 0,061 0,041 0,026 0,015 0,008 0,004 0,002 0,001 0,000 0,000 0,000 0,000
0,127 0,136 0,130 0,112 0,087 0,062 0,041 0,025 0,014 0,007 0,004 0,001 0,000 0,000 0,000 0,000
0,124 0,135 0,131 0,114 0,090 0,065 0,043 0,027 0,015 0,008 0,004 0,002 0,001 0,000 0,000 0,000
0,122 0,134 0,131 0,115 0,092 0,067 0,045 0,028 0,016 0,009 0,004 0,002 0,001 0,000 0,000 0,000
0,119 0,133 0,131 0,117 0,094 0,070 0,048 0,030 0,018 0,010 0,005 0,002 0,001 0,000 0,000 0,000
0,117 0,131 0,131 0,118 0,097 0,072 0,050 0,032 0,019 0,010 0,005 0,002 0,001 0,000 0,000 0,000
9,6 0,000 0,000 0,003 0,010 0,024 0,046 0,073 0,101 0,121 0,129 0,124 0,108 0,086 0,064 0,043 0,028 0,016 0,009 0,005 0,002 0,001 0,000 0,000 0,000 0,000
9,7 0,000 0,000 0,002 0,009 0,022 0,043 0,070 0,098 0,119 0,128 0,124 0,109 0,088 0,066 0,045 0,029 0,018 0,010 0,005 0,002 0,001 0,000 0,000 0,000 0,000
9,8 0,000 0,000 0,002 0,008 0,021 0,041 0,068 0,095 0,117 0,127 0,124 0,111 0,090 0,068 0,047 0,031 0,019 0,011 0,006 0,003 0,001 0,000 0,000 0,000 0,000
9,9 0,000 0,000 0,002 0,008 0,020 0,039 0,065 0,092 0,114 0,126 0,125 0,112 0,092 0,070 0,050 0,033 0,020 0,011 0,006 0,003 0,001 0,000 0,000 0,000 0,000
10,0 0,000 0,000 0,002 0,007 0,018 0,037 0,063 0,090 0,112 0,125 0,125 0,113 0,094 0,072 0,052 0,034 0,021 0,012 0,007 0,003 0,001 0,000 0,000 0,000 0,000
162
k 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39
11,0 0,000 0,000 0,001 0,003 0,010 0,022 0,041 0,064 0,088 0,108 0,119 0,119 0,109 0,092 0,072 0,053 0,036 0,023 0,014 0,008 0,004 0,002 0,001 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000
12,0 0,000 0,000 0,000 0,001 0,005 0,012 0,025 0,043 0,065 0,087 0,104 0,114 0,114 0,105 0,090 0,072 0,054 0,038 0,025 0,016 0,009 0,005 0,003 0,001 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000
13,0 0,000 0,000 0,000 0,000 0,002 0,007 0,015 0,028 0,045 0,066 0,085 0,101 0,109 0,109 0,102 0,088 0,071 0,055 0,039 0,027 0,017 0,010 0,006 0,003 0,002 0,001 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000
14,0 0,000 0,000 0,000 0,000 0,001 0,003 0,008 0,017 0,030 0,047 0,066 0,084 0,098 0,106 0,106 0,098 0,086 0,071 0,055 0,040 0,028 0,019 0,012 0,007 0,004 0,002 0,001 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000
λ 15,0 0,000 0,000 0,000 0,000 0,000 0,001 0,004 0,010 0,019 0,032 0,048 0,066 0,082 0,095 0,102 0,102 0,096 0,084 0,070 0,055 0,041 0,029 0,020 0,013 0,008 0,005 0,002 0,001 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000
16,0 0,000 0,000 0,000 0,000 0,000 0,001 0,002 0,006 0,012 0,021 0,034 0,049 0,066 0,081 0,093 0,099 0,099 0,093 0,083 0,069 0,055 0,042 0,031 0,021 0,014 0,009 0,005 0,003 0,001 0,001 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000
163
17,0 0,000 0,000 0,000 0,000 0,000 0,000 0,001 0,003 0,007 0,013 0,023 0,035 0,050 0,065 0,080 0,090 0,096 0,096 0,090 0,081 0,069 0,056 0,043 0,032 0,022 0,015 0,010 0,006 0,003 0,002 0,001 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000
18,0 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,001 0,004 0,008 0,015 0,024 0,036 0,050 0,065 0,078 0,088 0,093 0,093 0,088 0,079 0,068 0,056 0,043 0,032 0,023 0,016 0,010 0,007 0,004 0,002 0,001 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000
19,0 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,001 0,002 0,005 0,009 0,016 0,025 0,037 0,051 0,065 0,077 0,086 0,091 0,091 0,086 0,078 0,067 0,055 0,044 0,033 0,024 0,017 0,011 0,007 0,004 0,003 0,001 0,001 0,000 0,000 0,000 0,000 0,000 0,000
20,0 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,001 0,002 0,005 0,010 0,017 0,027 0,038 0,051 0,064 0,076 0,084 0,088 0,088 0,084 0,076 0,066 0,055 0,044 0,034 0,025 0,018 0,012 0,008 0,005 0,003 0,002 0,001 0,000 0,000 0,000 0,000 0,000
III. táblázat Standard normális eloszlású valószínűségi változó eloszlásfüggvényének táblázata Φ(− u ) = 1 − Φ(u )
0
u
Φ(u)
u
Φ(u)
u
Φ(u)
u
Φ(u)
u
Φ(u)
0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 0.10 0.11 0.12 0.13 0.14 0.15 0.16 0.17 0.18 0.19 0.20 0.21 0.22 0.23 0.24 0.25 0.26 0.27 0.28 0.29 0.30 0.31 0.32 0.33 0.34 0.35 0.36 0.37 0.38 0.39 0.40 0.41 0.42 0.43 0.44 0.45 0.46 0.47 0.48 0.49 0.50 0.51
0.500000 0.503989 0.507978 0.511966 0.515953 0.519939 0.523922 0.527903 0.531881 0.535856 0.539828 0.543795 0.547758 0.551717 0.555670 0.559618 0.563559 0.567495 0.571424 0.575345 0.579260 0.583166 0.587064 0.590954 0.594835 0.598706 0.602568 0.606420 0.610261 0.614092 0.617911 0.621720 0.625516 0.629300 0.633072 0.636831 0.640576 0.644309 0.648027 0.651732 0.655422 0.659097 0.662757 0.666402 0.670031 0.673645 0.677242 0.680822 0.684386 0.687933 0.691462 0.694974
0.52 0.53 0.54 0.55 0.56 0.57 0.58 0.59 0.60 0.61 0.62 0.63 0.64 0.65 0.66 0.67 0.68 0.69 0.70 0.71 0.72 0.73 0.74 0.75 0.76 0.77 0.78 0.79 0.80 0.81 0.82 0.83 0.84 0.85 0.86 0.87 0.88 0.89 0.90 0.91 0.92 0.93 0.94 0.95 0.96 0.97 0.98 0.99 1.00 1.01 1.02 1.03
0.698468 0.701944 0.705401 0.708840 0.712260 0.715661 0.719043 0.722405 0.725747 0.729069 0.732371 0.735653 0.738914 0.742154 0.745373 0.748571 0.751748 0.754903 0.758036 0.761148 0.764237 0.767305 0.770350 0.773373 0.776373 0.779350 0.782305 0.785236 0.788145 0.791030 0.793892 0.796731 0.799546 0.802337 0.805105 0.807850 0.810570 0.813267 0.815940 0.818589 0.821214 0.823814 0.826391 0.828944 0.831472 0.833977 0.836457 0.838913 0.841345 0.843752 0.846136 0.848495
1.04 1.05 1.06 1.07 1.08 1.09 1.10 1.11 1.12 1.13 1.14 1.15 1.16 1.17 1.18 1.19 1.20 1.21 1.22 1.23 1.24 1.25 1.26 1.27 1.28 1.29 1.30 1.31 1.32 1.33 1.34 1.35 1.36 1.37 1.38 1.39 1.40 1.41 1.42 1.43 1.44 1.45 1.46 1.47 1.48 1.49 1.50 1.51 1.52 1.53 1.54 1.55
0.850830 0.853141 0.855428 0.857690 0.859929 0.862143 0.864334 0.866500 0.868643 0.870762 0.872857 0.874928 0.876976 0.879000 0.881000 0.882977 0.884930 0.886861 0.888768 0.890651 0.892512 0.894350 0.896165 0.897958 0.899727 0.901475 0.903200 0.904902 0.906582 0.908241 0.909877 0.911492 0.913085 0.914657 0.916207 0.917736 0.919243 0.920730 0.922196 0.923641 0.925066 0.926471 0.927855 0.929219 0.930563 0.931888 0.933193 0.934478 0.935745 0.936992 0.938220 0.939429
1.56 1.57 1.58 1.59 1.60 1.61 1.62 1.63 1.64 1.65 1.66 1.67 1.68 1.69 1.70 1.71 1.72 1.73 1.74 1.75 1.76 1.77 1.78 1.79 1.80 1.81 1.82 1.83 1.84 1.85 1.86 1.87 1.88 1.89 1.90 1.91 1.92 1.93 1.94 1.95 1.96 1.97 1.98 1.99 2.00 2.00 2.02 2.04 2.06 2.08 2.10 2.12
0.940620 0.941792 0.942947 0.944083 0.945201 0.946301 0.947384 0.948449 0.949497 0.950529 0.951543 0.952540 0.953521 0.954486 0.955435 0.956367 0.957284 0.958185 0.959070 0.959941 0.960796 0.961636 0.962462 0.963273 0.964070 0.964852 0.965620 0.966375 0.967116 0.967843 0.968557 0.969258 0.969946 0.970621 0.971283 0.971933 0.972571 0.973197 0.973810 0.974412 0.975002 0.975581 0.976148 0.976705 0.977250 0.977250 0.978308 0.979325 0.980301 0.981237 0.982136 0.982997
2.14 2.16 2.18 2.20 2.22 2.24 2.26 2.28 2.30 2.32 2.34 2.36 2.38 2.40 2.42 2.44 2.46 2.48 2.50 2.52 2.54 2.56 2.58 2.60 2.62 2.64 2.66 2.68 2.70 2.72 2.74 2.76 2.78 2.80 2.82 2.84 2.86 2.88 2.90 2.92 2.94 2.96 2.98 3.00 3.20 3.40 3.60 3.80 4.00
0.983823 0.984614 0.985371 0.986097 0.986791 0.987455 0.988089 0.988696 0.989276 0.989830 0.990358 0.990863 0.991344 0.991802 0.992240 0.992656 0.993053 0.993431 0.993790 0.994132 0.994457 0.994766 0.995060 0.995339 0.995604 0.995855 0.996093 0.996319 0.996533 0.996736 0.996928 0.997110 0.997282 0.997445 0.997599 0.997744 0.997882 0.998012 0.998134 0.998250 0.998359 0.998462 0.998559 0.998650 0.999313 0.999663 0.999841 0.999928 0.999968
164
IV. táblázat α
DF
0.005 0.01 0.025 0.05 5.024
10.597
9.210
12.838 11.345
14.860 13.277 11.143
α 0.5 0.75
0.9 0.95 0.975 0.99 0.995
2.706
1.323
0.455
0.102
0.016
0.004
0.001
0.000
0.000
7.378
5.991
4.605
2.773
1.386
0.575
0.211
0.103
0.051
0.020
0.010
9.348
7.815
6.251
4.108
2.366
1.213
0.584
0.352
0.216
0.115
0.072
9.488
7.779
5.385
3.357
1.923
1.064
0.711
0.484
0.297
0.207
16.750 15.086 12.832 11.070
9.236
6.626
4.351
2.675
1.610
1.145
0.831
0.554
0.412
18.548 16.812 14.449 12.592 10.645
7.841
5.348
3.455
2.204
1.635
1.237
0.872
0.676
20.278 18.475 16.013 14.067 12.017
9.037
6.346
4.255
2.833
2.167
1.690
1.239
0.989
21.955 20.090 17.535 15.507 13.362 10.219
7.344
5.071
3.490
2.733
2.180
1.647
1.344
23.589 21.666 19.023 16.919 14.684 11.389
8.343
5.899
4.168
3.325
2.700
2.088
1.735
10 11 12 13 14 15
25.188 23.209 20.483 18.307 15.987 12.549
5 6 7 8 9
6.635
0.1 0.25
3.841
1 2 3 4
7.879
χ2-eloszlás
9.342
6.737
4.865
3.940
3.247
2.558
2.156
26.757 24.725 21.920 19.675 17.275 13.701 10.341
7.584
5.578
4.575
3.816
3.053
2.603
28.300 26.217 23.337 21.026 18.549 14.845 11.340
8.438
6.304
5.226
4.404
3.571
3.074
29.819 27.688 24.736 22.362 19.812 15.984 12.340
9.299
7.041
5.892
5.009
4.107
3.565
31.319 29.141 26.119 23.685 21.064 17.117 13.339 10.165
7.790
6.571
5.629
4.660
4.075
32.801 30.578 27.488 24.996 22.307 18.245 14.339 11.037
8.547
7.261
6.262
5.229
4.601
16 17 18 19 20
34.267 32.000 28.845 26.296 23.542 19.369 15.338 11.912
9.312
7.962
6.908
5.812
5.142
35.718 33.409 30.191 27.587 24.769 20.489 16.338 12.792 10.085
8.672
7.564
6.408
5.697
37.156 34.805 31.526 28.869 25.989 21.605 17.338 13.675 10.865
9.390
8.231
7.015
6.265
38.582 36.191 32.852 30.144 27.204 22.718 18.338 14.562 11.651 10.117
8.907
7.633
6.844
39.997 37.566 34.170 31.410 28.412 23.828 19.337 15.452 12.443 10.851
9.591
8.260
7.434
21 22 23 24 25
41.401 38.932 35.479 32.671 29.615 24.935 20.337 16.344 13.240 11.591 10.283
8.897
8.034
42.796 40.289 36.781 33.924 30.813 26.039 21.337 17.240 14.041 12.338 10.982
26 27 28 29 30
48.290 45.642 41.923 38.885 35.563 30.435 25.336 20.843 17.292 15.379 13.844 12.198 11.160
40 50 60 70 80 90 100
66.766 63.691 59.342 55.758 51.805 45.616 39.335 33.660 29.051 26.509 24.433 22.164 20.707
9.542
8.643
44.181 41.638 38.076 35.172 32.007 27.141 22.337 18.137 14.848 13.091 11.689 10.196
9.260
45.558 42.980 39.364 36.415 33.196 28.241 23.337 19.037 15.659 13.848 12.401 10.856
9.886
46.928 44.314 40.646 37.652 34.382 29.339 24.337 19.939 16.473 14.611 13.120 11.524 10.520
49.645 46.963 43.195 40.113 36.741 31.528 26.336 21.749 18.114 16.151 14.573 12.878 11.808 50.994 48.278 44.461 41.337 37.916 32.620 27.336 22.657 18.939 16.928 15.308 13.565 12.461 52.335 49.588 45.722 42.557 39.087 33.711 28.336 23.567 19.768 17.708 16.047 14.256 13.121 53.672 50.892 46.979 43.773 40.256 34.800 29.336 24.478 20.599 18.493 16.791 14.953 13.787
79.490 76.154 71.420 67.505 63.167 56.334 49.335 42.942 37.689 34.764 32.357 29.707 27.991 91.952 88.379 83.298 79.082 74.397 66.981 59.335 52.294 46.459 43.188 40.482 37.485 35.534 104.22 100.43 95.023 90.531 85.527 77.577 69.334 61.698 55.329 51.739 48.758 45.442 43.275 116.32 112.33 106.63 101.88 96.578 88.130 79.334 71.145 64.278 60.391 57.153 53.540 51.172 128.30 124.12 118.14 113.15 107.57 98.650 89.334 80.625 73.291 69.126 65.647 61.754 59.196 140.17 135.81 129.56 124.34 118.50 109.14 99.334 90.133 82.358 77.929 74.222 70.065 67.328
165
V. táblázat Student- (t-) eloszlás tα DF 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 35 40 50 60 120 ∞
t0.995
t0.99
t0.975
t0.95
t0.90
t0.80
t0.75
t0.70
t0.60
63.657
31.821
12.706
6.314
3.078
1.376
1.000
0.727
0.325
9.925 5.841 4.604 4.032 3.707 3.499 3.355 3.250 3.169 3.106 3.055 3.012 2.977 2.947 2.921 2.898 2.878 2.861 2.845 2.831 2.819 2.807 2.797 2.787 2.779 2.771 2.763 2.756 2.750 2.724 2.704 2.678 2.660 2.617 2.576
6.965 4.541 3.747 3.365 3.143 2.998 2.896 2.821 2.764 2.718 2.681 2.650 2.624 2.602 2.583 2.567 2.552 2.539 2.528 2.518 2.508 2.500 2.492 2.485 2.479 2.473 2.467 2.462 2.457 2.438 2.423 2.403 2.390 2.358 2.326
4.303 3.182 2.776 2.571 2.447 2.365 2.306 2.262 2.228 2.201 2.179 2.160 2.145 2.131 2.120 2.110 2.101 2.093 2.086 2.080 2.074 2.069 2.064 2.060 2.056 2.052 2.048 2.045 2.042 2.030 2.021 2.009 2.000 1.980 1.960
2.920 2.353 2.132 2.015 1.943 1.895 1.860 1.833 1.812 1.796 1.782 1.771 1.761 1.753 1.746 1.740 1.734 1.729 1.725 1.721 1.717 1.714 1.711 1.708 1.706 1.703 1.701 1.699 1.697 1.690 1.684 1.676 1.671 1.658 1.645
1.886 1.638 1.533 1.476 1.440 1.415 1.397 1.383 1.372 1.363 1.356 1.350 1.345 1.341 1.337 1.333 1.330 1.328 1.325 1.323 1.321 1.319 1.318 1.316 1.315 1.314 1.313 1.311 1.310 1.306 1.303 1.299 1.296 1.289 1.282
1.061 0.978 0.941 0.920 0.906 0.896 0.889 0.883 0.879 0.876 0.873 0.870 0.868 0.866 0.865 0.863 0.862 0.861 0.860 0.859 0.858 0.858 0.857 0.856 0.856 0.855 0.855 0.854 0.854 0.852 0.851 0.849 0.848 0.845 0.842
0.817 0.765 0.741 0.727 0.718 0.711 0.706 0.703 0.700 0.697 0.695 0.694 0.692 0.691 0.690 0.689 0.688 0.688 0.687 0.686 0.686 0.685 0.685 0.684 0.684 0.684 0.683 0.683 0.683 0.682 0.681 0.679 0.679 0.677 0.674
0.617 0.584 0.569 0.559 0.553 0.549 0.546 0.543 0.542 0.540 0.539 0.538 0.537 0.536 0.535 0.534 0.534 0.533 0.533 0.532 0.532 0.532 0.531 0.531 0.531 0.531 0.530 0.530 0.530 0.529 0.529 0.528 0.527 0.526 0.524
0.289 0.277 0.271 0.267 0.265 0.263 0.262 0.261 0.260 0.260 0.259 0.259 0.258 0.258 0.258 0.257 0.257 0.257 0.257 0.257 0.256 0.256 0.256 0.256 0.256 0.256 0.256 0.256 0.256 0.255 0.255 0.255 0.254 0.254 0.253
166
VI. táblázat F-eloszlás
α = 0,05
α=0 0 α=0,05
F DF1 DF2
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 60 120 ∞
1
2
3
4
5
6
7
8
9
161
199
216
225
230
234
237
239
241
10 242
12 244
15 246
20 248
24 249
30 250
40 251
60 120 ∞ 252
253
254
18.5 19.0 19.2 19.3 19.3 19.3 19.4 19.4 19.4 19.40 19.4 19.4 19.5 19.5 19.5 19.5 19.5 19.5 19.5 10.1 9.55 9.28 9.12 9.01 8.94 8.89 8.85 8.81 8.79 8.74 8.70 8.67 8.64 8.62 8.59 8.57 8.55 8.53 7.71 6.94 6.59 6.39 6.26 6.16 6.09 6.04 6.00 5.96 5.91 5.86 6.04 5.77 5.75 5.72 5.69 5.66 5.63 6.61 5.79 5.41 5.19 5.05 4.95 4.88 4.82 4.77 4.74 4.68 4.62 4.95 4.53 4.50 4.46 4.43 4.40 4.37 5.99 5.14 4.76 4.53 4.39 4.28 4.21 4.15 4.10 4.06 4.00 3.94 4.53 3.84 3.81 3.77 3.74 3.70 3.67 5.59 4.74 4.35 4.12 3.97 3.87 3.79 3.73 3.68 3.64 3.57 3.51 4.12 3.41 3.38 3.34 3.30 3.27 3.23 5.32 4.46 4.07 3.84 3.69 3.58 3.50 3.44 3.39 3.35 3.28 3.22 3.84 3.12 3.08 3.04 3.01 2.97 2.93 5.12 4.26 3.86 3.63 3.48 3.37 3.29 3.23 3.18 3.14 3.07 3.01 3.86 2.90 2.86 2.83 2.79 2.75 2.71 4.96 4.10 3.71 3.48 3.33 3.22 3.14 3.07 3.02 2.98 2.91 2.85 3.71 2.74 2.70 2.66 2.62 2.58 2.54 4.84 3.98 3.59 3.36 3.20 3.09 3.01 2.95 2.90 2.85 2.79 2.72 3.59 2.61 2.57 2.53 2.49 2.45 2.40 4.75 3.89 3.49 3.26 3.11 3.00 2.91 2.85 2.80 2.75 2.69 2.62 3.49 2.51 2.47 2.43 2.38 2.34 2.30 4.67 3.81 3.41 3.18 3.03 2.92 2.83 2.77 2.71 2.67 2.60 2.53 3.41 2.42 2.38 2.34 2.30 2.25 2.21 4.60 3.74 3.34 3.11 2.96 2.85 2.76 2.70 2.65 2.60 2.53 2.46 3.34 2.35 2.31 2.27 2.22 2.18 2.13 4.54 3.68 3.29 3.06 2.90 2.79 2.71 2.64 2.59 2.54 2.48 2.40 3.29 2.29 2.25 2.20 2.16 2.11 2.07 4.49 3.63 3.24 3.01 2.85 2.74 2.66 2.59 2.54 2.49 2.42 2.35 3.24 2.24 2.19 2.15 2.11 2.06 2.01 4.45 3.59 3.20 2.96 2.81 2.70 2.61 2.55 2.49 2.45 2.38 2.31 3.20 2.19 2.15 2.10 2.06 2.01 1.96 4.41 3.55 3.16 2.93 2.77 2.66 2.58 2.51 2.46 2.41 2.34 2.27 3.16 2.15 2.11 2.06 2.02 1.97 1.92 4.38 3.52 3.13 2.90 2.74 2.63 2.54 2.48 2.42 2.38 2.31 2.23 3.13 2.11 2.07 2.03 1.98 1.93 1.88 4.35 3.49 3.10 2.87 2.71 2.60 2.51 2.45 2.39 2.35 2.28 2.20 3.10 2.08 2.04 1.99 1.95 1.90 1.84 4.32 3.47 3.07 2.84 2.68 2.57 2.49 2.42 2.37 2.32 2.25 2.18 3.07 2.05 2.01 1.96 1.92 1.87 1.81 4.30 3.44 3.05 2.82 2.66 2.55 2.46 2.40 2.34 2.30 2.23 2.15 3.05 2.03 1.98 1.94 1.89 1.84 1.78 4.28 3.42 3.03 2.80 2.64 2.53 2.44 2.37 2.32 2.27 2.20 2.13 3.03 2.01 1.96 1.91 1.86 1.81 1.76 4.26 3.40 3.01 2.78 2.62 2.51 2.42 2.36 2.30 2.25 2.18 2.11 3.01 1.98 1.94 1.89 1.84 1.79 1.73 4.24 3.39 2.99 2.76 2.60 2.49 2.40 2.34 2.28 2.24 2.16 2.09 2.99 1.96 1.92 1.87 1.82 1.77 1.71 4.23 3.37 2.98 2.74 2.59 2.47 2.39 2.32 2.27 2.22 2.15 2.07 3.37 1.95 1.90 1.85 1.80 1.75 1.69 4.21 3.35 2.96 2.73 2.57 2.46 2.37 2.31 2.25 2.20 2.13 2.06 2.96 1.93 1.88 1.84 1.79 1.73 1.67 4.20 3.34 2.95 2.71 2.56 2.45 2.36 2.29 2.24 2.19 2.12 2.04 3.34 1.91 1.87 1.82 1.77 1.71 1.65 4.18 3.33 2.93 2.70 2.55 2.43 2.35 2.28 2.22 2.18 2.10 2.03 2.93 1.90 1.85 1.81 1.75 1.70 1.64 4.17 3.32 2.92 2.69 2.53 2.42 2.33 2.27 2.21 2.16 2.09 2.01 3.32 1.89 1.84 1.79 1.74 1.68 1.62 4.08 3.23 2.84 2.61 2.45 2.34 2.25 2.18 2.12 2.08 2.00 1.92 2.84 1.79 1.74 1.69 1.64 1.58 1.51 4.00 3.15 2.76 2.53 2.37 2.25 2.17 2.10 2.04 1.99 1.92 1.84 3.15 1.70 1.65 1.59 1.53 1.47 1.39 3.92 3.07 2.68 2.45 2.29 2.18 2.09 2.02 1.96 1.91 1.83 1.75 2.68 1.61 1.55 1.50 1.43 1.35 1.25 3.84 3.00 2.61 2.37 2.21 2.10 2.01 1.94 1.88 1.83 1.75 1.67 3.00 1.52 1.46 1.39 1.32 1.22 1.03
167
VII. táblázat α=0 0 α=0,01
F-eloszlás
α = 0,01
F DF1
1 DF2
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 60 120 ∞
2
3
4
5
6
7
8
9
10
12
15
20
24
30
40
60 120 ∞
4052 4999 5404 5624 5764 5859 5928 5981 6022 6056 6107 6157 6209 6234 6260 6286 6313 6340 6366 98.5 99.0 99.2 99.3 99.3 99.3 99.4 99.4 99.4 99.4 99.4 99.4 99.4 99.5 99.5 99.5 99.5 99.5 99.5 34.1 30.8 29.5 28.7 28.2 27.9 27.7 27.5 27.3 27.2 27.1 26.9 26.7 26.6 26.5 26.4 26.3 26.2 26.1 21.2 18.0 16.7 16.0 15.5 15.2 15.0 14.8 14.7 14.5 14.4 14.2 14.0 13.9 13.8 13.7 13.7 13.6 13.5 16.3 13.3 12.1 11.4 11.0 10.7 10.5 10.3 10.2 10.1
9.9
9.7
9.6
9.5
9.4
9.3
9.2
9.1
9.0
13.7 10.9 9.78 9.15 8.75 8.47 8.26 8.10 7.98 7.87 7.72 7.56 7.40 7.31 7.23 7.14 7.06 6.97 6.88 12.2 9.55 8.45 7.85 7.46 7.19 6.99 6.84 6.72 6.62 6.47 6.31 6.16 6.07 5.99 5.91 5.82 5.74 5.65 11.3 8.65 7.59 7.01 6.63 6.37 6.18 6.03 5.91 5.81 5.67 5.52 5.36 5.28 5.20 5.12 5.03 4.95 4.86 10.6 8.02 6.99 6.42 6.06 5.80 5.61 5.47 5.35 5.26 5.11 4.96 4.81 4.73 4.65 4.57 4.48 4.40 4.31 10.0 7.56 6.55 5.99 5.64 5.39 5.20 5.06 4.94 4.85 4.71 4.56 4.41 4.33 4.25 4.17 4.08 4.00 3.91 9.65 7.21 6.22 5.67 5.32 5.07 4.89 4.74 4.63 4.54 4.40 4.25 4.10 4.02 3.94 3.86 3.78 3.69 3.60 9.33 6.93 5.95 5.41 5.06 4.82 4.64 4.50 4.39 4.30 4.16 4.01 3.86 3.78 3.70 3.62 3.54 3.45 3.36 9.07 6.70 5.74 5.21 4.86 4.62 4.44 4.30 4.19 4.10 3.96 3.82 3.66 3.59 3.51 3.43 3.34 3.25 3.17 8.86 6.51 5.56 5.04 4.69 4.46 4.28 4.14 4.03 3.94 3.80 3.66 3.51 3.43 3.35 3.27 3.18 3.09 3.00 8.68 6.36 5.42 4.89 4.56 4.32 4.14 4.00 3.89 3.80 3.67 3.52 3.37 3.29 3.21 3.13 3.05 2.96 2.87 8.53 6.23 5.29 4.77 4.44 4.20 4.03 3.89 3.78 3.69 3.55 3.41 3.26 3.18 3.10 3.02 2.93 2.84 2.75 8.40 6.11 5.19 4.67 4.34 4.10 3.93 3.79 3.68 3.59 3.46 3.31 3.16 3.08 3.00 2.92 2.83 2.75 2.65 8.29 6.01 5.09 4.58 4.25 4.01 3.84 3.71 3.60 3.51 3.37 3.23 3.08 3.00 2.92 2.84 2.75 2.66 2.57 8.18 5.93 5.01 4.50 4.17 3.94 3.77 3.63 3.52 3.43 3.30 3.15 3.00 2.92 2.84 2.76 2.67 2.58 2.49 8.10 5.85 4.94 4.43 4.10 3.87 3.70 3.56 3.46 3.37 3.23 3.09 2.94 2.86 2.78 2.69 2.61 2.52 2.42 8.02 5.78 4.87 4.37 4.04 3.81 3.64 3.51 3.40 3.31 3.17 3.03 2.88 2.80 2.72 2.64 2.55 2.46 2.36 7.95 5.72 4.82 4.31 3.99 3.76 3.59 3.45 3.35 3.26 3.12 2.98 2.83 2.75 2.67 2.58 2.50 2.40 2.31 7.88 5.66 4.76 4.26 3.94 3.71 3.54 3.41 3.30 3.21 3.07 2.93 2.78 2.70 2.62 2.54 2.45 2.35 2.26 7.82 5.61 4.72 4.22 3.90 3.67 3.50 3.36 3.26 3.17 3.03 2.89 2.74 2.66 2.58 2.49 2.40 2.31 2.21 7.77 5.57 4.68 4.18 3.85 3.63 3.46 3.32 3.22 3.13 2.99 2.85 2.70 2.62 2.54 2.45 2.36 2.27 2.17 7.72 5.53 4.64 4.14 3.82 3.59 3.42 3.29 3.18 3.09 2.96 2.81 2.66 2.58 2.50 2.42 2.33 2.23 2.13 7.68 5.49 4.60 4.11 3.78 3.56 3.39 3.26 3.15 3.06 2.93 2.78 2.63 2.55 2.47 2.38 2.29 2.20 2.10 7.64 5.45 4.57 4.07 3.75 3.53 3.36 3.23 3.12 3.03 2.90 2.75 2.60 2.52 2.44 2.35 2.26 2.17 2.07 7.60 5.42 4.54 4.04 3.73 3.50 3.33 3.20 3.09 3.00 2.87 2.73 2.57 2.49 2.41 2.33 2.23 2.14 2.04 7.56 5.39 4.51 4.02 3.70 3.47 3.30 3.17 3.07 2.98 2.84 2.70 2.55 2.47 2.39 2.30 2.21 2.11 2.01 7.31 5.18 4.31 3.83 3.51 3.29 3.12 2.99 2.89 2.80 2.66 2.52 2.37 2.29 2.20 2.11 2.02 1.92 1.81 7.08 4.98 4.13 3.65 3.34 3.12 2.95 2.82 2.72 2.63 2.50 2.35 2.20 2.12 2.03 1.94 1.84 1.73 1.60 6.85 4.79 3.95 3.48 3.17 2.96 2.79 2.66 2.56 2.47 2.34 2.19 2.03 1.95 1.86 1.76 1.66 1.53 1.38 6.64 4.61 3.78 3.32 3.02 2.80 2.64 2.51 2.41 2.32 2.19 2.04 1.88 1.79 1.70 1.59 1.47 1.33 1.04
168