Terjedelem
STATISZTIKA 6. gyakorlat
A szó szóródás terjedelme a statisztikai sor legnagyobb és legkisebb eleme kö közötti különbsé nbség.
R = xmax − xmin
Szó Szóródási mutató mutatók
Excel fü függvé ggvények Függvé ggvénykategó nykategória: Statisztikai
Forgalom terjedelem =MAX(FORGALOM)=486133 kg/é kg/év =MIN(FORGALOM)=35 kg/é kg/év Terjedelem=486133 - 35 = 486 098 kg/é kg/év
R=MAX(adatok) – MIN(adatok) Ez a legnagyobb ingadozá ingadozás!
Kvartilis elté eltérés Az adatok helyzeti eloszlá eloszlását mutatja. Gyakorisá Gyakoriságon alapul. A nagysá nagyság szerint rendezett adatokat né négy egyenlő egyenlő részre osztja. n +1 4 n +1 középső kvartilis : nQ 2 = 2 3( n + 1) felső kvartilis : nQ 3 = 4 interkvartilis terjedelem : iQ = Q3 − Q1 alsó kvartilis : nQ1 =
kvartilis eltérés : Qe =
Q3 − Q1 2
Excel fü függvé ggvény KVARTILIS(tö KVARTILIS(tömb;kvart) A kvart értéke 0 1 2 3 4
A KVARTILIS eredménye Minimális érték Első kvartilis (25%) Medián (50%) Harmadik kvartilis (75%) Maximális érték
1
Percentilis
Excel fü függvé ggvény
Latin per centum = szá százalé zalék Az n%n%-os (vagy nn-edik) percentilis azt jelenti, hogy az adatok n%n%-a kisebb, mint ez az érté rték. A mediá medián az 50%50%-os percentilisnek, percentilisnek, az alsó alsó és felső felső kvartilisek pedig a 25% ill. 75%75%-os percentilisnek felelnek meg. A percentiliseknek óriá riási jelentő jelentősége van a „mit tekintü tekintünk normá normálisnak?” lisnak?” kérdé rdés eldö eldönté ntésében. Az alsó alsó és felső felső néhány percentilis közötti részt (2.5% - 97.5% vagy 5% - 95%) szoká szokás normá normális (referencia) érté rtéknek elfogadni.
PERCENTILIS(tö PERCENTILIS(tömb;k) tömb: Az egymá egymáshoz viszonyí viszonyítandó tandó adatokat tartalmazó tartalmazó tömb vagy tartomá tartomány. k: A szá százalé zalékosztá kosztály szá száma a 00-1 intervallumban, a végpontokat is beleé beleértve. Megjegyzé Megjegyzés Ha a tö tömb üres vagy 8191 adatpontná adatpontnál tö többet tartalmaz, akkor a PERCENTILIS eredmé eredménye a #SZÁ #SZÁM! hibaé hibaérté rték lesz. Ha a k érté rtéke nem szá szám, akkor a PERCENTILIS az #É #ÉRTÉ RTÉK! hibaé hibaérté rtéket adja vissza. Ha k < 0 vagy k > 1, akkor a PERCENTILIS eredmé eredménye a #SZÁ #SZÁM! hibaé hibaérté rték lesz. Ha a k nem az 1/(n - 1) tö többszö bbszöröse, akkor a PERCENTILIS a k-adik szá százalé zalékosztá kosztályt interpolá interpoláció cióval hatá határozza meg.
Szá Százalé zalékrang
Excel fü függvé ggvény
Érté rték adathalmazon belü belül vett szá százalé zalékos rangjá rangját (elhelyezkedé (elhelyezkedését) mutatja. Pl. teszteredmé teszteredmények kié kiérté rtékelé kelése
SZÁZALÉKRANG(tömb;x;pontosság) Tömb: Az egymáshoz viszonyítandó számadatokat tartalmazó tömb vagy tartomány. x: Az az érték, amelynek a rangját meg kell határozni. Pontosság: Az eredményül kapott százalékérték értékes jegyeinek számát határozza meg, nem kötelező megadni. Ha nem adjuk meg, akkor a SZÁZALÉKRANG három tizedes jegyet használ (0,xxx).
1, 1, 1, 2, 3, 4, 8, 11, 12, 13 2 szá százalé zalékrangja: 33,3% 8 szá százalé zalékrangja: 66,6%
Átlagos abszolú abszolút elté eltérés
Excel fü függvé ggvény
Egyszerű formában kevé kevésbé sbé haszná használatos mérté rtékegysé kegységgel rendelkezik az átlagtó tlagtól mindké mindkét irá irányban értelmezzü rtelmezzük
ÁTL.ELTÉRÉS(szám1;szám2;...)
n
d=
∑x −x i
i =1
n
Súlyozott formában n
d=
∑f i =1
i
xi − x
n
∑f i =1
i
szám1, szám2...: 1 és 30 közötti számú argumentum, amelyek abszolút eltérésének átlagát keressük. Pontosvesszőkkel elválasztott argumentumok helyett egyetlen tömböt vagy erre mutató hivatkozást is használhatunk. Megjegyzés Az argumentumok számok, számokat tartalmazó tömbök vagy számokra mutató nevek, illetve hivatkozások lehetnek. A függvény a tömbben vagy hivatkozásban szereplő értékek közül csak a számokat használja, az üres cellákat, logikai értékeket, szöveget és hibaüzeneteket figyelmen kívül hagyja, de a nullát tartalmazó cellákat számításba veszi.
2
Szó Szórás becslé becslése 1.
Szó Szórás becslé becslése 2.
Minta alapjá alapján:
Sokasá Sokaság alapjá alapján:
Egyszerű ű formában:
Súlyozott formában: n
n
s=
∑ ( xi − x) 2 i =1
n −1
s=
∑ f (x i =1
i
i
n
∑f i =1
i
− x)
A szó szórás tulajdonsá tulajdonságai 1. A szó szórás ± vagy nulla A szó szórás mé mérté rtékegysé kegysége megegyezik az adatok mé mérté rtékegysé kegységével A szó szórás érté rtéke nagyon megnő megnő, ha kiugró ó adat van az adatok kö kiugr között
σ x+ A = σ x σ Bx = B σ x σ = xq 2 − x 2
n
n
2
−1
A szó szórás tulajdonsá tulajdonságai 3.
Súlyozott formában:
Egyszerű ű formában:
s=
∑ ( x − x) i =1
i
2
s=
∑ f (x i =1
n
i
i
− x)2
n
∑f i =1
i
A szó szórás tulajdonsá tulajdonságai 2. A szó szórások nem adható adhatók össze Az érté rtékekhez ugyanazt a szá számot hozzá hozzáadva vagy levonva a szó szórás nem változik Az érté rtékeket egy kö közös szá számmal szorozva a szó szórás a szá szám abszolú abszolút érté rtékével szorzó szorzódik A szó szórás kiszá kiszámítható tható a né négyzetes és szá számtani átlagbó tlagból is
Excel fü függvé ggvény SZÓRÁS(szám1;szám2;...) szám1, szám2...: A statisztikai mintát reprezentáló argumentumok, számuk 1 és 30 között lehet. Az argumentumokban pontosvesszővel elválasztott értékek helyett egyetlen tömb vagy tömbhivatkozás is használható. Megjegyzés A SZÓRÁS függvény az argumentumokat statisztikai sokaság mintájának tekinti. Ha az adatok a teljes sokaságot jelentik, akkor a szórást a SZÓRÁSP függvénnyel kell kiszámolni. A függvény a szórást a „torzítatlan” vagy „n-1” módszerrel számítja ki.
3
Excel fü függvé ggvény
Forgalom szó szórása
SZÓRÁSP(szám1;szám2;...) szám1, szám2...: A statisztikai sokaságot reprezentáló argumentumok, számuk 1 és 30 között lehet. Az argumentumokban pontosvesszővel elválasztott értékek helyett egyetlen tömb vagy tömbhivatkozás is használható.
=SZÓ =SZÓRÁS(Forgalom) = 83 927 kg =SZÓ =SZÓRÁSP(Forgalom) = 83 877 kg
Megjegyzés A SZÓRÁSP az argumentumokat a teljes statisztikai sokaságnak tekinti. Ha az adatok a teljes sokaság mintáját jelentik, akkor a szórást a SZÓRÁS függvénnyel kell kiszámítani. Nagyméretű mintáknál a SZÓRÁS és a SZÓRÁSP megközelítőleg azonos eredmény ad.
Variancia gyakorlati meghatá meghatározá rozása
Variancia vagy szó szórásné snégyzet Egyszerű formában:
Összeadható sszeadhatók, kivonható kivonhatók Ará Arányosí nyosítható thatók
n
s2 =
n
s2 =
∑ ( x − x) i =1
2
∑ ( x − x) n −1
s = 2
Súlyozott formában:
∑ (x − x) n −1
2
=
∑x
2
n −1
n
n
i
n
i =1
( x) − ∑
2
2
i
s = 2
∑ f ( x − x) i =1
i
Előnye:
n
∑f i =1
2
i
i
−1
Excel fü függvé ggvény VAR(szám1;szám2;...) szám1, szám2...: A statisztikai mintát reprezentáló argumentumok, számuk 1 és 30 között lehet. Megjegyzés A VAR függvény az argumentumokat egy statisztikai sokaság mintájának tekinti. Ha az adatok a teljes sokaságot jelentik, akkor a varianciát a VARP függvénnyel kell kiszámítani. A logikai értékeket, például IGAZ vagy HAMIS, valamint a szöveget a függvény figyelmen kívül hagyja. Ha a logikai értékeket és a szöveget is számításba szeretnénk venni, használjuk a VARA munkalapfüggvényt.
Csak az x és x négyzetet kell tárolni és összegezni
Excel fü függvé ggvény VARP(szám1;szám2;...) szám1, szám2...: A statisztikai sokaságot reprezentáló argumentumok, számuk 1 és 30 között lehet. Megjegyzés A VARP az argumentumokat a teljes statisztikai sokaságnak tekinti. Ha az adatok a teljes sokaságnak csak mintáját képezik, akkor a varianciát a VAR függvénnyel kell kiszámítani.
4
Variá Variáció ciós együ együttható ttható vagy relatí relatív szó szórás az eredmé eredményt %%-ban fejezzü fejezzük ki, az együ együttható ttható nagysá nagysága a vizsgá vizsgált jelensé jelenség vá változé ltozékonysá konyságával nő, alkalmas elté eltérő jelensé jelenségek szó szórásának összehasonlí sszehasonlítására, figyelembe veszi a vizsgá vizsgált jelensé jelenség szí színvonalá nvonalát, 0 – 10% homogé homogén, 10 – 20% közepesen vá változé ltozékony, 20 – 30% erő erősen vá változé ltozékony, 30% fölött szé szélső lsőségesen ingadozó ingadozó, az átlag nem alkalmas a sokasá sokaság jellemzé jellemzésére.
s Vr = CV = 100 x
Forgalom CV
s Vr = CV = 100 x 83 927 100 = 142% 59 075
Relatí Relatív variá variáció ciós együ együttható ttható s max imuma x CVr (%) =
Forgalom CVr
n
s x 100s 100 = n x n
CVr (%) =
100s 100 * 83 927 = = 4,88% x n 59 075 847
Érté rtéke 00-100% lehet.
Leí Leíró statisztika az ExcelExcel-ben
Szó Szóródási mutató mutatók szá számítása Kukorica (t/ha)
Eszkö Eszközök – Adatelemzé Adatelemzés…
Várható érték (számtani átlag) Standard hiba (az átlag szórása) Medián Módusz Szórás Minta varianciája Csúcsosság Ferdeség Tartomány Minimum Maximum Darabszám Konfidenciaszint(95,0%)
5,71 0,43 5,31 #HIÁNYZIK 2,37 5,64 -0,38 0,35 9,12 1,63 10,75 30 0,887
5
Kiugró Kiugró érté rtékek Trimmelt átlag Három szó szórásná snál nagyobb tá távolsá volság eseté esetén gyanú gyanús Q3+1,5IQR, illetve Q1Q1-1,5IQR
Trimmelt vagy ré részá szátlag Egy adathalmaz kö középső pső részé szének átlaga Az adathalmaz felső felső és alsó alsó részé szén adott szá á zalé é k ú adatpont elhagyá á s á val sz zal elhagy szá számítjuk ki Leggyakrabban 5 vagy 10%10%-os a trimmelé trimmelés
Excel fü függvé ggvény RÉSZÁTLAG(tömb;százalék) tömb: Az a tömb vagy tartomány, amelynek egy részét átlagolni kell. százalék: A számításban részt nem vevő adatok százalékos aránya. Ha például százalék = 0,2 (20%), akkor a 20 adatpontot tartalmazó halmazból 4 adatpont (20 x 0,2) marad ki a középérték kiszámításánál (2 a halmaz tetején, 2 az alján).
Forgalom ré részá szátlag =RÉ =RÉSZÁ SZÁTLAG(Forgalom; 0,2 )= 42 272 kg =ÁTLAG(Forgalom) = 59 075 kg
Megjegyzés Ha százalék < 0 vagy százalék > 1, akkor a RÉSZÁTLAG eredménye a #SZÁM! hibaérték lesz. A RÉSZÁTLAG az elhagyandó adatpontok számát lefelé kerekíti 2 legközelebbi többszörösére. Ha például százalék = 0,1 (azaz 10%), akkor 30 adatpontnál hármat kellene elhagyni. A szimmetria miatt a RÉSZÁTLAG az adathalmaz tetején és alján egy-egy értéket fog elhagyni.
Szá Számtani átlag standard hibá hibája
A szá számtani átlag szó szórása (standard hiba)
s sx = n
A szá számtani átlag is való valószí színűségi vá változó ltozó Normá Normális eloszlá eloszlást felté feltételezve igaz A sokasá sokaság való valódi kö középérté rtékének meghatá meghatározá rozásához
( x) ∑ x − ∑n
2
sx =
∑(x − x) n (n − 1)
2
2
=
n (n − 1)
6
Forgalom S.E.
sx =
s 83 927 = = 2 884 kg n 847
Standard hiba vé véges sokasá sokaság eseté esetén A vé véges sokasá sokaság elemszá elemszáma N Visszatevé é s né é lkü ü Visszatev n lk li mintavé mintavétel Minta: n/N>5%
µ = x ± 2884
A korrekciós tényező
Az számtani átlag standard hibája véges sokaság esetén
jele: fpc (finite population correction factor)
fpc =
N −n N −1
s sx = n
N −n N −1
Forgalom Északszak-alfö alföld
sx =
s n
N − n 79 400 847 − 121 = = 6 687 N −1 847 − 1 121
7