Változékonyság (szóródás)
STATISZTIKA I. 5. Előadás Szóródási mutatók
A szóródás mutatószámai A szóródás terjedelme Kvantilisek: Kvartilis eltérés Percentilis Százalékrang
A középértékek a sokaság elemeinek értéknagyságbeli különbségeit eltakarhatják. A változékonyság az azonos tulajdonságú, de eltérő értéknagyságú adatok egymástól vagy középértéktől való különbözőségét méri. Leggyakrabban a számtani átlaghoz képest állapítjuk meg Minél kisebb a szóródás annál jellemzőbb, megbízhatóbb az átlag
Terjedelem A szóródás terjedelme a statisztikai sor legnagyobb és legkisebb eleme közötti különbség.
Középeltérés Szórás Szóródási együttható (relatív szórás) Relatív szóródási együttható
Excel függvények Függvénykategória: Statisztikai
Forgalom terjedelem =MAX(FORGALOM)=486133 kg/év =MIN(FORGALOM)=35 kg/év Terjedelem=486133 - 35 = 486 098 kg/év
R=MAX(adatok) – MIN(adatok) Ez a legnagyobb ingadozás!
1
Kvartilis eltérés
Kvartilis ábra (box-plot)
Az adatok helyzeti eloszlását mutatja. Gyakoriságon alapul. A nagyság szerint rendezett adatokat négy egyenlő részre osztja.
maximum
Q3
Q2
Q1
minimum
Excel függvény
Az alsó (Q1) és felső (Q3) kvartilisek meghatározása nem egyértelmű
KVARTILIS(tömb;kvart) A kvart értéke 0 1 2 3 4
A KVARTILIS eredménye Minimális érték Első kvartilis (25%) Medián (50%) Harmadik kvartilis (75%) Maximális érték
Példa
Percentilis Latin per centum = százalék Az n%-os (vagy n-edik) percentilis azt jelenti, hogy az adatok n%-a kisebb, mint ez az érték. A medián az 50%-os percentilisnek, az alsó és felső kvartilisek pedig a 25% ill. 75%-os percentilisnek felelnek meg. A percentiliseknek óriási jelentősége van a „mit tekintünk normálisnak?” kérdés eldöntésében. Az alsó és felső néhány percentilis közötti részt (2,5% - 97,5%, vagy 5% - 95%) szokás normális (referencia) értéknek elfogadni.
2
Excel függvény PERCENTILIS(tömb;k) tömb: Az egymáshoz viszonyítandó adatokat tartalmazó tömb vagy tartomány. k: A százalékosztály száma a 0-1 intervallumban, a végpontokat is beleértve.
Százalékrang Érték adathalmazon belül vett százalékos rangját (elhelyezkedését) mutatja. Pl. teszteredmények kiértékelése
Megjegyzés Ha a tömb üres vagy 8191 adatpontnál többet tartalmaz, akkor a PERCENTILIS eredménye a #SZÁM! hibaérték lesz. Ha a k értéke nem szám, akkor a PERCENTILIS az #ÉRTÉK! hibaértéket adja vissza. Ha k < 0 vagy k > 1, akkor a PERCENTILIS eredménye a #SZÁM! hibaérték lesz. Ha a k nem az 1/(n - 1) többszöröse, akkor a PERCENTILIS a k-adik százalékosztályt interpolációval határozza meg.
1, 1, 1, 2, 3, 4, 8, 11, 12, 13 2 százalékrangja: 33,3% 8 százalékrangja: 66,6%
Excel függvény SZÁZALÉKRANG(tömb;x;pontosság) Tömb: Az egymáshoz viszonyítandó számadatokat tartalmazó tömb vagy tartomány. x: Az az érték, amelynek a rangját meg kell határozni. Pontosság: Az eredményül kapott százalékérték értékes jegyeinek számát határozza meg, nem kötelező megadni. Ha nem adjuk meg, akkor a SZÁZALÉKRANG három tizedes jegyet használ (0,xxx).
Középeltérés Egy statisztikai sor tagjainak a mediántól vett eltérések abszolút értékét (előjelek figyelmen kívül hagyása mellett) összeadjuk és osztjuk a sor tagjainak a számával
Átlagos eltérés Egyszerű formában kevésbé használatos mértékegységgel rendelkezik az átlagtól mindkét irányban értelmezzük Súlyozott formában
Egyszerű formában
Súlyozott formában
Excel függvény ÁTL.ELTÉRÉS(szám1;szám2;...) szám1, szám2...: 1 és 30 közötti számú argumentum, amelyek abszolút eltérésének átlagát keressük. Pontosvesszőkkel elválasztott argumentumok helyett egyetlen tömböt vagy erre mutató hivatkozást is használhatunk. Megjegyzés Az argumentumok számok, számokat tartalmazó tömbök vagy számokra mutató nevek, illetve hivatkozások lehetnek. A függvény a tömbben vagy hivatkozásban szereplő értékek közül csak a számokat használja, az üres cellákat, logikai értékeket, szöveget és hibaüzeneteket figyelmen kívül hagyja, de a nullát tartalmazó cellákat számításba veszi.
3
Szórás
Forgalom átlagos abszolút eltérés Számtani átlag = 59 075 kg/év Átlagos eltérés = 64 754 kg/év
Szórás becslése 1. Minta alapján: Egyszerű formában:
Az elméleti szórás jele: σ A mintából becsült szórás jele: s
Szórás becslése 2. Sokaság alapján:
Súlyozott formában:
A szórás tulajdonságai 1. A szórás ± vagy nulla A szórás mértékegysége megegyezik az adatok mértékegységével A szórás értéke nagyon megnő, ha kiugró adat van az adatok között
Egyszerű formában:
Súlyozott formában:
A szórás tulajdonságai 2. A szórások nem adhatók össze Az értékekhez ugyanazt a számot hozzáadva vagy levonva a szórás nem változik Az értékeket egy közös számmal szorozva a szórás a szám abszolút értékével szorzódik A szórás kiszámítható a négyzetes és számtani átlagból is
4
A szórás tulajdonságai 3.
Excel függvény SZÓRÁS(szám1;szám2;...) szám1, szám2...: A statisztikai mintát reprezentáló argumentumok, számuk 1 és 30 között lehet. Az argumentumokban pontosvesszővel elválasztott értékek helyett egyetlen tömb vagy tömbhivatkozás is használható. Megjegyzés A SZÓRÁS függvény az argumentumokat statisztikai sokaság mintájának tekinti. Ha az adatok a teljes sokaságot jelentik, akkor a szórást a SZÓRÁSP függvénnyel kell kiszámolni. A függvény a szórást a „torzítatlan” vagy „n-1” módszerrel számítja ki.
Excel függvény SZÓRÁSP(szám1;szám2;...) szám1, szám2...: A statisztikai sokaságot reprezentáló argumentumok, számuk 1 és 30 között lehet. Az argumentumokban pontosvesszővel elválasztott értékek helyett egyetlen tömb vagy tömbhivatkozás is használható.
Forgalom szórása =SZÓRÁS(Forgalom) = 83 927 kg =SZÓRÁSP(Forgalom) = 83 877 kg
Megjegyzés A SZÓRÁSP az argumentumokat a teljes statisztikai sokaságnak tekinti. Ha az adatok a teljes sokaság mintáját jelentik, akkor a szórást a SZÓRÁS függvénnyel kell kiszámítani. Nagyméretű mintáknál a SZÓRÁS és a SZÓRÁSP megközelítőleg azonos eredmény ad.
Hiba oszlopdiagram (Error Bar)
Variancia vagy szórásnégyzet Összeadhatók, kivonhatók Arányosíthatók
Egyszerű formában:
Súlyozott formában:
5
Variancia gyakorlati meghatározása
Excel függvény VAR(szám1;szám2;...) szám1, szám2...: A statisztikai mintát reprezentáló argumentumok, számuk 1 és 30 között lehet. Megjegyzés
Előnye: Csak az x és x négyzetet kell tárolni és összegezni
Excel függvény VARP(szám1;szám2;...) szám1, szám2...: A statisztikai sokaságot reprezentáló argumentumok, számuk 1 és 30 között lehet. Megjegyzés A VARP az argumentumokat a teljes statisztikai sokaságnak tekinti. Ha az adatok a teljes sokaságnak csak mintáját képezik, akkor a varianciát a VAR függvénnyel kell kiszámítani.
Varianciák átlaga több mintából
A VAR függvény az argumentumokat egy statisztikai sokaság mintájának tekinti. Ha az adatok a teljes sokaságot jelentik, akkor a varianciát a VARP függvénnyel kell kiszámítani. A logikai értékeket, például IGAZ vagy HAMIS, valamint a szöveget a függvény figyelmen kívül hagyja. Ha a logikai értékeket és a szöveget is számításba szeretnénk venni, használjuk a VARA munkalapfüggvényt.
Szórások átlagolása A csoportok közös szórása Belső szórás Pooled szórás
A SZÓRÁSOKAT NEM LEHET ÁTLAGOLNI!
Szórások átlagolása
6
n1=n2=n3
Négyzetes átlag
Variációs együttható vagy relatív szórás
Forgalom CV
alkalmas eltérő jelenségek szórásának összehasonlítására, az eredményt %-ban fejezzük ki, 0 – 10% homogén, 10 – 20% közepesen változékony, 20 – 30% erősen változékony, 30% fölött szélsőségesen ingadozó, az átlag nem alkalmas a sokaság jellemzésére.
Relatív variációs együttható
Értéke 0-100% lehet.
7