Változé ltozékonysá konyság (szó (szóródás)
STATISZTIKA 4. Elő Előadá adás Szó Szóródási mutató mutatók
A szó szóródás mutató mutatószá számai A szó szóródás terjedelme Kvartilis elté eltérés Percentilis Szá Százalé zalékrang Középelté peltérés Szó Szórás Szó Szóródási együ együttható ttható (relatí (relatív szó szórás) Relatí Relatív szó szóródási együ együttható ttható
Excel fü függvé ggvények Függvé ggvénykategó nykategória: Statisztikai
A kö középérté rtékek a sokasá sokaság elemeinek érté rtéknagysá knagyságbeli kü különbsé nbségeit eltakarjá eltakarják. A vá változé ltozékonysá konyság az azonos tulajdonsá tulajdonságú, de elté eltérő érté rtéknagysá knagyságú adatok egymá egymástó stól vagy kö középérté rtéktő ktől való való különbö nbözőségét méri. Leggyakrabban a szá számtani átlaghoz ké képest állapí llapítjuk meg Miné Minél kisebb a szó szóródás anná annál jellemző jellemzőbb, megbí megbízható zhatóbb az átlag
Terjedelem A szó szóródás terjedelme a statisztikai sor legnagyobb és legkisebb eleme kö közötti különbsé nbség.
R = xmax − xmin
Kvartilis elté eltérés Az adatok helyzeti eloszlá eloszlását mutatja. Gyakorisá Gyakoriságon alapul. A nagysá nagyság szerint rendezett adatokat né négy egyenlő egyenlő részre osztja. n +1 4 n +1 középső kvartilis : nQ 2 = 2 3( n + 1) felső kvartilis : nQ 3 = 4 interkvartilis terjedelem : iQ = Q3 − Q1 alsó kvartilis : nQ1 =
R=MAX(adatok) – MIN(adatok)
kvartilis eltérés : Qe =
Q3 − Q1 2
1
Kvartilis ábra (box (box--plot) plot) maximum
Q3
Q2
Q1
minimum
Excel fü függvé ggvény KVARTILIS(tö KVARTILIS(tömb;kvart) A kvart értéke 0 1 2 3 4
Percentilis Latin per centum = szá százalé zalék Az n%n%-os (vagy nn-edik) percentilis azt jelenti, hogy az adatok n%n%-a kisebb, mint ez az érté rték. A mediá medián az 50%50%-os percentilisnek, percentilisnek, az alsó alsó és felső felső kvartilisek pedig a 25% ill. 75%75%-os percentilisnek felelnek meg. A percentiliseknek óriá riási jelentő jelentősége van a 'mit tekintü tekintünk normá normálisnak?' ké kérdé rdés eldö eldönté ntésében. Az alsó alsó és felső felső néhány percentilis közötti részt (2.5% - 97.5% vagy 5% - 95%) szoká szokás normá normális (referencia) érté rtéknek elfogadni.
A KVARTILIS eredménye Minimális érték Első kvartilis (25%) Medián (50%) Harmadik kvartilis (75%) Maximális érték
Excel fü függvé ggvény PERCENTILIS(tö PERCENTILIS(tömb;k) tömb: Az egymá egymáshoz viszonyí viszonyítandó tandó adatokat tartalmazó tartalmazó tömb vagy tartomá tartomány. k: A szá százalé zalékosztá kosztály szá száma a 00-1 intervallumban, a végpontokat is beleé beleértve. Megjegyzé Megjegyzés Ha a tö tömb üres vagy 8191 adatpontná adatpontnál tö többet tartalmaz, akkor a PERCENTILIS eredmé eredménye a #SZÁ #SZÁM! hibaé hibaérté rték lesz. Ha a k érté rtéke nem szá szám, akkor a PERCENTILIS az #É #ÉRTÉ RTÉK! hibaé hibaérté rtéket adja vissza. Ha k < 0 vagy k > 1, akkor a PERCENTILIS eredmé eredménye a #SZÁ #SZÁM! hibaé hibaérté rték lesz. Ha a k nem az 1/(n - 1) tö többszö bbszöröse, akkor a PERCENTILIS a k-adik szá százalé zalékosztá kosztályt interpolá interpoláció cióval hatá határozza meg.
Szá Százalé zalékrang
Excel fü függvé ggvény
Érté rték adathalmazon belü belül vett szá százalé zalékos rangjá rangját (elhelyezkedé (elhelyezkedését) mutatja. Pl. teszteredmé teszteredmények kié kiérté rtékelé kelése
SZÁZALÉKRANG(tömb;x;pontosság) Tömb: Az egymáshoz viszonyítandó számadatokat tartalmazó tömb vagy tartomány. x: Az az érték, amelynek a rangját meg kell határozni. Pontosság: Az eredményül kapott százalékérték értékes jegyeinek számát határozza meg, nem kötelező megadni. Ha nem adjuk meg, akkor a SZÁZALÉKRANG három tizedes jegyet használ (0,xxx).
1, 1, 1, 2, 3, 4, 8, 11, 12, 13 2 szá százalé zalékrangja: 33,3% 8 szá százalé zalékrangja: 66,6%
2
Középelté peltérés Egy statisztikai sor tagjainak középérté rtéküktő ktől (leggyakrabban szá számtani közepü zepüktő ktől, esetleg mediá mediántó ntól) mé mért elté eltéréseinek abszolú abszolút érté rtékét (elő (előjelek figyelmen kí kívül hagyá hagyása mellett) összeadjuk és osztjuk a sor tagjainak a szá számával
Átlagos abszolú abszolút elté eltérés Egyszerű formában
Egyszerű formában n
d=
∑x i =1
i
− Me
n −1
kevé kevésbé sbé haszná használatos mérté rtékegysé kegységgel rendelkezik az átlagtó tlagtól mindké mindkét irá irányban értelmezzü rtelmezzük
n
d=
∑x −x i =1
i
n
Súlyozott formában Súlyozott formában n
d=
∑ f i xi − Me
n
i =1
n
∑ i =1
d=
fi − 1
∑f i =1
i
xi − x
n
∑f i =1
Excel fü függvé ggvény ÁTL.ELTÉRÉS(szám1;szám2;...) szám1, szám2...: 1 és 30 közötti számú argumentum, amelyek abszolút eltérésének átlagát keressük. Pontosvesszőkkel elválasztott argumentumok helyett egyetlen tömböt vagy erre mutató hivatkozást is használhatunk.
i
Szó Szórás Az elmé elméleti szó szórás jele: σ A mintá mintából becsü becsült szó szórás jele: s
Megjegyzés Az argumentumok számok, számokat tartalmazó tömbök vagy számokra mutató nevek, illetve hivatkozások lehetnek. A függvény a tömbben vagy hivatkozásban szereplő értékek közül csak a számokat használja, az üres cellákat, logikai értékeket, szöveget és hibaüzeneteket figyelmen kívül hagyja, de a nullát tartalmazó cellákat számításba veszi.
A szó szórás tulajdonsá tulajdonságai A szó szórás ± vagy nulla A szó szórás mé mérté rtékegysé kegysége megegyezik az adatok mé mérté rtékegysé kegységével A szó szórás érté rtéke nagyon megnő megnő, ha kiugró kiugró adat van az adatok kö között
Szó Szórás becslé becslése 1. Minta alapjá alapján: Egyszerű ű formában: n
s=
∑ ( x − x) i =1
2
i
n −1
Súlyozott formában: n
s=
∑ f ( x − x) i
2
i
i =1
n
∑f i =1
i
−1
3
Szó Szórás becslé becslése 2. Sokasá Sokaság alapjá alapján: Egyszerű ű formában: n
s=
− x )2
∑(x
i
i =1
n
Súlyozott formában: n
s=
∑ f ( x − x) i
2
i
i =1
n
∑f i =1
i
A szó szórás tulajdonsá tulajdonságai 1. A szó szórások nem adható adhatók össze Az érté rtékekhez ugyanazt a szá számot hozzá hozzáadva vagy levonva a szó szórás nem változik Az érté rtékeket egy kö közös szá számmal szorozva a szó szórás a szá szám abszolú abszolút érté rtékével szorzó szorzódik A szó szórás kiszá kiszámítható tható a né négyzetes és szá számtani átlagbó tlagból is
A szó szórás tulajdonsá tulajdonságai 2.
σ x+ A = σ x σ Bx = B σ x
Excel fü függvé ggvény SZÓRÁS(szám1;szám2;...) szám1, szám2...: A statisztikai mintát reprezentáló argumentumok, számuk 1 és 30 között lehet. Az argumentumokban pontosvesszővel elválasztott értékek helyett egyetlen tömb vagy tömbhivatkozás is használható. Megjegyzés
σ = xq 2 − x 2
Excel fü függvé ggvény SZÓRÁSP(szám1;szám2;...) szám1, szám2...: A statisztikai sokaságot reprezentáló argumentumok, számuk 1 és 30 között lehet. Az argumentumokban pontosvesszővel elválasztott értékek helyett egyetlen tömb vagy tömbhivatkozás is használható. Megjegyzés A SZÓRÁSP az argumentumokat a teljes statisztikai sokaságnak tekinti. Ha az adatok a teljes sokaság mintáját jelentik, akkor a szórást a SZÓRÁS függvénnyel kell kiszámítani. Nagyméretű mintáknál a SZÓRÁS és a SZÓRÁSP megközelítőleg azonos eredmény ad.
A SZÓRÁS függvény az argumentumokat statisztikai sokaság mintájának tekinti. Ha az adatok a teljes sokaságot jelentik, akkor a szórást a SZÓRÁSP függvénnyel kell kiszámolni. A függvény a szórást a „torzítatlan” vagy „n-1” módszerrel számítja ki.
Variancia vagy szó szórásné snégyzet Összeadható sszeadhatók, kivonható kivonhatók Ará Arányosí nyosítható thatók
∑ ( x − x) i =1
n
s2 =
∑ ( x − x) i =1
2
i
n −1
Súlyozott formában:
n
s2 =
Egyszerű formában:
2
n
i
n
s = 2
i
− x )2
i
−1
∑ f (x i =1
i
n
∑f i =1
4
Variancia gyakorlati meghatá meghatározá rozása
Excel fü függvé ggvény VAR(szám1;szám2;...) szám1, szám2...: A statisztikai mintát reprezentáló argumentumok, számuk 1 és 30 között lehet. Megjegyzés
(∑ x )
2
s2 =
∑
( x − x )2 = n −1
∑x
2
−
n −1
n
A VAR függvény az argumentumokat egy statisztikai sokaság mintájának tekinti. Ha az adatok a teljes sokaságot jelentik, akkor a varianciát a VARP függvénnyel kell kiszámítani. A logikai értékeket, például IGAZ vagy HAMIS, valamint a szöveget a függvény figyelmen kívül hagyja. Ha a logikai értékeket és a szöveget is számításba szeretnénk venni, használjuk a VARA munkalapfüggvényt.
Előnye: Csak az x és x négyzetet kell tárolni és összegezni
Excel fü függvé ggvény
Hiba oszlopdiagram (Error (Error Bar)
VARP(szám1;szám2;...) szám1, szám2...: A statisztikai sokaságot reprezentáló argumentumok, számuk 1 és 30 között lehet. Megjegyzés
30
Mean +- 2 SD T_atlag
20
A VARP az argumentumokat a teljes statisztikai sokaságnak tekinti. Ha az adatok a teljes sokaságnak csak mintáját képezik, akkor a varianciát a VAR függvénnyel kell kiszámítani.
10
0
-10
-20 1
2
3
4
5
6
7
8
9
10
11
-32 -32
hónap
Szó Szórások átlagolá tlagolása A csoportok kö közös szó szórása Belső Belső szó szórás Pooled szó szórás
Varianciá Varianciák átlaga tö több mintá mintából
s
2 súly
(n1 − 1) s12 + (n2 − 1) s22 + K + (nk − 1) sk2 = n−k
A SZÓ SZÓRÁSOKAT NEM LEHET ÁTLAGOLNI!
5
n1=n2=n3
Szó Szórások átlagolá tlagolása
ssúly =
(n1 − 1) s12 + ( n2 − 1) s22 + K + ( nk − 1) sk2 n−k
ssúly =
( n1 − 1)( s12 + s22 + s32 ) 3n1 − 3
ssúly =
(n1 − 1)( s12 + s22 + s32 ) 3(n1 − 1)
ssúly =
Négyzetes átlag n
X
q
=
∑x i =1
Súlyozott k
X
q
=
i =1 k
f i x i2
∑ i =1
s Vr = CV = 100 x
fi
Relatí Relatív variá variáció ciós együ együttható ttható s max imuma x Vr (%) =
Variá Variáció ciós együ együttható ttható vagy relatí relatív szó szórás az eredmé eredményt %%-ban fejezzü fejezzük ki, az együ együttható ttható nagysá nagysága a vizsgá vizsgált jelensé jelenség vá változé ltozékonysá konyságával nő, alkalmas elté eltérő jelensé jelenségek szó szórásának összehasonlí sszehasonlítására, figyelembe veszi a vizsgá vizsgált jelensé jelenség szí színvonalá nvonalát, 0 – 10% homogé homogén, 10 – 20% közepesen vá változé ltozékony, 20 – 30% erő erősen vá változé ltozékony, 30% fölött szé szélső lsőségesen ingadozó ingadozó, az átlag nem alkalmas a sokasá sokaság jellemzé jellemzésére.
2 i
n
∑
s12 + s22 + s32 3
n
Leí Leíró statisztika az ExcelExcel-ben Eszkö Eszközök – Adatelemzé Adatelemzés…
s x 100s 100 = n x n
Érté rtéke 00-100% lehet.
6
Szó Szóródási mutató mutatók szá számítása
Kiugró Kiugró érté rtékek
Kukorica (t/ha) Várható érték (számtani átlag) Standard hiba (az átlag szórása) Medián Módusz Szórás Minta varianciája Csúcsosság Ferdeség Tartomány Minimum Maximum Darabszám Konfidenciaszint(95,0%)
5,71 0,43 5,31 #HIÁNYZIK 2,37 5,64 -0,38 0,35 9,12 1,63 10,75 30 0,887
Trimmelt átlag Három szó szórásná snál nagyobb tá távolsá volság eseté esetén gyanú gyanús Q3+1,5IQR, illetve Q1Q1-1,5IQR
Trimmelt vagy ré részá szátlag Egy adathalmaz kö középső pső részé szének átlaga Az adathalmaz felső felső és alsó alsó részé szén adott szá százalé zalékú adatpont elhagyá elhagyásával szá számítjuk ki Leggyakrabban 5 vagy 10%10%-os a trimmelé trimmelés
Excel fü függvé ggvény RÉSZÁTLAG(tömb;százalék) tömb: Az a tömb vagy tartomány, amelynek egy részét átlagolni kell. százalék: A számításban részt nem vevő adatok százalékos aránya. Ha például százalék = 0,2 (20%), akkor a 20 adatpontot tartalmazó halmazból 4 adatpont (20 x 0,2) marad ki a középérték kiszámításánál (2 a halmaz tetején, 2 az alján). Megjegyzés Ha százalék < 0 vagy százalék > 1, akkor a RÉSZÁTLAG eredménye a #SZÁM! hibaérték lesz. A RÉSZÁTLAG az elhagyandó adatpontok számát lefelé kerekíti 2 legközelebbi többszörösére. Ha például százalék = 0,1 (azaz 10%), akkor 30 adatpontnál hármat kellene elhagyni. A szimmetria miatt a RÉSZÁTLAG az adathalmaz tetején és alján egy-egy értéket fog elhagyni.
A szá számtani átlag szó szórása (standard hiba)
Kvartilis ábra (box (box--plot) plot)
Q3
sx =
∑(x − x)
2
2
n (n − 1)
Q Me 2
Q1
( x) ∑ x − ∑n
2
maximum
sx =
=
n (n − 1)
s n
minimum
7
Standard hiba vé véges sokasá sokaság eseté esetén
A korrekciós tényező jele: fpc (finite population correction factor)
A vé véges sokasá sokaság elemszá elemszáma N Visszatevé é s né é lkü ü Visszatev n lk li mintavé mintavétel Minta: n/N>5%
Az számtani átlag standard hibája véges sokaság esetén
s sx = n
N −n N −1
Standard hibá hibák átlagolá tlagolása Ha:
x+y+z p= 3
N −n N −1
fpc =
A relatív gyakoriság standard hibája véges sokaság esetén
sx =
p(1 − p ) n
Négyzetes átlag n
Xq =
∑x i =1
sp =
s +s +s 3 2 y
2 z
2 i
n
Akkor: 2 x
N −n N −1
Súlyozott Xq =
k
∑g x i =1
2 i i
8