Statisztika, próbák Mérési hiba
Statisztikai függvények
ÁTLAG SZÓRÁS KICSI, NAGY MIN, MAX LIN.ILL LOG.ILL MEREDEKSÉG METSZ T.PROBA TREND NÖV
Statisztikailag fontos értékek Számtani átlag: ŷ=∑iyi /n Medián: a mintaintervallum közepe Módusz: a sűrűség függvény maximumának helye Szórás (standard deviatió, SD): s= {∑i(yi - ŷ)2/(n-1)}½= ={[∑i(yi )2 - (∑iyi)2/n)]/(n-1)}½= ={[n∑i(yi )2 - (∑iyi)2]/n/(n-1)}½ Variancia: V=s2= ∑i(yi - ŷ)2/(n-1) Relatív szórás: 100s/ŷ Középérték szórás (Standard Error {SE}): sŷ =s/n½
1. feladat
1., Számoljuk ki a hiányzó cellák értékét képlettel! 2., Készítsünk grafikont, amely szemlélteti az adott időszakban a kamionok számának alakulását! 3., Szemléltessük a 10 és 12 óra közötti forgalom megoszlását típusonként!
Statisztikai próbák, hipotézisvizsgálat
Valószínűségi változók (mérési adatok, eredmények) eloszlására, egymással való kapcsolatára tett hipotézisek statisztikai vizsgálata. Kiindulásul vett hipotézis: nullhipotézis Ennek megtartásáról vagy elvetéséről statisztikai próbák segítségével döntünk. Statisztikai függvényre alapozzuk, amelynek eloszlása ismert.
Egy (kis) α val.séghez meghatározunk egy számhalmazt, amelybe a stat. függvény értéke α valószínűséggel esik, ha a hipotézis igaz. Elsőfajú hiba: elvetjük a hipotézist, holott igaz. α Másodfajú hiba: Megtartjuk., holott nem igaz.
t-eloszlást különböző szabadsági fokok esetén
Gyakran használt próbák
Egymintás t-próba: várható értékre vonatkozó hipotézis (nem szerepel az Excel-ben) Páros kétmintás t-próba egymintás t-próba Kétmintás t-próba: 2 valószínűségi változó várható értéke megegyezik F-próba: 2 valószínűségi változó szórása megegyezik
Páros t-próba
Azonos számú elemből álló minták várható értékét hasonlítja össze, és azt vizsgálja, hogy a minták várható értékei különböznek-e egymástól. Pl. amikor egy mintacsoportot kétszer vizsgálnak: a kísérlet előtt és után.
2. feladat Két fájdalomcsillapító (A és B) hatását vizsgáljuk 8 betegen, mérve a fájdalom szűnéséig eltelt időt. Van-e szignifikáns különbség a két gyógyszer hatása között? Betegek
A
B
1
3,2
3,8
2
1,6
1
3
5,7
8,4
4
2,8
3,6
5
5,5
5
6
1,2
3,5
7
6,1
7,3
8
2,9
4,8
1. Megközelítés Nullhipotézis: A két minta várható értéke egyenlő.
0,04514 Pszámított<α → elvetjük a hipotézist
2. Megközelítés Eszközök -> Adatelemzés menüpont
|tszámított |> tα A nullhipotézist elvetjük
Kétmintás t-próba Egyenlő szórásnégyzeteknél Abból indul ki, hogy mindkét adathalmaz szórásnégyzete egyenlő, ezért homoszcedasztikus t-próbának is szokták nevezni. Ezt a módszert akkor használhatjuk, ha meg szeretnénk állapítani, hogy két minta várható értéke egyenlő-e.
Kétmintás t-próba s1=s2 esetén H0: m1=m2 α=0,05 x1 − x2 t= 1 1 + n1 n2
n1 + n2 − 2 2 2 (n1 − 1)s1 + (n2 − 1)s2
t α (n1 + n2 − 2) ha t emp ≥ t α (n − 1) akkor H0 hamis Ha t emp < t α (n − 1) akkor H0 igaz
Kétmintás t-próba Nem egyenlő szórásnégyzeteknél Azt feltételezi, hogy két adathalmaz szórásnégyzete nem egyenlő, ezért heteroszcedasztikus t-próbának is szokták nevezni. A t-próbákat akkor használhatjuk, ha meg szeretnénk állapítani, hogy két minta várható értéke egyenlő-e. Ezt a próbát akkor alkalmazzuk, ha a vizsgált csoportok különböznek.
Kétmintás t-próba s1≠s2 esetén H0: m1=m2 α=0,05 x1 − x2 t= s12 s22 + n1 n2
(n1 - 1)tα 1 (n1 - 1) + (n2 − 1)tα 2 (n2 − 1) t α (n1 + n2 − 2) = n1 + n2 − 2 ha t emp ≥ t α (n − 1) akkor H0 hamis Ha t emp < t α (n − 1) akkor H0 igaz
F-próba
Az egyenlő szórásnégyzetek ellenőrzésére
Két csoport teljesítménye azonos átlag esetén is különbözhet a különböző szórás miatt.
Az „F” próba arra ad választ, hogy ez az eltérés szignifikánse. f(x)
s1
s2 x
A vizsgálat menete: (Fisher-Snedecor eljárás)
1. H0: s1=s2 a két minta azonos szórású 2. A próbamutató meghatározása
Femp =
2 s nagyobb 2 s kisebb
3. Szignifikancia szint megállapítása Didaktikai vizsgálatokban szokásos α=0,05
4. Táblázatból Fα/2(m1;m2) kikeresése m1=n1-1 és m2=n2-1 szabadsági fokok
5. Döntés Ha Femp≥ Fα/2(m1,m2) akkor H0: hamis Ha Femp< Fα/2(m1,m2) akkor H0: p valószínűséggel igaz
Feladat Egy kísérleti telepen 2 tápszert próbáltak ki. Vizsgálták az adott időintervallumbeli súlygyarapodást. 1. tápszer
2. tápszer
31
26
34
24
29
28
26
29
32
30
35
29
38
32
34
26
30
31
29
29
32
32
31
28
Vizsgáljuk meg t-próbával, hogy szignifikáns-e az eltérés a 2 szer okozta súlygyarapodás között α=0,05 szinten!
Eldönteni F-próbával, hogy egyenlők-e a szórásnégyzetek? Beszúrás -> Függvény Statisztikai fgv-ek : F.PRÓBA
Pszámított > α Elfogadjuk a nullipotézist
Másik lehetőség: Eszközök -> Adatelemzés Kétmintás F-próba szórásnégyzetre
Fszámított < Fα A nullhipotézist megtartjuk
Kétmintás T-próba egyenlő szórásnégyzeteknél
tszámított > tα Pszámított < α
A nullhipotézist elvetjük
Feladat Egy emlősökben nem lévő steroid hormon adása patkányoknál módosítja-e a mellékvese tömegét? 1., Határozzuk meg a kontroll és a kezelt emlősökben a mellékvese tömegének átlagát és szórását! 2., Döntsük el, hogy szignifikáns-e a szteroid hatása? (kétmintás t-próba)
F-próba a szórásnégyzetek ellenőrzésére
Vigyázat! A nagyobb szórásnégyzetű az első változó! (ez kerül a számlálóba) Kétmintás F-próba a szórásnégyzetre
Ebben az esetben a „Kezelt” Változó 1 csoport! Fszámított < Fα Várható érték 22,20833333 Variancia 16,95471014 A nullhipotézist megtartjuk
Változó 2 17,86666667 14,6952381
Megfigyelések
24
15
df
23
14
F
1,153755389
P(F<=f) egyszélű
F kritikus egyszélű
0,400033257
2,357303686
Kétmintás T-próba
Kiindulási hipotézis:
A mellékvese tömege mindkét esetben azonos. Pszámított < α Elvetjük a nullipotézist
|tszámított |> tα A nullhipotézist elvetjük
Feladat Az alábbi adatok a Daphnia longispina (vízibolhafaj) két rasszát (A és B) reprezentáló 7-7 klón napokban kifejezett átlagos élettartamára vonatkoznak. A
7.2
7.1
9.1
7.2
7.3
7.2
7.5
B
8.8
7.5
7.7
7.6
7.4
6.7
7.2
Vizsgáljuk meg t-próbával, hogy szignifikáns-e az eltérés a 2 rassz élettartama között α=0,05 szinten!
Először T-próba a szórásnégyzetekre!
Kétmintás F-próba a szórásnégyzetre
Fszámított < Fα A nullhipotézist megtartjuk
Változó 1
Változó 2
Várható érték
7,514285714
7,557142857
Variancia
0,504761905
0,40952381
Megfigyelések
7
7
df
6
6
F
1,23255814
P(F<=f) egyszélű
0,403047876
F kritikus egyszélű
4,283862154
Kétmintás t-próba egyenlő szórásnégyzeteknél Nullhipotézis: a két rassz átlagos élettartama megegyezik Kétmintás t-próba egyenlő szórásnégyzeteknél
Változó 1
Változó 2
Várható érték
7.514285714
7.557142857
Variancia
0.504761905
0.40952381
7
7
Megfigyelések Súlyozott variancia Feltételezett átlagos eltérés df t érték
0.457142857 0 12
-0.118585412
P(T<=t) egyszélű
0.453782897
t kritikus egyszélű
1.782286745
P(T<=t) kétszélű
0.907565793
t kritikus kétszélű
2.178812792
|tszámított| < tα Pszámított > α
A nullhipotézist megtartjuk
Varianciaanalízis (ANOVA)
Ha kettőnél több minta várható értékeit kínánjuk összehasonlítani. Nullhipotézis: az adott valószínűségi változó várható értéke mindegyik mintacsoportban egyforma.
Az előző feladatban egy harmadik rassz élettartamát is vizsgáljuk: A
7,2
7,1
9,1
7,2
7,3
7,2
7,5
B
8,8
7,5
7,7
7,6
7,4
6,7
7,2
C 7,3 7 8,9 7,4 7,3 7,5 7,1 Vizsgáljuk meg, hogy van-e eltérés a várható átlagos élettartamok között! Varianciaanalízist alkalmazunk. Eszközök -> Adatelemzés -> Egytényezős varianciaanalízis F < Fkrit. A nullhipotézist megtartjuk
Az előző feladatban a hímek mellett nőstényeket is vizsgáltak. Van-e eltérés bármely csoprt várható élettartama között? Varianciaanalízist végzünk, de itt „Kéttényezős varianciaanalízist ismétlesekkel”.
A
B
C
hím
7,2
8,8
7,3
hím
7,1
7,5
7
hím
9,1
7,7
8,9
hím
7,2
7,6
7,4
hím
7,3
7,4
7,3
hím
7,2
6,7
7,5
hím
7,5
7,2
7,1
nőstény
7,3
7,2
8,8
nőstény
7
7,1
7,5
nőstény
8,9
9,1
7,7
nőstény
7,4
7,2
7,6
nőstény
7,3
7,3
7,4
nőstény
7,5
7,2
6,7
nőstény
7,1
7,5
7,2
Feladat
Egy fiú és egy lány hajának hossznövekedését mérték egy éven keresztül. Fiú (mm)
Lány (mm)
1
2,5
3,1
2
4,4
5,7
3
7,8
8,5
4
9,5
11,3
5
11,9
13,5
6
15
16,2
7
16,6
18,9
8
19,8
20,6
9
23
24,5
10
24,1
27,8
11
27,5
31
12
29,6
32,5
1., Illesszünk egyenest a két függvényre! Adjuk meg a meredekség és az y-tengelymetszet értékét! 2., Számoljuk ki, hogy mennyi lenne a hossznövekedés 18 ill. 24 hónap múlva a két esetben!
m
b
Fiú
2,492657
-0,22727
Lány
2,713986
0,159091