Példa
STATISZTIKA
Egy gazdálkodó k kukorica hibrid termesztése között választhat. Jelöljük a fajtákat A, B, C, D-vel. Döntsük el, hogy a hibridek termesztése esetén azonos terméseredményre számíthatunk-e.
6. Előadás Variancia-analízis Lineáris modellek
Elmélet A magyarázat a függő változó teljes heterogenitásának két részre bontását jelenti. A teljes heterogenitás egyik része az, amelynek „okai” a független változók,
Sir Ronald Aylmer Fisher 1890-1962
Lineáris modell
yij = µ + αi + eij
A másik heterogenitás-rész pedig az, amelynek „okait” az egyéb, általunk nem vizsgált tényezők tartalmazzák. Ez utóbbit sokszor a véletlen hatásaként, hibaként is emlegetik. Ez valójában a maradék hatás.
A variancia-analízis alkalmazásának feltételei A maradék független a kezelés és blokk hatástól valamint a függő változótól (véletlen mintavételezés, kísérleti elrendezés)
ahol: yij
a függő változó értéke (termés t/ha)
A maradék (hiba) normális eloszlású, nulla várható értékű sokaság
µ αi eij
főátlaga, fix hatás (t/ha) fix hatás, oka a független változó (t/ha) hiba, vagy maradék (t/ha)
A maradékok szórásai a kezeléskombinációk celláin belül egyformák (homoszkedasztikus)
1
Alapfogalmak 1. Faktor: a vizsgálatba bevont független változókat, pl. különböző kezeléseket, tényezőket. Faktor szint: A kezelések szintjei, pl. műtrágyaadagok. Kvalitatív és kvantitatív faktorok: Ha a faktorszintek nem numerikusak vagy intervallum skálájúak, akkor kvalitatív, ellenkező esetben kvantitatív faktorokról beszélünk.
Alapfogalmak 3. Egy-szempontos variancia-analízis: Varianciaanalízis, ahol csak egy faktor van. Több-szempontos variancia-analízis: Varianciaanalízis, ahol kettő vagy több faktor van. Egy-változós variancia-analízis: ANOVA technika, amely egy függő változót használ. Több-változós variancia-analízis: MANOVA technika, amely kettő vagy több függő változót használ.
Jelölések n: az adatok száma k: csoportok száma r: ismétlések száma
Alapfogalmak 2. Kezelések (cellák): Egyfaktoros esetekben a kezelések megfelelnek a faktorok szintjeinek, többfaktoros esetben a figyelembe vett faktorok szintjeiből előálló kombinációk a kezelések. Pl. amikor a 2 faktor műtrágyaadagok és öntözési módok, akkor a kezelések a (műtrágyaadagok, öntözési módok) összes lehetséges kombinációjából áll.
Egytényezős variancia-analízis Segítségével egy tényező hatását lehet vizsgálni a függő változó mennyiségi alakulására. A tényező, faktor valamilyen csoportképző ismérvvel rendelkezik, a függő változó pedig legtöbbször skála típusú adat. Vegyes kapcsolat elemzése
H0 A nullhipotézis jelentése, hogy a kezelés átlagok egyenlők, nincs közöttük különbség. Ez a technika a kétmintás t-teszt általánosítása, kiterjesztése több mintára.
Csoport átlag:
2
Variancia-analízis lépései
1. A modell felállítása
1. A variancia-analízis modell felállítása. 2. Szignifikancia-szint megválasztása 3. A variancia-analízis kiszámítása, az Fpróba elvégzése. 4. A modell érvényességének ellenőrzése.
A modellben a mérési, megfigyelési értékeket összegként képzeljük el. Kísérleti elrendezésnek megfelelő modellalkotás
5. Amennyiben az F-próba szignifikáns, középértékek többszörös összehasonlítása.
Lineáris modell
yij = µ + αi + eij
Példa Egy gazdálkodó k kukorica hibrid termesztése között választhat. Jelöljük a hibrideket A, B, C, Dvel. Döntsük el, hogy a hibridek termesztése esetén azonos terméseredményre számíthatunk-e.
ahol: yij
a függő változó értéke
µ αi eij
főátlag, fix hatás fix hatás, oka a független változó, faktor hiba, vagy maradék
2. Szignifikancia-szint
megválasztása
3. A variancia-analízis kiszámítása
Leggyakrabban 0,05 azaz 5% Lehet: 0,1; 1; 5 és 10% Elméletileg bármilyen értéket választhatunk, ha szakmailag meg tudjuk indokolni.
3
Eredménytáblázat (Excel)
Eltérés négyzetösszegek (SSö) Összes: alapadatok eltérés négyzetösszege A
B
C
D
9,3
5,4
4,5
3,5
7,2
7,1
2,9
0,9
8,2
5,9
5,0
2,5
Főátlag: 5,2 t/ha Eltérés- négyzetösszeg: 68,44
Eltérés négyzetösszegek (SScsk)
Eltérés négyzetösszegek (SS)
Csoportok között A
B
C
D
8,2
6,1
4,1
2,3
8,2
6,1
4,1
2,3
8,2
6,1
4,1
2,3
Főátlag: 5,2 t/ha
Csoporton belül = Összesen – Csoportok között Csoporton belül = 68,44 – 58,86 = 9,58 Általunk nem vizsgált, egyéb hatások összege a véletlen.
Eltérés- négyzetösszeg: 58,86
Szabadságfokok (df) Csoportok között: k-1
Varianciák Az eltérés négyzetösszegek osztva a szabadságfokokkal.
Csoporton belül: n-k SScsk/3 Összes: n-1
SScsb/8 SSössz/11
4
F-próba
Mi annak a valószínűsége? Hogy véletlenül 16,38 F-értéknél nagyobbat kapunk egy 3, 8 szabadságfokú F-eloszlás esetén.
P=0,00089
5
5. Az F-próba szignifikáns
Post hoc analízisek Középérték összehasonlító tesztek
Amennyiben az analízis az átlagok közötti egyenlőséget nem igazolja, szükséges az átlagok közötti különbségek kimutatása. A variancia-analízist kiegészítő középérték összehasonlító teszteknek kétféle típusa létezik: előzetes, un. a priori kontrasztok és az analízis után elvégezhető, un. post hoc analízisek
Post hoc analízisek A csoportok szórása megegyezik LSD Tukey Bonferroni Scheffe Dunett Student-Newman-Keuls Duncan
LSD-teszt (legkisebb szignifikáns differencia) Alkalmazhatóság feltételei: 1. A csoportok szórása egyenlő 2. Véletlenszerűen kiválasztott két csoport összehasonlítására jó
Hipotézisek
Példa
H0: A különböző kefirek átlagos fogyasztói ára megegyezik.
6
Szignifikancia szint megválasztása
Adatok
5% H1: A különböző kefirek átlagos fogyasztói ára nem egyezik meg.
Modell felállítása
Számítás 1. Adatbázis rendezése, szűrése
Egytényezős teljesen véletlen elrendezés Egytényezős variancia-analízis
Egytényezős variancia-analízis
Eredménytáblázat 1.
7
Eredménytáblázat 2.
LSD-teszt (legkisebb szignifikáns differencia)
Páronkénti összehasonlítás
8
Jelölések *** ** * . vagy +
0,1% 1% 5% 10%
9