Elmé Elmélet
STATISZTIKA 12. Elő Előadá adás
1. 2. 3. 4. 5. 6.
Általá ltalános Viszonyszá Viszonyszámok Centrá Centrális mutató mutatók Szó Szóródási mutató mutatók Indexek Hipoté Hipotézis vizsgá vizsgálatok
Összefoglalá sszefoglalás
Gyakorlat
Elmé Elméleti ké kérdé rdések
1. Viszonyszá Viszonyszámok 2. Leí Leíró statisztika (á (átlagok, szó szóródási mutató mutatók, konfidencia intervallumok) 3. Indexek 4. t-pró próbák 5. Egyté Egytényező nyezős varianciavariancia-analí analízisek
1
Viszonyszá Viszonyszámok feladat Szá Számítsa ki az északszak-alfö alföldi ré régió gió alá alábbi mutató mutatószá számait. Az eredmé eredményeket ké két tizedes pontossá pontossággal a kerekí kerekítési szabá szabályok szerint adja meg. A szá számok utá után mé mérté rtékegysé kegységet NE írjon.
Leí Leíró statisztika feladat Szá Számítsa ki az északszak-alfö alföldi ré régió gió alá alábbi mutató mutatószá számait. Az eredmé eredményeket ké két tizedes pontossá pontossággal a kerekí kerekítési szabá szabályok szerint adja meg. A szá számok utá után mé mérté rtékegysé kegységet NE írjon.
Indexek feladat Szá Számítsa ki az északszak-alfö alföldi ré régió gió alá alábbi mutató mutatószá számait. Az eredmé eredményeket ké két tizedes pontossá pontossággal a kerekí kerekítési szabá szabályok szerint adja meg. A szá számok utá után mé mérté rtékegysé kegységet NE írjon.
Viszonyszá Viszonyszámok ké kérdé rdések 1. 2010. évi forgalom bá bázis viszonyszá viszonyszáma, bázis év 2000. 2. Mennyi volt a forgalom vá változá ltozási ütemé temének éves átlaga? 3. Milyen ará arányt ké képvisel a baná banán az összes forgalombó forgalomból? 4. Szá Számítsa ki a kenyé kenyér és baná banán koordiná koordináció ciós viszonyszá viszonyszámát. Az összehasonlí sszehasonlítás alapja a kenyé kenyér. 5. Hatá Határozza meg a 2010. év tervfeladat viszonyszá viszonyszámát.
Leí Leíró statisztika ké kérdé rdések 1. Az eladott áruk átlagá tlagára 2. Adja össze évenké venként a forgalmi adatokat, és ezekbő ezekből az adatokbó adatokból hatá határozza meg azok szó szórását (minta alapjá alapján) 3. Adja össze évenké venként a forgalmi adatokat, és ezekbő ezekből az adatokbó adatokból hatá határozza meg a variá variáció ciós koefficiens érté rtékét (minta alapjá alapján). 4. Adja össze évenké venként a forgalmi adatokat, és ezekbő ezekből az adatokbó adatokból hatá határozza meg a szá számtani átlag 95%95%-s konfidencia intervallum alsó alsó szé szélét (minta alapjá alapján) 5. Három fű fűnyí nyíró egyenké egyenként 8, 16 és 20 óra alatt vágja le a golfpá golfpálya gyepé gyepét. Együ Együtt kezdve és dolgozva, há hány óra alatt vá vágjá gják le a gyepet?
Indexek ké kérdé rdések 1. Bázis év 2007., tá tárgy év 2008. év. Érté rték index: 2. Árindex tá tárgy idő időszaki 3. Árindex bá bázis idő időszaki 4. Volumen index bá bázis 5. Volumen index tá tárgyidő rgyidőszaki 6. Az eladott áruk átlagá tlagára
2
t-pró próbák feladat Töltse le a kefir.csv adatbá adatbázist. Elemezze az alá alábbi hipoté hipotéziseket. Dönté ntéseit 5%5%-os szignifikancia szint mellett hozza meg. Az eredmé eredményeket kéttizedes pontossá pontossággal, mé mérté rtékegysé kegység nélkü lkül adja meg.
t-pró próbák ké kérdé rdések 1. A Danone kefir átlagos eladá eladási ára 80 Ft. 2. A Danone kefir eladá á si á rának szó elad szórása (minta alapjá alapján): 3. A Muller kefir eladá eladási árának szó szórása (minta alapjá alapján): 4. A Danone és Muller kefir mintá mintán belü belüli szó szórása megegyezik. 5. A Danone és Muller kefir átlagos eladá eladási ára megegyezik. 6. Az elő előző feladatná feladatnál a nullhipoté nullhipotézis téves elveté elvetésének szá számított való valószí színűsége ...%.
t-pró próbák vá válaszok 1. 1. Igen, mert a szá számított FF-érté rték kisebb, mint a kritikus FF-érté rték. 2. Igen, mert a szá számított FF-érté rték nagyobb, mint a kritikus FF-érté rték. 3. Nem, mert a szá számított FF-érté rték kisebb, mint a kritikus FF-érté rték. 4. Nem, mert a szá számított FF-érté rték nagyobb, mint a kritikus FF-érté rték.
t-pró próbák vá válaszok 2. 1. Igen, mert a szá számított első elsőfajú fajú hiba kisebb, mint 5% 2. Igen, mert a szá számított első elsőfajú fajú hiba nagyobb, mint 5%. 3. Nem, mert a szá számított első elsőfajú fajú hiba kisebb, mint 5%. 4. Nem, mert a szá számított első elsőfajú fajú hiba nagyobb, mint 5%.
H0: A baná banán átlagos eladá eladási ára 300 Ft/kg
Számítások
szignifikancia szint=5% n=77 átlag= 298,49 Ft/kg s=46,26 Ft/kg Ha: nem egyenlő egyenlő
t=
X − µ0 298,49 − 300 = = −0,29 σ/ n 46,26 / 77
3
0.4
t-eloszlás (alfa=5%, DF=76)
Excel INVERZ.T fü függvé ggvény
Pró Próbafü bafüggvé ggvény, alfa=0,05; DF=76 1.99
INVERZ.T(alfa; szabadsá szabadságfok)
0.2
alfa = első elsőfajú fajú hiba szignifikancia szint Szabadsá Szabadságfok = nn-1
0.1
p
0.3
-1.99
0.0
INVERZ.T(0,05; 76)=1,99 -4
-2
0
2
Kétoldali szimmetrikus felté feltétel eseté esetén
4
t
t-eloszlás (alfa=5%, DF=76) 0.4
Excel T.ELOSZLÁ T.ELOSZLÁS fü függvé ggvény
-0.29 -1.99
1.99
0.1
p
x = érté rték, ahol a tt-eloszlá eloszlás való valószí színűségét keressü keressük szint szabadsá szabadságfok = nn-1 szé szél = 1 egyoldali, 2 ké kétoldali
0.2
0.3
T.ELOSZLÁ T.ELOSZLÁS(x; szabadsá szabadságfok; szé szél)
0.0
T.ELOSZLÁ T.ELOSZLÁS(1,99; 76; 2)=0,05
-4
-2
t-eloszlás (alfa=5%, DF=76) 1.0
0
2
4
t
Kétoldali szimmetrikus felté feltétel eseté esetén
H0: A szendvics sonka átlagos eladá eladási ára 900 Ft/kg
-0.29
0.4
p
0.6
0.8
n=77 átlag=865,82 Ft/kg szó szórás=84,47 Ft/kg Ha: nem egyenlő egyenlő 1.99
0.2
-1.99
0.0
t= -4
-2
0
2
X − µ0 865,82 − 900 − 34,18 = = = −3,55 9,63 σ/ n 84,47 77
4
t
4
t-eloszlás (alfa=5%, DF=76) 0.4
0.4
t-eloszlás (alfa=5%, DF=76)
Pró Próbafü bafüggvé ggvény, alfa=0,05; DF=76
Pró Próbafü bafüggvé ggvény, alfa=0,05; DF=76 -3.55 -1.99
1.99
p
0.0
0.0
0.1
0.2
0.3 0.2 0.1
p
1.99
0.3
-1.99
-4
-2
0
2
4
-4
-2
0
t
1.0
t-eloszlás (alfa=5%, DF=76)
0.8 0.4
p
0.6
szignifikancia szint=5% n1=n2=7 átlag2005= 291 Ft/kg átlag2010= 374,43 Ft/kg s2005=11,99 Ft/kg s2010= 9,45 Ft/kg
1.99
0.0
0.2
-1.99
-2
0
4
H0: A baná banán átlagos eladá eladási ára megegyezik 2005. és 2010. évben
-3.55
-4
2
t
2
4
Ha: nem egyenlő egyenlő
t
Kétmintá tmintás tt-teszt (szó (szórás azonos) Szá Származhatrmazhat-e a ké két fü független megfigyelé megfigyelés, minta azonos kö középérté rtékű populá populáció cióból? H0: µ1 = µ2 Pró Próbastatisztika: tt-eloszlá eloszlás, DF = n1 + n2 – 2
Kétmintá tmintás tt-teszt (szó (szórás azonos)
t=
sp =
sp
X1 − X 2 (1 / n1 ) + (1 / n2 )
(n1 − 1)s12 + (n2 − 1)s22 n1 + n2 − 2
5
t-eloszlás (alfa=5%, DF=12) 0.4
Kétmintá tmintás tt-teszt (szó (szórás azonos)
-2.18
t=
291 − 374,43 = −14,46 10,79 1 / 7 + 1 / 7
p
= 10,79
Nincs kü különbsé nbség
0.2
7+7−2
0.1
(7 − 1)11,992 + (7 − 1)9,452
0.0
sp =
2.18
0.3
Összevont szó szórás:
-4
-2
0
2
4
t
t-eloszlás (alfa=5%, DF=12) 0.4
Excel ké kétmintá tmintás tt-pró próba egyenlő egyenlő szó szórásné snégyzetekné gyzeteknél
-14.46 -2.18
2.18
0.0
0.1
p
0.2
0.3
Eszkö Eszközök, Adatelemzé Adatelemzés…
-15
-10
-5
0
t
Excel ké kétmintá tmintás tt-pró próba egyenlő egyenlő szó szórásné snégyzetekné gyzeteknél
Excel ké kétmintá tmintás tt-pró próba egyenlő egyenlő szó szórásné snégyzetekné gyzeteknél eredmé eredmény Kétmintás t-próba egyenlő szórásnégyzeteknél
Várható érték Variancia Megfigyelések Súlyozott variancia Feltételezett átlagos eltérés df t érték P(T<=t) egyszélű t kritikus egyszélű P(T<=t) kétszélű t kritikus kétszélű
2005 2010 291 374,4286 143,6667 89,28571 7 7 116,4762 0 12 -14,4621 2,95E-09 1,782288 5,9E-09 2,178813
6
t-pró próbák vá válaszok 3. 1. Igen, mert a szá számított tt-érté rték abszolú abszolút érté rtéke kisebb, mint a kritikus tt-érté rték. 2. Igen, mert a szá számított tt-érté rték abszolú abszolút érté rtéke nagyobb, mint a kritikus tt-érté rték. 3. Nem, mert a szá számított tt-érté rték abszolú abszolút érté rtéke kisebb, mint a kritikus tt-érté rték. 4. Nem, mert a szá számított tt-érté rték abszolú abszolút érté rtéke nagyobb, mint a kritikus tt-érté rték.
VarianciaVariancia-analí analízisek ké kérdé rdések A kefirek má márká rkák szerinti átlagos árai megegyeznek. Az FF-pró próba szá számított érté rtéke. A kritikus Fé rté é k. F rt Szignifiká Szignifikáns differencia érté rtéke.
VarianciaVariancia-analí analízisek feladat Töltse le a kefir.csv adatbá adatbázist. Elemezze az alá alábbi hipoté hipotéziseket. Dönté ntéseit 5%5%-os szignifikancia szint mellett hozza meg. Az eredmé eredményeket kéttizedes pontossá pontossággal, mé mérté rtékegysé kegység nélkü lkül adja meg.
VarianciaVariancia-analí analízisek ké kérdé rdések A Jogobella és Danone kefirek vá várható rható eladá eladási árai ... 1. Megegyeznek, mert az árak kü különbsé nbsége nem haladja meg a szignifiká szignifikáns differencia érté rtékét. 2. Megegyeznek, mert az árak kü különbsé nbsége kisebb, mint a kritikus FF-érté rték. 3. Nem egyeznek meg, mert az árak kü különbsé nbsége jelentő jelentősen nagyobb, mint a szignifiká szignifikáns differencia érté rtéke. 4. Nem egyeznek meg, mert az árak kü különbsé nbsége jelentő jelentősen nagyobb, mint a kritikus tt-érté rték.
Hipoté Hipotézisek
Számítások
H0: A kü különbö nböző kefirek átlagos fogyasztó fogyasztói ára megegyezik.
xMilli = xDanone = xJogobella = xMüller
7
Szignifikancia szint megvá megválasztá lasztása
Adatok
5% H1: A kü különbö nböző kefirek átlagos fogyasztó fogyasztói ára nem egyezik meg.
xMilli ≠ xDanone ≠ xJogobella ≠ xMüller
Modell felá felállí llítása Egyté Egytényező nyezős teljesen vé véletlen elrendezé elrendezés Egyté Egytényező nyezős varianciavariancia-analí analízis
Egyté Egytényező nyezős varianciavariancia-analí analízis
marka Milli Milli Milli Milli Milli Milli Milli Milli Milli Milli Milli Milli
bolt Tesco Tesco Tesco Tesco Tesco Tesco Tesco Tesco Tesco Tesco Tesco Tesco
Muller Muller Muller Muller
CBA CBA CBA CBA
ar 79 82 80 77 73 73 72 76 75 85 82 79 76 74 80 74
Szá Számítás 1. Adatbá Adatbázis rendezé rendezése, szű szűrése Milli 79 82 80 77 73 73 72 76 75 85 82 79 67 75
Danone 70 82 70 75 70 84 84 70 73 78 83 83 81 78
Jogobelle 75 82 92 84 80 74 72 90 85 81 79 81 76 82
Müller 78 89 74 79 76 81 84 84 78 86 80 82 80 75
Eredmé Eredménytá nytáblá blázat 1. ÖSSZESÍTÉS Csoportok Darabszám Összeg Átlag Variancia Milli 120 9298 77,48333 23,22661 Danone 120 9412 78,43333 22,48291 Jogobelle 120 9603 80,025 21,30189 Müller 120 9447 78,725 23,41113
8
Eredmé Eredménytá nytáblá blázat 2. VARIANCIAANALÍZIS Tényezők SS Csoportok között 396,38 Csoporton belül 10760,28 Összesen
11156,67
df
Jelö Jelölések *** ** * . vagy +
MS F p-érték F krit. 132,13 5,844904 0,000632 2,623637 22,61
3 476 479
F-eloszlás eloszlásfüggvénye 2.62
0.4
0.6
0.8
0.6
1.0
F-eloszlás sűrűségfüggvénye
0,1% 1% 5% 10%
0.0
0.0
0.2
0.2
0.4
2.62
0
2
4
6
8
0
5
10
x
15
x
LSDLSD-teszt (legkisebb szignifiká szignifikáns differencia)
0.6
F-eloszlás eloszlásfüggvénye
LSD = t p %
0.4
5.84
2.62
2 MQhiba r
0.2
t5% = 1,965
0.0
LSD = 1,965 0
2
4
6
8
2 * 22,61 = 1,2 120
x
9
Jelö Jelölések pá páronké ronkénti összehasonlí sszehasonlításokná soknál
Páronké ronkénti összehasonlí sszehasonlítás Csoportok Milli Danone Jogobella Müller
Milli
LSD = 1,965
Danone Jogobella Müller 0,95 2,541667 1,241667 1,591667 0,291667 -1,3
2 * 22,61 = 1,2 120
Csoport a
Kezelé Kezelés
Átlagok
Jogobella
80,02
b
Muller
78,73
bc
Danone
78,43
Milli
77,48
c
Lothar Sachs intelme "… amikor megadjuk az eljá eljárásokat és módszereket, el kell kerü kerülni az olyan hipoté hipotézispró zispróbát, amelyikre az adatok megszerzé megszerzése elő előtt nem gondoltunk, amelyikhez csak az adatok áttekinté ttekintése alapjá alapján jutunk… jutunk…".
10