TECHNICKÁ UNIVERZITA V LIBERCI Ekonomická fakulta
Semestrální práce
Statistický rozbor dat z dotazníkového šetření Analýza výsledků dotazníkového šetření - fakultní dotazník
Vypracovaly: Klára Habrová, Jana Vitvarová Kateřina Doulová, Martina Netíková Gabriela Pecháčková, Lenka Kulhánková
Počet stran:
10
Datum odevzdání:
11. 5. 2016
Úvod V rámci této práce bude provedena analýza výsledků dotazníkového šetření, ke zpracování údajů bude použit program Statgraphics Centurion XVII. Všechny hypotézy v této semestrální práci budou testovány na hladině významnosti 5 %. Jednotlivé kapitoly práce zodpovídají následující otázky: 1) Má rovnoměrné rozdělení barva auta u vozů s výkonem vyšším než 70 kW? 2) Otestujte, zdali je u naftových modelů skutečná spotřeba vyšší než spotřeba udávaná výrobcem. 3) Navštěvují celkově servis častěji muži, nebo ženy? Otestujte příslušnou hypotézu.
2
1. Má rovnoměrné rozdělení barva auta u vozů s výkonem vyšším než 70 kW? Ke zjištění rovnoměrného rozdělení barev aut u vozů s výkonem vyšším než 70 kW byl využit neparametrický test
test dobré shody.
Pomocí funkce „Sort data“ byla vybrána z celkového počtu aut ta, která mají výkon vyšší než 70 kW. Celkový počet aut se tedy snížil z 256 jednotek na pouhých 153. Následující histogram rozdělení četností shrnuje počty jednotlivých barev aut.
Obr. 1: Rozdělení barev aut Zdroj: vlastní zpracování
Hypotéza Nulová hypotéza vyjadřuje předpoklad rovnoměrného rozdělení četností. Alternativní hypotéza tento předpoklad vyučuje. H0: πi = π0,i
i = 1, 2, …, k
Hi: non H0 Testové kritérium Testovým kritériem je taková statistika, která má při platnosti nulové hypotézy známé pravděpodobnostní rozdělení. G= 3
Kritický obor Kritický obor zahrnuje takové hodnoty, které jsou při platnosti nulové hypotézy natolik extrémní, že jejich pravděpodobnost výskytu je velice malá. Je to tedy oblast hodnot, které svědčí pro přijetí hypotézy alternativní. W≡ W≡ W≡ Do kritického oboru tedy spadají hodnoty, které jsou větší nebo rovny hodnotě 11,07. Výpočet testového kritéria Následující tabulka shrnuje výpočty potřebné ke zjištění hodnoty testového kritéria. Tabulka 1: Výpočty
xi
ni
ni'
π 0,i
(ni-ni')2
Bílá
58
25,5
1/6
1056,25
Černá
37
25,5
1/6
132,25
Červená 17
25,5
1/6
72,25
Modrá
10
25,5
1/6
240,25
Stříbrná 24
25,5
1/6
2,25
Zelená
7
25,5
1/6
342,25
∑
153
153
1
1845,5
Zdroj: vlastní zpracování
Podmínka na požadovaný rozsah výběru: n π0,i > 5 pro i = 1, 2, …, k G=
72,37255
Závěr testu G є W → H0 zamítáme, přijímáme H1 Na hladině významnosti 5 % zamítáme hypotézu o rovnoměrnosti rozdělení barev aut u vozů s výkonem vyšším než 70kW.
4
2. Otestujte, zdali je u naftových modelů skutečná spotřeba vyšší než spotřeba udávaná výrobcem Pro otestování této hypotézy bylo nezbytné nejprve vybrat pouze naftové modely ze základního souboru naftových a benzinových paliv. Na základě těchto hodnot a příslušných hodnot skutečné spotřeby a spotřeby udávané výrobcem bylo možné stanovit hypotézu. Hypotéza Nyní byla formulována hypotéza testu shody středních hodnot dvou normálních rozdělení. Hladina významnosti je stanovena na 5%. µ1
střední hodnota udávané spotřeby
µ2
střední hodnota skutečné spotřeby
n1
rozsah souboru udávané spotřeby
n2
rozsah souboru skutečné spotřeby
Testové kritérium Při volbě testového kritéria je nezbytné ověřit shodu rozptylů. a) Formulace hypotéz
b) Testové kritérium Testové kritérium je vhodná statistika, která má při platnosti H0 známé pravděpodobnostní rozdělení.
c) Kritický obor Kritický obor je tvořen množinou hodnot testového kritéria, které jsou při platnosti H0 tak extrémní, že pravděpodobnost jejich výskytu je velmi malá. n1 = 113 n2 = 113
5
d) Výpočet testového kritéria
e) Závěr testu Hodnota testového kritéria splňuje podmínku kritického oboru, a tudíž zamítáme nulovou hypotézu a přijímáme alternativní. SGP: P-value = 0,016 ˂ 0,05 Na hladině významnosti 5 % bylo prokázáno, že rozptyly se nerovnají. V dalších výpočtech tudíž pracujeme s předpokladem neshody rozptylů.
Kritický obor
Výpočet testového kritéria
Závěr testu Hodnota testového kritéria nesplňuje podmínku kritického oboru, a tudíž nezamítáme nulovou hypotézu a nepřijímáme alternativní. 6
t∉ W SGP: P-Value= 0,428919 > 0,05 Na hladině významnosti 5 % jsme neprokázaly, že skutečná hodnota spotřeby je vyšší než hodnota udávaná výrobcem.
7
3. Navštěvují celkově servis častěji muži, nebo ženy? Otestujte příslušnou hypotézu Nejprve bylo nutné stanovit počet žen a počet mužů ve zkoumaném souboru návštěvníků autoservisu. Tyto údaje byly zjištěny v programu Statgraphics za pomocí tabulky rozdělení četností slovní proměnné. Celkem je v souboru návštěvníků servisu 256 osob, z nichž je 142 mužů a 114 žen. Toto rozložení pohlaví zákazníků je znázorněno na obrázku č. 2.
Kolacovy graf navstevnosti autoservisu dle pohlavi
Pohlavi M Z
114 (44,53%) 142 (55,47%)
Obr. 2: Koláčový graf návštěvnosti autoservisu dle pohlaví Zdroj: Vlastní zpracování
Pomocí těchto četností je určen podíl mužů a žen na celkovém počtu návštěvníků autoservisu:
podíl mužů p1:
podíl žen p2:
8
Hypotéza Následující krok spočívá ve formulování hypotézy testu parametru π alternativního rozdělení v případě velkých výběrů. Určí se H0 a H1. Hladina významnosti je stanovena na 5 %. H0: π = 0,5 H1: π >0,5 Jelikož se jedná o dichotomickou proměnnou lze předpokládat, že muži mají stejné zastoupení v základním souboru jako ženy. Hodnota π0 tedy odpovídá 0,5. Testové kritérium Testové kritérium je vhodná statistika, která má při platnosti H0 známé pravděpodobnostní rozdělení.
Kritický obor Kritický obor je tvořen množinou hodnot testového kritéria, které jsou při platnosti H0 tak extrémní, že pravděpodobnost jejich výskytu je velmi malá.
Výpočet testového kritéria Pro výpočet testového kritéria byl použit podíl mužů na celkovém počtu návštěvníků servisu p1. Hodnota π0 odpovídá 0,5, jak již bylo zmíněno výše.
Závěr testu Hodnota testového kritéria splňuje podmínku kritického oboru, a tudíž zamítáme nulovou hypotézu a přijímáme alternativní. íá
í á
9
Kontrola v programu Statgraphics: V programu lze provést hypotézu pro binomické rozdělení na hladině významnosti 5 %, z čehož vychází hodnota P - Value = 0,0457534. Jelikož je tato hodnota menší než α = 0,05 zamítáme nulovou hypotézu a přijímáme hypotézu alternativní. Na hladině významnosti 5 % bylo prokázáno, že muži navštěvují servis stejně často jako ženy. V případě potřeby lze snížit hladinu významnosti, kde by se daná nulová hypotéza již zamítla.
10