Vysoká škola bá ská – Technická univerzita Ostrava Institut geoinformatiky
Analýza dojížd ní z dotazníkového šet ení v MSK Semestrální projekt
18.1.2007
GN 262
Barbora Hejlková
1
OBSAH OBSAH..................................................................................................................................2 ZADÁNÍ ................................................................................................................................3 Požadované metody p i zpracování projektu: ......................................................................3 ANALYZOVANÁ DATA .....................................................................................................4 VYPRACOVÁNÍ...................................................................................................................5 Explora ní analýza .............................................................................................................5 1. Doba dojížd ní........................................................................................................5 2. Ochota dojížd t .......................................................................................................5 3. Velikost obce ..........................................................................................................6 4. Dosažené vzd lání...................................................................................................6 OCHOTA DOJÍŽD T UR ITOU DOBU ..........................................................................7 1. OCHOTA DOJÍŽD T x VÉKOVÉ SKUPINY .......................................................7 2 – test..........................................................................................................................7 2. OCHOTA DOJÍŽD T x VZD LÁNÍ .....................................................................8 2 – test..........................................................................................................................9 3. OCHOTA DOJÍŽD T x VELIKOST OBCE ........................................................10 2 – test........................................................................................................................11 DOBA DOJÍŽD NÍ .........................................................................................................13 1. DOBA DOJÍŽD NÍ x V KOVÉ SKUPINY ........................................................13 2 – test........................................................................................................................13 2. DOBA DOJÍŽD NÍ x VZD LÁNÍ ......................................................................14 2 – test........................................................................................................................15 3. DOBA DOJÍŽD NÍ x VELIKOST OBCE............................................................16 2 – test........................................................................................................................17 ZÁV R ................................................................................................................................19
2
ZADÁNÍ Zpracujte reálný vícerozm rný statistický soubor (minimáln 30 položek) s využitím libovolného statistického software (Statgraphics, JMP-IN, ...). Vyhodnocení prove te formou referátu, v n mž tená e (laika v oblasti statistiky) seznámíte se získanými výsledky.
Požadované metody p i zpracování projektu: 1. explora ní analýza dat (v etn ov ení normality) 2. statistická indukce
3
ANALYZOVANÁ DATA Data jsou získána z dotazníkového šet ení, které bylo ukon eno 31.8.2006 a spadalo pod projekt s názvem "Zm ny na trhu práce a perspektivy vzd lanosti v eské republice„.V následujících ástech jsou zpracovávány údaje z Moravskoslezského kraje, za který odpovídalo 610 respondent a jedná se analýzu odpov dí na otázky týkající se dopravy do zam stnání i škol. Výsledkem je zjišt ní závislosti doby dojížd ní a ochoty dojížd t danou dobu na v ku, vzd lání a velikosti obce. Dotazovaní byli ve v ku 25 let a více, kte í jíž pracují nebo si b hem následujících pár m síc cht jí najít práci. Byli rozd leni do dvou v kových kategorií s p ibližn stejným po etním zastoupením. (mén než 36 let a 36 let a víc). S ohledem na velký rozsah analyzovaných dat je zde uvedena jen ukázka zpracovávaných dat. Tabulka obsahuje následující atributy: ID – identifikátor respondenta DOBA_CEST – Doba kterou stráví p i cest do práce 1 - do p l hodiny 2 - p l až hodinu 3 - víc než hodinu OCHOTA_CEST – Doba, kterou jsou ochotni strávit na cest do práce 1 - do p l hodiny 2 - p l až hodinu 3 - víc než hodinu V KOVÉ SKUPINY – Vzd lání 1 - do 36-ti let 2 - 36 let a víc VZDELANI – Vzd lání 1 - bez maturity 2 - s maturitou 3 - s VŠ VEL_OBCE – Velikost obce 2 - mén než 2.000 ob.. 3 - 2.001 až 5.000 ob. 4 - 5.001 až 10.000 ob. 5 - 10.001 až 50.000 ob. 6 - 50.001 a více ob. Ukázka dat: ID 445 1416 1423 2288 1419 2291 1421 1417 1418 2293
DOBA_DOJIZ 1 1 1 1 1 1 1 1 1 1
OCHOTA_DOJ 1 1 1 1 1 1 1 1 1 1
VEL_OBCE 6 5 5 5 5 5 5 5 5 5
VZDELANI 2 1 2 1 2 1 1 3 1 2
VEK_SK 2 2 1 1 2 2 2 2 1 1
4
VYPRACOVÁNÍ Explora ní analýza 1. Doba dojížd ní Vzhledem k následnému zpracování byly p vodní 4 asové kategorie slou eny na t i, a to z d vodu malého po tu respondent spadajících do poslední kategorie – doba cestování delší než hodina a p l. Tato kategorie byla slou ena s kategorií t eti – doba cestování v rozmezí hodiny až hodiny a p l Z uvedeného výse ového grafu je patrné procentuelní zastoupení jednotlivých asových kategorií, nejvíce respondent stráví p i cest do práce í zam stnání maximáln p l hodiny – jedná se o 70,3% dotazovaných, podstatn mén jich pak dojíždí v rozmezí p l až hodiny jedna se o necelých 25%. Nejmén asu na cest pak stráví t etí skupina a to pouhých 5.12% obyvatel MSK.
2. Ochota dojížd t Stejn jako v p edchozím p ípad i zde byl snížen po et kategorií ze 4 na t i, a to ze stejného d vodu jako u otázky týkající se doby dojížd ní. Na tomto výse ovém grafu je patrné, že lidé jsou ochotni dojížd t delší dobu – konkrétn o p l hodiny, než ve skute nosti dojížd jí. Je zde proto nejvíce zastoupena kategorie druhá – více než 60% respondent . Maximální dobu strávenou p i cest do školy i zam stnání – 30 minut je ochotno p ibližn 27% a více než hodinu by mohlo dojížd t necelých 12.5% dotazovaných.
5
3. Velikost obce Velikost obcí, ve kterých respondenti bydlí byla rozd lena do 6 kategorií, z uvedeného výse ového grafu je vid t minimální procentuální zastoupení první kategorie – obce s maximálním po tem obyvatel do 1000, toto by p i následném testování zp sobilo problém, proto byly první dv kategorie spojené do jediné, a to obce s maximálním po tem 2 tisíce obyvatel. Nejvíce dotazovaných však bydlí v obcích v tších, jedná se o poslední dv kategorie – obce s 10 tisíci až 50 tisíci obyvateli a obce nad 50 tisíc obyvatel, tyto dv skupiny mají p ibližn stejné procentuální zastoupení 30%, p i emž poslední uvedená kategorie je ješt o necelých 5% vyšší. P ibližn stejn jsou také zastoupeny první dv kategorie – tedy do 2 tisíc obyvatel a obce s po tem obyvatel v rozmezí 2 až 5 tisíc – kolem 15% dotazovaných.
4. Dosažené vzd lání Vzd lání respondent bylo rozd leno do t í skupin a z uvedeného výse ového grafu je z ejmé p ibližn vyrovnané zastoupení daných kategorií, pouze poslední kategorie – vysokoškolsky vzd laných respondent bylo o p ibližn 10% mén než zbývajících dvou skupin – s maturitou a bez maturity.
6
OCHOTA DOJÍŽD T UR ITOU DOBU 1. OCHOTA DOJÍŽD T x V KOVÉ SKUPINY V této analýze šlo o ur ení toho, zda existuje závislost mezi dobou, kterou jsou respondenti ochotni strávit na cest do školy i zam stnání a jejich v kem. Po et odpov dí: 598 Níže je uvedená kontingen ní tabulka a v ní dané etnosti osob v závislosti doby dojížd ní, kterou jsou respondenti ochotni strávit na cest na v kových kategorií, do kterých tito dotazovaní spadají.
do p l hodiny
p l až hodinu Doba dojížd ní více než hodinu
Celkem
V kové kategorie <36 let >36 let 65 99 10.87% 16.56% 39.63% 60.37% 75.97 88.03 172 188 28.76% 31.44% 47.78% 52.22% 166.76 193.24 40 34 6.69% 5.69% 54.05% 45.95% 34.28 39.72 277 321 46.32% 53.68%
Celkem 164 27.42%
360 60.20%
74 12.37%
598 100.00%
Tabulka obsahuje: • Pozorované etnosti • Procentuální zastoupení v rámci celé tabulky • Procentuální zastoupení v rámci ádku • O ekávané etnosti 2
– test Chi-Square 5.04
Df 2
P-Value 0.0806
2 Pomocí – testu bylo provedeno testování hypotézy, zda uvedené dva jevy jsou nebo nejsou na sob závislé.
• •
H0 - jevy jsou na sob nezávislé HA - jevy jsou závislé
Na základ uvedené hodnoty P-Value ,v tabulce výše (0.0806), která je v tší než 0.05 nezamítáme nulovou hypotézu, tzn. že s 95% jistotou m žeme tvrdit, že doba, kterou jsou dotazovaní ochotni strávit p i dojížd ní nezávisí na tom, zda se jedná o mladší nebo starší ob any. 7
Na níže uvedených grafech je znázorn n sloupcový a mozaikový graf daných jev .
2. OCHOTA DOJÍŽD T x VZD LÁNÍ V této analýze šlo o zjišt ní toho, zda existuje závislost mezi dobou, kterou jsou respondenti ochotni strávit na cest do školy i zam stnání a tentokrát jejich vzd láním. Po et odpov dí: 606 Níže je op t uvedena kontingen ní tabulka a v ní dané etnosti osob v závislosti doby dojížd ní, kterou jsou respondenti ochotni strávit na cest a jejich nejvyšším dosaženým vzd láním.
8
bez maturity 69 11.39% 42.07% 60.89 130 21.45% 35.42% 136.26 26 4.29% 34.67% 27.85 225 37.13%
do p l hodiny
p l až hodinu Ochota dojížd t více než hodinu
Celkem
Vzd lání s maturitou 59 9.74% 35.98% 59.81 138 22.77% 37.60% 133.84 24 3.96% 32.00% 27.35 221 36.47%
s VŠ 36 5.94% 21.95% 43.3 99 16.34% 26.98% 96.9 25 4.13% 33.33% 19.8 160 26.40%
Celkem 164 27.06%
367 60.56%
75 12.38%
606 100.00%
Tabulka obsahuje: • Pozorované etnosti • Procentuální zastoupení v rámci celé tabulky • Procentuální zastoupení v rámci ádku • O ekávané etnosti 2
– test Chi-Square 4.68
Df 4
P-Value 0.3215
2 Pomocí – testu bylo provedeno testování hypotézy, zda uvedené dva jevy jsou nebo nejsou na sob závislé.
• •
H0 - jevy jsou na sob nezávislé HA - jevy jsou závislé
Na základ výše uvedené hodnoty P-Value (0.3215), která je v tší než 0.05, nezamítáme nulovou hypotézu, tzn. že s 95% jistotou m žeme tvrdit, že doba, kterou jsou dotazovaní ochotni strávit p i dojížd ní nezávisí na tom jaké mají dosažené vzd lání. Na níže uvedených grafech je znázorn n sloupcový a mozaikový graf daných jev .
9
3. OCHOTA DOJÍŽD T x VELIKOST OBCE V této analýze šlo také o prokázání, zda existuje závislost mezi dobou, kterou jsou respondenti ochotni strávit na cest do školy i zam stnání ale nyní v závislosti na velikosti obce, ve které žijí. Po et odpov dí: 610 Níže je op t uvedena kontingen ní tabulka a v ní dané etnosti osob v závislosti doby dojížd ní, kterou jsou respondenti ochotni strávit na cest a velikosti obce, ve které žijí.
10
do p l hodiny
Ochota dojížd t
mén než 2.000 ob
p l až hodinu
více než hodinu
Celkem
2.001 až 5.000 ob
Velikost obce
5.001 až 10.000 ob.
10.001 až 50.000 ob.
50.001 a více ob.
Celkem
24 3.93% 14.46% 28.57
17 2.79% 0.24% 25.58
4 0.66% 2.41% 4.63
68 11.15% 40.96% 49.80
53 166 8.69% 27.21% 31.93% 57.42
65 10.66% 17.66% 63.34
69 11.31% 18.75% 56.71
12 1.97% 3.26% 10.26
84 13.77% 22.83% 110.4
138 368 22.62% 60.33% 37.50% 127.29
16 2.62% 21.05% 13.08 105 17.21%
8 1.31% 10.53% 11.71 94 15.41%
1 0.16% 1.32% 2.12 17 2.79%
31 5.08% 40.79% 22.8 183 30.00%
20 76 3.28% 12.46% 26.32% 26.29 211 610 34.59% 100.00%
Tabulka obsahuje: • Pozorované etnosti • Procentuální zastoupení v rámci celé tabulky • Procentuální zastoupení v rámci ádku • O ekávané etnosti 2
– test Chi-Square 27.78
Df 8
P-Value 0.0005
2 Pomocí – testu bylo provedeno testování hypotézy, zda uvedené dva jevy jsou nebo nejsou na sob závislé.
• •
H0 - jevy jsou na sob nezávislé HA - jevy jsou závislé
Na základ uvedené hodnoty P-Value (0.0005), která je menší než 0.05, p ijímáme alternativní hypotézu, tzn. že s 95% jistotou m žeme tvrdit, že doba, kterou jsou dotazovaní ochotni strávit p i dojížd ní závisí na tom jak velká je obec, ve které dotazovaní bydli. Je však nutné upozornit na to, že n které o ekávané etnosti v tabulce jsou menší než 5, což mohlo ovlivnit celkový výsledek testu. Na níže uvedených grafech je znázorn n sloupcový a mozaikový graf daných jev .
11
12
DOBA DOJÍŽD NÍ Stejné testování jako výše uvedené, bylo provedeno s daty týkající se skute né doby, kterou dotazovaní stráví p i dojížd ní.
1. DOBA DOJÍŽD NÍ x V KOVÉ SKUPINY V této analýze šlo o ur ení, zda existuje závislost mezi dobou, kterou respondenti stráví na cest do školy i zam stnání a jejich v kem. Po et odpov dí: 594 Níže je uvedená kontingen ní tabulka a v ní dané etnosti osob v závislosti skute né doby dojížd ní a v kových kategorií, do kterých tito dotazovaní spadají.
do p l hodiny
p l až hodinu Doba dojížd ní více než hodinu
Celkem
V kové kategorie <36 let >36 let 186 233 31.31% 39.23% 44.39% 55.61% 193.98 225.02 73 72 12.29% 12.12% 50.34% 49.66% 67.13 77.87 16 14 2.69% 2.36% 53.33% 46.67% 16.11 13.89 275 319 46.30% 53.70%
Celkem 419 70.54%
145 24.41%
30 5.05%
594 100.00%
Tabulka obsahuje: • Pozorované etnosti • Procentuální zastoupení v rámci celé tabulky • Procentuální zastoupení v rámci ádku • O ekávané etnosti 2
– test Chi-Square 2.16
Df 2
P-Value 0.3388
2 Pomocí – testu bylo provedeno testování hypotézy, zda uvedené dva jevy jsou nebo nejsou na sob závislé.
• •
H0 - jevy jsou na sob nezávislé HA - jevy jsou závislé
Z uvedené hodnoty P-Value v tabulce výše (0.3388), která je v tší než 0.05 nezamítáme nulovou hypotézu, tzn. že s 95% jistotou m žeme tvrdit, že doba, jakou dotazovaní dojížd jí, nezávisí na tom, zda se jedná o mladší nebo starší ob any.
13
Na níže uvedených grafech je znázorn n sloupcový a mozaikový graf daných jev .
2. DOBA DOJÍŽD NÍ x VZD LÁNÍ V této analýze šlo rovn ž o zjišt ní, zda existuje závislost mezi dobou, kterou respondenti stráví na cest do školy i zam stnání a tentokrát jejich vzd láním. Po et odpov dí: 602 Níže je op t uvedena kontingen ní tabulka a v ní dané etnosti osob v závislosti skute né doby dojížd ní a jejich nejvyšším dosaženým vzd láním.
14
do p l hodiny
p l až hodinu Ochota dojížd t více než hodinu
Celkem
bez maturity 168 27.91% 29.53% 157.02 44 7.31% 29.53% 55.44 12 1.99% 38.71% 11.53 224 37.21%
Vzd lání s maturitou 156 25.91% 34.23% 154.22 51 8.47% 34.23% 54.45 13 2.16% 41.94% 11.33 220 36.54%
s VŠ
Celkem
98 422 16.28% 24.75% 23.22% 110.76 54 149 8.97% 60.56% 36.24% 39.11 6 31 1.00% 5.15% 19.35% 8.14 158 602 2625.00% 100.00%
Tabulka obsahuje: • Pozorované etnosti • Procentuální zastoupení v rámci celé tabulky • Procentuální zastoupení v rámci ádku • O ekávané etnosti 2
– test Chi-Square 11.34
Df 4
P-Value 0.023
2 Pomocí – testu bylo provedeno testování hypotézy, zda uvedené dva jevy jsou nebo nejsou na sob závislé.
• •
H0 - jevy jsou na sob nezávislé HA - jevy jsou závislé
Na základ uvedené hodnoty P-Value (0.023), která je menší než 0.05, p ijímáme alternativní hypotézu, tzn. že s 95% jistotou m žeme tvrdit, že skute ná doba cestování závisí na tom, jaké mají respondenti dosažené vzd lání. Na níže uvedených grafech je znázorn n sloupcový a mozaikový graf daných jev .
.
15
3. DOBA DOJÍŽD NÍ x VELIKOST OBCE V této analýze šlo také o prokázání, zda existuje závislost mezi dobou, kterou respondenti skute n stráví na cest do školy i zam stnání ale nyní v závislosti na velikosti obce, ve které žijí. Po et odpov dí: 606 Níže je op t uvedena kontingen ní tabulka a v ní dané etnosti osob v závislosti skute né doby dojížd ní a velikosti obce, ve které žijí.
16
do p l hodiny
Ochota dojížd t
mén než 2.000 ob
p l až hodinu
více než hodinu
Celkem
2.001 až 5.000 ob
Velikost obce
5.001 až 10.000 ob.
10.001 až 50.000 ob.
50.001 a více ob.
Celkem
80 13.20% 18.78% 73.81
62 10.23% 14.55% 65.38
8 1.32% 1.88% 11.95
127 20.96% 29.81% 127.24
149 24.59% 34.98% 147.62
426 70.30%
23 3.80% 15.44% 25.82
25 4.13% 16.78% 22.87
9 1.49% 6.04% 4.18
42 6.93% 28.19% 44.5
50 8.25% 33.56% 51.63
149 24.59%
2 0.33% 6.45% 5.37 105 17.33%
6 0.99% 19.35% 4.76 93 15.35%
0 0.00% 0.00% 0.87 17 2.81%
12 1.98% 38.71% 9.26 181 29.87%
11 31 1.82% 5.12% 35.48% 10.74 210 606 34.65% 100.00%
Tabulka obsahuje: • Pozorované etnosti • Procentuální zastoupení v rámci celé tabulky • Procentuální zastoupení v rámci ádku • O ekávané etnosti 2
– test Chi-Square 12.4
Df 8
P-Value 0.1343
2 Pomocí – testu bylo provedeno testování hypotézy, zda uvedené dva jevy jsou nebo nejsou na sob závislé.
• •
H0 - jevy jsou na sob nezávislé HA - jevy jsou závislé
Na základ uvedené hodnoty P-Value (0.1343), která je v tší než 0.05, nezamítáme nulovou hypotézu, tzn. že s 95% jistotou m žeme tvrdit, že doba, kterou respondenti stráví na cest p i dojížd ní nezávisí na tom jak velká je obec, ve které dotazovaní bydli. Je však nutné upozornit na to, že n které o ekávané etnosti v tabulce jsou menší než 5, což mohlo ovlivnit celkový výsledek testu. Na níže uvedených grafech je znázorn n sloupcový a mozaikový graf daných jev .
17
18
ZÁV R Z provedených analýz vyplývá, že existují rozdíly mezi závislostmi u doby, kterou dotazovaní skute n stráví p i cestování do zam stnání nebo školy a doby, kterou by byli ochotni procestovat na daných t ech ukazatelích – v k, vzd lání, velikost obce. Doba, kterou jsou respondenti ochotni strávit na cest nezávisí ani na tom, jak jsou respondenti sta í a ani na tom jaké mají dosažené nejvyšší vzd lání. Tzn, že nem žeme tvrdit, že by nap mladší ob ané byly ochotni dojížd t delší dobu do zam stnání nebo, že by vysokoškolsky vzd laný ob an byl ochoten dojížd t kratší dobu do práce oproti vyu enému. Z provedené analýzy však m žeme usuzovat o tom, že závisí doba, kterou jsou obyvatelé MSK ochotni strávit p i dojížd ní na velikosti obce, ve které bydlí. Jinak je to se skute nou dobou dojížd ní a závislostí na uvedených faktorech. Zde doba cestování nezávisí na velikosti obce a ani na v kové kategorii, ale závisí na dosaženém vzd láni respondent .
19