Výsledky pilotního průzkumu postojů studentů Policejní akademie ČR v Praze k problematice zálohování dat Ing. Bc. Marek Čandík, Ph.D. JUDr. Štěpán Kalamár, Ph.D.
The results of the pilot survey of students attitudes at Police Academy of the Czech Republic in Prague in the issue of data backup
Abstrakt: Příspěvek prezentuje první výsledky pilotního průzkumu postojů studentů Policejní akademie České republiky v Praze k problematice zálohování dat. Průzkum byl realizovaný v rámci dílčího výzkumného úkolu DVÚ č. 4/8 „Elektronická podpora výuky a vědeckého působení v oblasti práva a bezpečnosti“ na Policejní akademii České republiky v Praze.
Klíčová slova: Pilotní průzkum, dotazník, zálohování dat.
Abstract: The paper presents some first results of a pilot survey of students attitudes at Police Academy of the Czech Republic in Prague in the issue of data backup. The survey was implemented under the sub-research project DVU no. 4/8 "Support of elearning and scientific activity in the field of justice and security" at the Police Academy of the Czech Republic in Prague. Key words: Pilot surway, questionnaire, data backup.
Úvod Pilotní průzkum zaměřený na oblast postojů respondentů k zálohování dat byl součástí řešení dílčího institucionálního výzkumného úkolu DVÚ č. 4/8 „Elektronická podpora výuky a vědeckého působení v oblasti práva a bezpečnosti“ na Policejní akademii České republiky v Praze, jehož cílem bylo zmapovat, jaký postoj k problematice zálohování dat zaujímají studenti Policejní Akademie České republiky v Praze. Průzkum byl realizovaný formou dotazníkového šetření. Dotazníkový formulář, validovaný dvěma odborníky z praxe a akademického prostředí, byl navržen na základě studia odborné literatury. Dotazníkový formulář byl komponovaný do dvou částí. První část obsahovala identifikační znaky respondentů (pohlaví, věk, vzdělání a ekonomickou aktivitu). Druhou část dotazníkového formuláře představovala samotná zjišťovací část dotazníkového šetření. Tato část sestávala z 16-ti tázaných tvrzení, na které měli respondenti na 4bodové Likertově škále vyjádřit stupeň souhlasu či nesouhlasu s uvedeným tvrzením a celkový postoj respondenta byl dán součtem dílčích odpovědí na tázaná tvrzení. Distribuce dotazníků (v tištěné formě) byla realizována v roce 2014 na Policejní akademii České republiky v Praze. Dotazovanými byli studenti kombinované formy studia. Pro pilotní průzkum bylo distribuováno celkem 100 dotazníků, přičemž jejich návratnost byla 80 %. Následným počítačovým zpracováním bylo vyřazeno 12 dotazníků z důvodu neúplného vyplnění. Pro statistické zpracování bylo proto použito celkem 68 dotazníků. Data získaná z dotazníkového šetření byla v číselné podobě vložena do aplikace Microsoft Office Excel a následně importována do softwarového prostředí Statistica v.10, které bylo následně vytěžováno použitím zvolených statistických metod. Ke zpracování dat byly využity adekvátní matematicko-statistické postupy, jež jsou součástí tohoto softwarového prostředí.
Struktura respondentů Zkoumaný vzorek tvořili z 56 % muži (38 respondentů) a z 44 % ženy (30 respondentů).
2
Pokud se podíváme na věkové složení respondentů, většinu z dotazovaných (47 %; 32 respondentů) představovali respondenti ve věku 30 – 39 let. Druhou nejpočetnější skupinou byli respondenti ve věku 20 – 29 let. Z této věkové kategorie odpovídalo 26 respondentů, což představuje 38 % z celkového počtu dotazovaných. 12 % zaujímají respondenti ve věku 40 - 49 let (8 respondentů). Zbývající 3 % jsou tvořena respondenty z věkové skupiny 50 a více let (2 respondenti). Podle nejvyššího dosaženého vzdělání soubor respondentů tvořilo 65 % středoškolsky vzdělaných s maturitou (41 respondentů), 35 % mělo vysokoškolské vzdělání (24 respondentů) a 5 % (3 respondenti) dotazovaných mělo vyšší odborné vzdělání. Z hlediska ekonomické aktivity respondentů byla většina respondentů, 49 % (34 respondentů)
ve
služebním
poměru.
Zaměstnanci
veřejné
správy,
15 respondentů, tvořili 21 % dotazovaných. V soukromém sektoru bylo zaměstnáno 27 % dotazovaných (19 respondentů) a zbývající 3 % představovali ekonomicky neaktivní respondenti.
Statistické vyhodnocení průzkumu Získaná data jsme dále statisticky vyhodnocovali, přičemž nás zajímalo, jsou-li statisticky významné rozdíly mezi odpověďmi respondentů z hlediska pohlaví? Stanovili jsme pracovní hypotézu (H01) a alternativní hypotézu (HA1): H01: Vnímaní problematiky zálohování dat se v závislosti na pohlaví neliší HA1: Vnímaní problematiky zálohování dat se v závislosti na pohlaví liší Prvním krokem dalšího matematicko-statistického zpracování bylo ověření normality získaných dat. Z důvodů přehledné vizualizace výsledky testu normality znázorňujeme diagnostickým grafem pomocí tzv. N-P plotu (Normal probability plot) – obr. 1, který jsme pomocí adekvátních postupů vytěžili ze softwarového prostředí Statistica v.10.
3
Normál. p-graf:SOUHRN 3
Oček. normál. hodnota
2
1
0
-1
-2
-3 15
20
25
30
35
40
45
50
Hodnota
Obr.1 - N-P plot – Test normality (souhrn otázek). V případě, že data mají normální rozdělení, leží na přímce. Na uvedeném N-P plotu jsou však vidět odchylky od normálního rozdělení a nelze subjektivně posoudit, zda hodnoty ležící mimo přímku způsobují významné odchýlení od normality. Proto jsme dále přistoupili k výpočtu normality pomocí tzv. Shapiro-Wilksova W testu, kterým bylo na základě p hodnoty zjištěno, že celkový souhrn otázek nevykazuje normální průběh, normalita byla zamítnuta. Výpočty byly provedeny pomocí softwarového prostředí Statistica v.10. Normalita se zamítá, pokud je číselná hodnota p < 0,05. Zjištěná p hodnota dosáhla úrovně p=0,029, proto zamítáme předpoklad o normální distribuci. Z uvedeného zamítnutí normality nám vyplynulo, že je vhodnější data testovat neparametricky pomocí tzv. Mann-Whitneyova U-testu. Neparametrické testy se používají pro porovnání souborů statistických dat, u nichž nelze předpokládat normální rozdělení pravděpodobností sledovaného znaku. K vizuálnímu posouzení rozdílu mezi pohlavími jsme vytvořili následující krabicový graf (tzv. boxplot) – obr. 2.
4
Krabicový graf dle skupin Proměnná: SOUHRN 50
45
SOUHRN
40
35
30
25
20
15 1
Medián 25%-75% Min-Max
0 pohlaví
Obr. 2. Boxplot – Souhrn otázek (0 – muž, 1 – žena). Pro korektní zpracování dat jsme ve druhém kroku statistického zpracování dat obdržených z dotazníkového šetření stanovovali shodnosti rozptylů u testovaných souborů (mužů a žen) - tzv. test homoskedasticity. Tento test jsme uskutečňovali subjektivním posouzením rozptylů ze získaného boxplotu. Jak naznačuje vyobrazený boxplot, testované skupiny se v rozptylech výrazně neliší. Z uvedeného krabicového grafu lze vyčíst, že mediánové hodnoty a hodnoty horních a spodních kvartilů jsou u dotazované skupiny mužů vyšší než u dotazované skupiny žen. Zda jde o statisticky významný rozdíl jsme zjišťovali v softwarovém prostředí Statistica v.10 pomocí Mann-Whitneyova U-testu. Zjištěná p hodnota (viz Tab.1) statisticky významné rozdíly potvrdila, na základě čehož můžeme hypotézu, že se odpovědi respondentů v závislosti na pohlaví neliší, na našem vzorku, na 5ti procentní hladině významnosti vyvrátit.
Proměnná
SOUHRN
Mann-Whitneyův U test (dle proměn. Pohlaví) Označené testy jsou významné na hladině p < 0,05000 Sčt poř. skup. 1
Sčt poř. skup. 2
773,5000
1572,500
U
Z
308,5000
-3,22370
p-hodnota 0,001266
Tab. 1 U-test – Souhrn otázek. 5
Dále jsme získaná data statisticky vyhodnocovali, přičemž nás zajímalo, jsou-li statisticky významné rozdíly mezi odpověďmi respondentů z hlediska věku. Vzhledem k počtu obdržených dotazníků jsme za hranici stanovili mediánovou hodnotu 33 let.
Stanovili jsme pracovní hypotézu (H02) a alternativní hypotézu
(HA2): H02: Vnímání problematiky zálohování dat se v závislosti na věku neliší HA2: Vnímání problematiky zálohování dat se v závislosti na věku liší Postupovali jsme ověřením normality získaných dat Shapiro-Wilksovým testem. Na 5-ti procentní hladině významnosti jsme obdrželi p-hodnotu p=0,84, proto normalitu dat ve skupinách respondentů do 33 let a ve skupině respondentů nad 33 let jsme nezamítli a následně jsme testovali statisticky významný rozdíl pomocí parametrického t-testu (pro nezávislé vzorky). K vizuálnímu posouzení rozdílu mezi pohlavími jsme vytvořili následující krabicový graf (obr. 3). Krabicový graf SOUHRNs vs. SOUHRNm 38
37
36
35
34
33
32 SOUHRNs
SOUHRNm
Průměr Průměr±SmCh Průměr±1,96*SmCh
Obr. 3. Boxplot – Souhrn otázek [starší (nalevo), mladší (napravo)]. Jak naznačuje vyobrazený krabicový diagram, skupina starších respondentů (levá část grafu) se vyznačuje vyšším povědomím a používáním zálohovacích technologií ve srovnání se skupinou mladších respondentů (pravá část grafu). Vizuálním 6
posouzením homoskedasticity můžeme usoudit, že obě skupiny se vyznačují přibližně stejnou variabilitou. Matematicko-statistické srovnání obou skupin interpretuje následující tabulka (Tab. 2).
Proměnná
SOUHRN starší vs. mladší
Studentův t-test pro nezávislé vzorky Průměr starší
Průměr mladší
Hodnota t
p-hodnota
35,8000
34,6365
0,8014
0,4258
Tab. 2 t-test – Souhrn otázek.
Na základě zjištěné p-hodnoty konstatujeme, že na 5-ti procentní hladině významnosti shodu ve vnímání problematiky zálohování dat se v závislosti na věku nemůžeme zamítnout.
Závěr Z výsledků dotazníkového šetření můžeme usuzovat, že respondenti jsou si vědomi důležitosti zálohovat data a většina dotazovaných tak i činí a svá data zálohuje. Méně z nich pak pravidelně. Nejčastěji respondenti zálohují soukromá data, těsně následována daty pracovními. Respondenti zálohují prostým kopírováním, pro zálohování dat respondenti nejčastěji využijí jiný pevný disk nebo flash disk a tato média považují za bezpečná. Pilotním průzkum naznačil statisticky významný rozdíl v odpovědích respondentů z hlediska pohlaví. Zjistili jsme, že muži se o danou problematiku zajímají více než ženy a zálohují pravidelněji.
7
Literatura
Anděl, J. Matematická statistika. SNTL/Alfa Praha 1978. ISBN 80-01-01285-9
Budíková, M.; Mikoláš, Š.; Osecký, P. Popisná statistika. MU Brno 2001, ISBN 80-85863-93-6.
Cramér, H. Mathematical Methods of Statistics. Princeton University Press, 1999, ISBN 978–0691005478.
Zvára, K.; Štěpán, J. Pravděpodobnost a matematická statistika. Vyd. 3. Praha: Matfyzpress, 2002. 230 s. ISBN 80-85863-93-6.
8