ZÁVĚRY STATISTICKÉHO ZPRACOVÁNÍ VÝZKUMU OBECNÝCH ZNALOSTÍ INFORMAČNÍ BEZPEČNOSTI
Results of statistical research processing of general knowledge of information security Ing. Bc. Marek Čandík, PhD. Abstrakt Článek prezentuje závěry statistického zpracování výzkumu obecných znalostí informační bezpečnosti. Statistická analýza internetového výzkumu 800 respondentů byla realizována z hlediska pohlaví, věku, délky praxe a pracovního zařazení respondentů. Ke statistickému zpracování dat byl použitý software Statistica v.10. Klíčová slova Informační bezpečnost, statistická analýza, internetový výzkum Abstract The article presents some research findings of statistical processing of general knowledge of information security. Statistical analysis of Internet research of 800 respondents was implemented in terms of gender, age, length of service and employment status of the respondents. For the statistical processing was used Statistica software v.10. Key words: Information security, statistical analysis, internet research
ÚVOD Informační bezpečnost je ve většině případů spojován s informačními technologiemi. Informační technologie přinesly nové možnosti získávání, zpracovávání a ukládání dat/informací, podporují efektivnější a produktivnější systém práce. Tyto technologie nepřináší pouze pozitiva, ale vytváří i nové hrozby a prostor pro nový typ kriminality, kterou lze zjednodušeně označit jako počítačovou. Stejným způsobem, jak se
1
zrychluje přístup k informacím, zrychluje se i realizace těchto hrozeb. Logickou odpovědí na tento jev je pak snaha svá data/informace řádně zabezpečit a chránit je tak před útoky neoprávněných osob. Bezpečnost dat/informací a bezpečnost multimediálních dat je tak aktuální a dynamicky se rozvíjející téma. Pojem bezpečnosti je velmi rozsáhlý a vyskytuje se v různých oblastech lidské činnosti. Můžeme ho tak krom technických oborů (informatika, strojírenství) najít i v oborech společenskovědních (politologie, sociologie, psychologie, ekonomie a přírodovědných (medicína, ekologie). Ministerstvo vnitra ČR vymezuje pojem bezpečnost jako stav, kdy je systém schopen odolávat známým a předvídatelným vnějším a vnitřním hrozbám, které mohou negativně působit proti jednotlivým prvkům (případně celému systému) tak, aby byla zachována struktura systému, jeho stabilita, spolehlivost a chování v souladu s cílovostí. Je to tedy míra stability systému a jeho primární a sekundární adaptace.1 Bezpečnost je často doplňována nebo přímo charakterizována čtyřmi základními atributy:
Hrozby - (Threat) je skutečnost, událost, síla nebo osoby, jejichž působení (činnost) může způsobit poškození, zničení, ztrátu důvěry nebo hodnoty aktiva. Hrozba může ohrozit bezpečnost.
Riziky - (Risk) je pravděpodobnost, s jakou bude daná hodnota aktiva zničena nebo poškozena působením konkrétní hrozby, která působí na slabou stránku této hodnoty. Je to tedy míra ohrožení konkrétního aktiva.
Opatřeními, nástroji, nebo institucemi, které mají bezpečnost zajišťovat.
Objekty, jejichž bezpečnost má být chráněna. Bezpečnost informací (resp. informační bezpečnost) je multidisciplinární obor,
který se zabývá zajištěním ochrany informací během jejich vzniku, zpracování, ukládání, přenosu a likvidace. Snaží se snižovat rizika zneužití a navrhuje opatření k příslušným organizačním, řídícím, metodickým, právním a dalším podobným otázkám.2
Informační bezpečnost znamená komplexní pohled, který organizaci
pomáhá poznat a chránit své cenná data a také vede praktickými opatřeními k eliminaci či výraznému snížení dopadů v případě mimořádných událostí 3
Ministerstvo vnitra ČR. Bezpečnost [online]. Dostupné z: http://www.mvcr.cz/clanek/pojmy-bezpecnost.aspx Ministerstvo vnitra ČR. Základní definice, vztahující se k tématu kybernetické bezpečnosti [online]. 2009, s. 1 Dostupné z: http://www.mvcr.cz/soubor/cyber-vyzkum-studie-pojmy-pdf.aspx 3 KALVODA, Ondřej. Sociální inženýrství: v kontextu kybernetické bezpečnosti Brno, 2014, Masarykova univerzita (FSS). 1 2
2
Závěry mnohých výzkumů ukazují, že i když rizika spojená s používáním informačních technologií určitě nejsou zanedbatelná, mnoho lidí si dostatečně neuvědomuje nutnost jejich zabezpečení a i navzdory určitým obavám lidé při jejich používání nechovají vždy zodpovědně4. K nejvíce frekventovaným hrozbám v oblasti informační bezpečnosti lze zařadit:
Odcizení identity (Identity Theft) je nedovolené shromažďování a používání osobních údajů, obvykle za účelem kriminální činnosti.
Únik informací – případ, kdy budou uživatelská data prozrazena či odcizena cizím subjektem.
Narušení integrity dat –porušení konzistence dat uživatele. Například smazáním části dat nebo doplněním dat cizích.
Potlačení služby – úmyslné bránění uživateli v přístupu k datům. (může zahrnovat i úmyslnou změnu přístupových údajů).
Zneužití dat – využití odcizených dat k vlastní potřebě, ať už pro finanční či jinou potřebu.
REALIZOVANÝ VÝZKUM Cílem provedeného výzkumu bylo zmapovat obecné znalosti respondentů v oblasti informační bezpečnosti. Ke zpracování dat realizovaného výzkumu byla použita kvantitativní analýza. Kvantitativní (pozitivistický, resp. empiricko-analytický) výzkum patří k základním typům společenskovědního výzkumu. Má deduktivní povahu, což znamená, že z již existujících teorií jsou vyvozovány hypotézy, které jsou následně testovány prostřednictvím sebraných dat. Ověřování platnosti teorií pomocí odvozených hypotéz je základním cílem kvantitativního výzkumu5.
Např. studie týmu Norton poukázala na to, polovina uživatelů nepoužívá základní zabezpečovací prvky jako heslo, zabezpečovací software nebo zálohování souborů a 57 % o bezpečnostních řešeních pro mobilní zařízení ani neví. Nad riziky a bezpečnostními problémy se uživatelé příliš nezamýšlí. Z výzkumu realizovaného společností Intel z roku 2014, který probíhal na více než tisícovce respondentů, vyplynulo, že již 22 % uživatelů přišlo o svůj mobilní telefon či tablet, a to ztrátou nebo krádeží. Přesto si více než 60 % uživatelů těchto zařízení svá data nezálohuje. V případě stolních a přenosných počítačů je situace o něco lepší a podíl uživatelů, kteří si data pravidelně nezálohují, se pohybuje okolo 30 %. Skupina uživatelů, kteří svá data pravidelně zálohují, však tuto zálohu neprovádí s dostatečnou frekvencí. Jak vyplynulo z průzkumu, každý den provádí zálohu pouhá 4 procenta respondentů, jednou za měsíc pak 12 %. Celkově studie upozornila na alarmující a liknavý přístup uživatelů těchto technologií v otázce zabezpečení svých soukromých dat. 5 VÍŠKOVÁ, Veronika. Zabezpečení dat a ochrana soukromí u uživatelů chytrých mobilních telefonů. Brno: 2015, Masarykova univerzita (FF) 4
3
Vzorem pro kvantitativní výzkum jsou metody přírodních věd. Je proto hodně strukturovaný a standardizovaný. Standardizace mu zajišťuje vysokou reliabilitu, na druhou stranu však zároveň vede k redukci množství zjišťovaných informací a tím k poměrně nízké validitě. Kvantitativní výzkumy tedy sledují menší počet proměnných a vztahů mezi nimi, jejich porozumění nejde příliš do hloubky. Proměnné však zkoumají na velkém množství případů, takže jejich výsledky mohou být lépe zobecňovány 6. Pro sběr dat bylo využito metody dotazování, a to z důvodu zisku potřebných informací, které další metody jako pozorování a experiment v tomto výzkumu přinést nemohou. Získání dat pomocí dotazníkového šetření jsme preferovali z důvodu výhod této efektivní techniky sběru dat, a to hlavně z důvodů:
možnosti získání velkého množství údajů v poměrně krátkém časovém úseku,
eliminace vlivu tazatele na respondenta (respondent chce zapůsobit na osobnost tazatele – tzv. interviewer bias efektu,
možnosti hromadného zpracování dat na počítači.
existence zpětné vazby mezi tazatelem a respondentem, díky které lze očekávat lepší kvalitu sesbíraných dat
K nevýhodám získávání dat pomocí dotazníkového šetření patří:
riziko uvedení nepravdivých informací ze strany respondentů,
skutečnost, že respondent nemusí otázce zcela rozumět a není možné ji upřesnit.
V současnosti lze u výzkumů pozorovat vyšší preference elektronicky distribuovaných dotazníkových šetření. Tyto mají jisté nevýhody
Nízká návratnost dotazníků (což pak může negativně ovlivnit reprezentativnost výzkumu).
respondent nemusí odpovědět na všechny otázky
dotazník může místo něj vyplnit někdo jiný
6
tamtéž.
4
K výhodám dotazování výzkumného šetření elektronickou formou patří“
má poměrně spolehlivou anonymitu
pro jeho vyplnění není nutná přítomnost tazatele
možnost oslovení široké skupiny respondentů
časová nenáročnost
širší možnosti – použití animací, filmů, flash, odkazů na jiné WWW, atd
vícejazyčná podoba dotazníku
dohoda s respondentem o utajení testované služby nebo produktu
ekologický dopad (šetříme papír)
Z různých typů elektronicky distribuovaných dotazníkových šetření (vyplněním elektronického dotazníkového formuláře s fyzickou přítomností tazatele (např. vyučující na počítačové učebně), prostřednictvím e-mailu, atd.) je velmi populární internetový výzkum. Internetový výzkum je typ výzkumu, při kterém je sběr dat realizován prostřednictvím internetu, kdy respondent7: 1. vyplní dotazník online prostřednictvím internetu/intranetu nebo 2. „stáhne“ dotazník ze serveru (internetový či intranetový server) a odešle jej zpět prostřednictvím elektronické pošty nebo 3. obdrží odkaz (URL link) na dotazník/dotazník prostřednictvím elektronické pošty a vyplní jej (v online) prostředí nebo 4. se
účastní
hloubkového
rozhovoru
nebo
skupinové
diskuse,
a
to
prostřednictvím internetu nebo 5. se účastní v měřícím systému, který monitoruje jeho internetovou aktivitu prostřednictvím „cookies“ nebo aplikace instalované přímo na jeho počítači Při internetovém výzkumu je třeba dodržovat určité podmínky8:
Dobrovolnost o
Účast respondenta na výzkumu je vždy dobrovolná. Realizátor výzkumu nesmí rekrutovat respondenty a sbírat o nich osobní informace tajným, nekalým či nevyžádaným způsobem, tedy shromažďováním e-mailových
CHRAMCOV, Bronislav. Využití internetových technologií v sociálně - psychologickém výzkumu. Zlín: 2006, Univerzita Tomáše Bati (UI). 8 tamtéž. 7
5
adres a informací o respondentech bez jejich vědomí a bez uvedení způsobu dalšího zacházení s těmito informacemi. o
Výzkum nesmí za žádných okolností narušovat soukromí účastníků internetového výzkumu. V případě pop-up internetového výzkumu nesmí být návštěvníci internetové stránky, kteří si nepřejí účastnit se výzkumu, obtěžováni např. četným zobrazováním pop-up okna.
o
Realizátor výzkumu musí využít dostupných technologií pro zajištění neobtěžování respondenta a na žádost musí podat informaci o použité technologii.
o
Respondent má možnost odmítnout účast na jakémkoli výzkumu – ihned po nabídce účasti na takovém výzkumu, stejně jako odmítnout jakýkoli další kontakt s realizátorem výzkumu.
o
Osobní informace o internetových respondentech jsou chráněny a nesmí být s nimi nakládáno bez jejich vědomí.
Anonymita o
Pro zveřejnění osobních údajů respondenta je vždy zapotřebí mít souhlas respondenta učiněný předem. V opačném případě je vždy zachována jeho anonymita.
o
Osobně identifikované údaje o respondentech nesmi byt použity pro jiné než výzkumné účely (např. pro přímý marketing, ani pro žádné jiné prodejní techniky).
Informovanost respondenta a kontakt na technickou podporu o
Respondent je předem pravdivě informován o povaze výzkumu. Účel výzkumu může být utajen tak, aby nevedl k ovlivnění respondenta a respektoval výzkumné potřeby.
o
Respondent je informován o anonymitě a použití sebraných dat v úvodu či popisu výzkumu. Dále by měl být respondent před zahájením vyplňování dotazníku informován o možnosti opakovaně vstoupit či nevstoupit do dotazníku, době trvání výzkumu (časové omezení, do kdy je možné dotazník vyplnit) a délce dotazování. Během vyplňování by mělo být zobrazeno měřící zařízení sledující zbývající délku dotazníku.
o
Respondent musí mít možnost zjistit více informací o realizátorovi výzkumu, např. pomocí hyperlinku na webovou stránku realizátora.
o
Informace o výzkumu obsahuje minimálně následující informace: 6
o
Identitu realizátora
o
Oblast výzkumu (v případě multiklientských výzkumů vyjmenovat oblasti výzkumu)
o
Odměnu (benefity) za účast ve výzkumu – pokud existují
o
Důvod oslovení konkrétního respondenta
o
Link k informacím o ochraně dat (pokud se nejedná o respondenta z panelu)
o
Respondenti musí být informováni o zapojení tzv. cookies, nebo dalšího podobného zařízení a musí mít možnost toto zařízení vypnout, či odstranit, v případě, že to není možné i odvolat svůj souhlas s účastí.
o
Informace musí být doplněna kontaktem na technickou podporu libovolnou formou (email, telefon apod.).
Bezpečnost osobních dat o
Osobní data o respondentech musí být zabezpečena tak, aby bylo zabráněno manipulaci s daty neoprávněnou osobou.
o
Osobni data nesmí být dosažitelná bez nutnosti znalosti bezpečnostních údajů, např. uživatelského jména a hesla, nebo bez vlastnictví digitálního klíče.
o
Osobními daty se pro účely internetového výzkumu rozumí odpovědi respondenta spojené s identifikačními údaji o daném respondentovi.
o
Dotazování dětí a mladistvých se řídí zvláštními zásadami, stanovenými ESOMARem. Pokud si nemůže realizátor obstarat ověřený souhlas rodičů s dotazováním mladistvého (i přes internet), nemůže dotazovat osoby mladší 15ti let.
Ochrana soukromí o
Všechny osobní údaje a další informace, které respondent sdělí o své osobě, musí být uchovány v tajnosti a nesmí být využívány k jiným účelům (nabídka zboží, služeb a další marketingové aktivity, apod.).
o
Pokud respondent v rámci výzkumu odpoví na otázku, která umožňuje osobní identifikaci, musí realizátor zajistit, aby tato osobní data nemohla být propojena s jeho osobou, tj. klient nesmí mít možnost zjistit identifikaci respondenta spojenou přímo s jeho odpověďmi.
7
o
Na vyžádání respondenta musí realizátor vymazat jeho kontaktní údaje, pokud již respondent nechce být osloven v rámci dalších výzkumných projektů.
o
Kontakt v rámci dalších výzkumných projektů je povolen pouze tehdy, dalli respondent s tímto jednáním předem souhlas.
Metodika výzkumu Objekt výzkumu:
Informační bezpečnost r
Předmět výzkumu:
Znalosti respondentů o informační bezpečnosti
Respondenti:
Uživatelé Internetu9
Metoda výzkumu:
Dotazníkové
šetření,
s
následným
matematicko-
statistickým vyhodnocením. Návratnost dotazníků:
vzhledem k použité formě dotazování nelze kvantifikovat
Výzkumné otázky:
VO1: Je rozdíl ve znalostech o informační bezpečnosti v závislosti na pohlaví?
VO2: Je rozdíl ve znalostech o informační bezpečnosti v závislosti na věku?
VO3: Je rozdíl ve znalostech o informační bezpečnosti v závislosti na délce praxe? VO4: Je rozdíl ve znalostech o informační bezpečnosti v závislosti na zastávané pracovní pozici? Výzkumné předpoklady: VP1: Předpokládáme, že u znalosti o informační bezpečnosti nebudou statisticky významné rozdíly v závislosti na pohlaví. VP1: Předpokládáme, že u znalosti o informační bezpečnosti nebudou statisticky významné rozdíly v závislosti na pohlaví. VP1: Předpokládáme, že u znalosti o informační bezpečnosti nebudou statisticky významné rozdíly v závislosti na pohlaví. VP1: Předpokládáme, že u znalosti o informační bezpečnosti nebudou statisticky významné rozdíly v závislosti na pohlaví.
9
nebylo snahou získat reprezentativní vzorek, neboť to nebylo v možnostech výzkumného šetření. Úkolem bylo pouze sesbírat co nejvyšší počet odpovědí, aby výsledky výzkumu měly alespoň určitou výpovědní hodnotu.
8
Dotazník Na základě kvalitativní analýzy odborné literatury byl navržený nestandardizovaný (originální) dotazník. Dotazník byl vytvořen v elektronické formě. Díky tomu mohl být zkrácen časový interval potřebný pro sběr dat, odstraněny finanční náklady spojené s jeho tištěním a získaná data navíc mohla být jednoduše přenesena do programu, pomocí kterého byla prováděna jejich analýza. Sestavení a zveřejnění dotazníku probíhalo prostřednictvím dostupných webových portálů. Dotazník tvořilo celkem 13 otázek, které měly uzavřený charakter. Dotazníkový formulář byl komponovaný do tří částí. První část obsahovala identifikační znaky respondentů (pohlaví, pracovní zařazení, počet let praxe, zařazení ve vedoucí funkci). Druhá část dotazníkového formuláře byla tvořena tabulkou znázorňující způsob vyplňování dotazníku (4-bodová Likertova škála; od respondenta se požaduje, aby vyjádřil stupeň souhlasu či nesouhlasu s různými výroky, které se týkají určitého postoje. Nejčastější používanou technikou měření postojů jsou postojové škály. Jejich význam potvrzuje skutečnost, že postojové škály dosahují největší spolehlivost (reliabilitu). Postojové škály jsou tvořené souborem výroků, s kterými respondent vyjadřuje míru souhlasu, resp. nesouhlasu. Výroky mají být formulovány jednoznačně, přiměřeně a srozumitelně. Odpovědi jsou určitým způsobem sčítány a výsledek je úměrný postoji jedince k danému objektu. Postojové škály se vzájemně odlišují způsobem konstrukce, formou odpovědí a interpretací dosažených výsledků. Každý bod této škály je kódován 4,3,2 a 1 pokud jde o výrok pozitivní, případně v obráceném pořadí, je li výrok negativní - nejvyšší hodnotu má tedy souhlas s pozitivní, případně nesouhlas s negativním výrokem). Tab. 1. Použitá škála dotazníkového šetření
4
3
2
1
Souhlasím
Částečně souhlasím
Částečně nesouhlasím
Nesouhlasím
Třetí část dotazníkového formuláře představovala zjišťovací část dotazníkového šetření. Zjišťovací část se skládala z pěti okruhů výzkumného šetření zaměřených na obecnou znalost informační bezpečnosti. 9
Tyto výroky byly posléze hodnoceny na čtyřbodové škále (souhlasím- částečně souhlasím-částečně nesouhlasím-nesouhlasím).
Předvýzkum (Pilotáž) Před samotným výzkumem byla provedena malá pilotní sonda, jejímž účelem bylo ověřit srozumitelnost dotazníku a ověřit výroky pro část měřící postoje respondentů. Předvýzkum byl proveden pro potřeby správného nastavení úrovně atributů. Po sestavení dotazníku byla provedena jeho pilotáž za účelem odhalení jeho možných chyb. V rámci předvýzkumu byly získány odpovědi od 43 mužů a 27 žen. Sběr dat probíhal v období od 20. 12. 2014 do 5. 1. 2015, elektronickou formou. Vypracovaný dotazník byl korigovaný z hlediska validity (přeformulování některých nejasných otázek, vynechání otázek, ve kterých všichni respondenti deklarovali pouze souhlasný, resp. nesouhlasný postoj, atd.). Každému participantovi byl spočítán jeho celkový skór a každá položka testu byla následně s tímto celkovým skórem korelována. Položky, které vykázaly nízkou korelaci, byly testových otázek vyřazeny. Zbylé otázky byly následně administrovány respondentům v rámci výzkumného šetření. U výroků, které byly z dotazníku vyřazeny, se při výpočtu škály nepočítalo.
Sběr, zpracování a kontrola dat Sběr dat probíhal v období od 7. 1. 2016 do 15. 3. 2016. Během tohoto období bylo obdrženo 842 dotazníků. Následným počítačovým zpracováním bylo vyřazených 42 dotazníků (4,99 % z celkového počtu obdržených dotazníků) z důvodu neúplného vyplnění. Pro statistické zpracování jsme proto použili celkem 800 dotazníků. Veškeré dotazníky byly následně překódovány do programu MS Excel 2010 tak, aby byla možná jejich statistická analýza. Vznikla matice dat, která byla importována do softwarového prostředí Statistica v.10, tak aby data mohla být v tomto prostředí analyzována. V dalším kroku byla provedena kontrola dat. Ta neodhalila žádné chyby či nesrovnalost, proto počet dotazníku proto zůstal i po kontrole stejný – výzkumný vzorek tedy čítá 800 dotazníků. 10
Ke zpracování dat byly využity adekvátní matematicko-statistické procedury, jež jsou obsahem tohoto softwarového prostředí.
DOSAŽENÉ VÝSLEDKY Zastoupení respondentů z hlediska pohlaví znázorňuje níže uvedený obr. 1.
Obr. 1 Struktura respondentů z hlediska pohlaví Z celkového vzorku 800 respondentů převládají početně muži, kterých bylo 492 (61 %) nad ženami, kterých bylo 308 (39 %). Základní statistické veličiny respondentů z hlediska věku znázorňuje tab.2. Tab.2 Základní statistické údaje o věku respondentů Věk (v letech): minimum
14
maximum
54
směrodatná odchylka
10,33
průměr
27,80
medián
27
modus
15
Obr. 2 Struktura respondentů z hlediska věku Nejmladším respondentem v rámci internetového průzkumu byl respondent 14ti letý(minimum), nejstarším respondentem byl 54letý respondent (maximum). Průměrný 11
věk respondentů byl 27,8let, mediánová hodnota věku respondentů je 27 let, nejčetnější skupinou respondentů byla skupina 15ti letých (modus). Pro další statistické zpracování obdržených dat byli respondenti rozdělení dvou skupin – skupina respondentů s věkem do 29let, a skupina respondentů s minimálním věkem 30let. Poměr těchto respondentů uvádí obr. 2 Základní statistické veličiny respondentů z hlediska délky celkové praxe uvádí tab.3. Tab.3 Základní statistické údaje o praxi respondentů Celková praxe (v letech): minimum
0
maximum
32
směrodatná odchylka
7,97
průměr
7,52
medián
5
modus
0
U dotazované skupiny respondentů se praxe pohybovala v intervalu od 0let (minimum) po 32let (maximum). Průměrná doba praxe respondentů byla cca 8let, mediánová hodnota doby celkové praxe respondentů byla 5 let, nejčetnější skupinou respondentů byla skupina respondentů bez jakékoliv praxe (modus). Pro další statistické zpracování obdržených dat byli respondenti rozdělení dvou skupin – skupina respondentů s délkou praxe do 5ti let, a skupina respondentů s délkou praxe 5let a výše. Z celkového vzorku 800 respondentů mírně převládá počet 420 respondentů s pětiletou a vyšší praxí (53%) nad skupinou 380 respondentů s praxí do 5ti let (47 %). Poměr těchto respondentů uvádí obr. 3
Obr. 3 Struktura respondentů z hlediska délky praxe
12
Zastoupení respondentů z hlediska pracovního zařazení znázorňuje níže uvedený obr. 4.
Z Obr. 4 Struktura respondentů z hlediska pracovního zařazení Jak naznačuje obr. 4, v dotazované skupiné respondentů bylo 100 manažerů (12% respondentů) – zbytek, tj. 700 respondentů (88%) nezastává na pracovišti manažerskou pozici. V sesbíraném výzkumném vzorku byly ověřené předpoklady použití statistických metod, zejména normalita a homoskedasticita. Ve výzkumech se často setkáváme se situací, kdy měřenou proměnnou ovlivňuje současně větší počet poměrně slabých náhodných vlivů. Toto působení se projevuje tím, že značná část výsledků se soustřeďuje kolem střední hodnoty a na obě strany se výsledky vyskytují stále méně často. Normální rozdělení reprezentuje tzv. Gaussova křivka zvonovitého tvaru. Normální rozdělení je symetrické, průměr je roven mediánu i modu a jeho šikmost je nulová (Meloun, Militký, 2012). Normální rozložení má tu vlastnost, že: •
interval µ ± obsahuje 63,3 % populace,
•
interval µ ± 2 obsahuje 95,5 % populace,
•
interval µ ± 3 obsahuje 99,7 % populace.
Z důvodů přehledné vizualizace výsledky testu znázorňujeme diagnostickými grafy pomocí histogramů a tzv. N-P plotů (Normal Probability Plot), včetně výpočetních výsledků testu normality Shapiro-Wilksovým W-testem10 (tab. 4). U grafického vyobrazení histogramů sledujeme shodu distribuce sledované proměnné s Gaussovou
10
Shapiro-Wilsův W-test normality byl publikovaný v roce 1965 a je založený na analýze rozptylu. Tento test je doporučován normou ČSN 01 0225. Na testovou statistiku Shapiro-Wilksova W-testu lze nahlížet podobně jako na korelační koeficient mezi uspořádanými pozorováními a jim odpovídajícím kvantilům standardizovaného normálního rozdělení. Když má hodnotu 1, znamená to, že data vykazují perfektní shodu s normálním rozdělením. Hypotézu o normalitě zamítáme na hladině významnosti , když se na této hladině neprokáže korelace mezi daty a jim odpovídajícím kvantilům normálního rozdělení.
13
křivkou, u grafického vyobrazení NP-plotu v případě, že soubor vykazuje normální rozdělení, se (modré) body přibližují k zobrazené přímce resp. v ideálním případě na ní leží. Značné odchylky bodů od přímky ukazují na soubor, který nevykazuje normalitu. V případě normálního rozdělení dat budou všechny znázorněné body ležet na přímce (pro data s kladnou šikmostí se body řadí do konvexní křivky a u záporné šikmosti do konkávní křivky). Dalšími možnými diagnostickými grafy, pomocí kterých můžeme posuzovat, zda data pochází z normálního rozložení, patří například Q-Q plot (Quantile-Quantile Plot) a P-P plot (Probability-Probability Plot). U diagnostických grafů N-P, Q-Q, P-P plotů můžeme vizuálně pozorovat, zda body leží (téměř) na přímce. Z toho můžeme usoudit, že data pocházejí z normálního rozdělení. Abychom eliminovali případný mylný závěr, je zapotřebí si toto stanovisko získané vizuálním posouzením ověřit testem normality (výpočetně). N-P plot sledovaného souboru je vyobrazen na obr. 5. Z obrázku je patrné, že vyobrazené body neleží na přímce, proto lze očekávat, že podmínka normality splněna nebude. Normál. p-graf:SK-1 3
Oček. normál. hodnota
2
1
0
-1
-2
-3 4
6
8
10
12
14
16
18
20
Hodnota
Obr. 5 Diagnostický graf N-P plot zkoumaného datového souboru Tab.5 Výsledky testování normality Testování normality Shapiro-Wilksův W-test
w=0.964
p=0.000000
normalita zamítnuta
Výsledky testování homoskedasticity u sledovaných souborů pomocí F-testu (test významnosti rozdílu dvou rozptylů interpretuje následující tab.6.
14
Tab.6 Výsledky testování homoskedasticity Testování homoskedasticity F=1,0620
p=0.55200
pohlaví
homoskedasticita přijata
F=1.4360
p=0,00037
věk
homoskedasticita zamítnuta
F=1.27548
p=0.01560
praxe
homoskedasticita zamítnuta
F=1.1750
p=0.26205
pracovní zařazení
homoskedasticita přijata
Vzhledem k obdrženým výsledkům testování lze konstatovat, že nejsou splněny podmínky pro použití parametrických matematicko-statistických metod, proto bylo při analýze dat využito neparametrických testů. Pro testování významnosti dvou nezávislých průměrů byl použit Mannův –Whitneyův U test. K testování výzkumné otázky VO1 (rozdíl ve znalostech o informační bezpečnosti v závislosti na pohlaví) byla stanovena pracovní hypotéza: H01: Znalosti respondentů o informační bezpečnosti se v závislosti na pohlaví respondentů neliší. HA1: Znalosti respondentů o informační bezpečnosti jsou v závislosti na pohlaví odlišné. K názornému srovnání testovaných skupin jsme použili tzv. boxplot (Box-and-Whisker Plot, resp. krabicový diagram), který je často používán jako nástroj pro grafické zobrazení ukazatelů polohy. Rozdíly ve znalostech respondentů o informační bezpečnosti v závislosti na pohlaví je vyobrazen na obr. 611.
Jako ukazatel polohy vyobrazujeme průměr, který pro grafické vyobrazení lze považovat za názornější. V případě použití neparametrických testů bychom ale měli správně vyobrazovat mediánové hodnoty (grafické vyobrazení ale nebývá vždycky názorné).
11
15
Krabicový graf : SK-1 11,4 11,2 11,0 10,8
SK-1
10,6 10,4 10,2 10,0 9,8 9,6 Průměr Průměr±SmCh Průměr±1,96*SmCh
9,4 0
1 Pohlaví
Obr. 6 Rozdíly ve znalostech o informační bezpečnosti mezi muži (0 – nalevo) a ženy (1-napravo), 800 respondentů Jak naznačuje obr.6, ve sledované skupině respondentů dosahují respondenti – muži vyšší znalosti o informační bezpečnosti, než sledovaná skupina žen. K posouzení, zda je tento rozdíl statisticky významný, jsme použily neparametrický Mannův –Whitneyův U-test (tab. 6) Tab.7 Výsledky testování rozdílů v závislosti na pohlaví Statistické rozdíly - pohlaví U Informační bezpečnost
Z
p
62088 4,3011
0,000015
Hypotéza H01 zamítnuta
Jak je patrné z tab. 7, výsledky Mann-Whitneyova U-testu na hladině významnosti 5 % zamítají nulovou hypotézu H01 (p = 0,000015), proto konstatujeme (na hladině významnosti 5%), že znalosti respondentů o informační bezpečnosti se liší (statisticky významně) v závislosti na pohlaví – sledovaná skupina mužů disponuje statisticky významně vyššími znalostmi, než sledovaná skupina žen. K testování výzkumné otázky VO2 (rozdíl ve znalostech o informační bezpečnosti v závislosti na pohlaví) byla stanovena pracovní hypotéza: H02: Znalosti respondentů o informační bezpečnosti se v závislosti na věku respondentů neliší. HA2: Znalosti respondentů o informační bezpečnosti jsou v závislosti na věku odlišné.
16
K prvotnímu srovnání testovaných skupin jsme použili boxplot. znázorněn na obr. 7.
Krabicový graf : SK-1 12,0 11,8 11,6 11,4 11,2
SK-1
11,0 10,8 10,6 10,4 10,2 10,0 9,8 Průměr Průměr±SmCh Průměr±1,96*SmCh
9,6 0
1 Věk
Obr. 7 Rozdíly ve znalostech o informační bezpečnosti mezi respondenty do 30ti let (0 – nalevo) a respondenty nad 30 let (1-napravo), 800 respondentů Jak naznačuje obr.7, ve sledované skupině respondentů dosahují respondenti nad 30let vyšší znalosti o informační bezpečnosti, než sledovaná mladší skupina. K posouzení, zda je tento rozdíl statisticky významný, jsme použily neparametrický Mannův –Whitneyův U-test (tab. 8) Tab.8 Výsledky testování rozdílů v závislosti na věku Statistické rozdíly - věk U Informační bezpečnost
Z
p
57188 -5,7905
0,0000
Hypotéza H02 zamítnuta
Jak je patrné z tab. 8, výsledky Mann-Whitneyova U-testu na hladině významnosti 5 % zamítají nulovou hypotézu H02 (p = 0,0000), proto na hladině významnosti 5% konstatujeme, že znalosti respondentů o informační bezpečnosti se liší (statisticky významně) v závislosti na věku – sledovaná skupina respondentů starších než 30 let disponuje statisticky významně vyššími znalostmi, než sledovaná skupina respondentů do 30ti let. K testování výzkumné otázky VO3 (rozdíl ve znalostech o informační bezpečnosti v závislosti na délce praxe) byla stanovena pracovní hypotéza:
17
H03:
Znalosti respondentů o informační bezpečnosti se v závislosti na délce praxe respondentů neliší.
HA3: Znalosti respondentů o informační bezpečnosti jsou v závislosti na délce praxe odlišné. K prvotnímu srovnání testovaných skupin jsme analogicky použili boxplot. znázorněn na obr. 8.
Krabicový graf : SK-1 11,6 11,4 11,2 11,0
SK-1
10,8 10,6 10,4 10,2 10,0 9,8 9,6 Průměr Průměr±SmCh Průměr±1,96*SmCh
9,4 0
1 Praxe
Obr. 8 Rozdíly ve znalostech o informační bezpečnosti mezi respondenty s praxí do 5ti let (0 – nalevo) a respondenty s praxí nad 5 let (1-napravo), 800 respondentů Jak vyobrazuje obr.8, ve sledované skupině respondentů dosahují respondenti s pětiletou a vyšší praxí vyšší znalosti o informační bezpečnosti, než sledovaná skupina respondentů s praxí do 5ti let.. K posouzení, zda je tento rozdíl statisticky významný, jsme použily neparametrický Mannův –Whitneyův U-test (tab. 9) Tab.9 Výsledky testování rozdílů v závislosti na délce praxe Statistické rozdíly - praxe U Informační bezpečnost
Z
p
61916 -5,47912
0,0000
Hypotéza H03 zamítnuta
Jak je patrné z tab. 8, výsledky Mann-Whitneyova U-testu na hladině významnosti 5 % zamítají nulovou hypotézu H03 (p = 0,0000), proto na hladině významnosti 5% konstatujeme, že znalosti respondentů o informační bezpečnosti se liší (statisticky významně) v závislosti na délce praxe – sledovaná skupina respondentů s pětiletou a
18
vyšší praxí disponuje statisticky významně vyššími znalostmi, než sledovaná skupina respondentů s praxí do 5ti let. K testování výzkumné otázky VO4 (rozdíl ve znalostech o informační bezpečnosti v závislosti na pracovní pozici) byla stanovena pracovní hypotéza: H04:
Znalosti respondentů o informační bezpečnosti mezi manažery a nemanažery se neliší.
HA4: Znalosti respondentů o informační bezpečnosti jsou mezi manažery a nemanažery odlišné. K prvotnímu srovnání testovaných skupin jsme analogicky použili boxplot. znázorněn na obr. 9. Krabicový graf : SK-1 14,0 13,5 13,0
SK-1
12,5 12,0 11,5 11,0 10,5 10,0 9,5 0
1 Manažer
Průměr Průměr±SmCh Průměr±1,96*SmCh
Obr. 9 Rozdíly ve znalostech o informační bezpečnosti mezi respondenty -nemanažery (0 – nalevo) a respondenty - manažery (1-napravo), 800 respondentů Jak interpretuje obr.9, ve sledované skupině respondentů dosahují respondenti manažeři vyšší znalosti o informační bezpečnosti, než sledovaná skupina respondentů - nemanažerů. K posouzení, zda je tento rozdíl statisticky významný, jsme použily neparametrický Mannův –Whitneyův U-test (tab. 10) Tab.10 Výsledky testování rozdílů v závislosti na pracovní pozici Statistické rozdíly – pracovní pozice U Informační bezpečnost
Z
p
17600 -8,04937
19
0,0000
Hypotéza H04 zamítnuta
Jak je patrné z tab. 10, výsledky Mann-Whitneyova U-testu na hladině významnosti 5 % zamítají nulovou hypotézu H04 (p = 0,0000), proto na hladině významnosti 5% konstatujeme, že znalosti respondentů o informační bezpečnosti se liší (statisticky významně) v závislosti na pracovní pozici – sledovaná skupina respondentů manažerů a disponuje statisticky významně vyššími znalostmi, než sledovaná skupina respondentů - nemanažerů.
ZÁVĚR Dosavadní výzkum obohatil poznání zvláště v oblasti mapování znalostí informační bezpečnosti u uživatelů Internetu, kteří se výzkumu účastnili. Za limity výzkumu lze považovat dvě omezení: geografické (respondenty v prostředí Internetu nelze geograficky vymezit) a věkové (Ve výzkumu nebyly zastoupeny všechny věkové kategorie). Článek ale podává základní informaci o znalostech informační bezpečnosti, které jsme byli schopni obdržet od respondentů v rámci našeho výzkumu.
LITERATURA [1]
CHRAMCOV, Bronislav. Využití internetových technologií v sociálně psychologickém výzkumu. Zlín: 2006, Univerzita Tomáše Bati (UI).
[2]
KALVODA, Ondřej. Sociální inženýrství: v kontextu kybernetické bezpečnosti Brno, 2014, Masarykova univerzita (FSS).
[3]
Meloun, M., Militký, J. (2013). Kompendium statistického zpracování dat. Praha: Karolinum. 984 s. ISBN 9788024621968.
[4]
Meloun, M., Militký, J. (2012). Interaktivní statistická analýza dat. Praha: Karolinum. 960 s. ISBN 9788024621739.
[5]
VÍŠKOVÁ, Veronika. Zabezpečení dat a ochrana soukromí u uživatelů chytrých mobilních telefonů. Brno: 2015, Masarykova univerzita (FF).
[6]
Ministerstvo
vnitra
ČR.
Bezpečnost
[online].
Dostupné
z:
http://www.mvcr.cz/clanek/pojmy-bezpecnost.aspx [7]
Ministerstvo vnitra ČR. Základní definice, vztahující se k tématu kybernetické bezpečnosti [online]. 2009, s. 1 Dostupné z: http://www.mvcr.cz/soubor/cybervyzkum-studie-pojmy-pdf.aspx
20