STRUČNY PREHLED METODOLOGIE SE STATISTIKOU Studijní opora pro 1. Ročník CŽV 2003/4 Doc. PhDr Chrudoš Valoušek, CSc. Věda je na základě praxe a na základě výzkumů ověřovaného praxí vyvíjející se systém poznatků, který odráží zákonitosti skutečnosti. Vědecké poznatky nejsou evidovány pouze v textové podobě. Stávají se součástí běžného života. Setkáváme se s nimi v přístrojích, energetice, lécích, a léčebných zákrocích, ve výrobě, v technice, dopravě, úpravě potravy, v zemědělství atp. Metodologie je obor zabývající se výzkumem. Výzkum je aktuálně probíhající proces zkoumání: získávání údajů (dat), jejich logické a statistické zpracování (souhrny) a hodnocení. Jeho výsledky se do systémů vědeckých poznatků i praxe opět vracejí. Metodologie představuje formální pravidla upravující postup zkoumání. Je „gramatikou“ výzkumů. Gramatikou, která dbá obsahové stránky výzkumu právě tak, jako gramatika příslušného jazyka dbá obsahové stánky jazyka. 1. PŘEDPOKLADY VĚDECKÉHO POZNÁNÍ 1.1 Objektivním předpokladem vědeckého poznání je existence objektivní skutečnosti, která má ráz „jednoty nekonečné mnohosti“. Tzn. že svět není kompaktním, neproniknutelným „masivem“. Je členitelným souborem. Není však ani shlukem nesouvisejících jednotlivin – vytváří různě rozsáhlé prolínající se celky. Je nekonečný ve smyslu možnosti neustálých změn. Z této charakteristiky plynou další: existence relativně stálých pravidel – zákonitostí, s možností tato pravidla měnit, jednak cestou náhody a - dnes mnohdy bohužel i neuváženou a chamtivostí poznamenanou – lidskou činností. Zákonité pojetí skutečnosti označujeme jako determinismus (určenost, podmíněnost). V historii vědy se objevuje determinismus mechanický, striktní, který uznává pouze zákonitosti bez možnosti působení náhody. Vedle mechanického determinismu existuje determinismus dialektický, který současně (vedle zákonitosti) uznává vliv náhody. Náhoda v tomto pojetí však neznamená „bezpříčinnost“. Vznik náhodného jevu je determinován objektivními možnostmi, které jsou potencionální. Svět se samodeterminující se. Opakem determinismu je indeterminismus, který uznává náhodu v pojetí bezpříčinnosti a vede k nepoznatelnosti a neuznává zákonitosti. 1.2 Subjektivním předpokladem vědeckého poznání je existence poznávajícího subjektu, který je schopen vytvářet a používat znakový systém, který skutečnost reprezentuje, zastupuje. Takový znakový systém si vytvořil člověk v podobě jazyka. Pomocí jazyka se člověk „vydělil“ ze skutečnosti. Díky tomu ji mohl
poznávat jako subjekt, který existuje vedle, mimo a proti poznávanému objektu. Tím se současně stal i objektem poznání sám pro sebe, pro sebepoznání. Jazyk je „věc“, která kromě sebe přivádí na mysl něco jiného. Jazyk je konvenčním, uměle vytvořeným znakovým systémem na rozdíl od znaků přirozených, ikonických (obraz něčeho) a znaků indexicých (signálů, ukazatelů něčeho, kouř např. znamená oheň). Slovní znak má dvě stránky: Signifiant _ označující, nositel významu, slovní výraz, psané slovo a Singifi‘e – označovaný, vlastní význam slova, obsah, informace. Signifi‘e – má opět dvě stránky: Pojem (denotát) představuje určitou úroveň, objektivitu poznání. Umožňuje více méně přesně identifikovat jednotlivé jevy, přírodniny (např. míry, prostor, houby) i některé společenské jevy a význam (konotát, smysl). Ten je takovým obsahem slova, který na základě představ a individuálních zkušeností je vyvolán ve vědomí. (Zkuste např. definovat „stůl“). Tato stránka může vést k nedorozumění, k nepochopení toho, co má jiný na mysli v důsledku stereotypního uvažování, vyplývajícího z omezené individuální zkušenosti , někdy i ze záměru zkreslovat, zvláště při používání obecných výrazů bez jejich řádného vysvětlení. Další jazykovou formou je definice. Typickým příkladem definice je definice klasická (též úplná či analytická(. Obsahuje definiendum, výraz, který je definován (např. „vjem“). Dále obsahuje definiens, výrok, pomocí něhož definiendum definujeme. V definiens uvádíme na prvním místě nejblíže nadřazený pojem a potom druhové rozlišení, tedy názvy vlastností, které z rozsahu nejblíže nadřazeného pojmu vydělují definovaný jev (definiendum). Příklad definice: vjem je (nebo vjemem rozumíme, tj. definiendum) poznávací psychický proces (nejblíže nadřazený pojem), který je názorný, konkretní a je vyvolaný podněty, které v daný okamžik působí na naše smyslové orgány (druhové rozlišení, to je definiens). Nutno dodat, že někdy je třeba formulovat dílčí definici, např. co znamená výraz „názorný“ apod. Rozsah definienda a definiens je v této definici stejný. Pokud by nebyl, šlo by o definice neúplné nebo pravděpodobnostní. Následující jazykovou formou, jakožto součást subjektivních předpokladů vědeckého poznání je zákon. Výraz „zákon“ používáme ve dvojím smyslu. Jednak pro označení objektivně fungujícího vztahu, který nazýváme „zákonitost“ a jednak pro označení člověkem objevené zákonitosti, kterou nazýváme „vědecký zákon“ nebo prostě „zákon“. Zákony rozlišujeme podle různých kriterií. Hlavním kriteriem je kriterium obsahu., tedy to, kterými vztahy se zákon zabývá. Jde o následující vztahy či souvislosti: Zákony klasifikační, založené na poznání podobnosti, umožňující třídění jevů, Zákony vztahové, založené na poznání souvislostí, vztahů _ relací existujících v rámci individuí,
zákony kauzální, které zavádějí pojem příčiny vyvolávající nějaký účinek a zákony dialektické, které vyjadřují účinek zpětného působení (nikoliv zpětné vazby) na svou vlastní příčinu a na rozdíl od jednosměrného kauzálního působení (formulace autora tohoto textu). Dialektické zákony umožňují pochopení samovývoje. (Další výklad o nich není zařazen.) Na výše uvedené Filkornově klasifikaci zákonů je založen posléze následující výklad metodologie. Další jazykovou formou poznání je teorie. Výraz „teorie“ znamená především soustavu zákonů, pomocí níž vysvětlujeme různé jevy, dění , procesy. Výraz „teorie“ se současně používá ve smyslu (jakéhokoliv) vysvětlování, když např. někdo tvrdí: „Mám na to svou vlastní teorii“. Dále se výraz „teorie“ užívá k označení některých oborů, např. „teorie informace“, „teorie poznání“ nebo uvádění konkrétních způsobů vysvětlování, např. „Eysenckova teorie temperamentu“, Ericksonova teorie vývoje“ apod. Prostudování následující části textu má studenta kvalifikovat k napsání diplomové práce, která by byla založena na vlastním výzkumu. V diplomové práci se předpokládá teoretická část, která dokumentuje výsledek studia zaměřeného na téma diplomové práce a jemuž se chce student ve výzkumné části diplomové práce zabývat. 2. FORMULOVÁNÍ PROMĚNNÝCH, CÍLŮ a HYPOTÉZ 2.1 Proměnné Prvním krokem výzkumu je formulování cíle. Navazuje nejčastěji na odborné zaměření vedoucího diplomové práce. Diplomant se seznání se základními pojmy tématu i s dosavadními poznatky dané oblasti zkoumání. Na základě získaných informací vymezí problém, kterému se chce výzkumně věnovat. Je při tom třeba brát v úvahu i ono formální metodologické hledisko, jak vyplyne posléze z níže uvedeného příkladu. Výhodně lze pro tento účel použít termíny, které se souhrnně nazývají „proměnné“. Rozlišujeme dvě kategorie proměnných. Jednak z hlediska „funkce“ a jednak z hlediska „obsahu“. Proměnné z hlediska funkce. Nezávisle proměnné jsou ty, které působí, které ovlivňují hodnoty závisle proměnné. Mohou být dvojí: žádoucí a nežádoucí. Žádoucí n.p. (v experimentálních výzkumech se nazývají experimentální n.p.“) jsou ty, jejichž účinek či vliv na závisle proměnnou sledujeme. Nežádoucí n.p. jsou dvojí: systematické nežádoucí n.p. a nesystematické nežádoucí n.p. Systematické n.n.p. ovlivňují závisle proměnné jedním směrem, tzn. Buď jenom zvyšují nebo jenom snižují hodnotu žádoucí n.p. Objevují se při splynutí alespoň dvou nezávisle p. z nichž jenom jedna je žádoucí, tj. ta, jejíž účinek sledujeme. Druhá je nežádoucí systematická n.p. jejíž účinek opomíjíme buď z neznalosti nebo z nedbalosti. Závěry zkoumání můžeme potom chybně připisovat účinku
nežádoucí n.p. Např. výskyt úrovně šikany na škole připisujeme věku a pomíjíme vliv ostatních proměnných jako je pohlaví, zájmy, osobnostní vlastnosti aj. Nesystematické n.n.p ovlivňují hodnoty závisle proměnných oběma směry. Způsobují velkou variabilitu, zvyšují rozptyl a ze statistického hlediska snižují statistickou průkaznost výsledků. Závisle proměnné jsou ty, které jsou ovlivňovány nezávisle proměnnými. Jsou to např. odpovědi respondentů, chování zkoumaných osob apod. Nežádoucí na nich může být velká variabilita, kolísání hodnot, jejich nespolehlivost. Tato variabilita není totožná s variabilitou, kterou způsobuje nežádoucí nesystematická n.p. Její příčiny spočívají v povaze závisle proměnné. Příklad. Cíl práce. Cíle mé diplomové práce vycházejí ze studované literatury, dále se opírám o výzkumy, vycházím ze závěrečných poznatků a údajů mé bakalářské práce z roku… a současně vycházím z výsledků Grantu FRVŠ s názvem „Diagnostika rodinného prostředí adolescentů“, jehož jsem spoluřešitelem. Stanovil jsem si tyto cíle: C1: prostřednictvím užitých metod zjistit rozdíly v percepci rodinného prostředí mezi skupinou studentů a delikventů z hlediska pohlaví, C2: zjistit ve kterých dimenzích škály percepce rodinného prostředí (ŠPRP) se dané skupiny nejvíce liší z hlediska pohlaví, věku, bydliště, vzdělání, C3: zjistit, zda se na percepci rodinného prostředí z hlediska úrovně dimenzí a rozdílů mezi nimi výrazně podílí faktor úplnosti či neúplnosti rodinného prostředí. Formulace hypotéz. Studium předešlé literatury ukazuje na možné rozdíly v percepci rodinného prostředí u normálních rodin a rodin delikventů a dále určitých typických charakteristik rodinného prostředí především z hlediska funkčnosti) u těchto skupin. Opírám se o výzkumy rodinného prostředí z hlediska úplnosti a neúplnosti rodiny (E.Ondrušková, M.Krýslová, 1996), dále výsledků terenního šetření, zaměřeného na skupinu mladistvých pachatelů ve věku 15 - 18 let, které uskutečnili pracovníci katedry……..ve spolupráci s pracovníky Manželské a předmanželské poradny v… Současně také navazuji tímto výzkumem na svou bakalářskou práci a vycházím z výsledků Grantu FRVŠ. Stanovili jsme si dva základní okruhy hypotéz H1 (a – e) a H2 (a – k): H1: Bude zjištěn statisticky významný rozdíl alespoň u jedné z uvedených proměnných (KHZ,EMO,KCH, INT,NPR,SOŽ,ŘEŠ, ZÁJ, AUT,ROH,KOM) z hlediska“ a) pohlaví, b)věku, c) vzdělání, d) bydliště, e) úplnosti rodinného prostředí. H2: Budou existovat statisticky významné rozdíly mezi skupinou delikventů a studentů v závislosti na pohlaví v alespoň některé z následujících proměnných: a) koheze (KHZ), b) emocionalita (EMO), c) kontrola chování (KCH), d) komunikace (KOM), e) intimita (IMT), f) normy, pozice, role (NPR), g) sociální
žádoucnost (SOŽ), h) řešení problémů (ŘEŠ), i) zájmy hodnoty (ZÁJ), j) autonomie (AUT), k) rodinné hranice (ROH). Souvislosti a rozdíly mezi úkoly C1 – C3 nejsou jednoznačně vymezeny a jsou pochybně formulovány. Jde o zjišťování percepce rodinného prostředí. Podle úkolu C1 však není zřejmé u koho. Formulace připouští že u mužů-studentů proti ženám-studentkám. Formulace rovněž připouští, že u mužů-delikventů proti ženám-delikventkám, avšak rovněž u mužů-studentů proti mužůmdelikventům a u žen-studentek proti ženám-delikventkám. Rovněž – i když je to nesmysl, ale teoreticky-formálně taková možnost existuje, u mužů-delikventů proti ženám-studentkám a u mužů-studentů proti ženám-delikventkám. V úkolu C1 jde pravděpodobně o celkové skóre ŠPRP na rozdíl od vymezení úkolu C2.Jestliže autor zkoumal skóre delikventů-studentů se skóre nedelikventůstudentů (způsob formulace tomu nasvědčuje) srovnával nesrovnatelné. Dále, autor si neuvědomil (jelikož to neuvedl), že u úkolu C2 jde o dvoufaktoriální výzkumný projekt. Hodnota závisle proměnné nevariuje jenom v závislosti na delikventnosti ale současně také v závislosti na pohlaví. Znázorňuje to následující tabulka: Delikventnost
pohlaví
Delikventi
muži Xn ženy Yn muži Zn ženy Wn
Nedelikventi
Celkové skóre dotazníků ŠPRP skóre jednotlivců součet, prům. rozptyl X1 X2……….Xn dtto Y1 Y2……….Yn dtto Z1 Z2……….Zn dtto W1 W2………Wn dtto
Pomocí analýzy rozptylu 2 x 2 lze testovat statistickou významnost rozdílu mezi oběma uvedenými proměnnými (delikventnost, pohlaví) a jejich dvěma hodnotami. Úkol C2 spočívá ve zjištění jednotlivých dílčích skóre ŠPRP, jichž je 11 (tj. skóre koheze, emocionality, atd.) a „jak se nejvíce liší“ skóre z hlediska jednotlivých nezávisle proměnných (pohlaví, věk, atd.) Tato hlediska však nejsou specifikována kolik jakých hodnot obsahují. U pohlaví je to zřejmé, existují dvě pohlaví. Není uvedeno, kolik a které věkové kategorie, kolik a která bydliště, kolik úrovní a jakého vzdělání ovlivňují závisle proměnné. Není dokonce vyloučeno, že se jedná o jedno bydliště, o věk 15-18 let (tj. všichni respondenti v jedné věkové skupině, tak jak je u úkolu C2 naznačeno. V případě, kde nezávisle proměnné nemají alespoň dvě hodnoty (dvě věkové kategorie, atd.) nelze zjistit vliv této nezávisle proměnné. Aby to bylo možné musí nezávisle proměnná variovat, vystupovat alespoň ve dvou hodnotách. Pokud bychom získali údaje z jednoho místa bydliště, museli bychom v popisu podmínek toto bydliště uvést. Nemůžeme však o tomto místě uvažovat jako o „nezávisle proměnné“, jejíž vliv bychom mohli posoudit.
Úkol C3 je analogický jako úkol C2. Má se zjistit, zda úplnost/neúplnost rodinného prostředí ovlivňuje jednotlivá výše uvedené dílčí skóre. Z formálního hlediska jde o tentýž cíl jako u C2. Proč je uveden zvlášť, mimo úkol C2. Mohl být zařazen pod úkol C2, který by potom obsahoval nikoliv 4 ale 5 dílčích úkolů. Velmi pochybená je formulace „jak se nejvíce liší“. Nejvíce se může lišit jenom jeden případ a při tom ostatní by mohly poskytovat statisticky prokazatelné rozdíly, které by jako neměly stát za pozornost. Rovněž naopak, ten „který se liší nejvíce ze všech“ by vůbec nemusel být statisticky významný. Ve výzkumu jsou podstatná objektivní statistická kriteria a nikoliv vágní hodnocení „co nejvíce“. Tato nedopatření autor poněkud napravuje v rámci formulování hypotéz, kde se zmiňuje o statistické významnosti rozdílů. To však nijak neomlouvá nekvalifikovaný přístup k formulování cílů výzkumu. Problém je však v tom, že jeho hypotézy nejsou konkrétní. Konkrétnost hypotézy spočívá v tom, že hypotéza uvádí předpokládaný výsledek. Autor zatím předkládá rozdíl se zamlčenou otázkou : „ rozdíl v jakém směru“? Konkrétnost je hlavní charakteristikou hypotézy. Nekonkrétní hypotézu nelze potvrzovat ani odmítat. Nikde není uveden předpoklad, že skóre percepce bude vyšší u mužů než u žen nebo u úplné rodiny než u neúplné, atd. Třídění a formulace jednotlivých cílů a hypotéz tohoto výzkumu nemají logiku, postrádají kvalifikaci. Smysluplnost (další vlastnost hypotézy) postrádají uvedené hypotézy tím, že nijak nepomáhají výzkumu, jak konečně může být z textu patrné. Výzkum může být docela dobře proveden bez hypotéz. Podle mého názoru jsou uvedené hypotézy jakousi rádoby falešnou ozdůbkou jakési touhy po „vědeckosti“. Odůvodněnost (další vlastnost hypotézy) uvedených hypotéz lze chápat tak, že výzkum navazuje na jiné výzkumy i výzkum vlastní. Tato návaznost umožňuje předpokládat určité výsledky. Bez konkrétnosti však návaznost sama o sobě k uvádění hypotéz nestačí, nehledě k tomu, že se autor na tyto výsledky v konkrétní podobě neodvolával. Při formulování hypotéz měl autor možná na mysli statistickou nulovou hypotézu (Ho), která nepředpokládá statisticky významný rozdíl .O statistické Ho však v textu není ani zmínky. I v případě formulování Ho a jejího zamítnutí (což by znamenalo, že „je statistiky významný rozdíl“ mezi…) se autor musí závazně vrátit k věcné hypotéze nebo ke zkoumanému problému a uvést smysl, směr rozdílu v podobě formulace např. „ženy dosáhly statisticky významně vyššího skóre v emocionalitě než muži“. Nestačí formulace: „je statisticky významný rozdíl mezi muži a ženami v emocionalitě“! Ve výkladu cílů výzkumu a hypotéz není uveden přesná charakteristika nezávisle proměnných, tj. studentů a delikventů. Jsou zkoumáni studenti delikventi a studenti nedelikventi ? Pro výzkum a jeho validitu je to otázka nejpodstatnější. Autor se k ní nevyjadřuje. Formálně lze srovnávat studenty-
nedelikventy s nestudenty-delikventy avšak bez nároku na jakoukoliv validitu výsledků. Je to kardinální otázka celého výzkumu . Projekt výzkumu mohl být formulován následovně. Všechny skupiny respondentů, podle pohlaví, vzdělání, bydliště, delikvence a věku představují nezávisle proměnné, budou vyšetřeny dotazníkem ŠPRP. Jeho skóre představují hodnoty závisle proměnných. Bude vyhodnocována statistická významnost rozdílů v závisle proměnných mezi skupinami osob pomocí „t“ testu za účelem zjištění statistické významnosti rozdílu v působení nezávisle proměnných . Nezávisle proměnné: Závisle proměnné: ad a) proměnná: pohlaví zvlášť všech 11 skóre ŠPRP hodnoty: muži, ženy ad b) proměnná: vzdělání totéž hodnoty: alespoň dvě (neuvedeny) ad c) proměnná: bydliště totéž hodnoty: alespoň dvě (neuvedeny) ad d) proměnná: věk totéž hodnoty: alespoň dvě (neuvedeny) ad e) proměnná: úplnost rod.prostředí totéž hodnoty: ano, ne ad f) proměnná: delikventnost totéž hodnoty: ano, ne Vcelku by šlo u tohoto výzkumu o 6 jednofaktoriálních výzkumných projektů pokud by závisle proměnnou bylo celkové skóre ŠPRP. Navíc by mohlo jít o 66 (6x11)jednofaktoriálních výzkumů, kde by závisle proměnnou bylo u každého výzkumu jedno z jedenácti dílčích skóre (jednotlivé dimenze ŠPRP). Celý projekt však měl být koncipován jako multifaktoriální, protože se uvažovalo např. o delikvenci „z hlediska pohlaví“. Teoreticky měly být všechny nezávisle proměnné provázány v jeden multifaktoriální projekt, který by obsahoval - v případě kdy by záv. proměnnou bylo celkové skóre - 2 na 6, to je 64 sloupečků údajů. V každém by měl být dostatečný počet osob (resp. údajů či celkové skóre od nich) tj. teoreticky alespoň 30. Což teprve, kdyby měl výzkumník sledovat jednotlivá dílčí skóre, dimenze, kterých bylo 11! V takové podobě by šlo o velmi komplikovaný a rozsáhlý výzkum. Je pravděpodobné, že si to autor neuvědomil, jak vyplývá z naivních formulací cílů a hypotéz. V diplomové práci není nutné „dělat díru do světa“, což by realizování uvedeného výzkumu bylo (byť jenom s celkovým skóre jako nezávisle proměnnou). Úkolem diplomové práce je prokázat schopnost formulovat výzkumný projekt , provést řádně a popsat výběr respondentů, odůvodnit jej, vyhodnotit získané údaje a učinit závěr výzkumného počínání v konfrontaci
s hypotézami (pokud byly formulovány, což nepovažuji vždy za nutné, někdy „méně je více“) i v konfrontaci s výzkumy o kterých autor pojednával v teoretické části práce. Hlavně také svou činnost kultivovaně a kvalifikovaně v diplomové práci prezentovat. V popisovaném případě měl autor v diplomové práci zvážit všechny možnosti, složitosti, organizační, pracovní a časovou náročnost při provedení komplexního výzkumu aby předvedl, že problému rozumí. Potom teprve měl provést výzkum v redukované podobě, tj. provést výzkum pomocí jednofaktoriách výzkumů resp. dvoufaktoriálních. 3. VÝBĚRY ZKOUMANÝCH OSOB V sociálních vědách provádíme výzkum s lidmi, jak s jednotlivci, tak i se skupinami. Pokud provádíme výzkum se všemi prvky určitým způsobem vymezeného souboru osob, mluvíme o základním souboru neboli populaci. Záleží na nás a na předmětu zkoumání jakými hranicemi vymezíme základní soubor. Mohou to být např. všichni policisté v Ostravě, všichni obyvatelé – důchodci konkrétního domova důchodců, žáci šestých a sedmých tříd základních škol v Olomouci, všichni občané v ČR narození v roce 1983 atp. Pokud je základní soubor početný natolik, že bychom v daných časových a jiných pracovních možnostech nemohli šetření provést, musíme provést výběr. Existují tři základní druhy výběru: výběr náhodný, výběr záměrný a výběr nahodilý. Náhodný výběr provádíme podle principu: každý prvek základního souboru má stejnou pravděpodobnost být zařazen do výběru. Nejběžnějším způsobem takového výběru je losování z osudí. Vytvoříme očíslovaný seznam všech prvků základního souboru. Připravíme si lístečky s čísly, která dáme do osudí a vybíráme potřebný počet lístků. Výsledkem náhodného výběru ze základního souboru/populace je reprezentativní výběr neboli vzorek. Výraz „vzorek“ nesmí být použit k označení jiného než náhodného výběru. Náhodných výběrů je několik druhů. Při mechanickém výběru vybereme každý n-tý prvek, podle velikosti zákl. souboru a podle potřebné velikosti výběru. Výběr proporcionální: počet vybraných prvků je úměrný velikosti populace. Při dvoustupňovém výběru vybereme náhodným způsobem jednotky vyššího řádu, např. ze všech střed. Škol v Ostravě vybereme náhodně potřebný počet škol a z nich potřebný počet tříd (např. třetích tříd). Trsový/skupinový náhodný výběr provádíme tak, že náhodně nevybíráme jednotlivce ale skupiny osob, které se vytvořily přirozenou cestou, např. ze seznamu ulic vybereme náhodně potřebný počet ulic a jejich obyvatele podrobíme šetření. Podobně můžeme vybrat např. sedmé třídy základních škol v daném městě, kraji. Předpokládá se, že variabilita uvnitř trsů/skupin (např. tříd) bude větší než variabilita mezi třídami.
Vícestupňový/hierarchický navazuje na trsový/skupinový výběr který provádíme na vyšší úrovni, napřed ve vyšším řádu a potom v řádu nižším. Oblastním/stratifikovaným výběrem se rozumí výběr jedinců v různých oblastech, např.v rozdílných učňovských školách, různých územních celcích, v rozdílných profesích, rozdílném pohlaví,věku atd. Z každé oblasti se vybírá stejné procento prvků. Statistické charakteristiky jsou uvnitř oblasti (např. mezi muži) homogenní a mezi oblastmi heterogenní. Všechny výše uvedené výběry jsou náhodné, reprezentativní. Mezi nenáhodné výběry patří záměrný výběr. Provádíme jej v závislosti nás záměru výzkumu a na možnostech vstupu do příslušné instituce. Dalším nenáhodným výběrem je výběr nahodilý. Spočívá v tom, že požádáme o spolupráci náhodně oslovené osoby na ulici, na zastávce autobusu, u východu/vchodu do supermarketu či v přestávce divadelního představení apod. U posledně dvou uvedených nenáhodných výběrů se neuplatňuje pravidlo náhodnosti. Skupinu osob takto vybranou označujeme jako „soubor“, „nenáhodný výběr“, nikoliv „výběr“ a v žádném případě „vzorek“. V každém případě jsme povinni popsat, jak jsme výběr provedli. Nestačí uvést „provedl jsem náhodný výběr“ . Je nutný konkrétní popis. 4. DRUHY VÝZKUMŮ Druhy výzkumů rozlišujeme jednak podle úrovně poznání a jednak podle způsobu získávání údajů a jejich zpracování.. Podle úrovně poznání je dělíme na výzkumy výskytu, které navazují na poznání klasifikační. Dále na výzkumy spoluvýskytu, které navazují na poznání vztahové . Dalším typem výzkumu jsou výzkumy experimentálního typu, které navazují na poznání kauzální. Poslední jsou výzkumy systémově genetické navazující na poznání dialektické . Posledně uvedené výzkumy přesahují rámec tohoto textu. Podle způsobu získávání údajů a způsobů jejich zpracování rozlišujeme výzkumy na kvantitativní a kvalitativní. 4.1 Výzkumy výskytu Klasifikační poznání umožňuje klasifikovat, třídit jevy. Je vstupním procesem jakéhokoliv poznání i poznání vztahového a kauzálního. Klasifikace vychází ze vztahu podobnosti mezi jevy. Hlavní psychickou činností, která umožňuje třídění jevů je srovnávání. Díky němu můžeme jevy třídit a identifikovat, tj. určit pozorovaný jev, zařadit jej a pojmenovat. Jevy, které jsou ekvivalentní, mají tytéž klasifikační vlastnosti tvoří skupinu – třídu. Cílem klasifikačního poznání je objevit co nejvíce klasifikačních vlastností. Čím více jich objevíme, tím více daný jev poznáme a tím spolehlivěji jej můžeme identifikovat. K identifikaci čehokoliv nám obvykle nestačí jedna vlastnost a navíc téže kategorie jako např. vzhled. ( Abych si nepokazil smaženici z pravých
hřibů musím je odlišit od „hořčáků“ pomocí chuti, protože vzhled mají stejný.) V situaci identifikace jevu jej buď zařadíme do příslušné skupiny nebo nezařadíme. Proto v případě takovéto jednodušší klasifikace hovoříme o klasifikaci dvouhodnotové. Možnost klasifikovat jevy, vymezovat hranice mezi nimi, se vyvíjí. Klasickým příkladem je Aristotelovo dělení živých bytostí na ty, které mají krev a které ji nemají. Posléze byla objevena řada dalších klasifikačních vlastností. Příkladem jsou různé „klíče“ k určování druhů. V tom případě hovoříme o vícehodnotové klasifikaci, když k zařazení potřebujeme nejen dvě ale více vlastností. Když nejsou klasifikační vlastnosti zřetelně a jednoznačně ohraničeny, potom při klasifikaci postupujeme s určitou pravděpodobností. Hovoříme o klasifikaci pravděpodobnostní. Na zkoumaném jevu můžeme rozlišovat část vyhraněnou, jakési jádro a část nevyhraněnou, nejistou. Např. při zkoumání postojů bychom těžko vystačili s otázkami na něž by bylo možné opovědět buď „ano“ nebo „ne“. Proto dotazníky nabízejí škálu možných odpovědí od určité po méně jisté až nejisté. Na klasifikační poznání navazuje výzkum výskytu. Může jít o výzkumy složité a velmi nákladné, které probíhají nejen např. v rámci města, ale i celého státu i celosvětově. Příkladem je celosvětový výzkum kouření, který provádí WHO (Světová zdravotnická organizace). Např. podle Bulletinu Národního centra podpory zdraví č.2 1993 byl v ČR zjištěn 42% výskyt kuřáctví mezi 1524 letými, což je více než 38% v celé populaci. Neustále probíhá výzkum chorob v populaci, hlavně epidemických, politických postojů, výše příjmu, nezaměstnanosti, různých „preferencí“ atp. Vstupní metodou výzkumu výskytu bylo a je pozorování a zaznamenávaní jeho výsledků. Používají se ovšem další metody ankety, dotazníky, rozhovory. Výsledky výzkumu výskytu se zpracovávají popisnou statistikou .Nejjednodušším způsobem zpracování získaných údajů je třídění kvalitativních znaků. Kvalitativní znak (nezaměstnanost, šikana, kouření, spokojenost) buď existuje nebo ne. U kvalitativních znaků nás zajímá zda se vyskytují a v jakém počtu. Výskyt kvalitativních znaků uvádíme četností. Četnosti prezentujeme v podobě čísel uspořádaných do tabulek a grafů nejrůznějšího druhu. Tabulky mohu mít různý stupeň složitosti od jednofaktoriálních (třídění 1.stupně) po tabulky faktoriální či vyšších stupňů třídění. U jednoduchých tabulek třídíme údaje podle jedné nezávisle proměnné (např. čas), která může mít více hodnot (např. měsíce, roky apod.) a která obsahuje hodnoty závisle proměnné např. počty osob. Např. tabulka č. 6 obsahuje dvě tabulky jednofaktoriální (třídění 1. stupně). Tabulka č. 4 je tabulkou dvoufaktoriální. Obsahuje nezávisle proměnnou „čas“ o čtyřech hodnotách.
Tabulka č.6 Vývoj počtu uchazečů se ZPS a volná místa na trhu práce v letech 1991 – 1999 Ke dni
Počet uchazečů – osob se ZPS
podíl počet volných počet osob se z celkového pracovních míst ZPS na 1 volné počtu uchazečů pro osoby se místo pro osoby ZPS se ZPS
31.12. 1991 17032 7,7 % 1016 16,8 31.12. 1992 15502 11,5 % 2316 7,0 31.12. 1993 20016 10,8 % 1666 12,0 31.12. 1994 22015 13,2 % 1418 15,5 31.12. 1995 22687 14,8 % 1506 15,1 31.12. 1996 31455 16,9 % 1489 21,1 31.12. 1997 40295 15,1 % 1420 22,6 31.12. 1998 48951 12,7 % 1515 24,9 31.12. 1999 57615 11,8 % 1349 x Zdroj: Gottwald, J., Šimek, M.: Ekonomika trhu práce II. VŠB – TU, Ostrava, 1997 Tabulka č. 4 Struktura nezaměstnaných podle vzdělání v roce 1998
stav na konci čtvrtletí
struktura nezaměstnaných podle vzdělání Bez vzdělání
základní vzdělání
vyučení
vyšší středoškols odborné ké + vyuč. s mat.
Vysoko školské
I. 2873 94016 118114 61175 768 7139 II. 2411 92879 115309 69228 964 8686 III. 2361 99754 139984 96032 1743 10816 IV. 2521 114667 164552 93502 1399 10227 Zdroj: Statistická ročenka z oblasti práce a sociálních věcí 1998. MPSV, Praha, 1999
Následující tabulka je příkladem třídění 3. stupně, protože reprezentuje 3 nezávislé proměnné: místo, pohlaví a věkovou kategorii. Všechny takové tabulky mají obsahovat jak absolutní, tak relativní četnosti (%), které by měly být uzavřeny součty a hodnotou 100%. V políčkách mimo, okraj tabulky, Jsou uvedeny hodnoty závisle proměnné. Tabulka č. 43c Domov – penzion pro důchodce Věk muži % Abs . 55 – 64 3 13 65 – 74 11 46 75 – 84 9 38 85 – 94 1 4,2 95 – 104 0 0 Celkem 24 100
Orlová Ženy % Abs . 4 11 11 31 18 50 3 8,3 0 0 36 100
Havířov Celkem Celkem Muži ženy celkem muži ženy celkem abs. % abs. % abs. % abs. % abs. % abs. % abs. % 7 12 22 37 27 45 4 6,7 0 0 60 100
11 19 19 37 25 44 21 40 13 23 3 5,8 8 14 6 12 0 0 3 5,8 57 100 52 100
30 46 16 14 3 109
28 42 15 13 2,8 100
14 17 36 44 22 27 9 11 0 0 81 100
23 26 32 36 21 24 9 10 3 3,4 88 100
37 68 43 18 3 169
Pro poučení, jak se třídit nemá, předkládám – z tohoto hlediska – mimořádně „zdařilou“ tabulku.
Dívky Chlapci 3. třída 5. třída Celkem
Ubližovali mi spolužáci 10,35 % 8,22 % 14,64 % 3,85 % 9,38 %
ubližovali mi žáci vyšších tříd 11,49 % 16,44 % 19,51 % 7,69 % 13,75 %
bylo mi ubližováno opakovaně 3,45 % 6,85 % 8,54 % 1,28 % 5%
4.2 Druhy stupnic Tabelovat lze samozřejmě i údaje parametrické, tj. naměřené, vyjadřující míru něčeho, např. postojů, vlastností, zjištěnou např. dotazníky atd. jak se posléze dozvíme.
22 40 25 11 1,8 100
Dosud jsme se zabývali údaji nominálními, které mohou tvořit nominální stupnice. Konkrétní číslo, např. „5“ nemusí znamenat vůbec nic, pokud nevíme, v rámci které stupnice se vyskytuje. V rámci nominální stupnice toto číslo znamená četnost výskytu daného jevu. Východiskem pro identifikaci číselné hodnoty v rámci nominální stupnice je kvalitativní stránka jevu: „je“ nebo „není“ zaměstnán, student, narkoman, důchodce atp. Dalším druhem stupnice je stupnice pořadová. V jejím rámci číslo „5“ znamená, že něco nebo někdo je na pátém místě. Tato stupnice nemá identifikovatelnou velikost intervalů mezi stupni. Jestliže je někdo v běžeckém závodě pátý nevíme, jak daleko je za prvním a jak daleko před šestým. Prakticky, při statistickém výpočtech se s touto stupnicí setkáváme – mj.- tak, že původní naměřené (parametrické) hodnoty, z určitých důvodů (které budou popsány později) převádíme na údaje pořadové. Třetí stupnicí je stupnice intervalová. V jejím rámci vyjadřují číselné údaje velikost intervalu – níž nebo výš – od relativní nuly, která je stanovená konvencí, jako např. nula Celsiovy stupnice tepla. Pětka znamená vzdálenost od nuly, buď nad nulu nebo pod ni. Ve společenských vědách je takovou relativní nulou vypočítaný průměr. Poslední, poměrová stupnice se vyznačuje absolutní nulou, tj. chyběním příslušné vlastnosti. Příkladem jsou délkové míry, kde 5 (cm) znamená přesně vymezený kousek, který je polovinou z deseti a násobkem jedné. V rámci poměrové stupnice lze vykonávat všechny početní operace. V rámci intervalové stupnice lze pouze sečítat a odečítat. Znalost stupnic je důležitá při rozhodování, kterou statistickou metodu můžeme pro danou situaci použít. Pro údaje odpovídající tzv. „metrickým škálám“, intervalové a poměrové, se používají tzv. „parametrické metody“. Pro údaje odpovídající nominální a pořadové stupnici se používají tzv. „neparametrické metody“. 4.3 Statistika teoretická a praktická Pojem „statistika“ nepochybně souvisí s pojmy „status“ „stát“. Statistika je součásti oboru teorie pravděpodobnosti. Je odhadem výskytu jevů, které jsou náhodné. Jsou to jevy možné, nejisté jako je např. objevení se určitého čísla při vrhu kostkou, výsledek sportovního utkání, tahy čísel v loterii, odhad výskytu povětrnostních jevů, chování lidí např. při volbách aj.Tyto jevy nemůžeme předpovídat přesně jako např. pohyb slunce po obloze, ale jenom s určitou "pravděpodobností". Tyto náhodné jevy nejsou „bezpříčinné, jak již bylo uvedeno, jsou „potencionální“. Při využívání statistických výpočtů k vyhodnocování zjištěných dat je důležité uvědomit si, že pravděpodobnost je dvojí“: teoretická (matematická statistika) a praktická.
Pravděpodobnost teoretická či též apriorní odhaduje pravděpodobnost výskytu jevů předem. Úroveň této pravděpodobnosti je dána poměrem jevů příznivých (m) k počtu jevů možných (n). Předem můžeme zjistit jakou máme pravděpodobnost, že při hodu kostkou padne „šestka“: p = m/n = 1/6 = 1.66. Pravděpodobnost praktická, aposteriorní se vztahuje k výsledkům pokusů, které jsme již provedli. Když provedeme např. 60 hodů kostkou a žádané číslo padne dvanáctkrát bude mít pravděpodobnost aposteriorní/praktická p = 12/60 = 0,2. K čemu je teoretická a praktická pravděpodobnost? Jejich srovnání umožňuje odpovědět na otázku, zda námi vypočtený údaj lze považovat za náhodný nebo nenáhodný. Srovnání se provádí pomocí statistických tabulek, jejichž konstrukce je výsledkem teoretické statistiky, stejně jako vzorce, podle nichž počítáme pravděpodobnost praktickou. Tabulky obsahují výpočet meze či hladiny statistické významnosti, která určuje, zda můžeme vypočítané hodnoty (např. rozdíl mezi průměry) považovat za statisticky významné, tzn. nenáhodné, tedy takové, které představují výsledek nějakého vlivu ne je máme považovat za náhodné. Tabulková hodnota je hraniční, dělí číselné údaje na ty, které se vyskytují v oblasti náhody a ty, které představují prokazatelný vliv nezávislé proměnné. Za nenáhodné považujeme ve statistice ty jevy, které se vyskytují s pravděpodobností 95% a více. Zda námi vypočtený údaj padne do oblasti statistické významnosti záleží také na počtu případů, z něhož náš výpočet vychází. Čím větší bude počet případů, tím je hranice teoretické pravděpodobnosti „tolerantnější“ a naopak. Hranice 95% však platí stále. Interval mezi p = 95% (též p = 0,95) p = 99,999% je totiž hranicí, kdy výskyt jevu považujeme za možný. Nad tuto hranici, kdy p = 100 nejde o pravděpodobnost ale o jistotu. Pod hranici 95% řadíme výskyt, který je velmi málo pravděpodobný – nejistý. Nula znamená rovněž jistotu nemožnosti. Nyní se však musíme vyrovnat s problémem, který z určitých důvodů nebudu vysvětlovat. Musel bych tomu věnovat hodně prostoru. Jde o problém formulace zmíněné hladiny významnosti 95%. Statistikové ji vyjadřují úplně jinak, dalo by se říci: „naopak“.Důležitá je přitom tzv. „nulová hypotéza“, kterou značíme Ho. Znamená: není statisticky významný rozdíl např.mezi dvěma průměry.Ho znamená, že průměr jednoho souboru je stejný (ze statistického hlediska) jako průměr druhého, srovnávaného souboru, tedy M1 = M2. Ve statistice vycházíme z Ho. Podle výsledu výpočtu Ho nezamítáme (nepoužíváme formulace „potvrzujeme Ho“) nebo zamítáme Ho, když např. zjistíme statisticky významný rozdíl mezi průměry. V tom případě platí alternativní hypotéza , že je statisticky významný rozdíl mezi průměry. Značíme ji H1: M1 = M2, je to oboustranná alternativní H1. Mohou existovat dvě jednostranné alternativní hypotézy: H1: M1 M2 nebo M1 M2.
Když formulujeme jednostrannou hypotézu předem máme výhodu při určování hladiny významnosti. Když bychom pro jednostrannou alternativní hypotézu zjistili podle statistických tabulek hladinu významnosti 5% , pak můžeme prohlásit, že výsledek odpovídá hladině významnosti poloviční, tj. 2,5%. Při formulování hladiny významnosti používáme výraz „chyby alfa“, značíme ji řeckým písmenem. Chyba alfa znamená pravděpodobnost zamítnutí správné Ho v případě, kdy objektivně platí Ho. My se však při výpočtu dopustíme chyby a prohlásíme, že Ho neplatí, že existuje statisticky významný rozdíl mezi průměry. Symbolem „alfa“ jsou označeny úrovně hladiny významnosti ve statistických tabulkách, které uvádějí nejčastěji hodnoty 5% a 1%. Při statistické významnosti alfa = 5% nebo p alfa = 0,05 zamítáme Ho a považujeme rozdíl mezi průměry za prokázaný na pětiprocentní hladině významnosti. Znamená to, že v pěti případech ze sta v podobných opakovaných šetřeních se můžeme dopustit omylu, že totiž zjišťovaný rozdíl nebude statisticky významný. Hladinu statistické významnosti na úrovni 5% označujeme jako „významnou“ , na úrovni 1% jako velmi významnou. Při určování statistické významnosti srovnáváme vypočtený údaj s tabulkovým. Tabulkové údaje (teoretická pravděpodobnost) jsou předkládány ve sloupcích (u některých tabulek i v řádcích), které jsou označeny hladinou významnosti. V úvodním sloupci po levé straně tabulky jsou uvedeny stupně volnosti, které nejčastěji zjistíme podle vzorce n - 1 , kde n znamená počet případů. Nejčastěji postupujeme při srovnávání tak, že v tabulce hledáme nejblíže vyšší hodnotu (neplatí to však vždy).
Jestliže námi vypočtená hodnota v příslušném řádku ( v závislosti na SV) a v příslušném sloupci (v závislosti na hladině významnosti) je vyšší než tabulková, zamítáme nulovou hypotézu o rovnosti rozdílů Pro ilustraci uvádím záhlaví statistické tabulky pro χ2 (chí kvadrát). Počet stupňů volnosti SV Označován řeckým ν (n) 1 2
α = 0,05
α=0,01
3,84 5,99
6,63 9,21
V této souvislosti je nutné vysvětlit, co jsou to parametrické a neparametrické statistické metody. Zjednodušeně řečeno, parametr znamená vypočtená hodnota, ukazatel, např. průměr. Parametrické metody jsou ty, které jsou založeny na parametrických údajích. Jak bylo uvedeno, patří sem údaje z intervalových a poměrových stupnic. Pro podmínky použití parametrických metod je současně příznačné určité seskupení údajů . Za parametrické údaje se považují ty, které jsou seskupeny „normálně“ tzn., že kdybychom je znázornili graficky, musely by být ohraničeny Gaussovou křivkou. Aby mohly být takto ohraničeny, musí jich být dostatečný počet. Odhad uvádí, že jich má být alespoň 30. Není však nikde zaručeno, že 30 údajů bude takto rozloženo. Gaussova křivka může být různě deformována. Např. její vrchol může být příliš ostrý, může být vychýlen ze středu, může být příliš široký či může mít nepravidelný tvar. Proto musíme zvažovat, zda máme použít parametrické metody. Jsou výhodnější proto, že z údajů dovedou využít více ve smyslu prosazování statistické významnosti než metody neparametrické. Při jejich neoprávněném užití se dopouštíme hrubé chyby, z níž mohou vzniknout neoprávněné závěry. Není chybou použít parametrické metody. Může to být nevýhodné. Výklad se dosud pořád pohybuje v oblasti výzkumu výskytu. Proto je třeba uvést způsoby, jak můžeme prezentovat výsledky výzkumu výskytu. O jednom způsobu byla již zmínka, tj. o četnosti absolutní a relativní s uspořádáním údajů v tabulkách. Dalšími mírami na úrovni nominální stupnice jsou modus a medián. Modus, Mo je nejčastěji se vyskytující četnost nebo naměřená hodnota. Pokud se v řadě zjištěných údajů budou stejně často vyskytovat údaje v maximálním počtu, modem bude jejich průměr. Jestliže v řadě existují dvě navzájem nesouvisející maximální hodnoty, pak obě tyto hodnoty se považují za modus a rozdělení se nazývá „bimodální“ (např. 1,3,3,4,5,5,5,5,6,6,7,7,8,9,9,9,9,10,12, potom Mo1 = 5, a Mo2 = 9). Medián, Me je střední hodnota pod níž a nad níž leží stejný počet údajů nebo naměřených hodnot daného souboru srovnaných podle velikosti. Jestliže má řada sudý počet, potom Me leží mezi dvěma středními hodnotami. Na rozdíl od aritmetického průměru se Me nemusí počítat ze všech naměřených hodnot. Je nezávislý na středních hodnotách.
Ve výzkumu výskytu můžeme zpracovat údaje na úrovni pořadových hodnot pomocí průměrného pořadí. Pořadí: v zařazování žluté barvy na uvedené pořadí v barvovém testu Pořadí 1 2 3 4 5 6 7 8 9 10 11 12 celkem Počet 36 12 8 1 1 60 Průměrné pořadí = 38 x 1 + 12 x 2 + 8 x 3 + 4 x 1 + 9 x + / 60 = 1,73 Další mírou centrální tendence (vedle dříve uvedených Mo a Me) je aritmetický průměr. (Poznámka: v tomto textu nebudu rozlišovat staticické charakteristiky populace a výběrových souborů. Jejich výpočty jsou stejné, rozdíl je ve způsobu označení – v symbolech.) K označování údajů ve statistice používáme různých symbolů: zjištěný údaj – X, průměr – M, součet - Σ, počet údajů – n, rozptyl – s2, , směrodatná (standardní) odchylka – s, xi = „i – tá“ naměřená hodnota. Aritmetický průměr: M = Σ x/ n. Vážený průměr: vypočítáme z aritmetických průměrů jednotlivých výběrů: Mv = M 1.n 1 + M 2.n 2 +… + M k.n k / n 1 + n 2 +… +n k. K celkové charakteristice získaných údajů patří dále míra variability. Nejjednodušší je variační rozpětí: X max - X min. Další je průměrná odchylka od průměru. Vypočítává se jako průměr z absolutních hodnot odchylek všech naměřených hodnot od průměru aritmetického. Nejvýznamnější mírou variability je však rozptyl (variance) s2. Je součtem druhých mocnin odchylek všech naměřených hodnot od aritmetického průměru děleným počtem měření zmenšeným o 1. Při výpočtu se však postupuje podle vzorce, pro nějž není nutné počítat jednotlivé odchylky od průměru, což by bylo velmi pracné. Proto se rozptyl počítá tak, že od součtu čtverců (čili druhých mocnin) všech naměřených hodnot odečteme čtverec (mocninu) součtu všech naměřených hodnot, který jsme dělili počtem naměřených hodnot. Výsledek tohoto výpočtu dělíme n – 1 . Směrodatná odchylka: s = druhá odmocnicna z s2. 4.4 VÝZKUM SPOLUVÝSKYTU Dalším druhem výzkumu je výzkum spoluvýskytu (koincidence). Navazuje na vztahové poznání. Předmětem vztahového poznání je individuum, jedinec jako celek. Takovým jedincem nemusí být jen člověk. Může jím být např. kruh, trojúhelník apod. Každé individuum se vyznačuje vlastnostmi, které jsou společné pro více individuí a současně vlastnostmi, které jsou společné pro více individuí a současně vlastnostmi, které jsou individuální. Např. trojúhelníky mají společnou vlastnost: tři strany, tři úhly, jejichž součet činí 180o. Přesto jsou některé pravoúhlé. Rovnoramenné apod. Klasifikační poznání nám umožňuje poznat, zda ten či onen geometrický tvar patří mezi čtverce, trojúhelníky apod. K analýze trojúhelníků však nestačí. Musíme trojúhelníky rozložit na elementy
a studovat vztahy mezi nimi. Podobně je tomu při studium osobnosti. V rámci vztahového poznávání hledáme části, elementy, „základní kameny individuí“, které se nedají rozložit a současně hledáme vztahy mezi těmito „základními kameny“. Teoreticky můžeme prohlásit, že vztahy, čili relace jsou podmnožinami kartézského součinu. Kartézský součin dvou množin je množinou všech možných dvojic vytvořených z prvků oněch dvou množin. Když množina A má 3 prvky a množina B má 4 prvky, bude mít kartézský součin 3 x 4 = 12 dvojic. Když utvoříme pravidlo, které by určilo způsob uspořádání dvojic pak dostaneme jednu z možných relací, vztahů. Předpokládejme, že prvky X, Z, Y, jsou muži a prvky K, L, M, N jsou ženy. Pravidlo pro uspořádané dvojice: K-X, Y-L, Z-M by mohlo znít manželství. Jde o příklad vytvoření podmnožiny s uspořádanými dvojicemi a vytvoření relace, vztahu. Tato relace je tedy jednou z možných podmnožin. Je docela možné přisoudit těmto prvkům nějaké vlastnosti např. věk nebo výšku příp. i kvalitativní vlastnosti jako je barva očí a zjistit zda se spoluvyskytují u jednotlivých párů a zjistit, zda tento spoluvýskyt je náhodný nebo nenáhodný. To lze učinit pomocí korelací. Než dospějeme k charakteristice korelací a k jejich výpočtům, chtěl bych upozornit na některé stránky minulosti poznávání vztahů. Patří sem např. úvahy i výzkumy souvislostí, spoluvýskytu tělesných vlastností a vlastností psychických. Jde např. o frenologii, zkoumání velikosti a tvaru lebky a psychických, zejména rozumových vlastností. Výzkumy prokázaly, že tato souvislost neexistuje. Mimochodem původní výzkumy tohoto typu nebyly ani podloženy statisticky. Představa o zmíněném vztahu vycházela z jakési „pseudomaterialistické“ a principiálně pochybené představ, že existují jednoznačné biologické - případně i kosmické determinanty psychických schopností a vlastností. Přesto i dnes se takové tendence vyskytují i v podobě jakýchsi „psychodiagnostických služeb“ na principu znovu vydané publikace „Typologie“ od F.N.Čapka. Nejde pochopitelně o výzkumný a metodologicky podložený záměr a výzkum nýbrž o čistě peněžní záležitost. Z historického pohledu můžeme říci, že hlavní metodou získávání údajů vztahového poznání bylo měření, viz např. zmínka o analýze trojúhelníků již v dobách starořeckých. Posléze však byly vytvořeny statistické metody, které nevyžadují k výpočtu korelací kvantitativní míry. Korelace lze počítat i z četností. V úvodu k výkladu o korelacích bych chtěl připomenout, že korelace – obecně – neznamená příčinný vztah, neznamená kauzalitu. Do jisté míry může znamenat vztah příčiny v případě, pokud o jedné proměnné můžeme uvažovat jako o nezávislé proměnné jako je např. věk, pohlaví apod. Hodnota korelačního koeficientu „r“ se může pohybovat v rozsahu +1 přes 0 do –1. Korelace do +1 jsou pozitivní. Znamená to že s růstem jedné hodnoty roste i druhá hodnota. U korelace negativní s růstem jedné hodnoty klesá hodnota druhé proměnné. Nulová korelace znamená, že hodnota jedné proměnné se
může měnit, ale hodnota druhé proměnné se nemění. Úroveň korelace lze dobře znázornit i graficky průsečíky dvou přímek kolmých na osu X a na osu Y a spojením těchto průsečíků do shluků. Čím více se shluk blíží přímce, shluky jsou méně rozptýleny, tím je r statisticky průkaznější a naopak. Čím se současně shluk blíží jedné nebo druhé ose, tím je korelace nižší a naopak. Nulová korelace se může rovněž projevit jako velká rozptýlenost průsečíků. Hodnota korelačního koeficientu . V empirických výzkumech, zvl. V sociálních vědách se hodnota r zdaleka nepřibližuje krajním hodnotám +1 nebo –1. Na korelacích rozlišujeme tedy polaritu (+ nebo -) , dále hladinu statistické významnosti a dále úroveň na korelaci nízkou do r=0.4, střední do 0,6 a na vysokou nad 0,6. Statistická průkaznost korelací záleží mj. hodně na počtu získaných dat. Jestliže je však korelace nízká, tj. do hodnoty 0,4 má prakticky malý význam i když je statistický nenáhodná i na vysoké hladině významnosti. Naopak i vysoký korelační koeficient (nad 0.6), pokud není statistiky významný má problematickou hodnotu, protože je neprůkazný. Statistická významnost se prokazuje (nejen u korelací) statistickými testy. V dalším výkladu se budeme věnovat třem druhům korelačních koeficientů. Prvním je rfí, který vychází z četností – tedy z nominální stupnice – a nazývá se též koeficient asociace. Příklad: skupině osob předložíme například dvě vědomostní zkoušky X a Y. Jejich výsledky hodnotíme jako úspěšné nebo neúspěšné. Číselné hodnoty v tabulce tedy znamenají četnost. V úvahu připadají čtyři možné odpovědivýsledky u 117 osob: vyřešili obě, nevyřešili žádnou, vyřešili první X a druhou Y ne a vyřešili druhou Y a nevyřešili první X zkoušku.
Zkouška
Úspěch Neúspěch Σ
úspěch 59 a 18 c 77
Zkouška x Neúspěch 13 b 27 d 40
Σ 72 45 117
Statistickou významnost pro jakoukoliv korelaci lze zjistit ze statistické tabulky pro korelace, kde pro n 100 a 1% hladinu významnosti je uvedena hodnota 0,254. Tuto hodnotu námi vypočtená hodnota 0,430 překračuje. Znamená to, že výsledek není náhodný. Ke zhodnocení výsledku však takové konstatování nestačí. Musíme se vyjádřit k věcné podstatě. Z výsledku plyne, že je vysoce pravděpodobné, že kdo vyřeší jedno úlohu, vyřeší i druhou a kdo nevyřeší jedno úlohu nevyřeší ani druhou. Zkoušky se zřejmě neliší ani obtížností ani způsobem řešení. Úroveň korelace však patří do nízkých korelací, proto zobecňovat tento Výsledek nelze s dostatečnou jistotou.
Dalším druhem výpočtu je korelace, která vychází z pořadové stupnice. Původně získané údaje jsou naměřené hodnoty avšak je jich málo a nemáme jistotu, že jejich rozložení odpovídá normálnímu (Gaussovu) rozložení. Proto je převedeme na pořadové údaje a k výpočtu použijeme Spearmanův koeficinet korelace rs nebo též rρ (rro). Číselné hodnoty znamenají původně skóre dvou dotazníků X a Y. osoba skóry X skóry Y pořadí X pořadí Y d 1 12 2 14 3 18 4 7 5 19 6 4 7 20 8 11 9 5 10 8 11 17 12 3 Σ 138 rρ = 1 – 6 Σ d2
d2
5 7 3 4 16 17 8 9 -1 1 19 10 11 -1 1 14 4 7 -3 9 18 11 10 1 1 9 2 5 -3 9 16 12 8 4 16 6 6 4 2 4 2 3 1 2 4 12 5 6 -1 1 20 9 12 -3 9 4 1 2 -1 1 142 72 2 / n ( n - 1) = rρ = 1 – 6 . 72 / 12. (144-1) = 1 – 0,252 = 0,748
Kritická hodnota pro SV 10 a 1% hladinu významnosti = 0,7079. Vzhledem k tomu, že námi vypočtená hodnota je vyšší, platí, že odpovědi v dotazníku statisticky prokazatelně na 1 % hladině významnosti souvisí v tom smyslu,že čím vyšší skóre má osoba v jednom dotazníku, tím vyšší bude mít skóre pravděpodobně i ve druhém dotazníku a naopak. Dalším případem výpočtu korelačního koeficientu je Pearsonův korelační koeficient, též nazývaný součinový rxy . Vychází z naměřených údajů, proto patří mezi parametrické metody. Důvodem k jeho použití je dostatečný počet údajů a v podstatě jejich normální rozložení. K ilustraci výpočtu slouží ovšem příklad s malým počtem údajů. Vzhledem k tomu že existuje několik možných postupů k jeho výpočtu, použiji ten nejednodušší: sxy / sx . sy kde sxy = = Σ(Xi – Mx)(Yi - My) / n-1, to je součet násobků rozdílů mezi průměrem hodnot X a jednotlivými hodnotami X a násobkem rozdílů mezi průměrem hodnot Y a jednotlivými hodnotami Y. Subjekt X Y Xi - Mx Yi - My ( Xi - Mx)2 (Yi – My)2 (Xi – Mx)( Yi – My) A B C
3 3 7 5 11 7
-7 -3 1
-3 -1 1
49 9 1
9 1 1
21 3 1
D E Σ
14 6 15 9 50 30
4 5
0 3
16 25 100
0 9 20
0 15 40
Podle výše uvedeného vzorce sxy = 40/4 = 10 Sx (směrodatná odchylka x) = druhá odmocnina 100/4 = 5 Sy (směrodatná odchylka y) = druhá odmocnina 20/4 = 2,24 r = sxy / sx . sy = 10/5.2,24 = 0,89 což je korelace velmi vysoká a podle statistických tabulek pro n = 5 = 0,874 významná na 1% hladině významnosti. V příkladu znamenaly číselné údaje čas potřebný na vyřešení dvou různých úloh. Statisticky významná korelace znamená, že kdo vyřešil jednu úlohu rychle, bude řešit i druhou úlohu rychle. 4.5 VÝZKUM EXPERIMENTÁLNÍ Další úrovní poznání je poznání kauzální a na ně navazující výzkum experimentální. Vztahové poznání tak jako poznání klasifikační, má svoje hranice. Pohybuje se „uvnitř celku“, individua. Kauzální poznání hledá nové danosti a jejich souvislosti se zkoumanou oblastí. Považuje všechno za něčím způsobené a všechno za působící. Problematika kauzality je obsáhlá jak z filozofického hlediska tak i z hlediska metodologického. V našem krátkém přehledu se však musíme věnovat otázkám více praktickým – tedy výzkumu. Experimentální výzkum navazuje na podstatu kauzality. Tou je aktivita, činnost, působení předmětu, nikoliv jeho pouhá existence. Právě tak jako účinek není předmětem ale změnou předmětu. Účinek přebírá aktivitu příčiny, čímžse může s tát příčinou dalších účinků (a – to už jsme mimo kauzální poznání – činitelem, který zpětně ovlivňuje svou vlastní příčinu). Z výše uvedeného plyne, že záměrem kauzálního poznání je poznání příčin, účinků, tedy poznání dynamiky změn, procesů. Výzkum experimentální má tedy ráz a význam vysvětlující. Předcházející úrovně poznání a výzkumů měla ráz popisující. Tomu také odpovídala charakteristika statistických metod – popisná statistika. Zdůvodnění, vysvětlení, argumenty, důkazy mohou být dvojí. Jednak logické a jednak statistické. Logické důkazy vyplývají z podstaty věci a jejího pochopení. Pozoruji-li z mořského břehu připlouvající loď, vidím z ní pouze nejvyšší část. S jejím postupným přibližováním vidím další a další části lodě až nakonec vidím celou loď. Nepředpokládám-li, že se loď vynořuje z moře, nýbrž že připlouvá, musím přistoupit na předpoklad, že mezi mnou jako pozorovatelem a pozorovanou lodí existuje něco, co způsobuje efekt „vynořování se lodi z moře“. Tím něčím může být zakřivený, vypouklý tvar moře. Z takových pozorování mohu vyvodit závěr o kulatosti povrchu země. Měření provedená z tohoto hlediska, konstrukce
poledníků a rovnoběžek, tedy situace, kdy pořád ještě nikdo planetu Zemi neviděl jako kulatou, byla potvrzením původního předpokladu. Hmatatelný důkaz dnes poskytují snímky planety z těles kroužících kolem ní stejně jako výpovědi kosmonautů, kteří tu „kulatou“ Zemi viděli „na vlastní oči“. Jestliže konstruktér kosmické rakety na základě svých znalostí při znalosti gravitačních vlivů v oblasti planety a v přilehlém prostoru ji nasměruje žádaným směrem, je to doklad o platnosti jeho předpokladů na základě nichž raketu konstruoval a řídil. V obou uvedených případech - i když zcela odlišných – se nevylučuje potřeba provést opakování stejných pozorování. Taková pozorování však v podstatě se statistikou jako prostředku argumentace nesouvisejí. Vylučují nebo omezují „pouze“ klamání smyslů a umožňují korigovat nepřesnosti. Pravděpodobnostní důkazy jsou jiné povahy. Týkají se jevů silně variabilních, jejichž průběh nelze vyjádřit jednoznačně platnými pravidly či zákony. Jde o jevy hromadné a nejde jenom o jevy sociální povahy. Očekávání jejich výskytu a průběhu je založeno na „většině“. Nikoliv však na „parlamentní“ většině, jak se někteří méně vzdělaní studenti domnívají, když v diplomové práci tvrdí, že jejich hypotéza se potvrdila, protože výskyt daného jevu dosáhl 51%!!!. Tak takový argument neexistuje. Argumentem je, jak plyne z dřívějšího výkladu, alespoň 95% pravděpodobnost výskytu. Výsledky výzkumu se nedají „odhlasovávat“. Těžko pochopit, z čeho takové iluze pramení – že by z hluboké úcty k parlamentní demokracii? Hranice pα = 0,05 je hranicí spolehlivosti pozorování, nedá se odhlasovat. Pokud někdo statistice nerozumí, má dvě možnosti. Obrátit se na odborníka nebo prostě se statistice vyhnout a nepřekračovat své možnosti. Výzkum i v kontextu diplomové práce neztrácí svou hodnotu pokud je proveden s veškerou odpovědností. Údaje získané seriózním způsobem mohou být pro jiného badatele cenné. Je samozřejmé, že nevyužití možností statistického zpracování údajů se může projevit na klasifikaci diplomové práce. Na vysokoškolské úrovni se znalost statistiky a jejího použití právem předpokládá a vyžaduje. Dalo by se říci, že statistika má tři stupně: získání údajů, jejich zpracování (např. v podobě, přehledů, tabulek, četností, průměrů) a ve vyhodnocení, tj. rozhodování o významnosti. Výzkum experimentální je tedy založen na aktivitě na manipulaci se zkoumaným jevem, na jeho ovlivňování s cílem dosáhnout změny, rozdílu ve stavu „před a po“ zkoumání. Nemusí až tak záležet na tom, kdo tuto změnu způsobuje. Bývá vžitá představa, že to musí být experimentátor. Vůbec nechci tuto představu znevažovat, naopak. Chci upozornit na další možnosti, na to, že změnu způsobuje sám život a výzkumník se dostává ke změně „ex post facto“. Napřed je však třeba charakterizovat experiment. Vyznačuje se třemi charakteristikami. Především, jak bylo uvedeno, je manipulací se zkoumaným jevem. Manipulaci provádíme na základě nějakého předpokladu – hypotézy.
Hypotéza má, na rozdíl od jiných druhů výzkumů (viz předchozí výklad), v experimentálním výzkumu nezanedbatelnou roli. Druhou podstatnou charakteristikou experimentu je nutno srovnávání účinku alespoň dvou nezávisle proměnných, tzn. zjišťování rozdílu v jejich účinku. Proto srovnáváme hodnoty závisle proměnné způsobené experimentální manipulací s hodnotami závislé proměnné způsobené jinou manipulací anebo s hodnotami závislé proměnné nemanipulované. Třetí podstatnou podmínkou experimentování je kontrola. Spočívá v zajištění podmínek, které by bránily nežádoucímu ovlivňování závisle proměnných nežádoucími nezávisle proměnnými a v zajištění reliability, spolehlivosti závisle proměnných. Experimentální manipulace mohou být trojího druhu. 1.Vyvolávání zkoumaného jevu bez záměru jej měnit, ba právě naopak. Zabezpečit jeho „skutečný“ stav, úroveň za účelem zjištění jeho stavu. Takovým experimentem jsou testy. Proto považuji za důležité rozlišovat testy a např. dotazníky, byť v obou případech by šlo o standardizované postupy, což někteří autoři chápou jako ten hlavní důvod k nerozlišování těchto standardních metod. Někteří obě skupiny metod nerozlišují proto, že tomu nerozumí. Mezi oběma metodami je kardinální rozdíl. Standardizovat lze cokoliv, ale při tom to není totéž. Při „testování“ zkoumaná osoba podává příslušný výkon. Zkoumaný jev (např. inteligence) reálně v reálném čase probíhá. Při vyplňování standardizovaného dotazníku zkoumaný proces (extroverze, zátěž apod.) neprobíhá. Je to záležitost paměti a otevřenosti respondenta, nikoliv zkoumané nebo pokusné osoby. 2. Druhým případem experimentu je experiment reprodukující. V tomto případě jde o reprodukci podmínek pro vyvolání a změnu zkoumaného jevu. Tj. experiment ve vlastním slova smyslu. 3. Experiment kreativní, který spočívá v záměrné přeměně daného jevu, v jakési totální manipulaci. Např. Přetvoření nafty v jiný „materiál“, v překonání zemské přitažlivosti, ve výrobě léku, který uzdraví, v „přetvoření“ alkoholika na nealkoholika apod. Výzkum experimentálního typu zahrnuje i takové oblasti, situace, změny, které neprovádí experimentátor, ale život sám. Původně nejde o výzkumný záměr. Ten vzniká až po vzniku změny. Proto se tento výzkum nazývá „ex post facto“. Stane-li se dopravní nehoda, zkoumá se, jak a proč k ní došlo. Nemám na mysli běžnou policejní rutinu, kdy se zkoumá porušení dopravních předpisů. K nehodě může dojít i bez jejich porušení a naopak, nemusí k ní dojít při jejich porušení. Může být zkoumán „nehodář“ nebo např. situace, kdy nebo kde dochází k nehodám častěji. Ono častěji by však mělo být podchyceno statisticky aby byla vyloučena možnost náhody. Když na tzv. nebezpečném úseku, např. kolem N.Jičína se postaví překážka v podobě rozdělení dvou jízdních směrů, mohla by
se statisticky porovnat četnost dopravních nehod se situací, kdy tam ona překážka nebyla a statisticky prokázat, že počet nehod se statisticky významně snížil a doložit tak, že opatření splnilo svůj účel. Při tom nešlo o výzkumný záměr, ale o zásah do situace za jiným, nikoliv výzkumným účelem. Ten může vzniknout „ex post“. Porovnáním četností (ovšem z proporcionálního hlediska, tzn. při respektování hustoty provozu před a po opatření) bychom provedli výzkum „experimentálního typu“ – výzkum „ex post facto“. Proto tvrdím, že cestou k výzkumům tohoto typu je statistické vyhodnocování tabulek s výskytem čehokoliv za rozdílných podmínek, které potvrdí, že došlo či nedošlo ke statisticky, tedy nikoliv náhodně, prokazatelné změně. Studenti by se neměli v diplomové práci založené na výzkumu výskytu vyhýbat statistickému vyhodnocování získaných údajů pomocí testů zjišťujících významnost rozdílů. Nelze se spokojit pouze s transformací četností na procenta v různých tabulkách. Ty by měly být východiskem pro statistické vyhodnocování. Jde o metody zjišťující statistickou významnost rozdílů mezi průměry i četnostmi. Přehled těchto metod bude předložen v tabulce při konzultaci. Bude to samozřejmě pouze poměrně chudý výběr. K dalšímu zdokonalování je třeba studovat příslušné příručky nebo využívat konzultace. Stejně jako dříve uvedené statistické metody, jsou i metody pro zjišťování významnosti rozdílů roztříděny podle stupnic. Navíc však je třeba brát v úvahu, zda jde o údaje závislé(korelované) či nikoliv. První skupina testů je založena na testech „dobré shody“, které se označují malým řeckým písmenem chí2, nazývají se „chí kvadrát“- χ2 . Tyto testy se zabývají četností. Jako první uvádím jednoduchý příklad pro „zácvik“. V tomto příkladu máme dvě „pozorované - O“, zjištěné, četnosti (musí být pochopitelně alespoň dvě). Jedna : 63 odpovědí „ano“ a druhá: 37 odpovědí „ne“. Chceme zjistit, zda rozdíl mezi jejich počtem je dílem náhody nebo zda se uplatňuje nějaké pravidlo. Vypočteme „očekávané - E“ podle vzorce E = n/k (celkový počet dělíme počtem skupin/kategorií) = 100/2 = 50. Zjistíme rozdíl O – E v jednotlivých kategoriích, tj. 63 – 50 = 13 a 37 – 50 = 13. Hodnotu obou těchto rozdílů umocníme (O – E)2 tj. 169, 169 a každou zvlášť dělíme E = (O-E)2 / E = 169/50 = 3,58. Konečnou hodnotu chí2 dostaneme součtem obou podílů 3,58 + 3,58 = 6.76 = χ2 . Ve statistických tabulkách (budou k dispozici při konzultaci) pro chí2 a pro SV = k – 1 = 2 – 1 = 1 (hledáme tedy na 1. Řádku) najdeme ve sloupci pro 5% hladinu významnosti příslušnou kritickou hodnotu a srovnáme ji s hodnotou vypočtenou. Pokud je vypočtená hodnota vyšší než tabulková prohlásíme, že rozdíl mezi 63 a 37 je statisticky významný na 5% hladině významnosti. Rozdíl tedy není náhodný. Pokud však s ním není spojena nějaká věcná charakteristika nemůžeme se k příčině rozdílu vyjádřit. Kdyby však např. v jedné skupině byli muži (63) a ve druhé ženy (37) a ptali jsme se
jich např. na možnost trestat děti tělesnými tresty, mohli bychom učinit závěr, že o kladném vztahu k tělesným trestům rozhoduje pohlaví ve „prospěch“ mužů. Z metodologického hlediska by však takový postup byl pochybený, protože zřejmě nebyl proveden správný výběr, jelikož se ve výpovědích neobjevily žádné odpovědi „ne“ u mužů a „ano“ u žen. Pro takový případ, kde máme 4 kategorie odpovědí (muži: ano – ne, ženy: ano – ne) je však třeba použít jiného vzorce. Uvádím další příklad k výpočtu podle výše uvedeného postupu. Tabulky k vyhodnocení však budou k dispozic až na konzultaci. Příklad: 196 příležitostně osloveným byl předložen dotazník, v němž měly respondenti odpovědět na jednu otázku výběrem ze sedmi možností. Kategorie možných odpovědí: 1 2 3 4 5 6 7 Pozorované četnosti O: 9 41 46 11 40 5 44 Očekávané četnosti E: 28 28 28 28 28 28 28 Důležitou skupinou testů pro zjišťování statistické významnosti rozdílů mezi průměry jsou Studentovy t testy. Patří mezi parametrické metody. Ty hlavní jsou 3. První se týká situace, kdy rozptyly obou souborů se statisticky významně neliší. Zda se liší nebo nikoliv zjistíme pomocí F (Fišerova) testu, kterým porovnáváme vypočítané rozptyly. Příklad: Porovnáváme rozdíl mezi skupinou 12 chlapců a 14 dívek v odpovědi na dotazník. Průměrné skóre chlapců: M1 = 99,67, s 21 = 192,5. Hodnoty zjištěné u dívek: M2 = 102,0, s22 = 195,9. Napřed musíme provést F test, abychom zjistili, zda se oba rozptyly liší. F test provedeme porovnáním obou rozptylů tak, že větší s2 dáme do čitatele a menší do jmenovatele: 195,9/192,9 = 1,018. V tabulkách pro F test budeme hledat v tabulce (podle konstrukce tabulky) pro α 0,05 ve sloupci, které jsou určeny pro SV 14-1=13 pro větší rozptyl a v řádcích pro menší rozptyl pro SV : 12-1=11 (nebo pro hodnoty SV nejbližší podle konstrukce tabulky F. V průsečíku nalezneme hodnotu (podle jemnosti rozlišování konkrétní tabulky)F = 2,978, což je hodnota vyšší než hodnota námi vypočtená. Z toho plyne, že není statisticky významný rozdíl mezi oběma rozptyly. Rozhodneme se pro ten druh t testu, který je konstruován pro tento případ, tj. pro případ rovnosti rozptylů. Vzorec pro výpočet tohoto příkladu bude k dispozici a vysvětlen na konzultaci. Stejně i způsoby výpočtu pro další dva t- testy.