Zprávy - Psychologický ústav AV ČR
Tomáš Urbánek Optimální škálování Testu sémantického výběru
Roč. 7, 2001, č. 1
ISSN: 1211-8818
AKADEMIE VĚD ČESKÉ REPUBLIKY PSYCHOLOGICKÝ ÚSTAV VEVEŘÍ 97, 602 00 BRNO tel.: 05/41636281 e-mail:
[email protected]
Zprávy
Optimální škálování Testu sémantického výběru Tomáš Urbánek
Roč. 7, 2001, č. 1
ISSN: 1211-8818
Optimální škálování Testu sémantického výběru Tomáš Urbánek Psychologický ústav AV ČR Veveří 97, 602 00 Brno Úvod O tom, že Test sémantického výběru by se mohl stát atraktivní psychodiagnostickou metodou, se zmiňuje Smékal (1990). Uvádí také původní metodu zpracování výsledků testu, která se do té doby šířila patrně pouze ústním podáním a na základě „manuálu“ od neznámého autora. Tato metoda spočívá ve výběru vhodné dvojice referenčních pojmů, zjištění počtu shodných obrázků každého pojmu s těmito referenčními pojmy a konečně zakreslení jednotlivých pojmů do pravoúhlé mřížky těmito referenčními pojmy definované. To, že zmíněný postup je hrubě zavádějící, se autor již pokoušel (Urbánek, 1999; 2000) doložit. V tomto sdělení se pokusí popsat jednu z alternativních metod, která by mohla být užitečná jak pro výzkum formálních (psychometrických) a obsahových (teoreticky relevantních) vlastností tohoto testu, tak pro jeho praktické použití v psychodiagnostice. Administrace testu sémantického výběru Test sémantického výběru je tvořen sadou verbálních podnětů a sadou šestnácti obrázků. Verbální podněty mohou představovat vhodně vybrané pojmy, osoby z rodinné konstelace, z pracovního nebo školního kolektivu probanda, případně konstrukty získané pomocí metody repertoárových mřížek. Obrázky tvoří jednoduché symboly (viz obr. 1). Úkolem probanda je pro každý verbální podnět vybrat vhodné obrázky – v původní podobě to bylo osm obrázků pro každý podnět (Smékal, 1990), autor však navrhuje, aby tento počet byl ponechán částečně na volbě samotného probanda (např. stanovením rozmezí vybraných obrázků na 4-12).
1
Obr. 1: Obrázky v Testu sémantického výběru
Data, která tímto způsobem pro každého probanda vzniknou, představuje seznam verbálních podnětů, ve kterém je pro každý podnět uveden seznam obrázků, které k němu byly vybrány. Tento seznam lze upravit do podoby tabulky společného výskytu verbálních podnětů a obrázků, čímž se sice ztratí informace o pořadí voleb obrázků pro jednotlivé pojmy, ale vytvoří se možnost takto vzniklou tabulku analyzovat jako tabulku podobností mezi obrázky a pojmy, což je základní podoba dat používaná v psychosémantice pro účely tzv. rekonstrukce individuálních sémantických prostorů (Šmelev, 1983). V tabulkách 1 a 2 je zobrazen příklad konverze seznamu, který uvádí Smékal (tab. 1; podle Smékala, 1990), na tabulku společných výskytů (tzv. incidencí, Nishisato, 1994). Každá položka v seznamu vlastně vstupuje jako jednotka do příslušné buňky definované verbálním podnětem a obrázkem. Tab. 1: Tabulka vstupních dat podle Smékala (1990) 1. 2. 3. 4. 5. 6. 7. 8. 9. 10.
Já Láska Nebezpečí Nenávist Poznání Psychologie Radost Sebeovládání Smutek Umění
1 1 2 2 1 1 1 2 2 1
2 6 3 3 2 2 2 3 3 2
3 8 4 4 5 5 6 6 5 7
4 9 5 5 6 6 8 7 7 8
7 10 10 7 9 7 9 9 10 9
14 12 12 10 11 9 11 11 11 11
15 13 15 11 12 11 13 14 14 13
16 15 16 12 15 15 14 16 16 15
2
Tab. 2: Incidenční tabulka dat podle Smékala (1990) Obrázky Verb. podněty O1 O2 O3 O4 O5 O6 O7 O8 O9 O10 O11 O12 O13 O14 O15 O16 Celkem Já 1 1 1 1 0 0 1 0 0 0 0 0 0 1 1 1 8 Láska 1 0 0 0 0 1 0 1 1 1 0 1 1 0 1 0 8 Nebezpečí 0 1 1 1 1 0 0 0 0 1 0 1 0 0 1 1 8 Nenávist 0 1 1 1 1 0 1 0 0 1 1 1 0 0 0 0 8 Poznání 1 1 0 0 1 1 0 0 1 0 1 1 0 0 1 0 8 Psychologie 1 1 0 0 1 1 1 0 1 0 1 0 0 0 1 0 8 Radost 1 1 0 0 0 1 0 1 1 0 1 0 1 1 0 0 8 Sebeovládání 0 1 1 0 0 1 1 0 1 0 1 0 0 1 0 1 8 Smutek 0 1 1 0 1 0 1 0 0 1 1 0 0 1 0 1 8 Umění 1 1 0 0 0 0 1 1 1 0 1 0 1 0 1 0 8 Celkem 6 9 5 3 5 5 6 3 6 4 7 4 3 4 6 4 80 Pozn.: V tabulce 2 jsou z důvodů úspory místa názvy obrázků nahrazeny symboly O1 (Slunce), O2 (Měsíc), O3 (Mříž), O4 (Červ), O5 (Hrob), O6 (Loďka), O7 (Pavučina), O8 (Ústa). O9 (Strom), O10 (Dýka), O11 (Oko), O12 (Had), O13 (Květina), O14 (Ryba), O15 (Dům) a O16 (Voda).
Výhodnost takto upravených dat spočívá v tom, že umožňují zpracování pomocí vhodných statistických metod. Šmelev (1983) uvádí, že lze uvažovat o následujících dvou způsobech organizace individuálních sémantických prostorů: 1) paradigmatickém, u kterého je každý objekt (v tomto případě verbální podnět nebo obrázek) umístěn v prostoru definovaném vhodnými souřadnicemi, takže na každý objekt se používají stejná kritéria; 2) hierarchickém, ve kterém se na různé skupiny objektů uplatňují různá kritéria a výslednou strukturu lze zobrazit jako stromový graf – zvláštním případem takové struktury může být stromový graf o hloubce 1, ve kterém se vytvoří několik shluků na stejné úrovni. Každému způsobu organizace významů by měla odpovídat vhodná metoda statistické analýzy dat, dávající výsledky homomorfní s očekávanou strukturou. Pro paradigmatický způsob organizace významů je nejvhodnější metodou nějaká metoda analýzy, která jednotlivým objektům přiřazuje souřadnice – faktorová analýza, mnohorozměrné nebo optimální škálování. Pro hierarchický způsob organizace je nejvhodnější některá metoda shlukové analýzy nebo různé další metody empirické klasifikace (např. algoritmus CHAID apod.). Metoda, které je věnována tato práce, předpokládá paradigmatickou formu organizace individuálních sémantických prostorů. Tento předpoklad je zřejmě nutné dále testovat, aby se vymezily hranice jeho platnosti – např. pro jaký sémantický materiál nebo pro jaké osoby je možné ho považovat za platný. Nicméně dále popsaná metoda představuje jednu z možností, jak tento předpoklad metodologicky uchopit.
3
Vlastnosti optimálního škálování individuální incidenční matice Optimální škálování incidenční matice, jejíž příklad je uveden v tabulce 2, nebo konkrétněji tzv. korespondenční analýza takového formátu dat (van de Geer, 1993a; 1993b), není ničím jiným než analýzou hlavních komponent pro dvě skupiny kategoriálních proměnných (jednu sadu představují volby obrázků pro zvolené verbální podněty, druhou sadu představují pojmy, pro které byly zvoleny jednotlivé obrázky) nebo také nelineární analýzou hlavních komponent kategorií dvou nominálních proměnných. Cílem tohoto typu analýzy je najít pro jednotlivé objekty (verbální podněty a obrázky) takové souřadnice, které budou maximalizovat lineární korelaci mezi obrázky a verbálními podněty, což je podle autora implicitní předpoklad tvůrce a uživatelů Testu sémantického výběru (totiž že volbami obrázků pro jednotlivé verbální podněty se projevují důležité individuální zákonitosti psychiky daného probanda). Na základě unáhlené úvahy by se mohlo zdát (a skutečně byl tento názor na počátku století mezi statistiky rozšířen), že vhodnou volbou souřadnic je možné dosáhnout libovolné hodnoty korelace mezi jednou a druhou sadou objektů, tedy i korelace představující dokonalý vztah (r = 1). Později bylo ale dokázáno, že pro každou incidenční tabulku existuje maximální korelace mezi dvěma sadami objektů, která je obecně menší než 1 (van de Geer, 1993a; 1993b). Metoda optimálního škálování je v současnosti již podrobně rozpracována v mnoha publikacích (např. van de Geer, 1993a; 1993b; Nishisato, 1994) a v této práci je možné uvést pouze zlomek jejích vlastností. Přesto je nutné ještě dodat, že optimální škálování hledá souřadnice analyzovaných objektů obecně v několika dimenzích – maximální počet dimenzí je dán minimem z počtů objektů v obou sadách, od kterého se odečte 1. To znamená, že každá dimenze představuje jeden aspekt vzájemného vztahu obou sad objektů. V praxi se patrně osvědčí pouze několik málo dimenzí (2-3). Důležitou vlastností metody je přitom nekorelovanost jednotlivých dimenzí. Uvedené vlastnosti naznačují důvod, proč bývá korespondenční analýza nazývána někdy faktorovou analýzou kategoriálních dat. Numerický postup Postup, pomocí kterého lze nalézt optimální souřadnice objektů (verbálních podnětů a obrázků) v předem stanoveném počtu dimenzí, se nazývá metoda recipročních průměrů (reciprocal averaging) nebo také metoda alterujících nejmenších čtverců (alternating least
squares) (Nishisato, 1994). Její základní princip využívá dalších důležitých vlastností
4
hledaného řešení (v následujícím textu půjde už konkrétně o obrázky a verbální podněty Testu sémantického výběru): 1) V každé dimenzi se souřadnice všech obrázků rovnají váženým aritmetickým průměrům souřadnic těch verbálních podnětů, pro které byly tyto obrázky vybrány, a naopak – souřadnice jednotlivých verbálních podnětů se rovnají váženým aritmetickým průměrům obrázků, které byly daným verbálním podnětům přiřazeny. Tato vlastnost se odráží v názvu
metody recipročních průměrů. 2) V první dimenzi řešení se prostřednictvím hledání vhodných souřadnic maximalizuje lineární korelace mezi verbálními podněty a obrázky, což se provádí tak, že se postupně hledá optimální regresní přímka závislosti verbálních podnětů na obrázcích, potom regresní přímka závislosti obrázků na verbálních podnětech, potom opět závislost verbálních podnětů na obrázcích atd. Z toho důvodu se metodě říká také metoda alterujících nejmenších čtverců. Tato metoda je základem několika statistických procedur, z nichž nejjednodušší (a pro data z Testu sémantického výběru postačující) je metoda korespondenční analýzy. Tato metoda je součástí různých statistických počítačových programů, jako jsou např. SPSS nebo BMDP. Protože jsou ale tyto softwarové produkty poměrně specializované a obsahují množství dalších procedur, které nejsou pro popisovanou metodu potřebné (a také nepatří k nejlevnějším), je třeba popsat postup, který by se dal realizovat s minimálním softwarovým vybavením. Celý postup obsahuje několik kroků, které lze opakovat pro každou následující dimenzi. Nejprve je to volba vhodných počátečních hodnot souřadnic pro zvolenou sadu objektů (např. pro obrázky se zvolí jejich pořadová čísla), od kterých začne hledání řešení. Potom se pokračuje tak, že se souřadnice pro verbální podnět vypočte jako vážený průměr souřadnic obrázků, které byly pro daný verbální podnět vybrány. Potom se postupuje stejným způsobem pro souřadnice obrázků – vypočítají se jako průměry souřadnic verbálních podnětů, pro které byl daný obrázek vybrán. Celý postup se opakuje střídavě pro sadu obrázků a verbálních podnětů tak dlouho (tzv. iterace), dokud se souřadnice mění – dokud není dosaženo tzv. konvergence. Aby se nestalo, že by hodnoty souřadnic neustále rostly nebo oscilovaly, uplatňuje se transformace, která zajišťuje, aby v každé iteraci měly souřadnice v rámci každé sady nulový vážený průměr (od souřadnic se odečte jejich průměrná hodnota) a maximální absolutní hodnotu 1 (hodnoty souřadnic se dělí maximem z jejich absolutních hodnot).
5
Po nalezení optimálních souřadnic verbálních podnětů a obrázků se vypočte korelace reprezentující vztah mezi oběma sadami. Potom se původní incidenční matice transformuje tak, že se od jejích jednotlivých buněk odečte hodnota představující část vztahu mezi řádkovými a sloupcovými kategoriemi tabulky „vysvětlenou“ první dimenzí řešení. Takto upravená matice pak tvoří novou incidenční tabulku (tedy data), kterou lze použít pro hledání optimálních souřadnic v další dimenzi. Celý postup tak lze opakovat od začátku, až do dosažení maximálního počtu dimenzí. Po zjištění optimálních souřadnic verbálních podnětů a obrázků v každé dimenzi je třeba tyto souřadnice transformovat tak, aby bylo možné obě skupiny objektů (verbálních podnětů a obrázků) zobrazit společně v jednom grafu. Příklad postupu V této práci bude k ilustraci celého postupu použit příklad již uvedený v tab. 1 (podle Smékala, 1990) a tab. 2 (incidenční tabulka). Vstupní data představuje právě incidenční tabulka a marginální (řádkové a sloupcové) součty. Vzhledem k tomu, že použitá data byla získána procedurou, která nutí probanda vybrat ke každému verbálnímu podnětu přesně 8 obrázků, jsou všechny řádkové součty rovny hodnotě 8. Sloupcové součty se od sebe liší a vyjadřují v podstatě popularitu jednotlivých obrázků. Počáteční hodnoty a první iterace Vzhledem k tomu, že Test sémantického výběru je tvořen variabilním počtem verbálních podnětů, ale vždy stejným počtem obrázků, budou počáteční hodnoty zvoleny pro obrázky (pokud bychom se ale rozhodli zvolit počáteční hodnoty pro verbální podněty, na celém postupu by to nic nezměnilo). Budou použita pořadová čísla obrázků. Celý postup volby počátečních hodnot je shrnut v tab. 3:
6
Tab. 3: Volba počátečních hodnot Obrázek Slunce Měsíc Mříž Červ Hrob Loďka Pavučina Ústa Strom Dýka Oko Had Květina Ryba Dům Voda Vážený průměr Minimum Maximum
Počáteční hodnota 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 8 1 16
Po odečtení váženého průměru -7 -6 -5 -4 -3 -2 -1 0 1 2 3 4 5 6 7 8 0 -7 8
Po dělení maximem z absolutní hodnoty -0,875 -0,750 -0,625 -0,500 -0,375 -0,250 -0,125 0,000 0,125 0,250 0,375 0,500 0,625 0,750 0,875 1,000 0,000 -0,875 1,000
Postup je tedy jednoduchý – nejprve se zvolí počáteční hodnoty pro každý obrázek (dobré je volit pro každý objekt jinou hodnotu), vypočte se jejich vážený průměr (v tomto případě 8), který se v druhém kroku od každé z počátečních hodnot odečte, z těchto výsledných hodnot se vybere maximální absolutní hodnota (tedy 8), a tou se všechny hodnoty z druhého kroku vydělí. Tím ve třetím kroku vzniknou počáteční hodnoty souřadnic pro každý obrázek, které mají tu vlastnost, že jejich vážený průměr je roven 0 a všechny patří do intervalu od –1 do 1. Výpočet váženého průměru probíhá tak, že se jednotlivé hodnoty souřadnic násobí počtem objektů (řádkovým nebo sloupcovým součtem podle toho, zda se jedná o verbální podněty nebo obrázky), tyto hodnoty se sečtou a dělí celkovým počtem provedených voleb (tzn. celkovým součtem incidenční tabulky – v tomto případě 80). Konkrétně v tomto případě je postup výpočtu váženého průměru pro počáteční hodnoty souřadnic obrázků následující:
6 ⋅1 + 9 ⋅ 2 + 5 ⋅ 3 + 3 ⋅ 4 + 5 ⋅ 5 + 5 ⋅ 6 + 6 ⋅ 7 + 3 ⋅ 8 + 80 6 ⋅ 9 + 4 ⋅ 10 + 7 ⋅ 11 + 4 ⋅ 12 + 3 ⋅ 13 + 4 ⋅ 14 + 6 ⋅ 15 + 4 ⋅ 16 + =8 80 Je zjevné, že tyto souřadnice jsou zcela závislé na volbě počátečních hodnot, a tak jsou naprosto libovolné. V dalších krocích je proto nutné tyto počáteční hodnoty korigovat daty. Např. pro pojem „Já“ byly vybrány obrázky s pořadovými čísly 1 (Slunce), 2 (Měsíc), 3 (Mříž), 4 (Červ), 7 (Pavučina), 14 (Ryba), 15 (Dům) a 16 (Voda). Souřadnice pojmu „Já“ pak
7
bude vypočtena jako vážený průměr souřadnic uvedených osmi obrázků. Pro pojem „Já“ je výsledná souřadnice rovna:
1 ⋅ (−0,875) + 1 ⋅ (−0,75) + 1 ⋅ (−0,625) + 1 ⋅ (−0,5) + 1 ⋅ (−0,125) + 1 ⋅ 0,75 + 1 ⋅ 0,875 + 1 ⋅ 1 = 8 = −0,0313 x 1Já =
Tímto způsobem se postupuje také u souřadnic ostatních pojmů, čímž se získají hodnoty uvedené ve druhém sloupci tabulky 4 (Průměr souřadnic obrázků). Tyto hodnoty je opět nutné centrovat odečtením jejich aritmetického průměru ve sloupci 3 (Po odečtení průměru) a normalizovat dělením maximální absolutní hodnotou sloupce 3, čímž ve sloupci 4 (Po dělení maximem z absolutní hodnoty) vzniknou souřadnice verbálních podnětů. Tab. 4: První iterace souřadnic verbálních podnětů Verbální podn t Já Láska Nebezpe í Nenávist Poznání Psychologie Radost Sebeovládání Smutek Um ní
Pr m r Po ode tení Po d lení maximem sou adnic pr m ru z absolutní hodnoty obrázk -0,0313 -0,0313 -0,2 0,1563 0,1563 1,0 0,0469 0,0469 0,3 -0,1563 -0,1563 -1,0 -0,0469 -0,0469 -0,3 -0,1250 -0,1250 -0,8 0,0000 0,0000 0,0 0,0625 0,0625 0,4 0,0625 0,0625 0,4 0,0313 0,0313 0,2
Pr m r Minimum Maximum
0,0000 -0,1563 0,1563
0,0000 -0,1563 0,1563
0,0 -1,0 1,0
Opět je zřejmé, že vzhledem k tomu, že souřadnice obrázků byly zvoleny libovolně, také souřadnice verbálních podnětů jsou touto libovolností zatíženy. Z toho důvodu se také počáteční souřadnice obrázků korigují pomocí dat a souřadnic verbálních podnětů uvedených v tabulce 4. Opět se pro každý obrázek vypočte vážený průměr, a to ze souřadnic těch verbálních podnětů, pro které byl vybrán. Např. obrázek Slunce byl vybrán pro verbální podněty Já, Láska, Poznání, Psychologie, Radost a Umění. Jejich souřadnice budou použity pro výpočet průměru:
x1Slunce =
1 ⋅ (−0,2) + 1 ⋅ 1,0 + 1 ⋅ (−0,3) + 1 ⋅ (−0,8) + 1 ⋅ 0,0 + 1 ⋅ 0,2 = −0,0167 6
8
Opakováním výpočtu vážených průměrů pro všechny obrázky a jejich centrováním a normalizací jako v předchozích případech se získají nové, korigované hodnoty souřadnic obrázků uvedené v tabulce 5. Tab. 5: První iterace souřadnic obrázků Obrázek Slunce Měsíc Mříž Červ Hrob Loďka Pavučina Ústa Strom Dýka Oko Had Květina Ryba Dům Voda Průměr Minimum Maximum
Průměr souřadnic Po odečtení verbálních podnětů průměru -0,0167 -0,0167 -0,1111 -0,1111 -0,0200 -0,0200 -0,3000 -0,3000 -0,2800 -0,2800 0,0600 0,0600 -0,1667 -0,1667 0,4000 0,4000 0,0833 0,0833 0,1750 0,1750 -0,1571 -0,1571 0,0000 0,0000 0,4000 0,4000 0,1500 0,1500 0,0333 0,0333 0,2250 0,2250 0,0000 0,0000 -0,3000 -0,3000 0,4000 0,4000
Po dělení maximem z absolutní hodnoty -0,0417 -0,2778 -0,0500 -0,7500 -0,7000 0,1500 -0,4167 1,0000 0,2083 0,4375 -0,3929 0,0000 1,0000 0,3750 0,0833 0,5625 0,0000 -0,7500 1,0000
Další postup V předchozích odstavcích byla popsána „jednotka“ postupu numerického odhadu, které se říká iterace, v tomto případě konkrétně první iterace optimálního škálování výsledků Testu sémantického výběru. Tímto způsobem se pokračuje dále – právě získané souřadnice obrázků z 1. iterace se spolu s daty použijí pro výpočet 2. iterace souřadnic verbálních podnětů, ty se spolu s daty použijí pro výpočet 2. iterace souřadnic obrázků atd. Tento postup spolehlivě konverguje, tzn. vede k odhadu jedinečných hodnot souřadnic objektů (verbálních podnětů a obrázků). To neznamená, že všechny objekty musí mít nutně různé souřadnice. Pokud by např. dvěma verbálním podnětům byly přiřazeny totožné sady obrázků, tyto verbální podněty by měly stejné souřadnice. Podobně by tomu bylo u dvou obrázků přiřazených stejným verbálním podnětům (viz např. v tab. 5 souřadnice obrázků „Květina“ a „Ústa“). Jedinečnost hodnot souřadnic neznamená nic jiného, než vlastnost řešení, při kterém se při různých počátečních hodnotách souřadnic na konci řešení dospěje pokaždé ke stejným optimálním hodnotám souřadnic. To je možné díky tomu, že do procesu odhadu neustále korektivně vstupují data a uplatňují se ve stále stejných vztazích, matematickém modelu optimálního škálování kategoriálních dat. Vlastnostmi iteračních postupů odhadu parametrů
9
matematicko-statistických modelů (a dalšími otázkami) se zabývá numerická matematika, vědecká disciplína, která zasahuje do mnoha vědních odvětví. Základní otázkou každého iteračního postupu je, kdy se má s výpočty skončit, kdy jsou optimální odhady souřadnic objektů skutečně optimální v tom smyslu, že na nich už nelze nic zlepšit (v kontextu použitého modelu). V praxi se používají různá kritéria, např. rozdíl mezi sumami čtverců souřadnic získaných při dvou po sobě jdoucích iteracích. Pokud tento rozdíl klesne pod předem stanovenou (rozumně nízkou) hodnotu, průběh odhad optimálních hodnot souřadnic se zastaví. Optimální škálování souřadnic má tu vlastnost, že po několika málo iteracích (v nejhorším případě po několika desítkách) se hodnoty souřadnic začínají ustalovat a mění se pouze nepatrně (na čtvrtém a vyšším desetinném místě). Pokud se pro výpočet použije např. vhodný tabulkový procesor, je možné hodnoty souřadnic v každé iteraci zobrazit a průběh řešení kontrolovat vizuálně přímo v průběhu výpočtu. V tabulce 6 jsou obsaženy hodnoty souřadnic objektů (obrázků a verbálních podnětů) v prvních deseti iteracích. V posledních dvou iteracích už se hodnoty souřadnic buď nemění vůbec nebo až na třetím desetinném místě. Po dalších deseti iteracích už by změny probíhaly až na pátém desetinném místě, což jsou z hlediska interpretace výsledků zcela jistě nepatrné změny.
10
Tab. 6: Hodnoty souřadnic v prvních 10-ti iteracích Objekt Slunce Měsíc Mříž Červ Hrob Loďka Pavučina Ústa Strom Dýka Oko Had Květina Ryba Dům Voda Já Láska Nebezpečí Nenávist Poznání Psychologie Radost Sebeovládání Smutek Umění
1 -0,042 -0,278 -0,050 -0,750 -0,700 0,150 -0,417 1,000 0,208 0,438 -0,393 0,000 1,000 0,375 0,083 0,563 -0,200 1,000 0,300 -1,000 -0,300 -0,800 0,000 0,400 0,400 0,200
2 0,261 -0,157 -0,365 -0,558 -0,564 0,265 -0,265 1,000 0,317 -0,058 -0,116 -0,122 1,000 0,150 0,036 -0,189 -0,182 1,000 -0,245 -0,758 -0,342 -0,489 0,712 0,056 -0,163 0,410
3 0,407 -0,120 -0,576 -0,703 -0,484 0,381 -0,224 1,000 0,456 -0,305 0,021 -0,156 1,000 -0,029 0,094 -0,499 -0,399 0,992 -0,727 -0,811 -0,029 -0,082 1,000 -0,132 -0,575 0,763
4 0,470 -0,111 -0,678 -0,805 -0,444 0,454 -0,223 1,000 0,531 -0,403 0,076 -0,158 1,000 -0,117 0,130 -0,627 -0,530 0,923 -0,882 -0,818 0,192 0,170 1,000 -0,190 -0,711 0,845
Iterace 5 6 0,493 0,501 -0,110 -0,109 -0,719 -0,734 -0,849 -0,864 -0,427 -0,420 0,487 0,499 -0,227 -0,230 1,000 1,000 0,562 0,573 -0,436 -0,446 0,095 0,101 -0,153 -0,148 1,000 1,000 -0,153 -0,168 0,145 0,151 -0,675 -0,693 -0,594 -0,621 0,915 0,918 -0,938 -0,956 -0,832 -0,838 0,287 0,324 0,267 0,302 1,000 1,000 -0,210 -0,220 -0,765 -0,786 0,870 0,877
7 0,503 -0,110 -0,740 -0,869 -0,416 0,503 -0,232 1,000 0,576 -0,448 0,103 -0,145 1,000 -0,175 0,153 -0,700 -0,632 0,922 -0,961 -0,839 0,338 0,314 1,000 -0,225 -0,795 0,879
8 0,504 -0,110 -0,741 -0,870 -0,415 0,504 -0,233 1,000 0,577 -0,448 0,103 -0,143 1,000 -0,177 0,154 -0,702 -0,637 0,924 -0,962 -0,840 0,343 0,318 1,000 -0,227 -0,799 0,880
9 0,505 -0,110 -0,742 -0,870 -0,414 0,505 -0,233 1,000 0,578 -0,448 0,103 -0,142 1,000 -0,179 0,155 -0,703 -0,639 0,926 -0,963 -0,840 0,346 0,319 1,000 -0,229 -0,801 0,881
10 0,505 -0,110 -0,742 -0,870 -0,414 0,505 -0,233 1,000 0,578 -0,448 0,103 -0,141 1,000 -0,179 0,155 -0,704 -0,640 0,926 -0,963 -0,840 0,347 0,320 1,000 -0,230 -0,802 0,881
Po vypočtení hodnot souřadnic objektů v první dimenzi je možné přejít k výpočtu souřadnic v dalších dimenzích. U optimálního škálování platí, že první dimenze obsahuje nejdůležitější část informace obsažené v datech. Kdyby se rezignovalo na hledání dalších dimenzí, bylo by možné výsledky hledání optimálních souřadnic první dimenze interpretovat jako implicitní pořadí, které proband dává objektům. Dá se ovšem předpokládat, že organizace významů není jednorozměrná, ale obsahuje mnohem více dimenzí – v psychosémantice se takové dimenze nazývají někdy sémantické příznaky. Známé faktory Hodnocení, Síly a Aktivity zjištěné při faktorových analýzách dat pocházejících z výzkumů metody sémantického diferenciálu (Osgood, Suci a Tannenbaum, 1957) jsou v podstatě takovými sémantickými příznaky organizujícími prostor denotativních složek pojmů. Další dimenze řešení Aby tedy bylo možné získat souřadnice v další dimenzi optimálního řešení, je nutné upravit původní matici dat tak, že se z ní odečte informace „vysvětlená“ první dimenzí řešení. Taková úprava předpokládá výpočet sloupcových a řádkových sum čtverců a výpočet maximální korelace mezi verbálními podněty a obrázky pro danou dimenzi. Tato korelace se
11
také nazývá vlastní nebo singulární hodnota a je analogická s vlastními hodnotami, na jejichž základě se ve faktorové analýze rozhoduje o počtu extrahovaných faktorů. Pro každou buňku incidenční tabulky se pak provede úprava hodnoty, která je v ní obsažena.Nově získaná incidenční tabulka se dále analyzuje na základě výše popsaného postupu, čímž se získají souřadnice objektů (verbálních podnětů a obrázků) ve druhé dimenzi. V tomto postupu lze pokračovat dále až do dosažení maximálního počtu dimenzí (minimum z počtu verbálních podnětů a obrázků bez jedné) nebo do té doby, dokud data obsahují nějakou informaci. To se pozná tak, že procedura odhadu zkolabuje. Obvykle se ale neodhadují souřadnice pro maximální počet dimenzí. Postupné snižování korelací (vlastních hodnot) v po sobě následujících dimenzích je spolehlivým indikátorem klesající hodnoty dimenzí. Postup úpravy incidenční matice před odhadem souřadnic v další dimenzi bude popsán a ilustrován pro první dimenzi. Nejprve je nutné vypočítat sumu čtverců pro verbální podněty a pro obrázky. Suma čtverců verbálních podnětů se rovná odmocnině z podílu celkové sumy hodnot v incidenční tabulce a skalárního součinu řádkových sum incidenční tabulky (počtů obrázků přiřazených jednotlivým verbálním podnětům) a čtverců souřadnic verbálních podnětů v příslušné dimenzi, suma čtverců obrázků se analogicky rovná odmocnině z podílu celkové sumy hodnot v incidenční tabulce a skalárního součinu sloupcových sum incidenční tabulky (počtů verbálních podnětů, pro které byl vybrán ten který obrázek) a čtverců souřadnic obrázků v příslušné dimenzi. Tyto vztahy vyjadřují následující vzorce: Suma čtverců verbálních podnětů r
C VP =
s
åå a
ij
i =1 j=1 r
åa k =1
2 k• k
s
12
Suma čtverců obrázků
r
CO =
s
åå a
ij
i =1 j=1 s
åa m =1
2 •m m
s
kde r je počet řádků incidenční matice (tzn. počet verbálních podnětů), s je počet sloupců incidenční matice (tzn. počet obrázků), aij je hodnota na i-tém řádku a j-tém sloupci incidenční matice, ak• je řádkový součet v k-tém řádku incidenční matice, sk je souřadnice ktého verbálního podnětu, a•m je sloupcový součet v m-tém sloupci incidenční matice a sm je souřadnice m-tého obrázku. Pro zjednodušení byly z vzorců vynechány indexy, které by označovaly aktuální dimenzi, pro které se hodnoty počítají. Pro data analyzovaná v této práci byly v první dimenzi vypočteny následující hodnoty: CVP = 1,336 CO = 1,983 Uvedené hodnoty sum čtverců pro verbální podněty a obrázky se v dané dimenzi použijí pro adjustaci souřadnic verbálních podnětů a obrázků tak, aby vyjadřovaly relativní důležitost sady verbálních podnětů a sady obrázků pro variabilitu obsaženou v datech. Provede se to jednoduše – původně zjištěné souřadnice se vynásobí sumou čtverců příslušné sady. Opět je možné vyjádřit tyto vztahy vzorci: Souřadnice verbálních podnětů cVPk = skCVP Souřadnice obrázků cOm = smCO kde cVPk je adjustovaná souřadnice k-tého verbálního podnětu (k = 1, …, r) a cOm je adjustovaná souřadnice m-tého obrázku (m = 1, …, s). Ostatní symboly mají stejný význam jako v předchozích vzorcích.
13
Pro analyzovaná data byly vypočteny adjustované souřadnice uvedené v tabulkách 7 a 8: Tab. 7: Adjustované souřadnice verbálních podnětů Verbální podnět Já
Adjustovaná souřadnice -0,8567
Láska
1,2395
Nebezpečí
-1,2864
Nenávist
-1,1220
Poznání
0,4642
Psychologie
0,4278
Radost
1,3363
Sebeovládání
-0,3082
Smutek
-1,0723
Umění
1,1778
Tab. 8: Adjustované souřadnice obrázků Obrázek Slunce Měsíc Mříž Červ Hrob Loďka Pavučina Ústa Strom Dýka Oko Had Květina Ryba Dům Voda
Adjustovaná souřadnice 1,0005 -0,2187 -1,4732 -1,7256 -0,8211 1,0012 -0,4637 1,9828 1,1454 -0,8886 0,2042 -0,2797 1,9828 -0,3574 0,3077 -1,3967
Nyní je nutné pomocí adjustovaných souřadnic upravit incidenční matici, která byla použita pro odhad souřadnic v dané dimenzi. To se provede tak, že se každý prvek incidenční matice vynásobí adjustovanými souřadnicemi příslušného verbálního podnětu a obrázku. Pro každý prvek incidenční matice dané dimenze se vypočte jeho upravená hodnota podle následujícího vzorce: bij = aijcVPicOj
14
kde aij je prvek v i-tém řádku a j-tém sloupci původní incidenční matice, cVPi je adjustovaná souřadnice i-tého verbálního podnětu a cOj je adjustovaná souřadnice j-tého obrázku. Ve vzorcích opět není zohledněno, o kterou dimenzi se jedná. V případě analyzovaných dat je upravená incidenční matice (označená B) uvedena v tabulkách 9a a 9b. Tab. 9a: Upravená incidenční matice – 1. část Slunce Já
-0,8571
Láska
Měsíc
Červ
Hrob
0,1874 1,2620 1,4783
1,2401
0
Mříž 0
Loďka
Pavučina
Ústa
0,3972
0
0
0
0
0
1,2410
0 2,4576
Nebezpečí
0
0,2814 1,8950 2,2198
1,0562
0
0
0
Nenávist
0
0,2454 1,6529 1,9362
0,9213
0
0,5203
0
0 -0,3812
0,4648
0
0
-0,1984
0
Poznání
0,4645 -0,1015
0
Psychologie
0,4280 -0,0936
0
0 -0,3512
0,4283
Radost
1,3370 -0,2923
0
0
1,3379
0
Sebeovládání
0
0,0674 0,4540
0
Smutek
0
0,2345 1,5796
0
0,8804
0
0
0
0
Umění
1,1784 -0,2576
0
0 2,6496
0 -0,3086
0,1429
0
0,4972
0
-0,5461 2,3354
Tab. 9b: Upravená incidenční matice – 2. část Strom
Dýka
Oko
0
0
0
Já Láska
1,4197 -1,1013
Nebezpečí Nenávist
Had Květina 0
0
0 -0,3467
2,4576
Ryba
Dům
Voda
0,3062 -0,2636 1,1965 0
0,3813
0
0
1,1430
0
0,3598
0
0 -0,3958 1,7967
0
0,9970 -0,2291
0,3138
0
0
0
Poznání
0,5317
0
0,0948 -0,1298
0
0
0,1428
0
Psychologie
0,4900
0
0,0873
0
0
0
0,1316
0
Radost
1,5306
0
0,2728
0
2,6496 -0,4776
0
0
Sebeovládání
0
-0,3530
0 -0,0629
0
0
0,1102
0 0,4305
0
0,9528 -0,2189
0
0
0,3832
0 1,4976
0
2,3354
0
Smutek Umění
1,3491
0
0,2405
0,3624
0
Suma všech prvků upravené incidenční matice B je použita při výpočtu optimální hodnoty korelace mezi řádky a sloupci (zde verbálními podněty a obrázky) incidenční matice v dané dimenzi. Její vzorec je následující: r
R=
s
åå b
ij
i =1 j=1
r
åa k =1
2 k • VPk
c
s
åa m =1
•m
2 c Om
kde r je počet řádků a s počet sloupců incidenční (a tím i upravené incidenční) matice, bij je prvek z i-tého řádku a j-tého sloupce upravené incidenční matice, ak• je součet k-tého řádku
15
incidenční matice, cVPk je adjustovaná souřadnice k-tého verbálního podnětu, a•m je součet m-tého sloupce incidenční matice a cOm je adjustovaná souřadnice m-tého obrázku. Ani v tomto vzorci není zohledněna dimenze, pro kterou se hodnota korelace počítá. Pro data analyzovaná v této práci se optimální hodnota korelace mezi verbálními podněty a obrázky v první dimenzi rovná 0,631. Je třeba zdůraznit, že tato korelace je také vlastní (singulární) hodnotou v nelineární analýze hlavních komponent, takže vlastně představuje relativní důležitost dimenze vzhledem k dimenzím ostatním. Novou incidenční matici pro výpočet souřadnic v další dimenzi lze získat tak, že se od každého prvku původní incidenční matice odečte součin adjustovaných souřadnic příslušného verbálního podnětu a obrázku (tzn. příslušného řádku a sloupce), očekávané četnosti a vlastní hodnoty (korelace verbálních podnětů a obrázků) pro aktuální dimenzi. Symbolicky je tento vztah možné vyjádřit jako: (t) (t) (t) a ij(t +1) = a (t) ij − R c VPi c Oj e ij
kde aij(t+1) je prvek v i-tém řádku a j-tém sloupci incidenční matice použité pro výpočet souřadnic v dimenzi (t+1), aij(t) je prvek v i-tém řádku a j-tém sloupci incidenční matice použité pro výpočet souřadnic v t-té dimenzi, R(t) je korelace řádků a sloupců incidenční matice v t-té dimenzi, cVPi(t) je adjustovaná souřadnice i-tého verbálního podnětu v t-té dimenzi, cOj(t) je adjustovaná souřadnice j-tého obrázku v t-té dimenzi a eij je očekávaná četnost v i-tém řádku a j-tém sloupci matice očekávaných četností E (viz dále). V tomto vzorci již bylo nutné zdůraznit dimenze, pro které se výpočet provádí. Z předchozího vztahu je patrná důležitá zákonitost. Vzhledem k tomu, že u každé analýzy hlavních komponent se postupně pro každou další dimenzi snižují vlastní hodnoty (tzn. korelace řádků a sloupců), od hodnot v buňkách incidenční matice se pro každou další dimenzi odečítá v průměru stále nižší hodnota (kromě toho je průměr adjustovaných souřadnic nulový a očekávané četnosti jsou pro daný řádek a sloupec konstantní). Další důležitá zákonitost spočívá v tom, že celá analýza může skončit před vyčerpáním maximálního počtu dimenzí tak, že incidenční matice neobsahuje již žádný vztah. V takovém případě se incidenční matice pro následující dimenzi rovná matici očekávaných četností. Hodnota očekávané četnosti pro každou buňku se vypočítá jako součin sumy příslušného řádku se sumou příslušného sloupce dělený sumou celé incidenční matice.
16
V případě analyzovaných dat je např. řádková suma pro pojem „Já“ rovna 8, sloupcová suma pro 1. obrázek (Slunce) je rovna 6, celková suma tabulky je rovna 80, takže očekávaná četnost pro první řádek a první sloupec incidenční matice je rovna
8⋅6 = 0,6 . 80
e11 =
Tento vztah je možné napsat obecně jako
e ij =
a i• a • j a ••
kde eij je očekávaná četnost v i-tém řádku a j-tém sloupci matice očekávaných četností E, ai• je suma i-tého řádku incidenční matice, a•j je suma j-tého sloupce incidenční matice a a•• je celková suma přes všechny řádky a sloupce incidenční matice. Pro analyzovaná data je matice očekávaných četností uvedena v tabulce 10. Tab. 10: Očekávané četnosti pro analyzovaná data O11
O12
O13
O14
O15
O16
Já
O1
0,6 0,9 0,5 0,3 0,5 0,5 0,6 0,3 0,6 0,4
O2
O3
O4
O5
O6
O7
O8
O9
O10
0,7
0,4
0,3
0,4
0,6
0,4
S 8
Láska
0,6 0,9 0,5 0,3 0,5 0,5 0,6 0,3 0,6 0,4
0,7
0,4
0,3
0,4
0,6
0,4
8
Nebezpečí
0,6 0,9 0,5 0,3 0,5 0,5 0,6 0,3 0,6 0,4
0,7
0,4
0,3
0,4
0,6
0,4
8
Nenávist
0,6 0,9 0,5 0,3 0,5 0,5 0,6 0,3 0,6 0,4
0,7
0,4
0,3
0,4
0,6
0,4
8
Poznání
0,6 0,9 0,5 0,3 0,5 0,5 0,6 0,3 0,6 0,4
0,7
0,4
0,3
0,4
0,6
0,4
8
Psychologie
0,6 0,9 0,5 0,3 0,5 0,5 0,6 0,3 0,6 0,4
0,7
0,4
0,3
0,4
0,6
0,4
8
Radost
0,6 0,9 0,5 0,3 0,5 0,5 0,6 0,3 0,6 0,4
0,7
0,4
0,3
0,4
0,6
0,4
8
Sebeovládání
0,6 0,9 0,5 0,3 0,5 0,5 0,6 0,3 0,6 0,4
0,7
0,4
0,3
0,4
0,6
0,4
8
Smutek
0,6 0,9 0,5 0,3 0,5 0,5 0,6 0,3 0,6 0,4
0,7
0,4
0,3
0,4
0,6
0,4
8
Umění
0,6 0,9 0,5 0,3 0,5 0,5 0,6 0,3 0,6 0,4
0,7
0,4
0,3
0,4
0,6
0,4
8
Celkem
6
7
4
3
4
6
4
9
5
3
5
5
6
3
6
4
80
Pozn.: V tabulce 10 jsou z důvodů úspory místa názvy obrázků nahrazeny symboly O1 (Slunce), O2 (Měsíc), O3 (Mříž), O4 (Červ), O5 (Hrob), O6 (Loďka), O7 (Pavučina), O8 (Ústa). O9 (Strom), O10 (Dýka), O11 (Oko), O12 (Had), O13 (Květina), O14 (Ryba), O15 (Dům) a O16 (Voda).
Důležitou vlastnost matice očekávaných četností představuje fakt, že sloupcové a řádkové sumy součty stejné jako v případě incidenční matice, na jejímž základě byla matice očekávaných četností vypočtena. Pokud se tedy od incidenční matice pro výpočet souřadnic v první dimenzi (viz tab. 2) odečte matice očekávaných četností (tab. 10), ve které je každý prvek vynásoben vlastní hodnotou první dimenze (v tomto případě 0,631), adjustovanou souřadnicí pro daný verbální
17
podnět (tzn. řádek – viz tab. 7) a obrázek (tzn. sloupec – viz tab. 8). Výsledná incidenční matice vstupující do výpočtu souřadnic v druhé dimenzi je uvedena v tabulkách 11a a 11b. Tab. 11a: Incidenční matice pro výpočet souřadnic 2. dimenze – 1. část Hrob
Loďka
Pavučina
Ústa
Já
1,3244 0,8936 0,6019
Slunce
Měsíc
Mříž
0,7202 -0,2219
Červ
0,2706
0,8496
0,3215
Láska
0,5306 0,1539 0,5760
0,4048
0,3210
0,6086
0,2176
0,5349
Nebezpečí
0,4872 0,8402 0,4022
0,5799
0,6668
0,4063
-0,2258
0,4827
Nenávist
0,4249 0,8607 0,4786
0,6336
0,7094
0,3544
0,8031
0,4211
Poznání
0,8242 1,0577 0,2157
0,1516
1,1202
0,8534
0,0815 -0,1742
Psychologie
0,8380 1,0531 0,1988
0,1397
1,1108
0,8649
1,0751 -0,1605
Radost
0,4939 1,1660 0,6210
0,4364
0,3461
0,5780
0,2345
0,4985
Sebeovládání
0,1167 0,9617 0,8568 -0,1007 -0,0798
1,0973
0,9459
0,1157
Smutek
0,4061 0,8668 0,5017 -0,3502
0,7223
0,3386
0,8118
0,4024
Umění
0,5539 1,1463 0,5473
0,3051 -0,3720
1,2067
0,5580
0,3847
Tab. 11b: Incidenční matice pro výpočet souřadnic 2. dimenze – 2. část Strom Já
Dýka
0,3714 -0,1921
Had
Květina
Ryba
Dům
Voda
0,0772 -0,0605
Oko
0,3215
0,9227
1,0998
0,6981
Láska
0,4626
1,2779 -0,1118
1,0875
0,5349
0,1118
0,8557
0,4369
Nebezpečí
0,5577
0,7116
0,1160
0,9092
0,4827 -0,1160
1,1498
0,5466
Nenávist
0,4865
0,7484
1,1012
0,9208
0,4211 -0,1012
0,1307 -0,3955
Poznání
0,7987
0,1041
0,9581
1,0328 -0,1742
0,0419
0,9459
0,1636
Psychologie
0,8145
0,0959
0,9614
0,0302 -0,1605
0,0386
0,9502
0,1508
Radost
0,4206
0,2996
0,8795
0,0943
1,1205 -0,1556
0,4710
0,4985
Sebeovládání
1,1336 -0,0691
1,0278 -0,0218
0,1157
0,9722
0,0359
0,8914
Smutek
0,4649
0,7596
1,0967 -0,0757
0,4024
0,9033
0,1249
0,6221
Umění
0,4893
0,2641
0,8938
0,5580
0,1062
0,8628
0,4151
0,0831
Matici uvedenou v tabulkách 11a a 11b lze použít jako vstupní matici na místě incidenční matice, ze které byly odhadovány souřadnice pro první dimenzi optimálního řešení. V okamžiku, kdy se tato matice bude blížit matici očekávaných četností (viz tab. 10), bude to znamenat, že v datech už není obsažena žádná informace, na základě které by se dala zkonstruovat další dimenze. Pokud se tato matice od matice očekávaných četností liší, lze postupovat dále a odhadovat souřadnice pro další dimenzi. Velmi často je tímto způsobem možné dospět až k maximálnímu počtu dimenzí, které je (jak bylo již několikrát uvedeno) rovno maximu z počtu řádků (verbálních podnětů) a sloupců (obrázků) bez jedné, což je v případě dat analyzovaných v této práci 9 dimenzí. Obecně se ale má za to (van de Geer, 1993a; 1993b), že při analýzách hlavních komponent má smysl uvažovat pouze o několika málo dimenzích. Kritérium, na základě kterého se dá o počtu dimenzí rozhodnout, je analogické s Cattelovým kritériem „scree test“ (např. McDonald, 1991), ve kterém se počet dimenzí stanovuje na základě posouzení grafu
18
vlastních hodnot uspořádaných podle velikosti. Tyto hodnoty jsou pro analyzovaná data uvedeny v tabulce 12. Tab. 12: Vlastní hodnoty pro analyzovaná data Dimenze
Vlastní hodnota 1 0,6309 2
0,4610
3
0,3690
4
0,3051
5
0,2683
6
0,1942
7
0,1613
8
0,1326
9
0,0839
Po zobrazení vlastních hodnot seřazených podle velikosti není v grafu 1 patrný žádný výrazný „svah“, který by naznačoval, kolik dimenzí lze odhadnout. To může naznačovat to, že v datech není obsažena žádná informace, kterou by stálo za to interpretovat. Velikost vlastních hodnot by pak naznačovala relativní důležitost jednotlivých dimenzí. Velice exaktní kritérium, na základě kterého lze rozhodnout o počtu dimenzí, spočívá v dekompozici hodnoty chí-kvadrát pro vztah mezi řádky a sloupci původní incidenční matice. Tato hodnota se dá rozdělit na komponenty obsažené v každé z dimenzí optimálního škálování. Pokud daná dimenze obsahuje statisticky významnou část chí-kvadrát, obsahuje hodnotnou část informace, a má smysl pro ni odhadovat souřadnice a interpretovat je. Celý postup není výpočetně složitější než postup naznačený v této práci, nicméně ji tematicky značně přesahuje. V případě analyzovaných dat ovšem hodnota chí-kvadrátu statisticky významná není (χ2 = 80,00, df = 135, p = 1,000). To se podle názoru autora ani nedá očekávat, protože se jedná o řídce obsazenou tabulku. Posouzení adekvátnosti optimálního řešení ale nezávisí pouze na statistických nebo kvantitativních kritériích, ale také na teoretické hodnotě celého přístupu a validitě získaných výsledků v kontextu práce s individuálním klientem. Tyto otázky by měly být předmětem výzkumu.
19
Graf 1: Vlastní hodnoty Vlastní hodnota
Vlastní hodnota
0,7 0,6 0,5 0,4 0,3 0,2 0,1 0
1
2
3
4
5
6
7
8
9
Dimenze
Grafické znázornění dvourozměrného řešení V tabulce 13 jsou uvedeny souřadnice pro první dvě dimenze optimálního škálování dat uvedených v tabulkách 1 a 2. Tyto hodnoty byly získány na základě postupu popsaného v předchozích odstavcích.
20
Tab. 13: Dvě dimenze optimálního škálování dat Objekt
Dimenze I
Dimenze II
Slunce
-0,6411
-0,5102
Měsíc
0,9276
0,8115
Mříž
-0,9627
0,8134
Červ
-0,8397
0,6017
Hrob
0,3474
0,4891
Loďka
0,3201
-0,0689
Pavučina
1,0000
-0,4963
Ústa
-0,2306
-1,0000
Strom
-0,8024
-0,5286
Dýka
0,8814
-0,1115
Oko
0,5046
-0,0053
Had
-0,1103
-0,1715
Květina
-0,7430
-0,2243
Ryba
-0,8703
0,4252
Dům
-0,4141
0,3639
Voda Já Láska Nebezpečí
0,5049
-0,1147
-0,2339
-0,4448
1,0000
0,0694
0,5777
-0,1296
Nenávist
-0,4481
0,6124
Poznání
0,1030
-0,2767
Psychologie Radost Sebeovládání Smutek Umění
-0,1411
1,0000
1,0000
0,0694
-0,1803
-0,9996
0,1552
0,3272
-0,7044
-0,5009
Tyto souřadnice ještě nelze použít pro grafické znázornění, protože v této podobě nejsou obě sady objektů umístěny ve stejném prostoru (Nishisato, 1994). Aby bylo možné společné grafické znázornění, je třeba souřadnice transformovat do tvaru tzv. kanonického řešení, které má tu vlastnost, že souřadnice každého obrázku se rovná váženému průměru verbálních podnětů, u kterých byly použity, dělenému vlastní hodnotou příslušné dimenze. Souřadnice uvedené v tabulce 13 tuto vlastnost zatím nesplňují. Tohoto výsledku se dá docílit tak, že se rozsah souřadnic jedné ze sad objektů vhodným způsobem „natáhne“ nebo „smrští“ vzhledem k rozsahu hodnot souřadnic druhé sady. Přitom na absolutní délce os jednotlivých dimenzí v podstatě nezáleží. Je to jen otázka měřítka použitého pro dostatečně diferencované zobrazení objektů. Nejjednodušší postup, který navrhuje např. Nishisato (1994), spočívá v násobení souřadnic jedné sady objektů vlastní hodnotou příslušné dimenze. Tyto upravené souřadnice pak představují projekci určité sady do prostoru definovaného souřadnicemi objektů druhé sady. V tomto případě se budou vlastní hodnotou příslušné dimenze násobit souřadnice verbálních podnětů. Rozhodnutí je založeno na praktickém hledisku přehlednosti výsledného
21
grafu – protože vlastní hodnota je nižší než 1, výsledné body grafu budou umístěny blíže středu, což je výhodnější u sady, která má méně prvků. Je však obecně možný i opačný postup. Výsledné souřadnice upravené na základě popsaného postupu jsou uvedeny v tabulce 14. Tab. 14: Výsledné souřadnice objektů Objekt
Dimenze I Dimenze II
Slunce
0.5046
-0.0053
Měsíc
-0.1103
-0.1715
Mříž
-0.7430
-0.2243
Červ
-0.8703
0.4252
Hrob
-0.4141
0.3639
Loďka Pavučina
0.5049
-0.1147
-0.2339
-0.4448
Ústa
1.0000
0.0693
Strom
0.5777
-0.1296
Dýka
-0.4481
0.6124
Oko
0.1030
-0.2767
Had
-0.1411
1.0000
Květina
1.0000
0.0693
Ryba
-0.1803
-0.9996
Dům
0.1552
0.3272
Voda
-0.7044
-0.5009
Já
-0.4044
-0.2345
0.5852
0.3729
Nebezpečí
-0.6073
0.3737
Nenávist
-0.5297
0.2765
Poznání
0.2192
0.2247
Láska
Psychologie
0.2019
-0.0317
Radost
0.6309
-0.2281
Sebeovládání
-0.1455
-0.4595
Smutek
-0.5062
-0.2429
0.5561
-0.0512
Umění
Tyto souřadnice byly použity při konstrukci grafu 2, který představuje rekonstrukci individuálního sémantického prostoru probanda, od kterého pocházejí analyzovaná data. Horizontální osa představuje dimenzi I, vertikální osa dimenzi II, obrázky jsou označeny čtvercem a verbální podněty kosočtvercem.
22
Graf 2: Rekonstrukce individuálního sémantického prostoru
Had
Dýka Červ Nebezpečí
Hrob Nenávist
Láska Dům P oznání
Slunce Ústa Květina P sycholog Umění Loďka Strom Měsíc Radost Já Oko
Mříž S mutek Pavučina Voda
Sebeovládání
Ryba
Při pohledu na graf je třeba mít na paměti, že první dimenze je významnější než druhá v poměru, který vyjadřuje poměr jejich vlastních hodnot. Aby nebyl celý postup příliš složitý, nebyla prováděna další úprava souřadnic v jednotlivých dimenzích (např. opětovné násobení již jednou upravených souřadnic vlastními hodnotami dimenzí), je to však alternativa, která stojí v budoucnu za úvahu. Interpretace výsledků optimálního škálování závisí podle autora do značné míry na znalosti konkrétního probanda. Existují však obecná pravidla, která lze v takových případech použít (Kruskal a Wish, 1994). V zásadě lze výsledky interpretovat na základě charakteristik objektů umístěných na protilehlých pólech (lze nazvat pravidlem kontrastu) nebo na základě charakteristik objektů, které jsou umístěny blízko sebe (pravidlo podobnosti). Příklad interpretace na základě pravidla kontrastu: Např. na první dimenzi se verbální podněty „Láska“ a „Radost“ nacházejí v blízkosti pravého pólu dimenze spolu s obrázky Květina a Ústa, zatímco pojmy „Nebezpečí“, „Nenávist“ a „Smutek“ spolu s obrázky Červ, Mříž atd. jsou umístěny v blízkosti levého pólu. Možná interpretace by tedy mohla být založena na tomto zjištění (tato dimenze by mohla představovat individuální podobu dimenze hodnocení zjištěné v interpersonálních datech založených na použití sémantického diferenciálu). Pak se může jevit zajímavým zjištění, že verbální podnět „Já“ se vyskytuje spíše 23
v blízkosti negativního pojmu dimenze. Interpretace druhé dimenze již není jednoznačná, o to by však bylo zajímavější se o ni pokusit na základě znalosti osoby, od které pocházejí data. Příklad interpretace na základě pravidla podobnosti: V grafu se nevyskytují příliš výrazně oddělené shluky, nicméně např. shluk verbálních podnětů „Nebezpečí“ a „Nenávist“ a obrázků Červ, Dýka a Hrob působí jednoznačně. Zajímavý je opět fakt, proč se verbální podnět „Já“ nachází v blízkosti podnětu „Smutek“. Závěr Tato práce je věnována prezentaci postupu, který lze použít při zpracování dat získaných pomocí individuální administrace Testu sémantického výběru. Představuje jednu z možností, jak rekonstruovat individuální sémantický prostor pomocí metody optimálního škálování, které zobrazuje obrázky a verbální podněty ve společném grafu. Tento graf může představovat základ pro věcnou interpretaci individuálních výsledků. Uvedený postup lze zatím považovat pouze za návrh možné budoucí praxe používání Testu sémantického výběru. Nicméně je již jisté, že nějaký alternativní způsob zpracování výsledků tohoto testu bude třeba najít, protože stávající praxe je nevyhovující. Oprávněnost optimálního škálování bude v tomto případě ještě nutné doložit prostřednictvím empirických studií, které by byly schopny kriticky zhodnotit výsledky, které lze takovým postupem získat z hlediska jejich relevance pro psychologický výzkum a praxi. Relativní složitostí celého postupu by se nikdo neměl nechat odradit – jeho rutinní používání je jen otázkou vhodné počítačové implementace. V době, kdy množství klasických psychologických metod administrují počítače, není problém představit si, že budou vznikat i metody, jejichž použití je na použití počítačů zcela závislé. Jejich hodnotu ovšem musí prokázat nejprve výzkum a potom praxe. Uvedený postup optimálního škálování pro výsledky Testu sémantického výběru je (jak už bylo uvedeno) pouze jedním z mnoha možných. Další logickou možností je uplatnit na takto vytvořená data některý z postupů shlukové analýzy. Postup optimálního škálování přitom není omezen pouze na data z Testu sémantického výběru. Lze ho s výhodou použít na jakoukoli incidenční (kontingenční) tabulku, ale i na matice pocházející ze sociometrických šetření atd. Jeho hodnota je v české psychologii patrně zatím značně nedoceněná.
24
Literatura: Geer, J. P. van de: Multivariate Analysis of Categorical Data: Theory. SAGE Publications, London, 1993a. Geer, J. P. van de: Multivariate Analysis of Categorical Data: Applications. SAGE Publications, London, 1993b. Kruskal, J. B., Wish, M.: Multidimensional Scaling. In: Lewis-Beck, M. S.: Basic Measurement, Sage Publications, London, 1994. Nishisato, S.: Elements of dual scaling. An introduction to practical data analysis. Lawrence Erlbaum Associates, Publishers. Hillsdale, New Jersey, 1994. Osgood, C. E., Suci, G. J., Tannenbaum, P, H,: The measurement of meaning. University of Illinois Press, Urbana, 1957. Smékal, V.: Psychosémantické metody. In: Maršálová, L., Mikšík, O. a kol.: Metodológia a metódy psychologického výskumu. Slovenské pedagogické nakladatelstvo, 1990. Šmelev, A. G.: Vveděnije v eksperimentaľnuju psichosemantiku. Izdatěľstvo moskovskogo universitěta, Moskva, 1983. Urbánek T.: Metodologické otázky zpracování testu sémantického výběru: předběžné sdělení. In: Blatný, M., Svoboda, M. (Ed.): Sociální procesy a osobnost 99': Sborník příspěvků. Masarykova universita, Brno, 1999. Urbánek, T: Possibilities of quantification of the Semasiological selection test. Studia psychologica, 42, 2000, 3, s. 283-288.
25
Souhrn Zpráva je věnována podrobné prezentaci postupu optimálního škálování dat pocházejících z individuální administrace Testu sémantického výběru. Nejprve je diskutována nutnost hledání takového postupu a uvedeny možné alternativy. Na konkrétních datech jsou pak prezentovány a ilustrovány jednotlivé kroky optimálního škálování. Získané výsledky jsou zobrazeny graficky a jsou naznačeny možné způsoby jejich interpretace. Na závěr je zdůrazněna nutnost empirického ověřování hodnoty tohoto přístupu. Klíčová slova: Optimální škálování, korespondenční analýza, Test sémantického výběru. Summary The report is aimed to detailed presentation of the optimal scaling technique on data coming from individual administration of the Semantic selection test. First, the need for search of such a technique is discussed, and possible alternatives are introduced. Individual steps of the optimal scaling technique are then presented and illustrated by means of particular data. The obtained results are graphically displayed and possible ways of their interpretation are suggested. Finally, there is conclusion that the empirical testing of this approach is necessary. Key words: Optimal scaling, correspondence analysis, Semantic selection test.
26