UNIVERSITEIT GENT FACULTEIT ECONOMIE EN BEDRIJFSKUNDE ACADEMIEJAAR 2001-2002
LITERATUUR EN EMPIRISCH ONDERZOEK NAAR HET GEBRUIK VAN ASSESSMENT CENTERS IN HET DETECTEREN VAN INDIVIDUELE COMPETENTIES Scriptie voorgedragen tot het bekomen van de graad van licentiaat in de toegepaste economische wetenschappen
Katrien De Mesel onder leiding van Prof. dr. Dirk Buyens
UNIVERSITEIT GENT FACULTEIT ECONOMIE EN BEDRIJFSKUNDE ACADEMIEJAAR 2001-2002 LITERATUUR EN EMPIRISCH ONDERZOEK NAAR HET GEBRUIK VAN ASSESSMENT CENTERS IN HET DETECTEREN VAN INDIVIDUELE COMPETENTIES Scriptie voorgedragen tot het bekomen van de graad van licentiaat in de toegepaste economische wetenschappen
Katrien De Mesel onder leiding van Prof. dr. Dirk Buyens
Ondergetekende Katrien De Mesel bevestigt hierbij dat onderhavige scriptie mag worden geraadpleegd en vrij mag worden gefotokopieerd. Bij het citeren moet steeds de titel en de auteur van de scriptie worden vermeld.
Woord vooraf
Eerst en vooral wil ik mijn promotor, prof. dr. Buyens, bedanken voor zijn bereidheid tijd vrij te maken en voor het duwtje in de juiste richting wanneer ik met onduidelijkheden en twijfels geconfronteerd werd. Voor het praktijkonderzoek kon ik rekenen op de medewerking van de banken. De contactpersonen slaagden erin tijd vrij te maken naast hun normale dagtaak en stonden mij bijzonder vriendelijk te woord. Ik ben hun dan ook enorm dankbaar. Daarnaast wil ik volgende personen bedanken voor de morele steun en de praktische tips: mijn ouders, Kurt, vrienden, medestudenten,… Ik wil ook een woord van dank schenken aan de personen die tijd vrij maakten voor het herlezen van deze thesis.
mei 2002
______________________________________________________________________________________________ De Mesel Katrien
III
Woord vooraf
Inhoudstafel
Woord vooraf
III
Inhoudstafel
IV
0. Inleiding
1
1. Een blik op het assessment center
2
♦ Begripsomschrijving
2
♦ Assessment center en verwante technieken
4
- AC versus mini-assessment
4
- AC versus ‘work sample’
4
- AC versus simulatie
4
- ACM in enge zin versus ACM in brede zin
4
- ACM versus klassieke tests
4
2. Historiek
5
♦ Groei van de methode
5
♦ Verklaring succes
5
3. ACM in het dagelijkse leven
7
♦ Gebruik in België
7
♦ Vergelijking van het gebruik in Europese landen
8
4. Toepassingen van de ACM
10
♦ Doelstellingen
10
♦ Afstemmen van zelfevaluaties aan beoordelingen van assessoren en peers
10
5. Assessment Center versus Development Center
13
♦ Verschil
13
♦ Praktijk
15
______________________________________________________________________________________________ De Mesel Katrien
IV
Inhoudstafel
6. Opdrachten in een assessment center
17
♦ Postbak/ in-basket/ in-tray
17
♦ Groepsdiscussie
17
♦ Gesprekssimulatie
17
♦ Analyse- en presentatieopdracht
17
♦ Andere
18
7. Dimensies
19
♦ Begrip
19
♦ Opstellen gewenst comptentieprofiel
20
♦ Wetenschappelijke waarde
20
8. Deelnemers in een AC
22
♦ Assessees
22
♦ Assessoren
23
♦ Moderator
25
♦ Rollenspeler
25
9. Training assessoren
26
♦ Voordelen van assessorentraining
26
♦ Duur van assessorentraining
26
♦ Elementen van de training
27
♦ Benaderingen
28
♦ Assessment centersimulatie
29
10. Beoordelingsproces
31
♦ Observatiemethoden
31
METHODEN
31
- Traditionele methode - Behavioural checklist - Behavioural coding ONDERZOEK
32
______________________________________________________________________________________________ De Mesel Katrien
V
Inhoudstafel
♦ Scoringsprocessen
34
- Rationeel model - ‘Limited capacity’-model - Expertmodel ♦ Het vormen van een eindoordeel
35
- Discussie - Beslissingsregel ♦ Suggesties voor toekomstig onderzoek
36
11. Ontwikkeling van een AC
38
♦ Ontwikkeling van een center
38
- Te beschouwen factoren
38
- Fasen Inventarisatie
39
Operationalisatie
39
Uitvoering
40
Eindevaluatie
40
Het ontwerpen van oefeningen
42
- Fase 1: Het afstemmen van dimensies en oefeningen
42
- Fase 2: Het genereren van de inhoud
42
- Fase 3: Het evalueren van voorstellen
43
- Fase 4: Het schrijven van oefeningen
43
- Fase 5: Het toekennen van scores
43
- Fase 6: Het testen van een oefening
43
- Fase 7: Het evalueren van de oefening
44
12. Knelpunten bij ontwikkeling en gebruik van AC
45
♦
♦ Problemen bij de selectie en definiëring van dimensies
45
♦ Problemen aangaande de oefeningselectie en –ontwikkeling
46
♦ Problemen bij de selectie en training van assessoren
46
♦ Problemen bij observatie en scoring
48
♦ Problemen bij het bepalen van de eindscore
49
♦ Problemen bij de feedback naar kandidaten en management
49
♦ Verschillen in problemen bij verschillende ondernemingen
50
______________________________________________________________________________________________ De Mesel Katrien
VI
Inhoudstafel
15. Voordelen en nadelen van de ACM
51
♦ VOORDELEN
51
- Voordelen
51
- Secundaire effecten
51
- Billijkheid van de ACM
52
♦ NADELEN
55
- Minpunten
55
- Kostprijs
56
Utiliteitsanalyse
56
Middelen ter bestrijding van de kosten
57
16. Betrouwbaarheid en validiteit
59
♦ Interbeoordelaarsbetrouwbaarheid
59
- Begrip, vaststellingen en oorzaken
59
- Bepalende factoren
59
♦ Validiteit op zicht/ Face-validity
60
♦ Inhoudsvaliditeit/Content validity
60
♦ Criteriumvaliditeit
61
- Begrip
61
- Vaststellingen
61
- Oorzaken
62
- Factoren
63
- Praktijk
64
♦ Constructvaliditeit
64
- Begrip
64
- Vaststellingen
64
- Stromingen bij de onderzoekers
67
Aanhangers
67
Dimensies vervangen
67
Oorzaken achterhalen
68
- Oorzaken
68
- Bepalende factoren
70
Dimensies
70
Assessoren
70
Oefeningen
71
Observatie- en evaluatieprocedures
72
Integratieprocedure
74
- Adviezen
75
______________________________________________________________________________________________ De Mesel Katrien
VII
Inhoudstafel
17. Ontwikkeling van competenties
76
♦
Factoren van trainbaarheid
76
♦
Ontrainbare competenties
77
♦
Competentiegerichte training
77
18. Toekomst van het AC
79
19. Empirisch onderzoek
81
♦ Inleiding
81
♦ Methode
81
♦ Resultaten en besluiten
82
- Gebruik
82
- Ontwikkeling
86
- Inhoud
88
- Dimensies
92
- Assessoren
96
- Resultaten en feedback
102
- Onderzoek
106
- Opmerkingen
108
20. Algemeen besluit
109
Lijst van geraadpleegde werken
XI
Bijlagen
XVIII
Bijlage 1: Vragenlijst
XIX
______________________________________________________________________________________________ De Mesel Katrien
VIII
Inhoudstafel
Gebruikte afkortingen - AC: assessment center (methode) - ACM: assessment center methode - DC: development center
______________________________________________________________________________________________ De Mesel Katrien
IX
Gebruikte afkortingen
Lijst van tabellen, figuren en kaarten
TABELLEN Tabel 1 : Gebruik van assessment centers bij selectie
9
Tabel 2 : Toepassingen van de assessment centermethode die het management in overweging neemt
15
Tabel 3 : Overzicht van trainingsprogramma’s
29
Tabel 4 : Vergelijking tussen trait- en simulatiegeoriënteerde assessment benaderingen
40
Tabel 5 : Gebruikte oefeningen in de grote banken in België
90
Tabel 6 : Informatie voor de kandidaat
91
Tabel 7 : Dimensies in de grote banken in België
94
Tabel 8 : Inzage (I) of kopie (K) ?
105
FIGUREN Figuur 1 : Gebruiksfrequentie van assessment centers in grote Vlaamse en Brusselse ondernemingen
7
Figuur 2 : Ondernemingen die assessment center toepassen. Relatieve cijfers per regio
7
Figuur 3 : Toepassingsgebieden van assessment en development centers: gelijkenissen en verschillen
14
Figuur 4 : Continuüm van assessment centers
14
______________________________________________________________________________________________ De Mesel Katrien
X
Lijst van tabellen, figuren en kaarten
0. Inleiding
Ik ben steeds geboeid geweest door het gedrag van managers en meer bepaald in de manieren waarop ze met hun ondergeschikten en collega’s omgaan. Het ligt dan ook voor de hand dat mijn thesisonderwerp uit het vakgebied ‘personeelsbeleid’ komt. Toen in de eerste licentie, in de cursus ‘Beheer van het menselijk potentieel’, de selectie-instrumenten (waaronder de assessment centers) behandeld werden, begon het te kriebelen. Met de assessment centers als onderwerp van mijn thesis ging mijn wens om een scriptie te maken over iets wat me werkelijk interesseert, in vervulling. De assessment center-methode is een zeer dynamische techniek die reeds een hele weg heeft afgelegd, maar ook tegenwoordig nog in evolutie is. In die zin is deze scriptie uiteraard slechts een momentopname. De toekomst zal ongetwijfeld andere wendingen geven aan de methode. Deze scriptie bestaat uit twee delen. Het eerste deel is theoretisch en is gebaseerd op de literatuur. Het tweede onderdeel geeft het verslag van het empirische onderzoek dat in het kader van deze scriptie verricht werd. Het eerste onderdeel vangt aan met een verduidelijking van wat assessment centers zijn. Vervolgens wordt. de historiek van het instrument geschetst en wordt bekeken hoe het de methode in de praktijk vergaat. Eens dat allemaal gekend is, worden de diversie toepassingen beschreven en wordt dieper ingegaan op het onderscheid tussen assessment- en development centers. In het zesde hoofdstuk wordt een overzicht gegeven van de oefeningen die deel kunnen uitmaken van een center. Aangezien dimensies een centraal begrip zijn in de assessment center-methode, wordt ook stilgestaan bij dit begrip, alvorens de deelnemers van een center aan bod komen. Nadat ook iets gezegd is over het beoordelingsproces, wordt de ontwikkeling van een center toegelicht. Samenhangend daarmee zijn in het hoofdstuk erna de problemen die kunnen opduiken tijdens de ontwikkeling of het gebruik van de methode aan de beurt. Hoofdstuk dertien somt de voor- en nadelen van de techniek op. Daarna wordt de validiteit van de methode onder de loep genomen. In het kader van development centers wordt ook iets verteld over de ontwikkeling van competenties en tot slot wordt het theoretische deel afgesloten met een bespreking van de toekomst van assessment centers. Een beschrijving van het empirisch onderzoek vindt men in het tweede deel van deze thesis. In de grote banken in België werd nagegaan of zij de assessment center-methode aanwenden en in welke omstandigheden. Vooreerst werd telefonische contact opgenomen met de personeelsafdeling van de kredietinstellingen die een personeelsbestand hebben met meer dan duizend leden. In dit gesprek werden de banken om hun medewerking gevraagd voor een interview. Dit interview gebeurde aan de hand van een zelf opgestelde vragenlijst. De bekomen gegevens werden voor elke bank uitgeschreven, waarna per aspect conclusies werden geformuleerd. Ik hoop dat eenieder die deze scriptie leest, er iets van opsteekt. Ik heb alvast door het schrijven ervan mijn kennis over assessment centers fors uitgebreid. Daarenboven bood het empirisch onderzoek me de kans om een kijkje te nemen in de bedrijfswereld.
______________________________________________________________________________________________ 1 De Mesel Katrien Inleiding
1. Een blik op het assessment center
In dit hoofdstuk werpen we licht op wat een assessment center nu werkelijk inhoudt. Het is zeer belangrijk om bij de aanvang van deze scriptie duidelijk te stellen wat eronder verstaan wordt, zodat misverstanden vermeden worden. Eerst wordt een definitie gegeven en worden de essentiële kenmerken besproken. In het tweede deel wordt het verschil aangetoond met een aantal verbonden termen. A. BEGRIPSOMSCHRIJVING Iedereen is de term wel al eens tegengekomen, maar wat houdt een assessment center nu precies in? De naam doet vermoeden dat het om een plaats of gebouw gaat. Dit is nochtans niet (meer) het geval. De term is wel ontstaan in die zin, genoemd naar de werkelijke ‘centra’ waar in het begin de assessments georganiseerd werden. Vandaag duidt dit begrip een procedure aan, eerder dan een locatie, om op basis van gedragstests kandidaten te evalueren met het oog op selectie, promotie,… Er bestaan vele omschrijvingen van wat een assessment center is. Ik vermeld er enkele, waaronder de definitie die in de Belgische richtlijnen en ethische overwegingen vermeld staat. Verschillende landen hebben een definiëring en de noodzakelijke kenmerken van een AC vastgelegd, om wildgroei te vermijden. In België gebeurde dit in 1992 door de Werkgroep Assessment Centers Vlaanderen, onder toezicht van de Vlaamse Vereniging voor Organisatie-, Consumentenen Arbeidspsychologen (VOCAP): “Een assessment center is een evaluatieproces waarbij een individu of een groep van individuen beoordeeld wordt door meerdere beoordelaars (assessoren), die daarvoor een geïntegreerde set aan technieken gebruiken. Simulaties, waarbij gedragsobservatie basis is van meting, maken wezenlijk deel uit van de gehanteerde technieken. Op basis van de resultaten van een assessment center worden uitspraken gedaan over selectie, loopbaanplanning, potentieelbeoordeling, detectie van opleidingsbehoeften, enzovoort (Richtlijnen en ethische overwegingen VOCAP, 1992)”. “Een procedure waarbij op systematische wijze, met gebruikmaking van zowel groeps- als individuele oefeningen, tests en simulaties, wordt getracht die kwaliteiten vast te stellen die essentieel zijn voor een goede functieuitoefening van één of meer (toekomstige) medewerkers (Goemaere et al., 1997, blz. 149)”. “De Assessment Center Methode is een beoordelingsinstrument dat inzicht geeft in de gedragsvaardigheden van personen. Het is te definiëren als een testprogramma bestaande uit individuele activiteiten, (groepsactiviteiten), tests en oefeningen, waarbij kandidaten worden geobserveerd door beoordelaars ofwel assessors, ook wel assessoren genoemd. Op basis hiervan wordt bepaald of een kandidaat beschikt over eigenschappen en capaciteiten die essentieel worden geacht voor een functie (WIJCHERS et al., 1992, blz. 10-11).”
______________________________________________________________________________________________ De Mesel Katrien
2
Een blik op het assessment center
Niet zomaar alles wat enigszins met deze omschrijvingen strookt, mag beschouwd worden als een assessment center. De (in 2000 herziene) ‘Guidelines and Ethical Considerations for Assessment Center Operations’ sommen de onontbeerlijke eigenschappen van een assessment center op en verschaffen ze uitgebreid van toelichting. Wanneer één van deze voorwaarden niet vervuld wordt, mag de methode de naam ‘assessment center’ niet dragen. De voorwaarden worden hier kort opgesomd (JOINER, 2000, blz. 317-318). Een meer gedetailleerde uitleg volgt later. -
Er dient een functieanalyse uitgevoerd te worden waaruit de succesbepalende dimensies, competenties en
performantie vastgelegd worden. Wanneer men steunt op een oude analyse, moet de geldigheid ervan aangetoond worden. Bestaat de functie nog niet, dan moeten de taken of rollen die er deel zullen van uitmaken, bekeken worden. Dimensies mogen ook uit de visie, waarden, strategie en objectieven van de onderneming afgeleid worden. -
De gedragingen van de assessee moeten vertaald worden naar relevante categorieën zoals dimensies, vaardigheden
en kennis. -
Bij het ontwerpen van een center moet het gewenste gedrag in de functie gelinkt worden met competenties, die op
hun beurt omgezet worden in oefeningen. Op die manier zullen de beoordelingstechnieken informatie leveren die beoordeling van de dimensies mogelijk maakt. -
In het center moeten meerdere beoordelingstechnieken worden gebruikt, zoals tests, vragenlijsten, simulaties,…
-
Simulaties moeten een wezenlijk onderdeel vormen van het center. Deze oefeningen moeten in voldoende aantal
aanwezig zijn. -
Het is vereist dat meer dan één persoon als assessor optreedt in het center.
-
Bovendien moeten deze observatoren een grondige training krijgen.
-
Tijdens het assessment moeten de observaties geregistreerd worden, bijvoorbeeld aan de hand van checklists of
handgeschreven nota’s. -
Elke observator maakt een rapport van het geobserveerde in elke oefening vooraleer de integratie van de gegevens
plaatsvindt. -
Tot slot zullen de gegevens van de verschillende assessoren samengebracht en eventueel statistisch verwerkt
worden. Nijssen (NIJSSEN, 2000, blz. 41-42) vermeldt een aantal zogenaamde ‘vervuilende factoren’ waardoor de beoordeling een aanzienlijk deel van zijn voorspellende waarde verliest. Op basis van de hiervoor vermelde regels kan men bij aanwezigheid van een of meerdere factoren de activiteit niet als assessment center beschouwen. De vervuilende factoren zijn: het ontbreken van een degelijke functieanalyse, het gebruik van een verouderde functieanalyse, panelinterviews of vraagtechnieken als enige oefeningen, de eindevaluatie steunt op één oefening zodat er te weinig mogelijkheden tot observatie zijn voor een gefundeerde beoordeling (wanneer deze enige opdracht echter meerdere delen van de functie beslaat, stelt zich geen probleem), gebruik van testbatterijen die enkel bestaan uit schriftelijke situaties, er is slechts één assessor, de assessoren zijn ongetraind, de beoordelingen van de verschillende assessors lopen uiteen, de simulaties hebben geen nauwe band met de functie,…
______________________________________________________________________________________________ De Mesel Katrien
3
Een blik op het assessment center
B. ASSESSMENT CENTER EN VERWANTE BEGRIPPEN ♦
AC versus mini-assessment
Wanneer een ‘volledig’ AC te duur of te tijdrovend is, kan een onderneming opteren een ‘mini-assessment’ uit te voeren. De werkwijze blijft dezelfde, maar er worden minder kandidaten en assessors ingezet zodat sneller gewerkt kan worden. Bij de keuze van de oefeningen moet ernaar gestreefd worden de opdrachten zo nauw mogelijk te laten aansluiten bij de toekomstige functie. De werksituatie dient zo natuurlijk mogelijk nagebootst te worden (WIJCHERS et al., 1992, blz. 11). ♦
AC versus ‘work sample’
In een work sample worden de kandidaten getest aan de hand van simulatieoefeningen, net zoals in een AC. We kunnen echter pas spreken van een AC wanneer de simulaties een relatie hebben met de job, er fair en consistent wordt beoordeeld en wanneer de tests en de evaluatie systematisch zijn georganiseerd (VAN BEIRENDONCK, 1998, blz. 27). ♦
AC versus simulatie
Ook tussen de begrippen AC en simulatie kan verwarring ontstaan. Simulaties maken een essentieel onderdeel uit van een AC, maar niet elk AC bestaat enkel uit simulatieoefeningen. Aanvullingen met andere technieken zijn niet uitgesloten (VAN BEIRENDONCK, 1998, blz. 27). ♦
ACM in enge zin versus ACM in brede zin
Sommige auteurs maken een onderscheid tussen AC’s die enkel uit simulatieoefeningen bestaan (AC in enge zin) en de AC’s die ook andere selectie-instrumenten zoals psychologische tests, een gestructureerd interview,… integreren (BRAL, 2000, blz. 111). ♦
ACM versus klassieke tests
Van Beirendonck (VAN BEIRENDONCK, 1998, blz. 28-29) onderscheidt vijf verschilpunten tussen de ACM en de klassieke tests. Wat mensen ‘zeggen’ verschilt vaak van wat ze ‘doen’. Terwijl klassieke tests focussen op het eerste, evalueren AC’s de werkelijk getoonde competenties. Een AC legt het verschil tussen kennen en kunnen bloot. De theorie moet immers ook in praktijk kunnen worden omgezet. Een tweede verschil bestaat op vlak van de assessoren. In een AC nemen meerdere assessoren deel zodat individuele subjectieve oordelen uitgeschakeld worden. Van Beirendonck vermeldt ook de demystificatie van de ACM: de betrokkenheid van het management stijgt aangezien zij vaak mee evalueren. Bij de klassieke tests daarentegen is het enkel de expert-psycholoog die de gegevens behandelt. Terwijl klassieke interviews en persoonlijkheidsvragen het zelfbeeld van de kandidaat vastleggen, focust het AC op het gedrag, in plaats van op intenties. Tot slot lopen de methodes ook op vlak van voorspellingen uiteen. Klassieke tests steunen op de ‘sign approach’. Deze benadering zoekt relaties tussen eigenschappen van een persoon en diens gedrag. Wanneer deze relatie empirisch bevestigd is, spoort men bij de kandidaten naar de eigenschap (teken) die samenhangt met het gewenste gedrag. De ACM gaat anders te werk, namelijk via de ‘sample’-benadering. Er wordt verondersteld dat het gedrag dat geobserveerd wordt in een simulatie veralgemeenbaar is tot de handelingen die de persoon in de werkelijke job zal vertonen.
______________________________________________________________________________________________ De Mesel Katrien
4
Een blik op het assessment center
2. Historiek
Nu we weten wat de ACM inhoudt, is het interessant de geschiedenis ervan eens te bekijken. De assessment centers zoals we ze vandaag kennen, hebben immers reeds een hele weg afgelegd. Er wordt ook even stilgestaan bij de redenen die aan de basis liggen van de sterke opgang van de methode. A. GROEI VAN DE METHODE Voor een allereerste vorm van een assessment center gaan we terug tot na de Eerste Wereldoorlog. De Duitsers wensten hun leger uit te breiden en selecteerden door de kandidaten praktijkproeven te laten afleggen. De Britten namen de procedure over in hun ‘War Office Selection Board’. Zij voerden als eersten validiteitstests uit. Ook het Amerikaanse ‘Office of Strategic Services’ volgde, na problemen met een aantal andere methodes. In 1942-’43 gebruikte het OSS de simulatietechnieken om personen op te sporen die geschikt waren voor een functie als geheim agent. De methode leverde zeer gunstige resultaten en werd vervolgens ook toegepast bij de selectie van officieren voor het Amerikaanse leger. Na de Tweede Wereldoorlog stapte het OSS af van het gebruik van AC’s, behalve voor selectie van CIA-agenten. De procedure werd in andere landen, waaronder Groot-Brittannië, verder uitgewerkt (VAN BEIRENDONCK, 1998, blz. 14-17). De ‘American Telephone and Telegraph Company’ (AT&T) was het eerste particuliere bedrijf dat de procedure toepaste. In 1956 ondergingen sollicitanten voor hogere functies een AC in het kader van de ‘Management Progress Study’. Het programma bestond uit groepsopdrachten, simulaties, interviews en tests. Voor elke kandidaat poogde men de toekomstige performantie te voorspellen. Het assessment center diende louter onderzoeksdoeleinden en alle geëvalueerde kandidaten werden gerecruteerd en gevolgd tijdens hun loopbaan. Aangezien de resultaten niet werden bekendgemaakt aan de kandidaat noch aan diens leiding, kon acht jaar later de voorspellende waarde van het AC onderzocht worden. De prognoses voor de kandidaten bleken samen te lopen met hun echte performantie in het bedrijf. Deze positieve resultaten stimuleerden de verspreiding van de methodiek en andere organisaties volgden: Standard Oil, later IBM en General Electric (JANSEN en DE JONGH, 1993, blz. 18-19 en VAN BEIRENDONCK, 1998, blz. 71-72). Het duurde tot in de jaren zeventig vooraleer grote Europese bedrijven de waarde van het AC bij selectie ontdekten. Pioniers in Nederland waren Mars, Merck, Sharp & Dohme, Hendrix’ voeders en Rank Xerox. Later volgden Heineken, Siemens, KNP, Shell, ABN-AMRO, de Postbank en Ahold, om er een paar te noemen (NIJSSEN, 2000, blz.11-12 en blz. 123). In België waren Rank Xerox, Mars, Ford Genk en een aantal andere bedrijven de voortrekkers. Het grote succes van de methode liet echter tot in de jaren ’90 op zich wachten. In 1997 gebruikte 24% van de grote ondernemingen in België de methode, zo blijkt uit een onderzoek door Goemaere en zijn collega’s (VAN BEIRENDONCK, 1998, blz. 17). B. VERKLARING SUCCES Zoals uit de hiervoor beschreven geschiedenis blijkt, kende de methode een sterke opgang. Hiervoor zijn verschillende redenen aan te halen (VAN MINDEN, 1998, blz. 21-22). Ten eerste is de kost van een foute aanwerving toegenomen, zowel financieel (ontslagrecht) als emotioneel (teleurgestelde werknemer). Daarnaast stellen de klanten steeds hogere eisen en stijgt de werkdruk. Het AC zal selectie van geschikte werknemers verzekeren. Als derde oorzaak stelt van Minden dat de ACM tekortkomingen van traditioneel psychologisch ______________________________________________________________________________________________ De Mesel Katrien
5
Historiek
onderzoek vermijdt. Vakkennis en vaardigheden op psychologisch vlak kunnen samen onderzocht worden. Ook bij het testen van kandidaten van verschillende culturen, blijken traditionele instrumenten niet optimaal en biedt het AC een beter resultaat.
______________________________________________________________________________________________ De Mesel Katrien
6
Historiek
3. ACM in het dagelijkse leven
Na de korte uitzetting van de geschiedenis van de methode, is het nuttig de huidige toestand eens te bekijken. In dit hoofdstuk wordt het gebruik van de methode in België en een vergelijking tussen de Europese landen behandeld. A. GEBRUIK IN BELGIË •
Goemaere et al. onderzochten het kwantitatief gebruik en de ontwikkeling van AC’s in Vlaanderen en Brussel. Van
de grote ondernemingen uit verschillende sectoren en regio’s blijken 24% van de ondernemingen de ACM te hanteren voor selectie en/of potentieelbepaling (zie figuur 1). Figuur 1 : Gebruiksfrequentie van assessment centers in grote Vlaamse en Brusselse ondernemingen (Bron: Goemaere H. et. al., 1997, blz. 149) Ja 24% Missing values 4% Neen 72%
•
Wat de regio’s betreft, staan Antwerpen en Vlaams-Brabant aan de leiding met respectievelijk 33,5% en 28,5%.
Brussel en Oost-Vlaanderen volgen en West-Vlaanderen en Limburg sluiten de rij met 18% en 12,5% (zie figuur 2). Figuur 2 : Ondernemingen die assessment center toepassen. Relatieve cijfers per regio (Bron: Goemaere H. et. al., 1997, blz. 151)
40% 30% 20%
33,50% 22%
10% 0%
•
28,50% 23,50%
18% 12,50%
OVL
WVL
ANTW
LIMB
VLBR
BR
Wanneer de sectoren bekijken worden, blijkt het AC populair bij elektrische en elektronische apparaten, fabricage
(70%), chemie (63,5%), banken en voedingsindustrie (40%) en verzekeringen en uitgeverijen (37,5%) (GOEMAERE et al., 1997, blz. 151).
______________________________________________________________________________________________ De Mesel Katrien
7
ACM in het dagelijkse leven
•
Dat 24% van de grote ondernemingen het AC gebruikt, is een bevestiging van het onderzoek van Buyens et al.
(BUYENS et al., 1996, blz. 29-30). Deze studie vond als meest gebruikte methodes het face-to-face interview (97%), sollicitatieformulieren (88%), tests (67%), referenties (54%), interviewpanels (50%), ACM (24,5%) en grafologie (12%). Ook wordt vermeld dat de ACM in Europa weinig aangewend wordt voor selectie. Indien men toch werkt met deze methode, is dat meestal in het kader van potentieelbepaling en interne promotie. Deze tendens is niet enkel merkbaar in België, maar ook in andere landen (BUYENS et al., 1996, blz. 29-30). Het gevonden gebruikspercentage ligt hoger dan bij Vallet et al. (VALLET et al., 1995). Deze onderzoekers stelden immers vast dat AC’s 4% van de selectiemethoden voor bedienden uitmaakten en 2,2% bij kaderleden. Dit verschil kan verklaard worden doordat Vallet et al. niet enkel grote ondernemingen onderzochten en doordat Brusselse bedrijven niet waren opgenomen in hun steekproef (GOEMAERE et al., 1997, blz. 151). •
Uit dezelfde studie blijkt ook dat slechts acht van de drieëntwintig bedrijven een AC ontwerpt zonder inbreng van een
externe adviseur. De overige bedrijven wensen de inbreng van externe adviseurs. De betreffende functies liggen meestal op managementniveau en veel minder op niveau van arbeiders en bedienden (GOEMAERE et al., 1997, blz. 151). De meeste AC duren één dag en hebben zes deelnemers (LIEVENS en GOEMAERE, 1999, blz. 215). •
In Vlaanderen en Brussel bestaat bij de helft van de ondernemingen het assessorenkorps enkel eigen personeel, in
mindere mate vond men een combinatie met externe adviseurs en slechts enkele grote ondernemingen laten de beoordeling volledig aan externen over (GOEMAERE et al., 1997, blz. 152). •
De Vlaamse en Brusselse grote ondernemingen opteren massaal voor de discussie voor het bepalen van de
eindscores, hoewel deze soms zeer tijdrovend is. Slechts één van de 23 ondernemingen vormt het eindoordeel via een vaste beslissingsregel (GOEMAERE et al., 1997, blz. 153). •
De
tien
meest
voorkomende
dimensies
in
Vlaamse
grote
ondernemingen
zijn:
leiderschap,
communicatievaardigheden, planning en organisatie, teamgerichtheid, sociale vaardigheden, probleemanalyse, initiatief, creativiteit, stressbestendigheid en klantgerichtheid (LIEVENS en GOEMAERE, 1999, blz. 216). B. VERGELIJKING VAN HET GEBRUIK IN EUROPESE LANDEN Wanneer we België vergelijken met het buitenland zien we een frequenter gebruik van AC’s in andere landen zoals Duitsland (60%), het Verenigd Koninkrijk (44%) en Nederland (49%). In Zuid-Europese landen is het gebruik veel minder (10%) (BRAL, 2000, blz. 111). Met het groeiende belang van de Europese Unie, rijst de vraag in hoeverre de leden ervan gelijkaardig zijn. Ook op vlak van selectiemethoden komt deze vraag naar boven. Worden in de verschillende landen dezelfde technieken aangewend? Waar zijn afwijkingen te onderscheiden en wat ligt hiervan aan de basis? Shackleton en Newell (SHACKLETON en NEWELL, 1994, blz. 91-102) besloten licht op de zaak te werpen. Zij combineerden de resultaten van twee door hen uitgevoerde studies. Het eerste onderzoek stamt uit 1989 en levert gegevens omtrent Frankrijk en Groot-Brittannië. De tweede studie (1992) vergelijkt drie landen: Duitsland, Italië en België, waarvan Vlaanderen en Wallonië als aparte entiteiten worden beschouwd. Er bestaat dus een tijdsverschil van drie jaren tussen de twee studies en dit moet bij de interpretatie van de gegevens in rekening worden genomen. Wanneer de gegevens omtrent het assessment center bekeken worden, stelt men vast dat Italië de techniek het minst gebruikt: 92% van de bedrijven steunt niet op de procedure bij het selecteren van werknemers. In Duitsland en GrootBrittannië (in 1989) daarentegen wordt de methode bij 60% van de ondernemingen wel eens ingeschakeld. En terwijl in Vlaanderen de methode redelijk frequent voorkomt, blijft Wallonië achterop. ______________________________________________________________________________________________ De Mesel Katrien
8
ACM in het dagelijkse leven
Toch blijkt dat wanneer de procedure gebruikt wordt, dit niet extensief gebeurt: slechts 12% van de ondervraagden in Vlaanderen en Duitsland gebruikten de methode voor de helft van hun kandidaten of voor een groter deel ervan. In Frankrijk lag dit percentage in 1989 zelfs nog lager (zie tabel 1). Een opmerking is bij deze bevindingen in de tabel toch op zijn plaats: de vastgestelde verschillen tussen de landen in 1992 bleken (net) niet significant (SHACKLETON en NEWELL, 1994, blz. 97 en 100). In 1991 werd een studie uitgevoerd door de ‘European Review of Applied Psychology’ (ERAP). Daaruit bleek dat assessment centers in Noorwegen weinig voorkwamen, in tegenstelling tot Groot-Brittannië (SHACKLETON en NEWELL, 1994, blz. 91).
Tabel 1 : Gebruik van assessment centers bij selectie (aantal ondernemingen in%) (Bron: SHACKLETON en NEWELL, 1994, blz. 94)
Duitsland
Nooit
< 0,5 *
0,5 **
> 0,5 ***
Altijd
40,0
43,1 83,1
4,6 87,7
9,2 96,9
3,1 100,0
92,0
4,0
4,0
0,0
0,0
96,0
100,0
100,0
100,0
cumulatief Italië cumulatief Vlaanderen
57,8 cumulatief
Wallonië
76,0 cumulatief
Groot-Brittannië (in 1989)
41,1
cumulatief Frankrijk (in 1989)
81,2 cumulatief
24,4
6,7
8,9
2,2
82,2
88,9
97,8
100,0
20,0
4,0
0,0
0,0
96,0
100,0
100,0
100,0
34,2
12,3
8,2
4,2
75,3
87,6
95,8
100,0
9,4
7,5
1,9
0,0
90,6
98,1
100,0
100,0
* In minder dan 50% van de gevallen ** In de helft van de gevallen *** In meer dan 50% van de gevallen In een tweede onderdeel van het onderzoek werd de volgende vraag gesteld: ‘Hoe succesvol acht u de selectiemethode?’. Terwijl interviews en sollicitatieformulier bovenaan staan, blijken toch ook de assessment centers positief gewaardeerd te worden. Italië is hier het buitenbeentje: dit land, dat de methode niet veel aanwendt, blijkt ze ook niet te waarderen (SHACKLETON en NEWELL, 1994, blz. 97-98). Shackleton en Newell gingen na of de ondernemingsgrootte, en niet de nationaliteit ervan, aan de basis lag van de vastgestelde verschillen. Terwijl voor andere selectie-instrumenten het land de doorslag gaf, blijkt de grootte van het bedrijf bij AC’s de belangrijkste bepalende factor te zijn, net als bij de sollicitatieformulieren (SHACKLETON en NEWELL, 1994, blz. 98). Bovenstaande gegevens verschaffen een beeld van de situaties in de verschillende landen. Shackleton en Newell waarschuwen dat hiermee de kous echter niet af is. Zij botsten op grote verschillen in de AC’s tussen de landen. Dezelfde term kan heel verschillende dingen aanduiden. De inhoud en de specifieke omstandigheden waarin ze uitgevoerd worden, lopen uiteen. Pas wanneer ook deze factoren in kaart gebracht zijn, zal men een vollediger beeld krijgen over het gebruik in de Europese landen (SHACKLETON en NEWELL, 1994, blz. 100).
______________________________________________________________________________________________ De Mesel Katrien
9
ACM in het dagelijkse leven
4. Toepassingen van de ACM
Nu men een idee heeft van wat AC’s zijn en wáár ze worden aangewend, is het tijd een beeld te schetsen van de verschillende toepassingen van de techniek. Zoals in de VOCAP-omschrijving reeds vermeld is, kan een assessment center meerdere doelstellingen dienen. In wat volgt, wordt eerst een overzicht verschaft van de verschillende doelstellingen. In het tweede deel wordt dan verder ingegaan op het afstemmen van zelfevaluaties op beoordelingen van assessoren. A. DOELSTELLINGEN AC’s zijn veelzijdige instrumenten die voor vele doeleinden hun nut bewezen hebben. Van Minden onderscheidt volgende toepassingen (VAN MINDEN, 1998, blz. 19-20): naast selectie-instrument, de oorspronkelijke toepassing van het AC, is de methode ook geschikt voor preselectie bij training. Zo zal de onderneming enkel investeren in personen bij wie de opleiding meer kans heeft het gewenste effect te bereiken. Bovendien is het AC de aangewezen methode om de doorgroeimogelijkheden en het leerpotentieel van een persoon in te schatten. Daardoor weet men niet enkel wat iemand nu kan, maar ook waar hij/zij in de toekomst toe in staat zal zijn. Dit laat toe te evalueren of een persoon in aanmerking komt voor promotie. Promoveren op basis van anciënniteit kan vervangen worden door promotie op basis van de geschiktheid voor de functie. Het nodige potentieel voor die functie kan vergeleken worden met het potentieel dat een kandidaat bezit of kan ontwikkelen (NIJSSEN, 2000, blz. 79). Een veel voorkomende aanwending is deze waarbij trainings- en opleidingsbehoeften worden opgespoord. Een naar de individuele noden gerichte training is het gevolg. Dit past ook binnen het kader van loopbaanbeleid. Daarnaast kan geëvalueerd worden of de gewenste resultaten van de opleiding bereikt zijn en of specifieke vaardigheden beheerst worden. Bij outplacement tenslotte werpen de resultaten een blik op welke functies de kandidaat kan vervullen (VAN MINDEN, 1998, blz. 19-20). Een heel specifieke toepassing van de ACM spitst zich toe op het afstemmen van zelfevaluaties op de beoordelingen door assessoren. Het antwoord op de vraag waar dat dan wel goed voor is, luidt als volgt: wanneer een assessee zichzelf volkomen anders beoordeelt dan de assessor van een center, zal de beoordeelde in de verdediging gaan bij de feedback. De assessee zal de besproken tekortkomingen niet aanvaarden en bijgevolg zal hij/zij ook geen inspanning leveren om ze weg te werken. In plaats van het stimuleren van ontwikkeling, zal een averechts effect bereikt worden (CLAPHAM, 1998, blz. 193). Het is dan ook belangrijk om vooraf een blik te hebben op de wijze waarop de kandidaat zichzelf beoordeeld, zodat de feedback en het ontwikkelingsplan aangepast kan worden (HALMAN et al., 2000, blz. 435). Deze toepassing wordt verder uit de doeken gedaan in het tweede deel van dit hoofdstuk. B. AFSTEMMEN VAN ZELFEVALUATIES AAN BEOORDELINGEN VAN ASSESSOREN EN PEERS Gelijklopende zelf- en assessorevaluaties zullen de kans op aanvaarding van de feedback verhogen. De acceptatie zal op haar beurt de kans op een gedragsverandering doen toenemen. Tot slot wordt gesuggereerd dat de zelfevaluaties het toekomstig gedrag van die persoon kunnen voorspellen. Redenen genoeg om even dieper in te gaan op dit onderwerp. Deelnemen aan een development center (DC, center voor ontwikkelingsdoeleinden) resulteert in een hogere correlatie tussen de scores uit de zelfevaluatie en deze van de assessoren. Het aantal dimensies waarvoor de meningen gelijklopen, ______________________________________________________________________________________________ De Mesel Katrien
10
Toepassingen van de ACM
steeg in het onderzoek van Halman en collega’s van twee (vóór de deelname aan het DC) naar zes van de tien erna (HALMAN et al., 2000, blz. 423). Een mogelijke verklaring voor deze bijsturing van de eigen beoordeling, is dat het DC de kandidaten de kans geeft hun performantie te vergelijken met deze van de andere deelnemers. Ondersteuning voor deze hypothese wordt gevonden in het feit dat de dimensies die beoordeeld werden in de groepsoefening, meer gelijklopend beoordeeld werden door kandidaten en observatoren. Andere wetenschappers (Schmitt et al. 1986) kwamen echter niet tot dezelfde vaststellingen. Toekomstig onderzoek moet uitwijzen of groepsopdrachten het afstemmen van beide beoordelingen bevorderen (HALMAN et al., 2000, blz. 432). Er blijken een aantal factoren te bestaan die het bijsturen van het zelfbeeld bevorderen, namelijk de zelfbeoordelingstendens en het geslacht van de persoon. Personen die hun performantie onderwaardeerden vóór het DC, kenden zichzelf hogere scores toe na het doorlopen van het center. Wie zichzelf overwaardeerde, bracht geen significante wijzigingen aan in de zelfevaluatie. Wanneer een persoon die zijn prestaties overwaardeert en een sterk gevoel van eigenwaarde heeft, gedwongen deelneemt aan een DC, is de kans miniem dat deze persoon door deze ervaring zal veranderen. Het is belangrijk dat in het achterhoofd te houden (HALMAN et al., 2000, blz. 433-434). Naast de zelfbeoordelingstendens, beïnvloedt ook het geslacht van de kandidaten de mate waarin het DC veranderingen bij de personen teweeg zal brengen. Vrouwen bleken zichzelf nauwkeuriger te beoordelen, zowel vóór als na het DC en staan meer open voor de feedback (HALMAN et al., 2000, blz. 435). Steeds vaker worden ook collega’s ingeschakeld bij de beoordeling. Wanneer men de zelfevaluatiescores, de beoordelingen door collega’s en de beoordelingen door observatoren met elkaar vergelijkt, merkt men dat de zelfevaluatie het sterkst afwijkt van de twee andere. Harris en Schaubroeck (1988) stelden vast dat het beoordelingsformaat (dimensies of globaal) en de evaluatieschaal (gedrag of trait) geen invloed hadden. Het functietype (management of ‘blue collar’) daarentegen wel: de correlaties tussen de eigen beoordeling en die van de supervisor respectievelijk de collega’s zijn veel lager bij bestuursmedewerkers dan bij arbeiders. De correlaties tussen collega- en supervisorbeoordelingen blijven ongemoeid (NOWACK, 1997, blz. 145). Shore et al. gingen na of bij de drie assessments gesteund wordt op andere informatie. Dit blijkt inderdaad het geval: terwijl collega’s en assessors steunen op de informatie uit het center, blijkt de zelfevaluatie eveneens te steunen op informatie van buiten het center. De verschillen in de drie soorten beoordelingen zullen dus deels te verklaren zijn door de verschillen in de gebruikte informatie. Bovendien hechten de drie partijen niet evenveel belang aan elke dimensie en ook omgevingsfactoren (duidelijkheid van de doelstelling, beschikbare informatie voor de beoordelaars en evaluatiecontext) beïnvloeden de evaluaties. Onderzoek moet hieromtrent meer duidelijkheid brengen (SHORE et al., 1998, blz. 91-93). In een aantal studies wordt aangetoond dat de zelfevaluaties het toekomstig gedrag van die persoon kunnen voorspellen. Vele onderzoekers vonden echter dat de correlatie tussen zelfevaluaties en de beoordelingen van een observator laag is. Halman et al. gingen bijgevolg na of op basis van de absolute nauwkeurigheid van zelfevaluaties de aanvaarde en geweigerde kandidaten uit een center voorspeld konden worden. Enkel voor de groepsoefening bleek de variabele in staat onderscheid te maken tussen de succesvolle en niet- kandidaten (HALMAN et al., 2000, 456). Nowack vond in 1997 dat zelfevaluaties, samen met managerratings (bekomen door het invullen van een vragenlijst die peilt naar de managementvaardigheden door zowel de assessee als diens supervisor), bijdragen tot het voorspellen van ______________________________________________________________________________________________ De Mesel Katrien
11
Toepassingen van de ACM
objectieve (in-basketscores) en subjectieve (OAR, Overall Assessment Rating) performantiemaatstaven van een AC (NOWACK, 1997, blz. 145-151). In 1992 stelden Fletcher en Kerslake hogere correlaties tussen assessor- en zelfratings vast voor kandidaten met een hogere eindevaluatie in het center dan voor kandidaten met een lage OAR. Ook Bass en Yamarino (1991) en Furnham en Stringfield (1994) kwamen tot analoge resultaten (CLAPHAM, 1998, blz. 71 en FLETCHER, 1997, blz. 183-184). Kandidaten die onvoldoende presteren in het AC, blijken een minder nauwkeurige zelfevaluatie af te leveren na het doorlopen van het center. Succesvolle deelnemers schatten hun capaciteiten beter in. Logischerwijze rijst de vraag: waarom? Bass, Yamarino en anderen opperen dat de algemene onbekwaamheid om de reacties en gevoelens van anderen correct in te schatten een vinger in de pap heeft. Twee factoren kunnen onderscheiden worden: ofwel is men niet in staat de informatie van anderen te interpreteren en te gebruiken, ofwel gaat men zelfs niet actief op zoek naar feedback. Als gevolg van deze stelling ging Fletcher op zoek naar de persoonlijkheidstrekken en andere individuele factoren die de zoektocht naar feedback en het gebruik van de bekomen informatie bepalen. Uit het onderzoek van Fletcher, Taylor en Glanfield (1996) blijkt dat de personen die zichzelf beter inschatten minder zelfvertrouwen hebben, meer geneigd zijn te piekeren en zenuwachtig te zijn, zich minder vaak door de groep aanvaard voelen, meer plichtsbewust zijn en hogere verwachtingen over zichzelf koesteren. Personen die zelfkritischer zijn en minder zeker zijn van zichzelf, zullen vaker feedback zoeken en de reacties van anderen observeren. De kans is ook groter dat ze hun handelingen bijsturen. Waarschijnlijk zijn er ook nog andere factoren die het opsporen van feedback en het gebruik van de informatie beïnvloeden. Ook hier is een taak weggelegd voor toekomstig onderzoek (FLETCHER, 1997, blz. 184-185).
______________________________________________________________________________________________ De Mesel Katrien
12
Toepassingen van de ACM
5. Assessment Center versus Development Center
Nadat in het vorige hoofdstuk de verschillende toepassingen van de ACM op een rijtje zijn gezet, wordt hier dieper ingegaan op twee doelstellingen die het onderscheid tussen een assessment center en een development center bepalen. Steeds vaker wordt de term ‘assessment center’ vervangen door ‘development center’. Wat is nu het verschil tussen de twee? Bestaat er een verschil of gaat het om een nieuw modewoord? VERSCHIL Bral legt het verschil tussen de twee centers als volgt uit: “Wanneer de focus op het ontwikkelen van potentieel ligt, in plaats van op de sterkten en zwakten van de kandidaat, spreekt men van een development center. De werkwijze is weliswaar dezelfde. Enkel de doelstelling is verschillend. De uitkomst van een development center dient als basis voor een ontwikkelingsplan van de deelnemer. Terwijl het resultaat van een assessment center de werkgever helpt beslissen of hij een sollicitant al dan niet aanwerft. (BRAL, 2000, blz. 111)” Ook Bergenhenegouwen et al. (BERGENHENEGOUWEN et al., 1999, blz. 160) maken onderscheid naargelang de aanwending van de ACM. Zij spreken van assessment center wanneer deze selectie van betere kandidaten, verbetering van de taakvervulling en het bepalen van loopbaanbegeleiding tot doel heeft. Een development center dient daarentegen voor het ontdekken van ontwikkelingsbehoeften, vroege identificatie van talent, diagnose van trainingsbehoeften en vergemakkelijking van zelfdiagnose. Bij een development center is er steeds een link met scholing, opleiding, coaching, zelfstudie,… aanwezig. Het periodiek herhalen van het DC zal toelaten de vorderingen vast te stellen. Hiervoor is het uitstippelen van een ontwikkelingstraject noodzakelijk. Dit dient te bestaan uit een contract tussen de persoon en het management dat volgende aspecten vastlegt: de overeengekomen doelstellingen, de instrumenten om de prestaties te beoordelen en een individueel ontwikkelingsplan (IOP) dat aangeeft wat moet gebeuren om de werkelijke prestatie te laten aansluiten bij het gewenste presteren (BERGENHENEGOUWEN et al., 1999, blz. 163). De grootste basis van verschil ligt dus in de doelstelling. Van Beirendonck somt (VAN BEIRENDONCK, 1998, blz. 31) echter ook een aantal andere aspecten op: de betrokkenheid van de deelnemer bij het beoordelingsproces, de mate waarin assessoren beoordelaars dan wel ‘facilitators’ zijn, de keuze van de vragenlijsten en tests, het voortraject, de aanwending van de resultaten en het natraject, de toegankelijkheid van de resultaten voor vb. chefs en HRM, …
______________________________________________________________________________________________ De Mesel Katrien
13
Assessment Center versus Development Center
Figuur 3 : Toepassingsgebieden van assessment en development centers: gelijkenissen en verschillen (Bron: VAN BEIRENDONCK, 1998, blz. 33)
Er zijn echter ook een aantal kernelementen die voor beide centers gelijk zijn: het gebruik van simulaties, de basismethodologie (observatie, evaluatie, scores toekennen) en de noodzaak voor de basisdeontologie (VAN BEIRENDONCK, 1998, blz. 31). Figuur 3 geeft de gelijkenissen en verschilpunten voor de toepassingsgebieden van assessment en development centers. Vloeberghs (VLOEBERGHS, 1997, blz. 172-173) onderscheidt verschillende soorten assessment centers op basis van de doorwegende doelstelling ervan (assessment of ontwikkeling). In figuur 4 staan de types geschikt op een continuüm. Figuur 4 : Continuüm van assessment centers (Bron: VLOEBERGHS, 1997, blz. 172)
______________________________________________________________________________________________ De Mesel Katrien
14
Assessment Center versus Development Center
Vloeberghs vermeldt ook de verschilpunten tussen de twee uitersten (VLOEBERGHS, 1997, blz. 172-173): -
De duur bij ontwikkeling is minstens tweemaal zo lang aangezien de deelnemers de oefening uitvoeren, hierover feedback ontvangen en de opdracht een tweede maal doorlopen. Ook wordt een brede waaier van competenties beoordeeld.
-
De criteria bij ontwikkeling zijn complex. Dit laat toe op de unieke behoeften van de deelnemers in te spelen.
-
De deelnemers van een ontwikkelingscentrum mogen fouten maken en hieruit leren.
-
Bij ontwikkeling wordt tussentijds feedback verleend en krijgt deze ook een prominente waarde.
-
Terwijl bij selectie de assessoren afstandelijk blijven, krijgen zij bij ontwikkeling meer de rol van mentor en facilitator.
-
Wat het niveau van de oefeningen betreft, ligt dit gemiddeld lager bij ontwikkeling.
-
Counseling en persoonlijke ontwikkelingsplanning zijn onderdelen die enkel in een center met als doelstelling ontwikkeling voorkomen.
Terwijl de figuur een duidelijk overzicht geeft van de verschillende AC’s, zal het niet zo eenvoudig zijn om een bepaald AC toe te wijzen aan een van deze vormen. In de realiteit worden meerdere doelstellingen tegelijk gediend. Uit een selectie-instrument zal zelden louter een ja/nee-beslissing afgeleid worden. Er wordt immers veel meer informatie bekomen en het is zonde deze onbenut te laten (VAN BEIRENDONCK, 1998, blz. 35). In de praktijk worden de twee termen ook vaak door elkaar gebruikt. Er wordt dan gesproken over een development center terwijl men de resultaten ervan gebruikt bij selectie- of promotiebeslissingen. Het is duidelijk dat dit verwarring en wantrouwen in de hand werkt. PRAKTIJK Tillema onderzocht in welke mate ondernemingen die reeds vertrouwd zijn met assessment centers, warm lopen om ook development centers aan hun arsenaal toe te voegen. Uit een studie bij grote Nederlandse bedrijven kan Tillema besluiten dat bij de start ondernemingen de ACM hoofdzakelijk inzetten voor selectiedoeleinden, gevolgd door carrièreontwikkeling. Naarmate de methode een tijdje aangewend wordt, krijgt men meer oog voor het ontwikkelingspotentieel van de techniek. Vaak gebeurt dit echter uitsluitend in het kader van een specifieke doelstelling en voor bepaalde groepen. Het ontbreekt nog aan een algemeen besef dat een assessment center kan bijdragen tot de ontwikkeling van de medewerkers. Een tweede vaststelling is de tevredenheid over het AC in kader van detectie van specifieke competenties (TILLEMA, 1998, blz. 187-188). Tabel 2 : Toepassingen van de assessment centermethode die het management in overweging neemt (Bron: Tillema, 1998, blz. 187) Bij aanvang
Na twee of meer jaren
Overzicht van sterktes en zwaktes:
35%
Overzicht van sterktes en zwaktes:
65%
Selectie van personeel:
85%
Bepalen van ontwikkelingsnoden:
45%
Bepalen van ontwikkelingsnoden:
35%
Ontdekken van potentieel:
75%
Carrièreontwikkeling:
65%
______________________________________________________________________________________________ De Mesel Katrien
15
Assessment Center versus Development Center
Ik wens op te merken dat in wat volgt, omwille van praktische redenen vaak de term assessment center gebruikt is, waar zowel AC als DC bedoeld wordt. Wat behandeld wordt voor assessment centers is bijgevolg ook van toepassing voor de development centers, tenzij anders aangeduid.
______________________________________________________________________________________________ De Mesel Katrien
16
Assessment Center versus Development Center
6. Opdrachten in een assessment center
Zoals bij de begripsomschrijving van assessment centers vermeld werd, doet een center beroep op meerdere beoordelingstechnieken. Deelnemers aan een AC doorlopen verschillende oefeningen. Dit kunnen individuele of groepsopdrachten zijn, schriftelijke of verbale tests, … Wat volgt is een overzicht van de meest voorkomende testen. Er bestaan oneindig veel variaties in de oefeningen. Van Beirendonck slaagde erin de opdrachten onder te delen in vijf klassen (VAN BEIRENDONCK, 1998, blz. 51-54). a)
Postbak/ in-basket/ in-tray: In deze individuele oefening wordt de kandidaat de opdracht gegeven een postbak
door te nemen. Het is zijn taak om in een beperkt tijdsbestek te bepalen wat belangrijk is en welke acties vereist zijn. De voorbereidingstijd wordt bepaald aan de hand van de grootte van het in-basket, de werkdruk die men de kandidaat wil opleggen en de gewenste werksnelheid. De bevindingen worden meestal schriftelijk gerapporteerd, maar mondelinge rapportering is ook mogelijk en biedt het voordeel dat meer diepgaande informatie kan verworven worden. Bovendien verhoogt de face-validiteit en wordt de kandidaat persoonlijker behandeld. Tegenover deze voordelen staat het groter beslag op tijd, energie en bijgevolg financiële middelen (VAN BEIRENDONCK, 1998, blz. 53). b) Groepsdiscussie: De groepsdiscussie kan gebeuren al dan niet met rollentoewijzing. In zo’n rollenbedeling krijgt elke kandidaat een functie toegewezen en hij/zij dient vanuit dat standpunt deel te nemen aan de discussie. Er wordt een oplossing gezocht voor een probleem (budget vastleggen, productieprobleem oplossen, marketingstrategie bepalen,…). De groepsdiscussie moet onderscheiden worden van de groepsopdracht waarbij de kandidaten (in groep) een bepaalde taak moeten realiseren, bijvoorbeeld door fysieke arbeid (VAN BEIRENDONCK, 1998, blz. 53). Omwille van de anonimiteitswens van kandidaten met hoge functies, worden zij vaak niet aan deze oefening onderworpen. Pas afgestudeerden of personen met een startfunctie daarentegen wel. c)
Gesprekssimulatie: Ook tweegesprekken, rollenspelen en interviewsimulaties genoemd. De assessee krijgt een
situatieschets en een probleemstelling voorgeschoteld. Na een voorbereidingsperiode van meestal een half uur wordt een gesprek gevoerd met een klant, prospect, strategische partner of collega. Contactuele vaardigheden en probleemoplossende competenties zijn de meest geëvalueerde competenties bij dit soort opdrachten (VAN BEIRENDONCK, 1998, blz. 54). Van Minden (VAN MINDEN, 1998, blz. 169-190) vermeldt onder andere volgende tweegesprekken: conflictgesprek, slecht-nieuwsgesprek, exit-interview, adviesgesprek, selectie-interview, functioneringsgesprek en counseling (frequente, open bespreking tussen baas en medewerker). Verder is er nog het verkoopgesprek en het coachinggesprek. d) Analyse- en presentatieopdracht: De assessee krijgt voorbereidingstijd om een probleem te analyseren. In een tweede fase wordt de gevonden oplossing voorgesteld. Hierin zien we twee varianten: fact-finding en case-analyse. Bij fact-finding wordt de kandidaat overstelpt met gegevens en krijgt hij de opdracht een situatie te analyseren binnen een (strikt) tijdsbestek. Vervolgens moet hij een advies formuleren om het probleem van de baan te helpen. Analysevermogen, besluitvaardigheid, enz. zijn hier de geteste waarden. De case-analyse stelt de kandidaat voor een organisatorisch probleem, waarvoor aanbevelingen geformuleerd moeten worden.
______________________________________________________________________________________________ De Mesel Katrien
17
Opdrachten in een assessment center
e)
Andere: Andere opdrachten kunnen zijn een intelligentietest (numeriek, abstract-inductieve, abstract-deductieve,
verbale test,…), een persoonlijkheidsvragenlijst, een business game, een test voor productief denken, schriftelijke stukken produceren (klantenwerving, klachtbrief, marketingplan, herschrijven van een nota,…), een planningsopdracht (vb. een verhuis), een vergadering,… Elke soort oefening streeft ernaar bepaalde kenmerken en vaardigheden van de kandidaat te testen. Welke oefeningen gekozen zullen worden hangt af van de functie, de cultuur van de onderneming,… De oefeningen zelf kunnen (of eerder: moeten) aangepast worden aan de onderneming en aan de relevante functie zodat ze de kernelementen ervan weerspiegelen. Een overzicht van de meest populaire oefeningen in Vlaamse grote ondernemingen ziet er (in dalende volgorde) als volgt uit: in-basket, leaderless group discussion, rollenspel, presentatie en caseanalyse (LIEVENS en GOEMAERE, 1999, blz. 216). Wanneer bijvoorbeeld een selectieproces uit meerdere fasen bestaat, kan men zich afvragen of opdrachten als interviews, intelligentietests,… nu eigenlijk deel uitmaken van het assessment center of niet. Howards antwoord luidt als volgt: “Whether or not a multiple-hurdle selection process in its entirety is identified as an assessment center depends on whether assessors take into account all the information it produces when they rate dimensions (HOWARD, 1997, blz. 50).” Wanneer fasen enkel tot nut hebben om het aantal kandidaten te reduceren en de scores daarna niet meer gebruikt worden, maken deze fasen geen deel uit van het assessment center.
______________________________________________________________________________________________ De Mesel Katrien
18
Opdrachten in een assessment center
7. Dimensies
Nu we weten wat een AC is, de levensloop en de toepassingen van de methode kennen, is het hoog tijd om de basis van de techniek onder de loep te nemen. Aangezien dimensies een centraal element zijn van AC’s gaan we even dieper in op dit concept. Er wordt onder andere besproken wat het begrip inhoudt en welke wetenschappelijke waarde dimensies hebben. BEGRIP De ACM steunt, zoals hiervoor reeds werd aangehaald, op de observatie van gedrag. Om een kwalitatieve beoordeling te bekomen, moet doelgericht geobserveerd worden. Er is ook een eenduidige communicatie nodig. Om dit mogelijk te maken zijn de menselijke gedragingen opgedeeld in welomschreven gedragskenmerken die men ook gedragscriteria, dimensies en competenties noemt (VAN BEIRENDONCK, 1998, blz. 39-42). Van Beirendonck stelt dus, net als vele andere auteurs, de termen ‘dimensie’ en ‘competentie’ gelijk aan elkaar. Jansen en De Jongh daarentegen, argumenteren dat een dimensie verwijst naar een eigenschap die beschrijft hoe een persoon ís, terwijl een competentie verwijst naar wat iemand kán (JANSEN en DE JONGH, ….). In wat volgt gebruikt ik dimensie en competentie als synoniemen. Dat de term ‘dimensie’ een veelzijdig iets is, wordt duidelijk door volgende omschrijving (LIEVENS en KLIMOSKI, 2001, blz. 253): ‘dimensions have always been muddled collections of traits (e.g., energy), learned skills (planning), readily demonstrable behaviors (oral communication), basic abilities (mental ability), attitudes (social objectivity), motives (need for achievement), or knowledge (industry knowledge), and other attributes or behaviors’. Het is dan ook niet altijd duidelijk wat met een competentie bedoeld wordt. Er zijn ook zoveel definities! Van Sluijs en Kluytmans trokken een lijn door deze omschrijvingen en verdeelden ze in drie benaderingen (VLOEBERGHS, 1997, blz.166-168): •
Het merendeel beschouwt competenties als individuele eigenschappen, zoals kennis en bekwaamheden. Vaak wordt de
term gebruikt als synoniem voor SKA’s (Skills, Knowledge en Abilities). Sommigen voegen de vereiste toe dat een verband moet bestaan met de effectieve en uitstekende uitvoering van een taak of functie: ‘competencies are defined sets of knowledge, skills and abilities that allow the employee to perform specific functions related to organizational goals. It is a collection of behaviors that contribute to the performance of organizationally valued work.’ •
Een tweede groep van definities verwijst naar het combineren van kennis, kunde en vaardigheden van medewerkers met andere
resources zodat synergie ontstaat. •
De laatste benadering ziet een competentie als een eigenschap van de organisatie in plaats van een kenmerk van een individu.
Het combineren van kennis, vaardigheden, managementsystemen, technologieën,… maakt de creatie van een duurzaam competitief voordeel mogelijk. Van Beirendonck benadrukt het observeerbaar karakter van een competentie: de capaciteit moet zichtbaar ingezet kunnen worden. Om deze reden is ‘een hoog intelligentiequotiënt’ geen competentie, ‘vlotheid in het verwerken van cijfermatig materiaal’ daarentegen wel: “Een competentie omschrijven we als een capaciteit onder de vorm van toegepaste kennis, kunde, een observeerbare waarde, een attitude of een gedragsvaardigheid. De term ‘competentie’ wordt gebruikt om een ______________________________________________________________________________________________ De Mesel Katrien
19
Dimensies
capaciteit aan te duiden die nodig is om succesvol te zijn in de uitoefening van een bepaalde rol of functie, of om een capaciteit te benoemen waarover iemand beschikt (VAN BEIRENDONCK, 1998, blz. 124).” OPSTELLEN GEWENST COMPETENTIEPROFIEL Een AC of DC laat toe de aanwezige competenties bij de assessees vast te stellen en deze te vergelijken met het (in de toekomst) gewenste competentieprofiel. Allereerst kan het opstellen van dit profiel gebeuren door het uitvoeren van een functieanalyse. Op die manier komt men tot de actuele taken en verantwoordelijkheden van een functie en daaruit worden de vereiste competenties afgeleid. In het kader van een (dimensioneel) AC of DC zal de klemtoon echter verschuiven van deze taken naar de mentale processen, de vereiste eigenschappen van de functiehouder en hun belang bij het succesvol uitoefenen van de functie. De output van de analyse bestaat uit de belangrijkste competenties en hun bijhorende gedragsindicatoren en normen. Deze gegevens kunnen op meerdere manieren bekomen worden: via observatie, interviews, vragenlijsten, agenda’s van werknemer,… Meer naar de toekomst gericht, kan men het competentieprofiel ook opstellen uit de ondernemingsmissie, de strategie, omgevingsfactoren,… (VAN BEIRENDONCK, 1998, blz. 45-46). Elke competentie wordt eenduidig beschreven en opgesplitst in indicatoren. Zo zal bijvoorbeeld de dimensie ‘probleemanalyse’ als volgt omschreven worden: ‘het verwerken van gegevens, het duiden van een probleem in zijn verbanden en het op systematische wijze op zoek gaan naar bijkomende informatie om het probleem op te lossen.’ De indicatoren van deze competentie zijn een goed algemeen inzicht in de problematiek, verbanden opmerken tussen delen van de problematiek, controleren van de informatie,… (VAN BEIRENDONCK, 1998, blz. 39-42). De competenties en hun bijhorende indicatoren worden op hun beurt gegroepeerd tot clusters. Dit gebeurt op basis van de aard van het gedrag. Deze indeling is vaak arbitrair, maar kan de communicatie vereenvoudigen. Voorbeelden van clusters zijn leiderschap, interactieve communicatie, probleemverwerkende vaardigheden,… (VAN BEIRENDONCK, 1998, blz. 42). WETENSCHAPPELIJKE WAARDE Van Beirendonck merkt op dat de dimensies geen wetenschappelijk geverifieerde constructen zijn. Er bestaat geen lijst met onafhankelijke competenties. Dit heeft tot gevolg dat eenzelfde gedrag toegewezen kan worden aan verschillende gedragscriteria, afhankelijk van de ordening van de competenties (VAN BEIRENDONCK, 1998, blz. 42). Hoeft en Schuler (HOEFT en SCHULER, 2001, blz. 115-123) vermelden dat de dimensies het statuut toegewezen krijgen van de traditionele persoonlijkheidskenmerken en dat dit bovendien onterecht is. Sackett en Dreher waren in 1982 bij de eersten om dit gebruik op te merken en aan de kaak te stellen. Zij gebruikten in hun onderzoek de MultitraitMultimethod-benadering (MTMM). In geen enkel van de onderzochte centers werd aan de voorwaarden voor constructvalide maatstaven voldaan. Een trait heeft volgens Guldin en Schuler drie determinerende kenmerken: stabiliteit (ze wijzigen pas na een lange periode), consistentie (traits zijn waarneembaar in velerlei situaties) en algemeenheid (ze hebben een breed effect op vele verschillende taken of inspanningen). Guldin en Schuler onderzochten in hoeverre de assessment center-dimensies ook deze kenmerken bezitten. Zij besloten dat de scoringsdimensies niet hetzelfde conceptueel niveau hebben als traits.
______________________________________________________________________________________________ De Mesel Katrien
20
Dimensies
Daarbij moet wel opgemerkt worden dat een aantal criteria wel gelijkaardige kenmerken vertonen, terwijl andere louter situatiespecifieke vaardigheden zijn (HOEFT en SCHULER, 2001, blz. 117-118). Hoeft en Schuler leggen de oorzaak bij de sample-benadering, waarbij uit de functie een aantal belangrijke activiteiten worden gehaald die omgezet worden in criteria. De dimensies weerspiegelen dus gedragingen die nodig zijn voor een succesvolle uitvoering van de functie. Pas daarna worden deze taakelementen opnieuw geïnterpreteerd naar traits/kenmerken van succesvolle werknemers (HOEFT en SCHULER, 2001, blz. 118-119). Guldin en Schuler stellen in hun studie uit 1997 dat het conceptueel niveau van dimensies tussen dat van traits (met een hoge consistentie en lage specificiteit) en skills (met een lage consistentie en een hoge specificiteit) ligt (HOEFT en SCHULER, 2001, blz. 119). Scholtz en Schuler onderzochten de relatie tussen de totaalscores uit AC’s en klassieke persoonlijkheidskenmerken. Intelligentie, sociale vaardigheden, motivatie, zelfvertrouwen en dominantie kwamen als de beste voorspellers van de scores naar voor. Lagere correlaties bestaan met locus of control, zenuwachtigheid, extraversie, mannelijkheid en openheid. Voor aangenaamheid werd geen verband vastgesteld. (HOEFT en SCHULER, 2001, blz. 121).
______________________________________________________________________________________________ De Mesel Katrien
21
Dimensies
8. Deelnemers in een AC
In dit onderdeel gaan we dieper in op de verschillende partijen die bij de uitvoering van een center betrokken zijn. Achtereenvolgens wordt aandacht geschonken aan de assessees, de assessoren, de moderator en de rollenspeler. Voor elke deelnemer wordt besproken wat hun rol is en welke eigenschappen belang hebben voor de effectiviteit van het center. A. ASSESSEES De assessees zijn de personen die het center doorlopen en die beoordeeld worden. Lang bleef de ACM een instrument dat exclusief voor personen met een hoge functie werd ingeschakeld. Steeds meer wordt de methode nu ook voor lagere functies ingeschakeld en nemen ook verkoopsmensen, leraars en directeurs, ingenieurs, arbeiders, politieagenten, brandweerlui,… aan centers deel (WINFRED et al., 2000, blz. 813). Vele onderzoekers gingen na welke kenmerken van assessees de kwaliteit van een AC beïnvloeden (LIEVENS en KLIMOSKI, 2001, blz. 249-252 en 265-267). •
Een eerste onderzochte factor is het ras. Hoewel de ACM beter scoort dan de andere technieken, zijn de resultaten
verdeeld. De helft van de studies stelt dat er geen verschil is in de scores van kandidaten met een verschillend ras. De andere helft wijst er echter op dat blanke deelnemers bevoordeeld worden tegenover de deelnemers van een ander ras. In de zoektocht naar de verklaring van deze gemengde resultaten werd ontdekt dat het type oefening en meer bepaald de cognitieve inhoud ervan een invloed had. Wanneer de cognitieve component van de oefening belangrijker was, bijvoorbeeld bij een in-basket, werd een verschil tussen de rassen vastgesteld. Mondelinge oefeningen discrimineren minder dan schriftelijke. Later kom ik terug op deze kwestie bij de bespreking van de billijkheid van de ACM. •
Het geslacht van de assessees mag de score niet beïnvloeden. Is dat ook het geval? Er bestaat onderzoek dat duidt
in de goede richting. Andere onderzoekers vonden kleine geslachtsverschillen in het voordeel van de vrouwelijke kandidaten. Ook dit aspect wordt verder uitgediept wanneer de billijkheid behandeld wordt. Wanneer de scores van zwangere en niet-zwangere vrouwen worden vergeleken, merkt men dat de eersten slechter beoordeeld worden. Deze tendens is voornamelijk bij mannelijke assessoren en in mindere mate bij vrouwelijke beoordelaars aanwezig. •
Dubbelzinnigheid is ook terug te vinden in de resultaten omtrent de leeftijd van de kandidaat.
•
Fysieke aantrekkelijkheid van de kandidaat heeft een invloed, maar slechts op kleine schaal.
•
De invloed van persoonlijkheidskenmerken werd eveneens onderzocht. Scholz en Schuler vonden een correlatie
met de intelligentie van de assessee, de dominantie, de motivatie/ambitie, de sociale bekwaamheid en het zelfvertrouwen. Ook Schmidt en Hunter rapporteren een correlatie met ‘externe criteria van jobsucces’ en met de algemene mentale capaciteit. Het komt zelfs zover dat het duo het belang van AC’s in twijfel trekken (aangezien het AC in combinatie met indicatoren van de algemene mentale capaciteit niet bijdraagt tot een hogere validiteit). Ook Fleenor beschrijft een correlatie tussen de eindscore en karaktertrekken zoals vertoon/aanstellerij, dominantie en agressiviteit. Personen met een competitieve instelling en acteurs ontvangen hogere scores.
______________________________________________________________________________________________ De Mesel Katrien
22
Deelnemers in een AC
Tegenover dit overzicht van studies staan ook vele onderzoeken die de afwezigheid van een correlatie aanduiden. Goffin en kompanen besluiten dat persoonlijkheid en assessment centers andere domeinen keuren en dus verschillende aspecten van de performantie voorspellen (LIEVENS en KLIMOSKI, 2001, blz. 267). •
Vaak stelt zich de vraag of kandidaten door de angst en spanning, die samengaat met een AC, een slechtere
beoordeling krijgen. Het antwoord bleek negatief: meer angst resulteert niet in een lagere score. •
De relativiteit van de prestaties blijkt belangrijk. Contrasteffecten bestaan uit ‘between assessee variability’ en ‘within
assessee variability’. Op vlak van ‘between assessee variability’, wordt een zwakpresterende kandidaat lager gescoord wanneer hij/zij omgeven wordt met goede kandidaten, dan wanneer de anderen ook slecht presteren. Wat ‘within assessee variability’ betreft, krijgt een kandidaat bij een matige prestatie een slechtere beoordeling wanneer de vorige taken beter werden uitgevoerd dan wanneer hierop ook zwakker gepresteerd werd. Verder zijn de scores van kandidaten wiens performantie verschilt nauwkeuriger dan bij assessees zonder performantieschommelingen. •
Een laatste onderzocht aspect is de assessee training. Voor een in-basket, rollenspel, leaderless group discussion
en presentatie van een businessplan, lijkt oefening hogere scores op te leveren. Er is echter geen recent onderzoek om deze bevindingen te bevestigen. Eén onderzoek 1 ging de impact na van twee soorten opleiding: enerzijds lezingen en discussies met als doel verschillende organisatorische gedragsdomeinen aan te leren, en anderzijds een vorming met dezelfde inhoud maar via een meer empirische invulling. Beide vormen veroorzaken betere dimensiescores in een rollenspel, hogere totaalscores in een mondelinge presentatie en één hogere competentiescore bij een in-basket. De praktijkgerichte cursus leverde echter hogere scores op bij een rollenspel en de in-tray. B. ASSESSOREN Een assessor heeft als voornaamste taak het gedrag van de kandidaten waar te nemen en te beoordelen. Assessors kunnen ook kandidaten interviewen en worden soms ingeschakeld als rollenspeler (zie verder). Het aantal assessoren dat ingeschakeld wordt is afhankelijk van verschillende factoren. Eén ervan is het aantal kandidaten. Wanneer twee assessoren per kandidaat aanwezig zijn, wordt de hoogste objectiviteit behaald. Dit brengt natuurlijk enorme kosten met zich mee en dat is de reden waarom in de praktijk aan deze voorwaarde niet voldaan wordt. Om de kandidaten toch te laten evalueren door verschillende personen, beoordelen assessors verschillende kandidaten tegelijk. Lievens en Klimoski (LIEVENS en KLIMOSKI, 2001, blz. 248-249) geven een overzicht van studies die de invloed van allerlei kenmerken van assessoren nagaan. Voor elk van deze factoren werd nagegaan of ze een invloed uitoefenen op de kwaliteit van het AC. •
Lowry onderzocht de impact van demografische karakteristieken zoals leeftijd, ras, opleiding, rang, gezag, vroegere AC-
ervaring, managementervaring en ervaring met de doelfunctie. Enkel leeftijd en rang van de assessor bleken de scores te beïnvloeden, zij het in zeer beperkte mate. •
Er bestaan ook studies die focussen op het geslacht van de assessor. De resultaten zijn gemengd, maar wijzen meestal
geen verschil aan tussen de scores van mannelijke en vrouwelijke assessoren. Sommigen vonden dat vrouwelijke beoordelaars hogere scores gaven. Dit was ook zo in het onderzoek van Shore et al. (SHORE, 1997, blz. 200). In dit AC
1
Mayes, Belloli, Riggio en Aguirre (1997)
______________________________________________________________________________________________ De Mesel Katrien
23
Deelnemers in een AC
bleef dit fenomeen echter beperkt tot de eerste oefening van het center. In de opdrachten die volgden was het verschil in de scores tussen de twee geslachten afwezig. Er werd ook onderzoek verricht naar de relatie tussen het geslacht van de assessor en dat van de assessee. Walsh en collega’s vonden dat mannelijke assessoren vrouwelijke kandidaten een hogere score gaven dan de mannelijke medekandidaten. Dit fenomeen werd in latere studies echter niet teruggevonden (SHORE, 1997, blz. 200). Meer uitleg volgt bij de bespreking van de billijkheid van de ACM (zie Voordelen en Nadelen van de ACM). Hoewel wordt aangenomen dat geslacht geen effect heeft op de validiteit, acht Van Beirendonck (VAN BEIRENDONCK, 1998, blz. 62) het, omwille van de face-validiteit, verstandig om bij een groep assessees waarin beide geslachten aanwezig zijn, zowel mannelijke als vrouwelijke assessoren aan te duiden. •
Bij onderzoek omtrent persoonlijkheidstrekken (BARTELS en DOVERSPIKE, 1997, blz. 179 en 188) bleken
assessoren met een hogere intelligentie, gevoeligheid en zelfbeheersing meer toegeeflijk. De vaststelling omtrent de intelligentie kwam als een verrassing omdat vroeger onderzoek steeds bevestigde dat intelligentere mensen nauwkeuriger beoordelen. De auteurs wijzen op het belang van een uitgebreide studie rond deze variabele. •
Ook de keuze tussen een psycholoog of een manager als assessor heeft invloed, meer bepaald op de convergent- en
discriminantvaliditeit. Psychologen zijn beter in staat de dimensies te onderscheiden. Managers leveren dan weer beoordelingen die beter aansluiten bij de waarden en normen van de onderneming. Een assessorteam bestaat best uit een goede mix waarin bijvoorbeeld zowel lijnmanagers als personeelsmedewerkers als externe begeleiders vertegenwoordigd zijn. Voorts moet het team geloofwaardig en bekwaam zijn. De leden moeten ook belangstelling tonen voor de rol van assessor en moeten voldoende tijd kunnen vrijmaken om het center bij te wonen. Als laatste voorwaarde vermeldt Van Beirendonck (VAN BEIRENDONCK, 1998, blz. 59-60) dat de assessoren voldoende frequent moeten optreden in die rol. Is dit niet zo, dan moet de persoon zich steeds weer inwerken en zal de beoordeling nooit systematisch gebeuren. Drie of vier keer per jaar is volgens hem dan ook een minimum. Wanneer aan deze voorwaarden voldaan wordt, ontstaat vaak een probleem: steeds dezelfde geloofwaardige personen worden gevraagd, waardoor ze niet langer beschikbaar zijn. Toch is het bij de implementatie aan te raden de eisen op te volgen. Dit zal immers de acceptatie van het proces verhogen en de rol van assessor zal als aanlokkelijk ervaren worden (VAN BEIRENDONCK, 1998, blz. 60). Van Beirendonck hekelt twee additionele voorwaarden die in de literatuur naar voor komen. De eerste stelt dat interne assessoren twee hiërarchische niveaus hoger moeten staan dan de assessees (‘n+2’-eis). De andere dat assessoren en deelnemers elkaar best niet kennen. Van Beirendonck argumenteert dat deze eisen onnodig zijn. De eerste voorwaarde zou volgen uit de vrees dat een lijnmanager zijn positie wil veilig stellen door minder goede kandidaten te selecteren. In dit opzicht gaat men ervan uit dat deze toekomstige chef erin zal slagen de andere assessoren te beïnvloeden zodat zij zijn keuze steunen. Van Beirendonck acht dit bij een degelijk assessorenteam niet mogelijk. Bovendien is de ACM de techniek bij uitstek om de lijnmanager te dwingen objectief de competenties vast te stellen. Problemen worden met de andere beoordelaars besproken. Een tweede belangrijk argument is de praktische haalbaarheid van de ‘n+2’-eis: nu organisaties steeds vlakker worden, komt deze in het gedrang. Wanneer assessor en assessee elkaar kennen, vreest men dat een subjectieve beoordeling het gevolg zal zijn. Van Beirendonck vindt deze angst ongegrond (zie hierboven). Toch kan deze praktijk wel aanleiding geven tot problemen. Wanneer de assessor het optreden van de bekende gaat vergelijken met diens dagelijkse prestaties, kunnen vertekeningen ontstaan. De mentor moet hiervoor alert blijven en de bespreking beperken tot vaststellingen uit het center. Afwijkingen ______________________________________________________________________________________________ De Mesel Katrien
24
Deelnemers in een AC
tussen de beoordeling van de werknemer in de functie en de beoordeling in het center kunnen verklaard worden door meerdere factoren. Wanneer de kandidaat beter scoort in het AC dan in zijn werkelijke job, kan een beoordelingsfout aan de basis liggen. Het is echter ook mogelijk dat de competentie niet tot uiting komt in het dagelijkse werk terwijl ze wel aanwezig is bij de werknemer. In de omgekeerde situatie waarin de persoon in het dagelijkse leven een hogere score behaalt, kan het zijn dat de lat in het AC hoger ligt dan in de actuele functie. En ook hier kunnen beoordelingsfouten aanwezig zijn (VAN BEIRENDONCK, 1998, blz. 61-62). C. MODERATOR De moderator is de supervisor van het assessment center. Zijn taak bestaat hoofdzakelijk uit de voorbereiding van het assessment center. Zo zal hij (in samenspraak met het management) de doelstelling vastleggen, zorgen voor een degelijke en actuele functieanalyse, de omzetting van de functieanalyse in concrete oefeningen garanderen, aangepaste checklists of vragenlijsten opstellen en (bekwame) assessoren kiezen. Na afloop van het assessment center zal hij ook de feedback naar het management en de kandidaten verzorgen. Tot slot waakt de moderator over standaardisatie (elke kandidaat doorgaat dezelfde oefeningen, krijgt dezelfde informatie,…), de betrouwbaarheid en de deugdelijkheid. Dit laatste wijst op een degelijke functieanalyse en het bereiken van de doelstellingen (NIJSSEN, 2000, blz. 45-55). D. ROLLENSPELER Een derde partij die kan optreden in een AC zijn rollenspelers. Zij hebben tot taak bepaald gedrag bij de kandidaten uit te lokken, zodat de assessoren meer relevante observaties hebben om hun oordeel op te baseren. Ze zorgen ook voor standaardisatie (LIEVENS en KLIMOSKI, 2001, blz. 252). Assessoren vervullen vaak deze rol, maar steeds vaker worden professionele acteurs ingeschakeld. Er is slechts beperkt onderzocht welke invloed de rollenspelers hebben op de kwaliteit van het AC. Men weet wel dat actieve spelers, door het uitlokken van gedrag, bijdragen tot een hogere convergent- en discriminantvaliditeit (LIEVENS en KLIMOSKI, 2001, blz. 252). De invloed van het geslacht van de rollenspeler moet nog nagegaan worden. De interactie met de assessee of met het geslacht van de assessor zijn aspecten voor verder onderzoek (SHORE, 1997, blz. 199).
______________________________________________________________________________________________ De Mesel Katrien
25
Deelnemers in een AC
9. Training assessoren
Aangezien de kwaliteit van een center nauw samenhangt met de vaardigheden van de assessoren, aan we in dit hoofdstuk dieper in op de opleiding voor de assessoren. Eerst worden de voordelen van een grondige opleiding opgesomd. Daarna worden de factoren die de duur ervan bepalen, toegelicht. Vervolgens worden de elementen van de training en de verschillende visies en benaderingen besproken. Tot slot wordt een specifieke vorm van opleiding, namelijk de assessment centersimulatie, toegelicht. A. VOORDELEN VAN ASSESSORENTRAINING •
Het voorzien van een degelijke opleiding voor de assessoren is van primordiaal belang. Het ontbreken ervan kan
immers de hele waarde van het AC teniet doen. De kwaliteit van de ACM hangt samen met deze van de assessors. Assessoren die geen opleiding gehad hebben, zullen vaak gekleurde waarnemingen afleveren. Bij de bespreking van de knelpunten die men kan ondervinden in AC’s, is een overzicht gegeven van een groot aantal oorzaken van vertekeningen. Training kan deze vertekeningen opheffen zoniet verminderen en zo bijdragen tot betere beoordelingen. •
De training van de beoordelaars leidt echter niet enkel tot een goede evaluatie in het AC, maar verschaft ook
observatie-
en
evaluatievaardigheden
die
buiten
dit
kader
gebruikt
kunnen
worden,
bijvoorbeeld
bij
functioneringsgesprekken, interviews, coaching en motivatie van de medewerkers (LIEVENS, 1998b, blz. 212). Assessortraining resulteert zelfs in grotere gedragswijzigingen dan traditionele managementtrainingen. Ook het zelfbeeld van de assessoren ondervindt een invloed door de training: de managers ontdekken dat ze bepaalde vaardigheden minder goed onder de knie hebben, dan ze voor ogen hadden (VAN BEIRENDONCK, 1998, blz. 56). •
Assessortraining kan ook gebruikt worden om het commitment, de kennis en de ondersteuning voor het
assessmentproces te verhogen bij een ruimere groep mensen. Bovendien zullen lijnmanagers die als assessoren optreden ook beter in staat zijn de resultaten van een center te interpreteren en te gebruiken (VAN BEIRENDONCK, 1998, blz. 59). B. DUUR VAN ASSESSORENTRAINING Over de duur van de training bestaat heel wat commotie: moet de opleiding 3 dagen duren of volstaat 1 dag ook? Hoe lang de training moet duren is echter niet zomaar te zeggen. De duur is immers afhankelijk van diverse factoren: de duur van het assessment center-programma, de complexiteit van de simulaties, de doelstelling van het center, de taak van de assessor (coördinator, rollenspeler, assessor), de trainingsvorm (inductief of deductief), de visie op training en de deskundigheid van de trainer (VAN BEIRENDONCK, 1998, blz. 56). Joiner vermeldt ook nog de ervaring van de assessor met de beoordelingstechniek, het gebruik van psychologen, de kennis van de assessor over de onderneming en de functie, de regelmaat waarmee de persoon als assessor optreedt, de moeilijkheidsgraad van de functie en het aantal dimensies (JOINER, 2000, blz. 323-324). Lievens en Klimoski (LIEVENS en KLIMOSKI, 2001, blz. 248-249) voerden ook onderzoek omtrent de duur van de training en constateerden dat wanneer de opleiding verlengd wordt van één dag tot twee dagen, de nauwkeurigheid van de scores fors stijgt. Een derde dag levert geen significante verbetering. Vorming levert dus maar tot op bepaalde hoogte een meerwaarde. De kwaliteit van een AC is geen functie van de duur van de assessorentraining.
______________________________________________________________________________________________ De Mesel Katrien
26
Training assessoren
De periode tussen de assessorentraining en het eerste optreden als assessor, mag niet langer zijn dan zes maanden. Anders is het aan te raden een opfrissingscursus te organiseren of de assessoren speciaal te laten begeleiden door een ervaren beoordelaar. Hetzelfde geldt wanneer de persoon geen recente ervaring als assessor bezit, bijvoorbeeld minder dan twee assessments in twee opeenvolgende jaren (JOINER, 2000, blz. 325). C. ELEMENTEN VAN DE TRAINING Het hoofddoel van de opleiding is te leiden tot betrouwbare en nauwkeurige beoordelingen. Daartoe moeten een aantal minimale vereisten voldaan worden. De ethische richtlijnen van de Vlaamse Vereniging voor Organisatie-, Consumenten- en Arbeidspsychologen (VOCAP) vermelden zeven elementen die in de training moeten aanwezig zijn: “ 1) kennis van de organisatie en de te beoordelen functie 2)
observatietraining, waarbij geleerd wordt zo zuiver mogelijk te observeren en de interpretatie/beoordeling uit te stellen
3)
zich vertrouwd maken met de simulaties, bij voorkeur door ze zelf als kandidaat te doorlopen
4)
aanleren van de voor de functie of het functieniveau relevante gedragsdimensies
5)
training in de verschillende stappen van de beoordelingsprocedure
6)
aanleren van de vaardigheden om een evaluatiediscussie te houden
7)
deontologische beschouwingen bij personeelsbeoordeling.”
Ik ga even dieper in op het zevende punt namelijk de deontologische principes. Bij het vervullen van de rol van assessor kunnen volgende aspecten vooropgesteld worden (VAN BEIRENDONCK, 1998, blz. 58): -
De assessoren houden de inhoud van de simulaties geheim.
-
De observaties die zij verricht hebben, blijven geheim.
-
Bij de rapportering van de uiteindelijke resultaten worden de regels in acht genomen.
-
Elke deelnemer heeft recht op betrouwbare feedback.
-
De assessor blijft trouw aan de eindscore die ontstaat via consensus. Uitspraken die hier niet mee stroken zijn uit den boze.
-
Bij rollenspelen moet de rol realistisch zijn. Extreme situaties moet men mijden.
-
De kandidaten moeten vriendelijk en begrijpend behandeld worden tijdens het center.
Effectieve assessorentraining bestaat ook volgens Hauenstein niet enkel uit het verduidelijken van de dimensies (Performance Dimension Training). Het is onwaarschijnlijk dat PDT op zich de kwaliteit van de scores fors zal beïnvloeden. Het is een noodzakelijke, maar niet-voldoende voorwaarde. Het actief inoefenen van het geleerde is van wezenlijk belang omdat de assessoren hun individuele performantiestandaarden kunnen afstemmen op de beoordelingsschalen. Hiervoor is het verstrekken van feedback op de toegekende scores zeer belangrijk. De assessoren krijgen een situatie voorgeschoteld (beschreven of op video) en beoordelen het gedrag. Daarna ontvangen zij kwantitatieve (de correcte scores) of/en kwalitatieve (motivatie van de beoordeling) feedback (HAUENSTEIN, 1998, blz. 405-413). Nijssen (NIJSSEN, 2000, blz. 75) vermeldt eveneens het belang om het waarnemen en beoordelen actief in te oefenen. Dit is de zogenaamde deductieve training, die in tegenstelling van de inductieve training, praktijkgericht is. Wanneer de assessor met bijkomende taken wordt belast, moet ook hiervoor opleiding verschaft worden. Deze taken kunnen zijn: het voeren van een interview dat peilt naar specifieke gedragscompetenties, een interview over de ______________________________________________________________________________________________ De Mesel Katrien
27
Training assessoren
achtergrondinformatie van de kandidaat, het spelen van een rol als ontevreden klant,… (VAN BEIRENDONCK, 1998, blz. 57-58). Tot slot moet de assessor vertrouwd gemaakt worden met de feedbackprocedure en moet werkwijze voor het verschaffen van correcte feedback gedemonstreerd worden (JOINER, 2000, blz. 323). D. BENADERINGEN Er bestaan verschillende benaderingen over de inhoud van de training. Eerst worden de vijf benaderingen uitgelegd en daarna wordt aangeduid wanneer welke soort geschikt is. •
Een eerste soort training, rater error training (RET), focust op het vermijden van scoringseffecten (vb. halo, leniency,…)
bij de assessoren. Hoewel deze vorm vaak aangewend wordt, blijkt hij ontoereikend: er wordt geen hogere nauwkeurigheid mee bekomen. Hauenstein doet zelfs een oproep om het gebruik van RET stop te zetten (HAUENSTEIN, 1998, blz. 422). •
De tweede vorm, behavior observation training (BOT), wil via het verbeteren van de observatiestrategieën van de
beoordelaars, fouten vermijden. In plaats van het verwerkingsproces te verbeteren, spitst deze opleiding zich toe op het detecteren, percipiëren en herinneren van gedrag. Er bestaan twee strategieën: de nauwkeurigheid van de herinneringen verhogen of de assessoren leren om geheugensteuntjes zoals nota’s op te bouwen (HAUENSTEIN, 1998, blz. 419). •
In performance dimension training krijgen assessoren meer voeling met de dimensies, zoals hiervoor reeds werd vermeld.
•
Het vierde alternatief is ‘frame-of-reference’-training. Naast de verduidelijking van de dimensies worden de assessoren
voorzien van gemeenschappelijke evaluatiestandaarden. Kwalitatieve en kwantitatieve feedback naar de toekomstige assessoren zorgt voor de aansluiting van de eigen evaluatie met de standaarden van de onderneming. Deze standaarden dienen als referentie bij het beoordelen. Deze training slaagt er als beste van de vier in de nauwkeurigheid te verhogen. Bovendien leidt de vorm tot een hogere dimensionele nauwkeurigheid door het creëren van consistente schema’s bij het indelen in categorieën. Aangezien deze twee maatstaven van nauwkeurigheid nauw aansluiten bij constructvaliditeit, is dat positief nieuws (LIEVENS, 1998a, blz. 143). •
Hauenstein voegt er nog een vijfde trainingsvorm aan toe: de rater variability training (RVT). Deze opleiding heeft
als doelstelling het onderscheid tussen de assessees te verhogen door het geven van kwantitatieve feedback tijdens de opleiding (HAUENSTEIN, 1998, blz. 427). Eens men deze trainingsvormen kent, rest de vraag welke opleiding wanneer geschikt is. In dit kader onderscheidt Hauenstein twee bepalende factoren: de doelstelling van het center en de beoordelingstechniek. De doelstelling wordt gesplitst in gebruik voor de besturing en gebruik voor development. Voorbeelden van de bestuursdoelstelling zijn promotie-, verlonings- en ontslagbeslissingen. Hauenstein classificeert de beoordelingsmethoden in twee groepen: frequentiegebaseerde en subjectieve evaluaties. Takenchecklists en gedragsobservatieschalen behoren tot de eerste klasse, grafische schalen en gedragsgeankerde schalen tot de tweede. Voor elk van de vier combinaties ligt de meest aangewezen training vast (zie tabel 3). Wanneer verschillende doelstellingen of beoordelingsmethoden gebruikt worden, is de keuze minder duidelijk. Hauenstein wijst er echter op dat niet de inhoud van de training cruciaal is, maar wel de structuur ervan: activiteiten waarbij de assessoren zelf oordelen en feedback ontvangen op basis van de scores mag niet ontbreken (HAUENSTEIN, 1998, blz. 422-427 en 430-431).
______________________________________________________________________________________________ De Mesel Katrien
28
Training assessoren
Tabel 3 : Overzicht van trainingsprogramma’s (Bron: HAUENSTEIN, 1998, blz. 431) Doelstelling
Feedback
Aanbevolen gebruik
Beoordelingsfouten vermijden
Kwalitatief
Geen
Frame-of-Reference
Nauwkeurige scores voor elke
Kwantitatief en
Bij subjectieve schalen en
Training (FOR)
assessee voor elke dimensie
kwalitatief
developmentdoelstelling
Rater Variability Training
Nauwkeurig onderscheid tussen
Kwantitatief en
Bij subjectieve schalen en
(RVT)
de verschillende assessees
kwalitatief
bestuursdoelstelling
Behavioural Observation
Observatievaardigheden
Training (BOT)
verbeteren
Rater Error Training (RET)
Kwalitatief
Bij frequentiegebaseerde schalen of bij developmentdoelstelling
In de praktijk zien we dat een trainingsprogramma meestal een combinatie is van de vier vormen. De nadruk komt daarbij vaak te liggen bij het observatiegerichte deel. Gezien de meerwaarde van ‘frame-of-reference’-training moet zeker overwogen worden de klemtoon te verschuiven naar deze benadering (LIEVENS, 1998a, blz. 143-144). Een andere indeling van opleidingen spitst zich toe op de observatiefase en onderscheidt data-driven training, schemadriven training en control training. Data-driven training leert de assessoren om verschillende fasen (vb. observatie, classificatie en evaluatie) te doorlopen bij het beoordelen. Hierbij wordt pas naar de volgende fase overgeschakeld wanneer de vorige afgerond is. Schemagedreven training laat assessors het gedrag van kandidaten scannen in het kader van een performantietheorie. Relevante gedragingen worden dan toegewezen aan performantieklassen. Voor de drie types van opleiding werden de interrater reliability, dimension differentiation and differential accuracy (interraterbetrouwbaarheid, het onderscheiden van de dimensies en de nauwkeurigheid) vergeleken. Deze twee eerste trainingsvormen scoren beter op de vermelde maatstaven dan controleopleiding. Schemagedreven vorming kwam als beste van de drie uit de bus. E. ASSESSMENT CENTERSIMULATIE Het opstellen van ‘ware’ scores Bij de training geven de toekomstige assessoren scores aan de kandidaten in de simulatie. Deze scores moeten beoordeeld worden. Dit gebeurt door ze te vergelijken met ‘ware’ scores. Dit zijn de scores die door ervaren assessors aan de deelnemers van het AC toegekend werden in een optimale evaluatieomgeving. Dit verloopt als volgt: eerst vindt een discussie plaats tussen de ervaren beoordelaars in verband met de inhoud van de dimensies zodat een duidelijk beeld ontstaat over effectief gedrag. Vervolgens bekijken de experts (indien nodig meermaals) de video van het AC. Elke assessor kent aan elke kandidaat een score toe en dan wordt via discussie tot een consensus (de ware score) gekomen (LIEVENS, 1998b, blz. 213-214).
______________________________________________________________________________________________ De Mesel Katrien
29
Training assessoren
Voordelen van de simulatiemethode Door het simuleren van AC’s verwerft de assessore een beter inzicht in de ACM en de componenten ervan. De simulatie biedt de kans ervaring op te doen in een aantal assessorenvaardigheden. Afgestemde feedback speelt hierin een grote rol. Het feit dat de beoordelaars de acties echt uitvoeren en niet louter de theoretische basis voorgeschoteld krijgen, levert een grote meerwaarde. Er kan ook van anderen geleerd worden. Een laatste voordeel is het niet-bedreigende karakter. Er worden immers onbekenden beoordeeld en niet de medeassessoren, zoals in andere opleidingsvormen wel voorkomt (LIEVENS, 1998b, blz. 215). Nadelen Lievens haalt volgende probleempunten van de simulatie (LIEVENS, 1998b, blz. 213-214): •
Men kan als minpunt aanvoeren dat de kandidaten op videoband en niet ‘live’ beoordeeld worden. Deze werkwijze
komt echter in de praktijk ook voor en onderzoek wees uit dat er geen significante verschillen in de resultaten te vinden zijn. •
De simulatie is vaak een vereenvoudiging van de werkelijkheid op vlak van aantal kandidaten en lengte van de
oefeningen. De aanpassing ervan zou echter de praktische haalbaarheid van de simulatie in het gedrang brengen. •
Door de simulatie worden assessorenvaardigheden ingeoefend of bijgespijkerd. Het voorbereiden op een specifiek
AC is niet altijd mogelijk. •
Er zijn geen harde bewijzen van de meerwaarde van dit soort opleiding. Hier is dus nog onderzoek nodig.
Inhoud van de opleiding De opleiding start met een algemene inleiding. De deelnemers krijgen een uiteenzetting over wat de ACM inhoudt: definitie, basiscomponenten, toepassingen, fasen in de beoordeling, voor- en nadelen, ... Voor ze een kandidaat kunnen evalueren moeten de beoordelaars ook een beeld hebben van de organisatie en de functie die moet vervuld worden. Ze zullen dan ook informatie krijgen over de vacature, de taken en vereisten die er mee samenhangen, de werkomgeving en tenslotte over de onderneming zelf (sector, cultuur, concurrenten, …). Daarna leren de assessors het specifieke AC kennen. De gekozen dimensies, oefeningen en beoordelingsschalen worden verduidelijkt. Eens dat allemaal achter de rug is, kunnen de assessoren aan de slag: ze observeren en beoordelen de beelden van de kandidaten. Via discussie en argumentatie wordt tot een consensus gekomen. De feedback die volgt bestaat uit twee delen: analyse van de beoordelingprocessen en van de resultaten. Enerzijds worden de beoordelingsprocessen geanalyseerd en bekritiseerd. Observatietechnieken, de registratie, de einddiscussie,… worden van commentaar voorzien per assessor. Er wordt ook ingegaan op een aantal aspecten die de resultaten kunnen vertekenen, zoals het probleem bij te vaag gedefinieerde dimensies, tendensen bij het beoordelen, … Anderzijds worden ook de resultaten onder de loep genomen. De scores van de kandidaten worden dan vergeleken met de ware scores die experts hadden toegekend. Per assessor kan een nauwkeurigheidsindex berekend worden, zodat men een beeld krijgt van de correctheid van diens oordeel. Voor elke assessor kan ook nagegaan worden of hij/zij de juiste gedragingen geobserveerd heeft, of er geen belangrijke elementen over het hoofd gezien zijn (LIEVENS, 1998b, blz. 214-215).
______________________________________________________________________________________________ De Mesel Katrien
30
Training assessoren
10. Beoordelingsproces
Voor de beoordeling zijn bekwame assessoren onontbeerlijk. Nu in het vorige hoofdstuk de training van assessoren behandeld is, kan men starten met het beoordelingsproces. Eerst worden de observatiemethoden beschreven, in het tweede deel zijn de scoringstechnieken aan de beurt en vervolgens wordt stil gestaan bij het vormen van de eindbeoordeling. Tot slot worden een aantal suggesties voor verder onderzoek gegeven. A. OBSERVATIEMETHODEN Informatie selecteren, ordenen, opslaan en terug oproepen zijn processen die een zware last leggen op assessoren. Wanneer men veronderstelt dat mensen een beperkte verwerkingscapaciteit hebben, is de kans op foute waarnemingen of interpretaties reëel. Uit deze bezorgdheid zijn verschillende methoden ontworpen die de beoordelaars moeten helpen in hun taak. Hennessy, Mabey en Warr (HENNESSY et al., 1998, blz. 222-231) beschrijven drie technieken en onderzochten welke als beste naar voren schuift. METHODEN •
De traditionele methode komt als eerste aan bod. De techniek schrijft voor dat de verschillende fasen in het
beoordelen (observeren en vastleggen, classificeren en evalueren) gescheiden moeten worden om maximale objectiviteit te bekomen. De beoordelaars zullen tijdens het observeren hun bevindingen neerschrijven en pas daarna zal het gedrag aan klassen toegewezen worden. Tot slot zullen de scores voor elke dimensie bepaald worden. Het neerschrijven van de waarnemingen tijdens de observatie draagt twee voordelen met zich mee: er wordt informatie vastgelegd die zonder het neerschrijven verloren zou zijn gegaan en een neergeschreven gedraging kan aan meerdere dimensies toewijsbaar zijn. Er zijn echter ook nadelen verbonden aan de traditionele methode. Zo zal tijdens het neerschrijven de assessor minder aandacht schenken aan het observeren van het gedrag. De kans bestaat dus dat bepaalde handelingen niet opgemerkt worden. Een tweede minpunt is het ontbreken van begeleiding op vlak van de interpretatie van de dimensies. Dit zal een hogere interbeoordelaarsvariabiliteit tot gevolg hebben omdat elke assessor de voorbeeldgedragingen bij de dimensies anders kan interpreteren (HENNESSY et al., 1998, blz. 223). •
De ‘behavioural checklist’-methode wil ondersteuning bieden aan de beoordelaar via het ter beschikking stellen
van checklists met gedrag. De eerste fase in de beoordeling blijft dezelfde: er wordt neergeschreven wat geobserveerd is. In de tweede stap komt de checklist op het toneel: de assessor zal voor de gedragingen in een lijst moeten aanduiden of, en hoeveel keer de assessee het vermelde gedrag vertoonde. De behavioural checklist heeft meerdere voordelen. De assessee wordt verlost van de opgave om de geobserveerde handelingen aan dimensies toe te wijzen. De checklist neemt deze taak over en vermindert zo de cognitieve belasting. Bovendien krijgen de assessoren een beter inzicht in de voorbeeldgedragingen bij elke dimensie (HENNESSY et al., 1998, blz. 223-224). De assessors zullen hun aandacht focussen op relevant gedrag. De checklists kunnen eveneens als geheugensteun dienen. Ze maken het herinneren van het geobserveerde gedrag eenvoudiger en kunnen zo de specificiteit van de feedback verhogen (LIEVENS en GOEMAERE, 1999, blz. 218; LIEVENS en KLIMOSKI, 2001,
______________________________________________________________________________________________ De Mesel Katrien
31
Beoordelingsproces
blz. 253 en DONAHUE et al., 1997, blz. 87-88). Tot slot wordt de training van de assessoren gestroomlijnd (DONAHUE et al., 1997, blz. 87-88). Een nadeel dat blijft bestaan bij deze werkwijze is de duur die met het uitschrijven van de gedragingen gepaard gaat (HENNESSY et al., 1998, blz. 223-224). Een tweede minpunt ontstaat doordat de dimensies per oefening gedefinieerd worden. Doordat zeer specifiek gedrag wordt gemeten, vermindert de consistentie van dimensiescores over de opdrachten (LIEVENS en KLIMOSKI, 2001, blz. 257). Het opstellen van de lijst neemt meer tijd in beslag en ook het beoordelingsproces zelf wordt tijds- en arbeidintensiever wanneer veel items op de lijst staan. Tot slot kan de checklist een negatieve impact hebben op de beoordelaars wanneer zij vinden dat hun unieke expertise niet optimaal benut wordt (DONAHUE et al., 1997, blz. 87-88). •
De derde techniek, behavioural coding, wil het tijdrovende neerschrijven van gedragingen omzeilen en stelt
daarom een andere werkwijze voor: de assessoren worden gevraagd tijdens de observatie aan te duiden hoeveel maal een bepaald type gedrag gesteld wordt. Er wordt dus niet gewacht met het aanduiden van het gedrag tot na de observatie. In tegenstelling tot de behavioural checklists helpt behavioural coding de assessor dus reeds tijdens het observeren en niet enkel met de verwerking van de gegevens achteraf. Vijf voordelen van behavioural coding zijn het vermelden waard (HENNESSY et al., 1998, blz. 224). Deze aanpak leidt tot meer standaardisatie in de verwerking van de gegevens door de verschillende assessoren. De beoordelaars worden ook minder onderbroken bij het waarnemen aangezien ze het neerschrijven van gedrag achterwege kunnen laten. Hun observaties zullen bijgevolg vollediger zijn. Een derde voordeel is dat de assessoren zich meer zullen focussen op de te observeren dimensies. Dit kan samen gaan met een kleinere hoeveelheid informatie die ze moeten observeren, opslaan en verwerken. Daardoor kan ook het herinneren en de interpretatie vlotter verlopen. Als vierde punt, gaan de beoordelaars letten op dimensies die door de ontwerpers als belangrijk aangeduid zijn en niet deze criteria die zijzelf relevant achten. Ten vijfde zou het linken van het gedrag aan duidelijke categorieën ertoe leiden dat de informatie opgenomen wordt in het langetermijngeheugen van de assessor. Sociaal cognitief onderzoek bevestigt dat gestructureerd materiaal beter verwerkt en herinnerd wordt dan niet-geïntegreerde informatie (HENNESSY et al., 1998, blz. 228). Als kritiek op de methode wordt gesteld dat, wanneer assessors zich focussen op de verschafte toelichtingen, relevante aspecten die niet in de lijst opgenomen zijn niet beoordeeld zullen worden. Uiteraard zal de omvang van dit minpunt afhangen van het aantal en de geschiktheid van de voorbeelden die men geeft en van de instructies die de beoordelaars ontvangen (HENNESSY et al., 1998, blz. 224). ONDERZOEK Hennessy, Mabey en Warr (HENNESSY et al., 1998, blz. 224-230) onderzochten voor de verschillende methoden volgende variabelen: beoordelingsnauwkeurigheid, interbeoordelaarsvariabiliteit, nauwkeurigheid van het geschreven bewijs, de correlatie tussen de dimensiescores, de mening van de assessor over de procedure en de bereidheid van de beoordelaars om de methode aan te raden. De resultaten voor elk van de items worden hieronder diepgaander besproken. •
Op vlak van de beoordelingsnauwkeurigheid bestond de verwachting dat behavioural coding lager zou scoren
dan de traditionele methode en de behavioural checklist. Deze twee scheiden immers het waarnemen en het classificeren van het gedrag en daardoor zou de cognitieve belasting van de assessor lager liggen. De voordelen van behavioural coding (zie hierboven) blijken echter voldoende tegengewicht te bieden want er werden geen verschillen gevonden. De ______________________________________________________________________________________________ De Mesel Katrien
32
Beoordelingsproces
assessors moeten niet individueel de dimensies interpreteren maar krijgen definities en per criteria een lijstje met positieve en negatieve handelingen. De directe toewijzing aan duidelijk omschreven dimensies heeft tot gevolg dat de gestructureerde informatie beter verwerkt en onthouden wordt. De beoordelaar moet ook op minder dingen letten en zal beter herkennen welk gedrag relevant is. Tijdens de observatie hebben de assessors bovendien meer tijd vrij om effectief te kijken, terwijl bij de andere procedures vaak neergekeken wordt bij het noteren van het geobserveerde (HENNESSY et al., 1998, blz. 224-229). •
Op vlak van nauwkeurigheid bestaan er dus geen verschillen. Checklists dragen daarentegen wel bij tot meer
systematiek in de oordelen van verschillende assessors. De afwijkingen tussen de beoordelingen van verschillende assessoren liggen significant lager dan bij de traditionele werkwijze. Deze bevinding strookt met de verwachting. Terwijl in de traditionele methode de assessoren evalueren op basis van hun persoonlijke evaluatieschema’s, zal via de checklist een gemeenschappelijk beoordelingskader worden verschaft. Behavioural checklist en -coding komen tot dezelfde interbeoordelaarsvariabiliteit (HENNESSY et al., 1998, blz. 225-229). •
Als derde punt ging men de nauwkeurigheid van het geschreven bewijs na omdat deze notities controle toelaten
van de scores en bovendien de basis vormen van een gedetailleerde feedback naar de kandidaat toe. Ook hier werden geen verschillen vastgesteld bij de drie methoden. Nochtans had men deze wel verwacht: de traditionele en de checklistmethode zouden met hun uitgeschreven observaties (de zogenaamde long-hand notes) meer informatie leveren dan behavioural coding waar uitgebreide notities ontbreken. De praktijk ondersteunt deze hypothese dus niet. Een mogelijke verklaring is dat de ongestructureerdheid van de nota’s in de eerste twee methoden het moeilijk maakt een gedragsvoorbeeld voor een bepaalde dimensie te geven. Behavioural coding rekent erop dat de assessor op basis van kort aantekeningen zich het vertoonde gedrag in verband met een dimensie terug voor ogen kan brengen. Zoals reeds vermeld zal de gestructureerde verwerking tot een snellere herinnering leiden en kan dit het tekort aan schriftelijke nota’s compenseren. Wat ook de oorzaak mag zijn, behavioural coding kan niet verworpen worden op basis van de lagere kwaliteit van de schriftelijke onderbouwing (HENNESSY et al., 1998, blz. 225-229). •
Een vierde onderzocht item is de correlatie tussen dimensies in eenzelfde oefening (discriminantvaliditeit).
Verwacht werd dat bij een checklist de correlatie lager zou liggen omdat de dimensies meer verduidelijkt worden en de werklast verkleint, maar er werd geen ondersteuning gevonden voor deze stelling: tussen de drie methoden is geen verschil merkbaar. Drie verklaringen worden naar voor geschoven: de checklistitems zijn niet uitgesproken genoeg om het begrip van de competenties door de assessors te verhogen, het halo-effect vertekent de beoordelingen ongeacht de gebruikte methode of de werkelijke verschillen in de performantie van de deelnemers wordt weerspiegeld (HENNESSY et al., 1998, blz. 225-229). •
De houdingen van de assessoren ten opzichte van de technieken verschilden niet. Hoewel verwacht werd dat er
afkerig zou worden gereageerd op de minder conventionele behavioural coding-methode, bleek dit niet het geval. Ook de verwachting in verband met de checklist bleek ongegrond: Hennessy en collega’s voorspelden een voorkeur voor deze werkwijze. (HENNESSY et al., 1998, blz. 225-229). •
Geheel onverwacht bleken de assessoren de ‘behavioural coding’-methode even vaak te willen aanraden in hun
eigen onderneming dan de traditionele methode. De checklist scoort opvallend lager en ook dat kwam als een donderslag bij heldere hemel. Naar de reden kan men enkel gissen, maar men vermoedt dat het te maken heeft met de perceptie als te gedetailleerd en tijdrovend. Kort samengevat kan men stellen dat er enkel significante verschillen gevonden zijn in de interbeoordelaarsvariabiliteit en in het percentage aanbevelingen.. De traditionele methode scoort minder goed dan behavioural checklist en -coding ______________________________________________________________________________________________ De Mesel Katrien
33
Beoordelingsproces
wat betreft de variabiliteit van de beoordelingen tussen de assessoren en de checklistprocedure blijkt minder populair dan verwacht. Bij de overige variabelen vond men geen betekenisvolle afwijkingen Aangezien deze studie de minderwaardigheid van een bepaalde methode niet kon aantonen, kunnen ontwerpers zich dus vrij voelen elk van deze procedures aan te wenden in hun centers (HENNESSY et al., 1998, blz. 230). B. SCORINGSPROCESSEN Er bestaan drie conceptuele modellen in verband met het beoordelen van kandidaten: het rationele model, het ‘beperkte capaciteit’-model en het expertmodel. •
Het rationele model (rational model) staat ook bekend als het ‘data-driven’, ‘behavior-driven’ of ‘bottom-up’ model
(LIEVENS en KLIMOSKI, 2001, blz. 260). Dit model gelooft dat mensen in staat zijn gedetailleerd gedrag te onderscheiden, dit toe te wijzen aan categorieën, en objectieve en nauwkeurige oordelen te vormen. Van Beirendonck (VAN BEIRENDONCK, 1998, blz. 62-68) beschrijft het beoordelingsproces aan de hand van vijf O’s: observeren, opschrijven, omzetten, oordelen en overleggen. -Observeren: In deze fase wordt het feitelijke gedrag waargenomen. Met gedrag wordt dat bedoeld wat iemand daadwerkelijk zegt en/of doet. -Opschrijven: Het geobserveerde gedrag wordt zo nauwkeurig mogelijk geregistreerd zodat een getrouw beeld ontstaat van het gedrag van de kandidaat. Het gaat dus niet om interpretaties, opinies,… maar om neutrale beschrijvingen van het gedrag. Door het neerschrijven zal niet enkel op herinneringen gesteund worden bij de beoordeling. Het vermijdt eveneens het oordelen op basis van een algemeen beeld en op een selectieve of subjectieve manier (NIJSSEN, 2000, blz. 59). Deze twee fasen zijn van cruciaal belang aangezien zij niet kunnen herhaald worden. De stappen kunnen op video vastgelegd worden, maar het herbekijken ervan komt in de praktijk weinig voor. De volgende fasen kunnen aan de hand van de gegevens uit de eerste fasen wel opnieuw uitgevoerd worden. -Omzetten: De observaties worden gesorteerd en toegewezen aan de bijhorende competentie(s). Dit vereist een grondig inzicht in deze dimensies. -Oordelen: Voor elke opdracht worden per criterium de observaties bestudeerd en wordt de aanwezigheid van de competentie beoordeeld. Deze aanwezigheid wordt dan vergeleken met de gewenste aanwezigheid van de dimensie en uitgedrukt in een score. -Overleggen: De competentiescores van de verschillende assessoren worden bekendgemaakt en er wordt een eindscore vastgelegd. De manieren waarop men tot deze eindbeoordeling kan komen, worden besproken in het derde deel van dit hoofdstuk. •
De beperkte informatieverwerkingscapaciteit van assessoren staat centraat in het ‘limited capacity’-model. Door
deze beperking zullen beoordelaars niet in staat zijn aan de cognitieve eisen die een AC stelt, te voldoen. Ze krijgen immers aan een hoog tempo informatie over zich heen en de verwerking van deze gegevens tot competentiescores is ook niet van de poes. Eerst moet het gedrag vertaald worden naar de dimensies. Om de dimensiescore te bekomen moet dan het belang van elk gedrag gewogen worden (LIEVENS en KLIMOSKI, 2001, blz. 261). Vele studies gingen op zoek naar manieren om de belasting voor de assessor te beperken: via het reduceren van het aantal dimensies, het gebruik van behavioral checklists, videosimulaties en meer assessoren per assessee.
______________________________________________________________________________________________ De Mesel Katrien
34
Beoordelingsproces
•
Het expertmodel houdt in dat professionele assessoren over cognitieve structuren (well-established cognitive
structures, prior-knowledge frameworks) beschikken die ze gebruiken bij het beoordelen van kandidaten. Deze structuren ontstaan door ervaring en training en zullen om die reden niet bij beginnende assessoren aanwezig zijn. Bevestiging voor dit model vindt men bijvoorbeeld in het feit dat psychologen beter beoordelaars zijn dan assessoren uit het management. Het feit dat ‘frame-of-reference’-training het onderscheiden van dimensies verhoogt, duidt in dezelfde richting. Deze training voorziet de assessors immers van een mentaal kader bij het toewijzen van gedrag naar competenties (LIEVENS en KLIMOSKI, 2001, blz. 261-162). C. HET VORMEN VAN EEN EINDOORDEEL In de eindfase van het beoordelingsproces leggen de assessoren de door hen toegekende scores samen. Deze scores moeten samengebracht worden tot één eindscore per kandidaat. Er bestaan twee methoden om dat te doen: de discussie of de beslissingsregel (VAN BEIRENDONCK, 1998, blz. 74-75). •
Bij de discussie wisselen de assessoren ervaringen uit en wordt op basis hiervan via consensus een eindoordeel
vastgelegd. Ondanks het soms tijdrovende karakter van deze praktijk mag men niet het aantal lage scores afwegen tegenover het aantal assessoren dat een hogere score toekende. Het kiezen van de meerderheid boven de minderheid kan tot verlies van belangrijke informatie leiden en zo een foute beoordeling veroorzaken. Bij sterk afwijkende scores van de verschillende assessoren moet opgespoord worden wat de reden hiervan is. Via de gedragsobservaties moeten de assessoren hun lage of hoge score verantwoorden (VAN BEIRENDONCK, 1998, blz. 65-66). Tijdens de discussie moet aandacht geschonken worden aan groepsdynamieken. Elke assessor moet de kans krijgen zijn observaties te bespreken en te verdedigen. Een dominante assessor zal niet steeds een positieve invloed hebben op de kwaliteit van de beoordeling (VAN BEIRENDONCK, 1998, blz. 65-66). Tijdens de discussie krijgen de assessoren informatie over de kandidaat en meer bepaald over zijn gedrag tijdens de oefeningen waarin de assessor de kandidaat niet hoefde te observeren. Op die manier krijgt elke assessor een totaalbeeld van de kandidaat en kan elk van hen een algemene score toekennen (VAN BEIRENDONCK, 1998, blz. 65-66). Hoewel wordt aangenomen dat de discussie een meerwaarde bezit tegenover de beslissingsregel, bevestigt onderzoek niet steeds dit standpunt: Pynes en Bernardin vonden bijvoorbeeld geen verschillen in voorspellende kracht tussen mechanische en op discussie gebaseerde integratieprocedures. Later onderzoek, door onder andere Lebreton, pleitte dan weer wel in het voordeel van de discussiemethode (LIEVENS en KLIMOSKI, 2001, blz. 259). Voor de discussie werd nagegaan welke informatie assessoren integreren. Dit bleek voornamelijk informatie uit eerste hand (vb. door observaties) en in mindere mate biodata of psychometrische tests te zijn (LIEVENS en KLIMOSKI, 2001, blz. 259). Wat de beïnvloedende factoren van het discussieresultaat betreft, is er nog veel ruimte voor toekomstig onderzoek. Welke invloed hebben bijvoorbeeld persoonlijke kenmerken van de assessoren, groepskenmerken en groepsdynamieken op de eindscore (LIEVENS en KLIMOSKI, 2001, blz. 259)? Van Beirendonck kan vanuit zijn praktijkervaring bij Quintessence een aantal aanbevelingen voor de assessorenmeeting formuleren (VAN BEIRENDONCK, 1998, blz. 67-68). -
Begin met een algemene bespreking van het gedrag van de kandidaat in een bepaalde simulatie. Bespreek daarna
de competenties zoals die blijken uit die simulatie. Doe dit oefening per oefening om te komen tot scores per competentie en per opdracht. Vervolgens worden deze scores geaggregeerd tot één score per competentie, over de
______________________________________________________________________________________________ De Mesel Katrien
35
Beoordelingsproces
simulaties heen. De eindfase bestaat eruit een eindadvies te vormen over elke kandidaat. Ook dit moet via consensus bereikt worden. -
Breng een mentaliteit tot stand die niet spreekt over ‘foute’ en ‘juiste’ scores. Er moet gestreefd worden naar
een open en doelgericht gesprek. -
Bij afwijkende of onduidelijke scores moet naar de grondslag ervan gepeild worden: welke gedragsvoorbeelden
ondersteunen de evaluatie. -
Informatie van buitenaf moet geweerd worden. Enkel gegevens van binnen het AC mogen in beschouwing
genomen worden. •
Een eenvoudige beslissingsregel kan met 95% accuraatheid de uiteindelijke oordelen voorspellen. Men zou dus
kunnen concluderen dat het voeren van een discussie puur tijdverlies is. Van Beirendonck wijst echter op het feit dat de discussie een belangrijk onderdeel uitmaakt van de dynamiek van de ACM. De discussie zorgt dat foute indrukken opgehelderd worden en draagt bij tot een betere omlijning van de gewenste competenties. In de praktijk vindt men soms ook een averechts effect terug, bijvoorbeeld wanneer sterke personen hun (foute) mening doordrukken. D. SUGGESTIES VOOR TOEKOMSTIG ONDERZOEK In het kader van het verbeteren van de kwaliteit van AC-scores, kan de kennis over sociale perceptie en sociale kennisverwerving helpen bij het achterhalen van bepalende factoren. Lievens en Klimoski argumenteren dan ook dat het noodzakelijk is de informatie uit deze gebieden te integreren bij het onderzoek en ontwerp van AC’s. Zij geven een aantal concepten die zich hiertoe lenen (LIEVENS en KLIMOSKI, 2001, blz. 271-177). •
Social judgement accuracy: Mensen vertonen de neiging anderen te observeren en in te schatten. We blijken er zelfs
redelijk goed in te zijn. De vraag stelt zich dan ook waarom de beoordelingen in een AC niet van een hogere kwaliteit zijn. Misschien zoeken we naar andere kwaliteiten. Misschien botsen de dimensies met onze natuurlijke neigingen. Onderzoek naar selectie en gebruik van competenties die de tendensen bij personen niet verstoren, kan de moeite waard zijn (LIEVENS en KLIMOSKI, 2001, blz. 272). •
Rol van verwachtingen: De verwachtingen die we hebben over iemand, zal onze perceptie en kennisverwerking over die
persoon sterk beïnvloeden. Informatie die aansluit bij onze verwachtingen wordt anders verwerkt dan gegevens die ervan afwijken. Specifiek voor een AC weten we dat de informatie die een assessor heeft over de kandidaat vóór de beoordeling een invloed heeft, maar het is niet volledig duidelijk welke en waarom deze bestaat (LIEVENS en KLIMOSKI, 2001, blz. 272). •
Rol van cognitieve structuren: Cognitieve structuren zijn aanwezig in de aandacht, de waarneming van de persoon, de
verwerking van informatie, het geheugen en het scoringsproces. Deze structuren kunnen een belangrijke schakel zijn die de kwaliteit van de scores beïnvloeden, zodat verder onderzoek aan te raden is. Lievens en Klimoski vermelden drie soorten cognitieve structuren: trait structures, stereotypes en prototypes en structures for meaning-making (LIEVENS en KLIMOSKI, 2001, blz. 273). •
Gecontroleerde versus automatische processen: De verwerking van informatie kan op verschillende niveaus van bewustzijn
gebeuren. Soms ontleden we elke stimulus en schenken we er veel aandacht aan. Andere momenten lijken we niets te horen, te zien of te voelen. Ook bij relaties met personen en bij het verwerken van sociale informatie is dat zo. De mate waarin we aandacht schenken aan stimuli is uit te zetten op een continuüm. De situatie waarbij we niet bewust zijn van stimuli en de verwerking ervan, heet ‘pre-conscious automaticity’. Aan het andere uiteinde vinden we het ‘fully intentional thinking’. Hierbij kunnen we opzettelijk bepaalde cognitieve strategieën toepassen, wat niet zo is bij ______________________________________________________________________________________________ De Mesel Katrien
36
Beoordelingsproces
automatische verwerking. Onbewuste verwerking ontstaat bij routine, maar kan tegengegaan worden door het inschakelen van checklists. Checklists verhogen het bewustzijn bij de observatie en het toekennen van scores (LIEVENS en KLIMOSKI, 2001, blz. 274-275). •
Gemotiveerde cognitie: Niet enkel de omvang van de motivatie is van belang, ook de doelstelling erachter telt.
•
Sociale interactie als basis voor gevolgtrekking: Bij een beperkt aantal observaties van sociale interactie, is het zeer moeilijk
beoordelingen op te stellen. Er bestaan wel modellen die dit kunnen vergemakkelijken (LIEVENS en KLIMOSKI, 2001, blz. 276). •
Sociale interactie als verantwoordelijkheid: De beoordelaars verantwoordelijk stellen, zorgt voor een verhoogde en juistere
motivatie. Ook andere factoren zullen een invloed uitoefenen. Verder onderzoek kan de impact nagaan van de ontwerpmethode van een center, het beleid, de dynamieken bij de integratiesessie, de structuur van het assessorenteam, de verschillende vormen van feedback,… (LIEVENS en KLIMOSKI, 2001, blz. 276).
______________________________________________________________________________________________ De Mesel Katrien
37
Beoordelingsproces
11. Ontwikkeling van een assessment center
In de vorige hoofdstukken zijn diverse aspecten over de ACM toegelicht: wat de techniek inhoud, de oefeningen, de deelnemers, de assessorentraining,… Nu men deze kennis heeft, kan men kijken hoe assessment centers opgesteld worden. Dit hoofdstuk is onderverdeeld in twee stukken. In het eerste deel worden eerst een aantal factoren opgesomd die aandacht vergen bij de ontwikkeling van een center. Vervolgens wordt ingegaan op de fasen van het ontwikkelingsproces overlopen. In het tweede deel wordt een model besproken dat hulp biedt bij het maken van oefeningen. A. ONTWIKKELING VAN EEN CENTER TE BESCHOUWEN FACTOREN In principe moet voor elke functie een ander en op maat gemaakt assessment center-programma ontwikkeld worden. Van Beirendonck merkt op dat de bedrijfeconomische realiteit dat onmogelijk maakt. Functiespecifieke AC’s zullen wel nog ontwikkeld worden voor functies die ruim vertegenwoordigd zijn binnen de organisatie en waarvoor frequent en veelvuldig kandidaten moeten te worden gescreend. Er wordt echter meer en meer gewerkt met typesimulaties voor een ‘level’ of functieniveau, die toch toelaten een functiespecifiek competentieprofiel te meten (VAN BEIRENDONCK, 1998, blz. 32-34). Bij de ontwikkeling van een center moeten een aantal factoren in rekening genomen worden. De cultuur van de onderneming zal het succes bepalen in die zin dat een zelfregulerende en lerende organisatie nodig is (BERGENHENEGOUWEN. et al., 1999, blz. 176). De cultuur heeft echter ook een tweede invloed. Assessoren houden immers de waarden en normen van de onderneming in hun achterhoofd bij het evalueren van kandidaten (LIEVENS en KLIMOSKI, 2001, blz 259). Ook de ideeën die heersen in verband met assessment en competentieontwikkeling, percepties over de eigen bekwaamheid en de relatie tussen belonen en beoordeling zijn belangrijk (BERGENHENEGOUWEN et al., 1999, blz. 176). Nu steeds meer organisaties op internationaal niveau opereren, moet hiermee rekening gehouden worden bij de selectie en ontwikkeling van de medewerkers. De vraag rijst dan in hoeverre wijzigingen moeten worden aangebracht in de ontwikkeling, implementatie, beoordeling en feedbackverschaffing van een AC. Men zal in elke fase moeten stilstaan en zich afvragen welke aanpassingen of bijkomende voorwaarden vereist zijn voor een multiculturele aanpak. Te beschouwen aspecten zijn: de ontwerpers van het center (vereiste culturele kennis, hun eigen cultuur,…) , de keuze van de oefeningen (telt individuele- of groepsperformantie?, andere managementstijlen,…), keuze en training van de assessoren, selectie van de assessees (kandidaten van verschillende culturen mengen?,…), evaluatiemethode van de assessees, gewenst gedrag bij de deelnemers, aandachtsniveau en interpretatie van de assessoren, multinationale problemen in het assessorenteam (taalproblemen, andere waarden,…) en feedback (BRISCOE, 1997, blz. 264-267). Voor men echt van start kan gaan met het ontwikkelen van een AC, moet men duidelijkheid scheppen over een aantal aspecten: de doelstelling van het center, de doelgroep, wie zal de ontwikkeling, implementatie en realisatie op zich nemen, zijn acties om het management te betrekken of te overtuigen nodig, het al dan niet informeren van de vakbond, de link met andere HR-systemen, antwoord op de vraag of deelname verplicht is, wie verzorgt de rapporten en de ______________________________________________________________________________________________ De Mesel Katrien
38
Ontwikkeling van een assessment center
feedback, algemene of specifieke feedback, wie krijgt toegang tot de resultaten, relevantieduur van de resultaten, wie treedt op als assessor, wie coördineert, de locatie van het AC, de frequentie, bedrijfsspecifieke work samples of uniforme simulaties,
hoe
gebeurt
de
ontwikkeling
van
zwakbeoordeelde
competenties,
wie
draagt
hierbij
de
verantwoordelijkheid,… (VAN BEIRENDONCK, 1998, blz. 43-44). Fletcher en Anderson waarschuwen voor ‘oppervlakkige assessment centers’ (Superficial Assessment Center, SAC). Deze SAC’s lijken op assessment centers, maar hebben niet de kwaliteiten van een degelijk ontworpen en beheerd center. Het gebruik van een SAC draagt sterke negatieve gevolgen met zich mee: een zwakke beoordeling, lage voorspellingskracht, verspild geld en negatieve reacties van de medewerkers. Een SAC kan op diverse wijzen ontstaan: men maakt er zich te snel vanaf bij het oprichten van een assessment center of men neemt over wat men bij andere organisatie ziet, zonder evenwel over de nodige kennis of tijd te beschikken. Er zijn natuurlijk acties die men kan ondernemen om te vermijden dat men met een SAC opgezadeld geraakt. Het kan al veel helpen om tijdens de ontwikkeling en uitvoering van het center de ogen open te houden en de dingen kritisch in de gaten te houden. Fletcher en Anderson wijzen erop dat wanneer de vraag of de middelen te beperkt zijn, overwogen moet worden competentiegebaseerde interviews en psychometrische tests te gebruiken. Deze instrumenten zijn goedkoper en zeker efficiënter dan SAC’s (FLETCHER en ANDERSON, 1998, blz. 44-45). FASEN Seegers en Esser (1982) verdelen het assessment center-design in vier grote fasen: inventarisatie, operationalisatie, uitvoering en eindevaluatie (GOEMAERE et al., 1997, blz. 152). Elke fase bestaat uit verschillende onderdelen. Inventarisatie •
Doelstelling van het AC: Het bepalen van de doelstelling is belangrijk aangezien assessoren kandidaten anders
evalueren in een AC dan in een DC. Ze zullen de informatie ook anders verwerken (LIEVENS en KLIMOSKI, 2001, blz. 259). •
Functies waarvoor het assessment center bedoeld is (doelgroep)
•
Functiebeschrijving en -analyse: Deze analyse kan gebeuren door documentenstudie, observatie, interviews en
enquête (BERGENHENEGOUWEN et al., 1999, blz. 161). Operationalisatie •
Selectie en training van assessoren
•
Selectie en instructie van kandidaten
•
Selectie en ontwikkeling van oefeningen
Bij selectie van simulaties staat men voor de keuze: kiezen voor een representatief staal van situaties of de competenties testen in een situatie verschillend van de werkcontext. Naar de eerste optie wordt verwezen met de term ‘sample’benadering, de andere wordt aangeduid als ‘sign’. Er wordt dus een afweging gemaakt tussen het testen in een functierelevante situatie en het meten van algemene gedragscompetenties in een aantal proeven (VAN BEIRENDONCK, 1998, blz. 50-51). Hoeft en Schuler stellen dat de simulatiegeoriënteerde taken, de zogenaamde samples, het mogelijk maken voorspellingen te doen over de huidige competenties, skills en kennis. Daartegenover staan de traitgeoriënteerde oefeningen, de signs. Deze oefeningen zullen toelaten het toekomstig potentieel in te schatten omdat ze gebaseerd zijn op meer homogene constructen
die
betrekking
hebben
op
één
dimensie.
Men
gaat
dus
na
in
hoeverre
fundamentele
______________________________________________________________________________________________ De Mesel Katrien
39
Ontwikkeling van een assessment center
persoonlijkheidskenmerken aanwezig zijn (HOEFT en SCHULER, 2001, blz. 121-122). Tabel 4 geeft een vergelijking van de twee benaderingen. Tabel 4 : Vergelijking tussen trait- en simulatiegeoriënteerde assessment benaderingen (Bron: HOEFT en SCHULER, 2001, blz. 122) Trait-georiënteerd
Simulatie-georiënteerd
Verwijzing naar de job
Laag (trait-georiënteerde items = signs)
Hoog (taak-georiënteerde items = sample)
Omvatte functievereisten Analyseprocedure
Homogene trait-aspecten Element-specifiek (onafhankelijke items)
Heterogene trait-onderdelen Holistisch (globale taak met diverse managementvereisten)
Feedback naar deelnemers
Laag
Gelijktijdige feedback resulterend uit de lopende procedure
Karakter van de handelswijze
Statisch
Dynamisch (afhankelijk van de activiteiten van de deelnemer)
Typische voorbeelden
Intelligentietest, persoonlijkheidstest
Groepsdiscussie, rollenspel, in-basket
In praktijk wordt meestal gekozen voor de ‘sample’-benadering. Bovendien kreeg de ‘sign’-tactiek kritiek toen bleek dat een competentie in één situatie verschilt van die competentie in een ander situatie (VAN BEIRENDONCK, 1998, blz. 50-51). Bray kreeg in een interview (MAYES, 1997, blz. 6) de vraag voorgeschoteld welke assessment center-oefeningen het beste geschikt waren bij de evaluatie van managementpotentieel. Uit de ‘Management Progress Study’ (zie hiervoor) kon men de vier belangrijkste dimensies voor deze toepassing onderscheiden: intellectueel vermogen, administratieve vaardigheden, interpersoonlijke vaardigheden en motivatie om hogerop te geraken. Voor elk van deze competenties kent men bovendien de meest geschikte oefening. In dezelfde volgorde: cognitieve tests, in-basket, business game of leiderloze groepsdiscussie en persoonlijk interview. De onderneming kan zelf oefeningen ontwerpen of beroep doen op bestaande opdrachten. In het tweede deel van dit hoofdstuk wordt hierop verder ingegaan. Uitvoering •
Samenstelling draaiboek, met name de planning van het center, de toekenning van assessoren aan kandidaten, etc.
•
Daadwerkelijke assessment center-bijeenkomst
Eindevaluatie •
Eindoordeel en rapportage: In deze fase wordt een eindoordeel gevormd. In het hoofstuk ‘beoordelingsproces’
wordt hierop dieper ingegaan. •
Feedback naar kandidaat en onderneming
Een assessment center leidt niet enkel tot betere beslissingen, maar levert veel meer informatie. Zelfs indien selectie de doelstelling is, zal informatie op vlak van opleiding bekomen worden. Het zou zonde zijn deze gegevens verloren te laten gaan. In het feedbackgesprek kunnen de resultaten van het center diepgaand worden toegelicht. Ook de te verbeteren competenties kunnen worden vermeld. Dit zorgt voor een realistischer zelfbeeld van de kandidaat, maar ook de assessoren en de onderneming ontvangen daarbij informatie. Uit het gesprek kan de reactie van de kandidaat, zijn ______________________________________________________________________________________________ De Mesel Katrien
40
Ontwikkeling van een assessment center
openheid naar feedback, zijn leerbaarheid en zijn leerbereidheid afgeleid worden (VAN BEIRENDONCK, 1998, blz. 68). De kwaliteit van de feedback zal in development centers bepalen hoe assessees reageren. Wanneer zij niet begrijpen of geen geloof hechten aan wat hen meegedeeld wordt, is de kans klein dat zij inspanningen zullen leveren om tekorten bij te spijkeren (LIEVENS en KLIMOSKI, 2001, blz. 267). De positieve reacties van de kandidaten ontstaan grotendeels door de face-validiteit en jobgebondenheid van de methode. Harris, Paese en Greising groeven dieper en gingen op zoek naar de variabelen die de reacties op de feedback drijven. De reacties werden gemeten aan de hand van drie criteria: fairness van de procedure, verdelende billijkheid/rechtvaardigheid (distributive fairness) en ervaren nut van de feedback (LIEVENS en KLIMOSKI, 2001, blz. 267). Als eerste bevinding kwam naar voren dat kenmerken van de oefeningen (gepercipieerde inhoudsvaliditeit en gepercipieerde feedbackvaliditeit) relaties vertonen met de fairness, de verdelende billijkheid en het ervaren nut van de feedback. Natuurlijk hadden ook de kenmerken van de feedback zelf (zoals interactiviteit, specificiteit en uitstraling van de beoordelaar) een invloed op de reactie van de kandidaten. De mate waarin de verwachtingen van de kandidaten voldaan waren, correleerde met de fairness en de billijkheid, maar niet met het gepercipieerde nut van de feedback. Het realiteitsgehalte van de opdrachten, de aard van de feedback (positief of negatief) en de ervaring die de beoordelaar uitstraalt dragen bij tot aanvaarding van de feedback. Karaktertrekken van de beoordeelde daarentegen niet (LIEVENS en KLIMOSKI, 2001, blz. 267-268). Andere onderzoekers gingen op zoek naar de feedbackvorm die kandidaten prefereren. Attribuutfeedback (feedback per dimensie) en oefeningfeedback (bespreking per oefening) werden tegenover elkaar afgewogen. De methoden kwamen even goed uit de test (LIEVENS en KLIMOSKI, 2001, blz. 268). Wanneer tot slot wordt bekeken welke feedback effectief tot acties aanmoedigt, stuiten we op gemengde conclusies. Terwijl de ene studie een effect van feedback vaststelt, onderscheidt de andere geen verschil in loopbaanvooruitgang tussen degenen die feedback kregen en degenen die het zonder moesten stellen. Mitchell en Maurer gingen op zoek naar de oorzaken van deze teleurstellende constataties. Zij onthulden dat personen met een lagere score daaropvolgend meer training volgden. Tijdsbeperkingen en sociale ondersteuning voor ontwikkeling bleken ook bepalend (LIEVENS en KLIMOSKI, 2001, blz. 268-269). •
Evaluatie van assessment center-programma’s
______________________________________________________________________________________________ De Mesel Katrien
41
Ontwikkeling van een assessment center
B. HET ONTWERPEN VAN OEFENINGEN Zoals reeds vermeld, zijn de mogelijkheden op vlak van oefeningen in een AC nagenoeg onbeperkt. Bij het selecteren van opdrachten staat de onderneming voor de keuze: bestaande oefeningen overnemen of zelf aangepaste opdrachten ontwerpen. De eerste strategie veroorzaakt minder kosten. De tweede optie zorgt voor een AC dat beter aansluit bij de specifieke functie, de organisatiecultuur,… In praktijk blijken vooral de kant-en-klare oefeningen erg in trek (AHMED et al., 1997, blz. 62). Doordat diverse dimensies toegepast worden in verschillende ondernemingen, stelt Byham dat er ook een aantal oefeningen bestaan die over de grenzen van bedrijven heen gebruikt kunnen worden, uiteraard binnen bepaalde perken. Unieke competenties vereisen gespecialiseerde opdrachten (MAYES, 1997, blz. 5). Ahmed et al. wensen ondernemingen te stimuleren om aangepaste oefeningen te ontwerpen en stelden een ‘model of best practice’ op dat de bedrijven hierbij moet begeleiden. Dit model is een gids en mag niet als een rigide proces beschouwd worden. FASE 1: Het afstemmen van dimensies en oefeningen Bij het kiezen van de opdrachten, moeten een aantal aspecten in het oog gehouden worden. Ahmed et al. gaf een overzicht van vijf aandachtspunten (AHMED et al., 1997, blz. 64). •
Het soort oefening moet bepaald worden in functie van de aard van de dimensie (interactief, conceptueel,…).
Mondelinge vaardigheden zullen bijvoorbeeld in een andere vorm getest worden dan het analytisch denkvermogen. •
Wat inhoud van de functie betreft, is het logisch dat wat men meet relevant moet zijn voor de betreffende functie. De
oefeningen moeten dan ook taken weerspiegelen die de werkelijke functiehouder moet uitvoeren. Byham formuleert een waarschuwing omtrent het realiteitsgehalte van de oefeningen. De opdrachten mogen geen perfecte kopie zijn van de werkelijke functie omdat de assessoren met moeilijkheden zullen kampen omwille van de technische details. De observatoren raken verstrikt in de technische aspecten van de reacties van de deelnemers en zijn niet meer in staat de gedragingen te evalueren. Bovendien kan de kandidaat het gevoel krijgen geen eerlijke kans te krijgen omdat het hem/haar aan specifieke kennis of ervaring ontbreekt (MAYES, 1997, blz. 5). •
De aanvaarding van de opdrachten bij de kandidaten is een belangrijk aspect. Om de acceptatie te verhogen, wordt
gezorgd dat de uit te voeren taken als toepasselijk voor de doelfunctie worden beschouwd. •
Er wordt aangeraden het aantal dimensies per oefening te beperken tot drie, met een absolute grens van vijf criteria per
opdracht. Een laag aantal laat de assessoren immers toe hun aandacht te focussen, wat de kans op een meer accurate meting verhoogt. •
De dimensies worden best meerdere malen gemeten. Door de dimensie in minstens twee oefeningen te testen, wordt
verhinderd dat een slechte prestatie in één oefening de score van een dimensie te veel zou beïnvloeden. Doordat er meer waarnemingen worden gedaan, kan men tot een onderbouwde score komen. FASE 2: Het genereren van de inhoud De meeste gangbare methode om de inhoud van het AC te bepalen, is het uitvoeren van een functieanalyse. Vaak is deze informatie niet beschikbaar en moet men zich anders uit de slag trekken. De ontwerpers zullen op zoek gaan naar individuen in de onderneming die de belangrijke taken, vereisten,… van de doelfunctie kunnen aanwijzen. Er moet hierbij gelet worden op twee dingen (AHMED et al., 1997, blz. 64): •
De persoon die informatie levert, moet representatief zijn zodat hij/zij een realistisch beeld verschaft. Meestal worden
meerdere personen aangesproken om volledigere en nauwkeurigere informatie te bekomen. ______________________________________________________________________________________________ De Mesel Katrien
42
Ontwikkeling van een assessment center
•
Men moet nagaan of de informant betrouwbaar is, vooral bij een AC voor interne kandidaten.
FASE 3: Het evalueren van voorstellen De ideeën die naar voor komen, worden gewikt en gewogen op basis van zeven criteria (AHMED et al., 1997, blz. 64): •
Ten eerste moet er een duidelijke relatie bestaan met de doelfunctie.
•
Wat betreft de vraag of een relatie moet bestaan met de functie of met de dimensie, blijken beiden belangrijk. Men wenst
gedrag te testen in verband met een dimensie, maar wel in een realistisch kader. •
Praktische belemmeringen zoals tijdsgebrek, kosten,… elimineren ook een aantal voorstellen.
•
In het dilemma tussen alledaagse en uitzonderlijke situaties heeft de eerste optie de bovenhand. De andere voorstellen
worden slechts mondjesmaat goedgekeurd. •
Er moet gekozen worden voor ideeën waarbij de taken op verschillende niveaus uitgevoerd kunnen worden. Deze niveaus
laten immers toe de performantieverschillen bij kandidaten te onderscheiden. •
Eerlijkheid is ook belangrijk, in die zin dat niemand mag bevooroordeeld zijn door zijn achtergrond, ervaring,…
•
Er wordt ook gewezen op de noodzaak aan neutraliteit op vlak van politiek.
FASE 4: Het schrijven van oefeningen Bij de eigenlijke uitwerking van opdrachten hebben een aantal elementen een impact (AHMED et al., 1997, blz. 64-65): •
Ontwerpers moeten vooropstellen welk gedrag gewenst is. Dit gedrag moet dan uitgelokt worden bij de kandidaten.
Een manier om dit te doen, is een doelstelling in verband met de dimensie op te nemen in de instructies die de kandidaten bij aanvang krijgen. •
De hoeveelheid materiaal die men een kandidaat voorschotelt, lijkt niet aan regels gebonden. Men stemt dit meestal af
op de tijd die de kandidaat krijgt en de vereiste informatie. Het moet bovendien een realistische situatie blijven. •
Er moet gestreefd worden naar duidelijke informatie voor de kandidaat, zodat die er geen onnodige zorgen bijkrijgt.
•
Het realiteitsgehalte van de oefeningen is belangrijk en draagt bij tot de betrokkenheid van de kandidaat.
FASE 5: Het toekennen van scores Ahmed et al. benadrukken dat deze fase bepalend is voor de constructvaliditeit van de oefening en halen drie tactieken aan die verzekeren dat de prestaties correct gemeten worden (AHMED et al., 1997, blz. 65). •
Bij de keuze tussen een algemene schaal of een specifieke schaal per oefening kiezen ontwerpers ervoor eenzelfde schaal te
gebruiken voor het hele AC. Onderzoek bevestigt dat dit de verwerkingslast bij de assessoren vermindert en zo bijdraagt tot een hogere constructvaliditeit. •
Ontwerpers koppelen de scores aan de dimensies en niet aan de inhoud. Wanneer dit laatste onvermijdelijk is, zoals
bij een in-tray of een planningsoefening, wordt ernaar gestreefd deze zo snel mogelijk te vertalen naar dimensies. •
Zoals onderzoek aangeeft, is het belangrijk dat de dimensies goed te onderscheiden zijn.
Daartoe worden assessoren uitgerust met duidelijke definities en met gedragsvoorbeelden, liefst specifiek per oefening. FASE 6: Het testen van een oefening De oefeningen worden op twee vlakken op de rooster gelegd (AHMED et al., 1997, blz. 65). •
In verband met het proces worden de timing van de oefening voor assessor en assessee, de duidelijkheid van de taak
en het comfort voor de kandidaat getest. ______________________________________________________________________________________________ De Mesel Katrien
43
Ontwikkeling van een assessment center
•
De inhoud wordt nader bekeken: moeilijkheidsgraad, duidelijkheid van de informatie, hoeveelheid informatie,
realiteitsgehalte, biedt de oefening gelijke kansen aan de deelnemers, wordt het gewenste gedrag uitgelokt, worden verschillende niveaus in performantie onderscheiden. FASE 7: Het evalueren van de oefening Het beoordelen van de validiteit, blijkt in de praktijk niet steeds mogelijk omdat de opdrachten specifiek zijn en niet voldoende deelnemers tellen om statistische analyse mogelijk te maken. Analyse van andere aspecten is wel doenbaar (AHMED et al., 1997, blz. 65). •
Het bijwonen van ‘wash-up sessions’ laat de ontwerpers toe te ontdekken welke gegevens assessoren beoordelen en welk
gedrag niet geobserveerd wordt. •
Op basis van de observatiebladen van assessoren kan worden nagegaan welk gedrag uitgelokt werd in de oefening.
•
Reacties van assessoren en kandidaten zijn een andere bron van informatie.
Dit model is een gids bij het opstellen van AC-oefeningen, maar kan ook voor andere doelstellingen ingezet worden (AHMED et al., 1997, blz. 66): het is eveneens een instrument om oefeningen te beoordelen en dit niet enkel aan het einde van het proces (fase 7), maar in elke fase. Desnoods moet de ontwerper een aantal stappen terugkeren om de kwaliteit te verbeteren. Het ontwerpproces van een AC kan geprojecteerd worden op het ‘best practice’-model. In tegenstelling tot traditionele beoordelingsprocedures, die focussen op de voorspellende kracht van het AC, vereist deze evaluatie geen groot aantal deelnemers. Ze is dus breder toepasbaar en de bekomen informatie is veelzijdiger. De methode geeft gedetailleerde informatie over de aanwezige problemen. Uit het model zijn verscheidene instrumenten afgeleid, zoals checklists, vuistregels,…, die de analyse vergemakkelijken en helpen bij het ontwerp. Het model levert ook het antwoord op een groot bezwaar bij het gebruik van AC’s, namelijk het tijdsintensief karakter ervan. De methode laat toe een oefening, de bijhorende instructies en het scoringsmechanisme te ontwerpen in enkele uren.
______________________________________________________________________________________________ De Mesel Katrien
44
Ontwikkeling van een assessment center
12. Knelpunten bij ontwikkeling en gebruik
In het vorige hoofdstuk werd het ontwikkelingsproces van AC’s geschetst. Er kunnen echter een aantal problemen opduiken tijdens deze fase. Lievens en Goemaere onderzochten drieëntwintig grote Vlaamse ondernemingen en stelden een overzicht op van de problemen die ze ontmoetten. Vele van deze struikelblokken zijn ook in andere literatuur terug te vinden. De problemen worden beschreven voor een aantal stappen van het ontwikkelingsproces: selectie van de dimensies, oefeningselectie, selectie en training van assessoren, observatie en het toekennen van scores, vastleggen van de eindscore en het geven van feedback. Tot slot wordt bekeken welke factoren de verschillen in de struikelblokken tussen ondernemingen onderling verklaren. A. PROBLEMEN BIJ DE SELECTIE EN DEFINIËRING VAN DIMENSIES Voor het selecteren van dimensies hanteren ondernemingen verschillende strategieën. De eerste bestaat eruit een lijst met criteria over te nemen van een extern consultant. Een tweede alternatief vraagt meer inspanning: informatie verzamelen over de functie, een functieanalyse uitvoeren voor een aantal sleutelfuncties en daaruit de relevante competenties afleiden. Bij de derde mogelijkheid worden de ‘strategische’ criteria van het topmanagement als basis genomen (LIEVENS en GOEMAERE, 1999, blz. 216). In de praktijk blijken de meeste ondernemingen te werken met een standaardlijst met beschreven dimensies. Daaruit worden per AC een aantal criteria geselecteerd. De bijhorende omschrijving zal echter niet voor alle functies even geschikt zijn. Opdat de competentie goed zou worden waargenomen, moet een grondige functieanalyse de beschrijving vooraf gaan. Dit is echter zeer tijdrovend en wordt daardoor achterwege gelaten (GOEMAERE et al., 1997, blz. 154). Bij slechts een derde van de onderzochte ondernemingen gaat een grondige functieanalyse aan het AC of DC vooraf (LIEVENS en GOEMAERE, 1999, blz. 216). Een specifiek probleem bij het bepalen van de dimensies, ontstaat wanneer het assessment center als doelstelling heeft potentieel op te sporen. Buiten het kader van een bepaalde functie is de selectie van de relevante competenties niet steeds vanzelfsprekend (GOEMAERE et al., 1997, blz. 152). Er heerst onzekerheid op het gebied van specificiteit van de omschrijving van de dimensies. Kan men de interpretatie van een algemene beschrijving in het kader van een assessment overlaten aan de assessors? Of bieden heel uitgebreide definities, aangevuld met relevante gedragsvoorbeelden, meer houvast? Deze laatste hebben als nadeel dat ze niet bruikbaar zijn voor verschillende oefeningen en AC’s (LIEVENS en GOEMAERE, 1999, blz. 216). Uit onderzoek blijkt dat het gebruik van drie algemene dimensies in plaats van veertien specifieke leidt tot hogere nauwkeurigheid bij het categoriseren/toewijzen van gedrag naar dimensies, hogere nauwkeurigheid van de scores en hogere interbeoordelaarsbetrouwbaarheid. De convergentvaliditeit verbeterde eveneens, terwijl de discriminantvaliditeit geen invloed ondervond (LIEVENS en KLIMOSKI, 2001, blz. 253). Deze resultaten zetten Campbell ertoe aan ervoor te pleiten om door middel van algemene dimensies het aantal competenties te beperken (LIEVENS en KLIMOSKI, 2001, blz. 253). Kolk et al. raden het gebruik aan van drie brede categorieën, met name voelen, denken en kracht. Deze categorieën zijn groeperingen van dimensies (LIEVENS en KLIMOSKI, 2001, blz. 253). ______________________________________________________________________________________________ De Mesel Katrien
45
Knelpunten bij ontwikkeling en gebruik
Voorts is er ook het vertalingsprobleem: uit de dimensies moeten functierelevante oefeningen afgeleid worden. Niet elke competentie laat zich echter even gemakkelijk omzetten in een opdracht. De onderneming staat bij zo’n dimensie voor de keuze: de dimensie behouden of weglaten. In de praktijk worden de dimensies meestal behouden, maar dat veroorzaakt problemen bij de einddiscussie aangezien geen observaties bestaan die de mening ondersteunen. Een derde optie bestaat eruit de dimensie alsnog te testen, maar dan door middel van andere technieken. Bijvoorbeeld het testen van stressbestendigheid door een stressinterview (GOEMAERE et al., 1997, blz. 155). Ook wanneer er te veel dimensies geselecteerd werden, ontstaan problemen. Het beperken van het aantal competenties per AC (5-6 in plaats van 17) biedt meerdere voordelen. Het laat een beter aansluitende definitie toe, wat bij een grote hoeveelheid dimensies teveel tijd vergt. Naast deze tijdsbesparing leidt de beperking ook tot een kwalitatief betere evaluatie aangezien de assessoren nauwkeuriger kunnen beoordelen. Ook bij de einddiscussie zal tijd bespaard worden (GOEMAERE et al., 1997, blz. 154). Er zijn ook nog een aantal andere struikelblokken: aan eenzelfde dimensie kunnen verschillende betekenissen toegekend worden. Er is ook niet steeds een duidelijke link tussen de dimensiedefinitie en het uitgelokte gedrag in oefeningen. Bovendien worden dimensies anders geïnterpreteerd in verschillende oefeningen (LIEVENS en KLIMOSKI, 2001, blz. 254). B.
PROBLEMEN AANGAANDE DE OEFENINGSELECTIE EN -ONTWIKKELING
De moeilijkheid van het bepalen van de juiste oefening om een bepaalde dimensie te evalueren, werd reeds in het vorige punt besproken. Daarnaast blijkt het ontwerp van de oefeningen, meer bepaald de kost die ermee samenhangt en het gebrek aan ervaring, voor problemen te zorgen (LIEVENS en GOEMAERE, 1999, blz. 216). Ahmed merkte dit struikelblok ook op en ontwierp een model of best practice dat aan deze tekorten tegemoet komt. Dit model werd hiervoor reeds (hoofdstuk ontwikkeling AC) uit de doeken gedaan. Groepsoefeningen blijken niet steeds wenselijk te zijn. Verschillende redenen liggen hieraan de basis: sommigen vinden het onverantwoord (interne) kandidaten tegen elkaar uit te spelen. Verder is het aantal kandidaten niet steeds groot genoeg en wil men vermijden dat één persoon de groep domineert. De oplossing voor dit laatste kan eruit bestaan dat een groepsoefening met rollen wordt gekozen zodat iedereen een gelijke kans krijgt (GOEMAERE et al., 1997, blz. 152). C. PROBLEMEN BIJ DE SELECTIE EN TRAINING VAN ASSESSOREN De helft van de Vlaamse grote ondernemingen schakelt exclusief lijn- of personeelsmanagers in voor de beoordeling van kandidaten. Een kwart laat deze taak over aan externe consultants, terwijl de rest beiden hun zegje laat doen (LIEVENS en GOEMAERE, 1999, blz. 216). Voor het inschakelen van lijnmanagers zijn verschillende argumenten te vinden. Zij weten immers als geen ander wat de functie inhoudt en kunnen dus beter inschatten welk gedrag vereist is voor de job. De acceptatie van de geselecteerde zal bovendien groter zijn wanneer men zelf inbreng heeft gehad in de keuze (GOEMAERE et al., 1997, blz. 154). Nochtans is het juist de kennis van de functie die een referentiekader creëert en zo de beoordeling beïnvloedt. Het referentiekader wordt gevormd uit de organisatiecultuur, werkomgeving, de persoonlijkheid van de vorige ______________________________________________________________________________________________ De Mesel Katrien
46
Knelpunten bij ontwikkeling en gebruik
functiehouder,… De lijnfunctionaris moet aangespoord worden bij de beoordeling enkel op de voorgeschreven dimensies te steunen (GOEMAERE et al., 1997, blz. 154). Een mogelijke oplossing bestaat eruit lijnmanagers van andere afdelingen de beoordeling te laten doen. Daardoor daalt wel de betrokkenheid van de lijnfunctionaris van de functie. Een alternatief stelt voor dat psychologen lijnmanagers opleiden als assessor. Een derde mogelijkheid bestaat erin managers te screenen alvorens hen in te schakelen als beoordelaar (LIEVENS en GOEMAERE, 1999, blz. 218). Wanneer het AC tot doel heeft potentieel bij interne medewerkers te ontdekken, kan de historiek tussen de lijnfunctionaris en de kandidaat voor vertekeningen zorgen. Vaak wordt om deze reden vermeden dat beiden elkaar kennen (GOEMAERE et al., 1997, blz. 152). Terwijl een degelijke opleiding van de assessoren onontbeerlijk, blijkt bij de helft van de onderzochte bedrijven deze fase toch afwezig te zijn. Tijdsdruk en de financiële kost geven hierbij de doorslag, maar vaak wordt ook niet het nut ingezien van deze investering. Het ontbreken van goede assessoren kan nochtans de waarde van de hele procedure teniet doen. Sommigen lossen dit tekort op door externe assessoren in te schakelen (GOEMAERE et al., 1997, blz. 155). Wanneer de onderneming niet kan/wil investeren in assessorentraining, is het aan te raden dat een systeem van ‘assessor mentorship’ wordt ontwikkeld. Dit houdt in dat de onervaren beoordelaars al doende de knepen van het vak leren van meer ervaren of externe assessoren (LIEVENS en GOEMAERE, 1999, blz. 218). Is opleiding toch aanwezig, dan bestaat deze meestal uit volgende onderdelen: inleiding i.v.m. de ACM, uitleggen van de dimensies en oefeningen, het inoefenen van observatie, evaluatie en integratieprocessen (LIEVENS en GOEMAERE, 1999, blz. 217). Zelfs wanneer een opleiding voor assessors voorzien wordt, betekent dit niet dat alle problemen van de baan zijn. Zo is het bijzonder moeilijk om objectieve observatie en interpretatie gescheiden te houden. De neiging bestaat om onmiddellijk het geobserveerde te interpreteren. Het afzonderen van deze twee processen blijkt zeer moeilijk in de praktijk en is bovendien moeilijk aan te leren. Bovendien komt deze gewoonte een tijd na de opleiding vaak weer naar boven (GOEMAERE et al., 1997, blz. 153-154). De praktijk toont ook aan dat een groot deel van het geleerde niet toegepast wordt in een echte assessmentsituatie. Regelmatige ‘refreshment’-training kan als stimulans dienen en zal de aangeleerde vaardigheden onderhouden. Vooral voor lijnmanagers die niet regelmatig beoordelen, kan een opfrissing nooit kwaad (GOEMAERE et al., 1997, blz. 153155).
______________________________________________________________________________________________ De Mesel Katrien
47
Knelpunten bij ontwikkeling en gebruik
D. PROBLEMEN BIJ OBSERVATIE EN SCORING 1)
De observatie zelf loopt niet steeds op wieltjes. Zoals reeds aangestipt, levert het scheiden van observatie en
evaluatie nogal wat zorgen op (LIEVENS en GOEMAERE, 1999, blz. 217). 2)
Assessoren die vasthouden aan een referentiekader of klassieke beoordelingsfouten begaan, zijn ook een bron
van zorgen (GOEMAERE et al., 1997, blz. 153). Er bestaan een hele reeks oorzaken die aan de basis liggen van minderwaardige beoordelingen. Nijssen (NIJSSEN, 2000, blz. 58-59 en 69-71) geeft een uitgebreid overzicht en vermeldt dat het wijzen van (toekomstige) assessoren op deze fouten een belangrijke stap is in het vermijden ervan. •
Wanneer de oefening te lang duurt, kan de aandacht van de assessor verslappen.
•
Andere assessors denken na over wat zij in die situatie zouden gedaan hebben en dit blokkeert de
waarnemingsmogelijkheid. Ook Van Beirendonck (VAN BEIRENDONCK, 1998, blz. 51) vermeldt de neiging van assessoren om hun persoonlijke voorkeur voor een bepaalde oplossing mee in rekening te nemen bij de evaluatie. Vaak beoordelen interne assessoren de inhoud van de oplossing en niet de competenties die eruit blijken. •
Zeer bekend zijn het halo- en horn-effect. Bij deze effecten wordt de globale indruk die de assessor van een kandidaat
heeft, weerspiegeld in de scores op de individuele dimensies. Wanneer een kandidaat sympathiek overkomt, zal minder belang gehecht worden aan onvolkomenheden in zijn prestaties (halo-effect), terwijl deze bij het horn-effect juist een te grote waarde toebedeeld krijgen. •
Ook centrale tendentie en leniency zijn befaamde beoordelingsfouten: bij centrale tendentie wordt het geven van extreme
scores vermeden. Leniency houdt in dat de assessor hogere scores toekent dan gerechtvaardigd door het vertoonde gedrag. Deze vertekening blijkt vrij stabiel te zijn (BARTELS en DOVERSPIKE, 1997, blz. 180 en 187). •
De impact van de eerste indruk is niet te onderschatten. Wanneer een kandidaat in de eerste oefening(en) slecht
scoort, zal de assessor ervan uitgaan dat dit in de andere opdrachten ook het geval is en geeft hij/zij voor die performantie ook lage scores. •
Bij projectie wordt bij de kandidaat vastgesteld wat de assessor bij zichzelf als negatief ervaart.
De assessor kan bij een kandidaat aspecten opmerken die hem doen denken aan een derde persoon. Wanneer de assessor deze buitenstaander sympathiek vindt, profiteert de kandidaat hiervan, maar ook het omgekeerde, waarbij de kandidaat onterecht slecht wordt beoordeeld, is mogelijk. Ook Goemaere et al. vermelden dit spiegelgedrag 2: lijnfunctionarissen kunnen bij het evalueren bij de kandidaten zoeken naar kenmerken waarover een ondergeschikte waarvan men tevreden is, beschikt. Er wordt dus niet geëvalueerd op basis van het getoonde gedrag zoals zou moeten, wel volgens karakteristieken die met de persoon samenhangen (GOEMAERE et al., 1997, blz. 152). •
Informatie van buiten het assessment center die een assessor heeft over een kandidaat zal onbewust vaak ook een rol spelen
bij de beoordeling. Een assessor zou nochtans enkel mogen steunen op gegevens van binnen de assessment. •
Subjectieve feitenselectie zal eveneens de beoordelingen vertekenen, en wel via drie wegen. Persoonlijke waarden, normen en
meningen kunnen de waarnemingen vertekenen en leiden tot subjectieve interpretaties. Door psychologische factoren zullen assessoren zien wat ze willen zien. En bij selectieve verwachtingen tot slot zien assessoren wat ze verwachten te zien. Wat niet strookt met deze verwachtingen wordt niet waargenomen. • Assessoren leggen vaak de link tussen verschillende persoonlijkheidskenmerken. Voorbeeld hiervan is het geloof dat ongemotiveerde mensen dom en lui zijn. 1
Dit spiegelgedrag wijst dus niet op het ‘spiegelen van gedrag’ waarbij de twee partijen elkaars handelingen en houding overnemen: houdingsecho of synchronisatie. Dit overnemen van non-verbaal gedrag kan de output van een interview beïnvloeden. 2
______________________________________________________________________________________________ De Mesel Katrien
48
Knelpunten bij ontwikkeling en gebruik
3)
Ook de dimensies zelf maken het evalueren niet steeds eenvoudig: te veel of te vaag geformuleerde dimensies zijn
belangrijke factoren. Daarnaast kan het voorkomen dat een bepaalde competentie niet te beoordelen is omdat ze bij een kandidaat niet tot uiting kwam in de oefeningen (GOEMAERE et al., 1997, blz. 153). 4)
Uit interviews met de betrokken bedrijven bleek dat ook tijdsdruk en kostenbeperkingen vaak aan de basis liggen
van de problemen bij observatie en scoring. Door gebrek aan tijd of geld krijgen assessoren de opdracht meerdere kandidaten tegelijk te beoordelen (LIEVENS en GOEMAERE, 1999, blz. 217). Op die manier resulteren tijds- en kostenbeperkingen in assessoren die teveel kandidaten moeten beoordelen volgens teveel zwak omschreven dimensies. Checklists en video-opnames kunnen verlichting brengen, maar worden niet in alle Vlaamse AC’s gebruikt (LIEVENS en GOEMAERE, 1999, blz. 217). 5)
De planning en uitvoering van het AC vergen een zware inspanning. Het bepalen van een geschikte dag, een
locatie vinden, de beschikbaarheid van assessoren regelen, de rotatie van de kandidaten over de oefeningen plannen,… Kortom, teveel om op te noemen. Door de complexiteit verloopt het eigenlijke AC dikwijls niet volgens planning (LIEVENS en GOEMAERE, 1999, blz. 217). E. PROBLEMEN BIJ HET BEPALEN VAN DE EINDSCORE Zoals reeds vermeld, wordt het eindoordeel in Vlaamse en Brusselse grote ondernemingen overwegend bekomen door een discussie tussen de assessoren. Deze praktijk heeft als belangrijk nadeel dat ze zeer tijdrovend is. Ondernemingen zijn er blijkbaar echter van overtuigd dat deze discussie, door de inbreng van elke beoordelaar, tot een meer verantwoorde beslissing leidt. Ook de aanvaarding van het resultaat ligt dan hoger (GOEMAERE et al., 1997, blz. 153). Slechts twee Vlaamse ondernemingen gebruiken een statistische beslissingsregel om tot de eindscores te komen. Onderzoek bevestigt echter niet steeds de meerwaarde van de discussie (LIEVENS en GOEMAERE, 1999, blz. 215): F.
PROBLEMEN BIJ DE FEEDBACK NAAR KANDIDATEN EN MANAGEMENT
Alle onderzochte bedrijven zien de noodzaak van een degelijke feedback in. Dit verhoogt immers de aanvaarding van de beoordelingsuitslag (GOEMAERE et al., 1997, blz. 153). De deelnemers krijgen immers een groter gevoel van controle bij het gebruik van de ACM. Zij geloven dat ze een actievere rol spelen. Toch is een enkele ontevreden deelnemer niet uit te sluiten. Het merendeel van de ondernemingen voert na afloop van het AC een evaluatie uit. Men gaat na hoe de kandidaten de procedure ervaren hebben en welke punten te verbeteren zijn (GOEMAERE et al., 1997, blz. 153). Geconfronteerd worden met je negatieve of zwakke kanten, is niet aangenaam. Zeker niet wanneer die vaststelling ernstige gevolgen met zich meedraagt, zoals bijvoorbeeld het missen van een promotie, een job die aan je neus voorbijgaat, niet deelnemen aan een uniek opleidingsprogramma,… Wanneer de onderneming op basis van de output van het center beslissingen neemt, blijven er steeds ‘verliezers’ achter. Woodruffe benadrukt het belang om deze personen niet aan hun lot over te laten, maar ook voor hen een toegevoegde waarde te halen uit het center. Dit kan door aan het assessment center ook developmentdoelstellingen vast te koppelen. Op basis van de output zal, via een geïndividualiseerde aanpak, een ontwikkelingsplan opgesteld worden (WOODRUFFE, 1997, blz. 32-35). Woodruffe geeft tips om gedemotiveerde assessees op het einde van het traject te vermijden: wees eerlijk en open over alle aspecten van de beoordeling, organiseer developmentsessies waarin de kandidaat begeleid wordt en geef (voorzichtig ______________________________________________________________________________________________ De Mesel Katrien
49
Knelpunten bij ontwikkeling en gebruik
en professioneel) feedback tijdens de oefening zodat de medewerker zijn gedrag kan bijsturen indien nodig. Steun bij de evaluatie ook op informatie over de werkelijke performantie in de functie die de kandidaat bekleedt. Zowel de werknemers als diens directe baas zullen de feedback dan beter aanvaarden. Praktisch kunnen de gegevens bekomen worden door de supervisor voorbeelden te laten geven van een aantal gedragingen. De assessoren kunnen dan de aanwezigheid van de competentie inschatten. Tenslotte moet een goede feedback georganiseerd worden. Woodruffe raadt aan deze bespreking een tijdje na het center te laten plaatsvinden en niet op de dag zelf. Zowel assessor als assessee zijn dan immers vermoeid en gespannen en dit zal het vlot verlopen van de feedback niet ten goede komen (WOODRUFFE, 1997, blz. 32-35). G. VERSCHILLEN IN PROBLEMEN BIJ VERSCHILLENDE ONDERNEMINGEN Er werd onderzocht of bedrijven die sinds kort de ACM gebruiken andere problemen melden dan deze die reeds een tijd de procedure toepassen. De eersten vonden het organiseren van assessortraining en het verzamelen van lijnmanagers voor de evaluatie veel moeilijker. Bovendien wordt het hele proces ook tijdsintensiever ervaren dan bij de andere bedrijven (LIEVENS en GOEMAERE, 1999, blz. 217). Lievens et al. gingen ook na of de zelf ontworpen AC’s andere problemen opleverden dan deze die met inbreng van externen opgericht werden. Wat bleek is dat de eigen AC meer problemen opleveren o.a. omdat er geen goede assessorentraining georganiseerd wordt. Ook de planning van de oefeningen blijkt moeilijk (LIEVENS en GOEMAERE, 1999, blz. 217).
______________________________________________________________________________________________ De Mesel Katrien
50
Knelpunten bij ontwikkeling en gebruik
13. Voordelen en nadelen van de ACM
In de voorgaande hoofdstukken werden al een aantal positieve en negatieve aspecten van de ACM aangestipt. Dit hoofdstuk zet de plus- en minpunten systematisch op een rijtje. A. VOORDELEN Eerst worden de vele voordelen van AC’s opgesomd, daarna wordt dieper ingegaan op de secundaire effecten en de billijkheid van de centers. 1)
Wanneer men de voordelen van de ACM achter elkaar zet, bekomt men een hele waslijst (VAN
BEIRENDONCK, 1998, blz. 35-36): -
De kracht van de ACM ontstaat onder andere door het combineren van verschillende instrumenten zoals
interview, persoonlijkheidstest en simulaties. Dit levert voorspellingen op van een hogere kwaliteit (zie ook hoofdstuk ‘validiteit’). -
Personeelsplanning, opleiding en vorming, loopbaanbegeleiding,… verlopen veel systematischer.
-
Assessment centers hebben een hoge face-validiteit of realiteitswaarde bij kandidaten en management (zie
hoofdstuk ‘validiteit’). De aanvaarding bij de kandidaten ligt duidelijk hoger bij de ACM dan bijvoorbeeld bij vaardigheids-, persoonlijkheids- en creativiteitstests en even hoog als een interview (BRAL, 2000, blz. 112). -
De competenties worden duidelijk en objectief in kaart gebracht via deze methode die steunt op
gedragsobservatie. -
De ontwikkeling van de kandidaat wordt gestimuleerd. Doordat sterktes en zwaktes gekend zijn, gebeurt de
ontwikkeling ook veel gerichter. -
Aangezien communicatie gebeurt via gedragsterminologie, en niet via psychologisch jargon, begrijpen management
en human resources elkaar beter. -
De assessorentraining heeft positieve spin-off-effecten: managers leren gedrag observeren en evalueren, ze
verbeteren hun interviewtechnieken en krijgen meer inzicht in groepsdynamica en leiderschapsstijlen. -
De verantwoordelijkheid voor aanwerving, promotie,… komt bij het management terecht: men veronderstelt
immers dat de manager een grote kennis heeft over de functie en dat hij dus weet hoe deze uitgevoerd moet worden zodat de verantwoordelijkheid voor functie-uitoefening bij hem komt te liggen. -
De kandidaat krijgt tijdens de test informatie over de functie-inhoud en kan oordelen of de functie aan zijn
verwachtingen voldoet. -
Het vooraf omschreven gewenste gedrag kan in de simulaties nauwkeurig gemeten worden.
-
Assessment centers bieden het voordeel ten opzichte van interviews en psychologisch onderzoek dat ze ook
inzicht geven in het gedrag van de kandidaat en niet louter vakkennis, gevoel voor cijfers en uitdrukkingsvaardigheden testen (WIJCHERS et al., 1992, blz. 11). 2)
Het aanwenden van de ACM levert ook secundaire effecten (VLOEBERGHS, 1997, blz.171). De techniek brengt
grotere duidelijkheid en gerichtheid in de organisatie omtrent voor succes cruciale competenties, zodat ook een duidelijkere en meer effectieve organisatiecultuur ontstaat. Ook ontstaat er een grotere betrokkenheid van seniormanagement op vlak van het beoordelen van medewerkers, waarbij hun training als assessoren heel wat spin-offs ______________________________________________________________________________________________ De Mesel Katrien
51
Voordelen en nadelen van de ACM
kan hebben in andere domeinen. ‘Er gebeurt immers vaak spontaan een terugkoppeling naar andere evaluatiesystemen. Managers krijgen feedback over hun eigen medewerkers, wat aanleiding kan geven tot meer gemeenschappelijke standaarden bij het beoordelen van andere medewerkers.’ ‘Voor de deelnemers aan het assessment center kan het een onschatbare bron van informatie opleveren omtrent de in de organisatie echt gewenste competenties. Ze leren eveneens uit de reacties van de andere deelnemers. Soms wordt hier de basis gelegd voor verdere contacten en voor een informeel communicatienetwerk dat bevorderlijk is voor de verdere samenwerking. Sommige managers stellen zelfs dat de voordelen op het gebied van aspecten die niet rechtstreeks verbonden zijn met het assessment even waardevol of zelfs nog belangrijker zijn dan het assessment van competenties zelf (VLOEBERGHS, 1997, blz.171).’ 3)
Een belangrijk voordeel van de ACM is de billijkheid of ‘fairness’ van een procedure. Deze term duidt op de mate
waarin bepaalde groepen van deelnemers bevooroordeeld worden ten opzichte van anderen vb. op basis van geslacht, etniciteit,… Goldstein en collega’s vertellen dat de assessment centers hun ontstaan te wijten hebben aan de sterke discriminatie bij ‘paper and pencil’-tests, meetinstrumenten van cognitieve vaardigheden en schriftelijke tests over functiekennis. Deze instrumenten hebben een hoge predictieve validiteit, maar op vlak van fairness scoren ze ondermaats. Men ging dus op zoek naar andere methoden en kwam bij de ACM terecht. AC’s blijken een hoge voorspellingskracht te bezitten en bovendien minder te discrimineren (GOLDSTEIN et al., 1998, blz. 357-358). De billijkheid is aangetoond voor verschillende groepen. Achtereenvolgens wordt hier de billijkheid op basis van ras, geslacht en tussen Vlamingen en Walen besproken. •
Algemeen wordt aangenomen dat het AC nauwelijks discrimineert op grond van verschillen in de culturen van de
kandidaten. De ACM levert op dat vlak betere resultaten dan andere selectiemethoden. Wanneer men de literatuur erop naslaat, stuit men echter op uiteenlopende onderzoeksresultaten. Terwijl in de ene studie blanken significant beter scoren, worden in een ander onderzoek geen verschillen vastgesteld (LIEVENS en VAN KEER, 2000, blz. 70-71). Goldstein en collega’s (Yusko, Braverman, Smith en Chung) bieden een verklaring voor deze tegenstrijdige gegevens. Zij onderzochten of de fairness verschilt tussen de verschillende oefeningen van het AC. Er blijken inderdaad schommelingen te bestaan. In 1993 vonden Goldstein, Braverman en Chung dat opdrachten die meer nadruk leggen op mondelinge, interactieve en gedragsgebaseerde activiteiten, minder discrimineren tussen blanken en zwarten dan geschreven, minder interactieve en minder gedragsgeoriënteerde oefeningen. De volgende stap was dan het vinden van een verklaring. Eén hypothese luidt dat de cognitieve component van een simulatieoefening de billijkheid beïnvloedt. Het onderzoek van Goldstein en collega’s in 1998 levert ondersteuning voor deze denkpiste: wanneer de invloed van de cognitieve bekwaamheid worden uitgesloten, is in geen enkele oefening het cultuurverschil significant (GOLDSTEIN et al., 1998, blz. 367). Wanneer vooral oefeningen getest worden die sterk steunen op de cognitieve bekwaamheid (vb. postbakoefening of case-analyse), kan men dus etnische verschillen verwachten (LIEVENS en VAN KEER, 2000, blz. 70-71). Hoewel niet alle onderzoek wijst in deze richting, is het belang van onderzoek naar etnische verschillen per oefening, en niet in de totale score, aangetoond. Bestudering van rasverschillen in andere opdrachten zoals rollenspel, fact-finding, presentaties,… kan onderwerp zijn van toekomstig onderzoek (LIEVENS en KLIMOSKI, 2001, blz. 249252). In hetzelfde onderzoek gingen Goldstein et al. ook na welke impact het weglaten van de cognitief vermogen in de oefening heeft op de voorspellingskracht van het center. Hoewel de cognitieve belasting bijdraagt in de validiteit, blijven
______________________________________________________________________________________________ De Mesel Katrien
52
Voordelen en nadelen van de ACM
een aantal oefeningen toch hun voorspellende waarde behouden bij het weglaten ervan (GOLDSTEIN et al., 1998, blz. 368). Uiteraard is deze zaak nog niet zo klaar als een klontje. Zo is het bijvoorbeeld nog niet duidelijk welke karakteristieken het cognitief vermogen bepalen of welke andere methodologische aspecten de cultuurverschillen beïnvloeden. Er is nog werk aan de winkel (GOLDSTEIN et al., 1998, blz. 369-370). •
Wat billijkheid in het geslacht van de kandidaten betreft, blijken mannen en vrouwen een gelijke kans te krijgen.
Meerdere studies stelden geen verschillen tussen de kandidaten van beide geslachten vast: Moses (1973), Huck en Bray (1976) en Moses en Boehm (1975). Ook hier bestaan echter afwijkende studies. Shore (1992) vond hogere scores voor vrouwen bij beoordeling op basis van prestatiegerelateerde gedragskenmerken (LIEVENS en VAN KEER, 2000, blz. 78 en SHORE et al, 1997, blz. 192). Wanneer men de conclusies van laboratoriumonderzoek vergelijkt met deze uit echte ondernemingen, komt men tot een interessante vaststelling: terwijl bij een hypothetisch scenario mannen worden bevoordeeld, is dit niet zo in een reële omgeving en is daar zelfs eerder neiging om vrouwelijke kandidaten hoger te scoren. De verklaring wordt gezocht in de hoeveelheid informatie die assessoren krijgen om tot een oordeel te komen. Bij een laboratoriumonderzoek is deze hoeveelheid beperkt en men gelooft dat de assessor dan zijn toevlucht zoekt in stereotiepe vooroordelen. In het echte center staan heel wat meer gegevens ter beschikking van de beoordelaar en zullen vooroordelen geen invloed hebben (SHORE et al, 1997, blz. 193). In een recentere studie (1997) van Shore, Tashcian en Adams werd het faire karakter van de ACM nogmaals bevestigd: in geen enkele oefening en voor geen enkele dimensie konden ongelijke kansen voor man en vrouw worden vastgesteld (SHORE et al., 1997, blz. 197). Lievens en Van Keer gingen in een Belgische bank (BBL) na of er significante verschillen zijn tussen de geslachten. Bij de eindadviezen bleken deze afwezig. Enkel op vlak van doeltreffende communicatie kwamen vrouwen beter uit de test. Ook dit AC bevestigt dus de fairness van de ACM (LIEVENS en VAN KEER, 2000, blz. 78-79). •
Ook het mogelijke bestaan van een relatie tussen het geslacht van de kandidaat en dat van de assessor bleef niet
onopgemerkt en werd onder de loep genomen. Tegenover de vele studies die geen verschil terugvonden 3, is de studie van Walsh, Weinberg en Fairfield (1987) een buitenbeentje: deze onderzoekers vonden een voordeel voor vrouwen bij evaluatie door mannelijke assessoren. In deze studie werden kandidaten beoordeeld op basis van een algemene dimensie die geëvalueerd werd door een groep assessoren. Shore, Tashcian en Adams geloven dat de groepsdynamieken in het assessorenteam de afwijkende resultaten van dit onderzoek kunnen veroorzaken. Daarom vermeden ze in hun studie in 1997 het bestaan van geslachtsgerelateerde groepsdynamieken door de assessoren de kans te ontnemen hun scores onderling te bespreken. Bovendien werd gemeten aan de hand van specifieke dimensies en niet op basis van een globale score. Zij vonden geen relatie terug tussen de geslachten van beide partijen (SHORE, 1997, blz. 200). Hoewel Fletcher de positieve aspecten van zorgvuldig opgebouwde en beheerde AC’s niet in twijfel trekt, wil hij toch opmerken dat de gegevens niet al te sterk veralgemeend mogen worden. Wanneer de billijkheid tussen beide geslachten wordt bekeken, merkt men op dat de competenties die gekoppeld worden aan succesvolle managers vaak nauw verbonden zijn met mannen. Bovendien werd vastgesteld dat wanneer vrouwelijke assessees in de minderheid zijn, hun leiderschapsgedrag terugvalt tot een fors lager niveau dan wanneer er evenwicht is tussen de beide geslachten. Op basis
Bartol en Butterfield (1976), Hamner et al, (1974), Mobley (1982), Peters et al. (1984), Shore en Thornton (1986), Wexley en Pulakos (1982), … 3
______________________________________________________________________________________________ De Mesel Katrien
53
Voordelen en nadelen van de ACM
van deze gegevens kunnen een aantal aandachtspunten worden geformuleerd: laat de competentieanalyse uitvoeren op een gelijk aantal mannen als vrouwen, zorg voor een gelijk aantal mannelijke en vrouwelijke assessoren, schenk in de training aandacht aan het probleem en probeer bij de kandidaten de hoeveelheid mannen en vrouwen gelijk te houden. Ook voor andere aspecten (vb. voorspellingskracht,…) kan men soortgelijke aandachtspunten formuleren (FLETCHER, 1996, blz. 50). •
Lievens en Van Keer (LIEVENS en VAN KEER, 2000, blz. 79) onderzochten de billijkheid bij Vlamingen en
Walen. Het onderzochte AC scoorde goed. Toch werd voor het gedragskenmerk ‘intelligente aanpak’ wél een verschil vastgesteld: de Vlamingen scoorden hierop beter. Op niveau van het eindadvies was er een hoge billijkheid. •
Jansen en Stoop halen een ander aspect van fairness aan, namelijk het vergelijken van kandidaten met de andere
deelnemers. Zij vermelden: ‘for the observation, assessment, and decision process to be fair, the end rating of a candidate in an arbitrary assessment center should be independent of the end rating of another candidate in the same assessment center. There should be no relative judgement, no deflation or inflation of assessment standards as a consequence of the presence of worst or better other candidates.’ Uit hun onderzoek in het Nederlandse KPN blijkt dat kandidaten in een assessment center met zes kandidaten met elkaar vergeleken worden, waardoor de beoordelingen eerder relatief dan absoluut zijn. Bij vijf leden was dit niet het geval (JANSEN en STOOP, 1994, blz. 203-205). Lievens en Van Keer merken op dat billijkheid meer inhoudt dan het vergelijken van de scores van verschillende groepen deelnemers. Er moet ook onderzoek worden verricht naar de rechtvaardigheid in procedurele aspecten zoals het feedbackgesprek of de instructie aan de deelnemers. Bovendien kan in de toekomst differentiële predictie gebruikt worden als methode, in plaats van de ‘naïeve’ benadering van billijkheid. Terwijl deze laatste benadering verschillen tussen bijvoorbeeld de beide geslachten opspoort, is differentiële predictie een genuanceerdere vorm, waarbij onderzocht wordt of de verschillen in de scores gerelateerd zijn aan gelijkaardige verschillen in de criteria die de later werkelijk geleverde performantie weerspiegelen (LIEVENS en VAN KEER, 2000, blz. 81-82).
______________________________________________________________________________________________ De Mesel Katrien
54
Voordelen en nadelen van de ACM
B.
NADELEN
Dit onderdeel geeft eerst een opsomming van de nadelen van centers. Daarna wordt de kostprijs in het bijzonder besproken. •
Minpunten
Van Minden formuleert voor elk van de onderwerpen die in de voorgaande hoofdstukken aan bod kwamen bedenkingen (van Minden, 1998, blz. 32-35): -
Het ontwerp: Werd een goede functieanalyse gemaakt? Sluiten de opdrachten hierbij aan? Zijn de dimensies
goed gekozen en is de omschrijving ervan duidelijk? -
De assessoren: De beoordelaars zijn mensen en bijgevolg niet 100% objectief. Begrijpen de assessoren de
dimensies? Is de training voldoende? Wordt het gedrag met de juiste dimensie gelinkt? Komen verschillende assessoren tot hetzelfde besluit?,… -
De deelnemers: De kandidaten krijgen slechts een korte omschrijving van de (fictieve) onderneming en worden
verondersteld zich snel te kunnen inleven. In werkelijkheid is men beter op de hoogte van de waarden en normen, de medewerkers. Zal het vertoonde gedrag ook in werkelijkheid geuit worden?,… -
De ACM heeft een lage constructvaliditeit. Het is dus niet duidelijk wat precies gemeten wordt (zie volgend
hoofdstuk). Verder zijn er nog andere minpunten te formuleren (VAN BEIRENDONCK, 1998, blz. 37 en 51): -
Wanneer de oefeningen niet voldoende aansluiten op de basiselementen van de functie, zijn de voorspellingen
onbetrouwbaar: men heeft een prachtig instrument dat de verkeerde dingen meet. -
Kandidaten die een minder gunstige evaluatie kregen, kunnen de moed laten zakken. Deze beoordeling draagt
nochtans niet met zich mee dat de persoon zijn huidige functie niet naar wens vervult of dat hij/zij niet voor promotie in aanmerking komt. Speciale opvang is aan te raden. -
Wanneer deelnemers die goede resultaten behaalden tijdens een assessment, door het management bevoordeeld
worden, spreekt men van het k‘ roonprinssyndroom’. Dit kan tot gevolg hebben dat deze personen hun taken verwaarlozen aangezien ze ervan uitgaan dat hun carrière verzekerd is. Uiteraard zal het kroonprinssyndroom een demotiverende invloed hebben op de andere werknemers. -
Lijnmanagers kunnen machtsverlies vrezen. Daarom is het belangrijk dat zij uitleg krijgen en dat ze betrokken
worden in het proces. -
Wanneer kandidaten geloven dat de uitslag van het assessment center hun hele carrière zal bepalen, zullen zij
onder veel stress staan tijdens de beoordeling en (vaak) minder goed presteren. Dit bezwaar wordt geminimaliseerd aangezien de uitvoerders van de functie in de realiteit ook met stress te kampen hebben. De stress maakt onderdeel uit van de beproeving. Bovendien toont de studie van Fletcher et al. (FLETCHER et al., 1997, blz. 205 en 210) aan dat globaal gezien angst geen impact heeft op de eindbeoordeling van het center. Wanneer de ongerustheid echter uitgesplitst wordt naar trait, test en state anxiety4, is er wel een invloed. State anxiety vertoont een kromlijnige relatie met AC-maatstaven: hoge en lage angst leiden tot zwakke performantie. Test anxiety heeft een negatief effect op de prestaties in numerieke en geschreven tests. Een hoger niveau in trait anxiety levert betere AC-scores.
Trait anxiety slaat op de verschillen tussen individuen om de wereld als bedreigend of gevaarlijk te percipiëren en op de frequentie waarmee state anxiety wordt ervaren. State anxiety ontstaat door omgevingsfactoren en verwijst naar emotionele reacties zoals spanning, vrees, nervositeit en bezorgdheid. Test anxiety duidt op de ongerustheid die gepaard gaat met een examen of test. 4
______________________________________________________________________________________________ De Mesel Katrien
55
Voordelen en nadelen van de ACM
-
De kostprijs is een zeer belangrijke beperking: directe en onzichtbare indirecte kosten zijn hoog. Onzichtbare
kosten zijn bijvoorbeeld het verschaffen van opleiding aan werknemers die de onderneming in de toekomst zullen verlaten. De onderneming zal het assessment center als een investering moeten behandelen en bijgevolg kosten en baten tegen elkaar afwegen. Meer hierover in het tweede deel van dit hoofdstuk. -
Assessees die de bedrijfscontext kennen, zijn bevoordeeld. Zij kennen immers de regels, normen procedures en
gewoontes van de onderneming. •
Kostprijs
Het nadeel met waarschijnlijk de grootste impact is het prijskaartje dat aan de methode hangt. Dit is het gevolg van de hoge personeelskosten en het tijdrovende karakter. Vele ondernemingen proberen dit nadeel te omzeilen door te snoeien in assessoren, oefeningen of beoordelingstijd, maar dit gaat onvermijdelijk ten koste van de waarde van het AC (BRAL, 2000, blz. 112). Utiliteitsanalyse Wanneer de kosten relatief bekeken worden en dus afgewogen worden ten opzichte van de baten (utiliteitsonderzoek), komt de ACM niet zo slecht uit de bus en scoort ze zelfs beter dan het interview en andere selectiemethoden (BRAL, 2000, blz. 112). Bij selectie bestaan de financiële baten uit de aanwerving van mensen die gemiddeld beter presteren dan de kandidaten die werden gerekruteerd via minder valide methodes. Een beter presterende medewerker zorgt voor een outputstijging bij een gelijk aantal werknemers of verlaagt het vereiste aantal medewerkers (productiviteitsstijging) (VAN BEIRENDONCK, 1998, blz. 82). Voor een development center zal het voordeel bestaan uit het verschaffen van relevante opleiding. Bovendien zal de werknemer meer gemotiveerd zijn de training te volgen wanneer hij/zij de tekorten zelf ondervonden heeft in het center. Byham acht de baten bij selectie desondanks hoger omdat dan onmiddellijk een medewerker kan gekozen worden die open staat voor ontwikkeling (MAYES, 1997, blz. 5). De kosten van een foute keuze bij een aanwerving zijn vaak aanzienlijk en overstijgen de kost van het assessment. Naast deze financiële kosten, moeten echter ook imagoverlies, demotivatie van andere personeelsleden en de impact van beslissingen door de aangeworven persoon opgenomen worden (NIJSSEN, 2000, blz. 127). Bij utiliteitsonderzoek van AC’s wordt vaak de formule van Schmidt gehanteerd. De formule luidt als volgt (VAN BEIRENDONCK, 1998, blz. 81): t . Ns . (r1 – r2) . SDy . L
U= met: U t
SR – NS . (c1 - c2) / SR
= de utiliteitswaarde = de gemiddelde duur dat een geselecteerd persoon in het bedrijf blijft
Ns = het aantal geselecteerden r1
= de validiteit van de nieuwe procedure (hier: de ACM)
r2
= de validiteit van de oude procedure
SDy = de ‘onbeperkte’ standaarddeviatie van prestaties uitgedrukt in dollars L
= de ordinaat van de normaalcurve met betrekking tot de selectieratio
______________________________________________________________________________________________ De Mesel Katrien
56
Voordelen en nadelen van de ACM
SR = selectieratio (de verhouding tussen het aantal vacatures en het aantal kandidaten) c1
= de kosten van de nieuwe methode
c2
= de kosten van de oude methode
Middelen ter bestrijding van de kosten •
Enerzijds wijst Nijssen naar het feit dat steeds meer selectiebureaus de methode verschaffen zodat de techniek
ook betaalbaar wordt voor kleinere bedrijven. •
Anderzijds gingen meerdere wetenschappers op zoek naar manieren om de kosten van de ACM binnen de perken
te houden. Vooral nieuwe technologieën leveren hiertoe opportuniteiten doordat ze taken van de (dure) assessors kunnen overnemen. De impact van de technologieën kan ver uiteenlopen: het kan gaan van gecomputeriseerde formulieren, over het schrijven van (evenwaardige) rapporten, tot een fact-findingoefening die enkel tussen de assessee en de computer verloopt op basis van een dynamisch proces waarbij de assessee reacties krijgt op de genomen beslissing. De computer beoordeelt niet alleen de oplossing, maar eveneens de strategie die gebruikt is en levert een eindscore af (HOWARD, 1997, blz. 42-44). De computer zal zijn invloed laten gelden via automatisatie van bijvoorbeeld een postbakoefening. Van Beirendonck legt uit wat bedoeld wordt met het gebruik van de computer: “Wij hebben het hier niet over persoonlijkheidsvragenlijsten of zelfbeschrijvingstechnieken waarbij de antwoorden van de respondent worden verwerkt om vervolgens via psychologische constructies en door middel van statistiek voorspellingen te maken over competenties.” Het gaat hier over simulaties op de computer. Een voorbeeld is het computergestuurde in-basket ‘Lakeview’ (VAN BEIRENDONCK, 1998, blz. 100). Zoals elke methode heeft ook geautomatiseerde gedragsmeting voor- en nadelen (VAN BEIRENDONCK, 1998, blz. 100): Wanneer we de pluspunten bekijken, vermeldt Van Beirendonck dat geautomatiseerde gedragsmeting zowel onderdeel kan zijn van self-development als van assessment- en development centers. Bovendien wordt in deze techniek minder beslag gelegd op de assessoren. Zij moeten slechts de resultaten interpreteren (in geval de computer dit niet zelf doet). Een derde positief punt is dat de evaluatie van competenties, zoals probleemanalyse, plannen en organiseren, beslissen en delegeren, verloopt op een objectieve manier. Tot slot is de feedback niet enkel gebaseerd op de bekomen oplossing, maar kan ook de werkwijze of strategie om tot de oplossing te komen in beschouwing genomen worden. Het is echter niet allemaal rozengeur en maneschijn: het ontwikkelen van een dergelijk programma brengt een hoge kost met zich mee. Bovendien kan de methode enkel als aanvullend instrument worden gebruikt aangezien niet alle competenties beoordeeld kunnen worden met de techniek. Relationele vaardigheden vallen bijvoorbeeld uit de boot. Als derde nadeel zien we dat het programma bepaalde gedragsreacties uitlokt. Zo zal de vraag ‘Aan wie ga je dat delegeren?’ de kandidaat aanzetten tot delegatie. Het computersysteem kan dan wel de kwaliteit van de delegatie onderzoeken en beoordelen. Als laatste vermeldt Van Beirendonck het bestaan van systemen die de uiteindelijke beoordeling van de competenties afleiden uit meerkeuzevragen. Deze praktijk is suggestief, geforceerd en beperkt. •
Het maken van opnames van het center opent eveneens perspectieven. De assessoren kunnen de band bekijken op
een voor hen geschikt moment en levert bijgevolg minder stress, vermoeidheid en moeite op. Bovendien hoeft de beoordelaar niet fysiek aanwezig te zijn in het center, zodat (externe) professionele assessoren ingeschakeld kunnen worden en trainingskosten vermeden kunnen worden (HOWARD, 1997, blz. 46). ______________________________________________________________________________________________ De Mesel Katrien
57
Voordelen en nadelen van de ACM
•
Ook op niveau van specifieke oefeningen hebben onderzoekers gesleuteld om bijvoorbeeld het tijdvergende
karakter van de centers te wijzigen. Hakstian en Harlos ontwikkelden een in-basket-oefening waarvoor de trainings- en beoordelingstijd fors lager ligt terwijl de betrouwbaarheid en validiteit op hetzelfde niveau blijft. In hun onderzoek daalde door de reductie van de dimensies de betrouwbaarheid slechts marginaal en steeg de validiteit. De twee onderzoekers merken wel op dat de dimensiescores niet geschikt zijn voor trainings- of ontwikkelingsdoeleinden (HAKSTIAN en HARLOS, 1993, blz. 141). Het spreekt voor zich dat verder en diepgaander onderzoek aangewezen is om na te gaan of geen essentiële eigenschappen van de ACM geraakt worden door zulke ‘afslankingsperikelen’. Anderzijds toont dit voorbeeld aan welke mogelijkheden zich aanbieden.
______________________________________________________________________________________________ De Mesel Katrien
58
Voordelen en nadelen van de ACM
14. Betrouwbaarheid en validiteit
In de vorige hoofdstukken zijn diverse aspecten van de ACM toegelicht. In dit hoofdstuk komen misschien wel de belangrijkste elementen van allemaal aan bod, namelijk de interbeoordelaarsbetrouwbaarheid en de validiteit. Validiteit is een wetenschappelijk criterium dat de waarde van een meetinstrument uitdrukt: een meetinstrument is valide als het meet wat het verondersteld wordt te meten. Wanneer men de validiteit van de ACM kent, kan men het gebruik van de methode verantwoorden of veroordelen. Eerst wordt de interbeoordelaarsbetrouwbaarheid besproken. Daarna wordt er ingegaan op de verschillende soorten validiteit: face-validiteit, inhoudsvaliditeit, criteriumvalididteit en constructvaliditeit. A. INTERBEOORDELAARSBETROUWBAARHEID BEGRIP, VASTSTELLINGEN EN OORZAKEN Deze vorm van betrouwbaarheid peilt naar de mate waarin de scores van de verschillende assessors voor een kandidaat overeenstemmen. De interbeoordelaarsbetrouwbaarheid schommelt in het algemeen tussen .60 (wat een gemiddelde waarde is) en .90 (hoge waarde). Koen Claes berekende de interbeoordelaarsbetrouwbaarheid voor het AC van de Vlaamse Gemeenschap en vond heel hoge waarden. De puntcorrelaties, die het verband geven tussen de scores door twee assessoren voor één competentie, lagen echter een stuk lager. Deze (strenge) norm moedigt aan tot een genuanceerdere interpretatie van de hoge betrouwbaarheid van de algemene oordelen (VAN BEIRENDONCK, 1998, blz. 80). Algemeen kan men dus stellen dat de assessoren het eens zijn over de volgorde van de kandidaten op het niveau van de algemene resultaten, maar dat per competentie aanzienlijke verschillen kunnen bestaan (VAN BEIRENDONCK, 1998, blz. 80). De afwijkingen tussen de scores van verschillende assessoren bestaan omdat de denkschema’s van de assessoren verschillen. Assessorentraining, assessorenmeeting,… kunnen begeleiding bieden op dit vlak (VAN BEIRENDONCK, 1998, blz. 80). BEPALENDE FACTOREN Rothstein toonde met zijn studie uit 1990 aan dat de interbeoordelaarsbetrouwbaarheid toeneemt wanneer de beoordelaars meer kans/tijd krijgen het gedrag van de assessee te bestuderen (hogere ‘opportunity to observe’). Nieuwe medewerkers zullen pas goed ingeschat worden wanneer hun supervisor hiertoe wat tijd krijgt. Vooral tijdens de eerste twaalf maanden zal de betrouwbaarheid van de beoordelingen erop vooruit gaan (MOSER et al., 1999, blz. 133). Ook voor de AC’s is dit een belangrijke vaststelling. Kenny onderscheidde in 1991 zes factoren die de interbeoordelaarsbetrouwbaarheid bepalen: de bekendheid van de assessee, de kans om het gedrag van de kandidaat te observeren, de gedeelde waardesystemen van de beoordelaars, de consistentie van het getoonde gedrag, de informatie van buiten het center (los van het geobserveerde gedrag) en de communicatie tussen de assessors onderling (MOSER et al., 1999, blz. 134).
______________________________________________________________________________________________ De Mesel Katrien
59
Betrouwbaarheid en validiteit
B.
VALIDITEIT OP ZICHT/ FACE VALIDITY
In het algemeen vinden deelnemers, bedrijfsleiders en human resources-verantwoordelijken dat de ACM een relevant en valide instrument is. Deze perceptie geeft geen beeld van de werkelijke wetenschappelijke waarde, maar speelt wel een grote rol bij de aanvaarding van de resultaten van een center (VAN BEIRENDONCK, 1998, blz. 82). Wat de aanvaarding bij de kandidaten betreft, scoort het AC duidelijk beter dan bijvoorbeeld vaardigheids-, persoonlijkheids- en creativiteitstests en even goed als een interview (BRAL, 2000, blz. 112). In het Nederlandse KPN gingen Jansen en Stoop na hoe de kandidaten de ACM evalueren. Zij maakten een onderscheid tussen aanvaarde en geweigerde kandidaten. 90-95% van de aanvaarde kandidaten waren zeer tevreden over de methode. Geen enkel individu bestempelde de methode als slecht. Ook bij de afgewezen personen waren de meesten positief gestemd. Een aantal personen evalueerde de techniek wel als onaangenaam. Jansen en Stoop geven twee verklaringen voor het groter aandeel ontevreden personen bij de geweigerde dan bij de aanvaarde kandidaten: de aanvaarde kandidaten zullen de onplezierige ervaringen vergeten (cognitieve dissonantie) en afgewezen kandidaten leggen de oorzaak van hun eigen falen bij de procedure (attributietheorie). De twee onderzoekers wezen er ook nog op dat een aantal aanpassingen in het assessment center (in dit geval werd een leidraad opgesteld voor het rollenspel) de negatieve meningen fors reduceren (JANSEN en STOOP, 1994, blz. 205-206). C. INHOUDSVALIDITEIT/ CONTENT VALIDITY De Inhoudvaliditeit verwijst naar “de representativiteit van het meetinstrument of de onderzoeksopzet m.b.t. het onderwerp dat de onderzoeker beweert te meten. De inhoud van het onderzoeksinstrument moet m.a.w. representatief zijn voor, en een zo volledig mogelijk beeld geven van alle elementen van het onderwerp dat bestudeerd wordt.” (DE PELSMACKER en VAN KENHOVE , 1999, blz. 31-33) Opdat een AC voldoet aan deze omschrijving, moeten een aantal voorwaarden in acht genomen worden (AHMED et al., 1997, blz. 62): -
De taken moeten de meest belangrijke activiteiten van de job weerspiegelen.
-
Het formaat waarin informatie wordt gegeven (schriftelijk of mondeling) moet overeenstemmen met de vorm in de werkelijkheid.
-
Het antwoordkanaal moet hetzelfde zijn als in de eigenlijke functie.
-
Zorg voor een samenhangend ontwerp bijvoorbeeld via gelinkte oefeningen.
-
De taken moeten de moeilijkheidsgraad van de functie weer geven.
-
De vormgeving van de oefening moet het gewenste gedrag aanmoedigen.
-
De oefening moet de normen en de cultuur van de onderneming reflecteren.
______________________________________________________________________________________________ De Mesel Katrien
60
Betrouwbaarheid en validiteit
D. CRITERIUMVALIDITEIT Bij criteriumvaliditeit ligt de nadruk op het criterium en de voorspellende kracht van het meetinstrument en niet op de inhoud ervan zoals bij de contentvaliditeit. Op vlak van tijdsperspectief maakt men een onderscheid tussen voorspellende validiteit (predictive validity) en gelijktijdige validiteit (concurrent validity) (DE PELSMACKER en VAN KENHOVE, 1999, blz. 31-33). Voorspellende validiteit BEGRIP Predictieve validiteit gaat na in welke mate een techniek juiste voorspellingen toelaat. Specifiek voor assessment centers wordt dus gecontroleerd in welke mate de voorspellingen over het toekomstig werkgedrag juist zijn (VAN BEIRENDONCK, 1998, blz. 71). VASTSTELLINGEN Bij het beschrijven van de historiek van de ACM werd reeds de M ‘ anagement Progress Study’ vermeld. Dit onderzoek in het Amerikaanse bedrijf AT&T onthulde de sterke voorspellende waarde van de techniek: na acht jaar bleek dat tussen 75% en 82% van degenen die een midden-management-positie hadden bereikt, een positieve beoordeling hadden ontvangen bij het assessment. Van de personen die dit niveau niet bereikt hadden, was dat voor 94% correct voorspeld. Deze opmerkelijke resultaten bevorderden de verspreiding van de techniek en zetten ook andere onderzoekers aan tot analyse (VAN BEIRENDONCK, 1998, blz. 71-72). De ACM komt dus als een goede voorspeller van het toekomstig functioneren naar voor. Gaugler et al. vonden in hun samenvattende studie van vijftig validiteitsonderzoeken een gemiddelde gecorrigeerde validiteit van de finale scores die 0.37 bedraagt. Een hogere validiteit wordt gevonden voor scores omtrent managementpotentieel. Bij een promotiedoelstelling bedraagt de validiteit 0.30 (HOEFT en SCHULER, 2001, blz. 115). Assessment centers zijn dus valider voor de inschatting van potentieel dan voor de voorspelling van prestaties. Schmidt en Hunter merkten in 1998 op dat de validiteit van assessment centers lager ligt dan bij andere selectiemethoden. Wanneer men steunt op de studie van Gaugler e.a. uit 1987 vindt men dat de validiteit voor AC’s 0.37 bedraagt. Schmidt en Hunter vergelijken dit getal met dat van work samples (r = 0.54), het gestructureerd interview (r = 0.51), tests van het mentaal vermogen (r = 0.51) en tests over de functiekennis (r = 0.48). Bovendien voegt de ACM in combinatie met een andere techniek weinig validiteit toe (r = 0.02), terwijl andere methoden ook hier weer beter scoren: integriteitstests (r = 0.14), work samples (r = 0.12) en gestructureerd interview (r = 0.12). Wanneer dan ook de uitvoerbaarheid en de kost van de ACM in beschouwing wordt genomen, stelt men dat de validiteit zeker niet boven een gemiddeld niveau uitkomt. Aangezien de validiteit van work samples al zo hoog ligt, stelt zich de vraag waarom de ACM dan zo laag scoort. Hoe kan een combinatie van valide instrumenten leiden tot een validiteit die niet meer bedraagt dan de validiteit van één van die instrumenten? (HOEFT en SCHULER, 2001, blz. 115). Howard merkt in dit kader op dat men niet enkel de predictieve validiteit van de diverse methoden in beschouwing moet nemen bij het overwegen van de vervanging van de ACM. Zo scoren cognitieve tests bijvoorbeeld slecht op vlak van billijkheid. Bovendien moet ook de doelstelling in het oog gehouden worden: assessment centers hebben op vlak van diagnose voor individuele ontwikkeling duidelijke voordelen ten opzichte van andere tests die kwaliteiten meten die niet ______________________________________________________________________________________________ De Mesel Katrien
61
Betrouwbaarheid en validiteit
ontplooibaar zijn of die enkel scores afleveren. Bovendien kan door een zorgvuldige opbouw de kracht van het center verhoogd worden (gemiddelden zeggen niet alles) (HOWARD, 1997, blz. 21). Lamsdale et al. onderzochten of het competentiegebaseerde sollicitatieformulier een volwaardig alternatief is voor de ACM. Zij kwamen tot de bevinding dat dit formulier grote waarde bezit op vlak van het (verantwoord) reduceren van kandidaten, maar dat het de AC’s niet kan vervangen. Het formulier zorgt ervoor dat enkel de beste kandidaten een center zullen doorlopen en zal bijgevolg de kosten reduceren (LAMSDALE et al., 1999, blz. 176). OORZAKEN Er wordt algemeen aanvaard dat de ACM een hoge voorspellende waarde heeft. Waar minder consensus over bestaat, zijn de factoren die dat veroorzaken. Velen nemen aan dat de observatie van functierelevant gedrag aan de basis ligt van de voorspellingskracht die het AC bezit. Klimoski en Brickner stelden in 1987 dat een aantal mechanismen, die niet samenhangen met de observatie, kunstmatig bijdragen tot de voorspellende kracht (FOX et al., 1995, blz. 20). Als ongewenste positieve invloeden op de validiteit onderscheiden zij: het directe besmettingseffect, de indirecte besmetting, de self-fulfilling prophecy, de consistentie van performantie en de intellectuele functionering (FOX et al., 1995, blz. 20). •
Onmiddellijke criteriumcontaminatie: De output van het AC kan de latere aanwervings- of promotiebeslissingen
over die persoon beïnvloeden en zo de voorspellingswaarde van de ACM vergroten. De literatuur vermeldt echter geen bevestiging voor deze vorm van vertekening. Ook het onderzoek van Fox e.a. (FOX et al., 1995, blz. 26) komt tot hetzelfde besluit. Er werd geen verschil gevonden in predictieve validiteit tussen besmette beslissingen (waarbij de resultaten van de deelnemers bekend zijn) en niet-besmette beslissingen (door personen die geen toegang hebben tot de informatie van het center). •
Indirecte contaminatie (subtle contamination): Deze vertekening treedt op omdat een assessor bij het beoordelen
van een kandidaat rekening houdt met wat hij nodig acht om succesvol te zijn in de onderneming. Zijn referentiekader, o.a. in verband met de cultuur van de onderneming, heeft dus een invloed op zijn beoordelingen. De assessoren vellen impliciet een oordeel over de waarden die nodig zijn voor het maken van promotie, eerder dan over de kwaliteiten die vereist zijn voor de succesvolle uitvoering van de job (VAN BEIRENDONCK, 1998, blz. 75 en FOX et al., 1995, blz. 20). •
Self-fulfilling prophecy: Wanneer de kandidaat het AC goed doorstaan heeft, leidt dit tot meer motivatie in de job.
Verondersteld dat dit de prestaties zal verhogen, veroorzaakt een hoge score dus een hoge performantie (FOX et al., 1995, blz. 20). •
Het vierde effect, de autobiografische performantieconsistentie, ontstaat wanneer assessoren hun score baseren op
de biografische gegevens van de kandidaat in plaats van te steunen op diens gedragingen. Kennis van bepaalde gegevens uit de biodata, zoals de geschiedenis van de deelnemer, zou voorspellingskracht van het AC kunnen verhogen. Fox et al. vonden echter geen bevestiging van deze hypothese (FOX et al., 1995, blz. 26). •
Evaluatie van de intelligentie van de kandidaat is een laatste aspect dat Klimoski en Brickner aanhalen ter verklaring
van de hoge voorspellende kracht van de centers. Klimoski en Brickner geloven dat de impliciete beoordeling ervan de predictieve validiteit veroorzaakt. Fox et al. moesten ook hier de veronderstelling verwerpen (FOX et al., 1995, blz. 26).
______________________________________________________________________________________________ De Mesel Katrien
62
Betrouwbaarheid en validiteit
Klimoski en Brickner zaten er dus grotendeels naast, maar welke factoren veroorzaken dan wel de predictieve validiteit? Ook Jones werd door deze vraag geïntrigeerd. Hij stelt, zich baserend op meerdere studies, dat een significant deel van de nauwkeurigheid van AC-scores voortkomt uit de beoordeling van de motivatie van de kandidaten. Door de combinatie van de relatief constante contextuele informatie en de significante observatie van gedrag in een motiefrijke situatie, kunnen assessoren een redelijk nauwkeurige inschatting maken van de beweegredenen van de assessee. De assessoren blijken bovendien in staat om te voorspellen of die motieven de kandidaat zullen leiden tot vooruitgang in de onderneming (JOINER, 1997, blz. 172-173). Joiner merkt op dat deze theorie slechts een deel van de verklaring verschaft. Ook andere aspecten zijn van belang. Joiner acht de kans zeer groot dat onze methoden te kort schieten om de complexiteit van het menselijk gedrag te vatten. Bovendien zijn onze waarnemingen nog niet 100% nauwkeurig (JOINER, 1997, blz. 176). Toekomstig onderzoek moet licht op de zaak werpen. FACTOREN Naast de oorzaken, is het ook interessant om op de hoogte te zijn van de beïnvloedende factoren van de predictieve validiteit. Gaugler e.a. stelden in 1987 reeds een aantal trends vast op dit vlak (VAN BEIRENDONCK, 1998, blz. 7374, en LIEVENS en VAN KEER, 2000, blz. 69): -Wanneer een programma een groter aantal simulaties en tests bevat, stijgt de validiteit. -Bij gebruik van verschillende assessmenttechnieken neemt de voorspellende kracht toe. -Het beoordelen van prestaties in simulaties, in plaats van competenties, levert meer valide resultaten. -De validiteit neemt toe wanneer de assessoren psychologen zijn in plaats van managers. -De duur van de assessortraining vertoont geen verband met de voorspellende kracht. -Wanneer collega’s elkaar beoordelen, ligt de validiteit hoger dan bij evaluatie door de managers. -Tot slot zijn AC’s meer valide bij evaluatie van potentieel dan bij prestatiebeoordeling. Toen bleek dat grondig onderzoek naar de invloed van de ‘opportunity to observe’ op de validiteit ontbrak (in tegenstelling tot de impact op de betrouwbaarheid), besloten Moser, Schuler en Funke (MOSER et al., 1999, blz. 133141) daar iets aan te doen. In hun studie maten Moser en collega’s de ‘kans om gedrag te observeren’ aan de hand van het aantal jaren dat de beoordelaar supervisor was van de assessee (variërend van 1 tot 30 jaar). Naarmate dit aantal jaren toenam, zagen zij een stijging van de voorspellingskracht van het center. Met het stijgend aantal observatiejaren, neemt ook de beoordelingservaring van die supervisor en de duur dat de assessee de job bekleedt, toe. Deze variabelen zouden dus ook de voorspellende waarde van het center kunnen veroorzaken. Maar zelfs wanneer de invloed van deze twee variabelen geneutraliseerd wordt, is de tendens merkbaar. Bij de in deze studie onderzochte functies (ingenieurs en toegepaste wetenschappers) was een grens waarneembaar (MOSER et al., 1999, blz. 136). Onder de twee jaren bleken de scores uit het center weinig valide (r = 0.09), in tegenstelling tot boven de grens (r = 0.50). Dit wil echter niet zeggen dat de waarnemingen op twee jaar niet minder valide zijn (r = 0.23) dan die op pakweg 4 jaar (r = 0.61). Boven de 4 jaar is geen verbetering van de predictieve kracht te zien. Uiteraard zijn deze waarden afhankelijk van de functie en bijvoorbeeld de complexiteit ervan, maar niettemin is het interessant dit even te bekijken. Toekomstig onderzoek kan misschien voor verschillende functies de grenzen vastleggen. Moser en collega’s wijzen eveneens in de richting van het bepalen van de beste maatstaf voor de opportunity to observe (MOSER et al., 1999, blz. 141).
______________________________________________________________________________________________ De Mesel Katrien
63
Betrouwbaarheid en validiteit
PRAKTIJK Jansen en Stoop gingen de predictieve validiteit na van selectiebeslissingen van graduaten in Nederland. Zij steunen op gegevens verzameld tussen 1989 en 1992 door KPN (Koninklijke PTT Nederland NV), het in 1989 geprivatiseerde Postal and Telecommunications Services. De validiteit van de verschillende selectie-instrumenten van het bedrijf werd beoordeeld aan de hand van volgende criteria: huidig salaris, gemiddelde jaarlijkse verandering van functie, performantiebeoordeling, managementpotentieel en gemiddelde jaarlijkse salarisstijging. Voor het huidige salaris werd een sterke correlatie (0.55) teruggevonden met de score uit het assessment center. De eindscore van het assessment center blijkt dus een goede voorspeller voor het salaris. Ook de gemiddelde jaarlijkse verandering van functie vertoonde een relatie met de score uit het center, maar in mindere mate. Opmerkelijk is dat de performantiebeoordeling geen verband weergaf. Hetzelfde werd vastgesteld voor managementpotentieel. Enkel ‘vastheid’, dat door KPN omschreven wordt als ‘onafhankelijk, sterk, beslissend, resistent, uithoudingsvermogen, stressbestendig’, vertoont wel deze relatie wanneer de variabele gemeten wordt in het managementinterview (JANSEN en STOOP, 1994, blz. 200-202 en 206). E. CONSTRUCTVALIDITEIT Achtereenvolgens worden besproken: de begripsomschrijving, de vaststellingen, de stromingen in de onderzoekers, de oorzaken, de bepalende factoren en adviezen. BEGRIP De constructvaliditeit, ook begripsvaliditeit genoemd, gaat na of een instrument de constructen meet die het beweert te meten. In het kader van AC’s wordt met de term constructen verwezen naar de gedragskenmerken of competenties. Anders gesteld betekent dit dat de scores een juiste indicatie moeten geven van de capaciteiten van de kandidaat. Binnen de begripsvaliditeit wordt een onderscheid gemaakt tussen convergentvaliditeit en discriminantvaliditeit. “Convergentvalidering gaat de overeenkomst in resultaten na tussen metingen van eenzelfde construct aan de hand van twee of meer methoden (DE PELSMACKER en VAN KENHOVE , 1999, blz. 31-33).” In het kader van de ACM betreft het dus de correlatie tussen de beoordelingen van eenzelfde kenmerk in verschillende situaties of simulaties. De scores van één dimensie over de verschillende oefeningen moeten gelijk(aardig) zijn. Bij een goed instrument moet de convergentvaliditeit hoog zijn. “Discriminantvalidering verwijst naar resultaten van meetinstrumenten die verschillen wanneer zij effectief verschillende karakteristieken van onderwerpen proberen te meten (DE PELSMACKER en VAN KENHOVE , 1999, blz. 31-33).” De scores van verschillende dimensies moeten verschillen. Men kan spreken over een positief resultaat wanneer de correlatie van de uitslagen van de verschillende competenties binnen één simulatie laag is. VASTSTELLINGEN VOOR DE ACM De hoge criteriumvaliditeit en validiteit op zich staan in schril contrast met de lage constructvaliditeit van de ACM. Dit betekent dat de constructen die men wenst te meten, niet worden gemeten. De scores voor eenzelfde dimensie schommelen sterk over de verschillende opdrachten (lage convergentvaliditeit). Daarbovenop komt een lage discriminantvaliditeit: de scores van verschillende dimensies in eenzelfde oefening zijn sterk gecorreleerd (LIEVENS en KLIMOSKI, 2001, blz. 263).
______________________________________________________________________________________________ De Mesel Katrien
64
Betrouwbaarheid en validiteit
Vooral voor een center met een ontwikkelingsdoelstelling is het gebrek aan constructvaliditeit een doorn in het oog. Bij een beslissing over selectie of promotie is vooral de globale score van belang. Wanneer men daarentegen aanbevelingen wil doen omtrent ontwikkelingsnoden, zijn de dimensiescores en de correctheid ervan cruciaal. In dit kader is onderzoek naar de constructvaliditeit en bepalende factoren dan ook uiterst belangrijk (THORNTON et al., 1997, blz.110). Op basis van de bevindingen suggereren onderzoekers dat AC’s factoren van een bepaalde situatie (oefeningen) meten in plaats van de factoren van traits (dimensies). Indien dit waar is, is het geven van feedback op basis van dimensies misleidend en schadelijk: de assessee krijgt de boodschap dat de gehele competentie bijgeschaafd moet worden, terwijl deze slechts in een bepaalde situatie onvoldoende is. Misschien moet overgestapt worden naar feedback per oefening of situatie (KUDISCH et al., 1997, blz. 130). Als het van Kudisch et al. afhangt, zal het echter niet zo’n vaart lopen. Uit hun studie van 1997 blijken assessoren de informatie zowel volgens dimensies als volgens oefeningen te organiseren. Zij opperen dat feedback zich bijgevolg op zowel de dimensies als de oefeningen kan toespitsen. De wetenschappers merken op dat onderzoek de impact van de verschillende soorten feedback moet nagaan. Zij konden slechts één studie rond dit onderwerp terugvinden (Thornton, Kaman, Layer en Larsh, 1995). Voor diverse variabelen bleek het feedbackformaat van geen belang. Bij feedback rond oefeningen kon een hogere aanpassing van het gedrag worden vastgesteld. Verder onderzoek is aangewezen (KUDISCH et al., 1997, blz. 129 en 136-137). Een tweede argument van Kudisch en collega’s is dat de cross-situationele consistentie hoger ligt wanneer de dimensies meer observeerbaar zijn: mondelinge en schriftelijke communicatie leveren een betere convergentvaliditeit op, terwijl moeilijk waarneembare dimensies, zoals analyse en oordeelsvorming, de laagste validiteit opleveren. Verder onderzoek moet het nut van deze denkpiste nagaan (KUDISCH et al., 1997, blz. 136-137). Terwijl aan de studies naar de constructvaliditeit voor assessment centers in de strikte zin, geen einde lijkt te komen, blijken development centers vergeten te zijn. Slechts weinigen gingen na of wat geldt voor AC’s ook op DC’s van toepassing is. De vaststellingen in deze studies bleken alvast gelijkaardig (KUDISCH et al., 1997, blz. 131). Winfred et al. baseren zich op de ‘unitarian conceptualization of validity’ om het gebrek van de constructvaliditeit, bij aanwezigheid van inhouds- en criteriumvaliditeit, een paradox te noemen. Deze theorie stelt immers dat deze variabelen drie verschillende strategieën zijn om de constructvaliditeit van een test of maatstaf uit te drukken. Wanneer bijgevolg bewijs wordt gevonden van de inhouds- en criteriumvaliditeit, zou ook ondersteuning moeten aangetroffen worden voor de constructvaliditeit. Het feit dat onderzoek het bestaan ervan niet kan bevestigen, is in strijd met de unitarische visie op validiteit (WINFRED et al., 2000, blz. 813). Chan (CHAN, 1996, blz. 167-168) merkt op dat in de meeste studies construct- en criteriumvaliditeit niet samen gemeten worden. Bijgevolg kan volgende hypothese dienen als verklaring van een hoge voorspellingswaarde gekoppeld aan een lage constructvaliditeit: studies die een hoge criteriumvaliditeit terugvonden, waren gebaseerd op goed ontwikkelde centers, die bijgevolg ook een hoge constructvaliditeit hebben (maar dat werd niet gemeten), terwijl een lage voorspellingskracht samengaat met een lage constructvaliditeit. Om na te gaan of deze stelling strookt met de waarheid, bepaalde Chan beide validiteiten in een center. Hij vond dat de voorspellende kracht van het center gepaard ging met een gebrek aan constructvaliditeit. Volgens de unitarische validiteitstheorie moet, gezien de voorspellingskracht (voor potentieel), het center ook constructvalide zijn. Het is
______________________________________________________________________________________________ De Mesel Katrien
65
Betrouwbaarheid en validiteit
volgens Chan dan ook dringend tijd dat bepaald wordt wélke constructen gemeten worden (CHAN, 1996, blz. 168 en 174). Chan doet een suggestie voor verder onderzoek naar de constructen. Aangezien assessment centers (enkel) goede voorspellers zijn voor toekomstige performantie en minder voor de performantie in de huidige functie, gelooft Chan dat de assessors het construct van ‘toekomstige promotie’ beoordelen. Twee theorieën bieden verklaring: de consistenteperformantie-theorie en de ‘subtle criterion contamination’-verklaring (CHAN, 1996, blz. 175). •
De consistente-performantie-theorie stelt dat assessoren het gedrag van de kandidaten beoordelen in termen van rollen en
performantievereisten voor de doelfunctie, in tegenstelling tot de evaluatie van dimensies. •
De ‘subtle criterion contamination’-verklaring houdt in dat de assessoren de karakteristieken beoordelen die een persoon
nodig heeft om hogerop te geraken in de onderneming. De beoordelaars houden het promotiebeleid in hun achterhoofd bij het maken van evaluaties. Dit beleid kan al dan niet gebaseerd zijn op performantie in de functie. Vervolgens maakt Chan het onderscheid tussen ‘in-role’-gedragingen (m.b.t. de functieperformantie) en ‘extra-role’-gedragingen (de meer contextuele performantie: collega’s helpen, samenwerken,…). Promotiebeslissingen zullen hoogstwaarschijnlijk steunen op beide gedragingen. Beoordelingsinstrumenten daarentegen, worden meestal opgesteld vanuit een functieanalyse, die enkel ‘in-role’-gedrag bevat. Wanneer assessoren in een assessment center echter de promotievereisten beoordelen, komt een mogelijke oorzaak van de lage constructvaliditeit boven. Misschien zal door ‘extra-role’-gedragingen op te nemen in de centeroefeningen, de constructvaliditeit stijgen (CHAN, 1996, blz. 176). Toekomstig onderzoek moet de zoektocht naar de echte constructen van AC’s aan het licht brengen. Terwijl deze onderzoekers op zoek zijn naar de constructen die de centers meten, leggen Winfred et al. zich niet neer bij de lage constructvaliditeit. Vanuit de ‘unitarian conceptualization of validity’, trachtten Winfred et al. in hun studie om de constructvaliditeit van AC’s alsnog te bewijzen. Zij slaagden in hun opzet. Zij gebruikten de ‘generalizability theory’ om aan te tonen dat grote delen van de variantie samenhangen met ‘person effects’ (gelijklopendheid van de scores van individuen over de oefeningen en dimensies), ‘dimension effects’ en ‘person by dimension effects’ (mate waarin de performantie van een individu verschilt over de dimensies), terwijl kleine componenten van de variantie verbonden zijn met ‘rater effects’ (variantie toewijsbaar aan de assessoren), ‘exercise effects’, ‘person by exercise effects’ (mate waarin het gedrag van een individu verschilt over de oefeningen) en ‘dimension by exercise effects’ (mate waarin de dimensie verschillend vertegenwoordigd zijn in de oefeningen). Daaruit konden zij besluiten dat degelijk opgebouwde centers wel constructvaliditeit bezitten (WINFRED et al., 2000, blz. 813 en 817-818). Wanneer andere studies deze bevindingen kunnen bevestigen, zal een groot struikelblok dat aan de ACM geketend hangt, overwonnen zijn.
______________________________________________________________________________________________ De Mesel Katrien
66
Betrouwbaarheid en validiteit
STROMINGEN BIJ DE ONDERZOEKERS De lage constructvaliditeit vormt een gebrek van de ACM. Als gevolg hiervan zijn er drie stromingen ontstaan bij onderzoekers: zij die de methode blijven steunen, zij die ze verwerpen en zij die sleutelen om het tekort op te heffen. 1. Aanhangers Een eerste groep blijft aanhanger van de methode en stelt dat de constructvaliditeit volgt uit de vooraf uitgevoerde functieanalyse. Bovendien wordt verwezen naar de hoge voorspellingskracht van het AC (BRAL, 2000, blz. 112). 2. Dimensies vervangen Er worden drie hervormingen besproken: bij de eerste worden de dimensies vervangen door taken en bij de tweede door vaardigheden. De derde hervorming pleit voor de overgang van de ‘sample’- naar de ‘sign’-benadering. •
Tegenover de aanhangers staan de wetenschappers die de procedure verwerpen, waaronder Jansen. Zij stellen voor
om de klassieke dimensies te vervangen door situaties of taken (gesprek met een medewerker, opstellen van een planning,…). Op die manier bekomt men het zogenaamde ‘situatieve AC’ (BRAL, 2000, blz. 112) of ‘takenspecifiek assessment center’ (LOWRY, 1997, blz. 53). Het takenspecifiek center meet de performantie in work-sample-oefeningen die nauw verbonden zijn met de functie. De functieanalyse die uitgevoerd wordt voor de ontwikkeling van het center zal volgende gegevens opleveren: taken in de functie in volgorde van belangrijkheid, de frequentie van de taak en de noodzaak om deze reeds goed te vervullen bij intrede in de functie. De functieanalyse heeft dus de vorm van een taakanalyse. Voor elke taak zal een lijst opgesteld worden met de vereiste acties voor de succesvolle uitvoering van de opdracht. In tegenstelling tot dimensiespecifieke centers is het dus niet nodig om de vereiste kennis en vaardigheden voor de functie te detecteren (LOWRY, 1997, blz. 53-54). Het succes van het takenspecifieke center staat of valt met de relevantie van de work samples. Bij de ontwikkeling van het center is het dan ook onontbeerlijk dat personen die de functie als hun broekzak kennen, meewerken (LOWRY, 1997, blz. 54). Terwijl de selectiecriteria voor assessoren niet verschillen met het dimensiegeoriënteerde center, verschilt de inhoud van de training voor assessoren wel. De beoordelaars zullen niet langer de dimensies en hun inhoud leren, maar wel de regels en procedures van de organisatie, de inhoud van de oefeningen en de beoordelingsprocedures. Bovendien zullen de opdrachten herhaaldelijk geoefend worden. Terwijl in het dimensiespecifieke center de focus op de dimensies ligt, verschuift de aandacht hier naar de oefeningen (LOWRY, 1997, blz. 55). Het beoordelingsproces (observeren, registreren, classificeren naar dimensies en beoordelen) blijft grotendeels behouden. Enkel het classificeren kan achterwege gelaten worden. Tijdens het beoordelen staat een checklist ter beschikking van de assessoren. De assessor zal elk van de items beoordelen en een eindevaluatie maken in functie van de effectiviteit van het vertoonde gedrag (LOWRY, 1997, blz. 56). Via deze aanpak worden de problemen die gepaard gaan met het dimensioneel AC van de baan geholpen. Een ander pluspunt is dat de assessoren zich meer specifieke gedragingen kunnen herinneren. Ook blijkt feedback op basis van taken aanleiding te geven tot ontwikkeling van een grotere omvang. Na verloop van tijd blijken de assessoren meer specifieke en meer originele feedback te geven (HOWARD, 1997, blz. 31). Er zijn echter ook minder positieve aspecten: beoordeling op basis van de taken heeft als nadeel dat voor elke situatie een oefening opgesteld moet worden. Het beschrijven van mensen op basis van taken is een onnatuurlijke manier en de ______________________________________________________________________________________________ De Mesel Katrien
67
Betrouwbaarheid en validiteit
taken leveren ook een minder betekenisvolle feedback (HOWARD, 1997, blz. 31). Lowry vermeldt bovendien dat in deze benadering geen beroep kan worden gedaan op standaardoefeningen. De oefeningen moeten specifiek voor die functie in die bepaalde onderneming opgesteld worden en dit vraagt heel wat voorbereidingstijd (LOWRY, 1997, blz. 57). Ook Jack Zaal nuanceert het nut van het vervangen van dimensies door situaties: “Net zoals voor de stelling dat managementcompetenties niet éénvoudig opgevat kunnen worden als algemene competenties die generaliseerbaar zijn over uiteenlopende situaties, lijkt evenmin voldoende steun gevonden te worden voor de opvatting dat managementvaardigheden volledig samenvallen met de opdrachten (VAN BEIRENDONCK, 1998, blz. 77).” Er bestaan wel degelijk variabelen die sterk correleren over verschillende situaties heen. Voorbeelden zijn overtuigingskracht, sociabiliteit, flexibel gedrag, klantgerichtheid, luisteren en samenwerken, ook durf en initiatief. Daartegenover staan variabelen die per oefening sterk correleren, zoals sensitiviteit, luisteren en klantgerichtheid; durf en delegeren; en probleemanalyse en luisteren (VAN BEIRENDONCK, 1998, blz. 77). •
Andere wetenschappers, waaronder Sacket en Dreher, stellen een andere hervorming voor: geen globale dimensies
beschouwen, maar zich richten op vaardigheden die nodig zijn bij het vervullen van managementrollen die belangrijk zijn in die functie. Managementrollen verwijzen naar clusters van gedragscompetenties. De Bruyne neemt de managementrollen
van
Quinn
als
vervangingsmiddel
voor
de
competenties.
Hij
neemt
de
dertien
ontwikkelingscomponenten van de managementjob volgens Ohlott als basis bij het ontwikkelen van de oefeningen in het center. De Bruyne suggereert dat de onderliggende gedragsdimensies van elk van deze managementrollen gebruikt kunnen worden als leidraad in de beoordeling, feedback en de ontwikkeling van de manager in kwestie. Hierdoor wordt het contact met de klassieke competentiegerichte benadering van AC’s gegarandeerd (VAN BEIRENDONCK, 1998, blz. 78-79). Hoeft en Schuler erkennen dat bij de vervanging van de dimensies door de vaardigheden er een probleem ontstaat: met de dimensies gaan ook de voordelen die eraan verbonden zijn verloren. Bovendien worden voorspellingen omtrent de toekomstige ontwikkeling van een deelnemer moeilijk (HOEFT en SCHULER, 2001, blz. 122) •
Een derde hervormingsoptie is gebaseerd op het onderscheid tussen ‘sample’ en ‘sign’. Hoeft en Schuler wijzen op
de mogelijkheid om de momenteel gebruikte dimensies te vervangen door de traits. Bijgevolg zal men niet langer ‘planning en organisatie’ of ‘communicatievaardigheden’ evalueren, maar eerder ‘algemene intelligentie’ en ‘extraversie’. Van deze traits is het immers meermaals bewezen dat ze constructvalide zijn en eventuele tekorten kunnen uitgesloten worden (HOEFT en SCHULER, 2001, blz. 122). 3. Oorzaken achterhalen Een derde groep wetenschappers tracht de oorzaken van het gebrek aan constructvaliditeit te achterhalen. Dit laat toe acties te ondernemen om de constructvaliditeit te verhogen. In de volgende onderdelen wordt een overzicht gegeven van de oorzaken en de bepalende factoren van de constructvaliditeit. Er worden ook een aantal aandachtspunten geformuleerd. OORZAKEN Douglas Bray, die aan de wieg stond van het eerste management assessment center, vertelt dat er in het begin niet verondersteld werd dat elke oefening een nauwkeurig beeld geeft over elke dimensie. De oefeningen vertegenwoordigen een bepaald domein van de functie en bijgevolg zullen de dimensies in een oefening gelijkaardig zijn. Bovendien zal een ______________________________________________________________________________________________ De Mesel Katrien
68
Betrouwbaarheid en validiteit
dimensie die in meerdere opdrachten getest wordt vaak een andere connotatie hebben, wat de discriminantvaliditeit verlaagt. Deze theorie zal echter slechts een deel van de lage constructvaliditeit verantwoorden (HOWARD, 1997, blz. 26). Het is dan ook ten zeerste de vraag wat nog aan de basis ligt van de lage constructvaliditeit: fouten in de beoordelingen van de assessoren, werkelijke verschillen in de performantie van kandidaten, de aard van de dimensies, het ontbreken van een strakke evaluatie of de gebruikte statistische methoden. •
Fouten in de beoordelingen van de assessoren bestaan omdat de beoordelaars nooit 100% objectief zijn.
Bovendien zullen andere interpretaties van de dimensies en andere vertalingen van de gedragingen naar de competenties ook een rol spelen. Tot slot zal de beperkte verwerkingscapaciteit van een assessor resulteren in fouten. Dit laatste wordt bevestigd door het ‘limited capacity’-model en het expertmodel, zoals beschreven in het hoofdstuk ‘Beoordelingsproces’ bij de scoringsprocessen (BRAL, 2000, blz. 112 en LIEVENS en KLIMOSKI, 2001, blz. 265). •
Andere wetenschappers geloven dat de assessor geen schuld treft voor de lage convergent- en discriminantvaliditeit.
Zij geloven in het bestaan van zogenaamde oefeningeffecten (exercise effects): de performantie van kandidaten verschilt in verschillende situaties en oefeningen. Twee studies die de rivaliserende standpunten onderzochten, vonden bevestiging voor de oefeningeffecten. Het zijn de kandidaten en niet de assessoren die de constructvaliditeit bepalen en dat is een positief teken (LIEVENS en KLIMOSKI, 2001, blz. 265). •
Lievens en Klimoski argumenteren dat dimensies die eenvoudig te onderscheiden zijn, een hogere
constructverbondenheid dragen dan dimensies waarbij een intern proces nodig is bij de observatie. Maar deze stelling staat ter discussie. Andere wetenschappers stelden immers geen verschillen vast: moeilijk te observeren dimensies leidden tot eenzelfde niveau van constructvaliditeit dan hun makkelijke tegenhangers (LIEVENS en KLIMOSKI, 2001, blz. 254-255). •
Niet elke oefening zal evenveel gedragingen uitlokken met betrekking tot een bepaalde dimensie. In bepaalde
oefeningen krijgt de assessor meer mogelijkheden om relevant gedrag te observeren (opportunity to observe) dan in andere opdrachten (WINFRED et al., 2000, blz. 814). Wanneer in een oefening weinig gedrag gesteld wordt in verband met een dimensie, dan is dit gedrag niet voldoende representatief voor het gedrag van de assessee en zal de dimensie dus niet consistent gemeten worden. Wetenschappelijke studies leveren voor deze hypothese gemengde besluiten. Reilly, Henry en Smither (1990) vonden ondersteuning: zij besloten dat de correlatie tussen het geobserveerde gedrag en de scores tot op zekere hoogte functie was van het aantal gedragsitems op de checklist. Boven de grens van twaalf items bleef de relatie stabiel. Campbell (1991) kon de hypothese niet bevestigen (LIEVENS en KLIMOSKI, 2001, blz. 254). •
Kuptsch en Kleinmann stelden in hun onderzoek vast dat de scores van personen die beweren gelijkaardig te
handelen in verschillende situaties minder constructvalide waren dan de scores van personen die zeggen dat ze hun gedrag aanpassen aan de omstandigheden. Aan de basis van deze bevindingen ligt het feit dat de observatoren het gedrag van een kandidaat niet strak evalueren, maar de geschiktheid ervan beoordelen afhankelijk van de situatie. Pas wanneer een assessee zijn gedrag aanpast aan de omstandigheden zal de assessor hem/haar consistent beoordelen. Deze bevindingen impliceren dat een nieuwe conceptualisering van de dimensies in assessment centers kan leiden tot meer convergentvaliditeit voor de procedure (KUPTSCH en KLEINMANN, 1998, blz. 103 en 113).
______________________________________________________________________________________________ De Mesel Katrien
69
Betrouwbaarheid en validiteit
•
Een andere verklaring steunt op de statistische methoden die gebruikt zijn bij het evalueren van de gegevens.
Kleinmann en Köller geloven dat de werkelijke constructvaliditeit veel hoger ligt, maar dat de in het verleden gebruikte methodes (zoals het MTMM-paradigma van Campbell en Fiske) de waarde onderschat hebben. Betere statistieke technieken en verfijnde constructieprincipes zullen de constructvaliditeit van de ACM verbeteren (KLEINMANN en KOLLER, 1997, blz. 75). Ook Howard doet factoranalyse en de multitrait multimethod-methode af als ongeschikt. Beide methoden vereisen within-exercise dimensiescores (beoordeling van elke dimensie in elke oefening). Bovendien beschouwen ze de dimensiescores uit de verschillende oefeningen als evenwaardig. Dit is in strijd met de eigenlijke werkwijze van een center waarbij in een einddiscussie afweging wordt gemaakt van de verschillende vaststellingen rond een bepaalde dimensie. Soms is de score zelfs gebaseerd op één doorslaggevende observatie die de acties uit de andere opdrachten onbeduidend maakt (HOWARD, 1997, blz. 29). BEPALENDE FACTOREN Naast het formuleren van verklarende theorieën, hebben onderzoekers variabelen gemodificeerd om hun impact op te sporen en zo na te gaan wat de lage constructvaliditeit drijft. Lievens (LIEVENS, 1998a, blz. 141-152) heeft een samenvatting opgemaakt van 21 studies hieromtrent. Hij ordent de variabelen in vijf categorieën: dimensies, assessorkenmerken, situational exercices (factoren i.v.m. oefeningen), observatie- en evaluatieprocedures en integratie van de resultaten. Vele van de variabelen bieden kansen tot verbetering van de constructvaliditeit. 1)
Dimensies
Bij de dimensies werden volgende factoren onderzocht: het aantal, de onderlinge afhankelijkheid en de aard. •
Zich baserend op Gaugler en Thornton, besluit Lievens dat beperking van de hoeveelheid dimensies de
convergent-, maar niet de discriminantvaliditeit, verhoogt. Assessoren zijn in staat convergentvalide en nauwkeurige beoordelingen te geven bij drie criteria. Bij zes of negen criteria is dit niet mogelijk. Dit besluit biedt ondersteuning voor de hypothese van de beperkte verwerkingscapaciteit van assessoren. Het beperken van het aantal dimensies is de boodschap, voornamelijk bij AC’s met een selectiedoelstelling (LIEVENS, 1998a, blz. 143). Kleinmann en Köller stellen voor om de dimensies over de assessoren te verdelen, wanneer in een oefening meer dan drie of vier competenties beoordeeld moeten worden (KLEINMANN en KOLLER, 1997, blz. 74). •
Terwijl reductie van het aantal dimensies enkel de convergentvaliditeit verhoogt, melden Kleinmann et al. dat de
discriminantvaliditeit toeneemt wanneer conceptueel onafhankelijke dimensies gebruikt worden. Criteria rond eenzelfde thema leiden tot onderling afhankelijke scores (LIEVENS, 1998a, blz. 143). •
Traditionele en taakgerichte dimensies resulteren in eenzelfde niveau van constructvaliditeit. De aard van de
dimensie maakt dus niet veel uit (LIEVENS, 1998a, blz. 143). 2)
Assessoren
De invloed van de karakteristieken van assessoren en de training die ze ondergaan, werd ook onderzocht. •
Bij vergelijking van managementassessoren en psychologen, komen de laatsten er als beste uit. Sagie en Magnezy
concludeerden dat bij psychologen alle dimensies weerspiegeld werden in de toegekende score (hoge constructvaliditeit), terwijl de scores van de managers gebaseerd waren op twee dimensies: performantievaardigheden en interpersoonlijke vaardigheden (SAGIE en MAGNEZY, 1997, blz. 103). De psychologen moeten bijgevolg een kernrol krijgen in een assessorenteam aangezien dit de constructvaliditeit fors verbetert. ______________________________________________________________________________________________ De Mesel Katrien
70
Betrouwbaarheid en validiteit
•
De lengte van de training, noch een regelmatige opfrissing van het geleerde bleken een positieve invloed te hebben.
•
Bij vergelijking van de verschillende trainingstypes blijkt de ‘frame-of-reference’-training een meerwaarde te hebben
ten opzichte van drie andere opleidingsvormen. Deze training slaagt er het meest in de nauwkeurigheid te verhogen. Bovendien leidt de vorm tot een hogere dimensionele nauwkeurigheid door het creëren van consistente schema’s bij het indelen in categorieën. Aangezien deze twee maatstaven van nauwkeurigheid nauw aansluiten bij constructvaliditeit, blijkt het belang van deze trainingsvorm (LIEVENS, 1998a, blz. 143-144). Lievens merkt hier toch op dat meer onderzoek naar de effecten van assessorenkenmerken en de selectiemethode voor assessoren nodig is. 3)
Oefeningen
De inhoud, de rollenspelers, de vorm, de instructies aan de kandidaten en het niveau van standaardisatie van assessment center-oefeningen beïnvloeden de kwaliteit van de scores. •
Inhoud: Bij het opstellen van het AC streeft men ernaar taken van de functie te testen. Dit leidt tot de
jobgebondenheid en de voorspellingskracht van het AC. Dit zorgt er anderzijds voor dat de kandidaten zeer verschillende oefeningen doorlopen. Schneider en Schmitt stelden en bewezen dat dit de inconsistente performantie over de oefeningen heen verklaart. De ontwerper staat dus voor een dilemma: een groot aantal opdrachten die de vele taken van een functie testen of een kleiner aantal oefeningen die niet alles testen, maar die veel relevante gedragingen uitlokken (LIEVENS, 1998a, blz. 144). Highhouse en Harris stelden een relatie tussen inhoud van de oefening en consistentie in de scores van de kandidaten vast. Wanneer assessoren vonden dat opdrachten een gelijkaardige inhoud hadden, zijn de scores gecorreleerd. Anderzijds verschillen scores sterk wanneer de assessoren geen verband zien in de inhoud van de opdrachten. Deze relatie werd slechts tussen een beperkt aantal oefeningen teruggevonden (LIEVENS en KLIMOSKI, 2001, blz. 256). •
Hoewel rollenspelers ‘slechts’ figuranten zijn, is hun invloed niet te onderschatten. Wanneer ze hun rol actief
vervullen, leveren ze een belangrijke bijdrage in de vorm van een hogere convergent- én discriminantvaliditeit. De rollenspelers moeten dus gestimuleerd worden om dimensierelevant gedrag uit te lokken. •
Onderzoek naar de vorm van de oefeningen was een schot in de roos. De opdrachtsoort (rollenspel, discussie,…)
komt als zeer belangrijke oorzaak van het gebrek aan constructvaliditeit naar voor en verklaart 16% van de afwijkingen in de scores (LIEVENS en KLIMOSKI, 2001, blz. 256). •
De instructies die kandidaten krijgen, bevatten uitleg over de opdrachten, de tijdsindeling,… , maar kunnen ook
uitgebreid worden met de dimensies die worden geëvalueerd in het center. De kandidaten krijgen dan eveneens te horen welk gedrag gewenst is per dimensie. Bijgevolg (veronderstelt men) gaan de kandidaten zich daarnaar richten en krijgen de assessoren gedragingen te zien die gemakkelijker toe te wijzen zijn aan een dimensie. Dit komt de kwaliteit van de scores ten goede: tussen oefeningen verhoogt de consistentie, binnen een oefening lopen de scores meer uiteen. Het bekendmaken van de dimensies wordt dan ook warm aanbevolen (LIEVENS, 1998a, blz. 144). Ook Kleinmann en Köller geloven dat de bekendmaking van de dimensies tegenover de kandidaten een meerwaarde inhoudt. Zij verwerpen de bedenking die anderen maken: de kandidaten zullen op basis van de geformuleerde vereisten een rol spelen die niet aansluit bij hun werkelijke vaardigheden. Kleinmann en Köller argumenteren dat de kandidaat het acteren moet opgeven op het punt dat het maximale kunnen is bereikt en dat het juist deze topprestaties zijn die het AC wil achterhalen (KLEINMANN en KOLLER, 1997, blz. 74). Er zijn echter ook nadelen verbonden aan het bekendmaken van de dimensies. Een eerste minpunt is dat de ‘criterionrelated validity’ lager is. Verder blijken dimensiescores in ‘a situational exercise’ minder gelijklopend met ‘personality
______________________________________________________________________________________________ De Mesel Katrien
71
Betrouwbaarheid en validiteit
inventory scores’. Ook de correlatie tussen dimensiescores en de zelfgerapporteerde performantie een jaar later, bleek lager (LIEVENS en KLIMOSKI, 2001, blz. 256). De invloed van de transparantie op de predictieve validiteit is nog onduidelijk. Onderzoek moet hier licht op de zaak werpen. Wanneer daaruit blijkt dat de voorspellingskracht hetzelfde niveau behoudt of verbetert, mag er geen twijfel bestaan en moet de transparantie van de dimensies als norm opgelegd worden. Bij een afname staat men echter voor een dilemma: verkiest men een AC met een hogere predictieve- of een met een hogere constructvaliditeit (KLEINMANN en KOLLER, 1997, blz. 75). Samengevat kan de constructvaliditeit verhoogd worden door onbedoelde oefeningvariantie te beperken en door de assessees meer kansen te geven om dimensiegebonden gedrag te stellen. Dit laatste kan via getrainde rollenspelers, die actief gedrag uitlokken, en door de beoordeelde dimensies bekend te maken (LIEVENS, 1998a, blz. 145). Verder onderzoek naar de invloed van oefeningfactoren is aan te raden. 4)
Observatie- en evaluatieprocedures
Op vlak van observatie- en evaluatieprocedures, werd de invloed van de gebruikte schaal, het scoringsformaat, de evaluatieprocedures, de rotatie van de assessoren, en van videotaping nagegaan. •
Bij de keuze tussen een algemene schaal of een specifieke schaal per oefening kiezen ontwerpers ervoor
eenzelfde schaal te gebruiken voor het hele AC. Onderzoek bevestigt dat dit de verwerkingslast bij de assessoren vermindert en zo bijdraagt tot een hogere constructvaliditeit (AHMED et al., 1997, blz. 65). •
Instrumenten bij het scoren, zoals behavioral checklists en grafische scoringsschalen, maken het beoordelen
minder moeilijk. Bij de behavioral checklist bijvoorbeeld zal de assessor verlost worden van het indelen van gedrag naar dimensies. De relevante gedragingen voor elke oefening zijn immers per dimensie opgesomd (LIEVENS, 1998a, blz. 145). De studies leverden gemengde resultaten over de impact van checklists op de constructvaliditeit: terwijl Reilly, Henry en Smither in 1990 een hogere convergent- en (in mindere mate) discriminantvaliditeit ontdekten, stelden anderen 5 geen verschillen vast of slechts in één van de validiteiten (LIEVENS en KLIMOSKI, 2001, blz. 257). Ook Hennessy en collega’s (HENNESSY et al., 1998, blz. 224-230) vonden geen verschillen in de correlaties tussen dimensies in eenzelfde oefening bij drie verschillende observatiemethoden (traditionele methode, behavioural checklist en behavioural coding). Natuurlijk wenste men de oorzaken van deze gemengde onderzoeksresultaten te achterhalen. Meerdere verklaringen schuiven naar voor: andere ontwerpmethoden, de ordening van de items en het aantal gedragsvoorbeelden (LIEVENS, 1998a, blz. 145). §
Een mogelijke aanleiding zijn de diverse ontwerpmethoden van de behavioral checklists in de studies. Meestal
gebeurt de ontwikkeling via een vertalingsproces: uit de functie worden door experts (SME’s: subject master experts) een aantal gedragingen gehaald. Deze worden besproken en enkel bij goedkeuring door de experts aan de checklist toegevoegd. Andere wetenschappers, waaronder Donahue en collega’s, opteren ervoor deze schifting achterwege te laten omdat zij geloven dat de inhoudsvaliditeit en de face-validiteit op die manier toenemen. Omwille van dezelfde redenen wordt het vertalingsproces soms ook bij het opstellen van gedragsgeankerde schalen achterwege gelaten (DONAHUE et
Sweeney (1976), Louiselle (1986), Campbell (1986), Brannick et al. (1989), Harris et al. (1993), Schneider en Schmitt (1993) en Donahue et al. (1997) 5
______________________________________________________________________________________________ De Mesel Katrien
72
Betrouwbaarheid en validiteit
al., 1997, blz. 88). Een alternatief wordt geboden door Hauenstein en Foti: zij pleiten voor een soepeler vertalingscriterium (50-60% van de experts akkoord, in plaats van 80%) en voor het toekennen van niet-goedgekeurde gedragingen aan een aparte klasse. Verder onderzoek moet de waarde van deze suggestie uitwijzen (DONAHUE et al., 1997, blz. 99). Donahue et al. gingen de constructvaliditeit van een niet-vertaalde checklist en van een grafische beoordelingsschaal na en vergeleken hun resultaten met de literatuur. De checklist behaalde een hogere discriminantvaliditeit dan de grafische schaal (heterotrait-monomethod correlatie: .39 resp. .61). Daarenboven lag de discriminantvaliditeit van de checklist hoger dan bij vroeger onderzoek. De lagere cognitieve belasting op de beoordelaar kan aan de basis liggen daarvan. De convergentvaliditeit lag voor beide beoordelingsschalen laag, waarbij de checklist bovendien zwakker scoorde dan de grafische schaal. De waarde ligt ook lager dan de studie van Reilly et al. (1990). Verklaringen hiervoor kunnen liggen in het vertalingsproces, in de ervaring van de assessoren of in de gelijkaardige oefeningen in de studie van Reilly en collega’s (DONAHUE et al., 1997, blz. 97): -Misschien worden in het vertalingsproces gedragingen uitgesloten die geen indicatie geven van een dimensie, of die overlappen, of meerdere dimensies bevatten. Misschien zijn de geschrapte gedragsvoorbeelden te specifiek voor een oefening en zal het weglaten ervan de convergentvaliditeit verhogen. Donahue et al. werpen tegen dat op deze manier oversimplificatie kan ontstaan en de functie-inhoud daalt (DONAHUE et al., 1997, blz. 98). -De mogelijkheid bestaat dat de assessoren van Reilly et al. meer ervaring op zak hadden. Deze personen werden bovendien betrokken bij het opstellen van de schaal en dit zou, via het verhogen van het begrijpen van de dimensies, bijdragen tot een hogere convergentvaliditeit. -Tot slot gebruikte Reilly in zijn onderzoek twee dezelfde oefeningen, waarvan enkel de inhoud werd veranderd. Meerdere studies hebben aangewezen dat bij gelijke oefeningen de convergentvaliditeit hoger ligt (DONAHUE et al., 1997, blz. 98). §
Bij nader inzicht werd duidelijk dat de discriminantvaliditeit enkel toeneemt in het geval dat de items van de
checklist geordend worden in natuurlijke clusters. Bij willekeurig gerangschikte items werd geen verbetering vastgesteld (LIEVENS en KLIMOSKI, 2001, blz. 257). §
Een laatste factor is het aantal gedragsvoorbeelden op de checklist. Meerdere onderzoekers (Hauenstein, Reilly,
Henry, Smither, Lebreton,…) pleiten voor het beperken van het aantal statements per dimensie. Het optimale aantal lijkt tussen zes en twaalf te liggen (LIEVENS en KLIMOSKI, 2001, blz. 257). Meer items doen de constructvaliditeit niet toenemen. Het limiteren van de hoeveelheid dimensies én bijhorende items zou tot meer predictieve en constructvaliditeit leiden (LIEVENS en KLIMOSKI, 2001, blz. 257). Enkel de kernelementen moeten dus in de checklist opgenomen worden (LIEVENS, 1998a, blz. 145). •
Er zijn twee evaluatieprocedures te onderscheiden: de traditionele rapporteringsmethode voor gedrag (behavior
reporting method) en de ‘within-exercise method’. De werkwijze bij de ‘within-exercise’-methode bestaat eruit dat na elke oefening de kandidaten een score krijgen voor elke dimensie. Bij de ‘behavior reporting method’, wordt er pas een score toegekend na het afronden van alle opdrachten. De observaties (niet de score) rond een bepaalde dimensie worden in de groep gegooid en besproken. Pas na deze discussie zal elke assessor een score toekennen aan elke dimensie (THORNTON et al, 1997, blz. 111).
______________________________________________________________________________________________ De Mesel Katrien
73
Betrouwbaarheid en validiteit
Silverman et al. (1986) vermelden als voordeel van de ‘within-exercise method’ dat de assessoren de informatie zullen verwerken in kader van de oefeningen (LIEVENS , 1998a, blz. 145). Een nadeel van deze methode kan zijn dat het de assessoren aanzet tot het denken in kader van de globale performantie in de oefening: de kans bestaat dat de observatoren hun algemene indruk over de performantie zullen weergeven in de scores van de dimensies (THORNTON et al, 1997, blz. 111). Vele onderzoeken naar de constructvaliditeit blijken de ‘within-exercise’-methode te hanteren. Zij bekwamen, zoals reeds vermeld, een gemiddeld niveau van convergentvaliditeit en een lage discriminantvaliditeit. Thornton en collega’s steunden in hun studie op de ‘behavioral reporting’-methode en gingen de validiteit na door de scores van het center te vergelijken met de scores uit andere meetinstrumenten. Er werd, net als in studies die de ‘behavioral reporting’-methode gebruikten, bewijs gevonden voor constructvaliditeit van de globale dimensiescores, in tegenstelling tot de studies die op de ‘within-exercise’-methode steunen (THORNTON et al, 1997, blz. 110-112 en 120). •
Het rotatieschema van assessoren heeft een impact op de kwaliteit van de scores.
Omdat niet steeds dezelfde assessor de kandidaat beoordeelt over de verschillende opdrachten, kan er een afwijking in de score bestaan omdat de beoordelaars niet perfect identiek evalueren. Zelfs bij eenzelfde performantie in de verschillende testen, zal de kandidaat dus andere scores krijgen (LIEVENS en KLIMOSKI, 2001, blz. 258). Andres en Kleinmann hebben een rotatieschema ontworpen dat inconsistenties, veroorzaakt door de beoordelaars, minimaliseert. Hoewel de doelstelling was de informatiebelasting, contrasteffecten, halo-effecten en sympathie-effecten te verminderen, moet onderzoek nog uitmaken of het schema hier ook in slaagt (LIEVENS en KLIMOSKI, 2001, blz. 258). Drie principes komen naar voor in het schema: elke assessor beoordeelt een assessee slechts één keer, assessees ontmoeten elkaar minstens twee en maximaal vier maal, en elk koppel assessoren treft elkaar minimaal twee en hoogstens vier keer (LIEVENS, 1998a, blz. 145). •
Een ander middel dat wordt ingeschakeld met het oog op verbetering van de kwaliteit van de scores, is het filmen
van de kandidaten. Dit geeft assessoren de kans de videoband terug te spoelen en nogmaals het fragment te bekijken. In tegenstelling tot wat men zou verwachten, bleef de nauwkeurigheid van de scores ongemoeid (LIEVENS en KLIMOSKI, 2001, blz. 257-258). 5)
Integratieprocedure
Onderzoek naar de werking van de integratieprocedure op de constructvaliditeit is eerder schaars. Volgende onderzoeksonderwerpen werden door Lievens teruggevonden: effect van het discussieformaat en de vergelijking van de bespreking van de scores per oefening of per dimensie. Geen van deze aspecten verhogen de constructvaliditeit. Lievens benadrukt de nood aan verder onderzoek en vermeldt de eisen die men daarbij zou moeten opleggen (LIEVENS, 1998a, blz. 146-148). •
Tot dusver werd in de studies de impact van de modificatie van factoren op de constructvaliditeit nagegaan, maar
men verliest hierbij de invloed op bijvoorbeeld de criteriumvaliditeit uit het oog. Bij toekomstig onderzoek moet men tegelijkertijd het effect op zowel construct- als criteriumvaliditeit uitpluizen. •
Een tweede punt van ergernis voor Lievens zijn de gehanteerde onderzoeksmethoden van sommige tests. Deze
vertonen vaak aanzienlijke tekortkomingen. Meer aangepaste modellen bij het analyseren van de constructvaliditeit zijn een must. In aanmerking komen de ‘structural equation modeling’-technieken en de ‘generalizability analysis’. ______________________________________________________________________________________________ De Mesel Katrien
74
Betrouwbaarheid en validiteit
•
Ten derde moet toekomstig onderzoek ontstaan uit simulatie-experimenten. De kandidaten komen daarbij in zeer
werkelijkheidsgetrouwe
situaties
terecht,
die
een
hogere
realiteitswaarde
dragen
dan
de
quasi-
en
laboratoriumexperimenten die nu meestal uitgevoerd worden. •
Er is ook nog een hele waslijst van te onderzoeken factoren. Deze lijst bevat factoren zoals assessorkenmerken en
oefeningfactoren. Maar ook contextuele (doelstelling van het center,…) en assesseefactoren vragen uitdieping. ADVIEZEN Uit de oorzaken van de lage constructvaliditeit werden een aantal adviezen afgeleid. Vele auteurs formuleren raadgevingen. Wat volgt is een overzicht (BRAL J., 2000, blz. 112; AHMED et al., 1997, blz. 63 en VAN BEIRENDONCK, 1998, blz. 78): -
De dimensies moeten zorgvuldig gedefinieerd zijn, met de definities aangepast aan de functie.
-
De gedragsvoorbeelden bij de dimensies moeten observeerbaar zijn in de oefening.
-
De competenties moeten verduidelijkt worden naar de kandidaten toe.
-
In totaal moet een klein aantal dimensies beoordeeld worden.
-
Ook per oefening moeten er weinig criteria zijn. Drie is een optimaal aantal.
-
Vermijd elkaar overlappende dimensies.
-
De selectie en training van assessoren moet zorgvuldig gebeuren.
-
Voorzie de assessoren via training van een referentiekader waarbij de klemtoon ligt op het definiëren en herkennen van de gedragscriteria en op het aanleren van de prestatienormen.
-
Zorg ervoor dat ook psychologen deel uitmaken van het assessorenteam en geef hen een coachende rol.
-
Bij het observeren en classificeren van gedrag moet men checklists ter beschikking stellen die het verwachte gedrag per oefening weergeven.
-
Gedragsgeankerde schalen, opgesteld door experts, moeten gebruikt worden.
-
Gebruik de indicatoren van de functieanalyse en geen opdrachtspecifieke indicatoren.
-
Stimuleer ‘cross exercise’-beoordelingen, waarbij gedragspatronen worden geïdentificeerd die geobserveerd kunnen worden in meerdere oefeningen.
-
Bouw gestandaardiseerde stimuli in de simulaties in. Dit verhoogt immers de standaardisatie.
-
Zorg ervoor dat elke assessee door minstens twee assessors geëvalueerd wordt. Beperk het aantal kandidaten per assessor (maximum vier).
-
Assessoren mogen hun observaties niet uitwisselen tijdens het center. Dit is pas toegestaan tijdens de assessorenmeeting, wanneer alle simulaties afgerond zijn.
-
Geef ook rollenspelers en deelnemers in het onderzoek een inbreng. Schenk aandacht aan hun beoordelingen.
-
Stel een rotatieschema op waarbij elke assessee door verschillende assessoren wordt beoordeeld met een minimum van twee beoordelaars en drie meetmomenten. Dit zal beoordelingsfouten, zoals halo-effecten verminderen.
-
De assessorenmeeting moet competentiegericht en niet simulatiegericht gebeuren.
______________________________________________________________________________________________ De Mesel Katrien
75
Betrouwbaarheid en validiteit
15. Ontwikkeling van competenties
Eens de zwakten en sterkten van een persoon geïdentificeerd werden in het center, stelt zich de kwestie van de ontwikkeling. Er rijzen op dit vlak echter een aantal vragen: Kan men alles aanleren? Welke factoren bepalen het succes van een ontwikkelingsplan? Wat is de beste manier om competenties te trainen? In dit hoofdstuk bespreken we de factoren die de ontwikkeling van competenties beïnvloeden. Daarna wordt een overzicht gegeven van competenties die niet aanleerbaar zijn. A. FACTOREN VAN TRAINBAARHEID Welke factoren bepalen nu de trainbaarheid van gedrag? De invloeden worden hier in twee groepen besproken: persoonsgebonden factoren en omgevingsfactoren (VAN BEIRENDONCK, 1998, blz. 111-116). •
De persoonsgebonden factoren die het succes van ontwikkeling bepalen, zijn het leervermogen, de leerbereidheid,
de waarden en normen en de persoonlijkheid van de assessee. -
Leervermogen: Cognitieve capaciteiten maken het verwerven van gedragsvaardigheden mogelijk. Ze verhogen niet enkel de leersnelheid maar bepalen ook de trainbaarheid van diverse gedragskenmerken. Om deze reden pleit Van Beirendonck voor het testen van de cognitieve capaciteiten in al hun vormen (divergent denken, convergent denken, abstract redeneren,…) tijdens het center.
-
Leerbereidheid: Deze bereidheid is het gevolg van vele factoren. De carrièreverwachtingen van de werknemer is er één van. Wanneer iemand ervan droomt een bepaalde functie te bekleden, zal hij meer gemotiveerd zijn een competentie te ontwikkelen die momenteel onvoldoende aanwezig is, maar die voor die functie onontbeerlijk is. Wanneer in het omgekeerde geval het te trainen gedrag onvoldoende past in de carrièreambitie, is de kans op succes beperkt. Ook de openheid voor feedback speelt een rol. Wanneer de assessee defensief reageert, is de kans klein dat training succesvol zal zijn. De wijze waarop de leerinstructies worden aangeboden, zal de bereidheid mee bepalen. Leren kan via een boek, via de praktijk, via de computer,… Volgens NLP (Neuro Linguïstisch Programmeren) heeft ieder persoon voorkeur voor een kanaal waarlangs we communiceren en leren.
-
Waarden en normen: Ook waarden en normen moeten in een center getest worden. Ze onthullen immers de echte betekenis van het getoonde gedrag. Ze zullen bovendien de training en vorming beïnvloeden.
•
Persoonlijkheid: De relatief stabiele persoonlijkheidskenmerken zullen het gedrag beïnvloeden.
Omgevingsfactoren die de trainbaarheid beïnvloeden zijn de cultuur van de organisatie, de stijl van de
leidinggevende, de tolerantie voor fouten, de mogelijkheid tot creativiteit,… Deze factoren hebben een invloed op ons gedrag, maar ook op onze waarden en normen. Deze kunnen immers wijzigen en zo indirect gedragsveranderingen veroorzaken. Uit onderzoek blijken een aantal andere aspecten te bestaan die het succes van training bepalen. Volgens de wet van het effect van Thorndike zullen de consequenties van ons gedrag, het leergedrag sterk bepalen. Wanneer een positieve reactie volgt op het vertoonde gedrag, zal dat gedrag herhaald worden. Een tweede vaststelling is dat opleiding onder de vorm
______________________________________________________________________________________________ De Mesel Katrien
76
Ontwikkeling van competenties
van specifieke opdrachten, via het leveren van ervaring, bijdraagt tot een succesvolle uitvoering van een functie. Terwijl volwassenen 50% van wat ze leren halen uit ervaring, wordt minder dan 20% geleerd uit traditionele opleiding. Factoren uit de omgeving zullen vaak de feedback op gedrag bepalen. De reacties van collega’s of chefs beïnvloeden de herhaling van het gedrag. Bovendien zullen de ervaringen die men opdoet in de omgeving een grotere impact hebben dan traditionele ontwikkelingsprogramma’s. B.
ONTRAINBARE COMPETENTIES
Bij het ontwikkelen van competenties blijkt, naast persoons- en omgevingsfactoren, ook de trainbaarheid van een specifiek gedrag op zich van belang. Zo blijken bepaalde competenties niet trainbaar. Bepaalde competenties zijn immers afhankelijk van niet-beïnvloedbare persoonlijke eigenschappen, zoals intelligentie en persoonlijkheid. Is deze vereiste eigenschap afwezig bij de medewerker, dan zal de competentie niet opgebouwd kunnen worden. In het andere geval wel (VAN BEIRENDONCK, 1998, blz. 116-117). -
Sociabiliteit: Of iemand in diverse sociale situaties zijn plan kan trekken, hangt af van diens personaliteit. Van Beirendonck vermeldt dat voor een bepaalde situatie een persoon wel kan leren hoe hij vlot moet overkomen, maar dit geleerde kan niet naar allerlei situaties veralgemeend worden.
-
Motivatie: Ook deze dimensie is moeilijk trainbaar. Tijdelijk kan de motivatie wel verhoogd worden, maar wanneer de prikkel weer weggenomen wordt, daalt de inzet.
-
Enthousiasme: Hier wordt dezelfde redenering gevolgd als voor motivatie.
-
Leercapaciteit: Terwijl men wel technieken die het leren vergemakkelijken kan aanleren, blijft het verstandelijk vermogen toch een beperkende factor.
-
Oordeelsvorming: Ook het beoordelen van een toestand kan men trainen voor een bepaalde situatie, maar opnieuw is het toepassen van het geleerde in andere situaties niet steeds mogelijk.
-
Visie: Een analoge redenering als bij oordeelsvorming geldt hier. Daarenboven is het inschatten van langetermijngevolgen of het overzien van een complexe situatie afhankelijk van het vermogen tot abstract en convergent redeneren (intelligentie).
C. COMPETENTIEGERICHTE TRAINING Wat de ontwikkeling zelf betreft, wordt gekozen voor competentiegerichte training. Bij deze vorm wordt nadruk gelegd op de competenties en niet op thema’s, zoals bij klassieke training. Toegepast op een voorbeeld zal traditionele training zich richten op ‘gesprekstechnieken’ en competentiegerichte training op probleemanalyse, empathie, flexibiliteit,… (VAN BEIRENDONCK, 1998, blz. 117). De groepjes per trainingssessie worden best beperkt gehouden (vier tot zeven personen). De samenstelling ervan kan verschillen: ofwel worden alle deelnemers opgeleid voor eenzelfde competentie, ofwel kiest men voor een gemengde groep. Beide tactieken hebben hun voor- en nadelen (VAN BEIRENDONCK, 1998, blz. 120-121). Bij één specifiek ontwikkelingsthema kan zeer intensief omtrent die competentie gewerkt worden. Bij een gemengde groep zullen de andere leden voorbeeldgedrag stellen of concrete feedback kunnen verschaffen. Dit levert heel wat informatie op voor het lid dat die competentie moet uitspitten, maar ook voor de andere leden is dit geen verloren tijd. Middelmatig ontwikkelde gedragscriteria zullen verder verbeterd worden. Concreet bestaat het trainingsprogramma uit een aantal simulaties waarin de te verbeteren competenties aan bod komen. De deelnemers bereiden de opdracht voor en daarna voeren ze één voor één de opdracht uit. Tijdens de uitvoering
______________________________________________________________________________________________ De Mesel Katrien
77
Ontwikkeling van competenties
wordt regelmatig gestopt om het gedrag te bespreken: Wat hebben ze gezien? Wat was het effect? Bent u daar tevreden mee? Hoe zou u het anders kunnen aanpakken? (VAN BEIRENDONCK, 1998, blz. 109-110).
______________________________________________________________________________________________ De Mesel Katrien
78
Ontwikkeling van competenties
16. Toekomst van AC
Nu het verleden van AC’s gekend is en de methode in al zijn aspecten aan bod is gekomen, is het nuttig ook een blik op de toekomst te werpen. Dit hoofdstuk bespreekt de veranderingen die het center nu ondergaat of die men in de toekomst verwacht. Op de vraag of de ACM zich als instrument voor selectie, development,… zal kunnen handhaven in de toekomst, antwoordt Howard overtuigd positief. Gezien de veranderingen in het verleden geen problemen opleverden, zal de techniek ongetwijfeld in staat zijn zich blijvend aan de wijzigende omgeving aan te passen. Dit is echter alleen mogelijk wanneer de ogen en oren opengehouden worden en dimensies en oefeningen aangepast worden aan de nieuwe vereisten die opduiken (HOWARD, 1997, blz. 33-36). Van Minden voorspelt een aantal tendensen voor de evolutie van het AC (VAN MINDEN, 1998, blz. 35-37). Hij stelt dat het AC ook voor lagere functies zal worden ingeschakeld. Howard voegt daaraan toe dat ook het topmanagement niet langer ontsnapt aan het center: ook op dat niveau wil men zich ervan verzekeren dat de juiste man op de juiste plaats zit (HOWARD, 1997, blz. 37-38). Zo dringt de ACM door in alle geledingen van de organisatie. Van Minden stelt verder dat de duur van de centers zal dalen. In een interview (MAYES, 1997, blz. 5) vertelde Byham dat een kortere duur niet steeds problematisch is: deze moet immers afgeleid worden uit het aantal dimensies dat men wenst te beoordelen. De evaluatie van één of twee competenties kan naar Byhams mening zonder probleem in een tijdsbestek van twee uur plaatsvinden. Bovendien, stelt Byham, is niet enkel de duur van het assessment center bepalend, maar die van de volledige selectieprocedure. Wanneer een aantal selectiestappen niet als onderdeel van het center worden beschouwd, kan men de indruk krijgen dat de duur ervan verkort is, terwijl dit misschien niet het geval is. Van Minden onderscheidt nog andere tendensen: ondernemingen ontwikkelen steeds vaker zelf hun AC, met de bijhorende negatieve gevolgen (minder vooronderzoek). Verder ziet hij het aantal assessoren en dimensies dalen (VAN MINDEN, 1998, blz. 35-37). Ook de computer zal zijn invloed laten gelden via automatisatie van de oefeningen waardoor de vereiste tijd en bijgevolg de kosten gereduceerd worden. Video-opnames laten toe de beoordeling te doen wanneer het de assessor past (NIJSSEN, 2000, blz. 122). Bovendien concludeerden Ryan en collega’s in 1995 dat de nauwkeurigheid van de scores niet verschilt naargelang de assessors direct konden waarnemen, dan wel via een videoband (HENNESSY et al., 1998, blz. 222). Bovendien hoeft de beoordelaar niet fysiek aanwezig te zijn in het center, zodat (externe) professionele assessoren ingeschakeld kunnen worden en trainingskosten vermeden kunnen worden (HOWARD, 1997, blz. 46). In competentiemanagement is een verschuiving merkbaar van het opsporen van de competenties die op het huidige moment vereist zijn naar een meer toekomstgerichte visie waarbij men deze competenties wil opsporen die zullen bijdragen tot toekomstig succes van de onderneming. Er moet dus niet enkel aandacht verleend worden aan ______________________________________________________________________________________________ De Mesel Katrien
79
Toekomst van AC
kerncompetenties (waarvan het belang stabiel blijft in de tijd) en rijpe competenties (die een belangrijke rol hadden in het verleden), maar ook aan opkomende (essentieel voor de toekomst) en transitionele (vereist in een overgangsfase) competenties (VLOEBERGHS, 1997, blz. 179-182). De ACM zal steeds vaker ingezet worden voor ontwikkelingsdoelstellingen. Het besef groeit immers dat een center veel meer informatie levert dan een ja/nee-beslissing. Van Beirendonck (VAN BEIRENDONCK, 1998, blz. 130-131) voorziet samen met deze opgang van de ontwikkelingsdoelstelling, een wijziging in de eigenaar van de resultaten van een center. Momenteel is de meest frequente praktijk dat de onderneming zich eigenaar acht en dat de assessee inzage krijgt of een kopie ontvangt. Van Beirendonck verwacht dat steeds vaker de assessee eigenaar zal zijn van de resultaten. De deelnemer beslist dan zelf of hij de informatie deelt met de onderneming. Steeds vaker hechten ondernemingen belang aan het opbouwen van teams. Efficiënte teams komen niet uit de lucht vallen en de term team-assessment heeft bijgevolg zijn intrede al gedaan. Terwijl vandaag de ACM enkel gebruikt wordt voor het evalueren van individueel talent, kan de techniek in de toekomst ook toegepast worden vóór de groep een teambuildingsprogramma doorloopt (VAN BEIRENDONCK, 1998, blz. 131). De opdrachten worden werkelijkheidsgetrouwer gemaakt en echte acteurs duiken op als tegenspelers. De verschillende opdrachten van het AC kunnen met elkaar geïntegreerd worden zodat vb. uit het in-basket een analyse of gespreksimulatie volgt (VAN MINDEN, 1998, blz. 35-37). In dit kader wens ik bij wijze van voorbeeld de fictieve organisatie ‘Time Concepts®’ te vermelden. Quintessence 6 ontwierp deze fictieve producent van agenda’s en adviseur in tijdsbeheer met alles erop en eraan. Terwijl de medewerkers een dag meedraaien in de onderneming, worden hun competenties geëvalueerd. De kandidaten komen daarbij in een meer levensgetouwe en contextrijke omgeving terecht. Binnen Time Concepts zijn alle bedrijfsdisciplines voorzien en kunnen alle functieniveaus beoordeeld worden. Ook hier zijn er zowel pluspunten (o.a. spontaan gedrag) als nadelen (deelnemers met teveel fantasie, de doorlopen simulaties hangen af van wat de deelnemer beslist aan te pakken,..) aanwezig, maar Time Concepts wijst vooral op de opties die openliggen voor toekomstig assessment (VAN BEIRENDONCK, 1998, blz. 132-138). Bij wijze van inleiding kan een nepopdracht doorlopen worden om de kandidaten te laten wennen aan de situatie en zo een getrouwer beeld te krijgen van hun competenties (VAN MINDEN, 1998, blz. 35-37).
Quintessence is een consultingbedrijf dat gespecialiseerd is in competentiemanagement waarbij competentie-assessment en competentiedevelopment centrale thema’s zijn. Quintessence is vooral bekend om zijn assessment centers. 6
______________________________________________________________________________________________ De Mesel Katrien
80
Toekomst van AC
17. Empirisch onderzoek
A. Inleiding Als aanvulling bij het theoretische deel van de scriptie, werd ook een blik geworpen op de praktijk. De doelstelling is na te gaan óf en in welke mate de ACM doorgedrongen is in België. De aanwezigheid van de ACM en de omstandigheden waarin de techniek aangewend wordt, werden nagegaan bij grote kredietinstellingen die in België actief zijn. Goemaere et al. (GOEMAERE et al., 1997, blz. 151) stelden in 1997 bij de banken een gebruikspercentage van 40% vast. Aangezien de methode in de verstreken jaren enkel aan populariteit heeft gewonnen en aangezien in dit onderzoek enkel zeer grote kredietinstellingen onderzocht werden, kon men zeker AC’s verwachten. De algemene onderzoeksvraag kan als volgt geformuleerd worden: ‘Worden assessment centers gebruikt in de grote banken die actief zijn in België? En, zo ja, wat zijn de kenmerken van deze centers?’ B. Methode De specifieke onderzoeksvragen van dit onderzoek situeren zich rond diverse aspecten van een AC. Voor elk van deze aspecten werden meerdere factoren nagegaan. De onderzoeksvragen zijn opgedeeld in het gebruik (frequentie, doelstelling, …), de ontwikkeling (door wie, werkwijze,…), de inhoud (duur, aantal oefeningen, welke oefeningen,…), de dimensies (aantal, selectieprocedure,…), de assessoren (wie, aantal, frequentie van optreden,…), de training van de assessoren (duur, inhoud,…), de feedback (tijdstip, inhoud,…), onderzoek (bestaan, inhoud,…) en de resultaten (oordeelsvorming, relevantieduur, kopie voor kandidaat,…). Voor een uitgebreid overzicht verwijs ik naar de vragenlijst die in bijlage 1 opgenomen is. Aan de hand van deze vragenlijst werd een interview afgenomen. De populatie wordt gevormd door de kredietinstellingen die aanwezig zijn op de Belgische markt. Om deze populatie te beperken werd de norm opgelegd dat de banken meer dan duizend leden in hun personeelsbestand moeten hebben. Via de website de Top 100000 van Trends ging ik na welke kredietinstellingen aan deze criteria voldeden (op basis van gegevens van 2000). Zes namen werden bekomen. Dit beperkte aantal is te wijten aan de vele fusies die de laatste jaren doorgevoerd zijn en zelfs nu nog plaatsvinden. Er werd besloten de gegevens te verzamelen via een interview. De zes banken werden telefonisch om hun medewerking aan de enquête gevraagd. Deze vragenlijst zou dus in een direct gesprek afgenomen worden. Vijf kredietinstellingen bleken bereid een afspraak vast te leggen. Bij Bank 6 moest ik een schriftelijke aanvraag indienen. Het antwoordt luidde dat de assessment center-methode niet toegepast wordt binnen de kredietinstelling. Via de telefoon heb ik de antwoorden bekomen op de vragen die voor dit geval opgesteld werden. Bijgevolg zijn de gegevens van alle zes de bedrijven opgenomen. De gegevensanalyse werd gestart met het uitschrijven van de bekomen informatie. Daarna werden de relevante gegevens per onderwerp samengebracht en in een doorlopende tekst gegoten. Eens per bank en per onderwerp de gegevens beschikbaar waren, konden per onderwerp besluiten getrokken worden. Deze werkwijze maakt de analyse meer overzichtelijk en begrijpbaar. Gegevens die zich daartoe leenden werden ook verwerkt in een tabel. ______________________________________________________________________________________________ De Mesel Katrien
81
Empirisch onderzoek
Alvorens van start te gaan met de bespreking van de bekomen resultaten, wens ik op te merken dat de ‘assessment centers’ die in deze instellingen gebruikt worden, misschien niet steeds deze term waardig zijn. Hier kom ik later op terug, maar tot die tijd zal ik de term toch gebruiken. C. Resultaten en besluiten Zoals reeds aangehaald, wordt de ACM in vijf van de grote banken toegepast. Enkel Bank 6 vormde een uitzondering. Deze kredietinstelling acht de methode te duur, mede doordat er onvoldoende aanwervingen zijn om het gebruik van de techniek te laten renderen. Gebruik In dit eerste onderdeel wordt dieper ingegaan op de doelstellingen van de assessment centers in de verschillende banken, er wordt nagegaan hoe lang de methode reeds gebruikt wordt en hoe frequent men de techniek inschakelt. 1.
Bank 1
Binnen Bank 1 wordt een hele waaier van centers toegepast. De kredietinstelling gebruikt de methode al 10 à 15 jaren. De ACM wordt gebruikt voor twee doelstellingen: selectie en ontwikkeling. Binnen elke doelstelling zijn er meerdere types. Er zijn twee selectie-assessments: één voor juniors en één voor seniors. Voor ontwikkeling bestaan er assessments voor bedienden, kaderleden en directie. Elk van deze centers wordt kort toegelicht en weergegeven in de figuur. •
Kaderassessment: Voor bedienden (graduaten of humanioraniveau) om van bediendeniveau naar het kaderniveau
te gaan zonder dat de persoon daar de opleiding voor heeft genoten. •
SAC (Senior Assessment Center): Voor directieleden, om te bepalen of het kaderlid de competenties bezit om
directielid te worden. •
Development Center: Dit center gaat het potentieel na van kaderleden, met als doel de doorgroeimogelijkheden en
ontwikkelingspunten vast te stellen. Het is een ontwikkelingsinstrument. •
Selectie-assessment 1: Dit selectie-instrument wordt ingeschakeld voor personen die van buiten de onderneming
komen en solliciteren voor een functie op kaderniveau. Het assessment wordt niet standaard uitgevoerd: enkel bij mensen met 3-4 jaar ervaring en een generalistische opleiding die bijvoorbeeld aangeven dat ze later een managementfunctie willen vervullen. Het center wordt nooit gebruikt voor specialisten. •
Selectie-assessment 2: Wordt gebruikt voor de selectie van kandidaten voor de directie. Selectie-assessment 2 Directie
SAC
Kader Development
Selectie-assessment 1 Kaderassessment
Bedienden De frequentie waarmee de centers georganiseerd worden, is voor selectie afhankelijk van het aantal kandidaten die voor een bepaalde functie solliciteren. Voor development moet een medewerker 3-4 jaar in dienst zijn. Vroeger doorliep men na die periode standaard het center. Nu doet men dit enkel wanneer de werknemer het zelf wil en wanneer de lijn (directe hiërarchie) én de HRO (Human Resource Officer) opmerkt dat de persoon misschien over de competenties
______________________________________________________________________________________________ De Mesel Katrien
82
Empirisch onderzoek
beschikt om door te groeien binnen de organisatie. Die drie personen moeten akkoord zijn om een persoon ernaar toe te sturen. De methode wordt systematisch gebruikt. 2.
Bank 2
Sinds 1989 zijn binnen Bank 2 assessment centers in gebruik. De methode wordt ingeschakeld op drie meetmomenten: bij aanwerving (S&R), bij overgang naar loopbaan 140 (LBO A) en bij overgang naar loopbaan 180 (LBO B). De vorm en de inhoud worden aangepast naargelang de doelstelling van het center. •
Selectie en recrutering (S&R): Dit assessment is voorbehouden voor wie solliciteert voor een kaderfunctie. Personen
met een A1-diploma worden met klassieke selectieproeven getest, namelijk met een groepsdiscussie en computertesten (logisch verbaal en numeriek redeneren). De universitairen krijgen er een in-basket bovenop. De universitairen die worden binnengehaald op beginnend kaderniveau, worden al bij aanwerving grondig gescreend omdat zij geen loopbaanonderzoek A meer moeten doen achteraf (anders te snel na elkaar). Wanneer men op bediendeniveau de bank binnenkomt is er een beperkte screening en enkel wanneer men gelooft dat de persoon kan doorgroeien, ondergaat die later een loopbaanonderzoek A. •
Loopbaanonderzoek A (LBO A): Werknemers die op het hoogste bediendeniveau of op het laagste kaderniveau zitten,
zullen een loopbaanonderzoek A doorlopen wanneer ze volwaardig kaderlid willen worden. •
Loopbaanonderzoek B (LBO B): Om het hoogste kaderniveau te behalen. LBO B
LBO A
Hoogste kader Middenkader Lager kader
Momenteel is er een werkgroep gestart die zich toespitst op development. De bedoeling is om aan de verslagen van het loopbaanonderzoek een soort ontwikkelingsplan te koppelen. De frequentie van de centers verschilt naargelang de doelstelling: -
Selectie en recrutering: Vroeger tweemaal per week, maar op het ogenblik minder vaak omdat er minder
aangeworven wordt. -
Loopbaanonderzoek A: Dit assessment gaat twee keer per week door, duurt 1 dag en er zijn 5 kandidaten.
-
Loopbaanonderzoek B: Het center wordt minder vaak georganiseerd (eens om de twee weken), maar duurt langer
(twee dagen). Het vindt plaats in een hotel en telt 8 kandidaten.
______________________________________________________________________________________________ De Mesel Katrien
83
Empirisch onderzoek
3.
Bank 3
Wanneer Bank 3 precies begonnen is met de ACM kon men mij niet direct vertellen, maar de techniek wordt reeds ruime tijd ingezet, waarvan de laatste 2-3 jaren zeer intensief. Er zijn drie aanwendingen: •
Selectie van externe kandidaten voor de kaderfunctie.
•
Overgang van bediendenstatuut naar kader (uitvoerende functie naar kaderfunctie): Assessment voor de selectie van
interne kandidaten voor de kaderfunctie, maar ook in het kader van potentieelbeoordeling (kan de persoon de nodige competenties ontwikkelen). Er zijn drie mogelijke uitkomsten: men is nog niet bekwaam (en dan kijkt men of ontwikkeling een optie is), goedkeuring voor gewoon kader of een goedkeuring voor kader met people management. •
Voor een zeer specifieke functie of wanneer zeer specifieke competenties moeten nagegaan worden (en dat kan niet
door andere tests), zal men een beroep doen op een AC. Dit center wordt dan op maat gemaakt afhankelijk van wat men wil weten. Met het extern bureau wordt dan besproken welke oefeningen geschikt zijn. De frequentie van de centers verschilt: soms zijn er drie per week, soms geen in een maand. Deze frequentie hangt af van het vrijkomen van functies en de ‘ad hoc’-aanvragen van het management omtrent een bepaalde persoon. 4.
Bank 4
Sinds 1997 zijn de assessment centers ook bij Bank 4 binnengedrongen. Er zijn twee centers: •
Het eerste center heeft potentieelevaluatie als primaire doelstelling: kaderleden worden beoordeeld op
competenties voor directiekaderfuncties. Een secundaire doelstelling is development: los van het feit of iemand slaagt of niet, krijgt de persoon feedback en suggesties voor ontwikkeling. Het assessment duurt 1 dag. Sinds kort bestaan er twee types van dit center: één om de competenties van directiekader in te schatten en een tweede erg gelijkend center voor specialistkader, dat op hetzelfde niveau ligt (gelijke impact en verantwoordelijkheid), maar meer gericht is op deskundigheid. Dit past binnen het kader van een duale loopbaan: niet enkel doorgroei naar managementposities, maar ook naar hoogstaande specialistfuncties. •
Een tweede assessment spitst zich toe op development en wordt gebruikt in twee situaties. Ten eerste kunnen
personen dit center doorlopen ter voorbereiding van het examen voor de overgang van bediende naar kader. Het center heeft dan een informatief en geen selectief karakter en duurt een halve dag. Het assessment is zeer gelijklopend, maar compacter dan het center voor de overgang naar directie. Het richt zich ook hoofdzakelijk op kadercompetenties. De tweede aanwending is deze voor nieuw aangeworven universitaire kaderleden. In het jaar van aanwerving worden deze door het center gestuurd. De duur is één dag. Deze aanwending is nog gloednieuw en in projectfase. De frequentie van de assessment centers wordt gepland in functie van de noden. Het assessment in verband met de directiekaders gaat bijvoorbeeld om de 2 à 3 maanden door). 5.
Bank 5
Het center van Bank 5 bestaat enkel uit een postbakoefening, die ontwikkeld werd in 1988. Groepsoefeningen worden slechts nog zelden gebruikt en men sleutelt momenteel aan een simulatieoefening. De in-basket wordt zeer frequent gebruikt: elke week worden verschillende sessies georganiseerd. De oefening dient vooral selectiedoeleinden: bij de meeste screenings voor onbepaalde duur voor middenkader en kader is de oefening aanwezig. ______________________________________________________________________________________________ De Mesel Katrien
84
Empirisch onderzoek
Daarnaast doorlopen sommige kandidaten voor het maken van promotie ook de oefening. Wie dan niet slaagt, krijgt serieuze feedback zodat de werknemer samen met iemand van personeelsbeheer aan zijn competenties kan werken. In dit opzicht wordt de oefening dus ook ingeschakeld voor development. Een derde toepassing van de postbakoefening is het bepalen van het potentieel van een persoon die zonder ervaring Bank 5 binnenkomt, bijvoorbeeld voor het managementtraineeship. 6.
Conclusies bij het gebruik
•
Om een idee te hebben over hoe vertrouwd de banken met de ACM zijn, ging ik na hoelang de methode al
gebruikt wordt. Eind jaren tachtig, begin jaren negentig blijkt de methode een doorbraak gekend te hebben, met Bank 4 in 1997 als uitzondering. Men mag zich echter niet blind staren op deze jaartallen aangezien de assessments fors verschillen in omvang, doelstelling,… (zie verder). •
Wanneer we de doelstellingen van de aangetroffen centers even op een rijtje zetten, vinden we een brede
toepassing van de techniek: -
Selectie van externe personen: Bank 1, Bank 2, Bank 3 en Bank 5 schakelen centers hiervoor in. Bank 4 is de opvallende afwezige. Bij deze toepassing wordt het center steeds vooraf gegaan door andere instrumenten (sollicitatiebrief, interview, vragenlijst, …) die het aantal kandidaten reduceren.
-
Overgang naar een hoger functieniveau (bediende naar kader, kader naar directie, lager kader naar middenkader,…): Voor deze doelstelling staan alle vijf de banken paraat. De ACM blijkt dus zeer populair voor grote overgangen binnen de onderneming.
-
Development (sterktes en zwaktes vastleggen): Bank 1 heeft als enige een center dat specifiek deze doelstelling dient. Toch is ook in de andere banken het developmentaspect aanwezig. Ook daar krijgt de kandidaat in zijn feedback een overzicht van zijn capaciteiten en suggesties voor ontwikkeling. Bij Bank 1 wordt op basis van de output een ontwikkelingsplan opgesteld. In de andere banken wordt het aan de beoordeelde overgelaten om iets met de aanbevelingen te doen. Bank 2 is momenteel bezig met het op elkaar afstemmen van assessment en development. Ook daar is het besef aanwezig dat meer met de gegevens moet aangevangen worden.
-
Ter voorbereiding van een examen: Deze specifieke doelstelling werd enkel bij Bank 4 teruggevonden.
-
Nagaan van zeer specifieke competenties (niet meetbaar met andere instrumenten): Bank 3 organiseert soms ‘ad hoc’centers.
Algemeen kan men besluiten dat de centers vooral voor selectie van interne en externe personen gehanteerd worden. Er is wel een verschuiving merkbaar naar andere toepassingen zoals ontwikkeling, competentiedetectie,… •
Eenstemmigheid bestaat er wanneer men kijkt wie de assessments doorloopt: bedienden komen zelden aan bod. De
centers blijven voorbehouden voor kader en directie of voor wie in aanmerking komt voor deze niveaus. •
De frequentie waarmee men een center organiseert, is erg uiteenlopend. Veel hangt af van de doelstelling, het
niveau in de onderneming, het aantal aanwervingen (selectie),… Toch zijn ook tussen de banken onderling sterke verschillen: terwijl Bank 2 twee van haar centers tweemaal per week organiseert, past men bij Bank 4 de techniek eens om de twee of drie maanden toe (voor de overgang van kader naar directie).
______________________________________________________________________________________________ De Mesel Katrien
85
Empirisch onderzoek
Ontwikkeling In dit onderdeel wordt besproken hoe de kredietinstellingen de ontwikkeling van hun center aanpakken. 1.
Bank 1
Voor het ontwerp van een assessment wordt vertrokken van de ‘Bank 7 Competency Dictionary’. Dit is een lijst van competenties en hun omschrijving die door Bank 7 (moedermaatschappij van Bank 1) opgesteld is in samenwerking met een extern bureau. Er wordt dus niet vertrokken vanuit functies, maar vanuit competenties. Wanneer een persoon naar een assessment wordt gestuurd, wordt wel een functieomschrijving meegestuurd. De bedoeling hiervan is om de kandidaat te evalueren op een aantal competenties die cruciaal zijn voor de gepostuleerde functie. Het kaderassessment is in eerste instantie volledig intern opgesteld, nu gebeurt dit in samenspraak met een extern bureau. De oefeningen worden in samenspraak met dat bureau opgesteld. 2.
Bank 2
•
Vroeger werden mensen vooral gescreend aan de hand van persoonlijkheidsvragenlijsten, maar met deze
instrumenten meet men vooral wat mensen denken over zichzelf en niet zozeer hoe ze werkelijk zijn en zich gedragen. Daarom is er beslist om mensen te gaan observeren en te kijken hoe ze zich echt gedragen in quasi-werkelijke situaties. Aanvankelijk werden deze observaties echter bekeken aan de hand van criteria die nog zeer sterk persoonsbeschrijvingen waren (vb. introvert-extravert). Toen echter bleek dat mensen met verschillende persoonlijkheden eenzelfde functie even goed konden uitvoeren, werd meer gekeken naar gedragingen en competenties die binnen kaderfuncties van belang zijn, onafhankelijk van de persoonlijkheid van de geobserveerde. •
De keuze van de competenties, gebeurt op basis van de missie van de Bank 2. De mission statement bevat volgende
centrale concepten: cliëntgerichtheid, ondernemerschap, innovatievermogen en efficiëntie. Die zaken zijn vertaald in competenties. Eigenlijk is op basis van een lijst van competenties die bestond binnen het extern bureau, een selectie gemaakt op basis van de missie van de Bank 2. Bij de daaropvolgende versies: a) ging men nog gedragsmatiger werken, b) is de maatschappij veranderd: vb. nu is competentiekennis delen en omgaan met veranderingen belangrijker geworden en c) is door een fusie het competentiemodel van Bank 2 samengebracht met dat van het verzekeringsonderdeel van de onderneming. •
De oorspronkelijke versie is opgesteld samen met een extern bureau. Men is ondertussen al aan de derde versie toe
en deze is volledig intern ontwikkeld. Dit gebeurde door de personeelsdienst, meer specifiek de cel Loopbaanontwikkeling. Er werd wel overleg gevoerd met de andere leden van de personeelsdienst en met de business. Er wordt afgetoetst of iedereen zich erin kan herkennen. •
Hoe ging men nu specifiek te werk: vanuit de missie werden een aantal competenties afgeleid, die op hun beurt
omgezet werden in functietypes. Men onderscheidt er vijf: inhoudelijk-gespecialiseerd, beleidsondersteunend, adviserend, commercieel en leidinggevend. Elk functietype bestaat uit een combinatie van competenties. Bepaalde directies vertalen deze functietypes nogmaals naar functieniveau, bijvoorbeeld bij ICT worden rollen en functies omschreven door middel van competenties. •
Wanneer we kijken naar de opleiding omtrent het ontwerpen van assessment centers, zien we dat de cel
Loopbaanontwikkeling uit psychologen bestaat. Verder worden regelmatig seminaries bijgewoond en worden boeken gelezen om de kennis op peil te houden.
______________________________________________________________________________________________ De Mesel Katrien
86
Empirisch onderzoek
3.
Bank 3
Bank 3 heeft intern een assessment center ontwikkeld voor de overgang van technische functie naar technisch specialist. Een extern bureau leverde het assessment voor de stap van technisch specialist naar kader. Bank 3 beschikt over een competentiewoordenboek dat samen met een extern bureau ontwikkeld is. Bij het maken van een assessmentoefening voor de overgang van technische functie naar technisch specialist, ging men via interviews van HR-specialisten en lijnmanagers na wat het verschil maakt tussen een technische functie en een technisch specialist, wat de nodige en bijkomende competenties zijn. Men bekijkt iemand die succesvol is in de functie, vergelijkt die persoon met de anderen en leidt daaruit competenties af. Uit de competenties worden dan oefeningen afgeleid. Niet alle competenties worden in het assessment (center) nagegaan, ook in het interview en de persoonlijkheidstests wordt naar dimensies gepeild. Een ander extern ontworpen center is op dezelfde manier ontwikkeld. Voor de ad hoc-centers beschikt men over de functiebeschrijving en de context. Daaruit worden met de externe partner de te beoordelen competenties vastgelegd. 4.
Bank 4
Bank 4 liet de ontwikkeling van haar assessment centers over aan een extern bureau. Bij de ontwikkeling werd gestart vanuit de functieanalyse. 5.
Bank 5
De selectieafdeling van Bank 5 ontwikkelde samen met een extern bureau de in-basketoefening. Daarbij leverde de bank de functiegroepen en functieanalyses die de externe partner verfijnde en naar competenties vertaalde. 6.
Conclusies bij de ontwikkeling
•
Voor de ontwikkeling doen de banken beroep op gespecialiseerde externe consultancybureaus: ofwel liet men zich
vroeger bijstaan, ofwel doet men dat nog steeds. Toch is het opvallend dat de ondernemingen niet bang zijn om het ontwerp in eigen handen te nemen. Bank 3 stelde zelf een center op en liet een tweede assessment extern maken. Bank 2 schakelde voor het eerste center de hulp in van een extern bureau, maar de twee latere versies werden binnenshuis geconstrueerd. •
De gebruikte werkwijze bij de ontwikkeling loopt uiteen: -
Bank 4 en Bank 5 starten bij de ontwikkeling van de functieanalyse en bepalen daaruit de te achterhalen
dimensies. Tot slot worden oefeningen vastgelegd die naar deze competenties kunnen peilen. -
Bank 3 gaat in het veld de essentiële competenties vragen: wat bepaalt of men de functie aankan en wat zijn de
verschillen tussen goede en slechtere medewerkers? Uit de bekomen competenties worden de oefeningen afgeleid. -
Bank 1 kiest dimensies uit het ‘Competency Dictionary’ in plaats van ze af te leiden uit de functie.
-
Bank 2 vertrekt vanuit de missie van de bank. De concepten die daarin centraal staan, worden vertaald naar
competenties. Hoewel deze praktijk misschien raar overkomt, laten de Amerikaanse ‘Guidelines and ethical considerations for assessment center operations’ deze praktijk toe (JOINER, 2000, blz. 317). Het is desalniettemin aangeraden ook een oog op de functie gericht te houden en belangrijke competenties voor de uitvoering ervan op te nemen.
______________________________________________________________________________________________ De Mesel Katrien
87
Empirisch onderzoek
Inhoud In dit onderdeel wordt de duur, het aantal kandidaten, de oefeningen, aanpassingen van het center,… nader toegelicht. 1.
Bank 1
•
De duur van de assessments binnen Bank 1 schommelt naargelang het soort center: kaderassessment (1 dag),
development (1 dag, een avond en een voormiddag, dus 1,5 dag), SAC (3 dagen), selectie-assessment 1 (als antwoord op de veeleisende arbeidsmarkt is de duur gereduceerd van 1 dag tot een halve dag) en selectie-assessment 2 (1 dag). •
Ook het aantal kandidaten verschilt: één bij selectie en zes deelnemers bij het kaderassessment, development en SAC.
•
De deelnemende kandidaten doorlopen een interview, een persoonlijkheidsvragenlijst, een presentatieoefening, een
postbakoefening, een tweegesprek, een intelligentietest (bij selectie) en een vergadering die tot een besluit moet komen en die dus ook een groepsdiscussie is (bij kaderassessment). •
De inhoud van het tweegesprek varieert afhankelijk van het profiel van de functie. Het selectie-assessment 1
onderscheidt drie profielen: commercieel, technisch-analytisch en management. Het commerciële profiel krijgt als tweegesprek een conversatie met een klant, terwijl het technisch-analytisch profiel een dossiervoorstelling houdt en in het managerprofiel zal men spreken met een moeilijk personeelslid. Voor de rest wordt vertrokken vanuit de competenties en niet vanuit de functies, maar wanneer een persoon naar een assessment wordt gestuurd, wordt een functieomschrijving meegestuurd. In de verschillende functies komen andere competenties naar voor. •
Periodiek worden aanpassingen doorgevoerd in het assessment. Het center wordt permanent geëvalueerd en wanneer
bijvoorbeeld bij alle kandidaten een bepaalde competentie niet naar voor komt, zal de oefening aangepast worden. Er worden ook wijzigingen doorgevoerd omdat de oefeningen in de onderneming te gekend raken. •
Vooraleer de kandidaten het center doorlopen, krijgen de deelnemers uiteraard informatie. Bank 1 licht de kandidaten
in over wat een assessment center is, wat de doelstelling is, wat ze kunnen verwachten, hoe ze zich moeten gedragen, de tijdsindeling, de gevolgen van het center (graad hangt ervan af, kans op kaderfunctie of niet),… Bij het SAC-assessment krijgen de kandidaten zelfs een hele bundel voorbereidende literatuur mee. 2.
Bank 2
•
De twee loopbaanonderzoeken verschillen in duur (A: 1 dag, B: 2 dagen), aantal kandidaten (A: 5, B: 8) en aantal
oefeningen (A: 6, B: 7). Deze opdrachten zijn: een postbak, een rollenspel (beoordelingsgesprek), een groepsdiscussie, een case (beschrijving van een onderneming waarin alles fout loopt, de kandidaat oplossingen moet bedenken en een visie vormen op korte en lange termijn), een diepte-interview (competentiegericht), een logische redeneerproef en een presentatie (bij B). Voor de case mag de kandidaat kiezen uit drie opgaven waarvan één in verband met personeelsmaterie, één is commercieel getint en één algemeen maatschappelijk. •
Er gebeuren geen veranderingen in het programma afhankelijk van de functie: iedereen krijgt dezelfde oefeningen.
•
Periodiek, namelijk om de twee jaar, worden de oefeningen herwerkt omdat ze te bekend raken in de onderneming.
Daarnaast worden wijzigingen aangebracht omdat de samenleving verandert, naar aanleiding van de fusie,… Het competentiemodel wordt geregeld herzien. •
De kandidaten krijgen een hele bundel vooraf met onder meer de begripsomschrijving, doelstelling van het center,
het programma, wie de resultaten te zien krijgt en onder welke voorwaarden, hoe de resultaten gebruikt zullen worden, mogelijke gevolgen en tijdstip en soort van feedback. De tijdsindeling vernemen ze op de dag zelf.
______________________________________________________________________________________________ De Mesel Katrien
88
Empirisch onderzoek
3.
Bank 3
•
Het assessment voor de overgang van bediende naar kader neemt een halve dag in beslag. De uitgebreide versie voor
kader met people management duurt een hele dag. Telkens neemt maar één kandidaat deel aan de vier oefeningen: persoonlijkheidstest, interview, postbak en rollenspel. De inhoud van het rollenspel verschilt een beetje naargelang de functie: het kan gaan om een coachinggesprek, een functioneringsgesprek of bij een commerciële functie over een verkoopgesprek of een presentatie waarmee men marketing moet overtuigen van een bepaald project of strategie. Vroeger gebruikte men ook een groepsdiscussie. •
Periodiek worden de tests wel bijgehouden: vroeger gebruikte men bijvoorbeeld potlood-en-papier-tests, nu test men
op pc. Er wordt opgevolgd dat de testen niet verouderen. Er is nu een nieuwe start genomen met de vernieuwde assessments. Men zal ook hiervoor opvolging voorzien. •
Deelnemers krijgen volgende informatie vooraf: begripsomschrijving, doelstelling, tijdsindeling, tijdstip en soort
feedback. Men stelt bovendien de kandidaat op zijn gemak: het gaat hier niet louter om een test, waarbij geen herkansing mogelijk is, maar het assessment kadert binnen ontwikkeling. Details over de oefeningen worden niet vrijgegeven. 4.
Bank 4
•
Voor potentieelbeoordeling neemt het assessment één dag in beslag en kunnen 6 kandidaten tegelijk geëvalueerd
worden in de vier oefeningen: in-basket, groepsdiscussie, rollenspel en schriftelijke oefeningen. In het rollenspel bestaan varianten: conflictgesprek, coaching- en slecht-nieuwsgesprek (waaruit een conflictgesprek kan volgen). Bij de developmenttoepassing verschilt de duur: een halve dag bij de voorbereiding van het kaderexamen en een dag voor nieuw aangeworven universitairen. •
Het assessmentprogramma wordt niet aangepast voor verschillende functies aangezien het center niet gericht is op een
functie, maar op een functieniveau. •
Jaarlijks worden systematisch een aantal accenten geoptimaliseerd. Deze bijwerking gebeurt intern. Kleinere
aanpassingen kunnen sneller veranderd worden. •
De gegevens voor de kandidaten bevatten volgende aspecten: begripsomschrijving (principes, wat te verwachten,
situering), toelichting oefeningen (soort oefening), doelstelling, programma, tijdsindeling, wie de resultaten te zien krijgt en onder welke voorwaarden, hoe de resultaten gebruikt zullen worden, mogelijke gevolgen, tijdstip en soort van de feedback, gebruikstermijn van de resultaten (twee jaar, max. 3 jaar geldig, erna met relativiteit bekijken) en gegevens over de assessoren. 5.
Bank 5
•
Het in-basket en het interview nemen samen een halve dag in. Aangezien de groepsoefening niet meer gebruikt
wordt, kan individueel gewerkt worden. •
Echte aanpassingen in het programma per functie worden niet toegepast, maar de accenten in de bespreking achteraf
(rol van de interviewer) zullen anders liggen wanneer het om een commerciële functie gaat dan bij een managementfunctie. Binnen Bank 5 is men wel bezig met de assessments: in de zomer van 2001 werd het in-basket aangepast omdat een aantal aspecten, die in 1988 goed waren, verouderd waren. Men is hierin echter ook niet te ver willen gaan: het betreft restyling en het herformuleren van de gegevens. Zo heeft men de informatie het uitzicht gegeven van een papieren map met e-mails (niet op pc, want dat is niet praktisch). Deze aanpassingen zijn door interne personen uitgevoerd. ______________________________________________________________________________________________ De Mesel Katrien
89
Empirisch onderzoek
Dit jaar wil men de competenties bijsleutelen omdat het competentiehandboek van Bank 5 aangepast werd. Men verwacht geen grote aanpassingen, wel lichte accentwijzigingen. Ook voor volgend jaar heeft men al plannen gesmeed: men wil herevalueren of de antwoorden die nu als zeer goed aangeduid worden nog steeds relevant zijn. Men krijgt wel de indruk dat de oefeningen goed werken. •
Deelnemers worden op de hoogte gebracht van de doelstelling van het center, de tijdsindeling, de gevolgen, het
tijdstip en de soort van feedback en de manier waarop ze moeten antwoorden (mondelinge toelichting is zeer belangrijk, nota’s zijn voor de kandidaat zelf). Informatie over hoe de kandidaten zich kunnen voorbereiden wordt angstvallig vermeden. Men geeft hen de dimensies, maar geen verdere tips. 6.
Conclusies bij de inhoud
•
De duur van de assessment centers blijft meestal beperkt tot één dag of zelfs een halve dag. Een uitzondering is het
SAC-center van Bank 1 (drie dagen), maar dit is dan ook een zeer zwaar assessment. •
Waar meer onderscheid in terug te vinden is, is het aantal assessees: dit cijfer varieert van één kandidaat (Bank 1,
Bank 3 en Bank 5) tot zes of acht (Bank 1, Bank 2 en Bank 4). •
Ook het aantal oefeningen verschilt aanzienlijk: terwijl Bank 5 slechts steunt op een postbak en een interview,
halen andere banken een heel arsenaal aan (zeven opdrachten bij een loopbaanonderzoek B van Bank 2). •
In de onderstaande tabel 5 is per bank aangegeven welke oefeningen ze inzetten. We zien dat de postbak de
populairste oefening is. Ze wordt in elke bank gebruikt. Het interview en het rollenspel zitten meestal ook in het programma. De groepsdiscussie staat vierde en wordt gevolgd door de persoonlijkheidsvragenlijst, de presentatie en de intelligentietest. De case en het produceren van schriftelijke stukken worden het minst frequent gebruikt. Tabel 5 : Gebruikte oefeningen in de grote banken in België (eigen werk)
Postbak Interview Rollenspel Groepsdiscussie Persoonlijkheidsvragenlijst Presentatie Intelligentietest Case Schriftelijke stukken produceren
Bank 1
Bank 2
Bank 3
Bank 4
Bank 5
≤ ≤ ≤ ≤ ≤ ≤ (≤)
≤ ≤ ≤ ≤
≤ ≤ ≤
≤
≤ ≤
6
≤ ≤
≤ (≤) ≤ ≤ 6 of 7
4
≤ 4
Aantal vinkjes 5 4 4 3 2 2 2 1 1
2
De ‘Guidelines and Ethical Considerations for Assessment Center Operations’ schrijven voor dat een assessment center ‘een voldoende aantal functiegerelateerde simulaties’ moet bevatten (JOINER, 2000, blz. 318-320). Men kan zich de vraag stellen of dat bij Bank 5 het geval is. Nochtans is een beperkt aantal opdrachten niet steeds problematisch: ook één uitgebreide oefening die diverse delen van de functie beslaat, kan volstaan. Toch betwijfel ik of dat het geval is en dit assessment werkelijk de term ‘assessment center’ verdient. (Daar is men zich trouwens van bewust binnen Bank 5.) Daarover later meer.
______________________________________________________________________________________________ De Mesel Katrien
90
Empirisch onderzoek
•
De aanpassingen van het assessment naargelang de (toekomstige) functie van de kandidaat zijn onbestaande
(Bank 4 en Bank 2) of zeer beperkt. In het beste geval wordt de inhoud van het rollenspel gewijzigd (Bank 1 en Bank 3). Bij Bank 5 wordt het aan de interviewer overgelaten om accenten te leggen afhankelijk van de functie. •
Wanneer er uit de nabesprekingen in de centers te verbeteren punten naar boven komen, wacht men meestal niet
lang om deze details aan te passen. Twee banken melden bovendien aanpassingen of hernieuwingen met een vaste regelmaat: Bank 4 pakt jaarlijks een aantal aspecten aan en Bank 2 vernieuwd de oefeningen om de twee jaar omdat ze te gekend raken. Maar ook de andere instellingen zijn met hun center bezig: Bank 3 neemt een start met een vernieuwd assessment, Bank 5 stak zijn in-basket in een nieuw kleedje, Bank 2 stelt de dimensies af op de veranderde maatschappij,… •
Vooraleer de kandidaten het assessment doorlopen, worden zij op de hoogte gebracht van wat hen te wachten staat.
Tabel 6 geeft een overzicht van wat de kandidaten in de verschillende banken te weten komen. Opvallend bij twee banken (Bank 3 en Bank 5) is dat ze erg terughoudend zijn in het verschaffen van informatie aan de kandidaten omtrent de oefeningen en hoe men zich kan voorbereiden. Men wil dat de kandidaat zichzelf is en geen mooier beeld ophangt dan de werkelijkheid.
Tabel 6 : Informatie voor de kandidaat (eigen werk)
Begripsomschrijving assessment center Doelstelling assessment center Programma (te doorlopen oefeningen) Tijdsindeling Wie de resultaten te zien krijgt en onder welke voorwaarden Hoe de resultaten gebruikt zullen worden Mogelijke gevolgen van de beoordeling Tijdstip en soort van feedback Gebruikstermijn van de resultaten Gegevens over de assessoren Hoe men zich moet gedragen Wat kan men verwachten Kandidaat geruststellen (herkansing mogelijk, ontwikkelingsdoelstelling,…)
Bank 1 ≤ ≤ ≤
≤
Bank 2 ≤ ≤ ≤ ≤ ≤ ≤ ≤ ≤
Bank 3 ≤ ≤ ≤
≤
≤ ≤
Bank 4 ≤ ≤ ≤ ≤ ≤ ≤ ≤ ≤ ≤ ≤
Bank 5 ≤
≤
≤ ≤
≤ ≤
Manier waarop men moet antwoorden
≤
______________________________________________________________________________________________ De Mesel Katrien
91
Empirisch onderzoek
Dimensies Welke en hoeveel dimensies worden nu beoordeeld? Hoe is men tot deze competenties gekomen? Worden andere dimensies in de verschillende oefeningen beoordeeld en weten de kandidaten vooraf waarop ze beoordeeld zullen worden? 1.
Bank 1
•
Bij Bank 1 worden vijftien dimensies bekeken. Leiderschap, communicatievaardigheden, planning en organisatie,
creativiteit, stressbestendigheid, overtuigen, empathie en doorzetting zijn er een aantal van. Deze dimensies worden in elk assessment allemaal beoordeeld, maar in kader van de profielen zullen bepaalde dimensies verschillende malen beoordeeld worden of niet. Bij het technisch-analytisch profiel zullen communicatievaardigheden slechts in één oefening geobserveerd worden, bij een commerciële functie bijvoorbeeld tweemaal. •
De definities van de dimensie zijn algemeen en worden niet verder uitgediept voor de diverse oefeningen. Aan de
kandidaten worden de dimensies niet meegedeeld. 2.
Bank 2
•
Bij Bank 2 hanteert men 20 dimensies, ingedeeld in vijf groepen: -operationeel management: ondernemen, cliëntgericht handelen, beslissen, doelen realiseren en efficiënt organiseren -beheer kennis en kunde: analyseren, visie vormen, innoveren, zichzelf ontwikkelen en kennis delen -communicatie en contacten: helder communiceren, overtuigend communiceren, samenwerken en een netwerk opbouwen en benutten -zelfmanagement: omgaan met veranderingen, constructief stress hanteren en het ondernemingsbelang behartigen -leiding geven: stimuleren en motiveren, evalueren en bijsturen, en delegeren en controleren
•
Bij het selecteren van deze competenties werd gesteund op de missie van Bank 2, een lijst van een externe partner en
de competenties van het verzekeringsdepartement van Bank 2. •
De algemene definities worden per gebruik verder uitgediept. Deze toepassingen zijn: selectie en recrutering,
loopbaanonderzoek A, loopbaanonderzoek B, evaluatie van het personeel (geen AC) en loopbaanonderzoek C voor directieleden (beoordeling, geen AC). •
In de opdrachten worden niet steeds alle dimensies beoordeeld maar men zorgt ervoor dat elke dimensie minimum
tweemaal geobserveerd wordt. •
De kandidaten krijgen vooraf de lijst met dimensies, maar niet vermeld per oefening.
3.
Bank 3
•
Bij Bank 3 ligt het aantal dimensies lager: maximum 10. Bovendien worden niet al deze competenties in het center
beoordeeld, maar ook en het interview zal men een aantal van deze dimensies evalueren. Het betreft: planning en organisatie, creativiteit, stressbestendigheid, communicatievaardigheden, analyse van problemen en people management (wanneer de persoon naar zo’n functie gaat). •
De selectie van de competenties gebeurt op basis van bestaande systemen (beroepengids: beschrijving beroep, niveau
en verloning), maar deze moeten geïnterpreteerd worden afhankelijk van de context. Daarom worden functiebeschrijvingen opgesteld (taken, op wat kan je de uitvoerders beoordelen, nodige competenties). Samen met het management wordt het aantal competenties tot 10 beperkt en daaruit wordt nogmaals een selectie gemaakt. Die worden ______________________________________________________________________________________________ De Mesel Katrien
92
Empirisch onderzoek
dan voor alle kandidaten nagegaan. Drie partijen zijn dus bij de keuze betrokken: management, HRM en de bestaande systemen (woordenboek, beroepengids). •
Men gebruikt algemene omschrijvingen uit het Bank 3-competentiewoordenboek. Er is geen verdere uitwerking
naargelang de functie. In de verschillende oefeningen worden andere dimensies geëvalueerd, maar de kandidaten krijgen die indeling pas na het center te horen. 4.
Bank 4
•
Het aantal dimensies ligt bij Bank 4 op zeventien, waarvan een derde echt cruciaal zijn. Voor development ligt het
aantal lager. De dimensies worden ingedeeld in vier clusters: -deskundigheid: analysevermogen, oordeelsvorming, visie, creativiteit, technische competentie, discipline en precisie -naar business toe: cliëntgerichtheid, resultaatgerichtheid en kostenbewustzijn -interactie: overtuigingskracht, samenwerken en pedagogie -leadership: leiding, plannen en organiseren, beslissen en management van informatie •
De dimensies zijn ontstaan in overleg met een externe consultant, op basis van de noden van de hogerliggende
functies. Daarna werden ze gevalideerd door de business, namelijk door het Management Development Comité, een representatieve kerngroep van lijnmanagers. En tot slot werden ze bekrachtigd door het directiecomité. •
De algemene omschrijvingen worden niet aangepast per functie (want het center bestaat voor een functieniveau), maar
voor de verschillende oefeningen worden ze wel aangevuld met zichtbaar gedrag. •
In de diverse oefeningen wordt gepeild naar andere dimensies. Een matrixtabel geeft een overzicht hiervan. Ook de
kandidaten krijgen deze matrixtabel zodat zij weten welke competenties in welke opdrachten van belang zijn. 5.
Bank 5
•
In de in-basketoefening wordt gepeild naar zeven competenties die geordend worden rond vier punten: analyse (en
synthese), oordeelsvorming (waarmee houdt de kandidaat rekening, worden er veronderstellingen gemaakt), leidinggevende kwaliteiten (planning en organisatie, delegeren, nemen van beslissingen), commercialiteit en klantgerichtheid. Deze worden beoordeeld in het in-basket en in de bespreking achteraf. Het competentiehandboek van Bank 5 vermeldt echter 32 competenties en deze worden allemaal gebruikt. De dimensies die men niet beoordeelt op basis van de postbak, probeert men te achterhalen door competentiegericht te interviewen. Op basis van de functieanalyse wordt gekeken welke competenties achterhaald moeten worden in de in-basket, in het competentiegericht interview en in een aantal simulaties. •
De dimensies zijn algemeen omschreven en afgeleid uit de functieanalyse, in samenwerking met een extern bureau. Ze
worden niet aan de kandidaten bekend gemaakt. •
De lijst met dimensies wordt niet aangepast afhankelijk van de functie, maar de interviewers beoordelen met de
functie in hun achterhoofd en zullen daardoor bepaalde competenties zwaarder wegen.
______________________________________________________________________________________________ De Mesel Katrien
93
Empirisch onderzoek
6.
Conclusies bij de dimensies
•
Het aantal dimensies dat de banken beoordelen, ligt hoog: Bank 1 hanteert vijftien dimensies, Bank 4 zeventien en
Bank 2 zelfs twintig. Bij Bank 3 ligt het aantal lager, namelijk maximum tien. Deze competenties worden niet allemaal in het center beoordeeld. Een aantal worden via het interview achterhaald. Bank 5 beoordeelt in de postbakoefening en de bespreking achteraf zeven dimensies. Dit aantal ligt fors boven het in de literatuur als optimaal omschreven aantal van drie dimensies in één oefening. Tabel 7 : Dimensies in de grote banken in België (eigen werk) Bank 1 Analyseren Planning en organisatie Beslissen Klantgericht handelen Communicatievaardigheden Creativiteit Leiderschap Overtuigen Stressbestendigheid Oordeelsvorming Visie vormen Samenwerken Doorzetting Empathie Doelen realiseren Efficiënt organiseren Innoveren Kennis delen Zichzelf ontwikkelen Netwerk opbouwen en benutten Omgaan met veranderingen Ondernemen Ondernemingsbelang behartigen People management Pedagogie Kostenbewustzijn Resultaatgerichtheid Managen van informatie Technische competentie Precisie Discipline Commercialiteit •
Bank 2
Bank 3
Bank 4
Bank 5
≤
≤ ≤
≤ ≤ ≤ ≤
≤ ≤ ≤ ≤
≤ ≤ ≤ ≤
≤ ≤ ≤ ≤ ≤
≤ ≤
≤ ≤ ≤
≤ ≤ ≤
≤ ≤ ≤ ≤
≤ ≤
≤
≤ ≤ ≤ ≤ ≤ ≤ ≤ ≤ ≤ ≤ ≤ (≤) ≤ ≤ ≤ ≤ ≤ ≤ ≤ ≤
Aantal vinkjes 4 4 3 3 3 3 3 3 3 2 2 2 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
Tabel 7 geeft een overzicht van welke dimensies getoetst worden in de verschillende bankinstellingen. Negen
dimensies
blijken
zeer
populair:
analyseren,
planning
en
organisatie,
beslissen,
klantgericht
handelen,
communicatievaardigheden, creativiteit, leiderschap, overtuigen en stressbestendigheid. Wanneer we deze competenties vergelijken met de top tien die Lievens en Goemaere in Vlaamse grote ondernemingen terugvonden, zien we een forse ______________________________________________________________________________________________ De Mesel Katrien
94
Empirisch onderzoek
gelijklopendheid:
leiderschap,
communicatievaardigheden,
planning
en
organisatie,
teamgerichtheid,
sociale
vaardigheden, probleemanalyse, initiatief, creativiteit, stressbestendigheid en klantgerichtheid (LIEVENS en GOEMAERE, 1999, blz. 216). Vijf van deze tien dimensies komen letterlijk overeen. De andere vindt men onder andere benamingen ook terug in de tabel. Behalve het hoge aantal identieke competenties, komen toch ook een aantal specifieke aspecten voor elke bank naar voor. Zo hanteert Bank 2 zeer eigentijdse kenmerken (omgaan met veranderingen, innoveren, samenwerken, kennis delen, een netwerk opbouwen en benutten) die bij de anderen niet teruggevonden worden. Bank 1 benadrukt empathie en doorzetting, terwijl Bank 4 kostenbewustzijn, resultaatgerichtheid en pedagogie voorop stelt. Opvallend zijn de ‘rationele’ dimensies van Bank 5: commercialiteit, oordeelsvorming, beslissen,… (Bij een in-basket is dat ook te verwachten.) Bij de overige kredietinstellingen is altijd wel een ‘meer persoonlijke’ competentie aanwezig (samenwerken, empathie, pedagogie, stressbestendigheid). •
De dimensies worden meestal algemeen omschreven en niet specifiek voor een bepaald(e) functie(niveau) of
oefening. Bank 2 heeft specifieke dimensie-omschrijvingen afhankelijk van de toepassing (selectie, loopbaanonderzoek, evaluatie (geen AC,...). Binnen Bank 4 worden de algemene omschrijvingen voor elke opdracht aangevuld met zichtbaar gedrag. Men kan verwachten dat dit de interbeoordelaarsbetrouwbaarheid zal verhogen. •
De lijst met dimensies is in alle banken constant: er worden geen andere dimensies beoordeeld naargelang de
functie. Wel zal Bank 1 naar gelang van het profiel van de functie een bepaalde competentie een aantal keer observeren, afhankelijk van het belang van de dimensie in dat profiel: communicatievaardigheden zijn belangrijker in een commerciële functie en zal dus vaker geobserveerd worden dan bij het technisch-analytisch profiel. •
Bank 2, Bank 3 en Bank 4 beoordelen andere dimensies in de verschillende oefeningen. Belangrijk om op te
merken is dat Bank 2 elke dimensie minimum tweemaal observeert. Ook uit de literatuur (Reilly, Henry en Smither (1990), JOINER, 2000, blz. 318 en MOSER et al., 1999, blz. 133) blijkt dat het verschaffen van voldoende ‘opportunity to observe’ noodzakelijk is voor betrouwbare en nauwkeurige beoordelingen. •
Binnen Bank 1, Bank 3 en Bank 5 worden de kandidaten niet ingelicht over de dimensies waarop men hen zal
beoordelen. Bank 2 geeft een lijst, maar niet per oefening. Bank 4 verschaft de matrixtabel die voor elke opdracht aanduidt welke competenties belangrijk zijn en is daarmee de enige. Nochtans vindt men in de literatuur terug dat wanneer de deelnemers de dimensies kennen en te horen krijgen welk gedrag gewenst is per dimensie, zij hun gedrag hierop zullen afstemmen en dat de assessoren bijgevolg beter evaluaties zullen afleveren: tussen oefeningen verhoogt de consistentie en binnen een oefening lopen de scores meer uiteen (LIEVENS, 1998a, blz. 144). Ook Kleinmann en Köller steunen deze praktijk en verwerpen de stelling dat de kandidaten op basis van het meedelen van de dimensies een rol zullen spelen die niet aansluit bij hun werkelijke vaardigheden (KLEINMANN en KOLLER, 1997, blz. 74). Voor meer informatie omtrent dit onderwerp verwijs ik naar het theoriegedeelte (Validiteit, Constructvaliditeit, Bepalende factoren).
______________________________________________________________________________________________ De Mesel Katrien
95
Empirisch onderzoek
Assessoren Dit onderdeel bespreekt wie de assessoren zijn, hoeveel er ingezet worden, de frequentie van hun optreden, hoeveel kandidaten ze beoordelen, of ze biografische gegevens krijgen over de kandidaten, welke observatiemethoden ze gebruiken en welke opleiding ze ontvangen. 1.
Bank 1
•
Bank 1 zet zowel interne als externe personen in als assessor. De interne personen zijn bij kaderassessment en
development HR-leden. Bij seniorassessment kunnen ook directieleden zetelen. De personen van recrutering en selectie treden 10 keer per jaar op als assessor, anderen twee tot drie maal per jaar. Deze frequentie wordt bepaald door de functie, het enthousiasme en de beschikbaarheid van de persoon. Gemiddeld zijn er vijf assessoren per center. Dat is bijna één voor elke kandidaat. Elke assessor beoordeelt twee, maximum drie, kandidaten tegelijk. De kandidaten worden in de verschillende oefeningen door andere assessoren beoordeeld. •
Officieel worden geen biografische gegevens over de kandidaat ter beschikking gesteld van de observatoren. De persoon
die het interview afnam, zal deze informatie uiteraard wel hebben en soms zullen andere assessoren naar de informatie vragen en dan krijgen zij die, maar het is niet standaard. Bij evaluatie vragen assessoren vaak wel naar de huidige functie van de kandidaat. •
De observatie- en evaluatiemethode bestaat eruit dat de assessoren observeren, neerschrijven, een score van 1 tot 6
toekennen voor elke dimensie en dat er een discussie gevoerd wordt. •
Bij de herziening van het kaderassessment werd een opleiding georganiseerd omtrent de oefeningen en hun werking.
De training werd gegeven door externe personen en duurde één dag. Een permanent opleidingsprogramma voor nieuwe assessoren bestaat niet. De eerste maal dat een intern persoon als assessor optreedt, zal een externe assessor een oogje in het zeil houden en de aandacht vestigen op een aantal belangrijke aspecten. Er worden geen opfrissingscursussen georganiseerd. 2.
Bank 2
•
De assessoren zijn interne medewerkers, voor de helft van de personeelsdienst en de andere helft vanuit de business.
Bij een loopbaanonderzoek A worden steeds vijf personen ingeschakeld, waarvan vier van de personeelsdienst en één iemand uit de ‘lijn’: -
Eerste assessor: Dit is iemand van de personeelsafdeling die het center coördineert. De persoon neemt de helft van de interviews af en leidt de groepsdiscussie en de einddiscussie van het assessment.
-
Tweede assessor: Ook dit is iemand van de personeelsdienst. Deze persoon neemt de overige interviews af en is aanwezig bij de groepsdiscussie en de einddiscussie, maar leidt deze niet.
-
Twee ondersteuners: Dit zijn personen van de cel Loopbaanontwikkeling. Zij nemen elk de helft van de postbakken en rollenspelen af, maar zijn niet aanwezig bij de groepsoefening. Eén ondersteuner zal de redeneerproeven leiden.
-
Iemand van de lijn/business: Deze persoon beoordeeld de case.
Bij een loopbaanonderzoek B gaat het er analoog aan toe. Er zijn vier personen die voor de helft uit de personeelsdienst komen, de andere helft uit het lijnmanagement. Er zijn steeds twee personen aanwezig bij elke proef: iemand van de lijn en iemand van de personeelsdienst. De impact van dit assessment is immers groter en het is bovendien moeilijker te beoordelen.
______________________________________________________________________________________________ De Mesel Katrien
96
Empirisch onderzoek
•
De frequentie van het optreden verschilt naargelang de functie van de beoordelaar: mensen van de cel
Loopbaanontwikkeling treden tweemaal per week op als assessor. De tweede assessor en de lijn gaan een engagement aan om drie keer per jaar gedurende drie jaar de rol te vervullen. •
Bij de selectie van de lijnassessoren kiest men iemand uit de afdeling waar de verkozen kandidaat terechtkomt (ICT,
commerciële net of het hoofdkantoor). De datums van de assessments worden bekend gemaakt en afhankelijk van hun agenda schrijven de assessoren uit de pool op de sessies in. Personen die als assessor in aanmerking willen komen, moeten voldoen aan volgende voorwaarden: over een brede kennis van de bank beschikken, minstens twee loonbanen boven de te beoordelen mensen staan, een brede interesse hebben, verbaal en sociaal vaardig zijn en interesse vertonen om het te doen. Het hoofd van de cel Loopbaanontwikkeling bepaalt wie aan de eisen voldoet. De verkozen personen krijgen een opleiding en gaan een verbintenis aan voor drie jaar. Binnen Bank 2 heeft men geen tekort aan lijnassessors. •
Aangezien de meeste oefeningen individueel volbracht worden, moet de assessor ook slechts één persoon tegelijk
beoordelen. Enkel bij de groepsdiscussie worden meerdere kandidaten samengebracht en moeten de assessoren ook alle kandidaten tegelijk beoordelen. Door de organisatie wordt de kandidaat in elke oefening door een andere assessor beoordeeld en heeft elke van de assessoren alle kandidaten gezien. •
Wie het interview afneemt, kent automatisch de biografische gegevens van de kandidaat. De andere assessoren hebben
deze informatie in principe niet (omwille van de objectiviteit). De eerste assessor ziet in het interview 2 of 3 kandidaten, maar bekijkt wel alle dossiers. Bij het bemiddelen van de score (wanneer men niet uit de discussie geraakt) kunnen gegevens uit het dossier de doorslag geven. •
De observatie gebeurt op basis van gedragsgeankerde schalen. De schaal gaat van 4 tot 8 en heeft scores 4, 4-5, 5, 5-
6,… met zes als norm. De scores worden ingedeeld in drie blokken waarvoor gedragbeschrijvingen bestaan: zwak (4, 4-5 en 5), middelblok (5-6, 6 en 6-7) en hoogste blok (7, 7-8 en 8). Per competentie zijn er dus drie gedragsbeschrijvingen. In het middelste blok moet men afwegen of iemand op de norm zit of eronder. •
De assessoren krijgen een tweedaagse training, gegeven door personen van de cel Loopbaanontwikkeling: wat is een
AC, het competentiemodel van Bank 2, betekenis van de competenties, halo-effect…, belang van het scheiden van observatie en interpretatie en hoe feedback geven (beperkt omdat feedback door iemand van personeelsafdeling gebeurt). Bovendien worden de echte opdrachten ingeoefend (met studenten als proefpersonen) en lopen de nieuwelingen eerst een jaar dubbel: men neemt zelf geen proeven af, maar kent wel scores toe (2-3 keer een AC, met 5 proeven op een dag, dus: 10 keer). Door het dubbellopen en de einddiscussies aan het einde van elk center garandeert men dat het referentiekader van de verschillende assessoren overeenkomt. •
Systematische opfrissingscursussen worden niet georganiseerd. Dit jaar was er wel een opleiding omdat het
competentiemodel veranderd is. In een halve dag werden de punten die veranderd zijn overlopen. Ook wanneer wijzigingen aangebracht zijn in de oefeningen wordt een halve of een hele dag, afhankelijk van de noodzaak, uitgetrokken. Deze infosessies worden dan voor iedereen uit de assessorenpool georganiseerd. 3.
Bank 3
•
De assessoren binnen Bank 3 zijn interne personen, namelijk selectieconsultants. Zij doen een dertigtal assessments
per jaar. In de toekomst wil men ook managers opleiden uit gebieden die veel beroep doen op het center. Deze managers zullen ingezet worden bij selectie (niet bij potentieelbeoordeling), wanneer de manager later met de kandidaat moet werken. Op deze manier verhoogt men de betrokkenheid van het lijnmanagement in de selectieprocedure. ______________________________________________________________________________________________ De Mesel Katrien
97
Empirisch onderzoek
•
Elke selectieconsultant werkt voor een bepaalde directie en is er contactpersoon voor. In assessments voor die
directie verzorgt de persoon de observatie, schrijft hij/zij het rapport en geeft feedback aan het management. Een collega wordt ingeschakeld voor de oefening zelf. Daarbij wordt rekening gehouden met de taal van de kandidaat (de rollenspeler heeft dus dezelfde taal als de kandidaat). •
Wat het aantal assessoren betreft, zorgt men dat er steeds (minimum) twee assessoren per kandidaat zijn. Elke
assessor moet telkens maar één persoon observeren. De kandidaten worden in de verschillende oefeningen door andere observatoren beoordeeld. In de toekomst wil men per oefening een vaste beoordelaar aanstellen. •
De beoordelaars krijgen geen biografische gegevens over de kandidaten.
•
Bank 3 heeft een eigen evaluatiesysteem ontworpen. Per competentie moet men bij het beoordelen het niveau van de
performantie bepalen (drie niveaus: 1 = basis, 2 = wat meer en 3 = uitstekend). Per functie is voor de specifieke competentie bepaald waar iemand moet zitten. Wanneer de persoon dan beoordeeld is, kan men de score vergelijken met het vereiste niveau. Tijdens het observeren worden per competentie gedragsindicatoren en opmerkingen neerschreven op basis waarvan de score toegekend wordt en die ter verantwoording dienen. Opmerkelijk is dat de observatoren, naast 1, 2 of 3, ook de score ‘afwezig in de oefening’ en ‘niet aanwezig bij de kandidaat’ kunnen toekennen. •
De selectieconsulenten zijn allemaal psychologen. In deze opleiding hebben ze vaardigheden geleerd die ze dagelijks
gebruiken. Voor de assessments werd een workshop georganiseerd waarin de oefeningen op maat van Bank 3 ontwikkeld werden door de selection consultants zelf (in plaats van de aankoop van bestaande AC op de markt). Nadien werd dit AC door de consultants ingeoefend (Eerst door zelf kandidaat te spelen. Nadien door ‘Bank 3-proefpersonen’, die dit soort functie uitoefenen, de oefening te laten doen). Op die manier leert men de dimensies kennen, leert men het rollenspel spelen en kan men de scores onderling afstemmen. Daarnaast zijn ook andere workshops (interviewtechnieken, moeilijke gesprekken, feedback,…) doorgegaan. De bijkomende opleidingen namen 3 of 4 halve dagen in beslag. Een extern bureau begeleidde deze workshops. •
Opfrissingscursussen zijn er nog niet, maar bij de opleiding voor het nieuwe assessment merkte men dat herhaling geen
kwaad kan en heeft men zich vooropgesteld om binnen zes maanden nog eens een opfrissing te organiseren. Daarnaast is de intrede van een eventuele nieuwe collega of het ogenblik waarop de managers actiever betrokken worden bij het AC, misschien een goed moment voor herhaling. 4.
Bank 4
•
Bank 4 heeft zowel interne als externe assessors. De lijnmanagers en HRM-specialisten treden een viertal keer per jaar
op als beoordelaar. De frequentie is voor de managers afhankelijk van hun beschikbaarheid, hun enthousiasme, hun affiniteit ermee,… Bij de personeelsdienst zijn het voornamelijk de meer ervaren collega’s (seniors) die als (model)assessoren dienen. Wie gekozen wordt als assessor hangt ook af van het functieniveau van het center (bediende naar kader, of kader naar directiekader): hoe hoger het niveau van competenties, hoe vaardiger de assessoren moeten zijn (gelijkaardig niveau). Vandaar dat de ingeschakelde lijnmanagers ook meestal directeurs zijn en van de HRM-afdeling de seniors gekozen worden. •
Normaal zijn er vijf of zes assessoren aanwezig, die elk één persoon in de gaten houden. Enkel in bepaalde
oefeningen (groepsoefening) observeert de assessor twee personen. •
Kandidaten worden in de verschillende oefeningen door andere assessoren beoordeeld. De assessoren hebben geen
biografische gegevens over de kandidaten. ______________________________________________________________________________________________ De Mesel Katrien
98
Empirisch onderzoek
•
De assessoren krijgen voor het beoordelen per dimensie en per oefening omschrijvingen van welk gedrag aan welk
niveau toegewezen moet worden. Telkens zijn er een paar voorbeelden gegeven van positief gedrag. •
Tijdens hun opleiding leren de assessoren observatie en interpretatie te scheiden, leren ze de inhoud van de dimensies
en worden ze gewaarschuwd voor evaluatiefouten. Door oefening tijdens de opleiding en door de consensusdiscussie na elk AC wordt een referentiekader opgebouwd. De opleiding duurt één dag en gebeurt door een extern bureau. Wanneer een update van de oefeningen gebeurd is, wordt voor iedereen een opfrissing voorzien. 5.
Bank 5
•
Interne en externe personen verzorgen bij Bank 5 de evaluatie. Elk van deze assessoren kan alleen optreden. De
interne mensen zijn afkomstig van de selectieafdeling en beoordelen twee tot drie keer per week. Per kandidaat is er één assessor aanwezig en deze beoordeelt ook maar één persoon tegelijk. Biografische gegevens over de kandidaat worden gegeven. •
Afstemming van de beoordelingen van interne en externe assessoren gebeurt tijdens het center zelf. De in-basket
wordt samen afgenomen en er wordt besproken waarom iemand een gegeven op een bepaalde manier interpreteert. Er wordt gecontroleerd of assessoren van beide partijen tot dezelfde evaluatie komen. •
Een omschrijving van de competenties en vier scores met bijpassend gedrag (gedrag dat overeenkomt met de graad)
worden aan de assessor ter beschikking gesteld. Men beseft nu de nood om te kunnen aanduiden dat een bepaalde competentie niet aanwezig is. •
Er zijn geen interne assessoren die een ‘echte’ training ontvangen hebben. De externe beoordelaars hebben deze wel
gehad. Wel hebben de internen allen een diploma psychologie op zak. Nieuwe assessoren worden on-the-job door een collega opgeleid. In de on-the-job-opleiding wordt aandacht gegeven aan het scheiden van observatie en interpretatie, en de inhoud van de dimensies. Men komt ook in aanraking met de oefeningen en de evaluaties worden op elkaar afgestemd. Vooraleer iemand alleen kan evalueren, loopt hij/zij eerst een maand mee. Dat zijn tussen de 8 en de 10 centers. Bij de eerste twee assessments volgt men. De keren daarna gaat men ook zelf beoordelen. Opfrissingscursussen zijn er niet. Voor de toekomst heeft men gepland dat, bij de uitbreiding van de ACM binnen Bank 5, elke selectieadviseur een nieuwe opleiding zal krijgen. 6.
Conclusies bij de assessoren
•
Het aantal assessoren ligt bij drie instellingen op vijf à zes (Bank 1, Bank 2 en Bank 4). Bank 3 voorziet twee
beoordelaars per kandidaat, wat een typische verhouding is volgens de hierboven reeds vermelde Amerikaanse richtlijnen. Bank 5 valt wat uit de boot: er wordt maar één assessor ingeschakeld, tenzij het om een zeer gewichtige functie gaat. De definitie van een assessment center vereist echter meerdere beoordelaars zodat de praktijk binnen Bank 5 strikt genomen de naam ‘assessment center’ niet verdient. •
Wanneer we kijken wie de banken als assessoren inschakelen, zien we dat geen enkele kredietinstelling deze taak
volledig uit handen geeft: ofwel worden enkel interne personen gebruikt (Bank 2 en Bank 3), ofwel worden ze aangevuld door externe assessoren (Bank 1, Bank 4, Bank 5). •
Wanneer we bekijken wie deze interne assessors zijn, is steeds de personeelsafdeling aanwezig. Bij drie banken
wordt ook het management erbij betrokken: Bank 1 (directieleden bij seniorassessments), Bank 2 en Bank 4 (lijnmanagers). Ook Bank 3 wil in de toekomst managers betrekken bij de selectie. ______________________________________________________________________________________________ De Mesel Katrien
99
Empirisch onderzoek
•
Het aantal kandidaten dat een assessor tegelijk moet beoordelen, is beperkt. Meestal kan de aandacht zelfs
gefocust worden op één persoon en moeten slechts in bepaalde (groeps)oefeningen meerdere kandidaten simultaan geëvalueerd worden (Bank 2 en Bank 4). •
Ander positief nieuws is dat in de kredietinstellingen de kandidaten in de verschillende oefeningen geobserveerd
worden door andere assessoren. (Behalve in Bank 5 waar het aantal oefeningen beperkt is.) •
Het is belangrijk dat deze personen geregeld als beoordelaar optreden. Anders is de kans groot dat hun evaluaties
niet nauwkeurig zijn. De ‘Guidelines and Ethical Considerations for Assessment Center Operations’ vermelden hieromtrent dat bij minder dan twee assessments in twee opeenvolgende jaren de beoordelaar opfrissing van zijn training moet krijgen ofwel begeleid moet worden in het center. Hetzelfde geldt wanneer tussen de training en het eerste optreden als assessor zes maanden verstreken zijn. Van Beirendonck legt de lat hoger en vindt drie tot vier optredens per jaar een minimum (VAN BEIRENDONCK, 1998, blz. 60). Terwijl de leden van de personeelsafdeling zeer regelmatig optreden als assessor (vb. tien keer per jaar bij Bank 1, dertig assessments bij Bank 3, tot zelfs tweemaal per week bij Bank 2 en Bank 5), ligt voor managers de frequentie al een stuk lager (Bank 1: twee of drie keer per jaar, Bank 2: driemaal per jaar). •
Aangezien de leden van de personeelsafdeling meestal psychologen zijn, en bovendien deze afdeling steeds
betrokken is bij een assessment, zal ook steeds een psycholoog onder de assessoren zijn. Dit is goed nieuws. Psychologen kunnen immers beter de dimensies onderscheiden dan managers, die dan weer beter de waarden en normen van de onderneming kunnen beoordelen (LIEVENS en KLIMOSKI, 2001, blz. 248-249). •
Bij de observatie zijn twee technieken vertegenwoordigd: observeren en noteren (Bank 1 en Bank 3) en
gedragsgeankerde schalen (Bank 4, Bank 2 en Bank 5). (Voor meer uitleg: zie de besprekingen.) •
Behalve bij Bank 5, krijgen de assessoren meestal geen biografische informatie over de kandidaten omdat men
gelooft dat dit de beoordelingen zal vertekenen. Dit strookt met de literatuur die aanraadt enkel informatie van binnen het center te gebruiken. Wie het interview afneemt, zal natuurlijk wel over de gegevens beschikken en soms worden de gegevens wel ter beschikking gesteld wanneer een assessor daar specifiek naar vraagt. Bij Bank 2 is er steeds iemand die de dossiers van alle kandidaten doorneemt. De bedoeling hiervan is om bij betwisting het dossier de doorslag te laten geven. •
Op vlak van opleiding zijn er grote verschillen merkbaar. - Bank 1 heeft geen vast opleidingsprogramma voor nieuwe assessoren, maar bij de herziening van het kaderassessment kregen de assessoren een opleiding van één dag over de oefeningen. De eerste maal dat iemand als assessor optreedt, wordt hij/zij begeleid door een ervaren externe assessor. - Binnen Bank 2 gebeurt de opleiding dan weer heel uitgebreid: er is een tweedaagse training die zowel theorie als het doorlopen van de echte oefeningen bevat. Daarbovenop lopen nieuwelingen een jaar dubbel. Bij aanpassingen in het center, worden deze wijzigingen aan de assessoren toegelicht. - Bank 3 schakelt enkel mensen van de personeelsdienst in als assessor en betrouwd op kun kennis als psycholoog. Voor de assessments werden bovendien een workshop georganiseerd waarin de oefeningen doorlopen werden. - Bank 4 organiseert een training van één dag die een aantal theoretische aspecten aanhaalt en waarin ook de opdrachten geoefend worden. Na een update van de oefeningen, doorloopt iedere assessor een opfrissingscursus. - In tegenstelling tot de externe assessoren, zijn er binnen Bank 5 geen beoordelaars die een ‘echte’ opleiding gehad hebben. Nieuwe assessoren worden on-the-job door collega’s opgeleid. Er wordt aandacht geschonken aan een aantal theoretische aspecten en dan loopt de persoon een maand mee.
______________________________________________________________________________________________ De Mesel Katrien
100
Empirisch onderzoek
•
Opfrissingscursussen zijn meestal afwezig. Bij aanpassingen in het assessment worden meestal wel een aantal
zaken herhaald. Bank 3 heeft bij de opleiding in kader van het herwerkte kaderassessment het nut van zo’n herhaling ingezien en is van plan binnen zes maand nogmaals een herhalingssessie in te lassen.
______________________________________________________________________________________________ De Mesel Katrien
101
Empirisch onderzoek
Resultaten en feedback Hoe komen de kredietinstellingen tot een eindoordeel? Hoe lang acht men het rapport geldig? Wie krijgt de resultaten te zien? Wanneer worden de kandidaten op de hoogte gebracht van hun prestaties in het center en welke gegevens krijgen zij dan precies? Krijgt de deelnemer een kopie? Wordt er een opleidingsplan gekoppeld aan deze feedback en welke kenmerken heeft dit plan dan? Wordt het verloop ervan opgevolgd? 1.
Bank 1
•
De assessoren hebben voor elke dimensie een score toegekend tussen 1 en 6. Bij afwijkende scores op een bepaalde
competentie, volgt een discussie tot een consensus wordt bereikt. •
De bruikbaarheidstermijn van de resultaten ligt niet vast binnen Bank 1. Een junior die negatief beoordeeld is, kan
evenwel anderhalf tot twee jaar later wel nog eens terugkomen. Bij een positieve evaluatie is de relevantieduur minder duidelijk. •
Wanneer het assessment selectiedoeleinden dient, hoort de kandidaat of hij/zij geslaagd is of niet. Indien de persoon
meer informatie wenst, kan hij/zij deze bekomen, maar dat is niet standaard. De beslissing wordt kenbaar gemaakt via de telefoon, een tijdje na het center. Ook bij development krijgt de kandidaat de feedback een poos na het assessment, maar deze is veel uitgebreider. In een direct gesprek verneemt de kandidaat zijn sterktes en zwaktes, gedragsvoorbeelden ter motivering en te verbeteren aspecten. De feedback kan dus zeer uitgebreid zijn (eventueel zelfs voor selectie). •
Naast de personeelsdienst krijgt enkel de kandidaat inzage in het rapport. De kandidaat krijgt geen kopie.
•
Op basis van de output van het center zal in samenspraak een trainingsplan voor een jaar opgesteld worden
afhankelijk van de toekomstige functie die de persoon kan krijgen. Het personeelslid draagt de verantwoordelijkheid voor de uitvoering van het plan. Een mentor zal de opvolging van het plan op zich nemen en staat ter beschikking wanneer de werknemer vragen heeft. 2.
Bank 2
•
Het besluitvormingsproces bij Bank 2 is een combinatie van een beslissingsregel en een discussie. Het proces bestaat uit
vijf stappen: in eerste instantie geeft elke assessor per proef aan bepaalde competenties een score. Vervolgens wordt, aangezien elke competentie in minstens twee proeven gescoord wordt, een rekenkundig gemiddelde berekend van de verschillende scores per competentie. In de derde fase wordt door overleg beslist of die score naar boven of onder wordt afgerond. In de vierde stap worden de afgeronde scores per competentie ingetypt op een Excel-spreadsheet waar automatisch per functietype de competenties worden gegroepeerd en een score wordt berekend. Hierbij kan een kandidaat strafpunten of bonuspunten krijgen naargelang de grootte van de score. Tot slot wordt nogmaals onderhandeld over de afronding van de scores per functietype. •
Normaal gezien is de relevantieduur onbeperkt. Bijgevolg doorloopt een persoon slechts één maal een
loopbaanonderzoek A en één keer loopbaanonderzoek B, tenzij echt blijkt dat de kandidaat te vroeg deel genomen heeft. •
Externe deelnemers aan een assessment krijgen binnen de week het besluit in hun bus. Zij kunnen eventueel
telefonisch meer feedback bekomen. Personen die voor verdere stappen bekeken zullen worden, worden opgebeld. De internen krijgen zes weken na het AC een schriftelijk verslag van 10 bladzijden en krijgen een uitgebreide mondelinge toelichting door iemand van de personeelsdienst: elke competentie wordt overlopen, sterktes en zwaktes worden ______________________________________________________________________________________________ De Mesel Katrien
102
Empirisch onderzoek
aangeduid en adviezen worden geformuleerd. Tijdens dit gesprek wordt zo min mogelijk verwezen naar de proeven aangezien dit vaak de reactie uitlokt ‘ja, maar die proeven…’. De opmerkingen worden algemeen geformuleerd. •
Vier partijen hebben inzagerecht in het rapport: de kandidaat, de personeelsdienst, de lijn (directe hiërarchie) en het
topmanagement. •
Diverse partijen krijgen een kopie van het verslag: de (interne) kandidaat, de betrokken lijnmanager, de gedelegeerde
bestuurders, de cel Loopbaanontwikkeling en de personeelsconsulenten (van de personen die in hun groep zitten). •
Momenteel wordt nog geen trainingsplan opgesteld na het center. Het is de taak van de medewerker om zelf naar een
personeelsconsulent te stappen voor zijn verdere ontwikkeling. Men werkt wel aan de integratie van assessment en development. 3.
Bank 3
•
Een discussie zal het eindoordeel van de kandidaten bepalen.
•
Men acht de besluiten zo’n drie à vijf jaar relevant.
•
Wanneer het rapport opgesteld is, horen de kandidaten in een direct gesprek hoe ze gepresteerd hebben. Ze mogen
het rapport mee lezen. Dat rapport bestaat uit meerdere delen: de testresultaten, de resultaten van de oefeningen in detail, de eindconclusie (sterktes en zwaktes en leerbaarheid) en een blad voor het management (sterke en minder sterke punten, een ontwikkelingsplan en een advies). Het management verneemt de grote lijnen van de resultaten. Wanneer het assessment extern gebeurde, krijgt de kandidaat op de dag zelf korte feedback. Daarna wordt het rapport intern besproken (zie hierboven) en eventueel kan de persoon dan nog eens naar het extern bureau voor nog meer uitleg. •
De personeelsdienst, de kandidaat en de lijn mogen de gegevens inkijken. Het rapport staat steeds ter beschikking.
Tot maximum vijf jaar na het assessment mogen de kandidaten en de managers het rapport nogmaals inkijken. •
Zowel de lijn als de kandidaat krijgen geen kopie. De kandidaat mag wel notities nemen tijdens de bespreking. De
lijnmanager ontvangt geen dubbel om misbruik te vermijden: de gegevens zijn contextgebonden en moeten dan ook binnen dat kader gebruikt worden. •
Voor de ontwikkeling ligt het initiatief bij het individu. Samen met zijn manager moet beslist worden of op terrein
bijgeleerd zal worden, of een bezoek aan het Learning Center nodig is. Eventueel kan de persoon na een tijd nogmaals het center doorlopen. 4.
Bank 4
•
Ook bij Bank 4 wordt gediscuteerd tot een consensus bereikt is.
•
De gebruikstermijn ligt op twee jaar.
•
De kandidaten krijgen feedback anderhalve week na het AC. De persoon krijgt na het gesprek ook een kopie van het
rapport mee waarin sterktes en zwaktes, gedragvoorbeelden ter motivatie, een aanzet voor een trainingsplan (Welke competenties zijn voor verbetering vatbaar? Hoé dit specifiek moet gebeuren, wordt aan de afdeling interne vorming overgelaten.) en een carrièreadvies (vooral bij negatief advies zal men aangeven tot welke richting de kandidaat zich kan wenden) vermeld staan. Het extern bureau verzorgt deze feedback samen met de personeelsafdeling. •
De lijn kan aanwezig zijn bij de feedback naar de kandidaat. De personeelsdienst en de kandidaat houden een
exemplaar van het verslag.
______________________________________________________________________________________________ De Mesel Katrien
103
Empirisch onderzoek
•
De kandidaat kan ervoor opteren om naar het extern Learning Center te trekken om bepaalde competenties verder
te ontwikkelen. Op vlak van training ligt de eerste verantwoordelijkheid dus bij het individu. De mogelijkheden worden geboden, maar de persoon moet zich zelf inschrijven. In samenspraak met een vormingsanalist zal een plan opgesteld worden. Bij het jaarlijkse evaluatiegesprek zullen de vormingsinitiatieven geëvalueerd worden: hebben de inspanningen iets opgeleverd. Binnen Bank 4 is het center geen eindpunt, maar een beginpunt. Vaak slagen personen en komen zij in aanmerking voor het hogerliggend niveau, maar moeten een aantal punten nog verbeteren tijdens de stage van één à twee jaar. Om de zes maanden is er een beoordeling van de prestaties in de praktijk. Om in het statuut te blijven, moeten de evaluaties positief zijn. Is er geen verbetering merkbaar dan wordt de stage voor het directiekader stopgezet. 5.
Bank 5
•
In principe beoordeelt slechts één assessor de kandidaat en zal hij het zijn die een advies formuleert. Voor
gewichtige kandidaten zijn er soms twee selectieadviseurs. Eén die moeilijk doet en de in-basketoefening afneemt en de andere die wat zalft en het interview doet. In zo’n situatie komen de assessoren samen tot een beslissing. •
De bruikbaarheidstermijn van de resultaten wordt op maximaal twee jaar vastgelegd, maar is ook afhankelijk van de
context (commercieel accent of niet) en van wat toen met de kandidaat gedaan is. Men zal nagaan of de kandidaat voor dezelfde functie komt en wat hij/zij ondertussen gedaan heeft. •
Pas wanneer de beslissing gevallen is, krijgen de kandidaten feedback over hun prestaties. Op die manier wordt
vermeden dat valse verwachtingen gecreëerd worden. Tijdens het assessment zal men de kandidaat geen hints geven die zijn performantie zal beïnvloeden. Men wil dat de kandidaat zichzelf is. •
Na twee of drie weken wordt de beslissing aan de deelnemers meegedeeld in een brief. Wie dat wenst kan voor
feedback over het in-basket en het interview contact opnemen met de selectieadviseur die als contactpersoon aangeduid is. Sterktes en zwaktes, gedragsvoorbeelden en suggesties worden besproken. Aangeworven personen worden vaak opgebeld en uitgenodigd om het contract te tekenen. •
Naast de personeelsdienst krijgen de lijn en de kandidaat inzage, geen kopie.
•
De werknemers moeten zelf het initiatief nemen om hun competenties bij te schaven. Het center levert suggesties,
maar de kandidaat moet zich bijvoorbeeld zelf inschrijven voor een cursus. Uitzondering op deze regel vormen de personen die specifiek geselecteerd zijn voor het managementtraineeship. Deze mensen worden wel actief begeleid. 6.
Conclusies bij de resultaten en de feedback
•
De populariteit van de discussie om tot de eindoordelen te komen, wordt ook in dit onderzoek bevestigd. Slechts
één bank gebruikt een beslissingsregel (Bank 2: in combinatie met een discussie). •
De meeste banken erkennen dat de resultaten uit een center een tijdelijke relevantie hebben. Bank 2 is hier het
buitenbeentje: herkansing is in principe uitgesloten. Bank 3 acht de gegevens drie tot vijf jaar bruikbaar, Bank 4 en Bank 5 twee jaar. Bank 1 geeft een herkansing (bij negatieve feedback) na twee jaar. Voor positieve resultaten ligt de termijn niet vast. •
De kandidaten krijgen feedback eens het rapport opgemaakt is. Meestal worden hun resultaten uitgebreid
besproken. Bank 1 en Bank 2 delen aan externe personen enkel de beslissing mee. Indien ze meer uitleg wensen, kunnen ze deze telefonisch bekomen.
______________________________________________________________________________________________ De Mesel Katrien
104
Empirisch onderzoek
•
Meestal wordt omzichtig omgesprongen met het uitdelen van kopies van het verslag. Vooral naar het
lijnmanagement toe wil men misbruik vermijden. De gegevens zijn contextgebonden en moeten ook binnen dat kader gebruikt worden (Bank 1, Bank 5). Tabel 8 geeft weer welke partijen inzage krijgen in de resultaten of zelfs een kopij ontvangen. Bank 2 en Bank 4 verschaffen een kopie van het verslag aan de kandidaten. Bij Bank 2 krijgen zelfs alle partijen het verslag. Bank 3 geeft geen kopij, maar de kandidaten en het lijnmanagement kunnen tot maximaal vijf jaar na het assessment het verslag nogmaals inkijken.
Tabel 8 : Inzage (I) of kopie (K) ? (eigen werk) Bank 1
•
Bank 2
Bank 3
Bank 4
Bank 5
Personeelsafdeling
I ≤
K ≤
I ≤
K ≤
I ≤
K ≤
I ≤
K ≤
I ≤
K ≤
Kandidaat
≤
Ξ
≤
≤
≤
Ξ
≤
≤
≤
Ξ
Lijnmanagement
Ξ
Ξ
≤
≤
≤
Ξ
Ξ
Ξ
≤
Ξ
Topmanagement
Ξ
Ξ
≤
≤
Ξ
Ξ
Ξ
Ξ
Ξ
Ξ
Op vlak van training wordt de verantwoordelijkheid meestal bij de medewerker zelf gelegd. Enkel Bank 1 koppelt
automatisch een ontwikkelingsplan vast aan de resultaten van het center. Bij de andere banken zijn de systemen (ontwikkelingsconsulent, development center,…) aanwezig, maar de medewerker moet zelf de eerste stap zetten.
______________________________________________________________________________________________ De Mesel Katrien
105
Empirisch onderzoek
Onderzoek In dit onderdeel ging ik na in hoeverre de ondernemingen stil staan bij de waarde van hun center(s): worden facevaliditeit, voorspellende waarde,… onderzocht? En welke acties onderneemt men op basis daarvan? 1.
Bank 1
Formeel onderzoek wordt er binnen Bank 1 niet uitgevoerd. In een algemene bespreking zullen een aantal te verbeteren punten besproken worden en eventueel kunnen aanpassingen aangebracht worden in samenspraak met interne en externe personen. 2.
Bank 2
Er gebeurt onderzoek naar de verdeling van de resultaten binnen de bank en de directoraten. Onderzoek naar de predictieve validiteit ontbreekt, maar men heeft wel de intentie deze in de toekomst eens te bekijken en te evalueren wat het center oplevert. Bij de herwerking van de proeven omdat ze te gekend geraken, wordt de feedback van assessoren en assessees mee in rekening genomen. 3.
Bank 3
Met formeel onderzoek houdt men zich niet bezig. Men gaat ervan uit dat wanneer er problemen zijn, men het wel zal horen. In de feedback wordt wel gepeild naar de mening van de kandidaten over het onthaal, de oefeningen,… (facevaliditeit). Uit deze gesprekken blijkt dat de deelnemers ook zelf iets aan hun deelname aan het center hebben en dat ze deze methode prefereren boven de oude techniek. De mensen hebben minder het gevoel dat hun een zwaard boven het hoofd hangt en zijn enthousiaster. Ook over de feedbackwerkwijze is er tevredenheid en dit wordt bevestigd door de hoge aanvaarding van de resultaten. 4.
Bank 4
Bank 4 voert wel enige vorm van onderzoek. Daaruit blijkt bijvoorbeeld de hoge selectiviteit van het center (lage slaagkansen). Bank 4 wil de slaagkansen in het center verhogen door vooraf strenger te selecteren op vlak van wie in aanmerking komt voor een deelname. Vaak worden personen met voldoende potentieel gewoon te vroeg naar het center gestuurd. Het potentieel is dan nog onvoldoende omgezet in zichtbaar gedrag, zodat de slaagkansen geringer zijn. Na elk assessment wordt besproken of de deelnemers tevreden waren, of alles goed verlopen is,… Uit de zeldzame stopzettingen van de stage kan men afleiden dat het center redelijk goed werkt. Maar men beseft het gevaar dat een persoon die door het center geraakt is sowieso als goed wordt beschouwd. In de toekomst wil men de voorspellende kracht nog systematischer nagaan, louter uit preventieve overwegingen. 5.
Bank 5
Vorig jaar werd een zeer algemeen onderzoek uitgevoerd (managementtraineeships). Hieruit kon men besluiten dat de voorspellingen sterk overeen komen met de performantie van de onderzochte personen. Door de algemeenheid van het onderzoek wil men dit echter niet bestempelen als een onderzoek naar de voorspellende validiteit. Er werd bijvoorbeeld niet nagegaan wat aan de basis lag van de goede inschattingen (oefening of interview).
______________________________________________________________________________________________ De Mesel Katrien
106
Empirisch onderzoek
Op vlak van de face-validiteit wordt systematisch gevraagd naar de indruk van de kandidaten over de oefening. De aanvaarding ervan ligt hoog. Men heeft nu de verouderde memo’s omgevormd tot een mailbox, wat de gepercipieerde relevantie nog zal verhogen. 6.
Conclusies bij onderzoek
•
De resultaten omtrent dit onderdeel zijn niet bijster goed. Veel verder dan een evaluatie op het einde van elk
assessment geraakt men meestal niet. Uit deze besprekingen kunnen eventueel aanpassingen volgen. •
Wat wél in de gaten gehouden wordt, is de face-validiteit. Men peilt bij de kandidaten naar hun mening over het
assessment center. De aanvaarding van de methode ligt meestal hoog. •
Formeel onderzoek naar de voorspellende validiteit is in alle kredietinstellingen afwezig. Vaak leidt men echter uit
andere factoren de waarde af (beperkt aantal stopzettingen stage, geen klachten,…). In de toekomst is men wel bereid op dit vlak een inspanning te doen (Bank 2 en Bank 4).
______________________________________________________________________________________________ De Mesel Katrien
107
Empirisch onderzoek
Opmerkingen Op het einde van de vragenlijst kregen de contactpersonen de gelegenheid opmerkingen te formuleren. 1.
Bank 1
Geen opmerkingen 2.
Bank 2
•
Het competentiemanagement binnen Bank 2 gaat veel verder dan het gebruik van assessment centers. Ook in de
evaluaties, de omschrijving van de functies,… staan competenties centraal. •
In de toekomst wil men meer aandacht schenken aan de ontwikkeling en de evaluatie (face-validiteit,…) van eigen
systemen. •
Men werkt ook aan het smeden van nauwere banden tussen assessment en development. De cellen ‘opleiding en
vorming’, ‘selectie en recrutering’ en ‘loopbaanbegeleiding’ werden samengevoegd. 3.
Bank 3
•
Bank 3 neemt steeds meer dingen zelf op zich. Dit levert een kostenbesparing op en is bovendien interessanter voor
de leden van de personeelsafdeling. •
De laatste jaren is er een forse inspanning geleverd voor de ontwikkeling en voorbereiding van een assessment.
Vanaf nu kan men echt aan de slag gaan met dit center. 4.
Bank 4
•
Bank 8, waarmee Bank 4 zeer recentelijk is gefuseerd, gebruikte ook de assessment center methode, maar had deze
functie volledig uitbesteed met als grote voordeel dat een omvangrijke investering vermeden kon worden. De contactpersoon vindt echter dat met deze werkwijze een groot nadeel verbonden is, namelijk dat de follow-up moeilijker wordt. De kans is groter dat er geen opvolging gebeurt en het rapport (onbenut) in de kast belandt. •
Ook het belang van goede opvang en follow-up na het AC, vooral bij negatieve feedback, acht de contactpersoon
van cruciaal belang. Een assessment creëert immers enorme verwachtingen. Het is ook een openbaar gebeuren zodat de omgeving op de hoogte is. Een niet-weerhouden kandidaat riskeert een etiket op zijn rug, dat luidt: ‘niet geslaagd’. Bovendien is het een uitspraak op lagere termijn. Enkel wanneer de kandidaat actief gewerkt heeft om zichzelf te verbeteren en hij/zij de ondersteuning heeft van zijn/haar manager is een herkansing mogelijk. 5.
Bank 5
Bank 5 wil het gebruik van assessment center uitbreiden. 6.
Conclusies bij de opmerkingen
Hoewel momenteel in de meeste banken de koppeling tussen het assessment center en de ontwikkeling nog ontbreekt, worden inspanningen geleverd om in de toekomst meer te halen uit de resultaten van het center.
______________________________________________________________________________________________ De Mesel Katrien
108
Empirisch onderzoek
18. Algemeen besluit
Nu alles in detail behandeld werd, is het nuttig de belangrijkste conclusies nogmaals op een rijtje te zetten. •
In het eerste hoofdstuk werd de ACM omschreven als een evaluatieproces waarbij voor één of meerdere personen
(assessees) de gedragsvaardigheden beoordeeld worden door meerdere beoordelaars (assessoren of assessors). Daarbij worden diversie technieken gebruikt zoals een postbak, simulaties, een groepsdiscussie, een analyse-oefening, een intelligentietest,… Simulaties moeten steeds deel uitmaken van het programma. De andere opdrachten kunnen gekozen worden in functie van de dimensies die men wenst na te gaan. De term ‘assessment center’ is voorbehouden voor instrumenten die aan bepaalde voorwaarden voldoen. Zo is het essentieel dat de resultaten van de diverse assessoren geïntegreerd worden, dat er tijdens de observatie geregistreerd wordt en dat een functieanalyse aan de basis van de keuze van de competenties ligt. •
Om te begrijpen welke weg de ACM reeds heeft afgelegd en in welke mate AC’s vandaag gebruikt worden, worden
in het tweede en derde hoofdstuk de historiek en het gebruik van de methode in de praktijk besproken. Het eerste assessment center gaat terug tot kort na WO I toen de methode in het Duitse leger gebruikt werd. De techniek waaide over naar Amerika en toen AT&T de voorspellende kracht ervan aantoonde, kende de methode een sterke opgang. In de jaren zeventig stak de techniek terug de oceaan over en groeide ze ook in Europa aan populariteit. Op Europees grondgebied scoren AC’s vooral goed in Duitsland en Groot-Brittannië. Italië en Frankrijk zijn minder te vinden voor de techniek. In Wallonië staan de bedrijven meer weigerachtig tegenover de centers dan in Vlaanderen. In 1997 gebruikten reeds 24% van de grote ondernemingen in Vlaanderen en Brussel de methode. •
Zoals vermeldt in hoofstuk vier, kan de ACM zeer ruim ingeschakeld worden: voor selectiedoeleinden, voor
promotie, om het potentieel van een medewerker te onthullen, om ontwikkelingsnoden vast te leggen, om zelfevaluaties af te stemmen op assessorbeoordelingen,… •
Naast de term AC, komt ook het begrip ‘development center’ steeds vaker voor. Het gaat hier echter niet om een
modewoord. Hoofdstuk vijf leert ons dat een DC vooral verschilt van een AC door de doelstelling ervan. Terwijl het AC focust op selectie, spitst een DC zich toe op het ontdekken van ontwikkelingsbehoeften en is er bij een DC een link met scholing en opleiding. Naast de doelstelling zijn er ook andere verschillen: een assessor zal in een DC veeleer als coach dan als expert-beoordelaar optreden, de feedback is onontbeerlijk en kan tussentijds verschaft worden, een DC zal meer tijd in beslag nemen,… •
Nu bekend is wat een AC inhoudt, hoe de methode ontstaan en gegroeid is en voor welke doelstellingen de
techniek ingeschakeld kan worden, wordt dieper ingegaan op het center zelf. Zoals vermeld bestaat een center uit meerdere opdrachten. Bij het samenstellen van het programma kan uit een waaier van oefeningen gekozen worden: een postbak, een groepsdiscussie, een gesprekssimulatie, een analyse-opdracht, een presentatie, een intelligentietest,… (zie hoofdstuk zes). Belangrijk bij de keuze van de opdrachten is dat de oefening toelaat de vereiste competenties voor de functie te observeren. Deze dimensies zijn een centraal element van de ACM. Hoofdstuk zeven gaat dieper in op deze ______________________________________________________________________________________________ De Mesel Katrien
109
Algemeen besluit
dimensies of competenties en vermeldt dat dit geen wetenschappelijk geverifieerde constructen zijn. Ze mogen niet behandeld worden zoals de ‘traits’. De dimensies hebben immers niet dezelfde stabiliteit, consistentie en algemeenheid. •
In hoofdstuk acht wordt een overzicht gegeven van de partijen die bij een assessment betrokken worden. Aan een
center kunnen, naast de assessors en de assessees, nog twee partijen deelnemen: de moderator en de rollenspeler. De moderator bereidt het center voor en leidt alles in goede banen. Hij zal ook instaan voor de feedback. De rollenspelers zullen de standaardisatie van het center verhogen door bepaald gedrag bij de kandidaat uit te lokken. De rollenspeler kan een assessor of een professionele acteur zijn. •
De deskundigheid van de assessor zal in grote mate de kwaliteit van een AC bepalen en daarom is aan deze materie
een hoofdstuk gewijd. Een degelijke assessorentraining zorgt niet enkel voor meer nauwkeurige evaluaties, wat aangeleerd wordt kan ook buiten het center gebruikt worden. De vereiste duur van de opleiding kan erg verschillen en zal bepaald worden door de duur van het center, de doelstelling ervan, de complexiteit van de simulaties, de taken van de assessoren (interview, rollenspel,…), de deskundigheid van de trainer,… Toch is de kwaliteit van het center geen functie van de duur van de opleiding. Een aantal elementen moeten behandeld worden in de opleiding: de dimensies, de oefeningen, informatie over de onderneming, het beoordelingsproces, de bijkomende taken,… Hoewel trainingen in verband met beoordelingsfouten zeer frequent aangewend worden, stelt Hauenstein dat deze opleiding de nauwkeurigheid van de scores niet verhoogt. Frame-of-reference-training, die de assessors van gemeenschappelijke evaluatiestandaarden voorziet, slaagt hier wel in. Meerdere onderzoekers bepleiten het actief inoefenen van wat aangeleerd wordt. Door het doorlopen van de oefeningen kan het waarnemen en beoordelen ingeoefend worden, men leert de opdrachten kennen, men kan de toegekende scores bespreken en afstemmen op de standaard van de onderneming, het rollenspel kan doorlopen worden,… •
Hoofdstuk tien staat stil bij het beoordelingsproces. Ook voor deze fase moeten een aantal voorname beslissingen
genomen worden, bijvoorbeeld over de observatiemethode en de wijze waarop men tot een eindoordeel zal komen. -
De onderneming krijgt de keuze uit drie observatiemethoden: de traditionele methode, de behavioural checklist en
behavioural coding. De traditionele methode houdt de verschillende fasen van het beoordelingsproces gescheiden. Tijdens de observatie noteren de assessoren objectieve vaststellingen. Pas in een latere fase wordt het gedrag aan dimensies toegewezen en beoordeeld. De ‘behavioural checklist’-methode laat de assessor eveneens neerschrijven wat hij/zij ziet. In een tweede stap zal de assessor in de lijst het gedrag aanduiden dat hij/zij bij de assessee opgemerkt heeft. Op die manier moet de assessor niet zelf het gedrag toewijzen aan de dimensies. De checklist neemt deze taak over. De derde methode, behavioural coding, lijkt sterk op de vorige, maar verlost de assessor van het neerschrijven van de geobserveerde gedragingen. Reeds tijdens het observeren zal de assessor in de lijst het gedrag aanduiden. Onderzoek heeft de drie methoden vergeleken op diverse vlakken. De interbeoordelaarsbetrouwbaarheid ligt voor de behavioural checklist en voor behavioural coding op hetzelfde niveau. Deze beide methoden verschaffen immers een gemeenschappelijk beoordelingskader en bijgevolg liggen de variaties in de beoordelingen van de diverse assessoren lager dan bij de traditionele methode. De drie technieken leiden tot eenzelfde beoordelingsnauwkeurigheid, discriminantvaliditeit en nauwkeurigheid van het geschreven bewijs dat de scores verantwoordt. Tot slot ging men na hoe de assessoren de methoden ervaren hadden. Hoewel hun houding ten opzichte van de drie methoden gelijk was,
______________________________________________________________________________________________ De Mesel Katrien
110
Algemeen besluit
werd er wel een verschil gevonden in hun bereidheid om de technieken ook voor hun onderneming aan te raden. De checklist bleek het minst populair. De twee andere technieken scoorden even goed. -
Er zijn drie benaderingen omtrent de beoordeling: het rationele model, het ‘limited capacity’-model en het
expertmodel. Het rationele model acht de assessor perfect in staat om het gedrag te onderscheiden, in te delen volgens de dimensies en objectieve en nauwkeurige oordelen te vormen. Het ‘limited capacity’-model daarentegen gelooft niet dat de assessor hiertoe in staat is. Tot slot stelt het expertmodel dat professionele assessoren over cognitieve structuren beschikken, die ze gebruiken bij het beoordelen van kandidaten. -
Voor de integratie van de scores bieden zich twee alternatieven aan: de discussie of de beslissingsregel. In de
discussie wisselen de assessoren hun vaststellingen uit en komen ze tot een consensus omtrent de eindbeoordeling. Hoewel in de praktijk de discussie de meest gangbare werkwijze is, blijkt een beslissingsregel dezelfde voorspellende kracht te bezitten. •
Een onderneming kan ervoor opteren de ACM in te schakelen, maar een AC komt natuurlijk niet uit de lucht
gevallen. Vooraleer van start kan worden gegaan, zal men eerst aandacht moeten schenken aan de ontwikkeling van het center (hoofdstuk 11). Het ontwikkelingsproces wordt door Seegers en Esser in vier fasen opgedeeld. In de eerste fase gebeurt de inventarisatie: de doelstelling van het center wordt bepaald, de functies vastgelegd en de functiebeschrijving uitgevoerd. De tweede stap is de operationalisatie: selectie en training van de assessoren, selectie en instructie van de assessees en de selectie en ontwikkeling van de oefeningen. In de uitvoeringsfase zal het draaiboek samengesteld worden en zal het AC effectief doorgaan. Tot slot is er de eindevaluatie: het eindoordeel wordt gevormd, de feedback naar de kandidaat en de onderneming vindt plaats en de evaluatie van het AC-programma wordt uitgevoerd. Bij het samenstellen van het AC-programma staat de onderneming voor de keuze: bestaande oefeningen overnemen en aanpassen of zelf oefeningen ontwerpen. De zelf ontwikkelde opdrachten zijn duurder, maar sluiten beter aan bij de onderneming en de functie. Ahmed et al. ontwikkelden een model dat de ontwerper begeleidt en de aandacht vestigt op belangrijke aspecten tijdens het ontwikkelingsproces. •
Het ontwerpen en gebruiken van een center loopt niet steeds van een leien dakje. De onderneming kan met diverse
vragen en problemen geconfronteerd worden. Zo is het op vlak van de dimensies niet steeds duidelijk hoeveel en welke competenties beoordeeld moeten worden, hoe specifiek ze omschreven moeten worden en welke oefeningen het testen ervan mogelijk maken. Bij de selectie van de assessoren moet men beslissen of men ook lijnmanagers zal betrekken in het beoordelingsproces en welke opleiding men aan de assessors zal verschaffen. Bij de observatie en beoordeling kunnen diverse beoordelingsfouten de resultaten van het center vertekenen. Hoe kan men vermijden dat de feedback medewerkers demotiveert? Voor een aantal vragen of problemen is de oplossing beschikbaar. Men moet er enkel van op de hoogte zijn. Vandaar dat de bespreking van de knelpunten in hoofdstuk twaalf, een belangrijke bron van informatie kan zijn. •
Zoals elke techniek heeft ook de ACM zowel positieve als negatieve kanten. In hoofdstuk dertien wordt een
overzicht gegeven. Bij de voordelen staan de voorspellingskracht, de billijkheid en de face-validiteit bovenaan het lijstje. Daarnaast wordt de ontwikkeling van de competenties bevorderd, kan de communicatie gebeuren in gedragsterminologie in plaats van in psychologisch jargon,... Er zijn ook secundaire effecten te onderscheiden: de assessoren leren vaardigheden die ook buiten het center van pas komen, kandidaten leren uit de reacties van anderen,…
______________________________________________________________________________________________ De Mesel Katrien
111
Algemeen besluit
Een belangrijk voordeel is de billijkheid. Hier presteren AC’s duidelijk beter dan klassieke tests. De verschillen in kandidaten van andere culturen blijken alvast kleiner. Nochtans stellen niet alle onderzoekers vast dat de discriminatie in AC’s afwezig zijn. De cognitieve inhoud van de oefeningen in het center blijkt een rol te spelen: mondelinge, interactieve en gedragsgebaseerde oefeningen discrimineren minder. Ook voor het geslacht toonden slechts enkele studies een verschil aan. De billijkheid van de methode ligt dus hoog. Toch zal veel afhangen van de deugdelijkheid van de ontwikkeling en organisatie van het center. Naast een aantal kleinere nadelen (ontgoocheling van slecht beoordeelde kandidaten, lage constructvaliditeit,…), blijkt vooral de kostprijs een struikelblok te zijn. Nochtans stelt men bij het uitvoeren van een utiliteitsanalyse vast dat de baten de kosten overtreffen. Bovendien worden diverse acties ondernomen om de kosten te reduceren: het inschakelen van de computer, gebruik van video-opnames, nieuwe oefeningen,… •
Hierboven werd reeds verwezen naar de hoge voorspellende validiteit en de lage constructvaliditeit. Hoofdstuk
veertien geeft een gedetailleerd beeld van de vaststellingen op vlak van de validiteit en vermeldt de beïnvloedende factoren en de oorzaken van de interbeoordelaarsbetrouwbaarheid, de face-validiteit, de voorspellende validiteit en de constructvaliditeit. -
De interbeoordelaarsbetrouwbaarheid schommelt tussen een gemiddeld en een hoog niveau. De ‘opportunity to
observe’, de gemeenschappelijke waardeschema’s van de assessoren, de consistentie van het gedrag, het gebruik van informatie van buiten het center,… bepalen de waarde. -
De face-validiteit is belangrijk voor de aanvaarding van de resultaten en de feedback door de kandidaten. De
ACM scoort zeer hoog. -
(Bijna) niemand twijfelt aan de voorspellingskracht van de ACM. Over de oorzaken is er echter meer discussie:
ontstaat deze door de observatie van functierelevant gedrag of zijn er ongewenste positieve invloeden (directe criteriumcontaminatie, indirecte contaminatie, self-fulfilling prophecy, autobiografische performantieconsistentie, meting van de intelligentie,…) in het spel. Een aantal factoren verhogen de predictieve validiteit: het gebruik van psychologen als assessors, meer ‘opportunity to observe’, een groter aantal simulatie, evaluatie van potentieel in plaats van prestatiebeoordeling, beoordeling door collega’s in plaats van door managers,… -
De constructvaliditeit heeft al heel wat onderzoekers kopzorgen bezorgt. Zowel de convergent- als de
discriminantvaliditeit liggen laag. Vooral voor een DC is dat een probleem omdat het belang van de dimensiescores daar veel hoger ligt dan bij een AC. Diverse onderzoekers hebben de constructvaliditeit alsnog proberen aan te tonen. De ‘unitarian conceptualization of validity’ stelt immers dat bij aanwezigheid van inhouds- en criteriumvaliditeit, ook de constructvaliditeit hoog moet zijn. Andere onderzoekers focussen hun onderzoek op het achterhalen van de werkelijke beoordeelde constructen in een center. Chan gelooft bijvoorbeeld dat de assessoren de ‘toekomstige promotie’ van een kandidaat beoordelen in plaats van diens toekomstige performantie. De lage constructvaliditeit heeft de onderzoekers over drie kampen verdeeld: zij die de AC’s blindelings steunen, zij die pleiten voor de vervanging van de dimensies door taken (ook hier stuit men echter op nadelen) en zij die de oorzaken trachten te achterhalen. In deze laatste groep zijn er diverse denkpistes: beoordelingsfouten, oefeningeffecten (de prestaties van de kandidaat verschillen in de diverse opdrachten), de onderscheidbaarheid van de dimensies, de ‘opportunity to observe’, foute statistische methoden,… Men is ook op zoek gegaan naar de factoren die de constructvaliditeit modificeren. De hoeveelheid en de conceptuele onafhankelijkheid van de dimensies blijken belangrijk. De aard van de dimensies niet. Psychologen blijken betere beoordelaars en ook de duur en het type van de opleiding zijn van belang: frame-of-reference-training levert de hoogste ______________________________________________________________________________________________ De Mesel Katrien
112
Algemeen besluit
nauwkeurigheid. Actieve rollenspelers kunnen aanzienlijk bijdragen aan de convergent- en discriminantvaliditeit. Ook de opdrachtsoort (rollenspel, discussie,…) is bepalend. Het vooraf bekendmaken van de dimensies aan de kandidaten wordt eveneens aangeraden. Op vlak van observatie- en evaluatieprocedures wordt best eenzelfde schaal voor het hele center gebruikt. Checklists kunnen de constructvaliditeit verhogen wanneer de items in natuurlijke clusters geordend zijn en het aantal gedragsvoorbeelden per dimensie beperkt wordt. Terwijl het rotatieschema van de assessoren een rol speelt (niet steeds dezelfde assessor), levert het herbekijken van de videoband geen meerwaarde. Uit de hele waslijst adviezen die in de literatuur gevonden worden, zijn dit de voornaamste: beperk het aantal dimensies en omschrijf ze zorgvuldig, voorzie in goede assessoropleiding die de beoordelaars een referentiekader bijbrengt, verduidelijk de competenties naar de kandidaten toe, schakel psychologen in bij de beoordeling, stel checklists ter beschikking, voorzie gestandaardiseerde stimuli, beperk het aantal kandidaten per assessor (maximum vier),… •
Een AC (en vooral een DC) is geen eindpunt, maar het begin van een ontwikkelingsproces van de kandidaat.
Hoofdstuk vijftien schetst de factoren die de trainbaarheid van een persoon beïnvloeden: persoonsgebonden factoren (leervermogen, leerbereidheid, waarde en normen, en persoonlijkheid) en omgevingsfactoren (cultuur van de organisatie, tolerantie voor fouten,...). Daarnaast kunnen een aantal competenties niet (voor elke context) aangeleerd worden: sociabiliteit, motivatie, leercapaciteit, oordeelsvorming,… •
De ACM heeft in het verleden al een hele weg afgelegd en zal dat waarschijnlijk ook in de toekomst doen.
Hoofdstuk zestien werpt een blik op de toekomst en schetst de verwachte evoluties van de methode: de techniek zal doordringen in alle niveaus van de onderneming. Verder zal de duur dalen, zal het aantal assessoren en dimensies afnemen en zal de ontwikkeling steeds vaker intern gebeuren. Ook de computer en de video-opnames zullen hun opgang verder zetten. Men verwacht ook dat de dimensies verder op de toekomst gericht zullen worden en dat bij de selectie ervan rekening zal gehouden worden met toekomstige behoeften. Omtrent de doelstelling van het center verwacht men een accentverschuiving van selectie naar ontwikkeling en ook team-assessment zal in belang winnen. Tot slot zal het realiteitsgehalte van de centers toenemen. •
Een beschrijving van het empirisch onderzoek werd opgenomen in hoofdstuk zeventien. Dit onderzoek had als
doelstelling na te gaan in welke mate de ACM binnengedrongen is bij de grote banken die in België actief zijn. De omstandigheden en kenmerken van de AC’s werden nagegaan. In vijf van de zes gecontacteerde bedrijven werd de methode toegepast. De techniek in geen enkele bank ingezet voor bedienden. Enkel kader- en directieleden doorlopen de centers. De meest frequente doelstelling is de selectie van interne en externe personen. Er is wel een verschuiving merkbaar naar andere toepassingen, zoals development. Meestal laat de kredietinstelling zich bijstaan door een externe partner, maar toch laat men zich niet afschrikken en worden ook intern centers ontworpen. Meestal wordt hierbij vertrokken vanuit de functie-analyse, leidt men daaruit de dimensies af en gaat men dan de oefeningen vastleggen. Anderen vertrekken onmiddellijk vanuit een lijst met dimensies of vanuit de missie van de onderneming. De duur van de centers situeert zich meestal rond één dag of een halve dag. Het aantal kandidaten varieert tussen één en acht en ook het aantal oefeningen ligt in dit bereik. De meest populaire oefeningen blijken (in dalende volgorde) de postbak, het interview, het rollenspel, de groepsdiscussie, persoonlijkheidsvragenlijst, de presentatie en de intelligentietest. Aanpassing van het programma afhankelijk van de functie van de kandidaat is afwezig (eventueel zal men wel de inhoud van het rollenspel wijzigen). De centers zijn vaak opgezet voor een functieniveau en niet voor een specifieke functie. ______________________________________________________________________________________________ De Mesel Katrien
113
Algemeen besluit
Het aantal dimensies ligt zeer hoog (vb. vijftien). Dit is duidelijk een te verbeteren aspect. De meest geobserveerde dimensies blijken: analyseren, planning en organisatie, beslissen, klantgericht handelen, communicatievaardigheden, creativiteit, leiderschap, overtuigen en stressbestendigheid. Deze competenties worden algemeen omschreven. Het vooraf mededelen van de dimensies aan de kandidaten is nergens terug te vinden, nochtans zou dit de constructvaliditeit ten goede komen. In de onderzochte banken lag het aantal assessoren meestal rond vijf of zes. Een zeer positief aspect is dat deze beoordelaars meestal slechts één persoon tegelijk dienen te observeren. De assessoren zijn interne personen, al dan niet aangevuld door externe beoordelaars. Naast de personeelsdienst, was in drie banken ook het management bij de evaluaties betrokken. De frequentie van hun optreden ligt meestal voldoende hoog. De training van de assessoren loopt erg uiteen. Meestal waren wel psychologen aanwezig als assessor. Systematische opfrissingscursussen ontbraken. De observatie gebeurde ofwel op de traditionele methode (waarnemingen neerschrijven) ofwel door gedragsgeankerde schalen. De integratie van de gegevens gebeurt meestal via een discussie. Slechts één bank gebruikt een beslissingsregel. Meestal wordt een beperkte relevantieduur toegekend aan de resultaten (vaak 3-5 jaar). De feedback wordt meestal uitgesteld tot het rapport beschikbaar is. De assessee kan dan meestal veel informatie bekomen. Geheel onverwacht werd vastgesteld dat twee banken de kandidaten een kopie van dit rapport meegeven. In één kredietinstelling krijgen ook het management, het topmanagement… een kopij. Het onderzoek binnen de banken blijft meestal beperkt tot een evaluatie na afloop van het center. Ook de face-validiteit wordt in het oog gehouden. Onderzoek naar de voorspellende-, constructvaliditeit,… werd nergens vastgesteld. Voor toekomstig onderzoek zijn er nog oneindig veel suggesties te formuleren. In elk van de voorgaande hoofdstukken zijn steeds een aantal voorstellen geformuleerd. Hier beperk ik me tot een paar: in het beoordelingsproces zou men de invloed van verwachtingen en cognitieve structuren kunnen achterhalen. Men kan onderzoeken of groepsoefeningen het afstemmen van de zelfevaluaties op de beoordelingen door assessoren bevorderen. Ook de impact van de kenmerken van een assessorenkorps, de groepdynamieken en de persoonlijke kenmerken van de assessoren op de eindscore zijn nog niet duidelijk. Er is eveneens nog ruimte voor studies die de oorzaken van de voorspellende validiteit achterhalen of die de werkelijk gemeten constructen in de AC’s vastleggen. Nu per hoofdstuk de voornaamste conclusies nog eens vermeld zijn, wens ik nog een laatste opmerking te formuleren: wanneer een center goed ontworpen en georganiseerd is, zal het een hoge waarde leveren. Alles staat of valt met de ernst van de aanpak. Ik overliep verschillende aspecten die de degelijke opbouw en uitvoering van een center garanderen en hoop bijgevolg dat deze scriptie bijdraagt tot het verspreiden en verbeteren van de AC’s in de praktijk.
______________________________________________________________________________________________ De Mesel Katrien
114
Algemeen besluit
Lijst van geraadpleegde werken ♦ AHMED Y., PAYNE T. en WHIDDETT S., 1997, Professional Forum: A Process for Assessment Exercise Design: a Model op Best Practice, International Journal of Selection And Assessment, vol. 5, nr. 1, January 1997, blz. 62-68. ♦ Assessment center-methode beoordeeld, In: H.R.M.-items. Verslag van studiedag van de I.P.O. Management School, ced.samsom, Diegem, blz. 15-20. ♦ BARTELS L. K. en DOVERSPIKE D., 1997, Assessing the assessor: The Relationship of Assessor Personality to Leniency in Assessment Center Ratings, Journal of Social Behavior and Personality, vol. 12, nr. 5, 1997, blz. 179-190. ♦ BERGENHENEGOUWEN G. J., MOOIJMAN E. A. M. en TILLEMAN H. H., 1999, Strategisch opleiden en leren in organisaties, Kluwer, Deventer, 400 blz., blz. 157-178. ♦ BRAL J., 2000, De plaats van de assessment center methode in het selectieproces, HRJaarboek Personeelsbeleid in België 2000, blz. 110-112. ♦ BRISCOE D. R., 1997, Assessment Centers: Cross-cultural and Cross-national issues, Journal of Social Behavior and Personality, vol. 12, nr. 5, 1997, blz. 261-270. ♦ BURNS C., 1989, Individual Interviews, In: FOSTER A. en ROBSON S. (red.), Qualitative Research in Action, Edward Arnold, London, blz. 47-57. ♦ BUYENS D., VANDENBOSSCHE T. en SCHELSTRAETE S., 1996, De human resources-functie in profiel, een onderzoek van de Vlerick School voor Management, Jaarboek personeelsbeleid in België 1996, blz. 15-45. ♦ CHAN D., 1996, Criterion and Construct Validation of an Assessment Centre, Journal of Occupational and Organizational Psychology, vol. 69, nr. 2, Juni 1996, blz. 167-181. ♦ CLAPHAM M. M., 1998, A Comparison of Assessor and Self Dimension Ratings in an Advanced Management Assessment Centre, Journal of Occupational and Organizational Psychology, vol. 71, nr. 3, September 1998, blz. 193-202. ______________________________________________________________________________________________ De Mesel Katrien
XI
Lijst van geraadpleegde werken
♦ DE PELSMACKER P. en VAN KENHOVE P., 1999, Marktonderzoek Methoden en toepassingen, Garant, Leuven/Apeldoorn, 737 blz. ♦ DONAHUE L. M., TRUXILLO D. M., CORNWELL J. M. en GERRITY M. J., 1997, Assessment Center Construct Validity and Behavioral Checklists: Some Additional Findings, Journal of Social Behavior and Personality, vol. 12, nr. 5, 1997, blz. 85-108. ♦ FLETCHER C., 1996, It Pays To Be Aware of the Subtle Inequalities, People Management, vol. 2, nr. 22, 11/07/96, blz. 50. ♦ FLETCHER C., 1997, Self Awareness – A Neglected Attribute in Selection and Assessment?, International Journal of Selection and Assessment, vol. 5, nr. 3, juli 1997, blz. 183-187. ♦ FLETCHER C., LOVATT C. en BALDRY C., 1997, A Study of State, Trait, and Test Anxiety, and Their Relationship to Assessment Center Performance, Journal of Social Behavior and Personality, vol. 12, nr. 5, 1997,blz. 205-214. ♦ FLETCHER C. en ANDERSON N., 1998, A Superficial Assessment, People Management, vol. 4, nr. 10, 14/05/1998, blz. 44-46. ♦ FOSTER A. en ROBSON S., 1989, The Analysis and Interpretation Process, In: FOSTER A. en ROBSON S. (red.), Qualitative Research in Action, Edward Arnold, London, blz. 85-99. ♦ FOX S., LEVONAI-HAZAK S. en HOFFMAN M., 1995, The Role of Biodata and Intelligence in the Predictive Validity of Assessment Centres, International Journal of Selection and Assessment, vol. 3, nr. 1, January 1995, blz. 20-28. ♦ GOEMAERE H., BRANTS K. en LIEVENS F., 1997, De assessment center-methode in Vlaanderen: een inventarisatie van praktische knelpunten, HRJaarboek Personeelsbeleid in België 1997, blz. 149-155. ♦ GOLDSTEIN H. W., YUSKO K. P., BRAVERMAN E. P., SMITH D. B. en CHUNG B., 1998, The Role of Cognitive Ability in the Subgroup Differences and Incremental Validity of Assessment Center Exercices, Personnel Psychology, vol. 51, nr. 2, Summer 1998, blz. 357-372.
______________________________________________________________________________________________ De Mesel Katrien
XII
Lijst van geraadpleegde werken
♦ HAKSTIAN A. R. en HARLOS K. P., 1993, Assessment of In-Basket Performance by Quickly-Scored Methods: Development and Psychometric Evaluation, International Journal of Selection and Assessment, vol.1, nr. 3, Juli 1993, blz. 135-142. ♦ HALMAN F., FLETCHER C., RANDAL R., FERGUSON E. en PATTERSON F., 2000, The Impact of Development Centre Participation and The Role of Individual Differences in Changing Self-assessment, Journal of Occupational and Organizational Psychology, vol. 73, nr. 4, December 2000, blz. 423-459. ♦ HAUENSTEIN N. M. A., 1998, Training Raters to Increase the Accuracy of Appraisals and the Usefulness of Feedback, In: SMITHER J. W. (red.), Performance Appraisal. State of the Art in Practice, Jossy-Bass Publishers, San Francisco, blz. 404-442. ♦ HAY J., 1999, Assessment en development centres, In: LANDALE A. (red.), Gower Handbook of Training and Development, Hampshire, Gower, blz. 397-406. ♦ HENNESSY J., MABEY B. en WARR P., 1998, Assessment Center Observation Procedures: An Experimental Comparison of Traditional, Checklist and Coding Methods, International Journal of Selection and Assessment, vol. 6, nr. 4, October 1998, blz. 222-231. ♦ HOEFT S. en SCHULER H., 2001, The Conceptual Basis of Assessment Centre Ratings, International Journal of Selection and Assessment, vol. 9, nr. 1/2, March/June 2001, blz. 114-123. ♦ HOWARD A., 1997, A Reassessment of Assessment Centers: Challenges for the 21st Century, Journal of Social Behavior and Personality, vol.12, nr. 5, 1997, blz. 13-52. ♦ HUBERMAN A. M. en MILES M. B., 1984, Qualitative Data Analyses, Sage Publications, London, 262 blz. ♦ JANSEN P. G. W. en DE JONGH F. D., 1993, Assessment Centers een open boek, Het Spectrum, Utrecht, 200 blz. ♦ JANSEN P. en STOOP B., 1994, Assessment Center Graduate Selection: Decision Processes, Validity, and Evaluation by Candidates, International Journal of Selection and Assessment, vol. 2, nr. 4, October 1994, blz. 193-208. ♦ JOINER D. A., 2000, Guidelines and Ethical Considerations for Assessment Center Operations, Public Personnel Management, vol. 29, nr. 3, Herfst 2000, blz. 315-331. ______________________________________________________________________________________________ De Mesel Katrien
XIII
Lijst van geraadpleegde werken
♦ JONES R. G., 1997, A Person Perception Explanation for Validation Evidence from Assessment Centers, Journal of Social Behavior and Personality, vol. 12, nr. 5, 1997, blz. 169-178. ♦ KLEINMANN M. en KOLLER O., 1997, Construct Validity of Assessment Centers: Appropriate Use of Confirmatory Factor Analysis and Suitable Construction Principles, Journal of Social Behavior and Personality, 1997, vol. 12, nr. 5, blz. 65-84. ♦ KUDISCH J. D., LADD R. T. en DOBBINS G. H., 1997, New Evidence on the Construct Validity of Diagnostic Assessment Centers: The Findings May Not Be So Troubling After All, Journal of Social Behavior and Personality, vol. 12, nr. 5, 1997, blz. 129-144. ♦ KUPTSCH C. en KLEINMANN M., 1998, The Chameleon Effect in Assessment Centers: The Influence of Cross-situational Behavioral, Journal of Social Behavior and Personality, vol. 13, nr. 1, March 1998, blz. 103-116. ♦ LAMSDALE C., WOOD R. en MULROONEY C., 1999, An Alternative to an Assessment Center on Six Pieces of Paper?, International Journal of Selection and Assessment, vol.7, nr. 3, September 1999, blz. 170-176. ♦ LIEVENS F., 1998, Factors which Improve the Construct Validity of Assessment Centers: A Review, International Journal of Selection and Assessment, vol. 6, nr. 3, July 1998, blz. 141-152. ♦ LIEVENS F., 1998b, Assessment center methode. Vergeet de training van assessoren niet, HRJaarboek Personeelsbeleid in België 1998, blz. 212-215. ♦ LIEVENS F. en GOEMAERE H., 1999, A Different Look At Assessment Centers: View Of Assessment Center Users, International Journal Of Selection And Assessment, vol. 7, nr. 4, December 1999, blz. 215-219. ♦ LIEVENS F. en KLIMOSKI R. J., 2001, Understanding The Assessment Centre Process: Where Are We Now?, International Review of Industrial and Organizational Psychology, vol. 16, blz. 245-287. ♦ LIEVENS F. en VAN KEER E., 2000, Assessment centers in België: de resultaten van een onderzoek naar de voorspellende kracht en de billijkheid, Economisch en sociaal tijdschrift, vol. 54, nr. 1, maart 2000, blz. 67-87. ______________________________________________________________________________________________ De Mesel Katrien
XIV
Lijst van geraadpleegde werken
♦ LOWRY P. E., 1997, The Assessment Center Process: New Directions, Journal of Social Behavior and Personality, 1997, vol. 12, nr. 5, blz. 53-64. ♦ MAYES B. T., 1997, Insights Into the History and Future of Assessment Centers: An Interview with Dr. Douglas W. Bray and Dr. William Byham, Journal of Social Behavior and Personality, 1994, vol. 12, nr. 5, blz. 3-12. ♦ MOSER K., SCHULER H. en FUNKE U., 1999, The Moderating Effect of Raters’ Opportunities to Observe to Ratees’ Job Performance on the Validity of an Assessment Centre, International Journal of Selection and Assessment, vol. 7, nr. 3, September 1999, blz. 133-141. ♦ NIJSSEN A. M., 2000, Praktische toepassingen van het assessment center, Uitgeverij H. Nelissen, Baarn, 131 blz. ♦ NOWACK K. M., 1997, Congruence Between Self-other Ratings and Assessment Center Performance, Journal of Social Behavior and Personality, vol. 12, nr. 5, 1997, blz. 145-166. ♦ SAGIE A. en MAGNEZY R., 1997, Assessor Type, Number of Distinguishable Dimension Categories, and Assessment Center Construct Validity, Journal of Occupational and Organizational Psychology, vol. 70, nr. 1, March 97, blz. 103-108. ♦ SHACKLETON V. en NEWELL S., 1994, European Management Selection Methods: A Comparison of Five Countries, International Journal of Selection and Assessment, vol. 2, nr. 2, April 1994, blz. 91-102. ♦ SHORE T. H., TASHCHIAN A. en ADAMS J. S., 1997, The Role of Gender in a Developmental Assessment Center, Journal of Social Behavior and Personality, vol. 12, nr. 5, 1997, blz. 191-203. ♦ SHORE L. M., TETRICK L. E. en SHORE E. T., 1998, A Comparison of Self-, Peer, and Assessor Evaluations of Managerial Potential, Journal of Social Behavior and Personality, vol. 13, nr. 1, March 1998, blz. 8-101. ♦ TILLEMA H. H., 1998, Assessment of Potential, from Assessment Centers to Development Centers, International Journal of Selection and Assessment, vol. 6, nr. 3, July 1998, blz. 185-191. ♦ THORNTON G. C., TZINER A., DAHAN M., CLEVENGER J. P. en MEIR E., 1997, Construct Validity of Assessment Center Judgements: Analyses of the Behavioral Reporting Method, Journal of Social Behavior and Personality, vol. 12, nr. 5, 1997, blz. 109-128. ______________________________________________________________________________________________ De Mesel Katrien
XV
Lijst van geraadpleegde werken
♦ VALLET N., DEMAREST S. en HENDERICKX E., 1995, Het rekruteringsbeleid in Vlaanderen: de resultaten van een survey-onderzoek, Economisch en Sociaal Tijdschrift, vol. 49, nr. 1, maart 1995, blz. 89110. ♦ VAN BEIRENDONCK L., 1998, Beoordelen en ontwikkelen van competenties. Assessment center, development centers en aanverwante technieken, Acco, Leuven, 196 blz. ♦ VAN MINDEN J. J. R., 1998, Alles over assessment center. Dé verzekering voor een geslaagd assessment!, zesde druk, Uitgeverij L.J. Veen, Amsterdam/Antwerpen, 270 blz. ♦ VLOEBERGHS D., 1997, Handboek Human Resource Management, Managementcompetenties voor de 21ste eeuw, Acco, Leuven/Amersfoort, 411 blz. ♦ VOCAP, ‘Werkgroep Assessment Centers Vlaanderen (1992). Richtlijnen en ethische overwegingen bij het toepassen van de Assessment Center Methode. Ongepubliceerd manuscript.’ ♦ WIJCHERS L., VAN DEN BERG J. en KLOP H., 1992, Selecteren Beoordelen Opleiden Praktische personeelsinstrumenten, de SBO-benadering, Samsom Bedrijfsinformatie, Alphen aan de Rijn, 235 blz., blz. 10-12. ♦ WINFRED A., WOEHR D. J. en MALDEGEN R., 2000, Convergent and Discriminant Validity of Assessment Center Dimensions: A Conceptual and Empirical Re-examination of the Assessment Center Construct-Related Validity Paradox, Journal of Management, vol. 26, nr. 4, 2000, blz. 813-835. ♦ WOODRUFFE C., 1997, Going back a generation, People Management, vol. 3, nr. 4, 02/20/1997, blz. 32-35. Websites: ♦ Tip Concepts, Anxiety, URL:
. (07/04/2002). ♦ Trends, URL: <www.top100000.be>. (08/02/2002). ♦ SHS-Counseling
Center,
05/09/00,
Test
Anxiety,
URL:
stresstestanxiety.html>. (07/04/2002).
______________________________________________________________________________________________ De Mesel Katrien
XVI
Lijst van geraadpleegde werken
♦ Salar: Study And Learning Assessment Resource, Learning Activity Measuring Trait Anxiety, URL: . (07/04/2002).
______________________________________________________________________________________________ De Mesel Katrien
XVII
Lijst van geraadpleegde werken
Bijlagen Bijlage 1: Vragenlijst empirisch onderzoek
______________________________________________________________________________________________ De Mesel Katrien
XVIII
Bijlagen
Bijlage 1: Vragenlijst empirisch onderzoek
Onderneming: ……………………………………………………………………………………... Naam en functie: …………………………………………………………………………………... ……………………………………………………………………………………………………... Datum: ………………………………
Geachte Ik ben laatstejaarsstudente Toegepaste Economische Wetenschappen aan de Universiteit Gent en mijn thesis gaat over ‘assessment centers’. Een deel van mijn scriptie bestaat eruit empirisch onderzoek te verrichten naar het gebruik van assessment centers, in het bijzonder in de grootste Belgische banken. Aan de hand van deze vragenlijst wil ik peilen in hoeverre de techniek in de praktijk aanwezig is en onder welke omstandigheden. Ik ben me ervan bewust dat een aantal vragen niet gemakkelijk te beantwoorden zijn. Het beantwoorden van alle vragen is niet verplicht, maar zou mij ten zeerste helpen. De bekomen informatie wordt als confidentieel beschouwd en zal bijgevolg niet doorgegeven worden aan derden of voor een andere doelstelling dan hierboven vermeld gebruikt worden. Verder wil ik u alvast bedanken voor de vriendelijke medewerking. Katrien De Mesel
______________________________________________________________________________________________ De Mesel Katrien
XIX
Bijlagen
VRAGENLIJST IN VERBAND MET HET GEBRUIK VAN ASSESSMENT CENTERS Gebruik •
Gebruikt de onderneming de assessment centermethode? Ja / Nee (Schrap wat niet past)
INDIEN NEEN • Wat is de reden hiervoor? (Kruis het vakje aan dat van toepassing is.) r We kennen de techniek niet r Te duur r Te moeilijk r Tevreden met huidige methode r ………………………………………………………………………………………………
………………………………………………………………………………………………….. r ……………………………………………………………………………………………… ………………………………………………………………………………………………….. r Weet ik niet of mag ik niet vrijgeven •
Heeft de onderneming de methode ooit al eens geprobeerd? Ja / Nee r Nee r Ja: Waarom wordt ze nu niet meer gebruikt? ……..………………………………………………..
………………………………………………………………………………………………… ………………………………………………………………………………………………… ………………………………………………………………………………………………… De vragenlijst is voor u al op zijn einde gelopen. Bedankt voor uw medewerking. INDIEN JA • Hoe lang gebruikt de onderneming deze methode al? Ongeveer …………… jaar. •
Hoe vaak wordt door de onderneming een assessment center georganiseerd (vb. om de drie weken)?
…………………………………………………………………………………………………… …………………………………………………………………………………………………… •
Waarvoor wordt de assessment centermethode gebruikt? r Selectie r Development (ontdekken van opleidingsnoden bij personeelsleden) r Evaluatie van potentieel r Opvolgingsplanning (zorgen dat individuen beschikbaar zijn met de nodige competenties) r …………………………………………………………………………. r ………………………………………………………………………….
BIJ SELECTIE (Wordt de assessment center techniek niet gebruikt voor selectie, sla dit deel dan over.) • Voor welke functie(niveau)(s)?
……………………………………………………………………………………………… ……………………………………………………………………………………………… ………………………………………………………………………………………………
______________________________________________________________________________________________ De Mesel Katrien
XX
Bijlagen
• Wordt het assessment center gebruikt in combinatie met andere selectiemethoden, bijvoorbeeld om het aantal kandidaten van het assessment center te beperken? Ja / Nee / Geen mening Zo ja, welke? m Sollicitatiebrief m Interview m (Vragenlijst) m …………………………………………………………………………… m …………………………………………………………………………… m …………………………………………………………………………… BIJ DEVELOPMENT, POTENTIEELEVALUATIE, OPVOLGINGSPLANNING,… (Wordt de methode niet voor dit doel gebruikt, sla dit deel dan over.) • Voor welke functie(niveau)(s)?
……………………………………………………………………………………………… ……………………………………………………………………………………………… ……………………………………………………………………………………………… •
Hoe worden de deelnemers geselecteerd? m Het assessment center wordt aangekondigd en geïnteresseerden mogen inschrijven. m De onderneming selecteert personen die in aanmerking komen. m Combinatie m ……………………………………………………………………………………………..
………………………………………………………………………………………………… ………………………………………………………………………………………………… Wie doet wat Duid voor elk van volgende aspecten aan wie de uitvoering ervan verzorgt: de onderneming zelf, een externe partner of samen. Kruis het gepaste vakje aan. - Ontwikkeling van het assessment center - Selectie kandidaten/deelnemers - Assessoren (zijn dit interne of externe personen?) - Training assessoren - Selectie assessoren - Praktische organisatie - Evaluatie van het assessment center - Feedback naar de kandidaten - Opstellen assessment center programma - Selectie van dimensies - Opstellen trainingsplan (bij development) - Opvolgen trainingsplan (bij development)
Intern r r r r r r r r r r r r
Extern r r r r r r r r r r r r
Samen r r r r r r r r r r r r
Geen mening r r r r r r r r r r r r
Ontwikkeling •
Wie ontwikkelde het AC? r De onderneming zelf: Ga naar A. r Zelf met hulp van een extern consultant: Ga naar B. r Extern: Ga naar C.
______________________________________________________________________________________________ De Mesel Katrien
XXI
Bijlagen
A. ZELF Wie in de onderneming heeft het AC ontwikkeld?
…………………………………………………………………………………………… …………………………………………………………………………………………… …………………………………………………………………………………………… Had(den) deze perso(o)n(en) opleiding genoten op dit vlak? Ja / Nee / Geen mening Zo ja, welke? …………………………………………………………………………….
…………………………………………………………………………………………… …………………………………………………………………………………………… Hoe ging men bij de ontwikkeling te werk?
…………………………………………………………………………………………… …………………………………………………………………………………………… …………………………………………………………………………………………… …………………………………………………………………………………………… ………………………………………………………………………………………… B.
INTERN EN EXTERN Wie in de onderneming werkte mee aan de ontwikkeling?
…………………………………………………………………………………………… …………………………………………………………………………………………… Wie was de externe partner (vb. selectiebureau, gespecialiseerd consultancybureau,…)?
…………………………………………………………………………………………… …………………………………………………………………………………………… Hoe ging men te werk bij de ontwikkeling? ……………………………………………………………………………………………………………… ……………………………………………………………………………………………………………… ……………………………………………………………………………………………………………… ……………………………………………………………………………………………………………… Wat was de inbreng van de onderneming?
…………………………………………………………………………………………… …………………………………………………………………………………………… C. EXTERN Wie was de externe partner (vb. selectiebureau, gespecialiseerd consultancybureau,… eventueel ook de naam)?
…………………………………………………………………………………………… ……………………………………………………………………………………………
Hoe ging men te werk bij de ontwikkeling (indien bekend)?
…………………………………………………………………………………………… …………………………………………………………………………………………… …………………………………………………………………………………………… …………………………………………………………………………………………… ……………………………………………………………………………………………
______________________________________________________________________________________________ De Mesel Katrien
XXII
Bijlagen
Inhoud •
Wat is de (gemiddelde) duur van een assessment center (vb. in dagen)?
…………………………………………………………………………………………………… •
Zijn er sterke verschillen in de duur bij de verschillende centers? Ja / Nee / Geen mening
•
Hoeveel kandidaten nemen (gemiddeld) aan een assessment center deel?
……………………………………………………………………………………………………. •
Uit hoeveel oefeningen bestaat een (gemiddeld) assessment center programma?
……………………………………………………………………………………………………. • r r r r
Welke van de volgende opdrachten maken vaak deel uit van het programma? Persoonlijkheidstest Interview Intelligentietest Situatietests: r Postbak/in-basket r Presentatie r Tweegesprek m Slecht-nieuwsgesprek m Coachinggesprek m Selectie-interview m Functioneringsgesprek m Verkoopgesprek m Conflictgesprek m Adviesgesprek m ……………………………………. m ……………………………………. m Weet ik niet of kan ik niet vrijgeven r Fact-finding/Analyseoefening r Groepsdiscussie r Planningsopdracht r Vergadering r Business game r Schriftelijke stukken produceren (klachtbrief, marketingplan, nota,…) r …………………………………………………………………………………………… r …………………………………………………………………………………………… r …………………………………………………………………………………………… r …………………………………………………………………………………………………. r …………………………………………………………………………………………………. • Gebeuren er aanpassingen van het assessment center programma voor verschillende functies? Ja / Nee / Geen mening Zo ja, wie bepaalt de inhoud van het programma?
…………………………………………………………………………………………………… …………………………………………………………………………………………………… • Wordt het programma van het assessment center periodiek aangepast? (vb. wanneer de inhoud van een functie verandert, omdat andere eisen gesteld worden voor een functie,…) Ja / Nee / Geen mening Zo ja, door wie worden de wijzigingen aangebracht?
…………………………………………………………………………………………………… ……………………………………………………………………………………………………
______________________________________________________________________________________________ De Mesel Katrien
XXIII
Bijlagen
•
Welke informatie krijgen de geselecteerde deelnemers vóór het doorlopen van het assessment center? r Begripsomschrijving van een assessment center r Doelstelling van het assessment center r Assessment center programma (te doorlopen oefeningen) r Tijdsindeling van het assessment center r Wie de resultaten te zien krijgt en onder welke voorwaarden r Hoe de resultaten gebruikt zullen worden r Mogelijke gevolgen van de beoordeling r Tijdstip en soort van de feedback r Gebruikstermijn van de resultaten r Gegevens over de assessoren (wie, training, …) r …………………………………………………………………………………………… r …………………………………………………………………………………………… r …………………………………………………………………………………………… r Weet in niet of mag ik niet vrijgeven
Dimensies •
Hoeveel dimensies worden (gemiddeld) beoordeeld tijdens een assessment center?
……………………………………………………………………………………………………. • Wat zijn de meest voorkomende dimensies (maximum 10)? (Voorbeelden: leiderschap, communicatievaardigheden, planning en organisatie, creativiteit, stressbestendigheid,…)
…………………………………………………………………………………………………… …………………………………………………………………………………………………… …………………………………………………………………………………………………… …………………………………………………………………………………………………… •
Hoe worden de dimensies geselecteerd? r Vastgelegd door topmanagement r Afgeleid uit een functieanalyse r Lijst geleverd door extern consultant r ……………………………………………………… r Weet ik niet of mag ik niet vrijgeven
• Worden de definities van de dimensies aangepast aan de oefening of/en functie (gedetailleerde omschrijving) of wordt een algemene omschrijving gebruikt?
…………………………………………………………………………………………………… …………………………………………………………………………………………………… …………………………………………………………………………………………………… •
Wordt de lijst met dimensies aangepast aan de functie van het assessment center? r Weet ik niet of kan ik niet vrijgeven r Nee r Ja Indien ja, wie voert deze aanpassing uit?
……………………………………………………………………………………………… ………………………………………………………………………………………………
•
Worden in de verschillende oefeningen van een assessment center andere dimensies beoordeeld? Ja / Nee / Geen mening
• Worden de geobserveerde dimensies in de oefeningen meegedeeld aan de kandidaten vóór zij de opdracht aanvangen? Ja / Nee / Geen mening
______________________________________________________________________________________________ De Mesel Katrien
XXIV
Bijlagen
Assessoren (beoordelaar) •
Wie treedt op als assessor? r Externe assessoren r Interne personen, zoals bijvoorbeeld managers een relatie hebben met de functie r Zowel interne als externe personen r …………………………………………………………………………………………… r Weet ik niet of mag ik niet vrijgeven INDIEN INTERNE PERSONEN • Wie zijn deze personen?
………………………………………………………………………………………………… ………………………………………………………………………………………………… ………………………………………… •
Hoe vaak oefent een intern (!) assessor (gemiddeld) deze functie uit?
………………………………………………………………………………………………… •
Van welke factoren is deze frequentie afhankelijk (functie, afdeling, enthousiasme, beschikbaarheid,…)?
………………………………………………………………………………………………… ………………………………………………………………………………………………… ………………………………………………………………………………………………… •
Wie selecteert de assessoren voor een welbepaald assessment center? r Personeelsdienst r Extern adviseur r Beiden r …………………………………………………………………………………………… r Weet ik niet of mag ik niet vrijgeven
•
Welke selectiemethode wordt aangewend om de assessoren te bepalen voor een bepaald assessment?
…………………………………………………………………………………………………… …………………………………………………………………………………………………… …………………………………………………………………………………………………… • Hoeveel assessoren zijn er gemiddeld in een AC? (in absoluut aantal OF vb. 1 assessor per 5 kandidaten)
…………………………………………………………………………………………………… ….………………………………………………………………………………………………… • Hoeveel kandidaten moet een assessor tegelijk beoordelen (gemiddeld)? …………………………………………………………………………………………………… Wordt hier vaak van afgeweken? Om welke redenen?
…………………………………………………………………………………………………… …………………………………………………………………………………………………… …………………………………………………………………………………………………… …………………………………………………………………………………………………… • Worden de kandidaten in de verschillende oefeningen door andere assessoren beoordeeld? Ja / Nee / Geen mening • Krijgen de assessoren biografische gegevens,… van de kandidaten die ze beoordelen? Ja / Nee / Geen mening / Soms, namelijk………………………………………………………………………………
______________________________________________________________________________________________ De Mesel Katrien
XXV
Bijlagen
• Welke observatiemethode wordt gebruikt? (Indien dit verschilt per assessment center, vermeldt u de meest gebruikte methode) r Behavioral checklist r Gedragsgeankerde schalen r ……………………………………………………………………………………………
……………………………………………………………………………………………….. r Weet ik niet of mag ik niet vrijgeven Training van de assessoren •
Welke training krijgen de assessoren? r Scheiden van observatie en interpretatie r Inhoud van de dimensies r ‘Frame-of-reference’-training r Evaluatiefouten (halo-effect, projectie, eerste indruk,…) r Interpersoonlijke relaties r …………………………………………………………………………………………… r …………………………………………………………………………………………… r …………………………………………………………………………………………… r Weet ik niet of mag ik niet vrijgeven
•
Hoeveel tijd neemt deze opleiding in beslag (vb. in dagen)?
…………………………………………………………………………………………………… •
Door wie wordt de opleiding gegeven (intern, extern, …)?
…………………………………………………………………………………………………… …………………………………………………………………………………………………… • Worden er ook opfrissingscursussen georganiseerd? Ja / Nee / Geen mening INDIEN JA • Wie neemt deel aan deze cursussen?
………………………………………………………………………………………………… …………………………………………………………………………………………………
•
Hoe vaak krijgt eenzelfde persoon deze cursus?
………………………………………………………………………………………………… ………………………………………………………………………………………………… Feedback • Wanneer krijgt de deelnemer feedback over zijn prestaties? BIJ SELECTIE r Na elke oefening r Na verloop van alle oefeningen, maar nog in van het assessment center r Een tijd na het doorlopen van het assessment center r ………………………………………………………… r Weet ik niet of mag ik niet vrijgeven BIJ DEVELOPMENT EN ANDERE DOELSTELLINGEN r Na elke oefening r Na verloop van alle oefeningen, maar nog in van het assessment center r Een tijd na het doorlopen van het assessment center r ………………………………………………………… r Weet ik niet of mag ik niet vrijgeven
______________________________________________________________________________________________ De Mesel Katrien
XXVI
Bijlagen
• Op welke manier gebeurt deze feedback? BIJ SELECTIE r Per brief r Per telefoon r Per e-mail r In een direct gesprek r ……………………………………… r Weet ik niet of mag ik niet vrijgeven BIJ DEVELOPMENT EN ANDERE DOELSTELLINGEN r Per brief r Per telefoon r Per e-mail r In een direct gesprek r ……………………………………… r Weet ik niet of mag ik niet vrijgeven BIJ SELECTIE • Inhoud van de feedback: r Besluit (aanwerving of niet) r Sterktes en zwaktes r Gedragsvoorbeelden ter motivering r Suggesties te verbeteren aspecten r ………………………………………………………………………………………….. r ………………………………………………………………………………………….. r ………………………………………………………………………………………….. r Weet ik niet of mag ik niet vrijgeven BIJ DEVELOPMENT EN ANDERE DOELSTELLINGEN • Inhoud van de feedback: r Sterktes en zwaktes r Gedragsvoorbeelden ter motivering r Opstelling trainingsplan r Te verbeteren aspecten r Carrièreplanning r ………………………………………………………………………………………….. r ………………………………………………………………………………………….. r ………………………………………………………………………………………….. r Weet ik niet of mag ik niet vrijgeven • Wordt een trainingsplan opgesteld? Ja / Nee / Geen mening INDIEN NEE Wordt er dan iets anders met de informatie gedaan?
………………………………………………………………………………………………… ……………………………………………………………………… INDIEN JA • Wie bepaalt de inhoud en timing van het trainingsplan?
………………………………………………………………………………………………… ………………………………………………………………………………………………… •
Op welke termijn wordt (gemiddeld) gepland? Van welke factoren is deze afhankelijk?
………………………………………………………………………………………………… …………………………………………………………………………………………………
______________________________________________________________________________________________ De Mesel Katrien
XXVII
Bijlagen
•
Hoe belangrijk wordt het trainingsplan geacht?
………………………………………………………………………………………………… ………………………………………………………………………………………………… •
In hoeverre is het trainingsplan bindend? Bestaan er sancties?
………………………………………………………………………………………………… ………………………………………………………………………………………………… ………………………………………………………………………………………………… •
Wie draagt de (hoofd)verantwoordelijkheid voor de uitvoering ervan? (personeelsdienst, personeelslid of …)
………………………………………………………………………………………………… ………………………………………………………………………………………………… •
Bestaat er opvolging van het plan? Op welke tijdstippen?
………………………………………………………………………………………………… ………………………………………………………………………………………………… ………………………………………………………………………………………………… • Hoe gebeurt de opvolging van het plan? Hoe wordt nagegaan of het personeelslid vorderingen (ge)maakt (heeft)?
………………………………………………………………………………………………… ………………………………………………………………………………………………… ………………………………………………………………………………………………… Onderzoek Wordt er na afloop van het assessment/development center een evaluatie van dat center gedaan? Ja / Nee / Geen mening INDIEN NEE • Waarom niet?
…………………………………………………………………………………………………… …………………………………………………………………………………………………… INDIEN JA • Wie voert dit onderzoek uit?
…………………………………………………………………………………………………… ……………………………………………………………………………………………………. • Wat wordt onderzocht? r Face-validiteit (aanvaarding bij de deelnemers) r Voorspellende validiteit: • Wat houdt dit onderzoek in (vb. scores vergelijken met de werkelijke performantie, …)?
……………………………………………………………………………………………… ……………………………………………………………………………………………… ……………………………………………………………………………………………… •
Hoeveel tijd na het assessment center wordt dit onderzoek uitgevoerd?
……………………………………………………………………………………………… ……………………………………………………………………………………………… •
Hoe wordt de performantie gemeten (beoordeling van supervisor, behaalde functie, …)?
……………………………………………………………………………………………… ……………………………………………………………………………………………… r Constructvaliditeit m Discriminantvaliditeit m Convergentvaliditeit ______________________________________________________________________________________________ De Mesel Katrien
XXVIII
Bijlagen
r Beoordeling van de assessoren r …………………………………………………………………………………………………. r …………………………………………………………………………………………………. r Weet ik niet of mag ik niet vrijgeven •
In hoeverre wordt gezocht naar verbetering op basis van de bekomen resultaten?
…………………………………………………………………………………………………… …………………………………………………………………………………………………… …………………………………………………………………………………………………… •
Wie bepaalt wat veranderd zal worden?
…………………………………………………………………………………………………… …………………………………………………………………………………………………… Resultaten •
Hoe komt het eindoordeel tot stand? r Discussie tussen de assessoren r Beslissingsregel r ……………………………………………………………………………………………
……………………………………………………………………………………………….. r Weet ik niet of mag ik niet vrijgeven •
Wie krijgt (inzicht in) de resultaten in de onderneming? r Lijnmanager (superieur van de (toekomstige) werknemer) r Topmanagement r Personeelsdienst r Kandidaat r ………………………………………… r ………………………………………… r Weet ik niet of mag ik niet vrijgeven
•
Wat is de relevantieduur van de resultaten? Hoelang worden ze gebruikt of relevant beschouwd?
…………………………………………………………………………………………………… …………………………………………………………………………………………………… •
Bestaan er binnen de onderneming regels op vlak van ethiek voor het gebruik van de resultaten?
…………………………………………………………………………………………………… …………………………………………………………………………………………………… ….………………………………………………………………………………………………… •
Kan een personeelslid weigeren deel te nemen aan een assessment center? Wat zijn daar eventueel de gevolgen van?
…………………………………………………………………………………………………… …………………………………………………………………………………………………… …………………………………………………………………………………………………… • Krijgt de assessee (beoordeelde) een kopie van het verslag? Mag hij/zij het verslag gebruiken vb. bij sollicitatie in een andere onderneming?
…………………………………………………………………………………………………… …………………………………………………………………………………………………… ……………………………………………………………………………………………………
______________________________________________________________________________________________ De Mesel Katrien
XXIX
Bijlagen
•
Heeft u nog opmerkingen omtrent deze vragenlijst? Welke?
…………………………………………………………………………………………………… …………………………………………………………………………………………………… …………………………………………………………………………………………………… …………………………………………………………………………………………………… …………………………………………………………………………………………………… …………………………………………………………………………………………………… ……………………………………………………………………………………………………
Bedankt voor uw medewerking!!!
______________________________________________________________________________________________ De Mesel Katrien
XXX
Bijlagen