SIG (Digitaal) Toetsen en Leren Integreren

15.10.2015

Comparative judgment within online assessment: exploring students’ feedback reactions

SIG (Digitaal) Toetsen en Leren Integreren

Anneleen V. Mortier, Marije Lesterhuis, Peter Vlerick, Sven De Maeyer

www.d-pac.be

[email protected]

2

Inhoud 1• Comparative Judgment – Wat is comparative judgment? – Waarom comparative judgment?

2• Hoe geef je feedback bij CJ? – 4 Onderzoeksvragen

3• Studie – – – –

Design Resultaten Implicaties Mogelijks Verder onderzoek

3

Comparative Judgment – Wat is het? • Klassieke methode: rubrics/criteria

1. CJ

-

2. Feedback

-

3. Study

4

Comparative Judgment – Wat is het? • Comparative judgment: “Welke paper is de beste op de competentie verklarend schrijven?”

1. CJ

-

2. Feedback

-

3. Study

5

Comparative Judgment – Wat is het? • Wanneer we dit vele keren doen:

1. CJ

-

2. Feedback

-

3. Study

6

Comparative Judgment – Wat is het?

Demo: https://nomoremarking.com/demo1

1. CJ

-

2. Feedback

-

3. Study

12

Comparative Judgment – Waarom? 1• Rubrics = artificieel opdelen van de competentie

Bepaalde overlap

Pollitt, 2012

1. CJ

-

2. Feedback

-

3. Study

13

Comparative Judgment – Waarom? 2• Het geheel is meer dan de som van de delen Verklarend schrijven = ondersteuning + taal + structuur + ontwikkeling + indeling + conventies + spelling ? Sadler, 2009

1. CJ

-

2. Feedback

-

3. Study

14

Comparative Judgment – Waarom? 3• Soms worden er andere zaken meegenomen bij het beoordelen: Layout?

Crisp, 2007

1. CJ

-

2. Feedback

-

3. Study

15

Comparative Judgment – Waarom? 4• Beoordeling van 1 beoordelaar kan afhangen van zijn moodstoestand:

Bejar, 2012

1. CJ

-

2. Feedback

-

3. Study

17

Comparative Judgment – Waarom? 5• Scoren is ook een vergelijking maken

Laming, 2004

1. CJ

-

2. Feedback

-

3. Study

Comparative Judgment – Feedback naar studenten • Geen onderzoek naar hoe beoordeelden deze methode zien en of ze dit aanvaarden. “Welke paper is de beste op de competentie verklarend schrijven?”

1. CJ

-

2. Feedback

-

3. Study

18

Comparative Judgment – Feedback naar studenten • Hoe moet je dit voorstellen en hoe komt dit binnen?

1. CJ

-

2. Feedback

-

3. Study

19

20

Study – Onderzoeksvragen RQ 1

RQ 2

Eerlijk?

Relevant?

Betrouwbaar? RQ 3

1. CJ

-

2. Feedback

-

3. Study

21

Study – Research Questions RQ 4: Hebben specifieke tips een meerwaarde?

“Werk aan je structuur”

Algemene feedback

Specifieke feedback

Goodman & Wood, 2004

1. CJ

-

2. Feedback

-

3. Study

22

Study – Design - Studenten • 185 studenten van 10 scholen in Vlaanderen • 5de jaar middelbaar • 3 papers voor argumentatief schrijven (feedback op 1 paper)

1. CJ

-

2. Feedback

-

3. Study

23

Study – Design - Beoordelaars • 65 beoordelaars – Leerkrachten in opleiding, leerkrachten, AKOV, andere experts.

• Beoordeling in een gecontroleerde omgeving

1. CJ

-

2. Feedback

-

3. Study

24

Study - Design • CJ met D-PAC

1. CJ

-

2. Feedback

-

3. Study

25

Study - Design • CJ met D-PAC

http://demo.d-pac.be/tool/ [email protected] demo

1. CJ

-

2. Feedback

-

3. Study

26

Study – Beoordelaars Taak beoordelaars - Kies een paper - Waarom heb je deze paper gekozen? (Whitehouse, 2012)

Data - 1223 vergelijkingen - 1208 gesteunde vergelijkingen - 3739 uitspraken gerelateerd aan competentie

1. CJ

-

2. Feedback

-

3. Study

27

Argumenten van beoordelaars

Argumentatie 24%

Structuur 30%

Irrelevant 1%

Taal 21% Inhoud 24%

Similar to Huot (1993), Vaughan (1991)

28

Argumenten van beoordelaars 30 irrelevante aspecten in totaal (0,79%) “Het is geschreven in een ongelooflijk irritant lettertype om te lezen” (Vergelijking 344) “Ze waren beiden niet goed. Maar de rechtse paper maakte mij ten minste aan het lachen door de argumenten die de student heeft gebruikt.” (Vergelijking 621)

Similar to Whitehouse (2012)

29

Study - Design • Na de vergelijkingen: benchmark (6de jaar) werd vastgelegd door een groep van experts. Niet-geslaagd

Geslaagd

• Na de vergelijkingen: specifieke tips 1. CJ

-

2. Feedback

-

3. Study

Study – Design – Semi-gestructureerd interview

20 studenten

20 studenten


Algemene feedback 1. CJ

-

2. Feedback

-

3. Study

Specifieke feedback

30

31

Study – Design • Feedbackrapport bestond uit: – Informatie over de procedure

1. CJ

-

2. Feedback

-

3. Study

32

Study – Design • Feedbackrapport bestond uit: – Informatie over de sample – Informatie over de beoordelaars

1. CJ

-

2. Feedback

-

3. Study

33

Study – Design • Feedbackrapport bestond uit: – Ranking

1. CJ

-

2. Feedback

-

3. Study

34

Study – Design • Feedbackrapport bestond uit: – Ranking

Slaaggrens

1. CJ

-

2. Feedback

-

3. Study

35

Study – Design • Feedbackrapport bestond uit: – (specifieke tips)

1. CJ

-

2. Feedback

-

3. Study

36

Study – Design • Feedbackrapport bestond uit: – Eigen taak

1. CJ

-

2. Feedback

-

3. Study

37

Study – Design • Feedbackrapport bestond uit: – Beste taak

1. CJ

-

2. Feedback

-

3. Study

38

Study – Analyse • • • • •

1. CJ

Nvivo 10 Thematische aanpak (Braun & Clarke, 2009) Codes gebaseerd op onderzoeksvragen Subcodes gebaseerd op antwoorden Verschillen tussen algemene feedback en specifieke tips

-

2. Feedback

-

3. Study

39

Study – Resulten – RQ1 Eerlijk Meestal gezien als eerlijk Vergelijking Beoordeling is hetzelfde voor iedereen Veel beoordelaars Beoordelaars zijn consistent Het was anoniem

RQ 1

Eerlijk? Niet gezien als eerlijk omdat Score is afhankelijk van de klas Beoordelaars nemen de leercurve niet mee Score is niet genuanceerd (geslaagd of niet geslaagd)

1. CJ

-

2. Feedback

-

3. Study

40

Study – Resulten – RQ1 Eerlijk

Laagst scorende studenten: - Meer als oneerlijk - Leercurve wordt niet meegenomen

RQ 1

 Hebben wel de grootste groeimogelijkheid! Eerlijk?

Hoog scorende studenten: - Beoordelaars kunnen niet allemaal dezelfde mening hebben - Niet genuanceerd

1. CJ

-

2. Feedback

-

3. Study

41

Study – Results – RQ2 Relevantie Meestal gezien als irrelevant Procedure Beoordelaars sample Studenten sample

RQ 2

Maar: gemengde gevoelens Relevant ? Werd nooit gezien als irrelevant Ranking & benchmark

1. CJ

-

2. Feedback

-

3. Study

42

Study – Results – RQ2 Relevantie

RQ 2 Laagst scorende studenten: - “Goed dat we onze resultaten kunnen vergelijken” (voorbeeldpaper) Hoog scorende student: - Best scorende paper is overbodig

Relevant ?

1. CJ

-

2. Feedback

-

3. Study

43

Study – Results – RQ3 Betrouwbaarheid Meestal gezien als betrouwbaar Vergelijking Vele beoordelaars die er iets van kennen Anoniem

RQ 3

Betrouwbaar? Niet betrouwbaar want: Niet representatief Hoe hebben de beoordelaars de taken beoordeeld?

1. CJ

-

2. Feedback

-

3. Study

44

Study – Resultaten – RQ4 Specifieke tips


Studenten met specifieke tips gaven dit als argument voor betrouwbaarheid en eerlijkheid. Tips werden altijd gezien als relevant. Studenten met specifieke tips gaven aan dat ze meer hebben geleerd van hun feedbackrapport. 1. CJ

-

2. Feedback

-

3. Study

45

Study - Implicaties • Over het algemeen zien studenten deze feedback als eerlijk, betrouwbaar en relevant. – Potentieel gebruik in de praktijk

– Leg de methode goed uit

1. CJ

-

2. Feedback

-

3. Study

46

Study - Implicaties • Specifieke tips zijn belangrijk om te leren en het feedbackrapport te zien als eerlijk en betrouwbaar!


• Belangrijkheid van een score  Kunnen we dit implementeren?

1. CJ

-

2. Feedback

-

3. Study

47

Study – Mogelijks Verder Onderzoek • Resulteert feedback echt in leren?

• Feedbackreacties in specifieke populaties? - Bvb. studenten met dyslexie

• Veralgemeenbaarheid naar andere competenties? 1. CJ

-

2. Feedback

-

3. Study

Coenen, T., Coertjens, L., De Maeyer, S., Donche, V., Lesterhuis, M., Mortier, A.V., Vanhoof, J., Van Gasse, R., Van Petegem, P., Verhavert, S., & Vlerick, P.

Demo: http://demo.d-pac.be/tool/ username: [email protected] password = demo Contacteer ons! http://www.d-pac.be Try-outs zijn mogelijk!

Type van beoordelaars

Bronnen Voorkennis Lay-out

Leerkrachten Taal Nt sign

Argumentatie Grammatica

Structuur

Leerkrachten Taal

AKOV

Nt sign

Nt sign

Geen specifieke focus

Leerkrachten in opleiding Sign

51

Lopend onderzoek: Benchmark categorisatie • Hoe bepaal ik nauwkeurig in welke categorie een representaties behoort? – Voorbeeld: taalkennis B2

B1

SIG (Digitaal) Toetsen en Leren Integreren

Recommend Documents