Wiskunde, de achtste discipline in de heptatlon
Profielwerkstuk over de puntentelling van de heptatlon. Door: Carine Candel (6VP3) en Hanna Knotnerus (6VP2) Begeleider: Fred Pach Jaar: 2014-2015
Inhoudsopgave 1. Inleiding 2. Uitwerking deelvragen 2.1 Geschiedenis 2.2 Uitleg huidige formules 2.3 Criteria goede formules 2.4 Definitie eerlijkheid 3. Ideeontwikkeling 4. Nieuwe formules 4.1 Mogelijkheid 1 4.2 Mogelijkheid 2 4.3 Mogelijkheid 3 4.4 Toevoeging leukere kijksport 5. Toetsing formules 5.1 IAAF formules 5.2 Mogelijkheid 1 5.3 Mogelijkheid 2 5.4 Mogelijkheid 3 6. Conclusie 7. Discussie 8. Dankwoord 9. Bronvermelding 10. Bijlage 10.1 Uitwerking van het interview met Hans van Kuijen 10.2 Logboek 10.3 Toelichting van het logboek
Pagina 2 4 4 5 10 11 12 13 13 14 16 18 20 20 21 22 24 27 28 29 30 31 31 34 36
2
1. Inleiding Voor ons profielwerkstuk wilden we heel graag iets wiskundigs onderzoeken of ontwerpen. We moesten alleen nog bedenken wat we gingen doen. Toen zijn we gaan brainstormen met Fred Pach. Hij kwam met veel ideeën en wij vonden vooral het sportgedeelte interessant. Zo kwamen we bij de meerkamp van atletiek uit. Een meerkamp bij atletiek, voor vrouwen is dit de heptatlon (zevenkamp) en voor mannen de decatlon (tienkamp), is een tweedaagse wedstrijd met verschillende disciplines van atletiek. Die disciplines bevatten enkele loop- , spring- en werponderdelen, namelijk 100 meter horden, 200 meter sprint, 800 meter, verspringen, hoogspringen, kogelstoten en speerwerpen. Bij zo'n wedstrijd heb je dus te maken met zowel tijden als afstanden. Maar hoe worden al deze onderdelen samen tot een eenduidige uitslag gecombineerd en is de manier waarop dat gebeurt wel eerlijk? Om die uitslag te bepalen worden bij alle meerkampwedstrijden dezelfde formules gehanteerd. Dit zijn formules van de zogeheten IAAF (International Association of Athletics Federations) en deze formules bestaan sinds 1985 in de huidige vorm. Deze formules zijn ingewikkeld; ze bevatten machten en een hoop constanten waarvan niet helemaal duidelijk is hoe men daarop gekomen is. Dit is nogal vreemd, want deze formules worden algemeen gebruikt, het zou dus ook voor iedereen duidelijk moeten zijn hoe het precies werkt. Omdat er zo weinig duidelijk is over deze formules is het dus ook lastig om na te gaan of die formules wel eerlijk zijn. Wij vonden het een groot probleem dat niemand eigenlijk precies weet of de formules wel eerlijk zijn, omdat er sinds 1985 eigenlijk nooit meer kritisch naar is gekeken. Daarom leek het ons leuk om deze formules helemaal uit te pluizen, te toetsen op eerlijkheid en alternatieve, eerlijkere formules te ontwerpen. Onze hoofdvraag is dus: Hoe kunnen wij een eerlijkere formule voor de meerkamp van atletiek ontwerpen? Maar om nieuwe formules te ontwerpen moeten we eerst de huidige formules goed begrijpen. Ook moeten we een manier zien te bedenken hoe we "eerlijk" definiëren en hoe we achteraf kunnen meten of onze formule echt eerlijker is dan de huidige. Deze dingen onderzoeken we in onze deelvragen: o Hoe zijn de huidige formules ontstaan? o Hoe werken de huidige formules precies? o Aan wat voor criteria moet een goede formule voldoen? o Hoe definieer en meet je "eerlijk"? Om al deze dingen te weten te komen, hebben we veel gelezen; van het wedstrijdreglement van de atletiekunie tot stukken over de geschiedenis van de formules. Ook hebben we een interview gehouden met Hans van Kuijen, een atletiek statisticus die veel weet over de meerkamp en de formules. Al deze bronnen en de uitwerking van het interview met meneer van Kuijen zijn te vinden in de bijlage. Toen we begonnen aan ons onderzoek wilden we ons onderzoek doen met betrekking tot de hele meerkamp. Dus voor de decatlon (mannen) en voor de heptatlon (vrouwen). Maar we kwamen er al snel achter dat ons onderzoek dan veel te groot zou worden. De constanten die in de formules staan, en dat zijn er nogal veel, zijn voor mannen en vrouwen verschillend, wat natuurlijk ook logisch is omdat mannen andere prestaties leveren dan vrouwen. We zouden dus eigenlijk alles apart voor mannen en voor vrouwen uit moeten zoeken en ons onderzoek twee keer moeten doen. Dit zou ook niets toevoegen aan het onderzoek want voor de decatlon zouden we hetzelfde moeten doen als voor de heptatlon, dit is dus enkel dubbel werk. Aangezien het dan echt een veel te breed en langdurig onderzoek zou worden hebben we er voor gekozen ons te beperken tot de heptatlon (vrouwen).
3
2. Uitwerking deelvragen 2.1 Geschiedenis 1
In 1912 zijn de eerste formules voor de decatlon opgesteld, dit was voor de Olympische Spelen in dat jaar. Deze formules waren lineaire formules die gebaseerd waren op een beperkt aantal uitslagen die tot dan toe behaald waren. Per onderdeel werd een minimum resultaat vereist en dat leverde dan nul punten op en het Olympisch Record per onderdeel leverde 1000 punten op. Daartussen was een lineaire schaalverdeling. De punten werden tot twee decimalen achter de komma berekend, zodat elke mogelijke afstand/tijd een eigen puntenaantal zou hebben. In 1920 werden de formules van 1912 bijgewerkt, zo dat de punten werden gebaseerd op de records van dat moment. In 1920 was er ook nog een andere ontwikkeling. De Finse Federatie begon toen met het ontwikkelen van een nieuwe puntentelling. In 1934 kwam de Finse Federatie daadwerkelijk met het nieuwe voorstel, hierbij werden de lineaire functies omgezet in exponentiële functies. De formules waren dus progressief, dit houdt in dat bij een hogere prestatie er in verhouding steeds meer punten worden toegekend. Ze hadden de formules progressief gemaakt omdat ze het belangrijk vonden dat een betere prestatie in verhouding beter wordt beloond. Aangezien het relatief steeds moeilijker wordt om een nog betere prestatie te leveren. Bij het opstellen van de formules was heel veel statistiek nodig om eerlijke uitslagen te krijgen. De nieuwe formules werden zo opgesteld dat er per onderdeel minimaal 0 en maximaal 1150 punten te behalen waren. 0 punten kreeg iemand die het niveau had van een schoolkind en bij 1000 punten zat een atleet tegen het wereldrecord aan. Het maximum was 1150 punten zodat er ruimte bleef voor verbetering van wereldrecords. In de vijftiger jaren kwamen er weer nieuwe formules. Daarbij werd er gekeken naar naoorlogse prestaties, die veel beter waren dan de uitslagen daarvoor. Ook werden de formules nog progressiever gemaakt dan ze al waren. Op deze formule kwam al snel veel commentaar omdat ze door hun sterk progressieve karakter voordeel gaven aan specialisten. In 1962 kwam er dus weer een nieuwe formule. Hierbij werden voor de loop- en springonderdelen progressieve en voor de werponderdelen regressieve formules gemaakt. Regressief houdt in dat er bij een steeds betere prestatie in verhouding minder extra punten aan worden toegekend. Dit was op basis van veel uitslagen van decatlons van zowel amateurs als professionals. De werponderdelen werden regressief beoordeeld omdat het fysiek gezien relatief makkelijker was om een betere prestatie te behalen. Dit had te maken met kinetische energie, die door middel van een speer, discus of kogel makkelijker om te zetten is in een grotere afstand (dit heeft te maken met de omzetting van spier energie in kinetische energie maar dat betrekken we niet in ons werkstuk) dit is niet het geval bij spring- en looponderdelen.
1
Bron: Papieren document ‘scoring tables’ dat we hebben gekregen van Hans van Kuijen. Dit document is in het Engels, dit hebben we samengevat en vertaald. Geraadpleegd op 30 november 2014. Bron: Viktor Trkal (oktober 2009). Geraadpleegd op 6 januari 2015. http://www.oocities.org/mdetting/sports/decathlon-points-history.html Deze bron hebben we gekregen van Stefan Waltermann (zie paragraaf 10.3).
4
Maar ook op deze formule kwam veel kritiek. Doordat de werponderdelen nu regressief beoordeeld werden, had het niet zo veel zin meer om goed te zijn in die onderdelen. Je kreeg er namelijk toch niet zoveel extra punten voor. Daardoor gingen mensen ook steeds minder hun best doen voor deze onderdelen. In 1983 begon de IAAF daarom met het opstellen van laatste definitieve formules die in 1984 in gebruik werden genomen. De criteria die ze hadden bij het opstellen van deze formules waren de volgende: 1. De nieuwe formules moesten alleen gebruikt worden voor meerkampen. 2. De resultaten van verschillende onderdelen moesten, voor zover dat mogelijk was, ongeveer tot hetzelfde aantal punten komen bij een vergelijkbare moeilijkheid. 3. De nieuwe formules moesten ook: a. een aanpassing zijn van de bestaande formules b. een rechte lijn voor alle onderdelen zijn c. licht progressief zijn voor alle onderdelen 4. De nieuwe formules moesten bruikbaar zijn voor beginners (schoolkinderen), junioren en (wereld)top atleten. 5. Er moesten voor mannen en vrouwen verschillende formules (en constanten) bestaan. 6. Alle nieuwe formules moesten gebaseerd zijn op de statistische data van de meerkampen maar er moest ook worden gekeken naar statistische data van specialisten die maar op een onderdeel presteren. 7. De nieuwe formules moesten op dat moment en in de toekomst toepasbaar zijn. 8. Het was wenselijk dat, zonder andere problemen te creëren, de einduitslagen met de nieuwe formules voor de wereldtop atleten ongeveer hetzelfde bleven. 9. Voor zover mogelijk moesten de nieuwe formules voorkomen dat een specialist in een onderdeel dat onderdeel zo goed zou doen dat het niet meer zou uitmaken hoe er werd gepresteerd op de andere onderdelen en hij vanzelfsprekend de wedstrijd zou winnen. N.B.: Dit is de officiële lijst met criteria, we hebben deze lijst enkel vertaald naar het Nederlands. We kunnen er niets aan veranderen. We zien wel dat er enkele punten dubbelop lijken te zijn, bijvoorbeeld de punten 2 en 3b. Ook is punt 8 volgens ons een eis, waaraan het makkelijkst te voldoen is als men zich aan 3a houdt.
2.2 Uitleg huidige formules We kwamen er al snel achter dat er verschillende formules zijn. Namelijk de formules van de IAAF en die van de Atletiekunie (Koninklijke Nederlandse Atletiek Unie, KNAU). Deze formules verschillen heel erg van elkaar in constanten en opbouw. Ook heeft de IAAF drie formules, een voor loopnummers, een voor werpnummers en een voor springnummers, en de KNAU maar twee, een voor loopnummers en een voor werp- en springnummers. In het wedstrijdreglement staat dat er voor de meerkamp altijd gebruik wordt gemaakt van de formules van de IAAF. We vroegen ons af waarom de formules van de KNAU dan überhaupt bestaan als ze niet voor de meerkamp worden gebruikt. Dat hebben we Hans van Kuijen, de Nederlandse statisticus die we hebben geïnterviewd, gevraagd. De formules van de KNAU zijn formules die specifiek voor competitiewedstrijden worden gebruikt. Competitiewedstrijden zijn wedstrijden die met een team worden gedaan waarbij elke atleet specialist is in een paar onderdelen en ook met alleen die onderdelen meedoet. Bij deze wedstrijden zijn ook meer onderdelen dan alleen de zeven van de heptatlon. De formules zijn dus anders omdat ze bedoeld zijn voor specialisten. Als hier de formules
5
voor de heptatlon zouden worden gebruikt, worden er ineens allemaal records verbroken omdat het puntentotaal de uitslag is van allemaal specialisten samen. Ook zijn de formules anders omdat er meer onderdelen in betrokken moeten worden. In ons verdere werkstuk focussen we dus op de formules van de IAAF want dat zijn de formules voor de heptatlon. De IAAF formules zijn opgedeeld in aparte delen voor lopen, springen en werpen. Bij die formules worden meerdere constanten gebruikt, die constanten verschillen per onderdeel (en per man/vrouw, maar dat doet er voor ons onderzoek niet toe). De IAAF formules met bijbehorende constanten 2 (alleen de constanten die van toepassing zijn op de heptatlon) zijn: Loopnummers: Aantal punten = INTEGER(A*(B - tijd) ^ C) Vrouwen/meisjes A 100mh 9,23076 200m 4,99087 800m 0,11193
B 26,7 42,5 254,0
C 1,835 1,810 1,880
Springnummers: Aantal punten = INTEGER(A*(100*(afstand - B)) ^ C) Vrouwen/meisjes A B Hoogspringen 1,845230 0,75 Verspringen 0,188807 2,10
C 1,348 1,410
Werpnummers: Aantal punten = INTEGER(A*(afstand - B) ^ C) Vrouwen/meisjes A Kogelstoten 56,0211 Speerwerpen 15,9803
C 1,05 1,04
B 1,5 3,8
N.B.: In deze formules moet de afstand worden ingevuld in meters en de tijd in seconden.
2
Bron: Atletiekunie, Commissie Wedstrijdreglement (juli 2011). Formules en constanten Geraadpleegd op 16 mei en 18 augustus 2014. http://atletiekunie.nl/index.php?page=150
6
Wat ons opvalt aan de formules en de constanten zijn de volgende punten: o De significatie van de constanten is per formule en per A/B/C steeds gelijk, behalve bij B voor de loopnummers. Dan is er bij de 800m ineens een extra significant cijfer ontstaan. Dit is op zich logisch aangezien dit de ondergrens is en bij de 800m heb je nou eenmaal een extra significant cijfer omdat je die niet binnen 100 seconden kan lopen en dat kan voor de 100mh en voor de 200m wel. o Het aantal decimalen van de constanten is per formule en per A/B/C gelijk. o Zowel bij de springnummers als bij de werpnummers heb je te maken met behaalde afstanden die zo ver mogelijk moeten zijn, maar er is in de formule van de springnummers ineens een factor honderd bijgekomen. o B heeft maar 1 decimaal (bij loopnummers) maar de tijd wordt gemeten in honderdsten van seconden dus dan is de tijd nauwkeuriger dan de constante waar je die van aftrekt. o B heeft maar 1 decimaal (bij werpen) maar de afstand wordt gemeten in centimeters dus dan is de afstand nauwkeuriger dan de constante waar je die van aftrekt. Er is natuurlijk een soort omkering nodig, want bij tijd is het beter om een zo laag mogelijke tijd te hebben, terwijl het bij afstanden beter is om een verdere/hogere afstand te hebben. Deze omkering is in de formules gemakkelijk te herkennen. Dit zie je in de formule voor de looponderdelen in het gegeven dat de tijd van een constante af wordt getrokken, dus hoe kleiner de tijd, hoe minder er wordt afgetrokken, hoe meer punten. Bij de formules voor de spring- en werponderdelen zie je dit andersom, hier wordt een constante van de afstand afgetrokken. Het gevolg is dat je, als je verder/hoger bent gekomen, een hoger begin aantal hebt waar de constante van wordt afgehaald, waardoor je meer punten overhoudt. Deze omkering in de formule zou niet nodig zijn als er bij de loopnummers snelheden worden gebruikt in plaats van tijden. Het is bij snelheden namelijk wel beter om een zo hoog mogelijke waarde te hebben. In paragraaf 4.3 lichten we dit onderwerp nader toe. We hebben ons natuurlijk afgevraagd wat alles in de formules betekent en wat voor gevolgen elke constante heeft. Hieronder lichten we per formule toe hoe dat zit. Loopnummers: Aantal punten = INTEGER(A*(B - tijd) ^ C) De tijd is in seconden, die trek je af van B, B is dus ook in seconden. B is eigenlijk de ondergrens, men is er vanuit gegaan dat de langzaamste tijd die nog punten krijgt gelijk is aan de waarde van B. Vervolgens wordt de formule progressief gemaakt door middel van C. Bij de loopnummers is C best een grote waarde, dat wil zeggen dat C bijna 2 is. Dit zorgt voor een behoorlijke stijging in de formule. Vervolgens wordt het geheel met A vermenigvuldigd, dit is op zich logisch want het zorgt ervoor dat er een groter aantal punten uitkomt. Springnummers: Aantal punten = INTEGER(A*(100*(afstand - B)) ^ C) De afstand is in meters, daarvan trek je B af, B is dus ook in meters. B is de ondergrens, men is er vanuit gegaan dat de minimale afstand of hoogte die men moet springen gelijk is aan de waarde van B. Vervolgens wordt de afstand omgezet in centimeters door het met 100 te vermenigvuldigen. Daarna wordt de formule progressief gemaakt met behulp van C. Deze formules zijn al een stuk minder progressief dan die van de loopnummers, dit komt doordat deze C een stuk kleiner is dan de C bij de
7
loopnummers. Als laatste wordt het geheel weer met A vermenigvuldigd zodat het puntenaantal op een gewenste hoogte komt. Werpnummers: Aantal punten = INTEGER(A*(afstand - B) ^ C) Ook hier is de afstand weer in meters, daarvan trek je B af, B is dus ook weer in meters. B is wederom de ondergrens, men is er vanuit gegaan dat de minimale afstand die moet worden gestoten of geworpen even groot is als B. Dan wordt de formule weer progressief gemaakt, dat is in dit geval wel maar héél licht progressief; de waarden van C zijn hier bijna gelijk aan 1. Dit komt waarschijnlijk voort uit het gegeven dat de werpformules ook een tijdje regressief zijn geweest maar in 1985 toch weer progressief moesten worden. Tot slot wordt het geheel met A vermenigvuldigd waardoor het gewenste puntenniveau wordt behaald. N.B.: Wat hiernaast als eerste opvalt is dat in elke formule ‘INTEGER’ staat, dit is een afkapping van de uitkomst van de formule. Dat betekent dat de gehele uitkomst bij de komma wordt afgekapt zodat je een heel aantal punten krijgt. N.B.: De stijging die door exponent C wordt veroorzaakt zie je echter niet terug als je de grafiek van een onderdeel plot omdat de uitslagen maar betrekking hebben op een heel klein gedeelte van alle mogelijke getallen. Op dat kleine gedeelte van de grafiek dat gebruikt wordt krijg je eigenlijk hetzelfde als dat je lineaire formules zou hebben (zie figuur 1, volgende pagina). Het progressieve gedeelte in deze formule is dus onnodig. Op basis hiervan is een van onze criteria dat de nieuwe formules lineair zijn aangezien dit het geheel een heel stuk simpeler maakt en het toch hetzelfde gevolg heeft. N.B.: Wat er gek is aan de waarden van A, is de hoeveelheid significante cijfers. Dit is een typisch getal dat zo uit de computer is komen rollen en waarvan je eigenlijk niet zoveel cijfers mag gebruiken. Dit mag niet omdat deze waarden zijn opgesteld op basis van uitslagen van heptatlons, die uitslagen zijn in een bepaald aantal significante cijfers dus als daar mee gerekend wordt, mag je niet ineens extra significante cijfers toevoegen. Na het uitpluizen van deze formules wisten we precies welke constante wat voor gevolgen had. Alleen wisten we nog steeds niet wat de oorsprong van de constanten was. We zijn daarin niet de enigen; behalve enkelen die sterk betrokken zijn geweest bij de ontwikkeling van de formules en constanten, weet niemand hoe de constanten tot stand zijn gekomen. Er is wel bekend dat de constanten zijn gebaseerd op een hele grote hoeveelheid heptatlon uitslagen, dat was namelijk een eis. Bovendien is van de vreemde waarden van A af te leiden dat de constanten waarschijnlijk met de computer zijn berekend. Het kan bijvoorbeeld zo zijn dat men een best passende lijn door een aantal punten heeft getrokken. Om die punten op te stellen moest er wel eerst een ondergrens worden vastgesteld en moest men daar een bepaald aantal punten aan toe kennen, dit kan op de gok zijn gedaan. Door vervolgens een nauwkeurige lijn door die punten te trekken is een formule af te leiden. Nogmaals, dit is een manier hoe het zou kunnen zijn gegaan, we hebben verder geen bronnen die dit bevestigen. Het zou heel goed kunnen dat men, toen de formules eenmaal in de huidige vorm bestonden, er (bijna) niet meer kritisch naar heeft gekeken. Men heeft waarschijnlijk de constanten voor zoete koek geslikt aangezien de formules prima functioneerden (en functioneren) en ze ook aan alle eisen voldeden. Toch zijn er enkelen geweest die hebben geprobeerd de oorsprong van de constanten te
8
achterhalen alleen dan was er vaak de taalbarrière die het moeilijk maakte. Meneer Trkal is namelijk Tsjechisch en spreekt amper Engels. Hij heeft zelf overigens wel wat artikelen geschreven over de formules van de heptatlon maar ook daar staat niet in hoe de constanten tot stand zijn gekomen.
3
Figuur 1 : grafieken van de IAAF puntentelling per onderdeel, 200 tot 2000 punten. Het gearceerde deel laat zien in welk gebied de punten in onze dataset zijn gescoord. 3
Bron: Deze dataset hebben we van Hans van Kuijen gekregen. Geraadpleegd op 18 januari 2015.
9
2.3 Criteria goede formules Om te weten of we de huidige formules eerlijk vinden en om ideeën te hebben waar onze mogelijke formules aan moeten voldoen, hebben we criteria opgesteld waarvan we vinden dat formules voor de meerkamp aan moeten voldoen. Deze criteria zijn grotendeels dezelfde criteria als in 1984 de criteria waren, maar we hebben er ook een aantal bijgemaakt. Onze criteria zijn dat de formules (al deze criteria lichten we verderop in deze paragraaf toe): 1. Moeten voldoen aan onze definitie van eerlijkheid (zie paragraaf 2.4) 2. Lineair moeten zijn, dus niet (licht) progressief 3. Bruikbaar moeten zijn voor beginners (schoolkinderen), junioren en (wereld)top atleten 4. Voor mannen en vrouwen verschillend moeten zijn (wij ontwerpen alleen formules voor de heptatlon maar voor de decatlon zou je op dezelfde manier tot andere formules kunnen komen) 5. Gebaseerd moeten zijn op statistische data van meerkampen 6. Op dit moment en in de toekomst toepasbaar moeten zijn 7. Zo moeten zijn ontworpen dat de einduitslagen van de (wereld)top ongeveer hetzelfde blijven 8. Moeten voorkomen dat een specialist in één onderdeel dat onderdeel zo goed kan doen dat zij op de andere onderdelen onder gemiddeld kan presteren en toch nog de wedstrijd kan winnen 9. Zo moeten zijn ontworpen dat uitslagen van verschillende wedstrijden onderling met elkaar vergeleken kunnen worden Wij vinden het belangrijk dat de formules, zowel de huidige van de IAAF als mogelijke nieuwe ontwerpen, eerlijk zijn en dus moeten ze voldoen aan de (door ons opgestelde) definitie van eerlijkheid. We hebben ervoor gekozen om het als criterium in te stellen dat de formules lineair zijn en niet, zoals in de eisen uit 1984 staat, licht progressief. Dit hebben we gekozen omdat we vinden dat het voor elke atleet op elk niveau even moeilijk is om een betere prestatie te leveren. Om dat te halen moet je namelijk boven je niveau presteren en dus boven jezelf uitstijgen. De reden waarom het tot nu toe een progressieve formule is, is dat het naarmate je meer naar de top komt, het moeilijker is om jezelf te verbeteren vanwege fysieke beperkingen van het lichaam. Wij vinden echter dat dit niet zo belangrijk is dat we de formules progressief moeten maken. Ook de beste atleten zijn ooit namelijk amateurs geweest en bovendien hebben de topatleten en de amateurs onderling geen last van elkaar, dus waarom zou het dan zo moeten zijn dat de topatleten voor een even goede verbetering beter beloond worden dan amateurs? Daarnaast maakt het de formules ook simpeler door ze niet progressief te maken. Dat is ook al een verbetering, als de formules simpeler worden, zonder dat ze minder eerlijk worden. De IAAF had in 1984 als een van de eisen ingesteld dat de formules bruikbaar moeten zijn voor beginners tot en met topatleten. Dit vinden we een goede eis, we vinden dat iedereen die atletiek beoefent, het recht heeft om met de 'echte' formules een 'echte' meerkamp te doen. Bovendien kan iedereen zich op deze manier vergelijken met andere atleten en ook met topatleten. Dat er voor zowel mannen als vrouwen andere formules moeten zijn is voor ons vanzelfsprekend. De mannen hebben andere en meer onderdelen dan de vrouwen en scoren bovendien beter dan de vrouwen. Het is realistisch dat formules zijn gebaseerd op wedstrijduitslagen en dan zou het gek zijn dat de formules voor de vrouwen gebaseerd zijn op uitslagen van mannen, of omgekeerd. Dan zouden de formules scheef in verhouding staan met de behaalde resultaten.
10
Dat de formules gebaseerd moeten zijn op statistische data van meerkampen is, zoals eerder genoemd, logisch. Als je in het wilde weg formules zou gaan maken die niet op uitslagen gebaseerd zijn, zijn die formules niet goed toepasbaar. Want dan weet je niet wat voor resultaten er gemiddeld behaald worden bij een meerkamp en dan kan je dus niet beoordelen wat voor resultaat hoeveel punten nodig heeft en hoe steil de lijn van meer punten in verhouding met een betere prestatie moet lopen. Het is natuurlijk handig dat formules zo lang mogelijk (het liefst voor altijd) bruikbaar blijven. Vandaar de eis dat ze op dit moment én in de toekomst toepasbaar moeten zijn. Er moet dus rekening worden gehouden met ruimte voor verbetering want door steeds meer ontwikkelingen in technieken, kleding, trainingsschema's en manieren van trainen, is er nog steeds verbetering en dat zal in de toekomst zeer waarschijnlijk zo doorgaan. Een andere eis die de IAAF al in 1984 stelde en dat ook een van onze criteria is, is dat de formules zo ontworpen moeten zijn dat de uitslagen van de (wereld)topatleten ongeveer gelijk blijven, zowel in puntenaantallen als in ranking. Dit omdat er anders moeilijkheden ontstaan met (wereld)ranglijsten en (wereld)records en dergelijke. Een kleine toevoeging aan die eis van de IAAF was echter wel dat dit zo moest zijn mits het geen andere problemen zou creëren, dat geldt bij ons ook. Onze volgende eis is ook op basis van de IAAF eisen uit 1984; de formules moeten natuurlijk voorkomen dat een specialist in een onderdeel met dat onderdeel een dermate grote voorsprong kan krijgen dat deze atlete de wedstrijd wint als zij verder onder het gemiddelde presteert. Dit zou de wedstrijd namelijk niet eerlijk maken want dan zouden atleten zich ook in trainingen kunnen gaan focussen op een of twee onderdelen en bij de rest ondermaats presteren en toch nog de wedstrijd winnen. Dat is tegenstrijdig met de opzet van een meerkamp, dat is namelijk dat atleten heel breed zijn en dus op alle onderdelen goed kunnen presteren en verder ook nog eens zoveel onderdelen in zo'n korte tijd op dat niveau kunnen doen. Ons laatste criteria vinden we belangrijk omdat atletiek een individuele prestatiesport is, het gaat bij atletiek niet alleen om of je een wedstrijd wint of niet, maar ook om je persoonlijke prestatie en om die van anderen. Bij atletiek moet je dus uitslagen kunnen vergelijken, dit kan zijn om te weten of een atleet een of ander (punten)record heeft of om een atleet op een wedstijd en zijn tegenstanders voor te bereiden.
2.4 Definitie eerlijkheid Met het idee om 'eerlijkere' formules te ontwerpen voor de heptatlon hebben we het onszelf moeilijk gemaakt. We moesten namelijk eerst onze definitie van eerlijkheid formuleren voordat we formules aan die definitie konden toetsen. Onze definitie van eerlijkheid luidt: voor elk onderdeel moet het even moeilijk zijn om een bepaald puntenniveau te halen en om vervolgens eenzelfde aantal punten hoger te halen. We zijn op deze definitie gekomen omdat we belangrijk vinden dat de heptatlon eerlijk verloopt. Voor ons is het logisch dat, als je verschillende onderdelen hebt die je samen moet voegen, deze onderdelen allemaal even zwaar wegen. Hieruit volgt dat het voor elk onderdeel even moeilijk moet zijn om een bepaald puntenniveau te halen en ook om eenzelfde aantal punten hoger te halen.
11
3. Ideeontwikkeling Toen we de criteria en de constanten hadden opgesteld, wisten we waar de mogelijke nieuwe formules aan moeten voldoen. We begonnen met een hele simpele formule die totaal niet voldeed aan de criteria (mogelijkheid 1, zie paragraaf 4.1). Dit deden we om even te kijken wat de allersimpelste formule zou zijn. We konden toen meteen zien op welke punten het in die formule misging zodat we die punten in volgende formules konden verbeteren. De andere formules zijn gebaseerd op statistische data die we van statisticus Hans van Kuijen hebben gekregen. Toen we mogelijkheid 2 (zie paragraaf 4.2) ontwikkelden, gingen we uit van de lineaire basisformule y = ax + b. Hierin is a het hellingsgetal en b het startgetal. Het startgetal stelden we op 800, dit was omdat we dat een mooi gemiddeld puntenaantal vonden. Bovendien zou je, ervan uit gaande dat de echte wereldtopatleten dan gemiddeld iets meer dan 900 punten per onderdeel zouden verdienen, uitkomen op ongeveer dezelfde uitslagen voor de wereldtop. We zijn op het hellingsgetal 100 uitgekomen door een schatting te maken, na testen en proberen vonden we uit dat dit een mooie schatting was. Om de x-waarde te verkrijgen bedachten we de formules die we uiteindelijk ook hebben gebruikt. Alleen wisten we nog niets van de standaarddeviatie. We hadden eerst een andere manier bedacht en later hebben we die veranderd omdat we toen wat kennis van wiskunde A hadden opgedaan en wisten dat we de standaarddeviatie nodig hadden. Fred Pach attendeerde ons erop dat we voor de loopnummers misschien ook met snelheden konden werken in plaats van met tijden. Het handigst en eerlijkst is dan om met gemiddelde snelheden te werken. Je zou ook met topsnelheden kunnen werken maar het gaat er bij atletiek natuurlijk om wie lang genoeg de hoogste snelheid kan vasthouden en dus als eerste bij de finish komt. We hebben er toen voor gekozen om onze mogelijkheid 2 te gebruiken en die alleen voor de loopnummers aan te passen. We hebben die mogelijkheid gebruikt en niet de IAAF formules omdat mogelijkheid 2 veel beter aan onze criteria voldoet (zie paragraaf 5.1 en 5.3). Vervolgens hebben we ervoor gekozen om niet met 1 ), 𝑡𝑡𝑡𝑡
de exacte snelheden te werken maar met een product daarvan (
dit maakt de formules namelijk
een heel stuk simpeler. Uiteindelijk hebben we uit de toetsing een conclusie getrokken welke formule de eerlijkste is (zie hoofdstuk 6).
12
4. Nieuwe formules We hebben een aantal mogelijke formules bedacht die we hier onder bespreken. We leggen per mogelijkheid eerst uit hoe de formule werkt, dan bespreken we de voor- en de nadelen van deze mogelijkheid en daarna geven we kort onze mening in de conclusie of deze formule goed is of niet. In hoofdstuk 5 toetsen we de formules aan onze criteria voor goede formules en aan onze definitie voor eerlijkheid. In paragraaf 4.4 hebben we nog iets bedacht wat een leuke toevoeging zou kunnen zijn om de meerkamp een leukere kijksport te maken. Dit is echter geen andere formule maar een kleine aanpassing in de manier waarop een wedstrijd wordt gehouden. N.B.: Bij al deze mogelijkheden moet de tijd worden ingevuld in seconden en de afstand in meters. N.B.: Het aantal significante cijfers in de constanten is op basis van het aantal significante cijfers in de uitslagen. N.B.: Bij mogelijkheden 2 en 3 staat er ‘INTEGER’ in de formules, dit zorgt ervoor dat de uitkomst wordt afgekapt bij de komma, zodat je mooie hele puntenaantallen krijgt.
4.1 Mogelijkheid 1 De eerste mogelijke telling die we bedacht hebben is eigenlijk super simpel. Bij deze mogelijkheid kijken we alleen naar de ranking per onderdeel en niet naar hoe overtuigend iemand gewonnen heeft. We geven per onderdeel de winnaar van dat onderdeel 100 punten. Elke volgende plek krijgt steeds twee punten minder. Als bij een onderdeel twee atleten hetzelfde resultaat behalen, krijgen beiden hetzelfde aantal punten. De volgende krijgt dan net zoveel punten als hij zou krijgen wanneer de atleten boven hem niet allebei hetzelfde resultaat behaald zouden hebben. Bijvoorbeeld: er is een gedeelde 2e plaats bij het verspringen, dan krijgen twee atleten 98 punten voor het verspringen en de beste na hun krijgt 94 punten. Bij deze mogelijkheid kan je natuurlijk ook een andere stapgrootte nemen of op een andere waarde beginnen. Voor een hele heptatlon is het wel belangrijk dat voor elk onderdeel dezelfde formule (met stapgroottes en beginwaarde) gehanteerd wordt, zodat elk onderdeel even zwaar meetelt in de wedstrijd. Voordelen: 1. Alle onderdelen wegen even zwaar, want bij elk onderdeel krijg je even veel punten voor de plek waarop je geëindigd bent. 2. Het is een overzichtelijke en duidelijke puntentelling die iedereen kan begrijpen. Nadelen: 1. De marge waarmee iemand wint, is niet terug te zien in de (eind)uitslag. Bijvoorbeeld: als iemand de 800 meter wint met een voorsprong van 2 honderdste, krijgt diegene evenveel punten meer ten opzichte van de andere deelnemers als hij zou krijgen als hij met een voorsprong van 30 seconden had gewonnen. 2. Verschillende wedstrijden kunnen onderling niet worden vergeleken. Dat komt doordat je bij een ander deelnemersveld op een hele andere plaats zou kunnen eindigen. Hierdoor is het ook niet mogelijk om een persoonlijk puntentotaal record te hebben, dat hangt er bij deze
13
3.
mogelijkheid namelijk sterk van af hoe goed en hoe groot het deelnemersveld is. Bijvoorbeeld: een wedstrijd met deelnemers uit de internationale top en een wedstrijd met amateurs zou je niet kunnen vergelijken ook al zijn de beginwaarde, stapgrootte en het aantal deelnemers hetzelfde. Een amateur zou zo dus een hoger puntentotaal kunnen behalen dan een internationale topatleet, terwijl hij lang niet beter is dan die topper. Met deze puntentelling heb je een maximum aantal deelnemers.
Conclusie: Wij vinden deze formule niet goed. We vinden dat de nadelen opwegen tegen de voordelen. Dit omdat deze formule in zijn geheel niet aansluit bij onze definitie van eerlijkheid, want we vinden het belangrijk dat elk onderdeel even zwaar weegt in de zin van dat het voor atleten bij elk onderdeel even moeilijk zou moeten zijn om een bepaald aantal punten meer te halen. Dat is hier niet zo, dat zie je aan nadeel 1. Ook kun je verschillende wedstrijden niet met elkaar vergelijken, dit is voor ons wel een eis voor een goede formule.
4.2 Mogelijkheid 2 4 Bij deze mogelijkheid hebben we gebruik gemaakt van de standaarddeviatie (σ), dit is de gemiddelde afwijking van het gemiddelde (μ). Je berekent deze waardes als volgt: μ=
𝑆𝑆𝑆(𝑦) ; 𝑛
σ=�
met y = uitslag en n = aantal waarden
2 ∑𝑛 𝑖=1(𝑦−𝜇)
𝑛
; met y = uitslag en n = aantal waarden
Bij het maken van deze formules, zou je eigenlijk beschikking moeten hebben over een hele hoop data van alle niveaus. Er zijn natuurlijk veel meer amateurs dan topatleten maar toch vinden wij dat de verhouding in gebruikte data 1:1 moet zijn. Dit aangezien alle berekende constanten in de formules anders te 'laag' worden om voor topatleten bruikbaar te zijn. Het gemiddelde en de standaarddeviatie krijgen namelijk heel erg andere waarden als je die baseert op uitslagen van alleen topatleten of juist alleen beginners. Als het met alleen data van de top berekend wordt, wordt het gemiddelde namelijk veel hoger dan het werkelijke gemiddelde, en als je het gemiddelde van alleen amateurs berekent wordt dat juist veel lager. Het is dus belangrijk dat je echt data van alle niveaus hebt zodat alle gemiddelden en standaarddeviaties overeenkomen met de werkelijkheid. Als je het gemiddelde toch gaat berekenen met alleen data van de top, kan het zo zijn dat de formule niet meer toepasbaar is voor amateurs, omdat alle constanten zijn berekend met veel te hoge standaarden. Dit gaat tegen een van onze criteria voor een goede formule in, wij vinden namelijk dat goede formules bruikbaar moeten zijn voor beginners (schoolkinderen), junioren en (wereld)top atleten. Om de formules toch een beetje te kunnen testen, hebben wij ze uitgeprobeerd op basis van de data die we van Hans van Kuijen hebben gekregen. (Dit zijn uitslagen van alle Nederlandse vrouwen die ooit boven de 5000 punten hebben gescoord met de huidige formules). Dit zijn natuurlijk alleen topuitslagen en de constanten die we hiermee berekend hebben, zouden dus anders moeten zijn als deze formules worden toegepast op data van alle niveaus, dit kan je berekenen zoals we hierboven hebben beschreven.
4
Bron: De constanten in de formule in mogelijkheid 2 zijn gebaseerd op statistische data die we van Hans van Kuijen hebben gekregen. Geraadpleegd op 9 en 10 december 2014.
14
We hebben met de data van Hans van Kuijen de constanten berekend, je krijgt dan de volgende waardes voor μ en σ: µ σ 100mh 14,12 s 0,4504 s 200m 25,03 s 0,7343 s 800m 139,36 s 6,3350 s Hoogspringen 1,73 m 0,0639 m Verspringen 5,90 m 0,285 m Kogelstoten 12,65 m 1,041m Speerwerpen 38,51 m 6,030 m We hebben er voor gekozen om voor een gemiddelde prestatie 800 punten te geven, dit is het begingetal en dan krijgen atleten elke keer dat ze eenmaal de standaarddeviatie boven het gemiddelde zitten, 100 punten extra. De uitslagen tussen het gemiddelde en één keer de standaarddeviatie daarboven en minder goede en de betere uitslagen staan in een lineair verband. De formule is lineair (zie de criteria in paragraaf 3.3) je krijgt dan de volgende formule waarbij de waarden voor x voor de afstanden (spring- en werpnummers) en de tijden (loopnummers) apart worden berekend (de waarden van μ en σ staan in de tabel hierboven): puntenaantal = INTEGER (800 + 100x) 𝑎𝑎𝑎𝑎𝑎𝑎𝑎−µ 𝜎 µ−𝑡𝑡𝑡𝑡 𝜎
o
afstanden: x =
o
tijden: x =
We hebben deze formules, die dus gebaseerd zijn op data van de top, uitgetest op verschillende manieren. We hebben de formules toegepast en gekeken hoe de ranglijst van vrouwen die boven de 5000 punten gehaald hebben (met de huidige formule) verandert. Ook hebben we boxplots gemaakt van zowel de huidige formule, als onze eigen mogelijkheid. Deze bespreken we bij de toetsing van deze mogelijkheid in paragraaf 5.3. Voordelen: 1. Wedstrijden zijn onderling te vergelijken. Want de uitslag is persoonlijk en niet afhankelijk van het deelnemersveld. 2. Elk onderdeel weegt even zwaar. Want bij deze formule is er gekeken naar het gemiddelde en de standaarddeviatie per onderdeel, in theorie zou het dus bij elk onderdeel even moeilijk moeten zijn om meer punten te halen. 3. Het gemiddelde aantal punten van elk onderdeel is hetzelfde. Bijvoorbeeld: bij het hoogspringen is het gemiddelde aantal punten gelijk aan dat van het kogelstoten. Het is dus niet zo dat het gemiddelde van het ene onderdeel 800 punten is het dat van het andere 1100. 4. De formule is simpeler dan de huidige IAAF formules, je hebt namelijk in totaal maar twee formules in plaats van drie en per onderdeel zijn er maar twee constanten (μ en σ). Nadelen: 1. We hebben alleen beschikking over uitslagen van meer dan 5000 punten met de IAAFpuntentelling. Dit zorgt ervoor dat het gemiddelde en de standaarddeviatie gebaseerd is op
15
een heel hoog niveau waardoor het zou kunnen dat de formules in hele lage uitslagen resulteren bij amateurs. Conclusie: Wij vinden dit een hele goede formule. Alle onderdelen wegen even zwaar, het is overal even moeilijk om meer punten te halen, je kan verschillende wedstrijden vergelijken en verder voldoet hij ook aan al onze eisen. Een nadeel is dat we deze formule niet hebben kunnen maken voor alle niveaus omdat we alleen data voor de top hadden, de formules zouden dus eigenlijk andere constanten moeten hebben. Dit ligt echter niet per se aan de formules, als we meer uitslagen hadden gehad en uitslagen van alle niveaus, dan zouden we de formules daar namelijk op aan kunnen passen.
4.3 Mogelijkheid 3 5 Bij deze mogelijkheid hanteren we eigenlijk dezelfde opbouw van de formules als bij mogelijkheid 2 (we maken dus gebruik van het gemiddelde en van de standaarddeviatie), maar we veranderen de formule voor de loopnummers (tijden x). In deze formule halen we de 'omkering' (μ - tijd) weg en die vervangen 1 𝑡𝑡𝑡𝑡
we door (
- μ). Het lijkt zo alsof dit juist een extra 'omkering' is, maar dat is niet zo.
1 𝑡𝑡𝑡𝑡
is namelijk
evenredig met de gemiddelde snelheid van een atlete tijdens haar onderdeel, want snelheid wordt uitgedrukt in meter per seconde dus in 'afstand per tijd'. Door dan niet met de tijd maar met rekenen, ga je dus eigenlijk al met snelheden werken. Het verschil tussen
1 𝑡𝑡𝑡𝑡
1 𝑡𝑡𝑡𝑡
te
en de snelheid is dan
alleen nog een constante (namelijk het aantal meters dat het onderdeel bevatte, dat moet 1
vermenigvuldigd worden met 𝑡𝑡𝑡𝑡), maar dat is verder voor de berekeningen in de formules niet relevant en kan dus handiger worden weggelaten. Door met snelheden (om precies te zijn dus met
1 ) 𝑡𝑡𝑡𝑡
in plaats
van tijden te rekenen betekent 'lineair' ineens iets anders. De grafiek is nog wel lineair maar lineair in snelheid is anders dan lineair in tijd. Bijvoorbeeld: op een 100 meter van een tijdswinst van 12 seconde naar 10 seconde is een snelheidswinst van 8,33 m/s naar 10 m/s. Een tijdswinst van 10 seconde naar 8 seconde is echter een snelheidswinst van 10 m/s naar 12,5 m/s. In dit voorbeeld zie je dat een lineaire verbetering in tijd, zeker niet een lineaire verbetering is in snelheid. De constanten van deze formules zijn weer het gemiddelde (μ) en de standaarddeviatie (σ), de gemiddelde afwijking van het gemiddelde. Deze waarden zijn hier alleen niet helemaal op dezelfde manier berekend als bij mogelijkheid 2, om σ voor de looponderdelen te berekenen moet je nu namelijk 1 𝑦
in plaats van y rekenen met . Dit moet aangezien je uiteindelijk de volgende vergelijking krijgt; tijden: x 1 −𝜇 𝑡𝑡𝑡𝑡
= 800 + 100(
𝜎
) = 800 +
100× 𝜎
1 𝑡𝑡𝑡𝑡
−
100𝜇 . 𝜎
In deze uitgewerkte formule zie je dat 800 −
standaardnotatie b, is en dat
100 𝜎
De standaardnotering van een lineaire formule is y = ax + b. 100𝜇 𝜎
eigenlijk de constante, het startgetal en dus in de
het hellingsgetal, in de standaardnotatie a, is. Ook in y = ax + b is het
belangrijk dat alle waarden dezelfde eenheid hebben, aangezien die eenheid s-1 is (vanwege de x waar met
1 𝑡𝑡𝑡𝑡
wordt gerekend), moeten µ en σ ook in s-1 worden ingevoerd. Vandaar dat er, om µ en σ te
5
Bron: De constanten in de formule in mogelijkheid 3 zijn gebaseerd op statistische data die we van Hans van Kuijen hebben gekregen. Geraadpleegd op 4 januari 2015.
16
1 𝑦
berekenen voor de loopnummers bij deze mogelijkheid, moet worden gerekend met . De formules voor µ en σ zijn dus: Looponderdelen: o o
μ=
1 𝑦
𝑆𝑆𝑆( ) 𝑛
; met y = uitslag en n = aantal waarden 1 𝑦
2 ∑𝑛 𝑖=1( −µ)
σ=�
𝑛
; met y = uitslag en n = aantal waarden
Spring- en werponderdelen: 𝑆𝑆𝑆(𝑦) ; 𝑛
o
μ=
o
σ=�
met y = uitslag en n = aantal waarden
2 ∑𝑛 𝑖=1(𝑦−µ)
𝑛
; met y = uitslag en n = aantal waarden
Op basis van de data van Hans van Kuijen komen we op de volgende constanten (waardes voor μ en σ) uit: µ σ -1 100mh 0,07091 s 0,002225 s-1 200m 0,03999 s-1 0,001182 s-1 800m 0,00032103 s-1 0,0071904 s-1 Hoogspringen Verspringen Kogelstoten Speerwerpen
1,73 m 5,90 m 12,65 m 38,51 m
0,0639 m 0,285 m 1,041 m 6,030 m
We hebben er weer voor gekozen om voor een gemiddelde prestatie 800 punten te geven, dit is het begingetal en dan krijgen atleten elke keer dat ze eenmaal de standaarddeviatie boven het gemiddelde zitten, 100 punten extra. De uitslagen tussen het gemiddelde en één keer de standaarddeviatie daarboven en minder goede en de betere uitslagen staan in een lineair verband. Bij de spring- en werpnummers is dit lineaire verband nog steeds hetzelfde want die formules zijn precies hetzelfde. Maar bij de looponderdelen is dat lineaire verband nu dus anders omdat er wordt gerekend met snelheden in plaats van tijden. De formule is als volgt: 𝑢𝑢𝑢𝑢𝑢𝑢𝑢− 𝜇 )) 𝜎
puntenaantal = INTEGER (800 + 100( o
uitslag looponderdelen =
1 𝑡𝑡𝑡𝑡
o uitslag spring en werponderdelen = afstand Ook deze formules hebben we uitgetest op data van andere wedstrijden en we hebben deze formules ook in boxplots gezet, dit is te zien bij de toetsing van deze mogelijkheid in paragraaf 5.4. Voordelen: 1. Wedstrijden zijn onderling te vergelijken. Want de uitslag is persoonlijk en niet afhankelijk van het deelnemersveld. 2. Elk onderdeel weegt even zwaar. Want bij deze formule is er gekeken naar het gemiddelde en de standaarddeviatie per onderdeel, in theorie zou het dus bij elk onderdeel even moeilijk moeten zijn om meer punten te halen.
17
3.
4.
Het gemiddelde aantal punten van elk onderdeel is hetzelfde. Bijvoorbeeld: bij het hoogspringen is het gemiddelde aantal punten gelijk aan dat van het kogelstoten. Het is dus niet zo dat het gemiddelde van het ene onderdeel 800 punten is het dat van het andere 1100. Je hebt met deze mogelijkheid maar één formule, in plaats van drie zoals bij de IAAF formules.
Nadelen: 1. We hebben alleen beschikking over uitslagen van meer dan 5000 punten met de IAAFpuntentelling. Dit zorgt ervoor dat het gemiddelde en de standaarddeviatie gebaseerd is op een heel hoog niveau waardoor het zou kunnen dat de formules in hele lage uitslagen resulteren bij amateurs. Conclusie: Wij vinden dit een hele goede formule. Alle onderdelen wegen even zwaar, het is overal even moeilijk om meer punten te halen, je kan verschillende wedstrijden vergelijken en verder voldoet hij ook aan al onze eisen. Een nadeel is dat we deze formule niet hebben kunnen maken voor alle niveaus omdat we alleen data voor de top hadden, de formules zouden dus eigenlijk andere constanten moeten hebben. Dit ligt echter niet per se aan de formules, als we meer uitslagen hadden gehad en uitslagen van alle niveaus, dan zouden we de formules daar namelijk op aan kunnen passen.
4.4 Toevoeging leukere kijksport Hans van Kuijen gaf ons als idee dat we de meerkamp van atletiek misschien een leukere kijksport konden maken door een achtervolging te maken van de middellange afstand (800m). Hiermee bedoelen we dat er voor het laatste onderdeel van de meerkamp (dit is altijd de middellange afstand) een totaalklassement is. Op basis van dat totaalklassement kan de achterstand in punten op de eerste worden omgerekend in een bepaald aantal seconden. Elke atlete vertrekt voor de 800 meter die berekende tijd na de koploper. Degene die dan het eerste over de finish komt, is de winnaar. Je moet echter alsnog de precieze tijden van elke afzonderlijke loper meten, zodat je ook aan die tijden weer punten kan toekennen. Je moet namelijk eindscores hebben om verschillende wedstrijden te kunnen vergelijken. Dit is echter niet echt een nieuwe formule en het geheel wordt er ook niet eerlijker van. We hebben ons hier daarom niet echt verder in verdiept en de omrekening van punten naar seconden en terug ook niet uitgewerkt. Voordelen: 1. Op deze manier wordt het einde van een wedstrijd voor zowel het publiek als voor de atleten interessanter, begrijpelijker en spannender. Want de volgorde waarin men over de finish komt, is meteen ook de einduitslag. Hierdoor wordt de meerkamp misschien een populairdere kijksport. 2. Atleten weten tijdens de middellange afstand precies waar ze aan toe zijn en kunnen zo extra gestimuleerd worden om nog een inhaalslag te maken. Nadelen: 1. Met deze puntentelling is het heel moeilijk om elke atleet op het juiste moment te laten starten. Dit in verband met eventueel honderdsten of duizendsten van seconden.
18
2.
3. 4.
De tijdwaarneming en dus uiteindelijk ook de einduitslag in punten is moeilijk concreet te hanteren en te berekenen. De einduitslag moet namelijk wel weer worden omgerekend in puntenaantallen om wedstrijden met elkaar te kunnen vergelijken en om persoonlijke- en wereldrecords te kunnen hebben. Al het omrekenen van puntenaantallen naar tijden en terug kost veel moeite en er kunnen makkelijk fouten bij worden gemaakt. Atleten die zo'n grote voorsprong hebben dat ze al bijna gefinisht zijn als de volgenden of de laatsten nog moeten starten. Dit maakt de wedstrijd niet spannender omdat de uitslag van te voren eigenlijk al bekend is. Bovendien kunnen atleten die een grote voorsprong hebben op de anderen minder gemotiveerd zijn om tot het gaatje te gaan. Dit is de keerzijde van voordeel 2.
Conclusie: Dit zou misschien leuk zijn om toe te voegen aan de wedstrijd, in combinatie met een van onze eerlijke formules. Het zou alleen wel een hoop extra gedoe zijn en de kans op het maken van fouten zou groter zijn, dus echt handig is het niet.
19
5. Toetsing formules Om te weten of onze mogelijkheden aan de criteria en de definitie van eerlijkheid voldoen, moeten we ze daar natuurlijk wel aan toetsen. Op basis daarvan kunnen we ook bepalen wat volgens ons de beste nieuwe formules zijn. In dit hoofdstuk toetsen we eerst de IAAF formules en daarna achtereenvolgens de mogelijkheden 1, 2 en 3.
5.1 IAAF formules Voor ons profielwerkstuk moeten we natuurlijk niet alleen nieuwe formules bedenken en ontwerpen maar we moeten ook weten waarom we dat doen. Is er iets mis met de huidige formules? Dat niet per se, vanuit die gedachte zijn we ook totaal niet aan dit project begonnen, dat was puur uit nieuwsgierigheid naar hoe de puntentelling er eigenlijk aan toegaat. Toch is het voor het geheel belangrijk dat we ook de IAAF formules toetsen aan de hand van onze criteria en definitie van eerlijkheid. Dan weten we namelijk ook wat er, volgens ons, anders zou moeten aan die formules. Deze formules voldoen aan veel van onze eisen. Er wordt voldaan aan criteria 3, 4, 5, 6, 7, 8 en 9. Dit is ook wel logisch want deze criteria zijn hetzelfde als de criteria die in 1985 werden gebruikt toen deze formules werden ontwikkeld. De formules zijn in principe voor atleten van elk niveau bruikbaar, er zijn voor mannen en vrouwen verschillende formules (dat wil zeggen verschillende constanten), de formules zijn gebaseerd op statistische data en zijn in de afgelopen jaren bruikbaar geweest en in de toekomst zal dat niet veranderen. De formules zijn toentertijd zo ontworpen dat uitslagen van de (wereld)top ongeveer hetzelfde bleven, bovendien is het met deze formules mogelijk om wedstrijden met elkaar te vergelijken. Als laatste is het met deze formules onmogelijk voor een specialist om haar onderdeel zo goed te doen dat ze op de andere onderdelen onder gemiddeld kan presteren en dan nog de wedstrijd (ruim) kan winnen. Maar deze formules voldoen niet aan al onze criteria. Zo voldoen ze niet aan ons belangrijkste criterium, nummer 1. Volgens onze definitie van eerlijkheid moet het namelijk bij alle onderdelen even moeilijk zijn om een bepaald puntenniveau te halen, hieruit volgt dat de gemiddelden van alle onderdelen op hetzelfde niveau zouden moeten liggen. Het tweede deel van onze definitie zegt dat het bij elk onderdeel ongeveer even moeilijk zou moeten zijn om een bepaald aantal punten hoger te krijgen. Dit zou moeten resulteren in een even grote spreiding van punten bij elk onderdeel. In figuur 2 is te zien dat de gemiddelden van de verschillende disciplines heel sterk verschillen en dat ook de spreidingen niet gelijk zijn. Dat zie je aan het feit dat de balkjes niet allemaal op dezelfde hoogte zitten (dit geeft aan dat het voor het ene onderdeel makkelijker is om op een bepaald puntenniveau uit te komen dan voor een ander onderdeel) en dat ze ook niet allemaal even lang zijn (dit geeft aan dat de spreidingen niet gelijk zijn, het is dus niet bij alle onderdelen even moeilijk om een bepaald aantal punten hoger te halen). (Deze boxplot is gemaakt op basis van data die we van Hans van Kuijen hebben gekregen, dit is data van alle resultaten van vrouwen die ooit meer dan 5000 punten hebben gehaald op de heptatlon. Het gaat in totaal om 272 uitslagen.)
20
6
Figuur 2 : boxplot per onderdeel van de IAAF formules.
Ook wordt er met deze formules niet voldaan aan criterium nummer 2: deze formules zijn (héél licht) progressief (zie paragraaf 2.2). De IAAF formules zijn dus op zich goede formules, ze voldoen aan bijna al onze criteria maar ze voldoen niet aan onze definitie van eerlijkheid. We vinden de IAAF formules dus niet eerlijk en dus ook niet goed genoeg.
5.2 Mogelijkheid 1 Deze mogelijkheid valt eigenlijk al meteen af. Hij voldoet totaal niet aan onze definitie van eerlijkheid. Wij vinden namelijk dat het voor elk onderdeel even moeilijk moet zijn om een bepaald puntenniveau te halen. Dat is bij deze mogelijkheid niet het geval. Het hangt namelijk heel sterk af van het deelnemersveld hoe moeilijk het is om een bepaald aantal punten te halen. Als de andere deelnemers allemaal heel goed zijn, haal jij veel minder punten dan als de andere heel slecht zijn. Het zou juist altijd, onafhankelijk van het deelnemersveld en bij alle onderdelen even moeilijk moeten zijn om een bepaald aantal punten te halen. Ook is het niet bij alle onderdelen even moeilijk om een bepaal aantal extra punten te halen, dit is ook weer zo omdat het afhankelijk is van het deelnemersveld. Daarnaast voldoet het ook niet aan een aantal van onze andere eisen voor een eerlijke formule, namelijk de eisen 4, 5, 7 en 9. De formules voor mannen en vrouwen moeten verschillend zijn, bij deze manier is het hetzelfde. De formules moeten gebaseerd zijn op statistische data van meerkampen. Deze manier is niet gebaseerd op data, er wordt gekeken naar individuele wedstrijden. Ook moeten de einduitslagen van de top ongeveer hetzelfde blijven als er een nieuwe formule komt. Dit verandert juist heel erg, het hoogste wat met deze mogelijkheid te halen is, is 700 punten, terwijl de topatleten nu 6
Bron: De boxplot is gebaseerd op statistische data die we van Hans van Kuijen hebben gekregen. Geraadpleegd op 9 januari 2015.
21
ongeveer tussen de 6000 en 7000 punten halen. We hebben onze formule uitgeprobeerd op de uitlagen van de Europese Kampioenschappen in 2014 en onze berekende uitslagen vergeleken met de officiële uitlagen, figuur 3 hier onder. Daaraan kan je ook duidelijk zien dat de eindduitlagen niet ongeveer gelijk blijven, de rangorde verandert ook heel erg daardoor.
7
Figuur 3 : tabel waarin de einduitslagen van de eerste acht (volgens de IAAF formule) dames van het EK in 2014 met de IAAF formule en mogelijkheid 1 worden vergeleken.
Daarnaast moeten verschillende wedstrijden vergeleken kunnen worden. Dit is niet mogelijk, zie nadeel 2 paragraaf 4.1. Deze mogelijkheid voldoet wel aan de eisen 2, 3, 6 en 8. De formules moeten lineair zijn, dit is wel het geval. Bij elke plaats lager gaan er 2 punten af, als je de punten in een grafiek zet, krijg je dus een rechte lijn. De formules moeten ook voor alle niveaus bruikbaar zijn. Deze formule is wel voor alle niveaus bruikbaar, maar omdat hij zo afhankelijk is van het deelnemersveld kan je de niveaus niet met elkaar vergelijken. De formule moet nu en in de toekomst toepasbaar zijn. In deze formule staat niets waardoor het ooit niet meer toepasbaar zou kunnen zijn. Behalve als ze in de toekomst wedstrijden gaan houden met meer dan 50 deelnemers. Daarnaast mag een specialist in één onderdeel niet dat onderdeel zo goed kunnen doen dat zij op de andere onderdelen onder gemiddeld kan presteren en toch nog de wedstrijd kan winnen. Als de specialist namelijk op dat ene onderdeel wint krijgt zij voor dat onderdeel 100 punten. Maar voor de rest van de onderdelen krijgt zij het laagste aantal punten omdat zij daar verliest. Dan kan de specialist dus niet winnen door dat ene onderdeel. Dus deze formule is geen goede nieuwe formule, het voldoet maar aan 4 van onze 9 eisen voor en goede formule. Maar het allerbelangrijkste argument om te zeggen dat het geen goede formule is, is dat het niet aan onze definitie van eerlijkheid voldoet.
5.3 Mogelijkheid 2 Deze mogelijkheid is een hele goede mogelijkheid, hij voldoet namelijk aan al onze eisen voor een goede formule! Het voldoet aan onze definitie van eerlijkheid. Het is namelijk voor elk onderdeel even moeilijk om een bepaald puntenniveau te behalen, want het puntenniveau van elk onderdeel is gebaseerd op de gemiddelde prestatie en die gemiddeldes leveren allemaal evenveel punten op, in de boxplot hieronder zie je dat aan het feit dat alle balkjes op dezelfde hoogte zitten. Ook is het bij elk onderdeel even moeilijk om een bepaald aantal punten extra te halen, dit zie je in de boxplot in figuur 4 hieronder aan het feit dat de spreiding van punten die bij elk onderdeel hetzelfde is.
7
Bron: uitslagen van de heptathlon op de Europese Kampioenschappen in 2014. Geraadpleegd op 18 augustus 2014 en op 11, 12, 13 en 19 januari 2015. http://www.iaaf.org/results/european-championships/2014/22nd-european-athletics-championships-5535
22
8
Figuur 4 : boxplot per onderdeel van mogelijkheid 2.
Ook zijn de formules lineair, ze zijn in de vorm y = ax + b, dat is de standaardnotatie van een lineaire formule. Het kan dat de formules nu niet helemaal goed te gebruiken zijn voor amateurs, omdat we ze gebaseerd hebben op data van alleen de top, dit is echter niet de schuld van de formule maar van onze beperkte data. Als je de formules echter op exact dezelfde manier opstelt met zowel data van amateurs als data van de topatleten in de verhouding 1:1, is de formule voor iedereen goed te gebruiken. Echter kan het wel zo zijn dat er voor een definitieve verbetering op basis van veel meer data en dus ook van verschillende niveaus wel nog wat geschoven moet worden met de waarden '100' en '800', zodat de uiteindelijke uitslagen van de wereldtop nog meer lijken op de uitslagen met de huidige formules. Je kan zo het gemiddelde totaal aantal punten omhoog of omlaag halen door de waarde ‘800’ respectievelijk groter of kleiner te maken. Ook kan je het aantal punten meer of minder bij een betere of mindere prestatie veranderen door wat te schuiven met de waarde ‘100’. Maar ook met deze formule en constanten is het al een hele goede mogelijkheid, de uitslagen van de wereldtop komen behoorlijk overeen. We hebben dit getest op de eerste acht uitslagen (volgens de IAAF formule) van de Europese Kampioenschappen in 2014, het resultaat hiervan is te zien in figuur 5.
8
Bron: Deze boxplot is gebaseerd op statistische data die we van Hans van Kuijen hebben gekregen. Geraadpleegd op 13 januari 2015.
23
9
Figuur 5 : tabel waarin de einduitslagen van de eerste acht (volgens de IAAF formule) dames van het EK in 2014 met de IAAF formule en mogelijkheid 2 worden vergeleken.
Je ziet hier dat de puntentotalen bijna niet veranderen. Ze vallen bij bijna alle dames iets lager uit dan de puntentotalen die berekend worden met de IAAF formules. Verder zijn plaats 3 en 4 omgewisseld, dat zegt dat Thiam in een bepaald onderdeel net wat beter is dan Schäfer maar dat onderdeel wordt in de IAAF formules een klein beetje bevoordeeld ten opzichte van de formules van mogelijkheid 2. We vinden echter dat verschillen in de einduitslagen ongeveer hetzelfde blijven, mogelijkheid 2 voldoet dus ook aan criterium 7. Verder zijn de formules voor mannen en vrouwen verschillend. Voor mannen kan je de formules op precies dezelfde manier berekenen, alleen dan gebruik makend van uitslagen van decatlons. Ook zijn de formules gebaseerd op statistische data van meerkampen en ze zijn zowel nu als in de toekomst toepasbaar. Dit is dus een hele goede formule, aangezien het aan al onze eisen voor een goede formule voldoet.
5.4 Mogelijkheid 3 Het rekenen met snelheden in plaats van met tijden biedt mogelijkheden en zorgt voor een frisse kijk op de puntentelling. Er is in principe niets mis met deze manier, wat zou er mis mee zijn? Het is natuurlijk wel belangrijk dat deze formules aan onze criteria voldoen. Deze formules voldoen aan de volgende eisen: 1, 2, 3, 4, 5, 6, 7, 8 en 9. Zoals je ziet voldoet deze mogelijkheid dus aan alle eisen. Het belangrijkste punt, of de formules aan onze definitie van eerlijkheid voldoet, is goed. Bij deze formules liggen de punten gemiddelden namelijk (ongeveer) op dezelfde hoogte, ook is de spreiding nagenoeg hetzelfde. Dat is in de boxplot in figuur 6 goed te zien.
9
Bron: uitslagen van de heptathlon op de Europese Kampioenschappen in 2014. Geraadpleegd op 18 augustus 2014 en op 11, 12, 13 en 19 januari 2015. http://www.iaaf.org/results/european-championships/2014/22nd-european-athletics-championships-5535
24
10
Figuur 6 : boxplot per onderdeel van mogelijkheid 3.
Verder zijn de formules lineair, bij de loopnummers weliswaar een beetje anders dan men gewend is, aangezien er eigenlijk met snelheden wordt gerekend, maar nog steeds is het geheel lineair. Of de formules bruikbaar zijn voor zowel echte beginners als voor toppers, weten we niet zeker. Het kan heel goed zo zijn dat de formules voor beginners nadeliger uitvallen dan de bedoeling is, dit komt dan waarschijnlijk door de beperkte data die we tot onze beschikking hebben gehad. Als we data van alle niveaus hadden gehad, waren de formules waarschijnlijk niet zo 'scheef' uitgevallen. Echter kan het wel zo zijn dat er voor een definitieve verbetering op basis van veel meer data en dus ook van verschillende niveaus wel nog wat geschoven moet worden met de waarden '100' en '800', zodat de uiteindelijke uitslagen van de wereldtop nog meer lijken op de uitslagen met de huidige formules. Voor de decatlon, dus voor de mannen, zijn op precies dezelfde manier formules te ontwerpen die dan (waarschijnlijk) dezelfde basis (puntenaantal = 800 + 100x; tijden: x en afstanden: x) hebben maar andere constanten. Dat is ook logisch want deze μ en σ zijn op andere data gebaseerd. Zoals er bij de omschrijving en de ontwikkeling van deze mogelijkheid is vermeld, zijn de constanten gebaseerd op statistische data van heptatlons. Wij zien geen enkele reden voor deze formules om niet in de toekomst toepasbaar te zijn en op het moment zijn ze ook toepasbaar. Om eis 7 te testen hebben we mogelijkheid 3 toegepast op de eerste acht uitslagen (volgens de formules van de IAAF) van de Europese Kampioenschappen in 2014. Het resultaat hiervan staat in figuur 7.
10
Bron: Deze boxplot is gebaseerd op statistische data die we van Hans van Kuijen hebben gekregen. Geraadpleegd op 11 januari 2015.
25
11
Figuur 7 : tabel waarin de einduitslagen van de eerste acht (volgens de IAAF formule) dames van het EK in 2014 met de IAAF formule en mogelijkheid 3 worden vergeleken.
Je ziet dat de puntentotalen behoorlijk overeen komen. Er zijn kleine verschillen te zien maar we denken dat deze verschillen te klein zijn om er echt een punt van te maken. Hier worden net als bij mogelijkheid 2 rang 3 en 4 omgewisseld. De reden is waarschijnlijk weer dat Thiam in een onderdeel, dat in de IAAF formules wordt bevoordeeld ten opzichte van de formules van mogelijkheid 3, beter is dan Schäfer. Al met al voldoet mogelijkheid 3 dus ook aan eis 7. Criterium 8 eist dat het, vanzelfsprekend, niet mogelijk is om als specialist een onderdeel zo goed te doen dat je er zoveel punten voor krijgt dat je bij de andere onderdelen onder gemiddeld kan presteren en dan alsnog de wedstrijd wint. Met deze manier van het berekenen van de totale puntentelling is het mogelijk om wedstrijden onderling te vergelijken. Dus deze mogelijkheid is volledig geslaagd. Het heeft op alle punten goed gescoord en is volgens ons zeker een goede mogelijke nieuwe formule.
11
Bron: uitslagen van de heptathlon op de Europese Kampioenschappen in 2014. Geraadpleegd op 18 augustus 2014 en op 11, 12, 13 en 19 januari 2015. http://www.iaaf.org/results/european-championships/2014/22nd-european-athletics-championships-5535
26
6. Conclusie Onze hoofdvraag was: hoe kunnen wij een eerlijkere formule voor de meerkamp van atletiek ontwerpen? Om een eerlijkere formule te ontwerpen, moesten we eerst weten hoe de huidige formule ontstaan is, zodat we precies wisten wat er allemaal al geprobeerd is met de formule en we onze tijd niet hoefden te besteden aan het onderzoeken van al afgekeurde formules. Voor deze geschiedenis zie paragraaf 2.1. Toen moesten we onderzoeken hoe de huidige formules precies werken, om te kunnen zien waar het misgaat en wat we eraan kunnen verbeteren. Voor de uitleg van de huidige formules zie paragraaf 2.2. Om iets te ontwerpen, heb je natuurlijk altijd criteria nodig waaraan je ontwerp moet voldoen, die criteria hebben we opgesteld in paragraaf 2.3. Als laatste, aangezien we eerlijkere formules wilden ontwerpen, moesten we een definitie van eerlijkheid opstellen, deze is te vinden in paragraaf 2.4. Maar dit was alleen nog het voorwerk. Om eerlijkere formules te ontwerpen, moet je ook veel uitproberen en nadenken hoe je kan zorgen dat een formule aan je eisen voldoet. Onze mogelijkheid 1 was een typisch voorbeeld van uitproberen wat er gebeurt. We wilden eens kijken wat er zou gebeuren als je het aller simpelste wat wij konden bedenken zou gebruiken. Daaraan zie je dan weer wat er misgaat en daar konden we verder op bouwen. Uiteindelijk hebben wij twee formules ontworpen, mogelijkheid 2 en mogelijkheid 3, die eerlijker zijn dan de IAAF-formule. Deze formules voldoen namelijk allebei aan onze definitie van eerlijkheid en aan al onze andere criteria, zie paragraaf 5.3 en 5.4. De IAAF-formule voldoet daarentegen niet aan al onze eisen en deze voldoet ook niet aan onze definitie van eerlijkheid zie paragraaf 5.1. Maar uiteindelijk kan er maar één ontwerp de beste zijn. Dat is onze mogelijkheid 3. Deze mogelijkheid geeft bijna dezelfde resultaten als mogelijkheid 2, dus daar zit het verschil niet in. Het verschil zit hem in het feit dat je bij mogelijkheid 3 één soort formule voor alle drie de onderdelen kan gebruiken. Bij mogelijkheid 2 heb je een aparte formule nodig voor de looponderdelen. Voor de uiteindelijke formule gebruiken we voor de constanten in plaats van µ en σ respectievelijk A en B omdat dit overzichtelijker is. Het uiteindelijke model is dus: 𝑢𝑢𝑢𝑢𝑢𝑢𝑢−𝐴 )) 𝐵 1 = 𝑡𝑡𝑡𝑡 𝑖𝑖 𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠
Puntenaantal = INTEGER (800 + 100( o
uitslag looponderdelen
o uitslag spring en werponderdelen = de afstand in meters De waarden van A en B zijn: A B 100mh 200m 800m
Hoogspringen Verspringen Kogelstoten Speerwerpen
0,07091 s-1 0,03999 s-1
0,0071904 s-1 1,73 m 5,90 m 12,65 m 38,51 m
0,002225 s-1 0,001182 s-1 0,00032103 s-1 0,0639 m 0,285 m 1,041 m 6,030 m
We kunnen dus op de manier die hierboven beschreven is een eerlijkere formule ontwerpen, met heel goed resultaat!
27
7. Discussie Ons profielwerkstuk maken is heel erg goed gegaan en we vonden het heel leuk om te doen. Onze samenwerking was super goed, we hebben een leuk interview gehad en mailcontact met mensen die een belangrijke rol spelen in de atletiek, onze communicatie met Fred (onze begeleider) ging goed en het belangrijkste: we hebben eerlijkere formules ontworpen! Tijdens het proces hebben we maar een paar problemen gehad. Het belangrijkste daarvan is dat we nergens hebben kunnen vinden hoe men in 1985 nou precies op de constanten die nu gebruikt worden, is gekomen. Toch hebben we heel veel tijd besteed aan het uitzoeken hiervan. Achteraf hadden we hier beter minder tijd in kunnen stoppen, aangezien Hans van Kuijen ons al had verteld dat het bijna onmogelijk is om het uit te vinden; hij kon er zelf ook niet achter komen. Een ander probleem was dat we alleen data hadden van topprestaties om onze nieuwe formule op te baseren, hierdoor werkt onze formule niet helemaal goed voor amateurs. Maar ondanks de beperkte data hebben we toch formules kunnen ontwerpen die aan al onze eisen voldoen! Al met al vonden we het een heel geslaagd project waar we heel veel van geleerd hebben.
28
8. Dankwoord Bij het hele proces van ons profielwerkstuk hebben we van meerdere mensen hulp gehad, deze mensen willen we graag bedanken. Als eerste willen we natuurlijk graag Fred Pach, onze profielwerkstukbegeleider, bedanken. Hij heeft ons vanaf het begin af aan en zelfs al voordat hij officieel onze begeleider was, erg geholpen. We hebben regelmatig afspraken gehad om te brainstormen en om te laten zien wat we hadden gedaan, zo bleef hij op de hoogte van de ontwikkelingen en hielp hij ons verder. Ten tweede zijn we Hans van Kuijen heel dankbaar dat hij de tijd voor ons heeft willen nemen en dat hij ons zoveel heeft kunnen uitleggen over de achtergrond van de formules. Ook zijn we natuurlijk heel blij met al zijn data die hij ons heeft gegeven. Als laatste willen we graag onze ouders bedanken voor het helpen en het geven van mentale steun bij ons profielwerkstuk. Zij hebben ons geholpen met het wegwijs worden in Excel, het maken van boxplots, onze formulering en het maken van powerfood.
29
9. Bronvermelding We hebben in ons verslag nauwelijks geciteerd of stukken gebaseerd op een of meerdere bronnen, de keren dat we dat wel hebben gedaan, staat er een voetnoot bij. Op de achtergrond hebben we wel (enigszins) informatie gebruikt van de volgende bronnen. o Papieren document ‘scoring tables’ dat we hebben gekregen van Hans van Kuijen. Dit document is in het Engels, dit hebben we samengevat en vertaald. o http://www.oocities.org/mdetting/sports/decatlon-points-history.html (link van Stefan Waltermann) o http://atletiekunie.nl/index.php?page=150 o Dataset van Hans van Kuijen, hij heeft ons heel veel uitslagen gegeven waarop we onze constanten in de nieuwe formules hebben gebaseerd. o http://www.iaaf.org/results/european-championships/2014/22nd-european-athleticschampionships-5535 o http://nl.wikipedia.org/wiki/Meerkamp#Puntentelling o Wedstrijdreglement 2014-2015 (Atletiekunie) (http://www.tigch.nl/knau/wedstrijdreglement.pdf) o http://www.wiskunde.net/standaarddeviatie#.VEO0XxaWuh4 o Mondelinge informatie van Hans van Kuijen, we hebben hem op 1 november 2014 in Breukelen geïnterviewd, dit interview is in de bijlage (paragraaf 10.1) uitgewerkt. o Mailcontact met Stefan Waltermann o Mailcontact met Eric Roeske
30
10. Bijlage 10.1 Uitwerking van het interview met Hans van Kuijen INLEIDENDE VRAGEN Hans van Kuijen begon als atleet, hij is zelfs Nederlands jeugd kampioen geworden op de 400mh maar een jaar later scheurden zijn kruisbanden af en is hij in de organisatie beland. Hij vond atletiek meteen al een hele leuke sport en was vooral geïnteresseerd in de meerkamp. De reden daarvoor is vooral dat hij het fantastisch vindt dat de meerkampers het hele spectrum van atletiek beheersen, daarnaast vindt hij de sfeer onderling fascinerend: 'Meerkamp is een hele sociale sport.'. Hij werd al snel gevraagd voor de functie van secretaris wedstrijdsport bij de KNAU. Door zijn werk als meerkamp statisticus bezoekt hij regelmatig grote internationale wedstrijden, ook helpt hij soms bij de organisatie daarvan. Hij is door de atleten veelal gewaardeerd omdat ze weten dat hij denkt vanuit de atleten; hij wil niet het beste voor zichzelf of de wedstrijd o.i.d. maar het beste voor de atleten. Hij heeft zelf ook programmaatjes gemaakt waarmee hij voor én tijdens de wedstrijd prognoses en overzichten van de wedstrijd en van de atleten kan maken. De overzichten en grafieken worden tijdens de wedstrijd voortdurend aangepast en zijn dus actueel. Ze baseren zich op referentie uitslagen (meestal de p.b.'s of de s.b.'s van een atleet) en vergelijken die met de uitslagen van dat moment, zo kan je precies zien hoe een atleet presteert en wat er nog van diegene te verwachten is. Ook kan je dat vergelijken met de overzichten/grafieken van de andere atleten waardoor je prognoses van het verdere verloop van de wedstrijd op kan stellen. Maar, het blijft een sport en het blijven mensen die die beoefenen, dus er kunnen verrassende wendingen plaatsvinden die niemand had kunnen voorspellen, dat maakt (de) sport ook zo mooi volgens Hans van Kuijen. In de loop van de jaren heeft Hans van Kuijen een heleboel data (uitslagen van wedstrijden) verzameld. Er zijn niet zo veel statistici (op het niveau van Hans) in de wereld, die statistici wisselen samen uitslagen van wedstrijden uit. Ook krijgt Hans wel eens uitslagen toegestuurd en verder zoekt hij de uitslagen op. Elk jaar geeft hij een boek uit (hij had voor ons allebei het boek van 2013 meegenomen) met alle prestaties van grote atleten en wedstrijden. Hij verwerkt daarin wereldranglijsten allertijden en van het betreffende jaar en hij verwerkt er een aantal hoogtepunten van dat jaar in. Hij is sinds twee jaar gepensioneerd maar met zijn hobby als statisticus bij atletiek gaat hij nog vrolijk door. Al zijn werk voor de atletiekwereld heeft hij dus al die jaren vrijwillig gedaan en dat doet hij nu nog. VRAGEN OVER TOTSTANDKOMING De formules zijn in de loop van de afgelopen eeuw ontwikkeld. Ze zijn veranderd van lineair naar progressief naar deels progressief, deels regressief naar wat er nu is; licht progressief. Sinds 1985 bestaan de huidige tabellen, het opstellen van die formules moest aan een aantal eisen voldoen: 1. De nieuwe formules moesten alleen gebruikt worden voor meerkampen. 2. De resultaten van verschillende onderdelen moesten, voor zover dat mogelijk was, ongeveer tot hetzelfde aantal punten komen bij een vergelijkbare moeilijkheid. 3. De nieuwe formules moesten ook: a. een aanpassing zijn van de bestaande formules b. een rechte lijn voor alle onderdelen zijn (bij alle onderdelen om de top te halen, nagenoeg evenveel punten voor dezelfde moeilijkheid) c. licht progressief zijn voor alle onderdelen 4. De nieuwe formules moesten bruikbaar zijn voor beginners (schoolkinderen), junioren en (wereld)top atleten.
31
5. 6.
Er moesten voor mannen en vrouwen apart verschillende formules (en constanten) bestaan. Alle nieuwe formules moesten gebaseerd zijn op de statistische data van de meerkampen maar er moest ook worden gekeken naar statistische data van specialisten die maar op een onderdeel presteren. 7. De nieuwe formules moesten op dat moment en in de toekomst toepasbaar zijn. 8. Het was wenselijk dat, zonder andere problemen te creëren, de einduitslagen met de nieuwe formules voor de wereldtop atleten ongeveer hetzelfde bleef. 9. Voor zover mogelijk moesten de nieuwe formules voorkomen dat een specialist in een onderdeel niet de andere onderdelen te boven kan komen waardoor hij de wedstrijd vanzelfsprekend zou winnen. De criteria die zijn gehanteerd om te zorgen dat alle onderdelen ongeveer even zwaar wegen. Zoals al eerder gezegd zijn de formules en bijbehorende constanten opgesteld met behulp van heel veel uitslagen. Het zou leuk zijn als we zouden weten hoe men op deze constanten is uitgekomen. In eerste instantie waren er alleen formules voor de decatlon dus voor de tienkamp; het meerkamp onderdeel dat mannen beoefenen. Dat komt natuurlijk omdat de decatlon al vanaf 1912 wordt beoefend en er eerst alleen mannen waren die meerkampen deden. De formules voor de heptatlon zijn volgens Hans van Kuijen gemaakt op dezelfde manier als die van de decatlon. De formules hebben dezelfde basis alleen andere constanten. Deze constanten zijn (waarschijnlijk) op dezelfde manier opgesteld als die voor de decatlon, dus op basis van heel veel uitslagen (van verschillende niveaus). Hans van Kuijen heeft ons jammer genoeg niet kunnen helpen met de vraag hoe men op deze constanten is gekomen. In 1985, toen de huidige formules met bijbehorende constanten werden gemaakt, was bij dat proces de Tsjech Dr. Viktor Trkal betrokken. Hans kent hem en heeft ook wel eens geprobeerd te achterhalen hoe ze op die constanten zijn gekomen maar dat is hem niet duidelijk geworden, mede door de taalbarrière. Hans heeft er verder nooit zoveel waarde aan gehecht dat hij er helemaal in is gedoken en het helemaal heeft uitgepluisd. De formules die tegenwoordig worden gebruikt bestaan al sinds 1985 in deze vorm. De formules worden niet meer aangepast als er grote veranderingen zijn in bijvoorbeeld technieken of kleding. Die zijn er sinds 1985 ook niet meer geweest. Misschien wel de grootste en meest radicale verandering qua techniek werd namelijk al in 1968 geïntroduceerd, de fosbury flop. Daarna zijn er nagenoeg geen grote ontwikkelingen meer geweest qua atletiektechnieken of kleding. Dus aangezien er voordat de nieuwe formules zijn gemaakt, de laatste grote ontwikkelingen zijn geweest, is het (tot nu toe nog) niet nodig geweest om de formules aan te passen. (Bovendien is het maar de vraag of dat nodig is; als er nieuwe ontwikkelingen zijn, zijn de atleten gewoon beter dan de vorige, dus hebben ze recht op records en bovendien hebben de andere atleten er geen na- of voordeel van aangezien ze waarschijnlijk dezelfde techniek en kleding hebben.) Toen we vroegen of er rekening wordt gehouden met de wind, bleek dat een pijnlijk punt te zijn. De huidige regel met betrekking tot de wind houdt in dat de wind in de formule zelf, dus voor de uitslagen, niet meetelt. De wind wordt alleen gemeten omdat records en dergelijke niet tellen als er gemiddeld over de hele meerkamp plus of min 2,0 m/s wind was. Hans vindt dit echter geen goede regel, hij pleit voor de oude regel die tot 2010 werd gehanteerd, die regel luidt: de prestatie is legaal als de wind op het betreffende onderdeel minder dan 4 meter per seconde bedraagt, of indien het gemiddelde van de drie onderdelen (waarop de wind wordt gemeten) minder dan 2 meter per seconde is. Hij is samen met een heel aantal andere 'grote' mensen/trainers/coaches in de atletiekwereld aan het proberen om deze verandering in de regels terug te draaien. Het blijkt echter dat de officials van de
32
IAAF ontzettend conservatief zijn en dat ze bij het eerste woord wat ook maar lijkt op kritiek op hun teentjes getrapt zijn. Dan onderhandelt men niet meer en schiet men meteen in de verdediging. Dit is op zich reëel, zij het niet dat de officials veel al geen verstand hebben van atletiek. Dit maakt het geheel nogal krom (onze woorden) aangezien deze mensen wel stemmen over belangrijke beslissingen (wat betreft regels etc.) maar eigenlijk dus geen idee hebben wat de gevolgen/consequenties daarvan zijn. Dit zijn gevolgen voor de atleten maar ook voor de uitslagen. De onderdelen waaruit de meerkamp bestaat, hebben ze gekozen omdat deze onderdelen al heel lang in meerkampverband gebruikt worden. De specifieke afstanden van de loopnummers zijn eigenlijk een beetje willekeurig gekozen, zo dat de afstanden gewoon ronde getallen zijn. Bij hordenlopen is het zo geregeld hoe het het best uitkomt met de afstanden tussen de horden. De huidige formule is zo ontworpen dat de verschillende onderdelen zo eerlijk mogelijk met elkaar te vergelijken zijn. Het is natuurlijk moeilijk om te bepalen wanneer iets eerlijk is. Hans van Kuijen vindt dat de formules eerlijk zijn als heel verschillende soorten sporters goed met elkaar kunnen sporten én als alle sporters, ook al hebben ze verschillende kwaliteiten, toch ongeveer dezelfde uitslagen moeten kunnen halen. Ook vindt hij dat het zo moet zijn dat specialisten in één onderdeel niet doordat ze heel goed zijn in dat ene onderdeel de wedstrijd mogen kunnen winnen. De formule moet er zo ook voor zorgen dat je 'complete' sporters krijgt, doordat het dus voordeliger is om in alle onderdelen redelijk goed te zijn dan om super goed te zijn in één onderdeel. KNAU/IAAF Bij het berekenen van de punten van meerkampen worden altijd de IAAF formules gebruikt en verder zijn er eigenlijk geen formules nodig. Je vraagt je dan af waarom de KNAU überhaupt nog eigen formules heeft. Die zijn er omdat de IAAF geen formules heeft voor pupillen en C-/D-junioren. Ook worden die formules van de KNAU gebruikt voor de competitie, de IAAF formules gaan namelijk echt alleen maar over de meerkamp. Er bestaat nog zo'n soort formule als de KNAU formule, dus voor de competitie: de Hongaarse formule. Die wordt door de IAAF en ook in andere landen gebruikt voor resultaatvergelijking van de prestaties in de verschillende individuele onderdelen van specialisten. Hans vertelde dat er aan die formule regelmatig wordt gesleuteld vanwege de gemiddelde prestaties in een bepaald jaar dus dat hij zijn bedenkingen had bij de kwaliteit van de formule. De formules van de KNAU zijn anders dan die van de IAAF omdat die van de KNAU over specialisten wedstrijden gaan bij competitiewedstrijden. Waarom de basis van de KNAU formules zoveel verschillen van die van de IAAF is dat de KNAU formules gelden voor specialisten en de IAAF telling voor meerkampers. MENING/VERBETERING? Hans van Kuijen heeft gedurende het interview regelmatig laten weten dat hij denkt dat de huidige formules heel erg goed en eerlijk zijn. Hij vindt het niet nodig om nieuwe formules te maken en denkt ook niet dat er iets mee gedaan gaat worden, dit aangezien de officials bij de IAAF (en de KNAU) zo conservatief zijn. Bij het opstellen van nieuwe formules moet volgens Hans rekening gehouden worden met dezelfde criteria en dezelfde eisen als waarmee rekening gehouden werd in 1985. Hij zou zelf trouwens wel de regel met betrekking tot de wind willen terugdraaien.
33
In de Noorse combinatie, dit is een combinatie van schansspringen en langlaufen, is het schansspringen als eerste onderdeel. Iedere sporter springt twee keer, de afstanden worden bij elkaar opgeteld en zo wordt een puntenklassement opgesteld. De achterstand die elke sporter heeft tot de eerste wordt omgerekend in een tijd. Vervolgens is het langlaufen aan de beurt, hierbij vertrekt degene die bovenaan het klassement staat, als eerste, de rest mag zoveel tijd na de eerste starten als er berekend is op basis van zijn achterstand. Op deze manier wordt het langlaufen een achtervolging en is degene die als eerste over de eindstreep komt ook echt de winnaar. Dit leek Hans van Kuijen een leuke ingang voor een alternatieve formule. Bij de meerkamp is het laatste onderdeel namelijk altijd de middellange afstand (bij de heptatlon is dat 800m). Als je dan ook de achterstand zou kunnen omrekenen naar een aantal seconden, zou je ook een achtervolging kunnen maken. Zo wordt de einduitslag voor het publiek duidelijker en ook spannender. Mogelijke nadelen die we meteen al bedachten waren dat atleten met zo'n grote voorsprong al gefinisht kunnen zijn als de anderen nog moeten starten, op deze manier is de wedstrijd alsnog niet spannender en misschien alleen maar moeilijker voor de atleten omdat ze alleen lopen. Mogelijke nieuwe formules moeten sowieso via een landelijke atletiekbond bij de IAAF worden ingediend. Individuele aanvragen voor wijzigingen worden niet aanvaard. Stel dat je een inbreng wil hebben, moet je je voorstel eerst indienen bij een landelijke atletiekbond (het meest voor de hand liggend is de KNAU maar het kan ook via andere landen). Als je voorstel daar wordt aangenomen, kan die bond het voorstellen bij de IAAF. Alleen is, zoals al eerder gezegd, de kans dat nieuwe voorstellen (voor formules) worden geaccepteerd erg klein, aangezien de officials in deze erg conservatief zijn. De sfeer bij het interview was heel erg goed. Hans van Kuijen was heel erg vriendelijk en had het interview duidelijk goed voorbereid. Hij begon met een powerpoint presentatie die hij in 2013 gehouden had voor de Nederlandse pers. Na die presentatie had hij veel van onze vragen eigenlijk al beantwoord. Hij vond ook dat wij heel goed voorbereid waren en al heel veel van het onderwerp wisten, meer dan hij verwacht had. Hij wil graag ons verslag zien als het af is. De opname van het interview was helaas mislukt, we moesten deze uitwerking dus helemaal uit het hoofd doen. Hans van Kuijen had gelukkig wel gezegd dat we hem mochten mailen als we iets niet meer wisten. Na het interview heeft hij ons ook een hele hoop data gegeven. We mochten deze gebruiken voor ons onderzoek, als we beloofden dat we het nergens anders voor zouden gebruiken.
10.2 Logboek Datum 20 januari 2014 20 januari 2014 24 januari 2014 24 januari t/m 28 maart 2014 20 februari 21 maart 2014 28 maart 2014 31 maart 2014
Wie? 5VZ1 + 2 + 3 5VZ1 + 2 + 3 Carine en Hanna Carine en Hanna Carine met begeleiders Carine, Hanna en Fred Carine, Hanna en Fred Carine en Hanna
Wat? Inleiding profielwerkstuk 2015 Cursus "theorie onderzoeken en ontwerpen" Presentaties profielwerkstukken 5H en 6V bekijken
Waar? Aula B2-gang B3-gang
Gedacht over onderwerpen
Op school
Onderzoek en ontwerpen praktijk
B0-2
Brainstormen over onderwerp
D1-13
Onderwerp bedacht + begonnen met bedenken (onderzoeks)vragen In kwt bij Thijs verder met invullen startkaart
D1-13 B3-1
34
4 april 2014 4 april 2014 9 april 2014 16 mei 2014 31 mei 2014 13 juni 2014 20 juni 2014 26 juni 2014 27 juni 2014 18 augustus 2014 8 september 2014 18 september 2014
Carine, Hanna en Fred Carine en Hanna Carine en Hanna Carine en Hanna Carine en Hanna Carine en Hanna Carine, Hanna en Fred Carine en Hanna Carine en Hanna Carine en Hanna Carine, Hanna en Fred Carine en Hanna
18 september tot 31 oktober 2014 19 oktober 2014
Carine en Hanna
22 oktober 2014
Carine, Hanna en Fred Carine en Hanna Carine en Hanna Carine en Hanna
31 oktober 2014 1 november 2014 1 november 2014 4 november 2014 5 november 2014 5 november 2014 20 november 2014 23 november 2014 30 november 2014 9 december 2014
Carine en Hanna
Invullen startkaart + controleren + paraaf Fred
D1-13
Inleveren startkaart bij Thijs Begin gemaakt met documenten profielwerkstuk
Postkamer op school Mediatheek
Formules opgezocht
Huis Hanna
Begin planning
Huis Carine
Oriëntatie interviews
Mediatheek
Bespreken + laten zien wat tot nu toe + werken aan powerpoint Powerpoint voor minipresentatie afgemaakt + presentatie gemaakt Minipresentatie profielwerkstuk
D1-13
Formules selecteren + kennis mee maken + met Excel leren werken Definitieve formulering onderzoeksvraag + brainstormen KNAU gemaild + definitie eerlijkheid bedacht/geformuleerd + omkering formules geformuleerd + eerste vragen interview bedacht Mailcontact met H. van Kuijen en E. Roeske van de KNAU
Huis Hanna
Alternatieve formules bedacht + een daarvan geprobeerd op uitslagen + kennis gemaakt met wiskunde A + uitgezocht hoe het zit met windcompensatie Laten zien wat tot nu toe (bedachte formules) + brainstormen Vragen interview bedacht
Huis Carine
Voorbereiding interview perfectioneren
Huis Hanna
Interview met statisticus H. van Kuijen
Huis Carine B2-2c
Bèta kamer Huis Carine Verschillend
Kamer Fred Huis Carine
Hanna
Begin uitwerking interview
Van der Valk restaurant, Breukelen Mediatheek
Carine, Hanna en Fred Carine en Hanna Carine, Hanna en Fred Carine en Hanna Carine
Verslag gedaan van interview
Kamer Fred
Uitwerking interview
Huis Hanna
Vragen hoe nu verder
D1-1K
Nieuwe formules + begin verslag
Huis Hanna
Geschiedenis en inleiding
Huis Carine
Hanna
Criteria goede formules + definitie eerlijkheid
Huis Hanna
35
9 december 2014 10 december 2014 10 december 2014 11 december 2014 18 december 2014 19 december 2014 29 december 2014 2 januari 2015 4 januari 2015 4 januari 2015 4 januari t/m 6 januari 2015 9 januari 2015 11 januari 2015 12 januari 2015 13 januari 2015 14 januari 2015 14 januari 2015 16 januari 2015 17 januari 2015 18 januari 2015 19 januari 2015 20 januari 2015 20 januari 2015 21 januari 2015 22 januari 2015 22 januari 2015 23 januari 2015
Carine
Nieuwe formules
Huis Carine
Hanna
Criteria goede formules + definitie eerlijkheid + mailen Hans van Kuijen met uitwerking interview Nieuwe formules + definitie eerlijkheid
Huis Hanna
Finishing touch eerste concept + eerste concept inleveren Eerste concept nagekeken + commentaar gestuurd
Huis Hanna
Commentaar van Fred alvast bekeken
Mediatheek
Aanpassingen op basis van Freds commentaar + taken verdeeld Toelichting van het logboek Toelichting van het logboek + definitie eerlijkheid + toetsing formules + dankwoord Mogelijkheid 3 Mailcontact met S. Waltermann
Huis Carine
Toetsing IAAF formules Toetsing mogelijkheid 3 Toetsing mogelijkheid 1 Toetsing mogelijkheid 2 Overleg met Fred, bespreken wat nog gedaan moet worden Planning maken
Huis Hanna Huis Hanna Huis Carine Huis Carine D1-1K
Ideeontwikkeling Conclusie Uitleg huidige formules + toetsingen formules verder maken + grafieken maken Discussie + toetsing formules afmaken + leuke toevoeging afmaken Overleg met Fred
Huis Hanna Huis Carine Huis Hanna
Finishing touch verslag + beginnen met presentatie
Huis Carine
Presentatie afmaken + oefenen
Huis Hanna
Presentatie oefenen
Huis Hanna
Overleg met Fred
D1-1K
Inleveren profielwerkstuk + presenteren
School
Carine Hanna Fred Carine en Hanna Carine en Hanna Carine Carine en Hanna Hanna Carine en Hanna Hanna Hanna Carine Carine Carine, Hanna en Fred Carine en Hanna Hanna Carine Carine en Hanna Carine en Hanna Carine, Hanna en Fred Carine en Hanna Carine en Hanna Carine en Hanna Carine, Hanna en Fred Carine en Hanna
Huis Carine
Unknown
Huis Carine Huis Hanna Huis Hanna Verschillend
Mediatheek
Huis Carine + Huis Hanna D1-1K
10.3 Toelichting van het logboek Hier gaan we opschrijven wat we hadden bedacht hoe het aan te pakken. Ook schrijven we hier of dat is gelukt en vertellen we wat we allemaal hebben gedaan. We leggen hier dus eigenlijk ook een beetje het logboek uit.
36
Op 20 januari 2014 begon het allemaal, toen was er in de profielweek een eerste inleiding over het profielwerkstuk en hadden we ook een cursus over onderzoeken en ontwerpen. In diezelfde week op 24 januari zijn we gaan kijken naar profielwerkstukpresentaties van de eindexamenkandidaten van toen. We hadden toen al heel snel bedacht om ons profielwerkstuk samen te doen aangezien we allebei dezelfde dingen interessant vonden en ook allebei hard wilden werken om een goed resultaat te krijgen. De enige vraag die toen overbleef was: wat gaan we nou eigenlijk doen? Daar hebben we een hele tijd over nagedacht. We bedachten al snel dat we 'iets met wiskunde' wilden doen. Maar als je 'iets met wiskunde' gaat doen, zijn er nog steeds een heleboel mogelijkheden. We hebben toen op 21 maart voor het eerst met Fred Pach afgesproken omdat hij heel erg veel weet over wiskunde en ook leuke ideeën heeft. Wij wilden dan wel graag iets met wiskunde doen, maar het moest vooral niet al te theoretisch zijn. Het moest meteen duidelijk zijn dat de wiskunde die wij gingen onderzoeken ook ergens voor gebruikt werd. Zo kwamen we op wiskunde in de sport en uiteindelijk op de formule voor de meerkamp van atletiek. We besloten dat we gingen onderzoeken hoe die formule nou eigenlijk werkte, om uiteindelijk zelf een eerlijkere formule te kunnen maken, een ontwerp dus. Toen het onderwerp bedacht was en we de startkaart hadden ingevuld en op 4 april ook hadden ingeleverd, konden we eindelijk echt beginnen. We zijn toen begonnen met het aanmaken van een OneDrive-account, zodat we overal aan ons verslag konden werken. Ook hebben we de huidige formules opgezocht. We hebben toen veel informatie verzameld en veel over de geschiedenis gevonden van de formule, maar nergens stond hoe de huidige formule nou precies werkt of hoe de formule is opgebouwd. We wilden dus een interview houden met iemand van de atletiekunie die veel verstand had van de formule. Daarnaast wilden we een interview houden met een (internationale)meerkampatleet die regelmatig te maken heeft met de formules. Daarna moesten we al heel snel onze posterpresentatie houden, waarbij we presenteerden wat ons onderwerp was en hoe we ons onderzoek gingen aanpakken. We hebben daar veel over nagedacht en onze aanpak die we toen bedachten was als volgt: o Data verzamelen zowel uitslagen van wedstrijden als informatie over de huidige formule o Data analyseren uitzoeken hoe de huidige formule precies werkt en bedenken wat er eerlijker kan o Ontwerp maken zelf een formule bedenken o Ontwerp testen onze formule testen op de uitslagen van wedstrijden en dit vergelijken met de huidige formule Dit is eigenlijk wel ongeveer hoe we het uiteindelijk hebben aangepakt. Na deze presentatie zei Harma van Duijn dat ons onderzoek wel heel erg uitgebreid was en wel een promotie-onderzoek leek. We hebben in de zomervakantie toen veel nagedacht over ons onderzoek en ook over hoe we het konden inperken. We wilden toen namelijk nog de hele meerkamp in ons onderzoek betrekken, dus zowel de decatlon (mannen) als de heptatlon (vrouwen). Op 18 augustus, dus de laatste vakantiedag zijn we weer actief gaan werken aan ons profielwerkstuk. We zijn begonnen door kennis te maken met Excel aangezien we heel veel data zouden gebruiken in ons onderzoek en het niet te doen is om dat allemaal met de hand te verwerken. Op 8 september hebben we voor het eerst weer met Fred afgesproken en onze onderzoeksvraag definitief geformuleerd. Ook hebben we toen gebrainstormd over hoe we een eerlijker formule konden maken,
37
wat 'eerlijk' eigenlijk is, hoe we het onderzoek gingen aanpakken, etc. Dit soort brainstormsessies hebben we later nog veel vaker gehouden. Op 18 september hebben we de atletiekunie gemaild om te vragen of we een interview met iemand mochten houden die veel verstand had van de formules van de meerkamp. De atletiekunie zei toen dat we het beste Hans van Kuijen konden interviewen, waarna we een afspraak voor een interview met hem gemaakt hebben. Dat interview vond uiteindelijk op 1 november plaats. In de tijd tussen het eerste contact en het interview hebben we nog veel meer uitgezocht over de huidige formule en over hoe we een eerlijkere formule kunnen ontwerpen. We ontdekten dat we daarvoor veel meer van wiskunde A te weten moesten komen, omdat er veel statistiek bij zulke formules komt kijken. Natuurlijk hebben we ook ons interview voorbereid. Het interview vond plaats in het Van der Valk restaurant in Breukelen. De sfeer tijdens het interview was heel goed en Hans van Kuijen heeft ons heel veel nuttige informatie gegeven. Ook heeft hij ons een hele grote dataset met wedstrijduitslagen gegeven. Dit was echt super fijn want die data hadden we nodig om de formules op te kunnen baseren. Het enige wat Hans van Kuijen ons helaas niet kon vertellen was hoe de huidige formules nou precies tot stand zijn gekomen. Dit vormde wel een probleem, want we konden dat zelf ook nergens vinden. In de periode na het interview hebben we het interview uitgewerkt, dit was nog een hele klus want de opname was mislukt dus alles moest uit ons hoofd, Hans van Kuijen had gelukkig wel gezegd dat we hem altijd nog mochten mailen als we nog vragen hadden. We hebben hem het uitgewerkte interview nog toegestuurd zodat hij het kon lezen en eventueel kon aanpassen. Na het interview zijn we met de verkregen informatie en data aan de slag gegaan voor het ontwerpen van onze eigen, eerlijkere, formule. Ook waren we nog steeds heel hard opzoek naar een manier om er achter te komen hoe de huidige formule nou precies ontstaan is en zijn we begonnen met het schrijven van het verslag. Op 11 december hebben we toen ons eerste concept ingeleverd bij Fred. Een week later kregen we ons verslag met zijn commentaar erbij. Toen zijn we aan de slag gegaan met zijn opmerkingen en hebben we het verslag afgemaakt. In de tussentijd hebben we ook een mail gestuurd naar Stefan Waltermann, hij heeft zelf een aantal jaar geleden een heleboel uitgezocht over de formules en de constanten. We hebben contact met hem opgenomen omdat we hoopten dat hij ons meer zou kunnen vertellen over de manier waarop de constanten zijn opgesteld. Hij heeft ons een link opgestuurd met een artikel dat meneer Trkal zelf heeft geschreven. Jammer genoeg stond hier niet nog iets in over de oorsprong van de constanten. Intussen hebben we flink doorgewerkt aan het verslag en hebben we ook wat afspraken met Fred gehad om hem op de hoogte te houden. Uiteindelijk hadden we het verslag op 20 januari helemaal af, toen zijn we ook meteen begonnen met het maken van de presentatie. We hebben hard gewerkt om een zo goed mogelijk resultaat af te leveren!
38