FACULTEIT WETENSCHAPPEN Departement Biologie Afdeling Diversiteit en Systematiek van dieren
De invloed van internationale prestaties op de fokwaardeschatting bij sportpaarden
door
Maarten Aerts
Promotor: Prof. F. Volckaert
Proefschrift ingediend tot het
Co-promotor: Prof. N. Buys
behalen van de graad van
Begeleider: Dr. S. Janssens
Master in de Biologie
Academiejaar 2010-2011
© Copyright by K.U.Leuven Zonder voorafgaande schriftelijke toestemming van zowel de promotor(en) als de auteur(s) is overnemen, kopiëren, gebruiken of realiseren van deze uitgave of gedeelten ervan verboden. Voor aanvragen tot of informatie i.v.m. het overnemen en/of gebruik en/of realisatie van gedeelten uit deze publicatie, wend u tot de K.U.Leuven, Faculteit Wetenschappen, Geel Huis, Kasteelpark Arenberg 11, 3001 Leuven (Heverlee), Telefoon +32 16 32 14 01. Voorafgaande schriftelijke toestemming van de promotor(en) is eveneens vereist voor het aanwenden van de in dit afstudeerwerk beschreven (originele) methoden, producten, schakelingen en programma’s voor industrieel of commercieel nut en voor de inzending van deze publicatie ter deelname aan wetenschappelijke prijzen of wedstrijden.
FACULTEIT WETENSCHAPPEN Departement Biologie Afdeling Diversiteit en Systematiek van dieren
De invloed van internationale prestaties op de fokwaardeschatting bij sportpaarden
door
Maarten Aerts
Promotor: Prof. F. Volckaert
Proefschrift ingediend tot het
Co-promotor: Prof. N. Buys
behalen van de graad van
Begeleider: Dr. S. Janssens
Master in de Biologie
Academiejaar 2010-2011
Woord vooraf Bij deze zou ik graag de mensen bedanken die hebben bijgedragen tot de realisatie van deze verhandeling. Het was een weg vol uitdagingen en probleemstellingen die ik zonder hen nooit had kunnen voltooien. In de eerste plaats zou ik Prof. Filip Volckaert willen bedanken om mij de kans te geven een genetisch onderwerp te kiezen dat buiten de traditionele biologie ligt. Zonder zijn medewerking en goedkeuring had ik dit uiterst interessante onderwerp niet verder kunnen ontdekken en uitspitten. Daarbij zou ik ook graag Prof. Nadine Buys bedanken om mij als bioloog te steunen in de keuze voor dit ingenieursonderwerp en mij de kans te geven om aan dit proefschrift te werken in haar onderzoeksgroep. De volgende persoon die m’n uitdrukkelijke dank en erkentelijkheid verdient is Dr. Ir. Steven Janssens. Ik heb een jaar lang kunnen meeliften op zijn expertise en kennis van de fokkerij en kwantitatieve genetica en van z’n steun naar mijn onderzoek toe. Niet alleen over de fokkerij en genetische evaluatie van paarden, maar ook over computerprogrammering heb ik dit jaar enorm veel bijgeleerd. Ik mag hierbij de andere medewerkers van de onderzoeksgroep Huisdierengenetica (in het bijzonder Machteld Brebels) niet vergeten. Ook hen ben ik dankbaar om steeds met raad klaar te staan. Bijzondere dank gaat ook uit naar Huub Van Aert, zonder wiens monnikenwerk om al de internationale prestaties bij te houden dit onderzoek niet mogelijk was geweest. Uiteraard mag ik m’n ouders niet vergeten te bedanken. Niet alleen dit laatste jaar, maar ook de voorbije jaren stonden ze steeds met raad en daad klaar voor mij. Geen moeite was voor hen teveel en ik dank hen dan ook voor de kansen die ze mij gegeven hebben. Hierbij dank ik m’n vader nog extra om dit werk na te lezen en te verbeteren. Als laatste, maar zeker niet minste groep mag ik m’n medestudenten en vrienden niet vergeten. Zij hebben er mee voor gezorgd dat deze studententijd me altijd zal bijblijven en daar ben ik hen zeer dankbaar voor!
I
Samenvatting Belgische paarden zijn zeer succesvol in de internationale springsport. Toch worden in België, tot op heden, internationale prestaties, die de meeste weerklank krijgen bij pers en publiek, niet meegenomen voor de berekening van fokwaardeschattingen. Momenteel worden de fokwaarden berekend op basis van resultaten van LRV- en KBRSF-wedstrijden. Het doel van dit eindwerk is om te kijken of, en hoe, internationale resultaten kunnen geïncorporeerd worden in de fokwaardeschattingen. Naast de datasets gebruikt voor de traditionele fokwaardeschattingen, wordt er gebruik gemaakt van een manueel samengestelde dataset met internationale prestaties van BWP paarden. Een eerste deel van ons onderzoek betreft het bepalen van de factoren die in de verschillende modellen beschouwd moeten worden. Het traditionele model zonder internationale prestaties is gebaseerd op het Genetisch Spring Index (GSI) model. Voor het model met internationale prestaties worden dezelfde factoren meegenomen, maar wordt er een extra kenmerk HoogteKlasse toegevoegd. HoogteKlasse is een maat voor de hoogste proef die een paard ooit gelopen heeft in z’n sportcarrière, waarbij internationale prestaties worden meegenomen. De erfelijkheidsgraden, geschat voor LRV- en KBRSF-prestaties zijn voor het traditionele model 0,055 en 0,082. Deze waarden zijn lager dan degene die momenteel worden aangenomen voor de berekening van de Genetische Spring Index. In het model met internationale prestaties zijn deze erfelijkheidsgraden 0,082 en 0,090 voor LRV- en KBRSF-resultaten respectievelijk. Deze erfelijkheidsgraden komen overeen met die van vergelijkbare kenmerken in andere Europese landen. De erfelijkheidsgraad voor HoogteKlasse wordt geschat op 0,399. Deze waarde ligt hoger dan hetgeen in Nederland (het enige land met een vergelijkbaar, doch uitgebreider kenmerk) wordt aangenomen. De genetische correlaties tussen LRV-resultaten en HoogteKlasse variëren, afhankelijk van het model, tussen 0,779 en 0,795. Voor KBRSF-resultaten en HoogteKlasse variëren de genetische correlaties tussen 0,545 en 0,600. Alhoewel er een goed begin is gemaakt, blijft het verzamelen van data over internationale resultaten een aandachtspunt naar verder onderzoek toe.
II
Summary Belgian horses are very successful in the international showjumping scene. However, until present, in Belgium, these international performances are not used for the calculations of breeding value estimations. For the moment, breeding values are calculated on results from LRV and KBRSF competitions. The aim of this thesis is to see if, and how, international results can be incorporated in the breeding value estimations. Aside from the datasets used for the traditional breeding value estimations, a manually constructed dataset with data from international results of BWP horses is used. A first part of our research focuses on determining the factors that will be used in the different models. The traditional model, without international data is based on the model of the GSI (Genetic Showjumping Index). For the model with international data, the same factors are used but an extra effect is added, namely HoogteKlasse, which is a measure for the highest competition a horse has ever competed in. In HoogteKlasse, also international data are considered. The heritability’s, estimated for LRV- and KBRSF-performances for the traditional model are 0,055 and 0,082. These values are lower than the ones used in the calculations of the GSI for the moment. For the model with international data, these heritability’s are 0,082 and 0,090. These values are equivalent to those of comparable effects in other European countries. The heritability for HoogteKlasse is estimated at 0,399. This value is higher then what is presumed in the Netherlands (the only country with a comparable, though more extensive feature). The genetic correlations between LRV-performances and HoogteKlasse vary, depending the model, between 0,779 and 0,795. For KBRSF-results and HoogteKlasse, genetic correlaties lie between 0,545 and 0,600. Although a good start has been taken, the collecting of data about international performances of the horses stays and important point of attention for further research.
III
Afkortingenlijst ABP
Aufbauprüfungen für junge Pferde
ANOVA
Analysis Of Variance
BCP
Belgische Confederatie van het Paard
BLUP
Best Linear Unbiased Prediction
BWP
Belgisch Warmbloed Paard
CSN
Concours de Sauts d'obstacles National
DB
Derby
DIP
Dienst Identificatie Paarden
DWB
Danish WarmBlood Society
FEI
Federation Equestre International
FN
Deutsche Reiterliche Vereinigung
Fte
Full Time Equivalenten
FTP
File Transfer Protocol
Fw
Fokwaarden
Fws
Fokwaardeschatting
GP
Grote Prijs
HANN
Hannoveraner Verband
HK
HoogteKlasse
HLP
Hengstleistungsprüfungen
ISH
Irish Sport Horse
KBRSF
Koninklijke Belgische Ruiter Sport Federatie
KlCyc
Klassieke Cyclus
KNHS
Koninklijke Nederlandse Hippische Sportfederatie
KWPN
Koninklijk Warmbloed Paardenstamboek Nederland
LRV
Landelijke RijVereniging
MCMC
Markov Chain Monte Carlo IV
ML
Maximum Likelihood
MLE
Maximum Likelihood Estimators
MME
Mixed Model Equations
MTGSAM
Multi Trait Gibbs Sampler for Animal Models
NC
Nations Cup
OLD
Verband der Züchter des Oldenburger Pferde
PEV
Prediction Error Variance
REML
Restricted Maximum Likelihood
RHQT
Riding Horse Quality Test
SBS
Stamboek Belgisch Sportpaard
SF
Selle Français
SWB
Swedish WarmBlood Association
TRAK
Trakehner Verband
TSP
Turniersport
UELN
Universal Equine Life Number
VCE
Variance Component Estimation
VCP
Vlaamse Confederatie van het Paard
VLP
Vlaamse Liga Paardensport
VSC
Vlaams Supercomputer Centrum
WB
Wereldbeker
WBFSH
World Breeding Foundation for Sport Horses
WJP
Wedstrijd Jonge Paarden
YHT
Young Horse Test
Z
Zangersheide
ZSP
Zuchtstutenprüfungen
V
Tabellenlijst Tabel 1: Overzicht van de kenmerken en bron van de data voor de fokwaardeschatting voor springaanleg in 7 Europese landen en 9 stamboeken ..................................................................................... 21 Tabel 2: Overzicht van de gebruikte modellen, effecten, erfelijkheidsgraden en genetische correlaties voor de fokwaardeschatting voor springaanleg in 7 Europese landen en 9 stamboeken ....................................................................................................................................................................... 22 Tabel 3: Datastructuur van dataset 2008 ............................................................................................................. 24 Tabel 4: Datastructuur van dataset 2010-2011 ................................................................................................. 24 Tabel 5: Datastructuur FEI dataset .......................................................................................................................... 25 Tabel 6: Datastructuur dataset nationale gegevens ......................................................................................... 26 Tabel 7: Datastructuur pedigreebestand .............................................................................................................. 26 Tabel 8: Datastructuur van de gecombineerde dataset .................................................................................. 28 Tabel 9: Datastructuur van de uiteindelijke dataset ....................................................................................... 29 Tabel 10: Verdeling van de kenmerken LRV en KBRSF in de uiteindelijke dataset ............................ 30 Tabel 11: Indeling van de verschillende wedstrijden in hoogteklassen .................................................. 31 Tabel 12: Indeling van de leeftijdsklasses ............................................................................................................ 32 Tabel 13: Indeling van de geboortejaarklasses .................................................................................................. 33 Tabel 14: Verschillende modellen voor de analyses in VCE en MTGSAM................................................ 34 Tabel 15: Startwaarden voor de varianties en erfelijkheidsgraden voor model 2 van MTGSAM . 35 Tabel 16: Startwaarden voor de varianties voor model 1 van MTGSAM ................................................. 35 Tabel 17: Aantal wedstrijden, tijdsspanne, prestaties en paarden per jaar in de manuele internationale dataset ................................................................................................................................................... 36 Tabel 18: Aantal paarden per origineel stamboek per jaar in de manuele internationale dataset ................................................................................................................................................................................................ 36 Tabel 19: Paarden met de meeste prestaties en hun vader in de manuele internationale dataset ................................................................................................................................................................................................ 37 Tabel 20: Hengsten met meeste nakomelingen en hun aantal prestaties in de manuele internationale dataset ................................................................................................................................................... 37 Tabel 21: Moedersvaders met de meeste nakomelingen en hun aantal prestaties in de manuele internationale dataset ................................................................................................................................................... 38 Tabel 22: Aantal records per hoogteklasse in de manuele internationale dataset ............................. 39 Tabel 23: Aantal paarden per leeftijdsklasse in de manuele internationale dataset .......................... 39 Tabel 24: Aantal wedstrijden, tijdsspanne, prestaties en paarden per jaar in de FEI dataset ........ 40 Tabel 25: Paarden met de meeste prestaties in de FEI dataset ................................................................... 40 Tabel 26: Aantal records en wedstrijden per jaar in de nationale dataset ............................................. 41 Tabel 27: Paarden met de meeste prestaties en hun vader in de nationale dataset ........................... 42 Tabel 28: Hengsten met de meeste nakomelingen en hun prestaties in de nationale dataset ....... 42 Tabel 29: Aantal records per hoogteklasse in de nationale dataset .......................................................... 43 VI
Tabel 30: Verdeling van de gegevens over de hoogste klasse ...................................................................... 44 Tabel 31: Schatting van de ratio’s van de variantiecomponenten met VCE ........................................... 46 Tabel 32: Genetische correlaties geschat met VCE ........................................................................................... 48 Tabel 33: Correlatie tussen EBV’s van model 3 en 14 ..................................................................................... 49 Tabel 34: Beschrijvende statistiek van de EBV’s gebruikt voor de correlatieberekeningen. Model 3/Model 14. ....................................................................................................................................................................... 49 Tabel 35: Invloed van het vaste effect geslacht .................................................................................................. 52 Tabel 36: Schatting van de erfelijkheidsgraad van Internationaal............................................................. 53 Tabel 37: Schatting van de erfelijkheidsgraden en variantiecomponenten met MTGSAM .............. 53
VII
Figurenlijst Figuur 1: Stroomdiagram voor het hercoderen en inlezen van de data .................................................. 30 Figuur 2: Aantal nakomelingenprestaties per hengst ten opzichte van het aantal hengsten in de manuele internationale dataset ................................................................................................................................ 38 Figuur 3: Aantal prestaties per leeftijdsklasse in de manuele internationale dataset ....................... 39 Figuur 4: Aantal nakomelingenprestaties per hengst ten opzichte van het aantal hengsten in de nationale dataset ............................................................................................................................................................. 42 Figuur 5: Aantal prestaties per leeftijd in de nationale dataset................................................................... 43 Figuur 6: Correlatiediagram tussen EBV’s van de hengsten in modellen 3 en 14 ............................... 50 Figuur 7: Correlatiediagram tussen EBV’s van alle paarden in modellen 3 en 14 ............................... 50 Figuur 8: Schatting van vast effect geboortejaar ............................................................................................... 51 Figuur 9: Schatting van vast effect leeftijd............................................................................................................ 51 Figuur 10: Gemiddelde van BLUPs in functie van de geboortejaarsklasses ........................................... 52 Figuur 11: Markov Chain van variantiecomponenten voor model 1.1 ..................................................... 58
VIII
INHOUDSOPGAVE Woord vooraf ................................................................................................................................................................... I Samenvatting ................................................................................................................................................................. II Summary .........................................................................................................................................................................III Afkortingenlijst ............................................................................................................................................................ IV Tabellenlijst ................................................................................................................................................................... VI Figurenlijst .................................................................................................................................................................. VIII Inleiding .................................................................................................................................................................................1 1
Het paard .....................................................................................................................................................................3 1.1 Domesticatie van het paard ...............................................................................................................................3 1.2 Het paard in Vlaanderen .....................................................................................................................................4 1.2.1 Vlaamse Confederatie van het Paard ....................................................................................................4 1.2.2 Warmbloed Stamboeken ............................................................................................................................5 1.2.3 Ruitersportfederaties ..................................................................................................................................5 1.2.4 Economisch belang van de paardensector in Vlaanderen............................................................6 1.2.5 Economisch belang van de paardensector in Europa ....................................................................6
2
Fokwaardeschatting ................................................................................................................................................7 2.1
Inleiding .............................................................................................................................................................7
2.2
Theoretische achtergrond (Mrode, 1996)............................................................................................8
2.3
Herhaalbaarheidsmodel (Mrode, 1996) ............................................................................................ 10
2.4
Meerkenmerkenmodel (Mrode, 1996) ............................................................................................... 11
2.5
Schatten van variantiecomponenten ................................................................................................... 13
2.5.1 REML ............................................................................................................................................................... 13 2.5.2 Bayesian analyse, MCMC en Gibbs Sampling .................................................................................. 14
3
2.6
Inwegen van verschillende informatiebronnen in het model ................................................... 15
2.7
Kwaliteit van fokwaardeschattingen ................................................................................................... 16
Fokwaardeschatting voor prestatieaanleg in de springsport ............................................................. 18 3.1
Inleiding ........................................................................................................................................................... 18
3.2
Genetische evaluatie ................................................................................................................................... 18
3.2.1 België ............................................................................................................................................................... 18
IX
3.2.2 Nederland ...................................................................................................................................................... 19 3.2.3 Duitsland ........................................................................................................................................................ 20 3.2.4 Frankrijk ........................................................................................................................................................ 20 3.3
Internationale evaluatie ............................................................................................................................ 23
4. Materiaal ........................................................................................................................................................................ 24 4.1 Manuele dataset met internationale prestaties ..................................................................................... 24 4.2 FEI dataset met internationale prestaties ................................................................................................ 25 4. 3 Dataset met nationale prestaties................................................................................................................. 26 4.4 Pedigreebestand.................................................................................................................................................. 26 4.5 Hardware ............................................................................................................................................................... 26 4.6 Software .................................................................................................................................................................. 27 5. Methoden ....................................................................................................................................................................... 28 5.1 Datasets combineren en opzuiveren .......................................................................................................... 28 5.1.1 Manuele internationale datasets combineren ................................................................................ 28 5.1.2 Nationale en internationale datasets combineren ....................................................................... 28 5.1.3 Voorbereiden van prestatie- en pedigreebestand voor de genetische evaluatie ............ 29 5.2 Kenmerken ............................................................................................................................................................ 30 5.2.1 LRV en KBRSF .............................................................................................................................................. 30 5.2.2 Hoogteklasse (HK) ..................................................................................................................................... 31 5.2.3 Internationaal .............................................................................................................................................. 31 5.3 Effecten ................................................................................................................................................................... 32 5.3.1 Vaste effecten ............................................................................................................................................... 32 5.3.2 Toevallige effecten ..................................................................................................................................... 33 5.4 Modellen ................................................................................................................................................................. 34 6. Resultaten...................................................................................................................................................................... 36 6.1 Inventarisatie ....................................................................................................................................................... 36 6.1.1 Manuele internationale dataset............................................................................................................ 36 6.1.2 FEI dataset ..................................................................................................................................................... 40 6.1.3 Dataset met nationale prestaties ......................................................................................................... 41 6.1.4 Gecombineerde dataset ........................................................................................................................... 44 X
6.1.5 Hoogste stand .............................................................................................................................................. 44 6.2 Genetische evaluatie met VCE4..................................................................................................................... 45 6.2.1 Schatting van de variantiecomponenten .......................................................................................... 45 6.2.2 Genetische correlaties tussen LRV, KBRSF en Hoogteklasse geschat met VCE ................ 48 6.2.3 Vergelijking tussen BLUP met en zonder Hoogteklasse............................................................. 49 6.2.4 Schatting van de vaste effecten............................................................................................................. 51 6.3 Genetische evaluatie met MTGSAM............................................................................................................. 53 6.3.1 Schatting van de variantiecomponenten voor het threshold-kenmerk............................... 53 6.3.2 Schatting van de variantiecomponenten voor het 2-kenmerken model ............................. 53 7. Bespreking van de resultaten................................................................................................................................ 54 7.1 Inventarisatie ....................................................................................................................................................... 54 7.2 Genetische evaluatie met VCE ....................................................................................................................... 55 7.3 Genetische analyse met MTGSAM ................................................................................................................ 58 7.3.1 Threshold-model met 1 kenmerk ........................................................................................................ 58 7.3.2 Meer-kenmerken-model met threshold ........................................................................................... 59 8. Besluit ............................................................................................................................................................................. 60 Referenties ................................................................................................................................................................... XII
XI
INLEIDING Met in 2006 en 2010 twee opeenvolgende Belgische wereldkampioenen jumping kunnen we zeggen dat de paardensport, en dan vooral de springsport, in België ‘big business’ is. Belgische ruiters, maar vooral Belgische paarden zijn zeer succesvol in de internationale springsport. Zo waren op de springwedstrijd van de Wereldruiterspelen 2010 in Kentucky 31 van de 121 paarden die aan de start kwamen afkomstig uit een Belgisch stamboek (23 BWP, 7 Zangersheide en 1 SBS). Ook op andere internationale wedstrijden zijn Belgische paarden vaak niet uit de top weg te slaan. Zo staat het kleine stamboek van het Belgisch Warmbloed Paard op de 3de plaats in de WBFSH ranking. Het zijn uiteraard ook deze prestaties die het meest de aandacht trekken van media en van fokkers en waarmee de stamboeken het liefst naar buiten treden. Toch worden in de huidige modellen die in België gebruikt worden voor het berekenen van fokwaardeschattingen deze internationale prestaties niet in rekening gebracht. Volgens heel wat fokkers gaat hierdoor veel kostbare informatie verloren en zouden sommige hengsten een vertekende fokwaarde kunnen krijgen. Het doel van deze studie is na te gaan of en hoe deze internationale prestaties kunnen verwerkt worden in de berekeningen van fokwaardeschattingen en wat de invloed van deze gegevens is op genetische parameters (erfelijkheidsgraden en genetische correlaties) en op de ranking van de hengsten voor prestatieaanleg in de springsport. In het eerste hoofdstuk schetsen we een algemeen beeld van het paard. Zowel het proces van domesticatie als een overzicht van het Vlaams paardenlandschap worden belicht. Vervolgens bespreken we wat fokwaardeschattingen zijn en geven we een theoretische achtergrond over hoe deze berekend worden. In het derde en laatste hoofdstuk van de literatuurstudie geven we een overzicht van fokwaardeschatting voor prestatieaanleg in de springsport zowel in België als in andere Europese landen. Voor ons onderzoek zullen gegevens opgevraagd worden bij de Federation Equestre International (FEI) en het stamboek van het Belgisch Warmbloed Paard (BWP). Deze zullen toegevoegd worden aan de gegevens die gebruikt worden voor de routinematige fokwaardeschattingen, verkregen van de Landelijke Rijvereniging (LRV) en de Koninklijke Belgische Ruitersport Federatie (KBRSF). Vervolgens worden op basis van variantieanalyse een aantal statistische modellen voorgesteld. Deze modellen bevatten de significante factoren voor prestaties van de sportpaarden (zoals geslacht, leeftijd, geboortejaar…).
1
In een volgende stap wordt informatie over de afstamming van de paarden toegevoegd en worden er variantiecomponenten geschat voor de modellen met behulp van specifieke Animal Breeding software. Uit deze variantiecomponenten worden de erfelijkheidsgraden en genetische correlaties berekend. Vervolgens wordt de geschiktheid van de verschillende modellen getest en vergeleken. Tenslotte worden de uiteindelijke fokwaardes berekend en vergeleken voor de verschillende modellen.
2
DEEL I: LITERATUURSTUDIE 1
HET PAARD
1.1 Domesticatie van het paard Het paard (Equus caballus) is lange tijd van zeer groot belang geweest voor de maatschappij. Het dier werd gebruikt als voedselbron, lastdier, transportmiddel, werkkracht en zelfs als oorlogswapen. Vandaag de dag wordt het paard vooral gebruikt voor recreatie en sport. Archeologische vondsten stellen dat het paard ongeveer 6000 jaar geleden meerdere keren gedomesticeerd werd op de Eurasische steppe (CluttonBrock, 1999). Het paard is het recentst gedomesticeerde landbouwdier (na varken, koe, geit en schaap). Aangezien in alle onderzochte gedomesticeerde paardenpopulaties een hoge graad van mtDNA diversiteit werd vastgesteld, stelde de vraag zich waar deze diversiteit vandaan kwam en wat de historische processen waren in de domesticatie van het paard. Recent hebben enkele studies hier meer duidelijkheid in kunnen scheppen. Eén van de eerste studies werd uitgevoerd door Lister et al. (1998). Zij onderzochten sequenties van de mtDNA controle regio van 29 individuen, waaronder individuen van het wilde, nooit gedomesticeerde Prezwalski-ras en individuen van 14 gedomesticeerde rassen. Ze vonden een grote genetische variatie bij de gedomesticeerde rassen en slechts een geringe bij het wilde ras. Hieruit concludeerden ze dat domesticatie gebeurd moet zijn uit meerdere populaties van wilde paarden over een betrekkelijk grote geografische regio. Om een meer sluitend antwoord te bekomen onderzochten Villa et al. (2001) mtDNA van zowel moderne populaties als van enkele fossielen. Op basis van het principe van clustering van matrilines concludeerden ook zij dat er meerdere domesticatiegebeurtenissen vanuit verschillende populaties moeten zijn opgetreden. Villa et al. onderzochten verder ook nucleair microsatelliet DNA. De resultaten van dit onderzoek maakten duidelijk dat maternale gene flow de genetische uitwisseling tussen rassen heeft gedomineerd en dat de effectieve populatiegrootte van merries groter is dan die van hengsten. Dit is logisch, aangezien zowel in wilde populaties als in de hedendaagse fokkerij slechts een beperkt aantal hengsten zich effectief voortplant. Op basis van een geschatte divergentie van mtDNA-sequenties van 4,1 tot 8,1% per miljoen jaar schatten Villa et al. dat het moderne paard zo’n 0,32 tot 0,63 miljoen jaar geleden is ontstaan. Deze tijdsspanne is voldoende opdat genoeg matrilines kunnen ontstaan voor 3
het tijdstip van de eerste domesticatie van het paard om de vandaag gevonden diversiteit te verklaren. Jansen et al. (2002) kwamen tot dezelfde conclusies. Zij berekenden daarbij het minimale aantal merries dat ooit gedomesticeerd moet zijn geweest. Dit berekenden ze door van aantal mtDNA types (n=81), dat wereldwijd in de huidige gedomesticeerde paardenpopulatie wordt gevonden, het maximum aantal mtDNA types af te trekken dat tussen nu en de eerste domesticatiegebeurtenissen ontstaan kan zijn. Uit deze berekeningen concludeerden zij dat er minstens 77 wilde merries aan de basis moeten liggen van de huidige gedomesticeerde paardenpopulatie.
1.2 Het paard in Vlaanderen Volgens schattingen zijn er momenteel zo’n 150 000 paarden in Vlaanderen. Dit cijfer omvat alle rassen, dus ook pony’s en rassen die voor andere doeleinden dan de ruitersport worden gefokt. In wat volgt geven we een overzicht van de instanties die werkzaam zijn in de Vlaamse paardensector, zoals de VCP, de warmbloed stamboeken en de sportfederaties. Ook belichten we hier het economische belang van de paardensector in Vlaanderen. 1.2.1 Vlaamse Confederatie van het Paard De Vlaamse Confederatie van het Paard (VCP) is de Vlaamse vleugel van de Belgische Confederatie van het Paard (BCP). VCP is de koepelorganisatie van de paardensector in Vlaanderen. Bij de oprichting in 1981 was het belangrijkste doel van de VCP de promotie van de Belgische paardenfokkerij. Door de loop van de jaren is het doel van de VCP uitgebreid tot de vertegenwoordiger van de paardensector ten opzichte van de beleidsverantwoordelijken. Om een efficiënte en representatieve vertegenwoordiger te zijn werden er drie subsectoren opgesteld, namelijk fokkerij, gebruikers en beroepen en vorming. Een andere belangrijke tak van de VCP is de Dienst Identificatie Paard (DIP). Deze dienst staat in voor de registratie van de paardachtigen op Vlaams grondgebied. Sinds de invoering van de identificatie- en chippingsplicht in september 2008 moet elk paard op Belgisch grondgebied namelijk een microchip en een EU-conform paspoort hebben en geregistreerd staan in de centrale gegevensbank van de BCP. Deze identificatieplicht is een gevolg van een Koninklijk Besluit dat moet gezien worden in het kader van de voedselveiligheid. Hierbij kan de eigenaar de keuze maken om z’n paard definitief uit te sluiten voor de voedselketen. 4
1.2.2 Warmbloed Stamboeken Vlaanderen heeft 22 erkende stamboeken. Twee daarvan zijn stamboeken voor warmbloedpaarden, met name het Belgisch Warmbloed Paard (BWP) en Zangersheide (Z). Onder de andere 20 stamboeken vinden we onder andere de Vlaamse Fokkers van het Belgisch Trekpaard en het Belgisch Stud-Book van de Shetland Pony. In Wallonië is 1 warmbloed stamboek erkend, het Stamboek Belgisch Sportpaard (SBS). Het BWP is het grootste stamboek van België. Opgericht in 1955 vertegenwoordigt dit stamboek ongeveer 6500 leden en zo’n 130 000 geregistreerde paarden. Jaarlijks worden er om en bij de 3700 veulens geregistreerd (Het Belgisch Warmbloedpaard vzw, 2009). Het BWP richt zich vooral op het fokken van springpaarden doch is er sinds kort ook een dressuurwerkgroep opgericht. Zangersheide is een relatief jong stamboek. Pas in 1992 opgericht heeft het zich nu reeds opgewerkt tot één van de toonaangevende stamboeken in de springsport. Beide stamboeken zijn zeer succesvol in de springsport. Op de ranglijst van de World Breeding Foundation of Sport Horses (WBFSH) staan de relatief kleine stamboeken BWP en Z op een 3de en 10de plaats. Deze ranking geeft een score aan sportprestaties van paarden en telt de scores van de zes beste paarden van elk stamboek op. De ranking houdt dus geen rekening met de grootte van de stamboeken en bevoordeelt dus zo onrechtstreeks de grotere stamboeken, iets wat duidelijk blijkt als we de ranglijst van dichterbij bekijken (WBFSH, 2011). In een ranking, opgesteld door het Nederlandse fokkerijmagazine Sport Horse Breeding, die wel rekening houdt met de grootte van de stamboeken komen BWP en Z op een 3de en 1ste plaats respectievelijk (Remijnse, 2011). Toch moeten ook deze rankings met het nodige korreltje zout worden genomen aangezien er geen rekening wordt gehouden met de herkomst van de bloedlijnen van de paarden. Zo kan bijvoorbeeld een volledig BWP gefokt paard (BWP gefokte moeder en BWP gefokte vader) als veulen ingeschreven worden in een ander stamboek en dus ook voor dat stamboek meetellen in de rankings (en andersom). 1.2.3 Ruitersportfederaties Vlaanderen erkent en subsidieert twee ruitersportfederaties. De Landelijke Rij Vereniging (LRV) richt zich vooral op de recreatieve sporter, terwijl de Vlaamse Liga Paardensport (VLP) wedstrijden inricht voor de meer competitieve paardensport. De VLP is de Vlaamse vleugel van de Koninklijke Belgische Ruitersport Federatie (KBRSF). Samen vertegenwoordigen deze federaties ongeveer 32 000 leden. LRV richt wedstrijden in voor de drie Olympische disciplines (springen, dressuur en eventing)
5
alsook voor mennen. Onder de werking van VLP vallen naast deze vier disciplines ook para-equestrian, horse-ball, endurance, reining en voltige. 1.2.4 Economisch belang van de paardensector in Vlaanderen In 2008 werd er in opdracht van Vlaams minister van landbouw en plattelandsbeleid Kris Peeters een studie uitgevoerd om het economisch belang van de paardenhouderij in Vlaanderen in kaart te brengen. Dit onderzoek stelde vast dat de paardensector in Vlaanderen ongeveer 3600 voltijdse banen (fte of full time equivalenten) oplevert en een omzet van € 622 miljoen en een toegevoegde waarde van circa € 250 miljoen vertegenwoordigt. Dit is circa 0,12% van het Bruto Binnenlands Product van Vlaanderen. De fokkerij staat hierbij in voor 410 fte en een toegevoegde waarde van € 6 miljoen. 1.2.5 Economisch belang van de paardensector in Europa Het ‘European Horse Network’ (EHN) is een non-profit organisatie van belanghebbenden in de Europese paardensector. Het werd opgericht na de Europese conferentie Equus 2009. Een van de doelstellingen van de organisatie is de ontwikkeling van de paardensector in Europa te ondersteunen. Uit een samenvatting van verschillende studies uitgevoerd in Europese landen in 2010 maakten zij op dat de Europese paardensector een impact heeft van € 100 miljard en instaat voor 400 000 fte. Ze schatten de totale paardenpopulatie in Europa op 6 miljoen paarden, waarvoor 6 miljoen hectare permanent grasland wordt gebruikt. Ze vonden ook dat de Europese paardensector een groeiende sector is. Zo groeit het aantal ruiters met 5% elk jaar (European Horse Network, 2010).
6
2
FOKWAARDESCHATTING
2.1
Inleiding
Het doel van fokkers en fokprogramma’s is de huidige populatie te verbeteren. De basis van genetische vooruitgang in een populatie bestaat uit selectie; het selecteren van de beste ouderdieren om de volgende generatie te creëren. Welke de beste ouderdieren zijn is afhankelijk van het fokdoel dat het fokprogramma aanhoudt. Een objectieve waarde om de beste ouderdieren te selecteren zijn fokwaardeschattingen. Vroeger werd voor het schatten van fokwaarden gebruikt gemaakt van het principe van de selectieindex. Deze methode geeft de best mogelijke lineaire schatting van een individuele fokwaarde. Het combineert alle informatie die beschikbaar is van het dier en z’n verwanten. Hierbij wordt er eerst een gewicht gegeven aan verschillende fenotypes. Dit zijn eigenschappen zoals grootte, gewicht, melkgift, snelheid etc. De fenotypes van het dier en z’n verwanten worden vervolgens zo gecombineerd en ingewogen dat ze een nauwkeurige schatting geven voor de echte fokwaarde. Deze berekeningen zijn rekenkundig eenvoudig en algemeen toepasbaar. Er moet echter aan enkele veronderstellingen voldaan worden die in de realiteit niet haalbaar zijn. Zo gaat men er van uit dat het populatiegemiddelde constant blijft doorheen de volgende generaties, iets wat met selectie uiteraard niet het geval (en al helemaal niet het doel) is, en dat de hoeveelheid van de informatie voor elk dier identiek is, iets wat meestal niet het geval is. In 1949 ontwikkelde C. R. Henderson een nauwkeurigere methode voor het schatten van fokwaarden, de Best Linear Unbiased Prediction (of BLUP) methode. Met BLUP kunnen zowel de vaste omgevingsfactoren als de random factoren (de fokwaarden) tegelijkertijd berekend worden. Wegens de rekentechnische moeilijkheid en dus een bepaalde vereiste aan computercapaciteit wordt deze methode pas sinds 1990 algemeen toegepast. De eigenschappen van de methode zijn vergelijkbaar met deze van de selectie-index methode en zijn af te leiden uit de naam (Mrode, 1996): -
-
Best: de correlatie tussen de echte (a) en de voorspelde (â) fokwaarden wordt gemaximaliseerd of de voorspellingsfout variantie (PEV, Prediction Error Variance) wordt geminimaliseerd (var(a-â)) Linear: schatters zijn lineaire functies van de observaties Unbiased: de schatting van random variabelen (de fokwaarden), zijn onvertekend (E(a|â=â)) Prediction: de echte fokwaarden worden voorspeld
7
BLUP werd oorspronkelijk ontwikkeld en gebruikt voor het berekenen van fokwaarden van melkveestieren. Het eerste model dat gebruikt werd was het sire- of vadermodel. Hierbij wordt op basis van de prestaties (melkgift) van de dochters de fokwaarde van de stier berekend. Het vader-model gaat uit van enkele veronderstellingen die in de praktijk meestal niet correct zijn. Zo is het gemiddeld genetisch niveau van de moeders waarmee de stieren gepaard worden niet altijd gelijk (assortative mating), alhoewel het model er van uit gaat dat dit wel zo is. Doorgaans gebruikt men nu een verbeterd model, het dier-model. Hierin wordt voor elk dier een fokwaardeschatting berekend, niet enkel voor de vaderdieren. Alle genetische verwantschappen tussen de dieren wordt in rekening gebracht. Hierdoor is het mogelijk om voor dieren zonder eigen prestaties toch fokwaardes te schatten aan de hand van prestaties van z’n verwanten. BLUP wordt, dankzij de enorm toegenomen computercapaciteit, dezer dagen algemeen gebruikt voor alle mogelijke fokwaardeschattingen. Dus niet alleen voor melkvee, maar ook voor paarden, pluimvee, varkens, etc.
2.2
Theoretische achtergrond (Mrode, 1996)
Het diermodel in zijn eenvoudigste vorm is een gemengd lineair model. Een gemengd lineair model bevat zowel vaste als random effecten. De random effecten zijn meestal normaal verdeeld. De algemene vergelijking voor een gemengd lineair model is als volgt:
Hierbij is: -
y = [n x 1] vector met de observaties b = [p x 1] vector met de vaste effecten a = [q x 1] vector met de random effecten
-
e = [n x 1] vector met de random residuele effecten X = [n x p] incidentiematrix die voor elke observatie de vaste effecten aanduidt Z = [n x q] incidentiematrix die voor elke observatie de random effecten (de fokwaardeschattingen) aanduidt n = aantal observaties p = aantal niveaus vaste effecten q = aantal niveaus random effecten (het aantal dieren waarvoor een fokwaarde moet geschat worden)
-
8
Er wordt aangenomen dat de verwachtingen (E) van de variabelen E(y) = Xb en E(a) = E(e) = 0 en dat de residuele effecten onafhankelijk verdeeld zijn met variantie . Hierdoor is var(e) = I = R en var(a) = A = G. Gezien de random verdeling van de residuele effecten (random omgevingseffecten en niet-additief genetische effecten) is var(y) = var (Za + e). De vectoren a en b uit de algemene vergelijking moeten geschat worden. Als we gebruik maken van de kleinste kwadraten methode en deze transformeren in de door Henderson ontwikkelde Mixed-Model Equations (MME) bekomen we: =
Met: -
R = [n x n] variantie-covariantie matrix van e G = [q x q] variantie-covariantie matrix van a.
Aangezien var(e) = I en var(a) = A en er geen covarianties bestaan tussen de vaste en de randomeffecten kan deze vergelijking vereenvoudigd worden. Aangezien R-1 een eenheidsmatrix is kan de vergelijking aan beide zijden gefactoriseerd en herleid worden tot: =
Hierbij is: -
A = de verwantschapsmatrix die alle dieren bevat. Als er geen verwante dieren zijn is A-1 = I
-
α= = (h² = erfelijkheidsgraad, zie lager) X’y = de vector met de som van de waarnemingen per vast effect Z’y = de vector met de som van de waarnemingen per random effect X’X = het aantal observaties per combinatie van vaste effecten X’Z = het aantal observaties per combinatie van vaste en random effecten Z’Z = het aantal observaties per combinatie van random effecten. Meestal is het enige random effect dat in beschouwing wordt genomen de fokwaardeschatting. De Z’Z matrix wordt dan een diagonaalmatrix. 9
Bovenstaande één-kenmerk diermodel is het eenvoudigste BLUP model, met 1 vergelijking voor elk dier waarvoor er een observatie is en met enkel het additief genetisch effect (de fws) als random effect. De erfelijkheidsgraad wordt gedefinieerd als de proportie van de genetische variantie over de fenotypische variantie:
2.3
Herhaalbaarheidsmodel (Mrode, 1996)
In bepaalde omstandigheden hebben omgevingsfactoren een belangrijke invloed op de covariantie tussen de waarnemingen van een individu, waardoor deze covariantie niet meer puur genetisch is. Deze permanente omgevingsfactoren hebben een constante invloed op de prestaties en zijn niet overerfbaar. De gebruikte modellen moeten deze factoren mee in beschouwing nemen. Wanneer meerdere observaties per dier beschikbaar zijn wordt een herhaalbaarheidsmodel toegepast. De fenotypische variantie voor drie observaties van een welbepaald individu kan als volgt geschreven worden:
var
Hierbij is: -
= de tijdelijke omgevingsvariantie voor observatie i (i = 1,2,3) = de variantie door de permanente omgevingseffecten = de genetische variantie.
De herhaalbaarheid wordt gedefinieerd als de verhouding tussen de variantie veroorzaakt door diereffecten en de totale variantie. De herhaalbaarheid meet de correlatie tussen de observaties van een bepaald individu. De correlatie tussen verschillende observaties van één paard wordt gegeven door:
10
Het herhaalbaarheidsmodel kan geschreven worden als:
Hierbij is: -
y = vector van de observaties b = vector van de vaste effecten a = vector van de random diereffecten pe = vector van de random permanente omgevingseffecten en niet-additieve genetische effecten
-
e = vector van de random residuele effecten X, Z en W zijn incidentiematrices die de observaties correleren aan respectievelijk de vaste effecten, random diereffecten en random permanente omgevingseffecten.
De Mixed Model Equations voor dit model schrijven we als volgt:
=
Met
en
.
De erfelijkheidsgraad voor een kenmerk met herhaalde is van de vorm:
Een kernmerk als de som van n metingen zal daarom een hogere h² hebben dan wanneer de afzonderlijke metingen worden beschouwd.
2.4
Meerkenmerkenmodel (Mrode, 1996)
Selectie in een fokprogramma is meestal gebaseerd op meerdere kenmerken van de dieren. Als twee of meerdere kenmerken onderling gecorreleerd zijn kunnen we een meerkenmerkenmodel (of multivariaat model) toepassen om fokwaarden te berekenen. 11
Bij correlaties tussen kenmerken kunnen door metingen van het ene kenmerk fokwaarden voorspeld worden voor het andere. Zo kunnen bijvoorbeeld resultaten van stationtesten gebruikt worden om de fokwaarden voor latere sportprestaties te schatten. Henderson en Quaas (1976) waren de eersten die een multivariate analyse toepasten. Het grote voordeel van een multivariaat model is de toegenomen nauwkeurigheid van de fokwaardeschattingen. Nadelen zijn een hoge computing-kost en het feit dat er betrouwbare schattingen van genetische en fenotypische correlaties tussen de kenmerken nodig zijn en dat deze niet altijd beschikbaar zijn. We gaan uit van het volgende twee-kenmerken model:
Als we dit uitschrijven in matrices krijgen we: =
+
+
Hierbij is: -
yi = de vector met observaties voor kenmerk i
-
bi = de vector van de vaste effecten voor kenmerk i
-
ai = de vector van de random diereffecten voor kenmerk i
-
ei = de vector van de random residuele effecten voor kenmerk i
-
Xi en Zi zijn incidentiematrices die de observaties van kenmerk i relateren aan respectievelijk de vaste effecten en de random diereffecten.
Er wordt aangenomen dat:
=
Met: -
gij de elementen van G, de additief genetische variantie en covariantiematrix voor diereffecten, waarbij de elementen als volgt zijn gedefinieerd: 12
-
-
g11 = additief genetische variantie voor kenmerk 1
-
g12 = g21 = additief genetische covariantie tussen beide kenmerken
-
g22 = additief genetische variantie voor kenmerk 2
rij de elementen van R, de variantie en covariantie matrix voor residuele effecten.
De MME vergelijkingen zijn dan:
Met: X=
,Z=
,
,
, en y =
.
Als we voor elk kenmerk in het meerkenmerken model de vergelijking uitschrijven bekomen we volgende MME:
=
met gij elementen van G-1.
2.5
Schatten van variantiecomponenten
Om bovenstaande MME op te lossen zijn varianties en covarianties nodig. Deze zijn in realiteit niet gekend en moeten dus geschat worden. Hiervoor zijn verschillende technieken, waarvan we REML en Bayesian toepassen. 2.5.1 REML Het schatten van de variantiecomponenten werd lange tijd toegepast met behulp van ANOVA (Analysis Of Variance). In 1922 werkte R.A. Fisher de ‘Maximum Likelihood Estimation’ uit. Deze leidt in de meeste gevallen tot een betere schatting van de 13
populatieparameters. Vooral bij ongebalanceerde datasets krijgt de ML methode de voorkeur. Voor een bepaalde dataset en model berekent de ML methode die populatieparameters die het meest waarschijnlijk tot de geobserveerde data hebben geleid. Met andere woorden, die parameters (Maximum Likelihood schatters of MLE) waarvoor de likelihood functie maximaal is. Als de data het gevolg zijn van een normaal proces wordt de likelihood functie als volgt geschreven: } Met: -
y = de vector met observaties X = de incidentiematrix voor de vaste effecten b = de schattersvector voor de vaste effecten V = de variantie van y n = aantal waarnemingen.
Het maximaliseren van de functie gebeurt als volgt:
Deze uitdrukking geeft dus de likelihood voor de parameters b en V, gegeven X en y. De ML methode heeft echter enkele nadelen. Zo wordt geen rekening gehouden met het verlies van vrijheidsgraden resulterend uit de schatting van de vaste effecten van het model. Daarom bedachten Patterson en Thompson in 1971 de ‘Restricted Maximum Likelihood Estimation’ of REML. Bij deze methode worden de variantiecomponenten geschat nadat de data voor de vaste effecten in het model gecorrigeerd worden met de methode van de kleinste kwadraten. REML schat de vector van de vaste effecten niet, zodat er ook geen vrijheidsgraden verloren gaan. Zo kunnen dieren waarvoor bepaalde kenmerken ontbreken toch opgenomen worden in de berekeningen. De vergelijking voor REML is als volgt:
met p = aantal niveaus vaste effecten (Kutner et al., 2005). 2.5.2 Bayesian analyse, MCMC en Gibbs Sampling In de laatste twee decennia werd Bayesian inference geïntroduceerd voor genetische analyse in de fokkerij van dieren. Bayesian inference is een methode waarbij observaties 14
gebruikt worden om de waarschijnlijkheid van een bepaalde hypothese te berekenen. De methode steunt op het Bayes Theorema: P(A|C) =
.
Dit theorema beschrijft hoe de prior kennis verandert wanneer data accumuleren. De prior aanname van gebeurtenis A wordt uitgedrukt als de prior waarschijnlijkheid P(A). P(C) is de waarschijnlijkheid dat gebeurtenis C optreedt. P(A|C) staat voor de waarschijnlijkheid dat A optreedt, gegeven C en wordt ook wel de posterior distributie genoemd. In heel wat gevallen is het quasi onmogelijk om de posterior distributie analytisch af te leiden. Een van de oplossingen is het schatten van de posterior distributie aan de hand van Markov Chain Monte Carlo (MCMC) sampling. Geschikte Markov Chains hebben de eigenschap dat ze steeds convergeren naar een evenwicht, ongeacht het startpunt van de analyses. Om een Markov Chain op te zetten zijn verschillende methoden voor handen. De belangrijkste methode is de Metropolis-Hastings sampling. Het centrale idee hierachter is om steeds kleine random veranderingen aan te brengen aan de parameterwaarden en deze dan te accepteren of te verwerpen op basis van hun waarschijnlijkheid. Zo wordt een Markov Chain opgebouwd van verschillende waarden van parameters en hun waarschijnlijkheid. Gibbs Sampling is een specifieke MCMC methode en kan gezien worden als een speciaal geval van het Metropolis-Hastings algoritme. Bij Gibbs Sampling worden nieuwe waarden in de Markov Chain altijd geaccepteerd. Gibbs Sampling zal ook steeds slechts één random variabele aanpassen en de andere variabelen constant houden. Dergelijke univariate distributies zijn veel makkelijker te simuleren.
2.6
Inwegen van verschillende informatiebronnen in het model
Voor het schatten van fw met behulp van een diermodel wordt informatie gebruikt uit drie verschillende bronnen. Zowel informatie gemeten aan de ouders van het paard en alle familieleden, informatie gemeten aan het paard zelf en informatie gemeten aan de nakomelingen van het dier. Voor paarden jonger dan 3 jaar is er meestal enkel informatie van de ouders aanwezig. De fokwaarden die voor deze dieren geschat worden noemt men de verwachtingswaarden. De fokwaarden in de echte betekenis worden geschat bij paarden waarvoor informatie van hun nakomelingen beschikbaar is. De verwachtingswaarden moetenliefst zo goed mogelijk overeenkomen met de later geschatte echte fw. In een diermodel wordt de additief genetische waarde (â) gegeven 15
door een gewogen gemiddelde van eigen prestaties (DAT), pedigree-info (Parent Average) en prestaties van de nakomelingen (Progeny Contribution) (Schaeffer, 2000):
Met: -
w1 = n,
-
w2 =
,
-
w3 =
,
-
k=
-
n = aantal observaties,
-
m = aantal onbekende ouders,
-
p = aantal nakomelingen,
-
DAT = gemiddelde van (y-alle andere factoren in het model),
-
PA = (fws moeder + fws vader),
-
PC = gemiddelde van (2 x fws nakomelingen) – (fws vader of moeder).
2.7
,
Kwaliteit van fokwaardeschattingen
De kwaliteit van de fws hangt af van enerzijds de nauwkeurigheid van de schattingen en anderzijds van de afwezigheid van vertekening of bias. De nauwkeurigheid is grotendeels afhankelijk van de hoeveelheid en de aard van de ingesloten effecten. Hoe meer data, hoe hoger de nauwkeurigheid zal zijn, maar het verzamelen van meer data is logistiek niet altijd even makkelijk of haalbaar. Als de erfelijkheidsgraden hoger zijn, zal de nauwkeurigheid ook toenemen. Deze erfelijkheidsgraden kunnen verhoogd worden door de observaties te maken in sterk gecontroleerde en gestandaardiseerde omgevingen, zoals in stationtesten. Ricard et al. (2000) vonden voor stationtesten erfelijkheidsgraden van 0,40 – 0,60. Doch dient hierbij opgemerkt dat het gebruik van enkel gegevens uit stationtesten leidt tot een daling van de genetische respons (Dubois et al., 2008). Vertekening of bias kan verschillende oorzaken hebben. Zo stellen Ricard et al. (2000) dat het niet opnemen van niet-deelnemers, een preferentiële behandeling van bepaalde 16
hengsten en de ruiter een vertekenend effect kunnen hebben op de fws. Volgens Thorén Hellsten et al. (2006) kunnen wedstrijdgegevens van paarden die ingezet worden in slechts één sporttak, maar uit een basispopulatie met een multidisciplinair fokdoel komen, een incompleet en vertekend beeld geven. Nicking, het fenomeen waarbij bepaalde paringen betere resultaten geven dan men uit de pedigree-informatie zou verwachten, kan volgens Burnside en Tempelman (1989) ook een invloed hebben op de nauwkeurigheid van de schattingen. Bagnato en Lohuis (1998) vonden dan weer dat overschatting van de oudergemiddelden en een onnauwkeurige fws van de merries een bijkomende bron van bias kan zijn. Een belangrijke bron van vertekening is de oorsprong van de data. Prestaties van paarden komen uit drie verschillende bronnen, namelijk stationtesten, veldtesten en competitiegegevens. Stationtesten worden gebruikt om de prestaties van jonge paarden te meten. Vooral hengsten, maar ook merries worden gestald op een teststation en gedurende enkele dagen tot weken (gaande van 8 tot 100 dagen) getest. Op deze wijze krijgt men weinig en dure, maar zeer betrouwbare gegevens met hoge erfelijkheidsgraden. Veldtesten, gehouden op één dag zijn eveneens in gebruik voor het testen van jonge hengsten en merries. Een groot voordeel van deze testen is hun grote testcapaciteit. Vergeleken met gegevens uit stationtesten zijn deze gegevens echter minder betrouwbaar omwille van de korte testperiode en meer bias door voorafgaande training. Dit wordt gecompenseerd door de lagere mate van preselectie voor paarden die deelnemen aan veldtesten. Ricard et al. (2000) vonden voor veldtesten een erfelijkheidgraad tussen 0,10 en 0,30. Wedstrijdgegevens geven informatie over paarden van alle leeftijden en de beide geslachten (inclusief ruinen). Wedstrijden geven veel en goedkope gegevens. Enkele nadelen zijn de mogelijke preselectie van wedstrijdpaarden en het feit dat gegevens van hogere wedstrijdniveau’s pas op latere leeftijd kunnen verzameld worden. Voor wedstrijdgegevens werden erfelijkheidsgraden geschat in dezelfde grootte orde als voor veldtesten (Ricard et al., 2000; Koenen en Aldridge, 2002). Zoals hierboven al aangehaald ondergaan paarden dikwijls een preselectie. Hengsten die worden getest in stationtesten worden door de hengstenhouders extra voorbereid. Ze zullen onder andere gereden worden door de betere ruiters. Veel paarden zullen ook nooit in de sport lopen. Deze dieren worden dan ook niet meegenomen in de berekeningen en dit geeft een extra bron van vertekening. Dit kan echter opgelost worden door het implementeren van binaire kenmerken, waarbij paarden die wel in de sport lopen een 1 en andere een 0 krijgen. Zo bespreekt Arnason (1999) een systeem bij dravers waar het binaire kenmerk race-status wordt geïmplementeerd.
17
3
FOKWAARDESCHATTING VOOR PRESTATIEAANLEG IN DE SPRINGSPORT
3.1
Inleiding
Elk stamboek stelt z’n eigen fokdoel op. Bijna alle stamboeken zetten een combinatie van conformatie, prestatie en gezondheid voorop maar geven een verschillend gewicht aan deze kenmerken (Koenen et al.,2004). Dit weerspiegelt zich ook in de parameters en modellen gebruikt voor de fokwaardeschattingen. BLUP wordt algemeen toegepast, maar de gebruikte kenmerken en modellen zijn verschillend tussen stamboeken en/of landen. De meeste modellen nemen de niet-genetische effecten van leeftijd en geslacht op aangezien de prestaties in de sport stijgen met de leeftijd (tot 10-12 jaar) en hengsten en ruinen gemiddeld beter scoren dan merries. Ook met de effecten van de ruiter, testlocatie en permanente omgeving wordt in sommige modellen rekening gehouden. De data die worden gebruikt voor de fws zijn voor bijna alle stamboeken en/of landen verschillend. Zo gebruiken België, Frankrijk en Ierland uitsluitend competitieresultaten, Denemarken en Zweden enkel testresultaten en Duitsland en Nederland een combinatie van beiden (Koenen en Aldridge, 2002). De publicatie van de fws zijn meestal vrij gelijklopend. Aangezien het doel van fws is om de genetische aanleg van een paard te vergelijken met het gemiddelde van de populatie, worden de fokwaarden herrekend naar een gemiddelde van 100 met een standaardafwijking van 20.
3.2
Genetische evaluatie
In wat volgt geven we een overzicht van de modellen, kenmerken en data gebruikt door de belangrijkste fokkerijlanden in Europa (België, Nederland, Duitsland en Frankrijk). In Tabellen 1 en 2 wordt voor de hierboven vermelde landen en voor Denemarken, Zweden en Ierland extra informatie, zoals erfelijkheidsgraden en correlatiecoëfficiënten, getoond. 3.2.1 België In België (Vlaanderen) wordt de fokwaarde voor hengsten, goedgekeurd door het BWP, berekend en gepubliceerd door de onderzoeksgroep Huisdierengenetica van het Departement Biosystemen KULeuven in opdracht van het Vlaams Fokkerij Centrum vzw. De paarden die opgenomen worden in de berekeningen zijn die BWP paarden die de 18
laatste 20 jaar actief zijn geweest op nationale (KBRSF, KlCyc en WJP) of regionale (LRV) wedstrijden en al hun verwanten. Er worden dus 2 kenmerken bekeken, prestaties op de nationale wedstrijden en prestaties op regionale wedstrijden. De genetische correlatie tussen deze twee kenmerken bedraagt 0,63. De erfelijkheidsgraden van deze kenmerken zijn 0,10 en 0,11 respectievelijk. De ranking op deze wedstrijden wordt omgezet in een genormaliseerde score. Er wordt gebruikt gemaakt van een bivariaat BLUP diermodel met herhaalbaarheid. Als referentiepopulatie worden die paarden genomen die 7 tot 18 jaar voor de fokwaardeschatting geboren zijn en in de sport actief zijn of geweest zijn. Dit venster van 12 opeenvolgende geboortejaren schuift bijgevolg dus elk jaar op. De gemiddelde fokwaarde voor deze referentiepopulatie wordt vastgesteld op 100 met een standaarddeviatie van 20. De gepubliceerde lijst bevat enkel fokwaardeschattingen van hengsten geboren in de laatste 30 jaar, met een betrouwbaarheid van minstens 0,75 en tenminste 5 nakomelingen actief in de sport (Janssens et al., 2007a, 2007b). 3.2.2 Nederland In Nederland worden sinds 1987 fokwaardes geschat door het KWPN (Koninklijk Warmbloed Paardenstamboek Nederland). Ook hier wordt gebruikt gemaakt van een bivariaat BLUP diermodel. Het eerste kenmerk is de wortelgetransformeerde sportprestatie. Deze sportprestatie is de hoogste stand ooit behaald door het paard in competitie en is een cumulatief kenmerk (hoe hoger de klasse, hoe hoger de waarde van het kenmerk). KWPN is hierbij tot op heden de enige instantie die ook internationale sportprestaties beschouwt. Voor de sportprestaties wordt een erfelijkheidsgraad geschat van 0,15. Er werden geen correlaties geschat tussen prestaties in de nationale en internationale sport. Het tweede kenmerk zijn resultaten van aanlegtesten (stationtesten voor hengsten en ééndagstesten). Hierbij wordt gekeken naar springaanleg in het algemeen. De genetische correlatie tussen sportprestaties en aanlegtesten wordt geschat op 0,80. De data van beide kenmerken worden ter beschikking gesteld door de Koninklijke Nederlandse Hippische Sportfederatie (KNHS). De referentiepopulatie bevat elk paard waarvoor een fokwaarde geschat is. Niet alleen voor hengsten, maar ook voor merries worden de fokwaarden gepubliceerd. Voor hengsten betreft dit de fokwaardeschattingen met een betrouwbaarheid boven 30%. Voor merries worden de 500 beste merries met een betrouwbaarheid boven 30% gepubliceerd. Er worden verschillende lijsten gepubliceerd voor merries met en merries zonder nakomelingen in de competitie (Huizinga et al., 1989 en van Veldhuizen, 1997) .
19
3.2.3 Duitsland In Duitsland wordt de berekening van de fws uitgevoerd door het FN (Deutsche Reiterliche Vereinigung). Anders dan in Nederland en België zijn hier paarden van meerdere (Duitse) stamboeken betrokken bij de genetische evaluatie. Het gebruikte model is een multi-trait BLUP diermodel met herhaalbaarheid. De data zijn afkomstig uit competitieresultaten waarvan de ranking wordt genormaliseerd en uit resultaten van leistungsprüfungen (aanlegtesten). In de aanlegtesten worden zowel de gangen als de springaanleg en rijdbaarheid van de paarden gescoord. Al deze kenmerken worden ingewogen in het gebruikte model. De referentiepopulatie bestaat enkel uit hengsten die een hengstleistungsprüfung hebben doorlopen of minstens 5 nakomelingen hebben. Fokwaarden voor hengsten met een betrouwbaarheid boven de 75% en met minstens 5 nakomelingen actief in de sport worden gepubliceerd. 3.2.4 Frankrijk De genetische evaluatie in Frankrijk wordt uitgevoerd door het Frans Nationaal Instituut voor Landbouw Onderzoek (INRA). In Frankrijk wordt er eveneens gebruik gemaakt van een bivariaat BLUP diermodel. Het eerste kenmerk is de ranking van het paard in een welbepaalde wedstrijd in verhouding tot het aantal deelnemers. Het tweede kenmerk is het logaritme van het jaarlijkse prijzengeld. Dit kenmerk brengt zowel de ranking van het paard in de wedstrijd als het niveau van de wedstrijd in rekening aangezien enkel de best geklasseerden prijzengeld ontvangen en het prijzengeld hoger ligt bij een hoger niveau. Aangezien er talrijke problemen opduiken in verband met het 2de kenmerk, zoals een groot verschil in prijzengeld over verschillende wedstrijden van hetzelfde niveau en het niet meetellen van paarden zonder winstsom, wordt sinds kort dit kenmerk vervangen door een puntensysteem. Hierbij worden aan het paard punten toegekend op basis van z’n klassering en van de hoogte van de wedstrijd waarbij elk paard in de wedstrijd punten krijgt (Les Haras Nationaux, 2010). De basispopulatie bestaat uit de paarden die 5 jaar oud zijn op het tijdstip van de genetische evaluatie. De publicatie van de fokwaardeschattingen gebeurt met een gemiddelde van 0. De waarden worden zo herschaald dat de beste 2% van de populatie steeds een fokwaarde van 20 krijgen.
20
Tabel 1: Overzicht van de kenmerken en bron van de data voor de fokwaardeschatting voor springaanleg in 7 Europese landen en 9 stamboeken Land (Stamboek) België (BWP)
Competitie kenmerken Test kenmerken
Bron data
- Ranking omgezet in normale score Kenmerk 1: wedstrijdresultaten op nationaal niveau
Kenmerk 1: KBRSF (Klassieke Cyclus, WJP, Nationale proeven) Kenmerk 2: LRV (L, M, Z)
Kenmerk 2: Wedstrijdresultaten op Vlaams niveau
Denemarken (DWB)
- Vrijspringen: techniek, vermogen - Springen onder ruiter: techniek, vermogen
- Stationtesten voor hengsten - Veldtesten voor 4-jarige paarden - Veldtesten voor merries
Duitsland (HANN, OLD, TRAK)
- Ranking omgezet in normale score
Frankrijk (SF)
- Ranking - Logaritme van prijzengeld
- Competitieresultaten
Ierland (ISH)
- Ranking op hoog niveau in competitie
- Competitieresultaten
Nederland (KWPN)
- Hoogste niveau ooit behaald in de sport
- Competitieresultaten
- Competitieresultaten, TSP, ABP Stap, draf, galop, rijdbaarheid, vrij springen
Galop, reflexen, techniek, rijdbaarheid en springvermogen
Zweden (SWB)
- Ranking
- ZSP (merries), HLP (hengsten)
- Stationtesten voor hengsten - Eéndagstesten
- Competitieresultaten Techniek en vermogen Temperament en potentieel
- Veldtesten voor merries, ruinen en hengsten (RHQT, YHT)
Interstallion (2003a,b); Interstallion (2004a,b,c); Interstallion (2005); Interstallion (2006); Interstallion (2007); Interstallion (2008); Koenen en Aldridge (2002), Thorén Hellsten et al. (2006).
21
Tabel 2: Overzicht van de gebruikte modellen, effecten, erfelijkheidsgraden en genetische correlaties voor de fokwaardeschatting voor springaanleg in 7 Europese landen en 9 stamboeken Land (Stamboek)
Model
Effecten
Erfelijkheidsgraden
Genetische correlatie
België (BWP)
Bivariaat BLUP diermodel
Wedstrijd Leeftijd Geslacht Permanente omgeving
Kenmerk 1: 0,11 Kenmerk 2: 0,10
0,63
Denemarken (DWB)
BLUP diermodel met 1 kenmerk
Jaar Locatie Dier
Duitsland (HANN, OLD, TRAK)
BLUP diermodel met herhaalbaarheid
Leeftijd x geslacht Niveau ruiter Competitie Testgroep Aandeel volbloed
TSP: 0,10 ABP: 0,18
Frankrijk (SF)
Bivariaat BLUP diermodel met herhaalbaarheid
Geslacht Leeftijd Materneel effect Permanente omgeving
Log(prijzengeld): 0,27 Ranking: 0,16
0,90
Ierland (ISH)
Trivariaat BLUP diermodel met herhaalbaarheid
Geslacht Leeftijd Competitieniveau Permanente omgeving
Laag niveau: 0,08 Midden niveau: 0,05 Hoog niveau: 0,03
Laag-Midden: 0,97 Laag-Hoog: 0,66 Midden-Hoog: 0,79
Nederland (KWPN)
Bivariaat BLUP diermodel
Competitie: leeftijd en geslacht Stationtest: dag x locatie en aandeel volbloed Ééndagsveldtest: dag x locatie en leeftijd
Competitie: 0,15
0,80
Zweden (SWB)
BLUP diermodel met meerdere kenmerken
Stationtest: 0,50
Ééndagsveldtest: 0,50
Jaar en plaats Geslacht Leeftijd Dier
Interstallion (2003a,b); Interstallion (2004a,b,c); Interstallion (2005); Interstallion (2006); Interstallion (2007); Interstallion (2008)
22
3.3
Internationale evaluatie
Het vergelijken van fws over landsgrenzen is momenteel niet zinvol. Zoals blijkt uit Tabel 1 en 2 zijn er grote verschillen tussen de gebruikte data en schattingsmethoden in verschillende landen. Een bijkomend groot probleem is het correct identificeren van paarden. Ondanks het UELN-systeem (Universal Equine Life Number) kloppen deze identificatienummers niet altijd, worden ze verkeerd gebruikt of worden ze veranderd als een paard wordt ingeschreven in een ander stamboek (Thorén Hellsten et al., 2005). Hierdoor is het schatten van fokwaarden op een internationale schaal voor de fokker weinig transparant. Om deze en andere problemen op te lossen werd in 1998 de werkgroep Interstallion opgericht. De hoofddoelstellingen van deze werkgroep zijn: fokdoelen, testprocedures en genetische evaluatiemethoden beschrijven, aanbevelingen maken voor de verbetering van nationale genetische evaluatie systemen en het zoeken naar methodes voor het harmoniseren en vergelijken van fws tussen landen (Koenen en Aldridge, 2002).
23
DEEL II: EXPERIMENTEEL WERK 4. MATERIAAL 4.1 Manuele dataset met internationale prestaties Voor ons onderzoek werd gebruik gemaakt van gegevens van internationale sportprestaties uit de seizoenen 2008 en 2010-begin 2011. De gegevens werden bekomen via contacten bij het BWP-stamboek in de vorm van twee aparte en verschillend opgebouwde Excel-bestanden. De dataset van 2008 werd manueel geherstructureerd. Zo werden onder andere de uitslagen in verschillende rijen opgedeeld en opgesplitst in verschillende kolommen, namelijk uitslagen, hoogte, plaats en datum. In Tabellen 3 en 4 wordt een overzicht gegeven van de opbouw van de gegevens. Tabel 3: Datastructuur van dataset 2008 Veldnaam Datum Fokker Hoogte Naam Nummer Plaats
Omschrijving Datum van de wedstrijd Naam van de fokker van het paard Hoogte van de wedstrijd Naam van het paard Nummer van het paard Plaatsnaam van de wedstrijd
Ruiter Uitslagen
Naam van de ruiter Eindstand van de combinatie in de desbetreffende wedstrijd Naam van de vader van de moeder van het paard Naam van de vader van het paard
Moeders vader Vader
Tabel 4: Datastructuur van dataset 2010-2011 Veldnaam Datum Fokker Geslacht Hoogte Klassering Moeders vader Naam Ruiter Ras
Omschrijving Datum van de wedstrijd Naam van de fokker van het paard Geslacht van het paard Hoogte van de wedstrijd Eindstand van de combinatie in de desbetreffende wedstrijd Naam van de vader van de moeder van het paard Naam van de ruiter Stamboek waarin het paard origineel 24
Register Rubriek Stamboek naam UELN nummer Vader Wedstrijd Plaats Wedstrijdnaam
ingeschreven is Stamboekregister waarin het paard ingeschreven is Naam van de wedstrijd Naam waarmee het paard ingeschreven is in het stamboek Universal Equine Life Number, registratiecode van het paard Naam van de vader van het paard Plaatsnaam van de wedstrijd Naam van het paard op wedstrijden
Voor het opnemen van de gegevens werden volgende criteria aangehouden: -
Minimum hoogte van de wedstrijd is 1m40.
-
Het aantal deelnemers in de rubriek moet gekend zijn. Het paard moet een UELN nummer hebben, geregistreerd in de BWP databank.
4.2 FEI dataset met internationale prestaties Ook via het FEI werden gegevens opgevraagd en bekomen. Deze gegevens werden eveneens verkregen in de vorm van een excel-file. De dataset resulteert uit een query in de database van het FEI en bevat informatie over alle paarden die internationaal presteerden tussen 2006 en 2010 en in België geboren zijn of in België hun internationale FEI licentie verkregen hebben. Naast BWP paarden komen er dus ook paarden uit andere stamboeken voor. Deze data werden geleverd voor zowel springen, dressuur als eventing. In Tabel 5 wordt een overzicht gegeven van de opbouw van de dataset. Tabel 5: Datastructuur FEI dataset Veldnaam Administrated by Born in Competition Title Event type Horse FEI ID HR Horse Name Ind/Team Individual prize Rank Score Show name Year
Omschrijving Land waar paard is ingeschreven Land waar het paard geboren is Naam van de proef Type Wedstrijd FEI nummer van het paard Wedstrijdnaam van het paard Individuele of teamwedstrijd Prijzengeld verdiend in de wedstrijd Eindstand van de combinatie in de desbetreffende wedstrijd Behaald resultaat van de combinatie in de desbetreffende wedstrijd Naam van het concours Jaar van de wedstrijd
25
4. 3 Dataset met nationale prestaties Deze dataset bevat alle prestaties van BWP paarden op Belgische wedstrijden georganiseerd door LRV en KBRSF voor de periode 1992-2009. Het zijn deze gegevens die gebruikt werden voor de berekening van de GSI2009. Tabel 6 geeft een overzicht van de belangrijkste velden in deze dataset. Tabel 6: Datastructuur dataset nationale gegevens Veldnaam Num_id Chgs_id Chgs_s Organ Wedid Sexe Byear Plaats
Omschrijving Nummer van het paard in de database Aangepast nummer van het paard Aangepast nummer voor de vader van het paard Organiserende federatie van de desbetreffende wedstrijd Gecodeerd nummer voor de wedstrijd Geslacht van het paard (1=hengst/ruin, 2= merrie) Geboortejaar van het paard Plaats in de eindstand van de combinatie in de desbetreffende wedstrijd
4.4 Pedigreebestand Het pedigreebestand is gebaseerd op informatie van het BWP en SBS stamboek. De data bevatten informatie over 279 996 paarden. Hoe deze dataset is gestructureerd wordt weergegeven in Tabel 7. Tabel 7: Datastructuur pedigreebestand Veldnaam Paardnummer Vadernummer Moedernummer Geboortejaar Geslacht
Omschrijving Nummer van het paard Nummer van de vader van het paard Nummer van de moeder van het paard Geboortejaar van het paard Geslacht van het paard (0=onbekend, 1=mannelijk, 2=vrouwelijk)
4.5 Hardware Het grootste deel van het werk werd gedaan op de persoonlijke laptop (Toshiba L6501K2). Omdat er veel rekencapaciteit nodig is voor de verwerking van de data werd er daarenboven een account aangevraagd op de cluster van het Vlaams Supercomputer 26
Centrum. De VIC3-cluster biedt een uitgebreid rekenplatform en maakt uitgebreide modelberekeningen mogelijk. Het besturingssysteem van de VIC3-cluster is Linux.
4.6 Software Aangezien de datasets in .xls formaat werden verkregen werd het opslaan en openen ervan uitgevoerd met Microsoft Excel. Vervolgens werden de datasets ingelezen in het analytische programma SAS 9.2. Dit softwarepakket werd in eerste instantie gebruikt voor datamanagement. Ook de inventarisatie en voorbereiding op volgende analyses van de hierboven beschreven datasets werd met behulp van SAS 9.2 uitgevoerd. Variance Component Estimation 4 (VCE4) is een programma dat gebruikt wordt om diermodellen te berekenen door een schatting van de covariantiematrices (Groeneveld, 1998). Onder andere genetische correlaties en fokwaardeschattingen zijn het resultaat van deze berekeningen. Multiple Trait Gibbs Sampler for Animal Models (MTGSAM) is een set van FORTRANprogramma’s dat gebruikt wordt om Gibss Sampling toe te passen op diermodellen voor schatting van variantiecomponenten. In dit onderzoek wordt het toegepast om een thresholdmodel toe te passen op de data (Van Tassel et. al., 1995). De transfer van gegevens tussen de persoonlijke laptop en de VIC3-cluster werd mogelijk gemaakt door het File Transfer Protocol (FTP) programma WinSCP 4.2.6.
27
5. METHODEN 5.1 Datasets combineren en opzuiveren 5.1.1 Manuele internationale datasets combineren De twee manuele datasets werden gecombineerd en geherstructureerd om zo één volledige dataset te verkrijgen. Missende informatie in de ene dataset, zoals geslacht, levensnummer of stamboek, werd met informatie uit de andere aangevuld om een zo volledig mogelijke dataset te verkrijgen. De kolom ‘hoogte’ werd opgesplitst in ‘hoogte’ en ‘geen hoogte’ aangezien zoals eerder vermeld niet van elke prestatie de exacte hoogte geweten is maar er wel een aanduiding is van het type van de proef. In Tabel 8 wordt een overzicht gegeven van de opbouw van de uiteindelijke dataset. Tabel 8: Datastructuur van de gecombineerde dataset Veldnaam Datum Fokker Geen hoogte Geslacht Hoogte Hoogteklasse Klassering Moeders vader Naam Ruiter Ras Register Stamboeknaam UELN nummer Vader Wedstrijd Plaats Wedstrijdnaam
Omschrijving Datum van de wedstrijd Naam van de fokker van het paard Afkorting van type rubriek indien er geen hoogte geweten is Geslacht van het paard (merrie, ruin, hengst) Hoogte van de wedstrijd Gehercodeerde hoogte van de wedstrijd Eindstand van de combinatie in de desbetreffende wedstrijd Naam van de vader van de moeder van het paard Naam van de ruiter Stamboek waarin het paard origineel ingeschreven is Stamboekregister waarin het paard ingeschreven is Naam waarmee het paard ingeschreven is in het stamboek Universal Equine Life Number, registratiecode van het paard Naam van de vader van het paard Plaatsnaam van de wedstrijd Naam van het paard op wedstrijden
5.1.2 Nationale en internationale datasets combineren In een volgende stap worden de nationale en de manuele internationale datasets gecombineerd. Paarden die geen hoogteklasse toebedeeld kregen (te weinig info in de
28
dataset) en waarvan de geboortedatum ontbrak werden verwijderd uit de dataset. De structuur van deze dataset wordt gegeven in Tabel 9. Tabel 9: Datastructuur van de uiteindelijke dataset Veldnaam Num_id Chgs_id Chgs_s Organ Wedid Sexe Byear lft Hoogteklasse Ranking
Omschrijving Nummer van het paard in de database Aangepast nummer van het paard Aangepast nummer voor de vader van het paard Organiserende federatie van de desbetreffende wedstrijd Gecodeerde nummer voor de wedstrijd Geslacht van het paard (1=hengst/ruin, 2= merrie) Geboortejaar van het paard Leeftijd van het paard Gehercodeerde hoogte van de wedstrijd Ranking in de proef
Van deze dataset werd vervolgens van elk paard de hoogste stand bijgehouden, met name die record waarop het paard de jongste leeftijd heeft in de hoogste hoogtklasse die het ooit gelopen heeft. Deze hoogste stand werd voor zowel de nationale gegevens alleen als voor de gecombineerde dataset bijgehouden. 5.1.3 Voorbereiden van prestatie- en pedigreebestand voor de genetische evaluatie De programma’s VCE4 en MTGSAM hebben beiden een gecodeerd prestatie- en pedigreebestand nodig. Er wordt vertrokken vanuit het bestand met de sportprestaties en vanuit het bestand met de volledige pedigree-informatie. Deze worden in een SASprogramma, afgeleid van c_bel_horse.f geladen. Dit programma heeft als output wederom twee bestanden: sportprestaties van paarden met gekende pedigree en een minimale pedigreefile, met alleen pedigree-informatie over paarden in het prestatiebestand en hun voorouders. Deze bestanden worden op hun beurt weer in een afgeleide van de SAS-programma’s recode_for_vce.sas en sp.code_for_MTGSAM.sas ingeladen. Deze twee programma’s geven elk als output een gecodeerd prestatie- en pedigreebestand. Deze bestanden zijn gecodeerd voor gebruik in de programma’s VCE4 en MTGSAM respectievelijk. Het hercoderen houdt in dat de levels van elke factor worden omgezet naar gehele getallen van 1 tot k, met k het aantal levels van de factor. Deze gecodeerde bestanden worden in VCE4 of MTGSAM ingelezen door middel van een parameterfile. In deze parameterfile worden de locatie van de bestanden en de gewenste modellen gespecificeerd. Figuur 1 toont een stroomdiagram van bovenstaande stappen. 29
Figuur 1: Stroomdiagram voor het hercoderen en inlezen van de data
5.2 Kenmerken 5.2.1 LRV en KBRSF De kenmerken LRV en KBRSF zijn de BLOM-getransformeerde ranking in de desbetreffende wedstrijd (Reilly et al., 1998). Het zijn deze kenmerken die gebruikt worden voor de berekening van de Genetische Spring Index (GSI). Het kenmerk LRV betreft de uitslagen van wedstrijden ingericht door de wedstrijdfederatie LRV en dus van de meer recreatieve sport. KBRSF betreft de uitslagen van wedstrijden ingericht door de KBRSF (CSN’s), met daarbij uitslagen van de Klassieke Cyclus en de Wedstrijden Jonge Paarden. Dit laatste kenmerk sluit het best aan bij het fokdoel van het BWP en daarom worden de uiteindelijke fokwaardeschattingen voornamelijk gebaseerd op de KBRSF uitslagen. De verdeling van de kenmerken wordt weergegeven in Tabel 10. Voor model 2 van MTGSAM hebben we het kenmerk LRV-KBRSF gebruikt, waarbij de twee kenmerken samen als één kenmerk worden beschouwd. Tabel 10: Verdeling van de kenmerken LRV en KBRSF in de uiteindelijke dataset Kenmerk LRV KBRSF
Minimum 2,34 2,16
Maximum 7,76 8,04
Gemiddelde 5,00 5,00
Standaarddeviatie 0,94 0,94
30
5.2.2 Hoogteklasse (HK) Het kenmerk Hoogteklasse betreft de hoogste prestatie die elk paard ooit geleverd heeft in z’n sportcarrière. Voor het vinden van de hoogste prestaties van elk paard delen we de verschillende wedstrijden op in hoogteklassen, op basis van de gemiddelde hoogte van de proef. In Tabel 11 wordt een overzicht gegeven van de hoogteklassen. Voor de nationale gegevens, verkregen van LRV, kunnen we uit het wedstrijd-ID de hoogte afleiden. Ook voor de gegevens van WJP en KlCyc is dit mogelijk, aangezien deze wedstrijden voor de verschillende leeftijden een bepaalde hoogte hebben, vastgelegd in het wedstrijdreglement van de desbetreffende wedstrijden. Omdat de wedstrijd-ID voor de nationale wedstrijden van KBRSF deze informatie over de hoogte niet bevat stellen we een gemiddelde hoogte van 135cm vast, aangezien de hoogte van deze wedstrijden varieert tussen 120 en 150cm (KBRSF, 2011). Ook voor de internationale data hebben we niet voor alle gegevens de hoogte. In de data van 2008 ontbreken enkele hoogtes maar hebben we wel een indicatie voor het type van de proef. Deze stellen we ook gelijk aan de gemiddelde hoogte van dit type proef (FEI, 2011). Tabel 11: Indeling van de verschillende wedstrijden in hoogteklassen Hoogteklasse Hoogte(cm) 1 100 2 110 3 120 4 130 5 135 6 140 7 145 8 150 9 155 10 160
LRV B L M Z
WJP 4 5 6
KlCyc
KBRSF
Internationaal
4 5 6 X 140 145 150 + NC + GP + DB 155 160 + WB
5.2.3 Internationaal Het kenmerk Internationaal is een threshold-kenmerk. Het is een binomiaal kenmerk met waarde 1 voor paarden die voorkomen in de internationale datasets en waarde 0 voor paarden die enkel voorkomen in de nationale datasets. Dit kenmerk wordt gebruikt in de analyses met MTGSAM.
31
5.3 Effecten De effecten die meegenomen worden in de verschillende modellen worden opgedeeld in vaste en toevallige effecten. Welke effecten nu vast of toevallig zijn is ietwat arbitrair. Als stelregel wordt genomen dat vaste effecten een beperkt aantal levels zonder onderliggende verdeling hebben, terwijl de toevallige effecten over een hoger aantal levels met een onderliggende verdeling verspreid zijn. In wat volgt geven we een kort overzicht over de verschillende effecten. 5.3.1 Vaste effecten 5.3.1.1 Leeftijd (Lft) De paarden worden in 10 leeftijdsklasses ingedeeld. De groepen worden zo gekozen dat ze ongeveer even veel paarden bevatten. Een bijkomende reden om paarden van 13 en ouder samen te groeperen is dat de invloed van de leeftijd hier een minder grote rol zal spelen dan bij jongere paarden. Tabel 12 geeft de leeftijdsklassen en hun respectievelijke leeftijdscategoriën weer. Tabel 12: Indeling van de leeftijdsklasses Klasse 1 2 3 4 5 6 7 8 9 10
Leeftijd (jaar) 4 5 6 7 8 9 10 12 12 13 en ouder
5.3.1.2 Geslacht (Sx) De paarden worden in twee geslachten opgedeeld, namelijk mannelijk en vrouwelijk. In feite zijn ruinen niet hetzelfde als hengsten en worden ze best in verschillende klassen opgedeeld (Reinhardt, 1997). Deze informatie is echter niet altijd aanwezig in onze datasets. 5.3.1.3 Geboortejaar (Gj) Om een genetische trend over de geboortejaren (een genetische vooruitgang, het doel van selectie) te onderzoeken wordt ook geboortejaar als een vast effect meegenomen. 32
Ook hier worden de verschillende geboortejaren in klasses opgedeeld zodat de groepen ongeveer even groot zijn. Tabel 13: Indeling van de geboortejaarklasses Klasse 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
Geboortejaar 1979 – 1984 1985 – 1987 1988 – 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005
5.3.2 Toevallige effecten 5.3.2.1 Wedstrijdeffect (W) De resultaten zijn opgetekend op 940 verschillende wedstrijden met elk hun specifieke omstandigheden. Doordat paarden aan meerdere wedstrijden meedoen en meerdere paarden aan één wedstrijd meedoen kan het wedstrijdeffect geschat worden. Het wedstrijdeffect is een combinatie van externe factoren (zoals weer, bodem, sfeer…) die invloed hebben op de prestaties van elk paard in de desbetreffende wedstrijd of proef. 5.3.2.2 Permanent milieu effect (M) De prestaties van elk paard zijn gelijk aan de som van z’n genetische aanleg en van milieu-invloeden. Indien er meerdere metingen zijn per paard kunnen we een deel van de milieu-variatie schatten, eigen aan elk paard. Het permanent milieu effect beïnvloedt elke prestatie van een paard gelijk en is verschillend voor elk paard. 5.3.2.3 Additief genetisch effect (Ag) Dit is het aandeel van de genetische aanleg van het paard op z’n prestaties. Met andere woorden, het additief genetisch effect van het paard is z’n fokwaarde. 33
5.4 Modellen De in ons onderzoek gebruikte modellen in het programma VCE zijn meer-kenmerk modellen met herhaalde metingen. Ze verschillen in de combinaties van kenmerken en van effecten die worden meegenomen in de analyses. In het programma MTGSAM hebben we 2 verschillende modellen gebruikt. Het eerste is een thresholdmodel met enkel het threshold-kenmerk Internationaal. Het tweede model is een meerkenmerkenmodel waarbij een van de kenmerken eveneens het threshold-kenmerk Internationaal is. In Tabel 14 geven we een overzicht voor welke modellen er variantiecomponenten geschat zijn. De kenmerken en effecten zijn hierboven besproken. Tabel 14: Verschillende modellen voor de analyses in VCE en MTGSAM VCE Nr 1 2 3
Kenmerken LRV + KBRSF LRV + KBRSF LRV + KBRSF
4
LRV + KBRSF
5 6 7
LRV + HK LRV + HK LRV + HK
8
LRV + HK
9 KBRSF + HK 10 KBRSF + HK 11 KBRSF + HK 12 KBRSF + HK LRV + KBRSF + HK LRV + KBRSF + 14 HK 15 HK 13
1 2
Internationaal LRV-KBRSF + Internationaal
Toevallige Effecten Vaste Effecten geboortejaar + leeftijd + geslacht additief genetisch geboortejaar + leeftijd + geslacht additief genetisch + wedstrijd geboortejaar + leeftijd + geslacht additief genetisch + permanent milieu additief genetisch + wedstrijd + permanent geboortejaar + leeftijd + geslacht milieu geboortejaar + leeftijd + geslacht additief genetisch geboortejaar + leeftijd + geslacht additief genetisch + wedstrijd geboortejaar + leeftijd + geslacht additief genetisch + permanent milieu additief genetisch + wedstrijd + permanent geboortejaar + leeftijd + geslacht milieu geboortejaar + leeftijd + geslacht additief genetisch geboortejaar + leeftijd + geslacht additief genetisch + wedstrijd geboortejaar + leeftijd + geslacht additief genetisch + permanent milieu additief genetisch + wedstrijd + permanent geboortejaar + leeftijd + geslacht milieu geboortejaar + leeftijd + geslacht additief genetisch geboortejaar + leeftijd + geslacht additief genetisch + permanent milieu geboortejaar + leeftijd + geslacht additief genetisch MTGSAM geboortejaar + geslacht additief genetisch + permanent milieu geboortejaar + geslacht
additief genetisch + permanent milieu
Voor de schatting van de genetische varianties met MTGSAM vereist het programma een plausibele startwaarde van deze varianties. Om deze startwaarden te berekenen, gaan we uit van schattingen voor de erfelijkheidsgraden van, en de genetische 34
correlaties tussen beide kenmerken, gebaseerd op eerdere schattingen. Tabel 15 geeft, voor model 2, de startwaarden van de varianties en de erfelijkheidsgraden waarop deze gebaseerd zijn. Tabel 15: Startwaarden voor de varianties en erfelijkheidsgraden voor model 2 van MTGSAM Model
h² Internationaal
h² LRV-KBRSF
rg
σ²g Internationaal
σ²g LRVKBRSF
cov
1.1 1.2 1.3 1.4 1.5 1.6
0,1 0,1 0,1 0,5 0,5 0,5
0,15 0,15 0,15 0,15 0,15 0,15
0,5 0 -0,5 0,5 0 -0,5
0,111 0,111 0,111 1,000 1,000 1,000
0,176 0,176 0,176 0,176 0,176 0,176
0,070 0,000 0,070 0,210 0,000 0,210
Met: -
h² = erfelijkheidsgraad rg = genetische correlatie tussen de twee kenmerken σ²g = genetische variantie = (h² σ²e) / (1-h²) σ²e = genetische errorvariantie = 1 cov = covariantie tussen de twee kenmerken = rg * √(σ²gi σ²glk)
We testen dus zowel er van uitgaande dat er een positieve, negatieve of geen genetische correlatie is de twee kenmerken. Ook starten we met twee verschillende erfelijkheidsgraden voor het threshold-kenmerk. Voor model 1 zijn we eveneens uitgegaan van verschillende startwaarden voor de σ²g van het kenmerk Internationaal. Tabel 16: Startwaarden voor de varianties voor model 1 van MTGSAM Model 1.1
σ²g Internationaal
1.2
0,500
1.3
0,800
0,100
35
6. RESULTATEN 6.1 Inventarisatie 6.1.1 Manuele internationale dataset Hieronder geven we een inventarisatie van de gecombineerde en opgezuiverde manuele internationale dataset. Deze dataset bevat 11 710 prestatiegegevens van 1352 verschillende paarden. In Tabel 17 geven we een overzicht van de tijdsspanne, aantal prestaties en aantal paarden per jaar. We zien dat we voor 2010 met ongeveer het dubbel van de paarden bijna vier maal meer prestaties hebben ten opzichte van 2008. Tabel 17: Aantal wedstrijden, tijdsspanne, prestaties en paarden per jaar in de manuele internationale dataset Jaar
Tijdsspanne
Prestaties
Paarden
2008 2010 2011
05/01 – 14/09 03/01 – 30/12 02/01 – 09/01
2123 8423 1164
598 1083 21
We zien dat volgens de gegevens in de dataset het merendeel van de paarden bij hun geboorte BWP ingeschreven zijn (Tabel 18). Ook paarden die bij de geboorte in een ander stamboek geregistreerd zij en nadien BWP geregistreerd werden, worden in de fokwaardeschattingen opgenomen. Tabel 18: Aantal paarden per origineel stamboek per jaar in de manuele internationale dataset Stamboek
2008
2010
2011
AES BWP HANN HOLST KWPN NRPS OLD RHEIN SBS SF Z Onbekend
0 202 0 0 0 0 0 0 1 1 0 216
1 773 3 8 17 2 2 1 25 2 18 0
0 66 1 2 2 0 0 0 2 0 4 0
36
In Tabel 19 geven we een overzicht van de 11 meest voorkomende paarden en hun vader in onze data. Vervolgens beschouwen we in Tabel 20 de 10 vaders met de meeste nakomelingen en het totaal aantal prestaties van hun nakomelingen en in Tabel 21 de 10 moedersvaders met de meeste nakomelingen en het aantal prestaties van de nakomelingen. Tabel 19: Paarden met de meeste prestaties en hun vader in de manuele internationale dataset Paard Vonka-A Amai Abberuail Van het Dingeshof Torinto Van de Middelstede Barbarossa Van Paemel Bridgit Je t’Aime Flamenco Ulysse X Asteria Van de Dorpshoeve Ukinda Socrates Van de Padenborre
Aantal prestaties 69 64 61 59 57 56 55 55 53 53 53
Vader Darco Non Stop Non Stop Remondo Darco Kannan Flamenco de Semilly Non Stop Calvados Emilion Darco
Tabel 20: Hengsten met meeste nakomelingen en hun aantal prestaties in de manuele internationale dataset Hengst Darco Heartbreaker Nabab de Rêve Clinton Kannan Toulon Kashmir van’t Schuttershof Skippy II Thunder Van de Zuuthoeve Non Stop
Aantal nakomelingen 149 68 63 53 47 41 35 34 28 27
Aantal prestaties 1634 540 652 422 662 263 311 289 257 374
Het gemiddeld aantal nakomelingen per hengst is 4,875.
37
Tabel 21: Moedersvaders met de meeste nakomelingen en hun aantal prestaties in de manuele internationale dataset Hengst Darco Lys De Darmen Heartbreaker Skippy II Major de la Cour Feinschnitt I vd Richter Nabab de Rêve Pachat II Chin Chin Latano
Aantal nakomelingen 66 47 44 34 26 25 24 23 21 19
Aantal prestaties 751 491 459 256 226 260 162 175 393 184
Het gemiddeld aantal nakomelingen per moedersvader is 3,197. Figuur 2 toont de verdeling van nakomelingenprestaties per hengst.
Figuur 2: Aantal nakomelingenprestaties per hengst ten opzichte van het aantal hengsten in de manuele internationale dataset
Bij het toekennen van de hoogteklasses aan de prestaties krijgen we volgende verdeling (Tabel 22). Zoals beschreven in Tabel 11 komen voor de internationale prestaties enkel hoogteklasses 4 tot en met 10 terug.
38
Tabel 22: Aantal records per hoogteklasse in de manuele internationale dataset Klasse 1 2 3 4 5 6 7 8 9 10
Aantal records / / / 214 250 4252 3128 2800 309 757
Als we de leeftijdsverdeling bekijken krijgen we de volgende verdeling (Tabel 23 en Figuur 3). Tabel 23: Aantal paarden per leeftijdsklasse in de manuele internationale dataset Leeftijdsklasse 1 2 3 4 5 6 7 8 9 10
Leeftijd 4 5 6 7 8 9 10 11 12 ≥ 13
Aantal records / / 221 724 1944 2477 2040 1426 1209 1696
Figuur 3: Aantal prestaties per leeftijdsklasse in de manuele internationale dataset 39
6.1.2 FEI dataset Hieronder volgt een korte beschrijving van de belangrijkste zaken in de FEI dataset. Aangezien deze dataset anders is opgebouwd dan de vorige kunnen we geen even uitgebreide beschrijving geven (bv geen vader of moedersvader). In totaal zijn er voor springpaarden 24 189
prestaties van 2240 paarden beschikbaar. In Tabel 24 wordt een overzicht gegeven van de tijdsspanne, het aantal wedstrijden, event types, prestaties en paarden per jaar. Tabel 24: Aantal wedstrijden, tijdsspanne, prestaties en paarden per jaar in de FEI dataset Jaar
Tijdsspanne
Wedstrijden
Event types
Prestaties
Paarden
2006
15/07 – 03/12 14/07 – 12/11 09/08 – 26/12 08/01 – 26/12 07/01 26/12 06/01 – 14/01
4
4
55
22
2
2
29
11
114
24
4834
1067
283
27
8917
1229
288
30
10293
1358
3
3
64
25
2007 2008 2009 2010 2011
Tabel 25 toont de 10 paarden met de meeste prestaties in de FEI dataset. Tabel 25: Paarden met de meeste prestaties in de FEI dataset Naam van het paard Ulysse Torinto Van de Middelstede L’Espoir Nabab’s Son Wonami Van de Aard Amaryllis Celena Z Withney Van de Dwerse Hagen Wisconsin 111 Wonderboy III
Aantal prestaties 121 118 114 103 99 99 98 97 96 95
Van veel paarden is de UELN niet ingevuld in de dataset. Zo hebben we slechts van 1193 van de 2240 paarden in de dataset de UELN. Dit komt overeen met 10 659 records waarvan geen UELN aanwezig is in de data. Hierdoor is verdere analyse van deze gegevens zeer moeilijk tot zelfs onmogelijk aangezien we geen link kunnen leggen met het pedigree- en andere bestanden. Ook blijkt dat enkele paarden die in de manuele 40
dataset voorkomen niet aanwezig zijn in de FEI dataset. Zo komt het paard dat het meest aanwezig is in de manuele dataset (Vonka-A) helemaal niet voor in de FEI dataset. Daarenboven zijn veel van de paarden aanwezig in de FEI-dataset niet ingeschreven in het BWP en dus niet van nut in onze analyse. Omwille van voorgaande redenen werd beslist om enkel verder te gaan met de manuele internationale datasets. 6.1.3 Dataset met nationale prestaties In de opgezuiverde dataset (paarden zonder geboortedatum of zonder hoogteklasse werden verwijderd) vinden we 707 221 prestaties van 44 757 paarden. In Tabel 26 geven we een overzicht van het aantal records en aantal wedstrijden per jaar. Tabel 26: Aantal records en wedstrijden per jaar in de nationale dataset Jaar 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009
Aantal records 18134 19579 16411 20500 36015 36005 34695 38458 39576 38699 40887 38897 42154 44888 48490 64750 69079 62995
Aantal wedstrijden 484 501 326 495 863 795 763 826 849 792 835 834 779 830 855 1133 1294 1036
Tabel 27 toont de 10 paarden met de meeste records in de data en hun vader. In Tabel 28 tonen we de 10 vaders met de meeste nakomelingen en het totaal aantal prestaties van die nakomelingen.
41
Tabel 27: Paarden met de meeste prestaties en hun vader in de nationale dataset Paard Lothario Tamara de Reve Puckinia vd Wildernis Nick Odessa v/h Geinsteinde Lester Ritoch van de Pereboom Quick Chin vd Elsendam Picasso van de Rozebaan Irco-Polo v/h Blokenhof
Aantal prestaties 263 233 225 224 215 200 199 199 199 197
Vader Codexco Nabab de Reve Lys De Darmen Codexco Skippy II Pachat II Sioux de Baugy Chin Chin Venu du Theil Bacara
Tabel 28: Hengsten met de meeste nakomelingen en hun prestaties in de nationale dataset Hengst Darco Lys de Darmen Skippy II Heartbreaker Major de la Cour Nabab de Reve Non Stop Saygon Pachat II Mio de Baugy
Aantal nakomelingen 1120 484 350 342 334 319 305 281 256 246
Aantal nakomelingprestaties 27135 13216 9197 8660 8477 6455 5670 8316 5873 6257
Figuur 4 toont de verdeling van de data over het aantal hengsten.
Figuur 4: Aantal nakomelingenprestaties per hengst ten opzichte van het aantal hengsten in de nationale dataset 42
Figuur 5 toont de verdeling van de leeftijd van de paarden in de dataset. Herinner dat in de analyses de leeftijden zijn gegroepeerd in klasses en dat paarden van 13 jaar en ouder in 1 klasse zijn gegroepeerd (Tabel 12).
Figuur 5: Aantal prestaties per leeftijd in de nationale dataset
Tabel 29 toont de verdeling van de prestaties over de verschillende hoogteklasses. De nationale prestaties werden in de hoogteklasses 1 tot en met 6 opgedeeld (Tabel 11). Tabel 29: Aantal records per hoogteklasse in de nationale dataset Klasse 1 2 3 4 5 6 7 8 9 10
Aantal records 66 755 250 942 132 161 74 636 173 334 9 393 / / / /
43
6.1.4 Gecombineerde dataset De combinatie van de hierboven beschreven nationale en manuele internationale datasets gaf aanleiding tot een dataset met 718 931 records. 6.1.5 Hoogste stand Voor zowel de nationale als de gecombineerde dataset werd de hoogste hoogteklasse bijgehouden. Dit resulteerde voor de nationale gegevens in een tabel met 44 383 records (dus 44 383 paarden) en voor de gecombineerde dataset een tabel met 44 752 records. Tabel 30 toont de verdeling van de gegevens over de klassen. Tabel 30: Verdeling van de gegevens over de hoogste klasse Hoogteklasse Nationaal Gecombineerd
1 2 3597 11125 3549 11047
3 4 5 6316 2871 18690 6234 2843 18199
6 7 1784 2000 303
8
9
10
318
51
208
44
6.2 Genetische evaluatie met VCE4 6.2.1 Schatting van de variantiecomponenten In Tabel 31 wordt de schatting van de ratio’s van de variantiecomponenten voor de verschillende modellen weergegeven. De modellen verschillen zowel in de kenmerken (LRV en/of KBRSF en/of Hoogteklasse (HK)) als in de meegenomen effecten. Met: -
l = genormaliseerde plaats op LRV wedstrijden
-
f= genormaliseerde plaats op CSN, WJP en KL Cyc wedstrijden
-
k= hoogste klasse dat het paard ooit gelopen heeft, inclusief internationale prestaties
-
Ag=additief genetisch
-
Gj= geboortejaar
-
Lft= leeftijd
-
Sx= geslacht
-
W= wedstrijdeffect
-
M= permanent milieu effect
-
AGlog= likelihood schatter gegeven door VCE (hoe lager, hoe beter het model past voor de data)
-
CPU= computer-rekentijd in uren:minuten:seconden
-
Add gen= ratio van de additief genetische waarde variatie over de gehele variatie (= erfelijkheidsgraad)
-
Milieu= ratio van de milieu-variatie over de gehele variatie
-
Resid= ratio van de error-variatie over de gehele variatie
45
Tabel 31: Schatting van de ratio’s van de variantiecomponenten met VCE
LRV
KBRSF
Hoogteklasse
Resid
Add Gen
Add Gen Resid
0.740
Resid
Add Gen
0.260
0.143
Milieu
CPU
0.766
0.740
Milieu
AGlog 0.234
0.260
0.770
Random effecten 02:08:54
0.766
0.148
Vaste Effecten 731143,6 0.234
0.082
Kenmerken Ag 128:20:26
0.814
nr Gj+Lft+Sx 731143,6
0.130
l+f Ag + W
0.055
1 Gj+Lft+Sx 6:38:14
l+f 732381,1
0.770
2 Ag + M
0.148
Gj+Lft+Sx
0.082
l+f
0.841
3
0.131
Ag + W +M
0.055
Gj+Lft+Sx
256:09:51
l+f 732381,7
4 414546,8
0.388
Ag
0.769
Gj+Lft+Sx
0.231
l+k
40:41:33
03:28:03
5
414531,1
0.105
0.610
Ag + W
0.085
0.390
Gj+Lft+Sx
4:36:32
0.763
l+k
413899,2
0.105
0.325
6 Ag + M
0.088
0.601
Gj+Lft+Sx
67:25:11
0.399
l+k
413885,2
0.811
7 Ag + W +M
0.599
Gj+Lft+Sx
0.401
l+k
03:47:12
0.806
8
460555,5
0.642
Ag
0.358
Gj+Lft+Sx
0.740
f+k
13:29:38
0.260
9
460555,5
0.642
Ag + W
0.358
Gj+Lft+Sx
0.088
0.740
f+k
6:02:23
0.260
10
459626,2
0.639
Ag + M
0.361
Gj+Lft+Sx
0.088
0.769
f+k
25:07:25
0.143
11
459626,2
0.640
Ag + W +M
0.360
Gj+Lft+Sx
0.769
f+k
0.231
0.143
12
8:11:44
0.610
803255,1
0.390
Ag
0.736
Gj+Lft+Sx
0.264
l + f+ k
0.769
13
0.077
0.601 19:06:50
0.399
801618,1
0.767
Ag + M
00:08:48
0.090
Gj+Lft+Sx
70767,2
0.813
l + f+ k
Ag
0.110
14
Gj+Lft+Sx
0.657
k
0.343 15
46
Zoals in tabel 2 te lezen valt worden in elk Europees model voor fokwaardeschattingen de effecten geslacht en leeftijd meegenomen. Daarom worden deze vaste effecten ook nu sowieso meegenomen. Het effect geboortejaar wordt meegenomen om een trend in de genetische waarde van de populatie waar te nemen (door selectie zou de genetische waarde moeten stijgen). Als we telkens de modellen met en zonder een permanent milieu-effect vergelijken (bv 1 vs 3, 2 vs 4, 13 vs 14) zien we dat permanent milieu steeds een duidelijke invloed heeft op het additief genetisch effect (= de erfelijkheidsgraad) van zowel kenmerk LRV als KBRSF (van 0,15 tot 0,18). Het is duidelijk dat het additief genetisch effect het permanent milieu-effect opslorpt als we milieu niet meenemen in het model. Ook wordt in de modellen met een milieu-effect minder variatie verklaart dan in de modellen waarin geen milieu-effect wordt meegenomen (de Resid variantiecomponent is hoger). De likelihood-waarde is steeds kleiner voor de modellen waar we een milieu-effect meenemen. Dit duidt dat deze modellen beter aansluiten bij de data en dat het dus te verkiezen is om een milieu-effect mee te nemen in de modellen. Aangezien Hoogteklasse geen herhaalde metingen heeft (de hoogste waarde die ooit werd behaald, dus 1 waarde voor elk paard) is het schatten van een permanent milieueffect voor dit kenmerk niet relevant. Een wedstrijdeffect wordt niet waargenomen, de variantiecomponent voor het wedstrijdeffect wordt steeds op 0,000 geschat. Aangezien in de voorgaande modellen geen wedstrijdeffect wordt vastgesteld nemen we voor de analyses van de modellen met de drie kenmerken dit effect niet mee (dit om te besparen op rekentijd). Als we kijken naar de geschatte erfelijkheidsgraden zien we een lage erfelijkheidsgraad voor de kenmerken LRV en KBRSF. Dit geeft aan dat er veel externe omstandigheden inwerken op de sportprestaties van paarden. We vinden een lagere erfelijkheidsgraad dan die voor de huidige GSI-schatting wordt aangenomen (Interstallion, 2004c).
47
6.2.2 Genetische correlaties tussen LRV, KBRSF en Hoogteklasse geschat met VCE Tabel 32: Genetische correlaties geschat met VCE
Nr 1 3 5 7 9 11 13 14
Kenmerken l+f l+f l+k l+k f+k f+k l+f+k l+f+k
Effecten Gj+Lft+Sx Gj+Lft+Sx +M Gj+Lft+Sx Gj+Lft+Sx+M Gj+Lft+Sx Gj+Lft+Sx+M Gj+Lft+Sx Gj+Lft+Sx+M
LRV - KBRSF LRV -HK KBRSF - HK Gen corr s.e. Gen corr s.e. Gen corr s.e. 0,676 0,01 0,812 0,035 0,593 0,011 0,795 0,014 0,378 0,009 0,545 0,015 0,696 0,005 0,566 0,009 0,417 0,009 0,876 0,021 0,779 0,014 0,6 0,016
Tabel 32 toont de genetische correlaties en hun standaardafwijking voor de kenmerken geschat voor de verschillende modellen. Aangezien we geen invloed van het wedstrijdeffect zien (Tabel 29) hebben we de waarden van deze modellen niet opgenomen in de tabel. Ook voor de genetische correlaties zien we een duidelijke invloed van het milieu-effect. Aangezien in de modellen met een permanent milieu-effect de additief genetische waarden opgezuiverd zijn door het milieu-effect, geven deze correlaties dan ook een beter beeld. We zien voor de combinatie LRV - KBRSF een genetische correlatie van 0,676 tot 0,876. Dit betekent dat de genen die instaan voor goede prestaties op LRV wedstrijden ook instaan voor goede prestaties op wedstrijden van KBRSF, Klassieke Cyclus en Wedstrijd Jonge Paarden. Voor het 3-kenmerken model ligt de genetische correlatie hoger dan voor het 2-kenmerken model. Zoals te zien in Tabel 2, wordt voor de GSI-berekening een genetische correlatie vooropgesteld van 0,63. Onze resultaten tonen dus een hogere genetische correlatie tussen de twee kenmerken dan de correlatie in gebruik in de huidige berekening van de GSI. Voor de kenmerken LRV en Hoogteklasse zien we een genetische correlatie die hoger ligt dan de genetische correlatie tussen KBRSF en Hoogteklasse.
48
6.2.3 Vergelijking tussen BLUP met en zonder Hoogteklasse In de huidige Belgische fokwaardeschatting worden enkel de kenmerken LRV en KBRSF opgenomen, met de vaste effecten leeftijd en geslacht en de random effecten permanent milieu en additief genetisch effect. Dit komt overeen met model 3 uit voorgaande tabellen. De resultaten van deze analyses worden nu vergeleken met die van model 14, waarbij naast de kenmerken LRV en KBRSF ook het kenmerk Hoogteklasse (en hiermee dus internationale prestaties) wordt meegenomen. In wat volgt worden dus enkel de resultaten van deze twee analyses aangehaald. Allereerst worden de EBV’s van beide analyses vergeleken. Door de solution-files van VCE in te lezen in SAS kunnen we de Pearson- en Spearman-rank-correlatie berekenen en een correlatiediagram opmaken tussen de EBV’s van zowel alle paarden als tussen de EBV’s van de hengsten. Ook de EBV’s van de 100 beste hengsten in de analyse van model 3 (LRV + KBRSF), worden vergeleken met de EBV’s in de analyse van model 14 (LRV + KBRSF +HK). Dit wordt eveneens gedaan voor de top 100 van de hengsten waarvan de fws worden gepubliceerd in de GSI (geboren in de laatste 30 jaar, betrouwbaarheid van 0,75 en minstens 5 nakomelingen actief in de sport). De resultaten zijn weergegeven in Tabel 33 en Figuren 6 en 7. Tabel 34 toont een beschrijving van de EBV’s waarop de correlaties worden getest. De eerste waarde is steeds die voor de EBV’s van model 3, de tweede voor de EBV’s van model 14. Tabel 33: Correlatie tussen EBV’s van model 3 en 14
Bron van EBV’s Alle paarden Hengsten Beste 100 hengsten Beste 100 GSI hengsten
Pearson-correlatie 0,917 0,953 0,702 0,928
Spearman-correlatie 0,910 0,951 0,638 0,912
Tabel 34: Beschrijvende statistiek van de EBV’s gebruikt voor de correlatieberekeningen. Model 3/Model 14.
Bron van EBV’s Alle paarden Hengsten Beste 100 hengsten Beste 100 GSI hengsten
Gemiddelde
Minimum
Maximum
-0,060 / -0,101 -0,077 / -0,116 0,282 / 0,315
-0,657/ -1,084 -0,648 / 0,761 0,183 / 0,081
0,590 / 0,655 0,500 / 0,569 0,500 / 0,569
Standaarddeviatie 0,130 / 0,166 0,195 / 0,238 0,075 / 0,105
0,179 / 0,202
0,054 / 0,060
0,500 / 0,522
0,108 / 0,116
49
Figuur 6: Correlatiediagram tussen EBV’s van de hengsten in modellen 3 en 14
Figuur 7: Correlatiediagram tussen EBV’s van alle paarden in modellen 3 en 14
We zien dat de correlatie tussen de EBV’s van de hengsten hoger is dan de correlatie van de EBV’s van alle paarden. De top-100 van alle hengsten is duidelijk gewijzigd. Als we naar de 100 beste hengsten uit model 3 kijken vinden we er 87 terug in de top-100 van model 14 (met Hoogteklasse). Hun respectievelijke plaats is ook gewijzigd (Spearmanrank-correlatie van 0,638). Van de top-100 van de GSI hengsten van de analyse van model 3 komen er 86 terug in de top-100 van model 14. Hier is hun respectievelijke plaats minder gewijzigd (0,912). 50
6.2.4 Schatting van de vaste effecten De invloed van de vaste effecten, met name geboortejaar en geslacht wordt voor modellen 3 en 14 weergegeven in Figuur 8 en 9.
Figuur 8: Schatting van vast effect geboortejaar
Figuur 9: Schatting van vast effect leeftijd
We zien duidelijk een dalende trend bij het vast effect geboortejaar. Als we daarnaast ook het gemiddelde van de BLUPs in functie van de geboortejaarklasses bekijken (afgebeeld voor model 14 in Figuur 10) zien we een duidelijke stijgende trend.
51
Voor leeftijd zien we dat paarden van 4-5 jaar minder goed scoren, dat paarden van 6-7 goed scoren, dat er minder goed gescoord wordt tussen de 8 en de 11 jaar waarna de oudere paarden weer beter gaan scoren. Als we kijken naar het vaste effect geslacht zien we voor modellen 3 en 14 steeds een lagere waarde voor de mannelijke paarden dan voor de vrouwelijke (Tabel 32). Tabel 35: Invloed van het vaste effect geslacht
Model 3 14
Mannelijk 0 0
Vrouwelijk 0,015 0,008
Figuur 10: Gemiddelde van BLUPs in functie van de geboortejaarsklasses
52
6.3 Genetische evaluatie met MTGSAM 6.3.1 Schatting van de variantiecomponenten voor het threshold-kenmerk Tabel 36 toont de geschatte erfelijkheidsgraden voor het kenmerk Internationaal voor de verschillende startwaarden in model 1. Tabel 36: Schatting van de erfelijkheidsgraad van Internationaal Model
CPU (u:min:sec)
h² Internationaal
1.1 1.2 1.3
21:15:19 20:53:18 20:59:47
0,707 0,705 0,729
6.3.2 Schatting van de variantiecomponenten voor het 2-kenmerken model Tabel 37 toont de berekende ratio’s voor de respectievelijke modellen, en de computertijd nodig voor de analyse van de modellen. Tabel 37: Schatting van de erfelijkheidsgraden en variantiecomponenten met MTGSAM Model 2.1 2.2 2.3 2.4 2.5 2.6
CPU
h² Internationaal
h² LRV-KBRSF
78:57:29 78:28:33 78:59:15 79:15:29 79:06:09 78:58:29
0,913 0,905 0,905 0,904 0,906 0,904
7,091 7,416 7,292 7,895 7,871 7,684
(u:min:sec)
rg Internationaal + LRV-KBRSF 0,005 0,006 0,006 0,006 0,006 0,006
53
7. BESPREKING VAN DE RESULTATEN 7.1 Inventarisatie Een eerste en algemene opmerking die we moeten maken is de geringe data van internationale prestaties die we ter beschikking hebben, ten opzichte van de nationale data. Hierdoor is er weinig overlap tussen de verschillende datasets. Zo gaan bijvoorbeeld voor paarden die in 1994 nationaal presteerden, maar nadien ook internationale prestaties optekenden, deze internationale gegevens niet aanwezig zijn in onze datasets. Hierdoor zullen deze ook een lagere HK toebedeeld krijgen dan hetgeen ze eigenlijk hebben gepresteerd. Dit is al direct een grote bron van bias in dit onderzoek en dient naar verder onderzoek toe zeker aangepakt te worden. Als we vervolgens de resultaten van de inventarisatie kritisch bekijken stellen we volgende zaken vast: -
Voor de internationale dataset ligt zowel het aantal paarden als prestaties hoger in 2010 dan in 2008. Dit feit wordt verklaard doordat de originele dataset voor 2010 het meest volledig is en het volledige jaar overspant.
-
De verdeling van de nakomelingenprestaties per hengst vertoont een duidelijke asymetrie, met enkele hengsten met veel en veel hengsten met weinig nakomelingenprestaties. Dit duidt er niet noodzakelijk op dat deze eerste hengsten relatief gezien meer sportpaarden geven maar kan ook een gevolg zijn van het feit dat ze meer nakomelingen hebben in het algemeen. We zien dat Darco zowel in de nationale als internationale datasets de lijstaanvoerder is qua nakomelingenprestaties.
-
Het voornamelijk aanwezig zijn van 4- tot 7-jarigen in de nationale dataset kan verklaard worden door de incorporatie van de prestaties opgemeten op wedstrijden van de Klassieke Cyclus en Wedstrijden Jonge Paarden. Deze wedstrijden worden enkel voor paarden van 4 tot 7 jaar (KlCyc) en van 4 tot 6 jaar (WJP) ingericht. Op internationaal niveau worden, buiten een sporadische wedstrijd voor 6- en 7-jarigen, geen wedstrijden georganiseerd voor jonge paarden en schuift de leeftijd dus automatisch op.
-
Het gebruik van de FEI-dataset vertoont meerdere problemen. Zo zijn niet alle paarden in de dataset ingeschreven in het BWP stamboek. Zodoende hebben we hiervan geen pedigree-informatie en kunnen deze niet meegenomen worden in de analyses. Ook blijkt dat niet alle paarden, die wel in de manuele datasets zitten, aanwezig zijn in de FEI-dataset. Het voornaamste probleem echter is de 54
identificatie van de paarden. Aangezien sportpaarden regelmatig van naam veranderen is het moeilijk om ze op naam te identificeren. Daar komt de UELNnummer van pas. Deze nummers zijn echter niet altijd vermeld in de dataset waardoor een correcte identificatie van het paard onmogelijk wordt. Daarenboven worden de UELN-nummers dikwijls verkeerd gebruikt door de stamboeken (bv een paard dat in een nieuw stamboek wordt ingeschreven, maar al een UELN nummer heeft, krijgt dikwijls door dat stamboek een nieuwe UELNnummer toegewezen). Daarom is besloten om met deze dataset niet verder te werken.
7.2 Genetische evaluatie met VCE De log likelihood is steeds het laagst bij die modellen waarbij een milieu-effect wordt meegenomen. Deze modellen sluiten dus het best aan bij de data en daarom bespreken we hier alleen de resultaten van die modellen. Als we kijken naar de erfelijkheidsgraden van de respectievelijke kenmerken kunnen we het volgende opmerken: -
Er is een duidelijk permanent milieu-effect. Zo staat het milieu-effect in model 14 (LRV + KBRSF + HK), voor de kenmerken LRV en KBRSF respectievelijk, in voor 11% en 14,3% van de variantie. In de modellen waar geen permanent milieu effect wordt meegenomen slorpt het additief genetisch effect deze variatie op.
-
Er is geen wedstrijdeffect, ondanks dat we dit wel zouden verwachten. Dit zou betekenen dat een klassering op een minder sterk bezette wedstrijd op hetzelfde niveau geschat wordt als eenzelfde klassering op een sterk bezette wedstrijd. Waarschijnlijk zijn er per wedstrijd te weinig deelnemers om een wedstrijdeffect te kunnen schatten.
-
Het zou interessant kunnen zijn om, zoals in de Duitse fws, een ruitereffect op te nemen in de modellen. De ruiter heeft immers een grote invloed op de prestaties van een paard. Zo schatten Janssens et al. (1999) dat het ruitereffect instaat voor 14% van de variantie. Deze informatie is echter niet aanwezig in onze datasets en kan dus niet opgenomen worden. Idealiter zouden dan veel paarden gereden moeten worden door veel ruiters en veel ruiters veel moeten paarden rijden, iets wat in de paardensport meestal niet het geval is.
-
De erfelijkheidsgraad voor kenmerk LRV in model 3 (vergelijkbaar met het model gebruikt voor de GSI schatting, LRV + KBRSF) is 0,055. In modellen 7 (LRV + HK) en 14 (LRV + KBRSF + HK) is de erfelijkheidsgraad lichtjes hoger (0,085 en 55
0,077). Deze erfelijkheidsgraden zijn lager dan diegene die momenteel worden gebruikt in de huidige GSI-berekening (0,11). -
De erfelijkheidsgraden voor het kenmerk KBRSF liggen iets hoger dan voor LRV (0,082 tot 0,090), maar zijn eveneens lager dan deze gebruikt voor de GSIberekening (0,10).
-
Deze erfelijkheidsgraden voor competitie-kenmerken liggen in dezelfde lijn als deze geschat in Ierland (0,03 – 0,08, Aldridge et al., 2000) en voor het TSPkenmerk in Duitsland (Turniersport, 0,10, Interstallion, 2004b). De erfelijkheidsgraden voor ABP in Duitsland en Ranking in Frankrijk liggen echter hoger (0,18 en 0,16 respectievelijk, Interstallion, 2004b en 2003b).
-
De erfelijkheidsgraad voor kenmerk Hoogteklasse, wat een maat is voor de hoogste proef die een paard ooit gelopen heeft, wordt geschat op 0,399. Dit kenmerk is vergelijkbaar met het Competitie-kenmerk in Nederland (Tabel 2), dat is opgebouwd als de wortel van een cumulatieve waarde die de hoogste proef die een paard ooit gelopen heeft, aanduidt. Hiervoor wordt de erfelijkheidsgraad geschat op 0,15. Het hoogteklassesysteem in Nederland is wel uitgebreider dan het onze en is de enige bron van informatie over sportprestaties, hetgeen bij ons niet het geval is.
-
De h², geschat voor LRV en KBRSF, is een erfelijkheidsgraad voor een individuele prestatie. Als we, aan de hand van de formules in hoofdstuk 2.3, deze zouden omrekenen naar een erfelijkheidsgraad voor een som of een gemiddelde van prestaties zou deze hoger moeten liggen en van dezelfde grootteorde moeten zijn als de erfelijkheidsgraad voor HK (wat een soort cumulatief kenmerk is). Bij een gemiddelde van 15 prestaties per paard is de erfelijkheidsgraad 0,319 en 0,318 voor LRV en KBRSF respectievelijk. Deze waardes zijn inderdaad van dezelfde grootteorde als deze voor HK.
Als we kijken naar de genetische correlaties tussen de verschillende kenmerken merken we volgende zaken op: -
De genetische correlatie tussen de kenmerken LRV en KBRSF in model 3 (LRV + KBRSF) is 0,812. Deze waarde ligt hoger dan de waarde die momenteel aangenomen wordt in de GSI-schatting (0,63). Ook in model 14, waarbij de 3 kenmerken worden bekeken, is er een hogere genetische correlatie. Dit betekent dat in ons onderzoek er genetisch gezien minder verschil is tussen paarden die
56
goed presteren op LRV en KBRSF wedstrijden, dan momenteel wordt aangenomen voor de GSI schatting. -
De genetische correlatie tussen LRV en Hoogteklasse ligt hoger dan die tussen KBRSF en Hoogteklasse (0,795 tov 0,545 en 0,779 tov 0,600 in de vergelijkbare modellen). Dit kan ondermeer verklaard worden door de manier waarop het kenmerk Hoogteklasse is opgebouwd (zie Tabel 11). Hierbij worden alle KBRSFwedstrijden samengenomen in slechts 1 klasse terwijl de LRV-data werden opgesplitst in meerdere hoogteklasses. Meer informatie over de hoogte van de KBRSF-wedstrijden in de data, zodat ook deze prestaties verder kunnen opgesplitst worden, kan dit misschien oplossen.
Als we vervolgens naar de vergelijking tussen de EBV’s van de analyses met en zonder Hoogteklasse kijken zien we een hoge correlatie. Toch zien we een duidelijk verschillende top-100 van de hengsten. -
Vooral voor de top-100 van alle hengsten, ongeacht hun aantal nakomelingen of de betrouwbaarheid van hun GSI-waarde, is er een verschillende top-100. Sommige hengsten worden opgewaardeerd door het kenmerk Hoogteklasse toe te voegen, terwijl andere juist een lagere ranking krijgen (bv van niet in de top100 naar plaats 17 of van plaats 12 naar 36).
-
Voor de hengsten met een betrouwbaarheid van 0,75 in de GSI-schatting is er een minder verschillende top-100. Dit is waarschijnlijk het gevolg van het feit dat er een grotere hoeveelheid informatie aanwezig is voor deze hengsten en er dus een betere schatting kan gebeuren.
Aangezien we werken met additieve modellen duidt een lage schatting van de vaste effecten op een positieve invloed van het additief genetisch effect (en dus de genetische aanleg van het paard). Immers,
Dus voor eenzelfde prestatie, maar een lagere schatting voor leeftijd, geboortejaar, geslacht, permanent milieu en residueel effect is er een hoger additief genetisch effect nodig (=hogere fokwaarde). -
Het effect geboortejaar vertoont een dalende trend. Hieruit, samen met het feit dat de BLUPs gemiddeld stijgen doorheen de geboortejaren, concluderen we dat
57
er een genetische progressie doorheen de geboortejaren optreedt. Met andere woorden, er wordt genetische vooruitgang geboekt in de BWP-populatie. -
Mannelijke paarden zijn genetisch gezien beter dan vrouwelijke voor de wedstrijdsport. Dit komt overeen met wat in andere onderzoeken (Koenen en Aldridge, 2002) gevonden wordt. Een opsplitsing in 3 ‘geslachten’, waarbij hengsten en ruinen apart worden genomen zou nog beter zijn (Reinhardt, 1997), aangezien er duidelijke verschillen zijn in groei en gedrag tussen hengsten en ruinen. Deze informatie was echter voor de meeste paarden niet beschikbaar in de datasets.
7.3 Genetische analyse met MTGSAM 7.3.1 Threshold-model met 1 kenmerk De erfelijkheidsgraden geschat voor het kenmerk Internationaal liggen tussen 0,707 en 0,729. Dit betekent dus dat het feit dat een paard al of niet internationaal presteert meer dan 70% afhankelijk is van z’n genetische achtergrond. Alhoewel we wel een duidelijke genetische factor hadden verwacht lijkt deze waarde ons toch te hoog te zijn. Als we naar de waarden van de Markov Chains kijken (500 000 rondjes), blijkt dat deze niet echt gestabiliseerd zijn rond een bepaalde waarde (Figuur 11). Hierdoor kunnen we moeilijk conclusies trekken uit de verkregen variantiecomponenten.
Figuur 11: Markov Chain van variantiecomponenten voor model 1.1
58
7.3.2 Meer-kenmerken-model met threshold Er is duidelijk iets misgelopen bij de analyses van model 2. De bekomen erfelijkheidsgraden en correlaties blijken niet zinvol te zijn. Bij verder nazicht van de Markov Chains blijkt dat deze ook hier in geen enkele analyse gestabiliseerd zijn, maar steeds blijven stijgen. Deze analyses zijn meerdere keren herhaald waarbij de Markov Chain nooit stabiliseert. Een mogelijke oplossing zou zijn om langere Markov Chains te analyseren, maar hiervoor is zeer veel rekenruimte en rekentijd nodig (voor een ketting van 500 000 rondes zouden de analyses zo’n 30 dagen duren).
59
8. BESLUIT Uit de resultaten bekomen met VCE kunnen we volgende besluiten trekken: -
Voor de kenmerken LRV en KBRSF vinden we erfelijkheidsgraden variërend tussen 0,055-0,077 en 0,082-0,090 respectievelijk. Deze zijn beide lager dan de waarden die nu gebruikt worden in de berekening van de GSI en die enkele jaren geleden geschat zijn (0,11 en 0,10 voor LRV en KBRSF respectievelijk). De genetische correlatie tussen beide kenmerken varieert tussen 0,812 en 0,876. Deze waarde ligt hoger dan diegene die wordt aangenomen voor de GSIberekening (0,65). We raden dus aan om voor de berekening van de GSI de erfelijkheidsgraden en genetische correlaties aan te passen.
-
Er wordt voor beide kenmerken een duidelijk permanent milieu-effect waargenomen. Een wedstrijdeffect wordt niet waargenomen.
-
Voor het kenmerk HoogteKlasse, wat een maat is voor de zwaarste proef die een paard ooit gelopen heeft, vinden we een erfelijkheidsgraad van 0,399. Deze waarde ligt hoger dan de waarde die in Nederland wordt bekomen voor een gelijkaardig, doch uitgebreider kenmerk (0,15). Dit kenmerk heeft echter meer internationale data nodig om de werkelijke hoogste klasse van elk paard in de dataset te kunnen bepalen.
-
De genetische correlatie tussen LRV en KBRSF enerzijds en HoogteKlasse anderzijds is sterk positief, gaande van 0,779 - 0,795 voor LRV en 0,545 - 0,600 voor KBRSF. Een vergelijk met literatuur is niet mogelijk aangezien dit de eerste keer is dat dit onderzocht wordt.
-
Uit de resultaten voor het vast effect geboortejaar en een vergelijk van de gemiddelde fokwaarde over de geboortejaren kunnen we concluderen dat er genetische vooruitgang wordt geboekt in de BWP populatie.
-
Als we de beste 100 hengsten van beide modellen bekijken (al dan niet met HK), zien we toch een duidelijke invloed van het kenmerk HoogteKlasse.
Uit de resultaten bekomen met MTGSAM concluderen we volgende zaken:
- Het al of niet internationaal presteren van een paard blijkt een sterke genetische basis te hebben. Toch moeten we ook hier opmerken dat er meer data moet verzameld worden van internationale prestaties opdat de schattingen beter zou 60
kunnen gebeuren. Van te veel paarden is er niet alle informatie qua internationale sportprestaties aanwezig.
- Een model waarbij het kenmerk ‘al of niet internationaal gepresteerd’ wordt meegenomen kan een verbetering zijn voor het huidige model. Hiervoor is echter andere software nodig (MTGSAM) wat de analyses ingewikkelder en tijdsintensiever maakt (voor een voldoende uitgebreide analyse zouden we 30 dagen nodig hebben op de VSC-cluster).
Als bijkomend en algemeen besluit merken we nog op dat er een nood is aan meer data over internationale prestaties. Hoe meer data over de paarden, hoe beter en correcter de fokwaardeschattingen kunnen gedaan worden. Met het werk van Huub Van Aert is er een goede start genomen, doch, doordat dit ons een taak lijkt waarvoor een duidelijk en eenduidig systeem nodig is, zouden we aanraden dat het stamboek deze uitgebreide taak op zich neemt en dit niet stoelt op vrijwilligerswerk.
61
Referenties Aldridge, L.I., Kelleher, D.L., Reilly, M. and Brophy, M. (2000) Estimation of the genetic correlation between performances at different levels of show jumping competition in Ireland. Journal of Animal Breeding Genetics 117, 65-72. Arnason, T. (1999) Genetic evaluation of Swedish standard-bred trotters for racing performance traits and racing status. Journal of Animal Breeding Genetics 116, 387-398. Bagnato, A., Lohuis, M. (1998) What have we learned from the TEAM Program? Holstein Journal. Bruns, E., Schober, M., Fredricson, I. (2001) A cross-country evaluation of testing methods and data availability/suitability. Proceedings of the 52nd Annual Meeting of the EAAP, Budapest, Hungary, Book of Abstracts. Burnside, E.B., Tempelman, R.J. (1989) Is nicking important in mating dairy cattle? Holstein Journal. August, 1989. Clutton-Brock, J. (1999) A natural history of domesticated mammals. Cambridge: Cambridge University Press. Deutsche Reiterliche Vereinigung E.V. (1998) Jahrbuch Zucht 1998, Band 2, Leistungen und Daten der deutschen Pferdezucht. Schnell Buch & Druck, Warendorf. 1233p. Dubois, C., Manfredi, E., Ricard, A. (2008) Optimization of breeding schemes for sport horses. Livestock Science 118, 99-112. European Horse Network (2010)Key Figures English [online]. Beschikbaar op http://www.europeanhorsenetwork.eu/uploads/PDF/Key%20Figures%20english.pdf. Groeneveld, E. (1998) VCE4 User’s Guide and ReferenceManual Version 1.1. Federal Agricultural Research Center (FAL), Neustadt, Germany. Henderson, C.R., Quaas, R.L. (1976) Multiple trait evaluation using relatives records. Journal of Animal Science 43, 1188-1198. Het Belgisch Warmbloedpaard vzw (2009) Jaarverslag 2009. Huizinga, H.A., Van der Meij, G.J.W. (1989) Estimated parameters of performance in jumping and dressage competition of the Dutch warmblood horse. Livestock Production Science 21, 333-345.
XII
Interstallion (2003a) Studbook Français de cheval Selle Français [online]. Beschikbaar op http://www.biw.kuleuven.be/genlog/livgen/docs/SF.pdf . Interstallion (2003b) Swedish Warmblood Association [online]. Beschikbaar op http://www.biw.kuleuven.be/genlog/livgen/docs/SWB.pdf . Interstallion (2004a) Verband Hannoverscher Warmblüdzuchter E.V. [online]. Beschikbaar op http://www.biw.kuleuven.be/genlog/livgen/docs/HANN.pdf . Interstallion (2004b) Verband der züchter des Oldenburger pferdes E.V. [online]. Beschikbaar op http://www.biw.kuleuven.be/genlog/livgen/docs/OLDBG.pdf. Interstallion (2004c) Belgisch Warmbloedpaard E.V. [online]. Beschikbaar op http://www.biw.kuleuven.be/genlog/livgen/docs/BWP.pdf. Interstallion
(2005)
Irish
Sport
Horse
[online].
Beschikbaar
op
http://www.biw.kuleuven.be/genlog/livgen/docs/ISH.pdf. Interstallion (2006) Koninklijk Warmbloed Paardenstamboek Nederland [online]. Beschikbaar op http://www.biw.kuleuven.be/genlog/livgen/docs/KWPN.pdf. Interstallion (2007) Danish Warmblood Society [online]. http://www.biw.kuleuven.be/genlog/livgen/docs/DWB.pdf.
Beschikbaar
op
Interstallion (2008) Verband der züchter und freunde des Ostpreußischen warmblutpferdes Trakhener Abstammung [online]. Beschikbaar op http://www.biw.kuleuven.be/genlog/livgen/docs/TRAK.pdf. Janssens, S., Geysen, D., Vandepitte, W. (1999) The rider effect in the genetic evaluation of showjumping horses. 50th Annual meeting of the European Association for Animal Production, August 22th-26th 1999, Zurich, Switzerland, Commission on Horse Production, Session H6.4 Janssens, S., Rustin, M., Buys, N. (2007a) Genetische index voor springen – GSIn 2007 [online] Beschikbaar op http://www.biw.kuleuven.be/genlog/livgen/chgs_ebv /GenetischeIndex_Springen_2007.pdf. Janssens, S., Buys, N., Vandepitte, W. (2007b). Sport status and the genetic evaluation for show jumping in Belgian sport horses. Proceedings of the 58th Annual Meeting of the European Association for animal production. Annual Meeting of the European Association for animal production. Dublin, Ireland, 26-29 August 2007.
XIII
Koenen, E.P.C., Aldridge, L.I. (2002) Testing and genetic evalution of sport horses in an international perspective. Paper presented at 7th World Congress Applied to Livestock Production, Montpellier, August 2002. Koenen, E.P.C., Aldridge, L.I., Philipsson, J. (2004) An overview of breeding objective for warmblood sport horses. Livestock Production Science 88, 77-84. Les Haras nationaux (2010) Etalons de sport 2010. [online] Beschikbaar op http://www.haras-nationaux.fr/portail/particuliers/etalons/catalogues-etalons2010/document/telechargement/catalogue-pur-sang.html. Lister, A. M., Kadwell, M., Kaagan, L. M.,Jordan, W. C., Richards, M. B., Stanley, H.F. (1998) Ancient and modern DNA in a study of horse domestication. Ancient Biomolecules 2, 267–280. Mrode, R.A. (1996) Linear Models for the Prediction of Animal Breeding Values. CAB International, Wallingford. 187p. Reilly, M.P., Foran, M.K., Kelleher, D.L., Flanagan, M.J., Brophy, P.O. (1998) Estimation of genetic value of show jumping horses from the ranking of all perfomances in all competitions. Journal animal breeding and genetics 115, 1, 17-25.
Reinhardt, F., Schmutz, M. (1997) Estimation of Breeding Values for Sport Horses in Germany. 48th Annual meeting of the EAAP, Vienna, Austria, August 25th-28th, 1997. Remijnse, J. (2011) Studbook Rankings. Sport Horse Breeding 5.1, 5-10. Ricard, A., Bruns E., Cunningham, E.P. (2000) Genetics of Performance traits. The genetics of the horse. CAB International, Oxon, 411-438. Schaeffer, L.R., Wu, L. (2000) Reducing the effect of parent averages from animal solutions in mixed model equations. Journal of Animal Breeding Genetics 117, 361-374. Tavernier A., (1991). Genetic evaluation of horses based on ranks in competitions. Genetics Selection Evolution 23, 159-173.
Thorén Hellsten, E., Jorjani, H., Philipsson, J. (2005) Connectedness among five European sport horse populations-aspects on ID recording and exchange of pedigree data. 56th Annual Meeting of the EAAP, Uppsala, Sweden, June 5th-8th, 2005.
XIV
Thorén Hellsten, E., Viklund, A., Koenen, E.P.C., Ricard, A., Bruns, E., Philipsson, J. (2006) Review of genetic parameters estimated at stallion and young horse performance tests and their correlation with later results in dressage and showjumping competition. Livestock Science 103, 1-12. Van Tassel C.P., Van Vleck L.D. (1995) A manual for use of MTGSAM. A set of Fortran programs to apply Gibbs Sampling to animal models for variance component estimation. Department of Agriculture, Agricultural Research Service, Lincoln. 86p. van Veldhuizen, A.E. (1997) Breeding value estimation for riding horses in the Netherlands. 48th Annual Meeting of the European Association for Animal Production. Vienna, Austria, 25-28 August. Vilà, C., Leonard, J.A., Gotherstrom, A., Marklund, S., Sandberg, K., Liden, K., Wayne, R.K., Ellegren, H. (2001) Widespread origins of domestic horse lineages. Science 291, 474477. Walsh, B. (2004) Markov Chain Monte Carlo and Gibbs Sampling. Lecture Notes for EEB 581, version 26. WBFSH (2011) Jumping_Breed_Rankings_02 [online] Beschikbaar http://www.wbfsh.org/files/Jumping_Breed_Rankings_02.pdf (10/05/2011).
op
XV
Bijlagen Bijlage 1: Top 100 van de hengsten met betrouwbaarheid >0,75 in de traditionele fokwaardeschatting
Plaats 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23
Naam van de hengst HEARTBREAKER QUASIMODO VD MOLENDREEF ACTION - BREAKER TAUBER VAN HET KAPELHOF OMAR TOULON SALVADOR V 99.05612 OGANO SITTE (E.T.) SALAMON PHIN PHIN HAPPY WIND WANDOR VAN DE MISPELAERE JOYRIDER (EX JAMBO) AVONTUUR GOTHA BRECOURT CARTIER VD HEFFINCK OBOURG O32102 DARCO THUNDER VAN DE ZUUTHOEVE WUNDER BOY VAN DE ZUUTHOE TRIOMPHE DE MUZE LITTORIO UDARCIS
24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47
THINK TWICE D’ICI UNO DE LAUBRY PREMIUM DE LAUBRY WINNINGMOOD VAN DE ARENBE NIMBLE DES CINQ CHENES CAPPUCINO VAN BERKENBROEK RICHEBOURG TAMURA VAN'T HEIKE SIRE MAJOR DE LA COUR CONCRETO 210257998 HERCOS IDEM D'AZUR POLIDIKTUS V/D HELLE BILLY DU LYS KANNAN UPSILON VAN DE HEFFINCK FLAMENCO DESEMILLY LANCIER CHATMAN APOLLO VAN HET LINDEBOS IBIS DE MAI ALDO DES FONTENIS PLAYBOY NONSTOP
48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74
FILOU DES MESNILS BD MOZART DES HAYETTES VANCOUVER D AUVRAY UTABOR VAN T GESTELHOF QUICKFEUER VAN KOEKSHOF ORKAAN VIRUS DE LAUBRY EROS PLATIÈRE QUERLYBET HERO Q34591 KASHMIR VAN SCHUTTERSHOF APACHE DU FOREST ELTON CLOVIS DE GOUDAL X 48.72% NAGANO K.ZOSTARA 56 BALOUBET DU ROUET DUC DE LA LANDE II VIGARO UTRILLO VAN DE HEFFINCK HEUREKA DE LA LOGE LANDJUWEEL ST.HUBERT ERNEST IDAHO CONCORDE CUM LAUDE Z 4552999 RADJEX DC FIDJI DU FLEURY
75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100
BON AMI SKIPPY II FLORENTIJN O LIPTON 210187798 VERSACE VD RUITERSHOEVE VIGO D'ARSOUILLES LANDWIND FLAMINGO VAL THORENS VD PADENBORRE QUINTUS DALTON DES MALAIS GRANDEUR JUS DE POMME QUORUM DE LAUBRY OBELIX VERDI PRINCE DE REVEL EWOUT VAN DE KLEINE ROOST WINSCONSIN VD CRUYENVELDE CAESAR VAN DE HELLE BONNIE PRINCE CHARLIE LEADER M CORSAIRE DE VAUBAN VENE VIDI VICI VAN ORTI NABAB DE REVE TRESOR D'OPALINE CAPRICIEUX DES SIX CENSES
Bijlage 2: Top 100 van de hengsten met betrouwbaarheid >0,75 in de fokwaardeschatting met HoogteKlasse Plaats 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26
Naam van de hengst ACTION - BREAKER HEARTBREAKER QUASIMODO VD MOLENDREEF TAUBER VAN HET KAPELHOF TOULON JOYRIDER (EX JAMBO) UNO DE LAUBRY WUNDER BOY VAN DE ZUUTHOE GOTHA BRECOURT AVONTUUR WANDOR VAN DE MISPELAERE OMAR CONCRETO 210257998 CARTIER VD HEFFINCK OGANO SITTE (E.T.) PHIN PHIN DARCO SALAMON HAPPY WIND THUNDER VAN DE ZUUTHOEVE CHATMAN NIMBLE DES CINQ CHENES OBOURG O32102 SALVADOR V 99.05612 WINNINGMOOD VAN DE ARENBE TAMURA VAN'T HEIKE
27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53
TRIOMPHE DE MUZE PREMIUM DE LAUBRY HERCOS POLIDIKTUS V/D HELLE KANNAN LITTORIO IDEM D'AZUR BILLY DU LYS MOZART DES HAYETTES PLAYBOY RICHEBOURG UDARCIS ALDO DES FONTENIS APOLLO VAN HET LINDEBOS VANCOUVER D AUVRAY FLAMENCO DESEMILLY CAPPUCINO VAN BERKENBROEK BALOUBET DU ROUET NONSTOP THINK TWICE D'ICI INDIAN GOLD VAN CASTERSH VIRUS DE LAUBRY LANDJUWEEL ST.HUBERT ELTON SIRE MAJOR DE LA COUR FILOU DES MESNILS BD ORKAAN
54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77
DUC DE LA LANDE II IDAHO IBIS DE MAI VAL THORENS VD PADENBORRE QUICKFEUER VAN KOEKSHOF NAGANO UPSILON VAN DE HEFFINCK FAIRPLAY DU MANOIR VERSACE VD RUITERSHOEVE KASHMIR VAN SCHUTTERSHOF EDGAR VERT ET ROUGE APACHE DU FOREST CONCORDE UTRILLO VAN DE HEFFINCK QUERELLE K.ZOSTARA 56 ERNEST VIGO D'ARSOUILLES QUERLYBET HERO Q34591 EROS PLATIÈRE LANCIER SKIPPY II CLINTON
78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100
KARIOKA DEL FOLLEE LUCIFER LANDWIND BON AMI CLOVIS DE GOUDAL X 48.72% WARKANT VAN T GESTELHOF DALTON DES MALAIS UTABOR VAN T GESTELHOF JUS DE POMME LEADER M FIDJI DU FLEURY HEUREKA DE LA LOGE CUM LAUDE Z 4552999 DUBLIN TRESOR D'OPALINE CAESAR VAN DE HELLE QUORUM DE LAUBRY PARCIVAL ATILAS D'AUTAN EWOUT VAN DE KLEINE ROOST HAPPY EASTER DU REZIDAL QUINTUS CHURCHILL