PÁROSÍTÁS SZIMULÁCIÓJA NAGY POPULÁCIÓBAN Komlósi István DE ATC MTK, Állattenyésztés- és Takarmányozástani Tanszék, Debrecen Összefoglalás A szerző a szimulált tehénállományt és valós bikaállományt klaszteranalízissel csoportokra osztott, majd a párosítandó csoportokat korrektív párosítással jelölte ki. Ezeket a csoportokat lineáris programozással párosította, maximalizálva a szelekciós előrehaladást. Bevezetés Szimuláció során valós megfigyelésekből matematikailag megfogalmazzuk és felépítjük a valóságban is létező modellt, majd a modellen kísérletet hajtunk végre a jelenség teljesebb megértéséért (Csáki,1976). A sztohasztikus modellek a véletlen által befolyásolt folyamatok leírására alkalmazhatók, az eredményt a valószínűség befolyásolja. Ebben a körben legelterjedtebb a Monte-Carlo szimulációs módszer. Az állattartásban, nemesítésben a szimuláció ma néhány főbb kutatási területen került előtérbe. A determinisztikus modellek alkalmazása elsősorban az életfolyamatok, termelési folyamatok vizsgálatára jellemző. A sztochasztikus szimulációk alkalmasak a különböző tenyészértékbecslési eljárások összehasonlítására. Munoz-Serrano és mtsai (1992) az egyedek, valamint az egyes állományok közötti genetikai kapcsolat szorosságának hatását vizsgálták a BLUP (Legjobb Lineáris Hibamentes Becslés) módszerrel végzett becslés megbízhatóságára. Mallinckrodt és mtsai (1992) az adatfelvételezéskor előforduló hibák hatását elemezték a tenyészértékbecslés megbízhatóságára. A szelekció hosszú távú hatásának vizsgálata is költségtakarékosabb szimulációval, mint valós kísérletekkel (Boer és mtsai, 1994). Értékeléskor azonban csak óvatos következtetések vonhatók le. Gazdasági állatpopulációban több értékmérő tulajdonság fejlesztése a cél. A populáció méretével arányosan, a tulajdonságok közötti korrelációtól függően, nő viszont az egyes tulajdonságszint kombinációk száma, ami viszont áttekinthetetlenné teheti párosítási terv készítését. A populáció méretének növekedésével megnő a számítandó változók száma, a lineáris programozási algoritmus lelassul, vagy alkalmazása eredménytelen. Ennek elkerülésére a populáció részpopulációkra való osztása jelentheti az egyik megoldást.
Anyag és módszer Bognár (1999) magyar holstein-fríz bikapopulációra számított genetikai korrelációja alapján a Cholesky dekompozíció módszerével létrehoztam egy 300-as tejelő szarvasmarha állomány tejfehérje, tejzsír, tőgykompozit és lábkompozit tenyészértékét. Négy tulajdonságra a Cholesky dekompozíció a következő: L=
L11 L21 L31 L41
0 0 L22 0 L32 L33 L42 L43
0 0 0 L44
amelyben L a tulajdonság genetikai szórása, és L21 a második tulajdonság szórásának és az első két tulajdonság genetikai korrelációjának szorzata. Az 1999/2 Tenyészbika Teljesítmény Összesítő HGI pontszám szerinti első 60 bikáját választottam ki lehetséges termékenyítő bikának. A tehénállomány 300 egyede 4 tulajdonságának tenyészértékével alkotta a tehéncsoportot, a bikaállomány 60 egyede ugyanazon tulajdonságainak tenyészértéke alkotta a bikacsoportot. Mindkét csoport standardizált értékein klaszteranalízist végeztem, csoportonként nyolc klaszterrel. A klaszterek számának növelésével nő a tulajdonságkombinációk száma, mellyel a klaszteranalízis elveszti előnyét a klaszteranalízis nélkül végzett lineáris programozásban. Alacsony klaszterszám esetén viszont nem ismerhető fel az állományban ténylegesen jelen lévő tulajdonságkombináció. A klaszteranalízissel azonosított tehén és bika klasztereket (alcsoportokat) lineáris programozással párosítottam, maximalizálva az ivadékcsoport HGI pontszámát. Eredmények és megbeszélés Az 1. táblázat a tehéncsoport 8 klaszterének középértékeit tartalmazza. Az első klaszterbe azok a tehenek kerültek, melyek tenyészértéke minden tulajdonságban az átlaghoz képest 1 vagy 2 szórásegységgel kisebb, a minden tulajdonságban javításra szoruló tehenek. A 7. klaszterbe azok a tehenek kerültek, melyek minden tulajdonságukban átlag felettiek, s párosításhoz olyan bika, vagy bikacsoport ajánlható, mely elsősorban fehérjében és zsírban javít, például a 3. klaszter bikái (2. táblázat).
1. táblázat: A tehéncsoport klaszterközépértékei Tulajdonság/klaszter(1) Fehérje kg(2) Zsír kg(3) Tőgykompozit(4) Lábkompozit(5)
Fehérje kg Zsír kg Tőgykompozit Lábkompozit
1.klaszter(6)
2. klaszter
3. klaszter
4. klaszter
-2,1635 -1,7966 -1,1564 -1,1422
-0,5206 -0,8421 -1,7723 -0,4984
0,4446 0,5694 1,5937 -0,5166
-0,1396 -0,0710 -0,3684 -1,1562
5. klaszter
6. klaszter
7. klaszter
8. klaszter
-1,0127 -1,0896 0,1520 0,4032
-0,1015 -0,0514 -0,6728 0,6737
0,3950 0,3610 0,7734 1,0903
1,2070 1,0950 0,0532 -0,2771
Table 2. Cluster Centroids for DamsVariable(1), protein kg(2), fat kg(3), udder composite(4), fet and leg composite(5), cluster centroid(6) 2. táblázat: A bikacsoport klaszterközépértékei Tulajdonság/klaszter(1) 1.klaszter(6)
2. klaszter
3. klaszter
4. klaszter
Fehérje kg(2) Zsír kg(3) Tőgykompozit(4) Lábkompozit(5)
3,0332 3,1746 -0,6000 1,6154
2,1801 1,7385 -0,6649 -0,1447
0,7583 1,0280 1,4509 0,6154
0,2844 -0,0756 2,0256 1,3365
5. klaszter
6. klaszter
7. klaszter
8. klaszter
0,6416 0,7152 0,6245 1,7623
1,1848 1,7133 0,5303 -0,0278
1,2618 0,5480 0,3977 0,4006
1,1730 0,6047 1,4273 -0,8638
Fehérje kg Zsír kg Tőgykompozit Lábkompozit
Table 2: Cluster Centroids for Sires Variable(1), protein kg(2), fat kg(3), udder composite(4), fet and leg composite(5), cluster centroid(6)
3. táblázat: A párosításra kiválasztott második klaszter bikái A bika neve(1) 4. HECCELŐ STARBUCK 26. KÉNYÚR WINKEN 40. CHIFCHRIS 56. KUSZÓ BOVA GLOW
Fehérje tenyészérték(2)
Láb és HGI Tőgykompozit lábvég pontszám tenyészérték(4) tenyészérték (5) (5) 13 3,44 1,55 1079
Zsír kg tenyészérték(3)
19 19
5
2,13
1,45
902
12
9
3,20
0,66
849
14
13
1,94
1,07
802
Table 3: Bulls in the second cluster selected for mating Name of the sire(1), protein kg breeding value(2), fat kg breeding value(3), udder composite breeding value(4), fet and leg composite breeding value(5)
4. táblázat: A korrektív párosításra kiválasztott tehén és bikacsoport egyedi párosítása Tehén(1) 1. x 2. x 3. x 4. x 5. x 6. x 7. x 8. x 9. x 10. x
Bika (2) 1. 2. 1. 2. 2. 3. 3. 1. 2. 1.
Tehén 11. x 12. x 13. x 14. x 15. x 16. x 17. x 18. x 19. x 20. x
2. 2. 1. 2. 2. 3. 1. 1. 1. 1.
Bika Tehén 21 x 1 22 x 2 23 x
Table 4: Mating of the selected cows and sires Cow(1), sire(2)
Bika 2
A párosítási terv bemutatására kiválasztottam a 2. klasztert, mely 23 tehenet foglalt magába. Ezeket a teheneket elsősorban tőgykompozit tulajdonságukban szükséges javítani. A tőgykompozitot legnagyobb mértékben a 4. klaszter bikái javítják. Ez jelen esetben 4 bikát foglal magába. Az adott tenyészérték közlési időszakban ez a 3. táblázatban levő egyedeket jelentette. Láthatjuk, hogy ezen bikák tőgykompozit tenyészértéke kiemelkedő. Lineáris programozással a 23 tehenet és a négy bikát párosítottam, melynek eredményét a 4. táblázat tartalmazza. Következtetés Nagy populáció klaszteranalízissel részpopulációkra osztható, s az egyes tulajdonságokat javítandó korrektív párosítás alapján a tenyésztő által kiválasztott tehén és bikapopuláció lineáris programozással a szelekciós előrehaladás maximalizálásával egymással párosítható. Irodalom Boer, I.J.M.-Arendonk, J.A.M. (1994): Additive response to selection adjusted for effects of inbreeding in a closed dairy cattle nucleus assuming a large number of gametes per female. Animal Production. 58. 173-180. Bognár, L. (1999): Holstein Globál Index. Előterjesztés. Holstein-fríz Tenyésztők Egyesülete. Budapest. Csáki, Cs. (1976): A szimuláció alkalmazása a mezőgazdaságban. Mezőgazdasági Kiadó, Budapest. 170. Mallinckrodt, C.H.-Golden, B.L.-Bourdon, R.M. (1992): The impact of data problems on the reliability of expected progeny differences. Proceedings, Western Section, American Society of Animal Science, July 8-10. Vol. 43. 135-138. Munoz-Serrano, A.-Sanchez-Palm, A.-Serradilla, J.M. (1992): Simulation analysis of the sensibility of BLUP solutions to different data structures in selection schemes for goats. 43rd Annual meeting of the EAAP. September 14-17, Madrid. S.IV.11.
Summary The author applied stochastic simulation to produce a cow population and on a real sire dataset. Sire and cow clusters were then paired and linear programming was applied on these subsets to maximize genetic response. Cluster pairing let the breeders to interfere into the programming process and linear programming on the clusters shortens computation time.