Gén térképezés, génizolálás
Dr. Karsai Ildikó, tudományos tanácsadó
[email protected]
Karsai Ildikó
Gén azonosítás tulajdonságok fenotípusos megnyilvánulásában meghatározó szerepet játszó genetikai komponensek, szabályozó mechanizmusok, biokémiai folyamatok megértése diagnosztikai markerek, módszerek kidolgozása természetes variabilitás tesztelése vad és termesztett fajtákon belül, valamint a rokon fajok csoportjában hasznos gének, gén allélek beépítése a nemesítési alapanyagokba marker szelekcióval egybekötött hagyományos keresztezések során gén transzformációs technikák alkalmazásával
Gén azonosítás főbb módszerei marker kapcsoltsági térképek és pozicionális klónozás Két szülős térképező populációk Széles genetikai bázist képviselő fajtakör jelölt gén megközelítés Genom pozíció függő stratégiák Összehasonlító genomikai stratégiák mesterséges genetikai variáció (indukált mutációs populációk) génfunkció és fenotípus közti kapcsolat Gén expressziós mintázatok elemzése
Gén térképezés főbb módszerei
• Két szülős térképező populációk • marker kapcsoltsági térképek, QTL elemzés
• Széles genetikai bázist képviselő fajtakör • LD térképezés, teljes genomot lefedő asszociációs elemzések
Két szülős populációk marker kapcsoltsági térképei Térképező populáció Molekuláris marker technikák Számítógépes térképező programok
Marker kapcsoltsági térképek Térképező populáció Keresztezési partnerek kiválasztása: távoli vagy speciális Populáció típusa: hasadó F2 populáció homozigóta populációk (DH, RIL, SSD) egyéb speciális populációk (NIL, egy kromoszómára rekombináns stb.)
Populáció mérete DNS izolálás
markeres vizsgálatok
Genom szintű különbségek
Marker kapcsoltsági térképek Molekuláris marker technikák RFLP PCR alapú markerek ismeretlen kromoszómális elhelyezkedésű: RAPD, AFLP ismert kromoszómális elhelyezkedésű: SSR, STS funkcionális markerek: EST, SNP, Tillling HTP marker technikák (Illumina platform, DArT)
Új generációs szekvenálás
Marker kapcsoltsági térképek Számítógépes térképező programok marker térkép készítés (MAPMAKER, GMENDEL, JOINMAP, GenStat) QTL elemző programok (MAPMAKER, WINQTL, JOINMAP, GenStat) Egyszerű intervallum térképezés (SIM) Összetett intervallum térképezés (CIM) Egy tulajdonság + egy környezet több tulajdonság + több környezet Tulajdonság komponens kölcsönhatás elemzés, QTL x környezet kölcsönhatás elemzés Fenotípusos vizsgálatok ismételhetőség, pontosság Fenomika
Marker kapcsoltsági térképek alkalmazási területei Genomot teljesen lefedő molekuláris marker térkép készítése Összehasonlító térképezés rokon fajok között, fajon belül különböző populációk között Genom szerveződés makro és mikro kolinearitás kromoszóma átrendeződések intergénikus és génklaszter szakaszok azonosítása
Marker kapcsoltsági térképek alkalmazási területei Gének azonosítása, fenotípusos hatásuk vizsgálata finom térképezés, pozicionális klónozás modell növény ismert génszekvenciája alapján Egyszerű és összetett tulajdonságok genetikai elemzése lókuszok számának és helyének azonosítása Adott lókusz szerepének elemzése; QTL dinamika, tulajdonság komponensek vizsgálata Allél gyakoriságok vizsgálata szélesebb genetikai bázison Marker szelekció
DNS markerek, mint ujjlenyomatok Markerek (M1………)
N1 N2 M1
N5
N10
N15
M2 M3
„A” „B” szülő szülő
„A” x „B” keresztezés utódpopulációjának növényegyedei (N1………)
QTL elemzés marker kapcsoltsági térkép alkalmazásával Hasadó populáció Fenotípusos jellemzés
Genotípusos jellemzés
szülők
AAABBAB ABBABABB
Adat mátrix *mst1011 *mst1012 *mst102 *wg4642 *bcd1752 *wg541 *v8h49 *uv16h49 *v16h49 *uv24h49
ABAAABBBABBBABBBBBABBABBA ABBAABAABBAABBBBBBABBBBBB AAABBBAABBABBBABBBBABBABB ABBAABAABBAABBBBBBABBBABB ABBAAABBBA---ABBABBBABABAA AA-BBBA---ABBABBABBABABAABA 164.5 157.5 149.5 146.5 154 171 250 43 128.5 138 159 163.5 143.5 49 51 38 40 57.5 60.5 60.5 69.5 38 44 63 38 62.5 27 97.5 111.5 123.5 125 103.5 29.5 31.5
BBBAA
AB
QTL elemzés marker kapcsoltsági térkép alkalmazásával Marker kapcsoltsági térkép elkészítése 8> m ake chrom osom e chrom 2h chrom 4h chrom 5h 16> s scih grnom2h chrom osom es adefined: chrom 2h frame wochrom rk: 4h chrom 5h
H v M 3 61 8 > - t ah nr ce he opr ol ionctu s o n c h r o m 2 h . . . c a n n o t r e - a s s i g n B m a g 1L2 i5n k- aagnec G h or ro luopc su sa to m n ci nh rLo O mD 2 h 3. ...0c 0a ,n m n oat xr eD- ai sstsai gn nc e 3 7 . 2 9> seq hvm 36 bm ag125 B m a c 3T0 r i p- Placing ca u: sL oOn Dc h3 r. o0 m h .a. .xc -aDn3.00... ni sot t 3r7e .-2a ,s #s iLg inn k a g e s 2 lae nt cchr oi trat e lroilog-likelihood 0threshold , 4M M a r k e r s D i s t a n c e sequenceH#1= hvm 36 bm ag125 Start: 9 5 1 11 12 c ot ino nc 'h ri so m o n4.h . . . c a n n o t r e - a s s i g n v M 6 7' t r i p- lNpt-2: ae necrhroo rr 9l do5ce ut1 es(10) 11 12 t ai nn gB .h.3 .o5 2 r8 4 placements d poM eremaining t 5s hi n nn ko ta gr ee - ag sr soi ug p B m a g 3c3o7u n7 -No cG l6o cl iun sk oe2 n0. ctfor . . . c2 a lnimarkers ns A 6rhirc unique 6lm l o g l i k e l i h o o 10> anchor A Bchrom G 7 0 22h - a n c h o r l o c u s o n c h r o m 5 h . . . c a n n o t r e - a s s i g n d d i f f e r e n c e s u- 5 naMap: rd k et o r s2h PgBna1chrom 2 2.24hcM H vM 36 A- Banchor on G 8 c olocus st Markers sO im e6 c h r o Distance m a t L O D 2 0 .1 a - b - c b - a - c a - c - b 1: A B G 8 A B C 311 O P H 121 0 .0 0 - 0 .2 0 0 .0 0 C 3 1 1 2locus a s s i g n e d t o c h r o m 2 h a t L O D 2 4 . 4 Bm ag125A -Banchor on chrom 2h 9 Bmc222a 21.5 cM 4 H v M 3 6 3 . 1 c M : A B G 8 A B C 311 H vM 36 0 .0 0 - 0 .2 0 - 0 .6 1 8.2 O PeHchrom 1 2 1 3 2h sB s5i G g nOPB162 eA d B t oH cvM h1r 136 o mO 2PhBcM a1t 6L2 O D 2 8 . 6 0 . 0 0 - 0 . 1 9 - 1 . 9 2 chrom osom anchor(s): Bm ag125 :- aA 8 C 3 1 H1 cM 2 .A6.3 02Bc M O P B 1 6 2 4 :-3aAsO sBP i gG nABG8 dA tBo Cc 3h 1r o1010.6 m hG a t L O D 2 3 .8 0 .0 0 - 0 .1 8 - 2 .9 5 8e1 10 OPP102b cM 3 1 8 A B G 3 1 8 5 :2 - A a sA g3 n1 e Ad Bt oC c3h1r1o m hG BsBiC G 81 A12 Bc 11 OPA192 10.6 cMa3t 5 L8 O D 2 2 . 9 0 . 0 0 - 0 . 0 9 - 1 9 . 2 1 2 . M 12 OPQ10 ---------A 2 B hG a4t 5L9 O D 1 3 . 8 0 . 0 0 - 0 . 0 8 - 1 9 . 7 7 A B G 3 5 8 6 :- A a sBs iGg n8 e Ad Bt oC c3h1r1o m 57.1 cM 7 : A B G 8 A B C 3 1 1 B m c 2a t2 2L6aOmarkers . 0 0 - 0 . 0 9 - 1 8-98.26 .7 8 0.m62chM A B G 459 1 - a sAsBiG g8n e d t o c h 1 ro D 2 4 . 4 0log-likelihood= 8 : Markers A B G 8placed A B C relative 3 1 1 O Pto P 1above 0 2 b map: 9: A B G 8 A A 1 911 2 9 B C 53 1 1 1O P10 12 1 0 : A B G 8 :-21-:--8-:-11-:--6-:-11-: A B C 311 O P Q 10
0 .0 0 - 0 .1 6 - 0 .1 1
10 OPP102b 6.3 cM 11 O A1.*.:.**.:....:....:....:....:... 92 10.6 cM 8P2 7 2 .*.:.**.:....:....:....:....:... 12 O Q1...:.**.:..*.:....:....:....:... 0 ---------6P2 4 2 ...:..*.:.**.:....:....:....:... 3 2 ...:....:.**.:..*.:....:....:... 55.6 cM 9 markers
0 .0 0 - 5 .4 4 0 .0 0 - 6 .4 1 0 .0 0 - 1 6 .9 8
2 2 ...:....:.**.:..*.:....:....:... -----------------------------------------------------------------Placing at log-likelihood threshold 2.00... Start: 9 5 1 10 11 12 Npt-4: 9 5 (2) 1 10 11 12 Npt-4: 9 5 (4) 2 1 10 11 12 Npt-4: 9 5 4 (3) 2 1 10 11 12
log-likelihood= -101.39
DK1DK2DK3DK4DK7DK8DK9 DK10 DK11 DK12 DK13 DK14 DK15 DK16 DK17 DK18 DK19 DK20 DK21 DK22 DK24 DK25 DK26 DK27 DK28 DK29 DK30 DK31 DK32 DK35 DK36 DK37 DK38 DK39 *mst102 A B A A A B B B A A B B A B B B A B B B A B B A B B A A B A A B A B *Bmac144d A B A A A B B B A B B A B B B B B B B B A B B A B B A A B A A B A B TCGA96 A B A A A B B B A B B A B B B A B B B B A B B A B B A A B A A B A B *MWG938 A B A A B B B B A B B A B B B A B B B B A B B A B B A A B A A B A B AGAT166/162 A B A A B B B B A B B A B B B A B B B B A B B A B B A A B A A B A B GCTC58 A B A A B B B B A B B A B B B A B A B B A B B A B B A A B A B B B B OPK16 A B A A B B B B A B B A B B B A B A B B A B B A B B A A B A B B B B *abc156.1 A B A A B B B B A B B A B B B A B A B B A B B A B B A A B A B B B B *BMAC213 A B A A B B B B A B B A B B B A B A B B A B B A B B A A B A B B B B GAAT76 A B A A B B B B A B B A B B B A B A B B A B B A B B A A B A B A B B *OPE171 A B A A B B B B A B B - B B B A B A B B A B B A B B B A B A B A B B GAAT414 A B A B B B B B A B B A B B B A B A B B A B B A B B B A B A B A B A *OPO18 A B A B B B B B A B B A B B B A B A B B A B B A B B B A B A B A B A *OPB16-1 A B A B B B B B A A B A B B B A B A A A A B B A B B B A B A B A B A *Bmag211 A B A B B B B B B A B A B B B A B A A A A B B A B B B A B A B A B A *OPS16 A B A B B B B B B A B A B B B A B A A A A B B A B B A A B A B A B A GCGA428 A B A B B B B B B A B A B B B A B A A A A B B A B B A A B A B A B A *Ebmac560a A B A B B B B B B A B A B B B A B A A A A B B A B B A A B A B A B A *OPB41 A B A B B B B B B A B A B B B A B A A A A B B A B B A A B A B A B A GAAT550 A B A B B B B B B A B A B B B A B A A A A B B A B B A A B A B A B A AGGT290 A B A B B B B B B A B A B B B B B A A A A B B A B B A A B A B A B A TCGA119 A B A B B B B B B A B A B B B B B A A A A B B A B B A A B A B A B A *OPT152 A B A B B B B B B A B A B B B B B A A A A B B A B B A A B A B A B A GAAT510 A B A B B B B B B A B A B B B B B A A B A B A A A A A B A A B B A A AGAT51 A B A B A A A B B A B A B B B B B B A B B B A A A A A B A A A B A B *Bmac144a A B A B A A A A B A B A B B B B B B A B B B A A A A A B A A A B A B GCGA269/270 A B A B A A A A B A B A B B B B B B A B B B A A A A A B A A A B A B *ABC152b A B A B A A A A B A B A B B B B B B A B B B A A A A A B A A A B A B *HvHVA1 A B B B A A A A B A B A B B B B B B A B B B B A A A A B A A A B B B *BCD265c A B B B A A A A B A B A B B B B B B A B B B B A A A A B A A A B B B GCGT132 A B B B A A A A B A B A B B B B B B B B B B B A A A A B A A A B B B *OPP142 A B B B A A A A B A B A B B B B B B B B B B B A A A A B A A A B B A
Dicktoo × Kompolti korai marker térkép (246 lókusz) 1H
2H
3H
4H 0 8
0 4 6 8 11 15 17 18 22 24 28 30 31 41 48 50 53 54 56 57 58 59 61 86 99 100 104 109 125 126 130 136 163
mst102 0 Bmac144d 1 TCGA96 18 MWG938 B1 25 AGAT166 28 GCTC58 29 OPK16 31 abc156.1 37 Bmac213 B3 39 GAAT76 40 OPE171 41 GAAT414 42 OPO18 51 OPB161 56 Bmag211 B7 57 OPS16 58 GCGA428 88 Ebmac560a 101 OPB041 102 GAAT550 108 AGGT290 109 TCGA119 110 OPT152 113 GAAT510 115 AGAT51 116 Bmac144a B9126 GCGA269 127 ABC152bB10128 HvHVA1 B12142 BCD265c B13 GCGT132 OPP142 OPX031
0 Bmac222a 6 ABG459 B5 11 ABG318 B3 14 HvM36 16 ABC311 17 GAGT494 ABG8 B3 19 22 GCGA52 50 GAGA72 55 TCTC212 59 GAAT338 60 OPA192 72 AGAT347 73 AGAT248 75 GAGA573 76 GAGT62 87 GCGT250 92 abg459a Bmac216 B7 99 102 Bmac144b 103 bcd175b 104 Bmag125 106 GAGT670 108 TCGT280 132 TCAT572 152 TCTC631 Bmag003cB7 155 159 GCAT142 172 OPG07 175 179 186 189 194 195 197 204 205 209 210 211 212 220
OPD07 9 OPS141 16 OPO072 21 GATC355 22 GCGA288 24 TCAT132 29 GAGA642 32 TCTC626 33 AGTC201 39 GAAT308 40 GCAT191 41 OPI041 42 AGAT498 59 OPS202 62 Bmag384b 64 TCTC548 65 GCGT270 72 OPK111 HvM60 B8 79 84 AGAT175 85 AGAT598 86 GAAT182 AGGT472 92 GCGT164 93 OPH15 ABG4 B15100 TCAT477 Bmag13 B14 GCAT104 TCTC216 OPS192 Hvm62 B16 GAGA650 OPH122 Hvm70 B18 GCGT68 TCAT228 GCAT227 GCGA205 TCGA205 ABC174 B19 AGTC335 GAAT147
5H HvPhyA GCAT76 0 TCAT300 7 TCAT77 8 AGAT142 9 HvPhyB B4 13 CAB 18 Bmac30 B5 21 AGAT312 24 Bmag353 B6 27 Bmag173a 32 Bmac310 33 OPJ15 35 TCAT452 37 OPU162 38 AGAT46 40 ABG366 B10 41 abg54 AGAT148 47 GCGT161 51 GCAT312 54 AGAT406 58 HvM67 B12 71 OPS031 88 90 HvSnf2 92 AGGT650 95 Hdamyb B14 96 101 112 114
VRN-H2
117 137 142 156 161
6H 0 2 9 13 23 26 51 62 64 65 68 69
OPT151 GCAT50 Bmag136b GAGA556 Bmag337 B4 GATC565 AGTC122 AGGA575 GAGA220 AGAT42 GAGA58 Bmag113 B5 71 abc156.5 AGAT676 72 TCTC502 75 Bmag223 B7 78 mR 80 GATC106 81 abg459b 84 OPH123 87 GCGT406 89 GCGA434 90 TCAT332 93 abc306d 95 OPK112 97 TCTC510 99 ABG702 B11 102 AGTC50 107 Bmag381b 108 gms061 B13 111 HvPhyC 136 abc155 143 TCGT372 149 GCAT406 150 ABC310 B18151
VRN-H1
7H BMAC316 B1 AGGT256 0 TCTC386 9 AGAT658 11 ABC152c B3 12 Bmag500 B4 13 Bmag21a 14 GAGA626 15 GCGT262 16 Bmag219 B8 25 OPH081 28 Bmag009 B10 30 HvCry1a 32 HvCry2 33 GCGA48 36 AGGA62 42 OPI042 48 OPA203 50 abc306b 52 abc306c 59 abc303 60 AGGT336 62 Bmag003b 65 ebmac806 B12 73 TCTC576 75 OPT14 78 GCTC258 81 GAGA170 86 AGGT484 87 TCAT216 88 GCAT212 90 AGAT298 107 wg464a 118 GAGA622 123 GAGA596 127 TCTC528 143 TCAT232 145 GCGT382 147 157 172
Hvm4 B3 Bmac222b GCAT188 TCAT516 TCTC250 abg460 TCTC623 abc152a GCGT69 AGTC400 TCAT123 Bmag21c GCAT299 Ebmac603 B6 TCGT144 TCGA273
VRN-H3
KSuA1a B5 abc306a TCGT153 TCGT64 AGGT64 OPE172 Bmac187 B9 TCGT143 Bmag120 B12 OPR152 OPS032 mst101b Bmag369 B10 AGAT87 AGAT223 GCGT206 OPQ17 TCTC71 OPB031 AGGT86 GCTC158 GAAT418
Egyedi térképek – fajra jellemző konszenzus térkép
Stein et al. TAG(2007)114:823
Marker kapcsoltsági térkép – kromoszóma fizikai térképe P92201D5-2/P91193D1-10
0.3 0.7 16.4 2.9 10.5 8.0 34.6 0.7 14.1 22.4 0.5 2.2 4.1 3.8 0.2 1.4 1.2 0.5 0.3 0.2 0.3 2.6 3.3 7.6 7.3 4.0 2.0 3.1 2.1 1.3 12.1 1.9 10.4 5.4 11.2 15.0
wPt-5195* wPt-0643 wPt-6575 wPt-5587 wPt-3459 wPt-5934 wPt-6627* wPt-4916* wPt-0100* wPt-8235* gwm614b* wPt-8404* wPt-1041* wmc25* gwm319* wPt-3569* wPt-1650* wPt-1068* wPt-7937* wPt-0775* wPt-8294* wPt-0395* wPt-1494* wPt-2249* wPt-2907* wPt-0434* wPt-9131* barc183* wPt-0615* wPt-1127* wPt-5440* wPt-6144* wPt-0079* gwm630* wPt-9350* cfd56* AF112966* wPt-7625* gwm47* wmc477* gwm120* wPt-3109* wPt-9336* wPt-7350* wPt-4701 wPt-2266* gwm526c* barc1147* barc92
Ajana/WAWHT2074
14.6 19.6 9.6 4.3 2.9 6.2 5.6 0.6 8.9 0.7 0.6 0.7 0.6 0.6 21.1 26.6 12.2 2.5 7.7 12.0 10.1 0.6 0.6 4.6 0.6 6.1 8.2 11.0 7.5 7.2 2.3 1.2 7.6 22.0 28.3 20.9
gwm614 wPt-1663 wPt-5567 wPt-4527 cfd238 wmc25a barc318 wPt-9423 wPt-9402 wPt-1489 wPt-8072 wPt-4301 wPt-0462 wPt-3561 wPt-6932 wPt-3983 wPt-5707 wPt-2314 wPt-6199 wPt-8583 wPt-6477 wPt-4125 wPt-9644 wPt-7757 wPt-0408 wPt-0615 wPt-5672 wPt-8492 barc183b* gwm46 barc7 barc55† wmc474 cfa2278 wPt-0335 wPt-0709 wPt-7750 gwm374 gwm319 gwm630b gwm271 gdm14a gwm120a gwm191a* wPt-1140* wPt-7200 wPt-3132 wPt-0950 wPt-7404 wPt-5128* gwm120b† wPt-4199 gdm61*
Cadoux/Reeves
9.2 10.8 5.0 2.2 8.1 7.6 0.7 0.7 2.9 37.8 1.4
EGA Blanco/Millewa
wPt-4527 cfd238 wPt-8004 wPt-8326 wPt-9423 wPt-9402 wPt-1489 wPt-8072 wPt-5707 wPt-3983 wPt-4997 gwm429 barc13† wPt-6477 wPt-0615 wPt-7750 wPt-2430* wPt-8569*
0.9 3.2 1.0 0.4 0.5 3.8 3.4 0.4 1.5 2.3 6.0 21.7 9.9 12.5 10.3 2.3 12.9 10.4 8.2 5.0 11.2 3.3 3.2 2.4 1.0 0.5 2.4 0.4 0.5 4.1 7.7 1.9 1.8 14.9 2.1 2.8 19.1 1.4 8.0 1.4
wPt-6575* wPt-5587* wPt-3459* wPt-5934* wPt-6970* wPt-6627* wPt-5195* wPt-0643* wPt-6805* wPt-0100* wPt-8760* wPt-2410* wPt-3565* gwm614* wPt-6223* barc35* barc297a* wPt-2106* wPt-8004* wPt-8326* wmc154 wPt-5374 wPt-3561 wPt-5707 wPt-7757 wPt-5672 wPt-5556 wPt-4125 barc55 wPt-6278 barc1114 cfa2043b gwm120 wPt-4199* wPt-2430 wPt-8569 wPt-0094 wPt-7200 wPt-3132 wPt-8460 wPt-5680 wPt-5242 wPt-0694 stm509acag wPt-4701 wPt-7004 wPt-4210 wPt-0047 barc1147 wPt-2135 wPt-3378 barc159 wPt-4559
wPt-6970 wPt-7123 wPt-9288 wPt-6311 wPt-8737 wPt-9859 wPt-9220
wPt-4916 wPt-9423 wPt-5587 wPt-5934 wPt-6575 wPt-7995 wPt-3459
2BS-3
wPt-3188 wPt-1549
2BS-1 wPt-1549 wPt-2249 wPt-2397 wPt-3807 wPt-5287 wPt-1650 wPt-8074 wPt-0408 wPt-0615 wPt-1489 wPt-1494 wPt-3188 wPt-3983 wPt-4701 wPt-4737 wPt-4997 wPt-5249 wPt-5556 wPt-5597 wPt-7348 wPt-7610 wPt-8072 wPt-8294 wPt-8460 wPt-8720 wPt-9402 wPt-6144 wPt-6053 wPt-6627 wPt-7408 wPt-7757 wPt-8070
2BL-6 wPt-5128
Chromosome 2B
QTL elemzés marker kapcsoltsági térkép alkalmazásával • QTL azonosítás a teljes marker kapcsoltsági térképre kiterjedve • markerek közötti intervallumok vizsgálata • Valószínűségi becslések LOD= lg(QTL csúcs jelenlétének valószínűsége/annak a valószínűsége, hogy nincs QTL hatás) LOD küszöbérték: M genom méret M marker sűrűség M populáció méret
QTL elemzés marker kapcsoltsági térkép alkalmazásával --------------------2- - - - - - - - - - | O P J 1 5 - A B G 3 6 6 2 8 . 0 c M 0.0 35.24 17.7% 1.585 | 2 . 0 80 38.40 21.2% 1.758 | 4.0 4 1 . 5 1 2H2 5 . 0 % 1 . 9 4 1 4H| 5H 6.0 44.33 28.8% 2.126 | * 70 8.0 46.56 32.0% 2.303 | ** 10.0 48.44 34.9% 2.464 | ** ============================================================= 60 12.0 49.63 36.7% 2.599 | *** QTL-Map for peak 3: 14.0 50.31 37.8% 2.704 | *** 50 16.0 5Interval: 0.48 3 8 . 2 %Left 2Boundary= .776 | ** ** Confidence OPS31-Snf2 + 2.0 18.0 50.03 37.5% 2.815 | **** Right Boundary= Snf2-Hdamyb (off end) 40 20.0 49.35 36.5% 2.822 | ** ** 22.0 48.24 34.8% 2.800 | **** 2 4 . 0 30 46.68 32.5% 2.754 | **** INTERVAL LENGTH QTL-POS WEIGHT 26.0 44.82 29.9% 2.688 | * * * GENETICS 2 8 . 0 20 42.79 27.1% 2.609 | *** Snf2-Hdamyb 8.0 0.0 free 78.700 -------------------------------| ABG366-abg54 5.5 cM 0 . 0 10 42.79 27.1% 2.608 | *** 2.0 45.76 30.5% 2.667 | *** chi^2= 105.665 (1 D.F.) log-likelihood= 22.94 4.0 0 44.87 29.1% 2.372 | ** - - - -16.300 - - - - - - - -sigma^2= - - - - - - - - -102.058 --------- | a b g 5 4 - O P R 1 9 5 7 . 9 93.8% cM mean= variance-explained= recombination distance (cM) 0.0 36.31 19.1% 1.753 | ============================================================= 2.0 37.80 20.9% 1.885 | HD24h vern 4.0 3 8 .HD16h 66 2uv 2 . 0 % HD16h 1 . vern 992 | HD24h uv
LOD values
cM
Weight
R
LOD
Kalászolási idő, mint vizsgált tulajdonság
Populáció egyedei közti változékonyság 16h + hő ciklus
DH vonalak száma
40
Xátl=77 nap
30
Kompolti
20
Dicktoo
10 0 20 30
40 50
60 70
80 90 100 110 120 130 140 150
Kalászolási idő
Dicktoo x Kompolti korai DH vonalak
HvSnf2
4H árpa kromoszóma 0 8
16
ZCCTH
21 22 24 29 32 33
65 72 79 84 85 86 92 93 100
TCAT300 TCAT77 AGAT142 HvPhyB CAB Bmac30 AGAT312 Bmag353 Bmag173a Bmac310 OPJ15 TCAT452 OPU162 AGAT46 ABG366 abg54 AGAT148 GCGT161 GCAT312 AGAT406 HvM67 OPS031
VRN-H2 HvSnf2 AGGT650 Hdamyb
vernalizált kezelés
39 40 41 42 59 62 64
HvPhyA GCAT76 vernalizálatlan
9
QTL elemzés
Két szülős populációk – QTL térképezés • Hagyományos két:szülős térképező populációk hátrányai: – Előállításuk idő és munka igényes – Szűkebb mértékű polimorfizmus – Lókuszonként csak két allél hatásának vizsgálatára van mód – A két szülő közti hasonlóság korlátozza az egyes gének azonosítási lehetőségeit – QTL térképezés pontossága változó – Adott populációban azonosított QTL csúcshoz szorosan kapcsolt marker nem polimorf a nemesítési anyagban – Gén (allél) kölcsönhatások vizsgálata limitált
Alacsony hatékonyság
Gén térképezés főbb módszerei
• Két szülős térképező populációk • marker kapcsoltsági térképek, QTL elemzés
• Széles genetikai bázist képviselő fajtakör • LD térképezés, teljes genomot lefedő asszociációs elemzések
Széles genetikai bázisú fajtakör – asszociációs genetika • Nincs szükség a genetikai populáció kifejlesztésére • A tesztelt populáció képviselheti a vadfajok, tájfajták és vagy a nemesítés számára releváns fajták széles körét • Diverz és nagyméretű populációk vizsgálata a gének detektálásának valószínűségét fokozza • Adott gén természetes allél variációi, és azok fenotípusos hatása könnyebben azonosítható • „Történelmi” rekombinációk hasznosítása (evolúció – adott környezetben folytatott nemesítés) – nagyobb felbontású géntérképezést tesz lehetővé • Régebbi fenotípusos vizsgálatok eredményei is felhasználhatók
Asszociációs térképezés a növényekben Széles genetikai bázisú fajtakör kiválasztása
Széles körű fenotípusos jellemzés (különböző környezet, többszöri ismétlés)
Genotipizálás molekuláris markerekkel (pl AFLP, SSR, DArT, SNP)
Marker – tulajdonság asszociáció (megfelelő megközelítés alkalmazásával) Tulajdonsággal kapcsolt markerek azonosítása
LD jellemzése a marker adatbázisra alapozva
Populáció szerkezet meghatározása (struktúra és rokonsági fokok)
Azonosított lókuszok klónozása, biológiai funkciójuk jellemzése
Asszociációs térképezés Valós marker – tulajdonság asszociáció azonosításának esélye függ • Az alkalmazott molekuláris marker típustól • A populációban lévő LD kialakulásának módjától és az LD mértékétől • A populáció genomi sajátosságaitól • A populáció mérettől és a szerkezetétől • A vizsgált tulajdonság genetikai szabályozásának komplexitásától
Asszociációs térképezés Valós marker – tulajdonság asszociáció azonosításának esélye függ • Az alkalmazott molekuláris marker típustól • A populációban lévő LD kialakulásának módjától és az LD mértékétől • A populáció genomi sajátosságaitól • A populáció mérettől és a szerkezetétől • Alkalmazott statisztikai modelltől • A vizsgált tulajdonság genetikai szabályozásának komplexitásától
Molekuláris marker típusok
• Kodomináns (SNP) – domináns (AFLP, DArT) markerek • Bialléles (SNP, DArT) : multialléles (SSR, RFLP, AFLP) markerek
Asszociációs térképezés Valós marker – tulajdonság asszociáció azonosításának esélye függ • Az alkalmazott molekuláris marker típustól • A populációban lévő LD kialakulásának módjától és az LD mértékétől • A populáció genomi sajátosságaitól • A populáció mérettől és a szerkezetétől • Alkalmazott statisztikai modelltől • A vizsgált tulajdonság genetikai szabályozásának komplexitásától
Különböző lókuszok allél variánsai közötti kapcsoltsági viszonyok adott populáción belül Linkage disequilibrium (LD; kapcsoltsági egyensúlytalanság)
Linkage equilibrium (LE; kapcsoltsági egyensúly)
Linkage disequilibrium (LD) • LD: – az allélok nem véletlenszerű szétválása (kromoszómán belül és kromoszómák között) • Mértékének meghatározása D= PAB:PAPB ; Megfigyelt és a várt haplotípus gyakoriságok különbsége – rekombinációs különbségek összegzése r2; két marker lókusz közti korreláció négyzete – rekombinációs és mutációs események összegzése
LD ábrázolása Páronkénti r2:ben kifejezett LD értékek grafikus ábrázolása KétMszülős marker térkép
Fajta populáció marker mátrix
Sok fajtás LD térkép
LD ábrázolása LD csökkenés (LD decay) a páronkénti marker távolság függvényében 1
y = -0.039Ln(x) + 0.3304 R2 = 0.1299
0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1
két marker közti rekombinációs távolság (cM)
120.3
104.2
91.5
85.0
79.4
74.5
69.9
65.1
61.6
56.9
54.0
50.9
48.5
46.1
43.7
41.4
39.2
36.6
34.1
31.3
28.6
25.7
23.9
21.1
18.2
15.7
13.8
11.4
9.2
7.4
5.6
3.8
2.4
0.9
0 0.0
két marker közti korreláció (r 2)
0.9
LD mértékét befolyásoló faktorok • LD értékét növelő tényezők – – – – – –
Öntermékenyülés Genetikai izoláció Strukturált populáció Rokonság Kis méretű kiinduló populáció Alacsony rekombinációs gyakoriság
• LD értékét csökkentő tényezők – Idegen megtermékenyülés – Rekombináció és mutáció nagy gyakorisága – Ismétlődő mutációk
Az LD mértéke függ a populáció típusától, a rekombináció gyakoriságától (adott kromoszóma régió genetikai és fizikai távolsága közti arány), az LD blokkoktól
LD mértéke árpában Cél gén
Cél gén
LD
LD lassan szűnik meg Termesztett árpa ~5cM Rostoks et al., 2006 Kraakman et al., 2004
LD gyorsan szűnik meg Vadárpa Génen belül (~300 bp) Morrell et al., 2005
Árpa genom ~ 1250 cM
LD és az asszociációs vizsgálatok • Nagy kiterjedésű LD – Csökkenti az asszociációs térképezéshez szükséges marker sűrűséget – Térképezés felbontóképessége csökkent (coarse mapping)
• Szűk LD – Nagyszámú marker szükséges az asszociációs vizsgálatok kivitelezéséhez, egy adott gén markerezéséhez – Térképezés felbontó képessége jelentősen megnő
• Független markerek közti LD – Hamis marker – tulajdonság kapcsolat azonosításának esélye megnő
Árpa genomot lefedő LD térkép
1H 2H
Comadran et al. (2011) TAG 122:1363 190 Mediterrán árpafajta
3H
2132 SNP
4H
LD cM:ban kifejezve
5H
6H 7H 1H
2H
3H
4H
5H
6H
7H
Egyedi gének LD térképei
2H
HvFT HvFT1 7H
HvCO1 7H
upper P value >0.01 <0.01 <0.001 <0.0001
lower r2 1.0 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0
LD kB:ban kifejezve
ps450 ps460 ps464 ps606 ps632 ps723 ps779 ps838 ps890 ps939 ps990 ps1002 ps1079 ps1162 ps1186 ps1194 ps1199 ps1572 ps1599 ps1616 ps1756 ps1805 ps1919 ps2079 ps2163 ps182 ps427 ps506 ps582 ps843 ps885 ps912 ps1093 ps1267 ps1348 ps1455 ps1489 ps1576 ps1596 ps1816 ps2008
Ppd H1
ps1443 ps1515 ps1725 ps1785 ps1839 ps1843 ps2032 ps2035 ps2036 ps2230 ps2322 ps2327 ps450 ps460 ps464 ps606 ps632 ps723 ps779 ps838 ps890 ps939 ps990 ps1002 ps1079 ps1162 ps1186 ps1194 ps1199 ps1572 ps1599 ps1616 ps1756 ps1805 ps1919 ps2079 ps2163 ps182 ps427 ps506 ps582 ps843 ps885 ps912 ps1093 ps1267 ps1348 ps1455 ps1489 ps1576 ps1596 ps1816 ps2008
ps1443 ps1515 ps1725 ps1785 ps1839 ps1843 ps2032 ps2035 ps2036 ps2230 ps2322 ps2327
B
Ppd H1 Stracke et al. TAG(2009)118:259
HvFT HvFT1
HvCO1
Széles genetikai bázisú fajtakör – asszociációs genetika
• LD térképpel lehetővé válik a gén – fenotípus asszociációk azonosítása a meglévő törzsgyűjteményekben • Az evolúció során rögzített fenotípusos információkat, meiotikus és rekombinációs eseményeket hasznosítja • Egy törzsgyűjteményben lehetőség nyílik számos fenotípusos tulajdonság párhuzamos vizsgálatára
Asszociációs térképezés Valós marker – tulajdonság asszociáció azonosításának esélye függ • Az alkalmazott molekuláris marker típustól • A populációban lévő LD kialakulásának módjától és az LD mértékétől • A populáció genomi sajátosságaitól • A populáció mérettől és a szerkezetétől • Alkalmazott statisztikai modelltől • A vizsgált tulajdonság genetikai szabályozásának komplexitásától
LDMdecay kromoszómánkénti változásai 168 árpafajta körben Markerek
Össz cM
Átl cM
DArT
Gén spec
1H
79
1
137.6
2H
101
2
3H
98
4H
Átlagos LD csökkenés (cM) 168 fajta
tavaszi
őszi
Őszi+ átmeneti
1.7
7.3
16.5
7.0
5.5
197.6
1.9
2.7
5.4
3.0
1.3
1
181.3
1.8
3.3
8.1
4.3
3.3
35
4
186.4
4.8
9.7
9.7
7.5
5H
92
20
193.0
1.7
6.2
24.8 1.9
15.2
7.8
6H
90
5
159.3
1.7
1.7
2.2
3.9
2.2
7H
116
7
198.0
1,6
5.1
11.7
6.0
5.3
Σ
611
40
1253.2
1.9
5.0
7.3
7.1
4.8
LDMdecay kromoszómánkénti változásai 168 árpafajta körben Átlagos LD csökkenés (cM)
Egyedi kromoszómák és a teljes genomi markerek közti összefüggés Korreláció (r) alapján
Párosított TMteszt (P érték) alapján
1H
7.3
0.74
10E:12
2H
2.7
0.75
8E:27
3H
3.3
3E:54
4H
9.7
0.79 0.60
5H
6.2
0.76
6H
1.7
0.64
ns 3EM239
7H
5.1
0.71
9E:10
Átlag
5.0
:
:
9E:38
Asszociációs térképezés Valós marker – tulajdonság asszociáció azonosításának esélye függ • Az alkalmazott molekuláris marker típustól • A populációban lévő LD kialakulásának módjától és az LD mértékétől • A populáció genomi sajátosságaitól • A populáció mérettől és a szerkezetétől • Alkalmazott statisztikai modelltől • A vizsgált tulajdonság genetikai szabályozásának komplexitásától
www.barleycap.org Barke Pasadena C-14 Farmington Scarlett Collins Franklin BISON5H BISON1H+5H BISON4H+5H Baronesse BISON1H BISON4H BISON7H BISON1H+4H BISON1H+4H+5H Geraldine Eslick Hays Radiant ACMetcalfe CDC-Kendall CDC-Stratus Newdale Merit Crest Klages Hockett Harrington Sublette Garnett CDCCopeland 2B96-5038 TR306 B1202 B1215 2B98-5312 Conrad Charles Rawson(ND19119-2 Bowman Conlon ND21863 Craft Haxby Orca Flagship2 Arapiles Canela BCD47 BCD12 HarunaNijo CIho4196 Shenmai3 OWBRecessive Steptoe Sussex Wysor Nomini Price Doyce Strider Kold Thoroughbred Dicktoo Kompolti WA1614-95 Hoody Belford Washford Morex 88Ab536 88Ab536-B Robust MNBrite Excel Lacey M123 6B02-3394 Legacy 6B00-1526 FEG90-31 FEG66-08 M122 6B94-7378 FEG55-14 6B94-8253 Stander B1614 Stellar Foster 6B97-2245 CDC-Sisler FEG59-09 B1602 Tradition Drummond Larker ND20448 ND20508 NDB112 OWBDominant
US CAP Core 102 Lines 1105 P-OPA2 markers; SM distance; UPGMA cluster
Rawson(ND19119-2MW
0.54
0.65
0.77
Coefficient
0.88
1.00
Strukturált populáció
• A populáción belül határozottan elkülönülő alcsoportok jelenléte • LD kapcsolat egymástól távol, nem kapcsolt, vagy eltérő kromoszómákon levő lókuszok között • Alcsoportonként változó LD blokkok
www.barleycap.org Barke Pasadena C-14 Farmington Scarlett Collins Franklin BISON5H BISON1H+5H BISON4H+5H Baronesse BISON1H BISON4H BISON7H BISON1H+4H BISON1H+4H+5H Geraldine Eslick Hays Radiant ACMetcalfe CDC-Kendall CDC-Stratus Newdale Merit Crest Klages Hockett Harrington Sublette Garnett CDCCopeland 2B96-5038 TR306 B1202 B1215 2B98-5312 Conrad Charles Rawson(ND19119-2 Bowman Conlon ND21863 Craft Haxby Orca Flagship2 Arapiles Canela BCD47 BCD12 HarunaNijo CIho4196 Shenmai3 OWBRecessive Steptoe Sussex Wysor Nomini Price Doyce Strider Kold Thoroughbred Dicktoo Kompolti WA1614-95 Hoody Belford Washford Morex 88Ab536 88Ab536-B Robust MNBrite Excel Lacey M123 6B02-3394 Legacy 6B00-1526 FEG90-31 FEG66-08 M122 6B94-7378 FEG55-14 6B94-8253 Stander B1614 Stellar Foster 6B97-2245 CDC-Sisler FEG59-09 B1602 Tradition Drummond Larker ND20448 ND20508 NDB112 OWBDominant
US CAP Core 102 Lines 1105 P-OPA2 markers; SM distance; UPGMA cluster
Rawson(ND19119-2MW
0.54
0.65
0.77
Coefficient
0.88
1.00
Strukturált populációk • Populáció szerkezetből származó fals asszociációk • Populáció struktúra mint tényező beépítése az elemzésekbe • K mátrix (pairwise Kinship values) (TASSEL, PCA, GenStat) • Q mátrix (a határozottan elkülönülő alcsoportok azonosítása) (STRUCTURE) • K + Q mátrix együttes használata
Alcsoportok számának meghatározása STRUCTURE programmal
0
2
4
6
-8000
Goodness of fit
-9000 -10000 -11000 -12000 -13000 k
8
10
12
Comadran et al. (2009) TAG 119:175 190 Mediterrán árpafajta 1130 DArT marker alapján
Alcsoportok és rokonsági kapcsolatok meghatározása főkomponens elemzéssel (PCA)
LD:decay populáció és alcsoport függő változásai 811 térképezett DArT marker alapján
Comadran et al. (2009) TAG 119:175
Asszociációs térképezés Valós marker – tulajdonság asszociáció azonosításának esélye függ • Az alkalmazott molekuláris marker típustól • A populációban lévő LD kialakulásának módjától és az LD mértékétől • A populáció mérettől és a szerkezetétől • Alkalmazott statisztikai modelltől • A vizsgált tulajdonság genetikai szabályozásának komplexitásától
Asszociációs vizsgálatok alapstatisztikai eljárásai • Egyszerű marker:tulajdonság asszociáció (naív modell) • Általános lineáris modell (GLM) • Kevert lineáris modell – MLM+Kinship mátrix; MLMK • Kevert lineáris modell + populáció struktúra – MLMK + Q mátrix
1.0 0.9 MOR (naïve)
0.8
Cumulative % of p-value
0.7 ITA (naïve)
0.6
K
MOR (Q)
0.5 ITA (Q)
0.4 0.3 Naïve
0.2
Q K
0.1 0.0 0.0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
Observed p-value
Comadran et al. (2009) TAG 119:175
12 GLM naive GLM Q MLM K
10
MLM Q_K
-log10p
8
6
4
2
0
rekombinációs távolság (cM)
Asszociációs térképezés Valós marker – tulajdonság asszociáció azonosításának esélye függ • Az alkalmazott molekuláris marker típustól • A populációban lévő LD kialakulásának módjától és az LD mértékétől • A populáció mérettől és a szerkezetétől • Alkalmazott statisztikai modelltől • A vizsgált tulajdonság genetikai szabályozásának komplexitásától
Lisztharmat rezisztencia asszociációs vizsgálata árpában
Comadran et al. (2009) TAG 119:175
Mennyiségi tulajdonságok Termőképesség genom széles asszociációs vizsgálata árpában (Comadran et al. 2011.) • Mediterrán medence körül 12 termőhelyen két évjáratban (24 egyedi adatsor) • Meta:analízis során fő QTL:ek meghatározása, • egyedi termőhelyeken azonosítható QTL:ek
Mennyiségi tulajdonságok Termőképesség genom széles asszociációs vizsgálata árpában (Comadran et al. 2011.)
Mennyiségi tulajdonságok Termőképesség genom széles asszociációs vizsgálata árpában (Comadran et al. 2011.) • 2 – 7 QTL:t azonosítottak a termés különböző komponensei esetében • A szignifikáns asszociációk egy része olyan SNP:k nél lokalizálódott, amelyek szorosan kapcsolódtak ismert génekhez • QTL:ek együtt lokalizálódása a genomon • termés meta:analíziseként 3 főhatású QTL:t azonosítottak, míg az egyedi termőhelyekre bontva ezek száma 27 volt (genotípus x környezet kölcsönhatás elemzése)
Strukturált populációk problematikája A populáció struktúra hatását számításba vevő módszerek nem minden esetben képesek a fals pozitív asszociációk kiszűrésére A populáció struktúrára szűrés megakadályozhatja az olyan biológiai jelentőséggel bíró QTL / génhatások azonosítását is, amelyek egybeesnek a populáció struktúrával A fenotípus szignifikáns korrelációja a populáció struktúrával megakadályozhatja a kisebb hatású allélok detektálását
Javasolt irodalom • Abdurakhmonov et al. (2008) International Journal of Plant Genomics vol. 2008, article No:574927 • Comadran et al. (2009) Theor Appl Genet, 119:175 • Comadran et al (2011) Theor Appl Genet 122:1363 • Rostoks et al. (2006) PNAS 103:18656 • Waugh et al. (2009) Curr Opin in Plant Biol 12:218