intenzita
MALDI-MS proteinů BSA
[M+H]+ [M+2H]2+
BSA dvojnásobně nabitý
[2M+H]+ BSA dimer
m/z
jednonásobně nabité ionty, také 2+,3+, záleží na matrici a hmotnostním rozsahu artefakty: dimery, trimery; adukty (s matricí, rozpouštědlem); fragmenty
MALDI-MS proteinů, Příklad č.2 2+
rel. intenzita
1+
3+
m/z
Určení MW – ESI
jak vzniká vícenásobný náboj – ESI
výpočet MW proteinu z m/z sousedních píků M – MW proteinu z – nábojový stav
intenzita
X = (M+z)/z Y = (M+z+1)/(z+1) nábojový stav (z) píku X: zx= (Y-1)/(X-Y)
X
MW: M = (X*zx)-zx = (Y*zy)-zy
Y
m/z
myoglobin: ukázkový výpočet MW X = (M+z)/z Y = (M+z+1)/(z+1) nábojový stav (z) píku X: zx= (Y-1)/(X-Y); X = 998.25 Y = 942.82 zx = (942.82-1)/(998.25-942.82) ≈ 17 zx = 17, zy = 18 M = (X*zx) – zx = 998.25*17-17 = 16952.91 teoretická MW = 16951.52 M = (Y*zy) – zy = 942.82*18-18 = 16952.76 teoretická MW = 16951.76
Unknown
X = 1101.8 Y = 1057.8 zx = (Y-1)/(X-Y) = (1057.8-1)/(1101.8-1057.8) ≈ 24 zx = 24, zy = 25 M = (X*zx) – zx = 1101.8*24-24 = 26419.2 M = (Y*zy) – zy = 1057.8*25-25 = 26420
M = (662.1*34) - 34 = 22477.4 M = (1762.1*9) - 9 = 15849.9
Příklad č.4 – určete nábojové stavy jednotlivých píků a přibližnou MW zx= (Y-1)/(X-Y); X = 952.1772 Y = 912.5492 zx = (912.5492-1)/(952.1772-912.5492) ≈ 23 zx = 23, zy = 24 952.1772*23-23*1 = 21877.07 atd. 21877.1
Programy pro dekonvoluci - SpectraPhile http://home.iprimus.com.au/pakholt/lcms/spectraPhile.html
Programy pro dekonvoluci - MagTran Zhongqi Zhang and A. G. Marshall.J. Am. Soc. Mass Spectrom. (1998), 9, 225-233. http://www.geocities.com/SiliconValley/Hills/2679/magtran.html
Klasické problémy při interpretaci - ADP/ATP transporter
problémový membránový protein -soli, pufry, detergent, lipidy -> ESI? -precipitace, omytí, rozpuštění…. SDQALSFLKDFLAGGVAAAISKTAVAPIERVKLLLQVQHASKQISAEK QYKGIIDCVVRIPKEQGFLSFWRGNLANVIRYFPTQALNFAFKDKYK QIFLGGVDRHKQFWRYFAGNLASGGAAGATSLCFVYPLDFARTRLA ADVGKGAAQREFTGLGNCITKIFKSDGLRGLYQGFNVSVQGIIIYRAA YFGVYDTAKGMLPDPKNVHIIVSWMIAQTVTAVAGLVSYPFDTVRRR MMMQSGRKGADIMYTGTVDCWRKIAKDEGPKAFFKGAWSNVLRG MGGAFVLVLYDEIKKFV
Klasické problémy při interpretaci - ADP/ATP transporter 28 1176.90 -precipitace, omytí, redukce/alkylace, 29 1136.35 10% FA 30 1098.51
MW = 32925
31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46
1063.10 1029.91 998.73 969.39 941.72 915.59 890.87 867.45 845.24 824.13 804.06 784.94 766.70 749.30 732.67 716.77
Příklad č.6 – určete co je problémem ve ESI-MS spektru následujícího proteinu a navrhněte řešení SEKVENCE:
MRELPVSYDSTSTESLYPRSILIKPPQITVPRTP AVSYPLVTSFPPLRQPDLLPIPRSPQPLGGSHRM PSSQQNSDDANSVASYENQEPACKNVDADED EDDYPNGYLVVLPDSSPAAVPVVSSAPVPSNPDL GDSAFSVESCEDYVNVPESEESAEASLDGSREY VNVSPEQQPVTRAELASVNSQEVEDEGEEEGV DGEEAPDYENLQELNLEHHHHHH Pufr: 20mM HEPES, 50mM NaCl, 1mM 2-ME, 1mM EDTA
Příklad č.6 – určete co je problémem ve ESI-MS spektru následujícího proteinu a navrhněte řešení SPEKTRUM:
Příklad č.6 – tvoří se kovalentní multimery (snadno odhalitelný je di a trimer) a adukty s 2-ME 24272.5 48390.8 72507 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50
1936.64 1862.19 1793.26 1729.25 1669.66 1614.03 1562.00 1513.22 1467.40 1424.27 1383.60 1345.20 1308.87 1274.45 1241.80 1210.78 1181.27 1153.17 1126.37 1100.80 1076.36 1052.98 1030.60 1009.15 988.57 968.82
37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56
1960.66 1909.09 1860.16 1813.68 1769.47 1727.36 1687.22 1648.89 1612.27 1577.25 1543.71 1511.57 1480.74 1451.15 1422.71 1395.37 1369.06 1343.73 1319.32 1295.78
Příklad č.6 – po redukci TCEP a přečistění
24120.4 HS
SH
Příklad č.6 – tvoří se kovalentní multimery (snadno odhalitelný je di a trimer) a adukty s 2-ME 24272.5 48390.8 72507
24120.4 + 2*76
25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50
S-2ME
2ME-S
2*24120.4 + 2*76 - 2 2ME-S
S S
2ME-S
HS
SH
S-2ME
S S
S S
3*24120.4 + 2*76 - 4
S-2ME
1936.64 1862.19 1793.26 1729.25 1669.66 1614.03 1562.00 1513.22 1467.40 1424.27 1383.60 1345.20 1308.87 1274.45 1241.80 1210.78 1181.27 1153.17 1126.37 1100.80 1076.36 1052.98 1030.60 1009.15 988.57 968.82
37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56
1960.66 1909.09 1860.16 1813.68 1769.47 1727.36 1687.22 1648.89 1612.27 1577.25 1543.71 1511.57 1480.74 1451.15 1422.71 1395.37 1369.06 1343.73 1319.32 1295.78
Určení náboje z jednoho píku • Nutné dostatečné rozlišení • Rozdíly mezi izotopickými píky v izotopovém vzoru 1+: Δ m/z = 1 Da, 2+: Δ m/z = 0.5 Da, 3+: Δ m/z = 0.33 Da ...
• Rozdíly mezi adukty
1375.9650
1375.9650*4 – 4*1.00728 = 5499.8309
1375.7153
1 Z= A-B
1376.2140
1375.9650
3 4 5 6
1834.28 1375.97 1100.97 917.65
B
1376.4635 1375.4653
A
1376.7128
1376.713 1376.464 1376.214 1375.965 1375.715 1375.465
4.0 4.0 4.0
1376.9613
1100.9760
1375.2151 1377.2118
1375.2
1375.6
1376.0
1376.4
1376.8
1377.2
1377.6
917.6493 1834.2813
Určení náboje z jednoho píku • Počet izotopických píků do 1 amu od daného izotopu…
1188.2596
1188.1758
12+ 1188.0923
1188.0085
1187.9251
1187.8415
1187.7581
1187.6746
1187.4241
1187.3400
1187.2557
1295.72
1187.5078
1187.82
14241.80 m/z 1583.43 1425.19 1295.72 1187.82 1096.53 1018.28
1096.53
MW CS 9 10 11 12 13 14
1187.5910
12*1187.82 – 12*1.00728 = 14241.8
1583.43
1018.28
1425.19
1187.3 1187.4 1187.5 1187.6 1187.7 1187.8 1187.9 1188.0 1188.1 1188.2 m/z
1000
1100
1200
1300
1400
1500
m/z
900 950 1000 1050 1301.0
1100 1301.5
1150 1302.0 1302.5
1200
1042.5
1303.0
1301.5244
1042.0
1303.0274
1302.0248
1301.7748
1301.5244
1301.2739
1042.2212
1042.8223
1042.6216
1041.8204
1041.6200
1041.4196
1041.2194
1041.4196
1041.0190
1042.0206
1040.8186
868.1845
868.0176
867.8506
1042.4214
868.3516
867.6835
1041.5
1302.7760
1302.5254
867.6 867.8 868.0 868.2 868.4 868.6 868.8 869.0 869.2 869.4
1301.0233
869.1866
869.0183
868.8518
868.6854
868.5181
867.5161
1041.0
1302.2751
1300.7725
868.0176
Příklad č.7 – z izotopových obálek jednotlivých píků určete Mmono a nábojový stav všech tří píků
1043.0
m/z
1250 1300
900 950 1000 1050 1301.0
1100 1301.5
1150
1042.0
1302.0 1302.5
1200
1042.5
1303.0
1301.5244
1041.5
1303.0274
1301.5244 1301.7748 1302.0248
5199.0568 1301.2739
1042.2212
1042.8223
1042.6216
1041.8204
1041.6200
1041.4196
1041.2194
1041.4196
1041.0190
1042.0206
1040.8186
868.1845
868.0176
867.8506
1042.4214
868.3516
867.6835
1041.0
1302.7760
1302.5254
867.6 867.8 868.0 868.2 868.4 868.6 868.8 869.0 869.2 869.4
1301.0233
869.1866
869.0183
868.8518
868.6854
868.5181
867.5161
6+ (6*867.5161) - 6*1.00728 5199.0529
1302.2751
1300.7725
868.0176
Příklad č.7 - řešení 5+ (5*1040.8186) - 5*1.00728 5199.0566
1043.0
4+ (4*1300.7725) - 4*1.00728 5199.0609
m/z
1250 1300
800
900
1100
1200
1300
1400
1500
36245.30 m/z 1813.27 1726.97 1648.52 1576.89 1511.23 1450.82 1395.06 1343.43 1295.48 1250.85 1209.18 1170.21 1133.67 1099.35 1067.05 1036.59 1007.82 980.61 954.83 930.37 907.14 885.04 863.99 843.92 824.76 806.46
1600
1727.03294
1648.54925
1576.89786
1511.27150
1450.82931
1395.05604
1343.45012
1250.83461
1209.17181
1295.50636 1000
MW CS 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45
1170.20543
1133.67556
1099.32219
1036.56681
1007.81287
954.81691
930.35939
824.36523 843.91262 863.95838 885.05225 907.10386
980.61272
1067.03671
Určení nábojového stavu u velkých molekul
1700
m/z
1169.6 1169.8 1170.0 1170.2 1170.4
1170.42571
1170.39192
1169.94088 1169.97348 1170.00605 1170.03851 1170.07119
1170.6 1170.8
1171.00609
1170.87858 1170.90967 1170.94223 1170.97161
1170.78092 1170.81205 1170.84461
1170.71535 1170.74729
1170.58883 1170.61952 1170.65150 1170.68208
1170.45993 1170.49076 1170.52271 1170.55331
1169.87867 1169.90721
1169.84535
1169.81088
1169.77748
1169.71912 1169.74322
1169.68301
1169.64771
1170.29687 1170.32885 1170.36101
1170.26276
1170.13509 1170.16711 1170.23236
1170.10264
1170.19872
m/z 1/(m/z(n+1) - m/z(n) 1170.23236 29.7 1170.19872 1170.36101 31.1 1170.32885 1170.42571 29.6 1170.39192 1170.16711 31.2 1170.13509 1169.97348 30.7 1169.94088
m/z
AVG 30.5
1170.0 1170.1 1170.2 1170.3 1170.4 1170.5
1170.5533
1170.5227
20
1170.6
1170.6821
1170.6515
1170.5888
25
1170.7 1170.8
31
1170.9
1170.9422
1170.8786
1170.8446
1170.8120
1170.7809
1170.7473
15 1170.4257
1170.2628
1170.1671
1170.1351
1170.3610
1170.3289
1170.2969
10
1170.4908
1170.4599
1170.3919
1170.0712
1170.0385
1170.0060
1
1169.9735
1169.9409
1170.2324
1170.1026
1170.1987
5
Dekonvoluce, určení náboje a monoizotopické M •
Výpočet z různě nabitých stavů - Covey TR. Rapid Commun Mass Spectrom 1988, 2: 249.
•
Odhaz ze vzdáleností mezi izotop. píky – Henry
•
Mannův algoritmus – odhad náboje podle vzdálenosti aduktu, metoda nejmenších čtverců - Mann M. Anal Chem 1989, 61: 1702. - náchylné k artefaktům…
•
„3D“ dekonvoluce – podobné jako Mann ale využívá více aduktů - Labowsky M. Rapid
•
Multiplikativní korelační analýza – Hagen JJ. Anal. Chem. 1994, 66:1877.
•
Maximum Entropy – dobrá ale výpočetně extrémně náročná metoda.
KD. Org. Mass Spectrom. 1990, 25: 490.
Commun Mass Spectrom 1993, 7: 71.
Reinhold BB. J. Am. Soc. Mass Spectrom. 1992, 3:207. Ferrige AG. Rapid Commun. Mass Spectrom. 1991, 5:374. Ferrige AG. Rapid Commun. Mass Spectrom. 1992, 6:707.
Dekonvoluce, určení náboje a monoizotopické M •
Pattern recognition – určení náboje. Patterson vs. Fourier, resp. jejich kombinace - Senko MW. J. Am. Soc. Mass Spectrom. 1995, 6:52.
•
Zscore – Zhang Z. J. Am. Soc. Mass Spectrom. 1998, 9:225
•
Vypočtení Mmono – najdeme monoizotopický pík, z pozic izotopů n=2-4 počítáme Mmono jako Mi-i*1.0028 – průměrujeme přes jednotlivé izotopy a pak i spektra
•
Proč určovat Mmono? - není zatížena variabilitou C12/C13
•
U velkých molekul monoizotopický pík mizí, je potřeba správně určit jeho pozici.
Ubiquitin: 8,57kDa (10+) Intens.
C378H629N105O118S1, M+nH ,8569.69 857.3701
857.4704
857.5706 857.2698 1500
857.6709
1000 857.1695
500
Mono
857.7712
857.8715 857.0692
857.9718
858.0720 856.9689 0 857.0
857.2
857.4
857.6
857.8
858.0
858.2
m/z
Myoglobin: 16,96kDa (20+) Intens.
C769H1212N210O218S2, M+nH ,16961.12 848.5569 848.5068
1000
848.6070
848.4566
848.6572 800
848.4065 848.7073
600
848.3564
848.7574
400 848.8075 848.3062
848.8577 200
Mono
848.2561
848.9078
848.9579 848.2060
849.0080 849.0582
0 848.2
848.4
848.6
848.8
849.0
849.2
m/z
Pepsin: 41,40kDa (50+) Intens.
C1851H2835N451O599S12, M+nH ,41399.58 828.4924
1000
800
600
400
Mono
200
0 828.0
828.1
828.2
828.3
828.4
828.5
828.6
828.7
828.8
828.9
m/z
BSA: 69,33kDa (80+) Intens.
C3071H4826N816O927S40, M+nH ,69329.07 867.1641
1000
800
600
400
Mono
200
0 866.7
866.8
866.9
867.0
867.1
867.2
867.3
867.4
m/z
Fibronectin: 262,56kDa (100+) Intens.
C11485H17824N3208O3681S90, M+nH ,262560.88 2627.2224
1000
800
600
400
Mono
200
0 2625.8
2626.0
2626.2
2626.4
2626.6
2626.8
2627.0
2627.2
2627.4
2627.6
m/z
Určení Mmono proteinu – dle Mavg Roman Zubarev – Mmono se od Mavg oddaluje o cca 1Da na každých 1500Da. Přepočítávací faktory pro proteiny i oligonukleotidy (ty dávají lepší výsledek – uniformní složení).
Zubarev R at al Rapid Commun Mass Spectrom 1991, 5, 276.
Určení Mmono proteinu – dle Mavg Jaká je průměrná hmotnost uhlíku? 12,0011 +/- 0,001 nebo 12,0109 +/- 0,0002 nebo…? Zastoupení izotopů kazí přesnost výpočtu…
Beavis RC Anal Chem 1993, 65, 496.
Určení Mmono proteinu – averagine Zubarev – Mavg -> Mmono Spočteno na základě rovnoměrného zastoupení aminokyselin (každé je 5%). Realita je jiná, např. Cys 1,9%, Met 2% Michael Senko – koncept averagine – průměrná AK, spočtená na základě reálné distribuce aminokyselin v proteinové databázi
C4.9384H7.7583N1.3577O1.4773S0.0417
Mavg = 111.1254
1.Dekonvoluce + určení Mavg 2.Určení kolik averagine jednotek se vejde do Mavg 3.Spočtení přibližného teoretického složení + zaokrouhlení na nejbližší celočíselnou hodnotu 4.Dopočtení množství vodíků – příklad 5.Modelová izotopová obálka 6.Fitování obálek a odečtení Mmono
Ad bod 4. 20kDa protein = 179.98 averagine = 7.5 S – rozdíl v intenzitách izotopů, pokud uděláme S=7 (+16H) nebo S=8 (-16H) je méně než 1% - tedy pod variabilitou sken-sken Ad bod 6. Píky na krajích obálek nejsou vhodné – m.j. mohou být ovlivněny tvorbou aduktů s kationty a solventy – je lepší ořezat vše pod 20% THRASH – Thorough high resolution analysis of spectra by Horn – Horn DM. J. Am. Soc. Mass Spectrom 2000, 11:320. Senko MW et al J Am Soc Mass Spectrom 1995, 6, 229. Horn DM et al J Am Soc Mass Spectrom 2000, 11,320.
Určení Mmono proteinu – averagine - myoglobin Intens. x108
+MS 1060.45448
998.19367 1131.08475
1.0
942.73570
0.8 1211.80784
893.22571 1413.68197
0.6
1304.95351
848.56454
0.4
808.20423
0.2 1696.26594
1542.12638 1884.40957
616.18202
0.0 600
800
1000
1200
1400
1600
1800
m/z
Určení Mmono proteinu – averagine - myoglobin Intens. x108
16+ 1060.37885
16+ 1060.44089
+MS 16+ 1060.50289
16+
1.0 16+ 1060.56505
16+ 1060.31712
Mavg = 16951,272
0.8
16+ 1060.62774
16+ 1060.25537
0.6
16+ 1060.69050
0.4
16+ 1060.19396 16+ 1060.75387
0.2 16+ 1060.81702 16+ 1060.13281
16+ 1060.88109 16+ 1060.06935 16+ 1060.94116
0.0 1060.0
1060.2
1060.4
1060.6
1060.8
1061.0
1061.2
m/z
Určení Mmono proteinu – averagine - myoglobin Mavg 16951,272 Averagine = 111,12540 / (C4,9384H7,7583N1,3577O1,4773S0,0417) Mavg / averagine = 152,5418 ×
C753,31258H1183,46529N207,10604O225,35005S6,36099 C753H1183+XN207O225S6 C0,31258H0,46529N0,10604O0,35005S0,36099 = X ~ 23
C753H1206N207O225S6 (teor. složení – C769H1212N210O218S2)
Určení Mmono proteinu – averagine - myoglobin Model podle averagine kalkulace C753H1206N207O225S6 Nábojový stav 16+
Model podle reálného složení C769H1212N210O218S2 Odečtená Mmono = 16940,9375 Teoretická Mmono = 16940,9650 1,6ppm
1060.0
1060.2
1060.4
1060.6
1060.8
1061.0
1061.2
Dekonvoluce, určení náboje a monoizotopické M averagine
1169.4879
Mmono = 36223.9135
1169.6
1169.8
1170.0
1170.2
1170.4
1170.6
1170.8
1171.0
m/z
Identifikace jednoho proteinu
Intensity
ADSMK ADSMKEETSLINVCPWKVNMGGHDSIYTLREEIYTLK EETSLINVCPWK VNMGGHDSIYTLR EEIYTLK MLIILLR MLIILLRTYSHEEDKEWQIDSLAEIRIQPLPMNVSA TYSHEEDK EWQIDSLAEIR IQPLPMNVSA
m/z
Proteinové štěpení • • • • • • •
Trypsin AspN GluC ArgC LysC CNBr Chymotrypsin
K/R-D E-, E/DRKMY/W/K/F-
\-P \-P \-P \-P
\-P
Identifikace proteinu - princip
Přesnost – správnost měření • Da – Dalton - 0.1 – 0.0001 • Th – Thompson – 0.1 – 0.0001 • ppm – parts per million – 100 – 0.1 ppm chyba = 1e6x(naměřená M-teoretická M)/teoretická M
• % 1000.0000 Iontová past 100-1000 ppm
TOF FT-MS 10-100 ppm 0.1 – 1 ppm
Důležitá je přesnost… Čím vyšší přesnost měření, tím méně peptidů potřebujeme pro bezchybnou identifikaci Unikátnost peptidu jako funkce jeho MW
Počet unikátních peptidů jako funkce velikosti proteinu Conrads TP et al . Anal Chem 2002, 72: 3349.
Peptidové mapování MASCOT – Matrix Science - http://www.matrixscience.com/cgi/search_form.pl?FORMVER=2&SEARCH=PMF MS-Fit – Protein Prospector,UCSF - http://prospector.ucsf.edu/cgi-bin/msform.cgi?form=msfitstandard
Pro-Found – Rockefeller University
http://prowl.rockefeller.edu/prowl-cgi/profound.exe http://hs2.proteome.ca/prowl/profound/control.html
Older engines, not available or unstable today PepIdent – SWISS-PROT PepSEARCH – EMBL ~ PepSea – Protana pepMAPPER – UMIST MOWSE – MRC/HGMP
Identifikace proteinů peptidovým mapováním •
Než začneme posbíráme maximum informací - zdroj vzorku (u tkáňových kultur zjistíme zda nebyly modifikovány virem) - postup zpracování, složení pufrů – vliv na modifikace proteinu - fyzikálně chemické informace – MW, pI - potenciální modifikace - typ štěpení, kvalita a čistota enzymu, čistota a stáří chemikálií….
•
Důkladně prohlédneme spektrum, odstraníme známé kontaminace a adukty (pozor na odstranění píků ze vzorku – důležitou roli hraje přesnost a rozlišení) Keller BO. Anal Chim Acta 2008, 627:71.
•
První nástřel provádíme s volnějšími parametry (zkrácené nebo modifikované proteiny mají jiné MW a pI než ty v databázi, organismus není zcela osekvenovaný, atd.) pak upřesňujeme (užší taxonomie, MW a pI interval, přesnost, modifikace, atd.) a sledujeme jak se vyvíjí skóre a počet přiřazených peptidů
•
Zvolíme jeden z prohledávacích programů ProFound – http://prowl.rockefeller.edu/prowl-cgi/profound.exe MASCOT – http://www.matrixscience.com/cgi/search_form.pl?FORMVER=2&SEARCH=PMF MsFit – http://prospector.ucsf.edu/prospector/cgi-bin/msform.cgi?form=msfitstandard
•
Nepřiřazené píky buď dále prohledáváme (směs proteinů) nebo se je snažíme přiřadit (nespecifické štěpení, procesing proteinu). Sledujeme i spektrum – je nepřiřazený signál intenzivní nebo ne?
Peptidové mapování – vliv parametrů 784.3656 842.5097 869.3889 870.5407 936.4567 938.4214 941.6030 952.4515 1002.5619 1016.5771 1024.5436 1037.4020 1075.5534 1081.5163 1089.5689 1097.5338 1120.5630 1128.5281 1138.5850 1174.6306 1188.6459 1297.6743 1308.6543 1331.7240 1453.7759 1961.0208 1971.0781
Peptidové mapování – vliv parametrů
Peptidové mapování – vliv parametrů
Database TaxonomyAll taxa Missed Cleavages Fixed Mods Variable Mods Peptide tol
NCBI 0 0 0 1000
Peptidové mapování – vliv parametrů
Database TaxonomyAll taxa Missed Cleavages Fixed Mods Variable Mods Peptide tol
SwissProt 0 0 0 1000
Peptidové mapování – vliv parametrů
Database TaxonomyAll taxa Missed Cleavages Fixed Mods Variable Mods Peptide tol
SwissProt 1 0 0 1000
Peptidové mapování – vliv parametrů
Database TaxonomyAll taxa Missed Cleavages Fixed Mods Variable Mods Peptide tol
SwissProt 2 0 0 1000
Peptidové mapování – vliv parametrů
Database TaxonomyAll taxa Missed Cleavages Fixed Mods Variable Mods Peptide tol
SwissProt 1 C-Cam 0 1000
Peptidové mapování – vliv parametrů
Database TaxonomyAll taxa Missed Cleavages Fixed Mods Variable Mods Peptide tol
SwissProt 1 C-Cam M-ox Prot N-ter Ac 1000
Peptidové mapování – vliv parametrů
Database TaxonomyAll taxa Missed Cleavages Fixed Mods Variable Mods Peptide tol
SwissProt 1 C-Cam M-ox Prot N-ter Ac 100
Peptidové mapování – vliv parametrů
Database SwissProt TaxonomyFirmicutes Missed Cleavages 1 Fixed Mods C-Cam Variable Mods M-ox Prot N-ter Ac Peptide tol 100
Peptidové mapování – vliv parametrů
Database SwissProt TaxonomyFirmicutes Missed Cleavages 1 Fixed Mods C-Cam Variable Mods M-ox Prot N-ter Ac Peptide tol 10
Peptidové mapování – vliv parametrů
Database SwissProt TaxonomyFirmicutes Missed Cleavages 1 Fixed Mods C-Cam Variable Mods M-ox Prot N-ter Ac Peptide tol 1
Peptidové mapování – vliv parametrů
Database SwissProt TaxonomyS. penumoniae Missed Cleavages 1 Fixed Mods C-Cam Variable Mods M-ox Prot N-ter Ac Peptide tol 1
Peptidové mapování – vliv parametrů
Unmatched masses: 842.50 – Trypsin 870.54 – very tiny peak 1016.57 - methylation of 1002.56 1024.54 – sodium adduct of 1002.56 1089.57 - methylation of 1075.55 1097.53 - sodium adduct of 1075.55 1128.53 – very tiny peak 1188.65 – methylation of 1174.63 1308.65 - very tiny peak
Peptidové mapování – prezentace výsledků Nutno uvést • instrument a jeho nastavení, typ kalibrace (interní, externí, post-kalibrace) • program/algoritmus použitý pro označení píků, dekonvoluci, vyhlazení/korekce • program a všechny parametry použité pro identifikaci • Skóre (+limit), pokrytí sekvence, počet použitých/přiřazených píků
MALDI FT-ICR (Apollo II Dual source Apex Qe 9.4T) externí kalibrace na Bruker Peptide Mix DataAnalysis 4.0, unprocessed, SNAP v 2.0 MASCOT v 2.2 – Swiss-Prot (verze/datum), S. pneumoniae, Trypsin, m.c. - 1, f.m. - C-Cam, v.m. – Prot N-term acetylated + M-ox, p.t. 1ppm Skóre 249 (48 limit), pokrytí sekvence 53%, 23/26 píků přiřazeno
http://www.mcponline.org/site/misc/PhialdelphiaGuidelinesFINALDRAFT.pdf
Co nám vysoké rozlišení přináší Lepší a rychlejší identifikace proteinů – peptidové mapování Plektin – obrovský protein z cytoskeletu (530kDa, 4900 AK, několik sestřihových variant) MVAGMLMPRDQLRAIYEVLFREGVMVAKKDRRPRSLHPHVPGVTNLQVMRAMASLRARGLVRETFAWCHFYWYLTNEGIAHLRQ YLHLPPEIVPASLQRVRRPVAMVMPARRTPHVQAVQGPLGSPPKRGPLPTEEQRVYRRKELEEVSPETPVVPATTQRTLARPGPE PAPATDERDRVQKKTFTKWVNKHLIKAQRHISDLYEDLRDGHNLISLLEVLSGDSLPREKGRMRFHKLQNVQIALDYLRHRQVKLV NIRNDDIADGNPKLTLGLIWTIILHFQISDIQVSGQSEDMTAKEKLLLWSQRMVEGYQGLRCDNFTSSWRDGRLFNAIIHRHKPLLIDM NKVYRQTNLENLDQAFSVAERDLGVTRLLDPEDVDVPQPDEKSIITYVSSLYDAMPRVPDVQDGVRANELQLRWQEYRELVLLLLQ WMRHHTAAFEERRFPSSFEEIEILWSQFLKFKEMELPAKEADKNRSKGIYQSLEGAVQAGQLKVPPGYHPLDVEKEWGKLHVAILE REKQLRSEFERLECLQRIVTKLQMEAGLCEEQLNQADALLQSDVRLLAAGKVPQRAGEVERDLDKADSMIRLLFNDVQTLKDGRH PQGEQMYRRVYRLHERLVAIRTEYNLRLKAGVAAPATQVAQVTLQSVQRRPELEDSTLRYLQDLLAWVEENQHRVDGAEWGVDL PSVEAQLGSHRGLHQSIEEFRAKIERARSDEGQLSPATRGAYRDCLGRLDLQYAKLLNSSKARLRSLESLHSFVAAATKELMWLN EKEEEEVGFDWSDRNTNMTAKKESYSALMRELELKEKKIKELQNAGDRLLREDHPARPTVESFQAALQTQWSWMLQLCCCIEAH LKENAAYFQFFSDVREAEGQLQKLQEALRRKYSCDRSATVTRLEDLLQDAQDEKEQLNEYKGHLSGLAKRAKAVVQLKPRHPAH PMRGRLPLLAVCDYKQVEVTVHKGDECQLVGPAQPSHWKVLSSSGSEAAVPSVCFLVPPPNQEAQEAVTRLEAQHQALVTLWH QLHVDMKSLLAWQSLRRDVQLIRSWSLATFRTLKPEEQRQALHSLELHYQAFLRDSQDAGGFGPEDRLMAEREYGSCSHHYQQL LQSLEQGAQEESRCQRCISELKDIRLQLEACETRTVHRLRLPLDKEPARECAQRIAEQQKAQAEVEGLGKGVARLSAEAEKVLALP EPSPAAPTLRSELELTLGKLEQVRSLSAIYLEKLKTISLVIRGTQGAEEVLRAHEEQLKEAQAVPATLPELEATKASLKKLRAQAEA QQPTFDALRDELRGAQEVGERLQQRHGERDVEVERWRERVAQLLERWQAVLAQTDVRQRELEQLGRQLRYYRESADPLGAWL QDARRRQEQIQAMPLADSQAVREQLRQEQALLEEIERHGEKVEECQRFAKQYINAIKDYELQLVTYKAQLEPVASPAKKPKVQSG SESVIQEYVDLRTHYSELTTLTSQYIKFISETLRRMEEEERLAEQQRAEERERLAEVEAALEKQRQLAEAHAQAKAQAEREAKELQ QRMQEEVVRREEAAVDAQQQKRSIQEELQQLRQSSEAEIQAKARQAEAAERSRLRIEEEIRVVRLQLEATERQRGGAEGELQALR ARAEEAEAQKRQAQEEAERLRRQVQDESQRKRQAEVELASRVKAEAEAAREKQRALQALEELRLQAEEAERRLRQAEVERARQ VQVALETAQRSAEAELQSKRASFAEKTAQLERSLQEEHVAVAQLREEAERRAQQQAEAERAREEAERELERWQLKANEALRLRL QAEEVAQQKSLAQAEAEKQKEEAEREARRRGKAEEQAVRQRELAEQELEKQRQLAEGTAQQRLAAEQELIRLRAETEQGEQQR QLLEEELARLQREAAAATQKRQELEAELAKVRAEMEVLLASKARAEEESRSTSEKSKQRLEAEAGRFRELAEEAARLRALAEEAK RQRQLAEEDAARQRAEAERVLAEKLAAIGEATRLKTEAEIALKEKEAENERLRRLAEDEAFQRRRLEEQAAQHKADIEERLAQLR KASDSELERQKGLVEDTLRQRRQVEEEILALKASFEKAAAGKAELELELGRIRSNAEDTLRSKEQAELEAARQRQLAAEEERRRR EAEERVQKSLAAEEEAARQRKAALEEVERLKAKVEEARRLRERAEQESARQLQLAQEAAQKRLQAEEKAHAFAVQQKEQELQQ TLQQEQSVLDQLRGEAEAARRAAEEAEEARVQAEREAAQSRRQVEEAERLKQSAEEQAQARAQAQAAAEKLRKEAEQEAARR AQAEQAALRQKQAADAEMEKHKKFAEQTLRQKAQVEQELTTLRLQLEETDHQKNLLDEELQRLKAEATEAARQRSQVEEELFSV RVQMEELSKLKARIEAENRALILRDKDNTQRFLQEEAEKMKQVAEEAARLSVAAQEAARLRQLAEEDLAQQRALAEKMLKEKMQ AVQEATRLKAEAELLQQQKELAQEQARRLQEDKEQMAQQLAEETQGFQRTLEAERQRQLEMSAEAERLKLRVAEMSRAQARAE EDAQRFRKQAEEIGEKLHRTELATQEKVTLVQTLEIQRQQSDHDAERLREAIAELEREKEKLQQEAKLLQLKSEEMQTVQQEQLLQ ETQALQQSFLSEKDSLLQRERFIEQEKAKLEQLFQDEVAKAQQLREEQQRQQQQMEQERQRLVASMEEARRRQHEAEEGVRRK QEELQQLEQQRRQQEELLAEENQRLREQLQLLEEQHRAALAHSEEVTASQVAATKTLPNGRDALDGPAAEAEPEHSFDGLRRKV SAQRLQEAGILSAEELQRLAQGHTTVDELARREDVRHYLQGRSSIAGLLLKATNEKLSVYAALQRQLLSPGTALILLEAQAASGFLL DPVRNRRLTVNEAVKEGVVGPELHHKLLSAERAVTGYKDPYTGQQISLFQAMQKGLIVREHGIRLLEAQIATGGVIDPVHSHRVPVD VAYRRGYFDEEMNRVLADPSDDTKGFFDPNTHENLTYLQLLERCVEDPETGLCLLPLTDKAAKGGELVYTDSEARDVFEKATVSAP FGKFQGKTVTIWEIINSEYFTAEQRRDLLRQFRTGRITVEKIIKIIITVVEEQEQKGRLCFEGLRSLVPAAELLESRVIDRELYQQLQRGE RSVRDVAEVDTVRRALRGANVIAGVWLEEAGQKLSIYNALKKDLLPSDMAVALLEAQAGTGHIIDPATSARLTVDEAVRAGLVGPE FHEKLLSAEKAVTGYRDPYTGQSVSLFQALKKGLIPREQGLRLLDAQLSTGGIVDPSKSHRVPLDVACARGCLDEETSRALSAPRA DAKAYSDPSTGEPATYGELQQRCRPDQLTGLSLLPLSEKAARARQEELYSELQARETFEKTPVEVPVGGFKGRTVTVWELISSEYF TAEQRQELLRQFRTGKVTVEKVIKILITIVEEVETLRQERLSFSGLRAPVPASELLASGVLSRAQFEQLKDGKTTVKDLSELGSVRTLL QGSGCLAGIYLEDTKEKVSIYEAMRRGLLRATTAALLLEAQAATGFLVDPVRNQRLYVHEAVKAGVVGPELHEQLLSAEKAVTGYR DPYSGSTISLFQAMQKGLVLRQHGIRLLEAQIATGGIIDPVHSHRVPVDVAYQRGYFSEEMNRVLADPSDDTKGFFDPNTHENLTYR QLLERCVEDPETGLRLLPLKGAEKAEVVETTQVYTEEETRRAFEETQIDIPGGGSHGGSTMSLWEVMQSDLIPEEQRAQLMADFQA GRVTKERMIIIIIEIIEKTEIIRQQGLASYDYVRRRLTAEDLFEARIISLETYNLLREGTRSLREALEAESAWCYLYGTGSVAGVYLPGSR QTLSIYQALKKGLLSAEVARLLLEAQAATGFLLDPVKGERLTVDEAVRKGLVGPELHDRLLSAERAVTGYRDPYTEQTISLFQAMKK ELIPTEEALRLLDAQLATGGIVDPRLGFHLPLEVAYQRGYLNKDTHDQLSEPSEVRSYVDPSTDERLSYTQLLRRCRRDDGTGQLLL PLSDARKLTFRGLRKQITMEELVRSQVMDEATALQLREGLTSIEEVTKNLQKFLEGTSCIAGVFVDATKERLSVYQAMKKGIIRPGTA FELLEAQAATGYVIDPIKGLKLTVEEAVRMGIVGPEFKDKLLSAERAVTGYKDPYSGKLISLFQAMKKGLILKDHGIRLLEAQIATGGII DPEESHRLPVEVAYKRGLFDEEMNEILTDPSDDTKGFFDPNTEENLTYLQLMERCITDPQTGLCLLPLKEKKRERKTSSKSSVRKRR VVIVDPETGKEMSVYEAYRKGLIDHQTYLELSEQECEWEEITISSSDGVVKSMIIDRRSGRQYDIDDAIAKNLIDRSALDQYRAGTLSIT EFADMLSGNAGGFRSRSSSVGSSSSYPISPAVSRTQLASWSDPTEETGPVAGILDTETLEKVSITEAMHRNLVDNITGQRLLEAQAC TGGIIDPSTGERFPVTDAVNKGLVDKIMVDRINLAQKAFCGFEDPRTKTKMSAAQALKKGWLYYEAGQRFLEVQYLTGGLIEPDTPG RVPLDEALQRGTVDARTAQKLRDVGAYSKYLTCPKTKLKISYKDALDRSMVEEGTGLRLLEAAAQSTKGYYSPYSVSGSGSTAGS RTGSRTGSRAGSRRGSFDATGSGFSMTFSSSSYSSSGYGRRYASGSSASLGGPESAVA
http://xtal.cicancer.org/research.html
Co nám vysoké rozlišení přináší Lepší a rychlejší identifikace proteinů – peptidové mapování MALDI-TOF vs MALDI-FT-ICR
Co nám vysoké rozlišení přináší
TOF
Lepší a rychlejší identifikace proteinů – peptidové mapování
Přiřazeno 384 peptidů Pokrytí 67%
ICR
Proč nedosahujeme 100% pokrytí
Optimální případ (při měření v rozsahu 600-3500 Da) = 88% K-VFGR-CELAAAMK-R-HGLDNYR-GYSLGNWVCAAK-FESNFNTQATNRNTDGSTDYGILQINSR-WWCNDGR-TPGSR-LCNIPCSALLSSDITASVNCAKK-IVSDGNGMNAWVAWR-NR-CK-GTDVQAWIR-GCR-L Bez alkylace = 49% K-VFGR-CELAAAMK-R-HGLDNYR-GYSLGNWVCAAK-FESNFNTQATNRNTDGSTDYGILQINSR-WWCNDGR-TPGSR-LCNIPCSALLSSDITASVNCAKK-IVSDGNGMNAWVAWR-NR-CK-GTDVQAWIR-GCR-L S alkylací, ale limitace množstvím vzorku-reálný stav = 59% K-VFGR-CELAAAMK-R-HGLDNYR-GYSLGNWVCAAK-FESNFNTQATNRNTDGSTDYGILQINSR-WWCNDGR-TPGSR-LCNIPCSALLSSDITASVNCAKK-IVSDGNGMNAWVAWR-NR-CK-GTDVQAWIR-GCR-L Ani nejlepší proteáza není dokonalá K-VFGR-CELAAAMKR-HGLDNYR-GYSLGNWVCAAK-FESNFNTQATNRNTDGSTDYGILQINSR-WWCNDGR-TPGSR-LCNIPCSALLSSDITASVNCAK K-IVSDGNGMNAWVAWRNR-CKGTDVQAWIR-GCR-L
Jak dosahujeme 100% pokrytí Trypsin K-VFGR-CELAAAMK-R-HGLDNYR-GYSLGNWVCAAK-FESNFNTQATNRNTDGSTDYGILQINSR-WWCNDGR-TPGSR-LCNIPCSALLSSDITASVNCAKK-IVSDGNGMNAWVAWR-NR-CK-GTDVQAWIR-GCR-L AspN KVFGRCELAAAMKRHGL-DNYRGYSLGNWVCAAKFESNFNTQATNR NT-DGST-DYGILQINSRWWCN-DGRTPGSRLCNIPCSALLSS-DITASVNCAK KIVS-DGNGMNAWVAWRNRCKGT-DVQAWIRGCRL Chymotrypsin KVF-GRCELAAAMKRHGLDNY-RGY-SLGNW-VCAAKF-ESNF-NTQATNR NTDGSTDY-GILQINSRW-W-CNDGRTPGSRLCNIPCSALLSSDITASVNCAK KIVSDGNGMNAW-VAW-RNRCKGTDVQAW-IRGCRL
Proč věřit identifikaci i když nedosahujeme 100% pokrytí Jsou-li peptidy rovnoměrně rozprostřeny po sekvenci, je to dobré znamení K-VFGR-CELAAAMK-R-HGLDNYR-GYSLGNWVCAAK-FESNFNTQATNRNTDGSTDYGILQINSR-WWCNDGR-TPGSR-LCNIPCSALLSSDITASVNCAKK-IVSDGNGMNAWVAWR-NR-CK-GTDVQAWIR-GCR-L Pokud tomu tak není, podíváme se blíže na sekvenci abychom zjistili, proč nám kus proteinu chybí. Nejčastější příčiny: Chybí zásahové místo pro proteázu V sekvenci je hodně cysteinů a vzorek nebyl alkylován V sekvenci nalezneme potenciální N-glykosylační místa, u sekvencí bohatých na Ser a Thr může jít i o O-glykosylaci Výskyt jiných posttranslačních modifikací (methylace, acylace, fosforylace, GPI kotva, flavinylace, atd.) Pokud máme perfektně pokrytý C-konec, ale chybí kus od N-konce – procesing?
Prediction programs O-glycosylation DictyOGlyc - http://www.cbs.dtu.dk/services/DictyOGlyc/ GlcNAc O-glycosylation sites in Dictyostelium discoideum proteins Example of O-glycosylated propetide from A. oryzae VGVNPLPAPREISWGSSGPKSIAGELQLRTDSDSADGIVADAWNRAWETIVALRWVPAATEAPISSFEPFPTPTAGAS ................................................................................................................................................................................G...........G...............
NetOGlyc - mucin type GalNAc O-glycosylation sites in mammalian proteins http://www.cbs.dtu.dk/services/NetOGlyc/ N-glycosylation http://www.cbs.dtu.dk/services/NetNGlyc/ finds NXS-T sequons and tries to predict which one will be modified
Prediction programs N-glycosylation http://www.cbs.dtu.dk/services/NetNGlyc/ finds NXS-T sequons and tries to predict which one will be modified Hexosaminidase
GPI anchor http://mendel.imp.ac.at/sat/gpi/gpi_server.html If run on CD73 (GPI on 549) - P21589 The S549 is identified !!!!
Prediction programs Acylation Myristoylator - predicts N-terminal myristoylation of proteins by neural network. Only N-terminal glycines are myristoylated (leading methionines are cleaved prior to myristoylation). http://us.expasy.org/tools/myristoylator/
The entered sequence is: VP2 MGAALTILVD LIEGLAEVST LTGLSAEAIL SGEALAALDG EITALTLEGV MSSETALATM GISEEVYGFV STVPVFVSRT AGAIWLMQTV QGASTISLGI QRYLHNEEVP TVNRNMALIP WRDPALLDIY FPGVNQFAHA LNVVHDWGHG LLHSVGRYVW QMVVQETQHR LEGAVRELTV RQTHTFLDGL ARLLENTRWV VSNAPQSAID AINRGASSAS SGYSSLSDYY RQLGLNPPQR RALFNRIEGS MGNGGPTPAA HIQDESGEVI KFYQAQVVSH QRVTPDWMLP LILGLYGDIT PTWATVIEED GPQKKKRRL This protein is predicted as myristoylated!
Palmitoylation (on Cys residue) http://csspalm.biocuckoo.org/online.php Tested with Lck – P06239 Online version has limitations (<1000AA, etc.) Freely downloadable has no limits
Prediction programs Phosphorylation NetPhos2.0 - produces neural network predictions for serine, threonine and tyrosine phosphorylation sites in eukaryotic proteins http://www.cbs.dtu.dk/services/NetPhos/
Kinase targets NetPhosK - http://www.cbs.dtu.dk/services/NetPhosK/ Site Kinase Score --------------------S-7 CKII 0.66 S-42 RSK 0.50 S-59 p38MAPK 0.54 S-71 PKC 0.58 S-102 PKA 0.61 T-104 PKC 0.63 S-121 DNAPK 0.50 S-133 PKC 0.59 S-162 PKC 0.53 S-166 PKC 0.77 Y-192 EGFR 0.54 S-194 p38MAPK 0.51
Intensity
Identifikace proteinů ve směsi ADSMKEETSLINVCPWKVNMGGHDSIYTLREEIYTLK ADSMK / EETSLINVCPWK / VNMGGHDSIYTLR / EEIYTLK MLIILLRTYSHEEDKEWQIDSLAEIRIQPLPMNVSA / MLIILLR / TYSHEEDK / EWQIDSLAEIR / IQPLPMNVSA – každý peptid z jiného proteinu!!!
m/z
Identifikace proteinů ve směsi - separace a MS/MS Separace – LC+schopnosti MS
MS
Intensity
MS/MS (CID)
MS MS
time MS/MS (CID)
MS/MS (CID) MS MS/MS (CID)
Peptidové sekvenování
Fragmentace peptidu b1
b2
b3
R1
R3 R4 R2 NH2-CH-CO-NH-CH-CO-NH-CH-CO-NH-CH-CO2H N-konec
C-konec
y3
y2
y1
Přehled aminokyselin v číslech AK G A S P V T C L I N D Q K E M H F R Y W
Gly Ala Ser Pro Val Thr Cys Leu Ile Asn Asp Gln Lys Glu Met His Phe Arg Tyr Trp
Hmotnost 57.02 71.08 87.03 97.05 99.07 101.05 103.01 113.08 113.08 114.04 115.03 128.06 128.09 129.04 131.04 137.06 147.07 156.10 163.06 186.08
Boční řetězec 1 15 31 41 43 45 47 57 57 58 59 72 72 73 75 81 91 100 107 130
Immoniové ionty 30 44 60 70 72 74 76 86(72) 86(72) 87(70) 88 101(84, 129) 101(129, 112, 84, 70) 102 104(61) 110(166, 138, 123, 121, 82) 120(91) 129(112, 100, 87, 73, 70, 59) 136 159
Fragmentace peptidu S-P-A-F-D-S-I-M-A-E-T-L-K MH+ = 1410.6 b-ions+ 88.1 185.2 256.3 403.5 518.5 605.6 718.8 850.0 921.1 1050.2 1151.3 1264.4
y-ions+ S PAFDSIMAETLK SP AFDSIMAETLK SPA FDSIMAETLK SPAF DSIMAETLK SPAFD SIMAETLK SPAFDS IMAETLK SPAFDSI MAETLK SPAFDSIM AETLK SPAFDSIMA ETLK SPAFDSIMAE TLK SPAFDSIMAET LK SPAFDSIMAETL K
1323.6 1226.4 1155.4 1008.2 893.1 806.0 692.3 561.7 490.6 361.5 260.4 147.2
Specific Cleavage at Proline y7
HYPERCLEAVAGE
b11
y2
b16
[M+2H]2+
y8
SSLPPLPGPDK
2+
y8 y7
y5
y8
y5
y7
y3
GTPGELTYSVTYTPGASTNKHPDWWNEK y15
y26
y7
y263+
[M+3H]3+
y182+
y16
y202+
2+
y7 y152+
y212+ y222+ y232+
y172+
y192+
y252+
y262+
Interpretace MS/MS Spekter MASCOT MS/MS SEARCH - Matrix Science http://www.matrixscience.com/cgi/search_form.pl?FORMVER=2&SEARCH=MIS
MS/MS SONAR - Rockefeller University http://hs2.proteome.ca/prowl/sonar/sonar_cntrl.html
MyriMatch
http://fenchurch.mc.vanderbilt.edu/software.php
OMSSA
http://pubchem.ncbi.nlm.nih.gov/omssa/omssacgi.cgi?searchsettings=iontrap.xml
!XTANDEM - Rockefeller University http://www.thegpm.org/
PepFrag –Rockefeller University http://prowl.rockefeller.edu/prowl/pepfrag.html
Protein Guru
http://www.proteinguru.com/MassSpec/OLMAT/login
MS Seq, MS Tag - Protein Prospector,UCSF http://prospector.ucsf.edu/cgi-bin/msform.cgi?form=msseq http://prospector.ucsf.edu/cgi-bin/msform.cgi?form=mstagstandard
SEQUEST – Scripps, ThermoFisher Protein Pilot – ABI Sciex Protein Lynx - Waters
MASCOT – MS/MS
MASCOT – MS/MS
MASCOT – MS/MS
MASCOT – MS/MS
MASCOT – MS/MS výsledek Skóre
Report
„Error tolerant search“ report
Jak ověřovat MS a MS/MS data? • Nezávislý experiment – biologický • Manuální procházení MSMS spekter a kontrola přiřazení – expert mode, časově náročné, nemusí být 100%ní • Statistické ověření pomocí tzv. nesmyslných/maskovacích databází – decoy search
Jak ověřovat MS a MS/MS data? Decoy – dvě strategie - invertovaná databáze - zpřeházené sekvence Kolik procent dobrých identifikací získám v „nesmyslné“ databázi – FDR (False Discovery Rate) FDR = FP / (FP + TP) FP – false positive, TP – true postive http://www.mcponline.org/site/misc/PhialdelphiaGuidelinesFINALDRAFT.pdf
False Discovery Rates at Peptide and Protein levels : For large scale experiments, the results of any additional statistical analyses that estimate a measure of identification certainty for the dataset, or allow a determination of the false discovery rate, e.g., the results of decoy searches or other computational approaches.
Jak spočítat hmotnost iontu? • b-ionty 1 + B1 + B2 + B3 + B4 + . . . . • y-ionty 1 + 18 + Y1 + Y2 + Y3 + Y4 + . . . . • a-ionty b – 28 (CO) • immoniové ionty AK zbytek – 27 • MW Σ(AK zbytek) + 18
Pravidla pro čtení sekvence 1.
? Nábojový stav, hmotnost prekurzoru
2.
? C- nebo N-koncová AK – na základě štěpení
3.
? Komplementární ionty – nikdy nekombinovat různé série !!! y + b – 1 = [M+H]+
4.
? a- / b-iontové páry (dif. 28Da)
5.
? Ztráty H2O/ NH3 (dif. 18 / 17Da)
6.
? Vícenásobně nabité ionty + následné neutrální ztráty
7.
? Prolin
m/z 699.62 tryptic digest (-K/-R)
[M+H]+ = 1398.24
ends with -K
AAAAAAAAAAAAAAGAAGK
A
A
A A
A A
A
A
A
A G KG
A
A
G
A
6A
A
A
A G
A A
K
A
A
A
2A
A 2A