Proteomika – alapfogalmak, módszerek, példák a proteomika alkalmazására
Alapfogalmak és „omikák”: Genomika – Teljes humán genom szekvenciájának meghatározása: 2001. február – Genom: Winkler, 1920; „GENes and chromosOMEs” Egy szervezet, sejt, egy organellum vagy egy vírus teljes kromoszomális és kromoszómán kívüli génjeinek összessége, azaz a szervezet teljes DNS-állománya (IUPAC) - Genomika: Roderick, 1986 (Genomics, folyóirat) – – – – –
genom szekvenciájára vonatkozó adatállomány új gének felfedezése géntérképezés genomok összehasonlítása (fajok, evolúció) új, gén alapú eljárások
Alapfogalmak és „omikák”: Proteomika Proteom: M. Wilkins (1994) Conference on Genome and Protein Maps, Siena, Italy Protein complement expressed by a genome. Egy szervezet, egy sejt, egy organellum vagy egy vírus összes proteinje, a szervezet teljes fehérjeállománya If the genome is a list of the instruments in an orchestra, the proteome is the orchestra playing a symphony. (R. Simpson)
Proteomika: 1. Proteomok kvalitatív és kvantitatív analízise, összehasonlítása különböző körülmények között (pl. beteg vs egészséges) 2. Azonosítás (szekvencia, 3D szerkezet) és fehérjemódosítások 3. Kísérleti megfigyelések összegyűjtése adatbázisban 4. A fehérjék alábbi tulajdonságainak meghatározása: - lokalizáció - módosítások (pl. poszttranszlációs módosítások) - kapcsolatok (pl. metabolikus és jelátviteli utak) - aktivitás - funkció (predikció és kísérleti eredmények alpján) 5. Betegségek megértése, diagnosztika, gyógyszerek fejlesztése
További „omikák” Bioinformatika Adat
Genomika Gének
Adat
Transcriptomika mRNS
Adat
Proteomika Fehérjék
Adat
Metabolomika Metabolitok
Összefoglaló Proteom
Genom
„sejttérképezés"
Genomika
Proteomika Funkcionális genomika
Proteomika mint kulcsszó az irodalomban
Darab közlemény
3000 2500
2484
2595
2006
2007
2791
2100
2000
1533
1500
974
1000 500
310 4
0 2001
2002
2003
2004
2005
Év
2008
Miért kell a proteomika? – Az mRNS expresszió nem mindig felel meg a fehérjeexpressziónak – Biológiai minták (pl. szérum, vizelet stb.) nem alkalmas mRNS expressziós analízisre
– Poszttranszlációs változások: nem lehet egyértelműen következtetni a DNS szekvencia alapján – A fehérjék lokalizációjára és kölcsönhatásaira is lehet következtetni
Proteomikák Funkcionális
Strukturális
Aktivitáson alapuló proteomika: Funkció összekapcsolása génexpressziós és/vagy fehérjefehérje interakciós adatokkal
Integrált Kémia proteomika: Proteom-szintű vizsgálatok Enzimaktivitás meghatározására, sokféle kémiai könyvtár
Toxikoproteomika: Specifikus fehérjék azonosítása és koncentrációváltozásuk mérése
Mikrobiális proteomika
Célzott proteomika: Szövetproteomika (Kezdeményezés: National Cancer Institute)
Filoproteomika: Ismeretlen bakteriális izolátumok azonosítása az adatbázisban szereplő fehérje biomarkerek hasonlósága alapján Statisztikus proteomika: High throughput 3D/4D fehérjeszerkezeti információ analízise és alkalmazása valamennyi élettudomány alapján
Az expressziótól az azonosításig és tovább.... Eredet meghatározás (taxonómia)
Fehérje expresszió Lízis
Sejtlizátum -Nukleinsav -Fehérje -Lipidek -Szénhidrátok
Elválasztás
Izolált fehérje
Primer szerkezet (aminosav sorrend) Alegységszerkezet Poszttranszlációs mód.
Térszerkezet (3D)
Rokonság más fehérjével
Lokalizáció
Funkció
Asszociáció betegséggel
Annotáció
Az expressziótól az azonosításig és tovább.... Nehézségek Eredet (taxonomia)
Fehérje expresszió 1. Fehérje-expresszió
1. "Sokféle fehérje" : 30 000 gén - 500 000 fehérje 2. Eltérô expressziós profil : mennyiség, minôség - idô - hômérséklet - fény/részecske - kémiai szignál -- "természetes" -- "környezeti" (gyógyszer, szennyezés stb) Sejtlizátum -
Lízis
nukleinsavak fehérjék lipidek szénhidrátok
........ 1. Nem teljes, molekuláris szintû dezintegráció. 2. Oldékonyság (hidrofób fehérjék). 3. Enzimaktivitás, degradáció.
Az expressziótól az azonosításig és tovább.... Nehézségek Elválasztás - elekroforézis - kromatográfia - UC ........
Sejtlizátum -
nukleinsavak fehérjék lipidek szénhidrátok
........
Izolált fehérje
1. "Sokféle fehérje" : 500 000 fehérje; kb. 10000 fehérje/minta, de csak kb. 2000 választható el 2D gélelektroforézissel 2. Kicsi és nagy 3. Kis mennyiség ("ritka protein"). 4. Alacsony koncentráció. 5. Nagy mennyiség ("abundant protein"). 6. Magas koncentráció. 7. Membrán/hidrofób fehérje (oldékonysági problémák) Elôfrakcionálás pI 5 +
6
7
8
9 _
Pl. Humán szérum : 600 folt , ebből 205 a pI 5-6 tartományban
Az expressziótól az azonosításig és tovább.... Nehézségek
Izolált fehérje
Primer szerkezet - aminosavsorrend
Szerkezetvizsgálat - kémiai, enzimatikus lebontás - MS - bioinformatika
1. Diszulfid híd - alegységszerkezet. 2. Oldallánc amidkötés. 3. Nem-kovalens komplex. 4. Poszt transzlációs változáson átesett fehérje. 5. Enzim "rezisztens" fehérje (lásd prion). 6. Adatbázisban nem szereplő fehérje Pl. Humán szérum : 600 folt , ebből 205 a pI 5-6 tartományban, ebből 105 található meg az adatbázisban.
Az expressziótól az azonosításig és tovább.... Nehézségek Primer szerkezet - aminosavsorrend Annotáció Primer szerkezet
- alegységek - poszttranszlációs modosulások
Funkció(k)
- Ca 2+ kötés - Zn finger - ATP kötés
Térszerkezet
Rokonság más fehérjével
1. Ismeretlen térszerkezet
Lokalizáció
Asszociáció betegséggel
- izolálás, szintézis, X-ray/NMR - predikció. 2. Ismeretlen lokalizáció - sejtfrakcionálás, - radioaktiv izotópos bioszintézis 3. Ismeretlen funkció - kötődés - biológiai válasz mérése 4. Összehasonlító vizsgálatok - fajok, - "normál" vs "kezelt"
Proteomikai munkafolyamat – Minta összegyűjtése – Organellumok szétválasztása – Tisztítás ellenanyag segítségével
– 1 és 2D gélelektroforézis – RP-HPLC – SCX HPLC (ioncserés)
Fehérje gélek
minta ESI-MS, MALDI-TOF…
Szerkezeti vagy tömeg információk
Előkészítő lépések
MS
Fehérje(k) peptidek
Fehérje azonosítás Keresés adatbázisban
Fehérje(k) (pöttyök) kivágása
SWISS-PROT TrEMBL RefSeq XPs Ensembl ...
A médium összetételének hatása az E-coli fehérjeösszetételére
Arg
- Arg
Farrell PHO (1978)
Mintaelőkészítési nehézségek – Szövet, szerv, stádiumspecifikus expresszió – Kis mennyiségben jelenlévő fehérjék – Abundáns fehérjék – Nem mindegy, hogy milyen körülményeket alkalmazunk – Membránfehérjék problémája
Arg
- Arg
A médium összetételének hatása az E-coli fehérjeösszetételére Farrell PHO (1978)
ProteoMiner (Bio-Rad)
Biológiai minta
ligand könyvtár
Fehérjék kötődése
nem kötődő fehérjék eltávolítása
eluálás, analízis
Membrán fehérje oldatba vitele 2D elektroforézishez Miért reprezentálják csak 1%-t az összes azonosított fehérjének? 1. Kis mennyiségben vannak 2. Általában magas a pI értékük 3. Rosszul oldódnak vizes oldatban Megoldás 1. A lipid környezetből izolálni kell 2. Oldható formába kerüljenek 3. Oldatban maradjanak az IEF egész ideje alatt
Néhány lehetséges módszer
2D-Kromatográfia
Fehérjekeverék, amely több ezer egyedi fehérjét tartalmaz 2D-elektroforézis 1. Dimenzió: IEF
2. Dimenzió: PAGE
Emésztés
Peptid keverék
MS Adatok elemzése
A pöttyök emésztése
MS Adatok elemzése
Elválasztás: 2D gélelektroforézis Minta oldata
Kiszárított gélcsík
- passzív rehidratálás (20°C, egész éjszaka) / aktív - Izoelektromos fókuszálás (50-250 V, 20’; 25010000 V, 150’; 8 óra)
vájatok
gélcsík Futtatás (16 mA/gel, 30 perc, utána 24 mA/gél) Ekvilibrálás (DTT, SDS, jódacetamid)
Fixálás, festés, mosás
Akrilamid gél
Detektálás: festékek, szoftverek A detektálás alsó határa 1 ng Teljes sejtkivonatból azonosíthatók azok a fehérjék, amelyek 10000 kópia/sejt mennyiségben vannak jelen, de a regulátor fehérjék száma <10000 kópia/sejt Coomassie G250 vagy R250 Fluoreszcens festékek DIGE-hoz (Cy3, 5) Ezüst festés
Kiértékelő szoftverek: Progenesis, DeCyder, PDQuest…
Differenciál gélelektroforézis (DIGE) 1. Fehérje kivonat Egyes festékkel jelölt
Kétféle jelölt minta összekeverése
2. Fehérje kivonat Kettes festékkel jelölt
Elválasztás: 2D PAGE
Gerjesztés: 1. hullámhossz
Képanalízis: képek egymásra vetítése
gélkép
Differenciál analízis
Gerjesztés: 2. hullámhossz
Képanalízis: mennyiségi különbségek
Humán plazma részleges proteintérképe 2D gélelektroforézis alapján (JC Sanchez et al. 1995).
8 - 200 kDa méret pI = 4,0 – 6,0 izoelektromos pont tartományba eső fehérjekomponensek
Egészséges humán vastagbél epitélium fehérje térképe a sejtlizátum 2D gélelektroforézis alapján (MA Raymond et al. 1997).
Sejtmag fehérjék HeLa sejtekből
Swiss-Prot
Sejtmag fehérjék HeLa sejtekből
Mw
pI
Fibroblaszt lizátum fehérjéinek 2D gélelektroforézis képe A: egészséges, B: Down-kóros beteg mintája
A
B
Elválasztás után, tömegspektrometria előtt – Gélcsík vagy gélpötty kivágása, mosás (vízzel, majd acetonitrillel) – Redukálás: DTT (ha ez nem történik meg, akkor lehetséges, hogy a hasítóhelyek nem lesznek hozzáférhetőek) – Alkilálás: jódacetamid, utána reagens eltávolítása, utolsó mosás: acetonitrillel, majd szárítás – Emésztés gélben: enzimatikus vagy kémiai – Emésztéshez használható reagensek: • Tripszin: Lys, Arg mellett (fehérje:tripszin 50:1) • Termolizin: Leu, Ile, Val, Phe, Met, Ala mellett • BrCN: Met – Extrakció (ACN, hangyasav; bepárlás után minta felvétele az eluensben)
Nem gél alapú elválasztási eljárások: kromatográfiás technikák peptidek, fehérjék analíziséhez
Gélszűrés
Hidrofób kölcsönhatás
Ioncserés
Fordított fázisú
Affinitási
Multidimensional Protein Identification Technology (MudPIT) Denaturált fehérje komplex emésztés
Peptidek
Erős kationcserélő oszlop
Fordított fázisú oszlop
Peptidek 2D kromatográfiás elválasztása
Peptid fragmentáció (MS/MS)
Keresés adatbázisban A komplexben lévő fehérjék azonosítása
ICAT: Isotope Coded Affinity Tag 1. A fehérjék izolálása, izotóp jelzése jelzés kétféle típusú stabil izotóppal (peptidek szilárd fázisú kinyeréséhez: jelölt biotin) 2. A kétféle keverék egyesítése 3. Emésztés 4. Elválasztás 5. Tömegspektrometria 6. Azonosítás adatbázisok alapján
SILAC: Stable Isotope Labeling by Amino acids in Cell culture
Alapja: aminosavak beépülése a sejt fehérjéibe Néhány osztódást várni kell a kezelés előtt
MALDI ESI LC-MS
Proteomikában leggyakrabban használt
Mikor melyik módszert? ESI Ioncsapda
MALDI TOF-TOF
Felbontás
kicsi
nagy
Tömegpontosság
100 ppm
10 ppm
Érzékenység
Femto/pikomol
Femtomol
MS/MS
+
+
Keverékek
HPLC-vel igen
nem
Throughput
alacsony (HPLC-vel)
magas
Tömegspektrometria ionforrás
MALDI ESI
analizátor
TOF, ioncsapda, FT-ICR…
detektor
Peptidek fragmentálódása
TQTXT (X = 19 aminosav) peptidkönyvtár vizsgálata ESIFTICR tömegspektrometriával [T QT Q T + H ] + 578.2759 ↓[T QT K T + H ] + ↓ 578.3127 M calc . (T QT QT ): 578.2708 M calc . (T QT K T ): 578.3071
I,L
X = [T Q T X T +H ]
+
P G
A
S
m /z
- Sig n als
V T N
F Q,K D E
W R Y
M H
510
530
550
570
590
610
TQTQT/TQTKT Ms különbség: 0,368
630
m /z
Keresés adatbázisban MS alapján
MS-MS alapján MS/MS spektrum
Tömegspektrum
Peptide Mass Fingerprint (PMF) Fehérje azonosítás peptid tömeg alapján
Szekvencia specifikus információ minden peptidre
Fehérje azonosítás a peptidek szekvencia információja alapján
Az azonosításhoz Legalább 5 peptid tömegnek egyeznie kell
Legalább 2 fragmentációs mintázatnak egyeznie kell
Mit csinálnak a keresőmotorok? MS alapján történő keresés MS-MS alapján történő keresés
– A fehérjék elméleti emésztése – Megkeresi a legjobb egyezést a kísérleti peptid tömeg és az elméleti peptid tömeg között
– A fehérjék elméleti emésztése – Elméleti fragmens ionok generálása minden lehetséges triptikus peptidre, amely az emésztés során keletkezett – Legjobb egyezés keresése peptid azonosításhoz – Peptidek szekvenciáján alapuló fehérje azonosítás
MASCOT: mindkét féle keresést tudja
Mascot - MS/MS, szekvencia és tömegadatok kombinált keresése - MSDB, SwissProt és NCBI adatbázisokban keres
ExPASy (Expert Protein Analysis System) www.expasy.org
-2D gélelektroforézis adatbázis -Technikai információk -Keresés fehérje neve, azonosítója alapján
Protein
• Protein Sequence Databases: PIR, PRF, RefSeq, SwissProt, TrEMBL • Protein Family Databases: InterPro, iProClass, Pfam, PIR-ALN, ProDom • Protein Structure Databases: CSD, MMDB,NDH, PDB, • Protein Structural Classification Databases: CATH, DSSP, FSSP, HSSP, SCOP, • Post-translational Modification Databases: O-GlyBase, RESID, Protein-protein kölcsönhatás
• • • • •
CuraGen: Portal.curagen.com DIP: Dipode-mbi.ucla.edu Interact: Bioinf.man.ac.uk/interactso.htm MIPS: mips.biochem.mpg.de ProNet: Pronet.doublewist.com
Ismert 3D szerkezettel rendelkező fehérjék száma (http://www.rcsb.org/pdb)
Ismert 3D szerkezetek száma
20000 az évben megismert az addig megismert
10000
0 1970
1980
1990
2000
Év
2010
NiceProt View of SWISS-PROT: P16070 Entry name CD44 HUMAN Primary accession number P16070 Entered in SWISS-PROT in Release 14, April 1990 Sequence was last modified in Release 35, November 1997 Annotations were last modified in Release 41, March 2002 Protein name CD44 antigen [Precursor] Synonyms Phagocytic glycoprotein I PGP-1 HUTCH-I Extracellular matrix receptor-III ECMR-III GP90 lymphocyte homing/adhesion receptor Hermes antigen Hyaluronate receptor Heparan sulfate proteoglycan Epican CDw44 Gene name CD44 or LHR From Homo sapiens (Human) [TaxID: 9606] Taxonomy Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. References [1] SEQUENCE FROM NUCLEIC ACID (VARIOUS ISOFORMS). TISSUE=Lymphoblast; MEDLINE=93101687; PubMed=1465456; [NCBI, ExPASy, EBI, Israel, Japan] Screaton G.R., Bell M.V., Jackson D.G., Cornelis F.B., Gerth U., Bell J.I.; "Genomic structure of DNA encoding the lymphocyte homing receptor CD44 reveals at least 12 alternatively spliced exons." Proc. Natl. Acad. Sci. U.S.A. 89:1216012164 (1992)
Apolipoprotein D: identification of fistula in perilymph Perilympha liquid
Human serum (clinical)
Cerebrospinal liqued
Human serum (Sigma) Sun JP 1998
Apolipoprotein D: identification of fistula in perilymph
- Neuraminidase
+ Neuraminidase
2D gelelectrophoresis map of proteins of fibroblast lysate from healthy (A) and from Down-diseased patient (B)
A
B
A proteomika alkalmazásai
Sejt térkép Expressziós térkép Jelátvitel
Proteom analízis Szerkezetmódisítás analízise Expressziós mechanizmus
Nagy értékű termékek Ételek Búza, haszonállatok fehérje analízise stb.
Gyógyszerek toxicitása Új gyógyszerek célbajuttatása Gyógyszerek mechanizmusai
Proteomika (2DE, MS)
Mikrobiológia számára hasznos fehérjék felfedezése
Betegségek biomarkerei Az öregedés és metabolikus betegségek faktorai Ideg- és immunrendszer betegségeinek ellenőrzése Protein chip Különbségek kimutatása
Strukturális genomika Bioinformatika
Összefoglalás Proteom
Genom
"Cell mapping"
Genomika
Proteomika Funkcionális genomika
Tér és idő
Interakciók