Bioinformatika 2 − 5. előadás Prof. Poppe László BME Szerves Kémia és Technológia Tsz. Bioinformatika – proteomika Előadás és gyakorlat
2009. 03. 21.
Bioinformatika 2
Fehérje térszerkezet megjelenítése
¾A fehérjék meglehetősen összetett szerkezetek, ezért speciális eszközökre van szükség a megjelenítésükhöz. ¾Az ábrán egy relativ kisméretű fehérje, az acilfoszfatáz (PDB kód 2ACY) szerkezete látható. ¾Egyszerűsítések nélkül még ennek fehérjének a szerkezete is kezelhetetlen.
2
2009. 03. 21.
a
kisméretű
Bioinformatika 2
RasMol http://www.openrasmol.org/software/rasmol/
Fehérje térszerkezet megjelenítése A fehérjelánc (backbone) megjelenítése ¾A fehérjelánc lefutása simított interpolált görbével jeleníthető meg (2ACY)
3
2009. 03. 21.
Bioinformatika 2
Swiss PDB Viwer: http://spdbv.vital-it.ch/
Fehérje térszerkezet megjelenítése A fehérjelánc szekunder szerkezeti elemek szerinti megjelenítése ¾A fehérjelánc lefutása a szekunder szerkezetnek megfelelő szalagokkal jeleníthető meg (2ACY)
4
2009. 03. 21.
Bioinformatika 2
Fehérje térszerkezet megjelenítése A fehérje szekunder szerkezeti elemek szerinti sematikus megjelenítése ¾A fehérje a szekunder szerkezetnek megfelelő sematikus elemekkel megjelenítve (2ACY)
5
2009. 03. 21.
Bioinformatika 2
Fehérje térszerkezet megjelenítése A fehérje szerkezet fejlett vegyes módú megjelenítése ¾A fehérje szerkezet fejlettebb programokkal vegyes módon is megjeleníthető (2ACY)
6
2009. 03. 21.
Bioinformatika 2
Összerendelések megjelenítése A többszörös összerendelések megjelenítése és vizuális elemzése a leghatékonyabb eszköz amivel a molekuláris biológiával foglalkozó kutató dolgozhat, akár a laboratóriumi asztalról. Ne is gondoljunk azonban hatékony eszközre - felhasználásra, ha nem alkalmazunk kölönböző színeket az aminosavak kölönböző fizikokémiai típusai szerint.
7
Szín
Oldallánc típusa
Aminosavak
Sárga
Kicsi, apoláris
Gly, Ala, Ser, Thr
Zöld
Hidrofób
Cys, Val, Ile, Leu, Pro, Phe, Tyr, Met, Trp
Magenta
Poláris
Asn, Gln, His
Piros
Negatív töltésű
Asp, Glu
Ké k
Pozitív töltésű
Lys, Arg
2009. 03. 21.
Bioinformatika 2
Összerendelések megjelenítése A színezés és vizuális megjelenítés fontossága tioredoxin enzimek példáján: ¾ A tioredoxin enzimek minden sejtben megtalálhatóak. A biológiai folyamatok széles skálájában részt vesznek, mint pl sejtosztódás, véralvadás, csírázás, inzulin lebontás, oxidatív sérülések javítása, stb... Közös hatásuk a proteinek diszulfid hídjainak redukciója. ¾ Az E. coli tioredoxin szerkezete egy központi ötszálú β-redős lemezt tartalmaz, minden oldalról α-hélixekkel körbevéve. A hélixeket és a redőket az α és β szimbólumok jelzik. Elvárható, hogy a többi tioredoxin enzimek többé-kevésbé, de nem teljesen megegyező szerkezeti elemeket tartalmaznak, mint az E. coli enzim. ¾ A következő néhány képen a tioredoxin enzimek példáján láthatjuk a színek alkalmazását többszörös összerendelések és szerkezeti elemzés során.
8
2009. 03. 21.
Bioinformatika 2
Többszörös összerendelések megjelenítése
9
(a) Az E. coli tioredoxin és homolgjai aminosav szekvenciáinak többszörös összerendelése. Néhány szekvenciát a végeknél elvágva láthatunk. A tábla számai az E. coli szekvencia pozícióinak felelnek meg (felső sor). A hélix (α) és redő (β) hozzárendelések az E. coli 2009. 03. 21. kísérleti szerkezetéből származnak (PDB kód: 2TRX). Bioinformatika 2 tioredoxin
Szekvencia Logo megjelenítése
(b) Az E. coli tioredoxin és homolgjai aminosav szekvenciáinak többszörös összerendeléséből származtatott szekvencia Logo (Szekvencia Logo: T. Schneider and M. Stephens; Webszerver (S.E. Brenner): http://www.bio.cam.ac.uk/cgi-bin/seqlogo/logo.cgi). Jól láthatóak a konzervált szerkezeti részletek és az ezekben részt vevő aminosavak sajátságai. 10
2009. 03. 21.
Bioinformatika 2
Térszerkezet megjelenítése
(c) Az E. coli tioredoxin [2TRX] szerkezete egy központi ötszálú β-redős lemezt tartalmaz, minden oldalról α-hélixekkel körbevéve. Az aminosavak számozása megegyezik a szekvencia összerendelés táblázatban találhatóval. Az N- és C-terminális részek és minden tizedik Cα atom (gömbök) kiemelve láthatóak. A reaktív diszulfid hidak a Cys32 és Cys35 aminosavak között sárga. A többszörös szekvencia összerendelések segítségéval remélhetjük hogy egyes szerkezeti és működési sajátságok azonosíthatóak. 11
2009. 03. 21.
Bioinformatika 2
Térszerkezet / funkció / szekvencia összefüggés
12
¾ A legjobban konzervált régiók valószínüleg megfelelnek az aktív helynek. Az E. coli tioredoxin Cys32 és Cys35 aminosavak közötti reaktív diszulfid hidak a fehérje családon belül a konzerválódott WCGPC[K/R] motivumban találhatóak. A szekvencián belül további konzerválódott régiók is találhatóak: a PT (76–77) és a GA (92-93) aminosavak a szubsztrát 2009. 03. 21. Bioinformatika 2 kötésben fontosak.
Térszerkezet / funkció / szekvencia összefüggés
13
¾ A beszúrásokban/törlésekben gazdag helyek valószínüleg felszini hurkok. Konzervált Gly ill. Pro valószínüleg fontos kanyaroknak (turn) felel meg. A kanyar (turn) egy nem szokásos főlánc konformáció, általában nagy mozgékonyságú glicineknél fordul elő. A konzervált Gly92 az E. coli tioredoxinban például egy kanyar része. Kanyart okozó szerkezeti rész lehet még a 2009. 03. 21. Bioinformatika 2 prolin. A konzervált Pro76 az E. coli tioredoxinban például szintén egy kanyar része.
Térszerkezet / funkció / szekvencia összefüggés
¾ A 2 egységenként hidrofób oldalláncokat – a köztes egységekben változatosabb és hidrofil oldalláncokat is tartlamazó aminosavakkal – tartalmazó szekvencia β-redő jelelétére utal. utal Ez a mintázat figyelhető meg az 50-60 közötti β-redőnél. 14
2009. 03. 21.
Bioinformatika 2
Térszerkezet / funkció / szekvencia összefüggés
¾ A ~4 egységenként hidrofób oldalláncokat tartalmazó szekvencia α-hélix jelelétére utal. utal (Az α-hélix menetemelkedése 3,6 aminosav). Ez a mintázat figyelhető meg a 40-49 hely közötti α-hélixnél. 15
2009. 03. 21.
Bioinformatika 2
Fehérjeszekvenciák és szerkezetek analízise 1. Egyszerű fehérje elemzések 2. Térszerkezet előrejelzése 2.1. A probléma bonyolultsága 2.2. A predikció szintjei 2.3. 1D predikciók (másodlagos szerkezet, hozzáférhetőség, transzmembrán hélixek) 3. Térszerkezetek kísérleti meghatározása 3.1. Fehérje szerkezetek kristályos fázisban (Röntgen diffrakció) 3.2. Fehérje szerkezetek oldatfázisban (NMR módszerek) 4. Térszerkezetek elemzése 4.1. Másodlagos szerkezet elemzése 4.2. Fehérje szerkezet minősége 4.3. Szerkezeti motívumok 4.4. Kölcsönhatás ligandumokkal 4.5. Egyéb (töltésviszonyok, felszínek, üregek) 16
2009. 03. 21.
Bioinformatika 2
Egyszerű fehérje elemzések Fehérjeazonosítás (ld.: EXPASY Tools – AACompIdent, Multident, ...)
AACompIdent: (http://www.expasy.ch/tools/aacomp/) Fehérje azonosítása aminosav összetétel ill. opcionálisan még pI (izoelektromos pont) és Mw (molekulatömeg) alapján a SwissProt/TrEMBL adatbázisokban (-> rangsorolt lista a bevitt adatokhoz hasonló fehérjékről -> esetleges távoli homológiák találhatóak!)
17
2009. 03. 21.
Bioinformatika 2
Fehérjeazonosítás tömegspektrometriai módszerekkel Adott proteázzal (pl. tripszin) való emésztés után a képződő peptid fragmentumok pontos molekulatömege tömegspektrometriával mérhető, így a fehérje azonosítható (tömeg ujjlenyomat – mass fingerprinting) Elterjedt módszer: MALDI (Matrix Assisted Laser Desorption/Ionisation Mass Spectrometry)
MALDI-TOF: a fehérjét (ill. fragmentumait) UV elnyelő anyagba ágyazzák (mátrix), ezt a réteget pulzáló UV lézerrel besugározzák. Az ionizált molekulák leválnak a mátrixról. Az elektromos térben felgyorsított ionok becspódását detektáljuk. A becsapódásig eltelt időből (time of flight - TOF) számítható a tömeg.
18
2009. 03. 21.
Bioinformatika 2
Fehérje elemzés – Mass fingerprinting MOWSE, MASCOT: Az emésztéshez használt proteáz és a peptidtömegek megadásával rangsorolt listák nyerhetőek a megadott adatoknak megfelelő, elsődleges fehérje szekvencia adatbázisban (pl. OWL, SwissProt, stb. megtalálható fehérjékről
19
2009. 03. 21.
Bioinformatika 2
Térszerkezet előrejelzés bonyolultsága Általános cél: határozzuk meg egy adott fehérje(szekvencia) azon konformációját, amelyhez a szabadentalpia globális minimuma tartozik. Kisebb modellek segítségével igazolható, hogy a feladat ún. NP−nehéz, azaz a megoldáshoz szükséges idő a (fehérje)mérettel nempolinomiális függvény szerint (hanem gyorsabban) növekszik (tehát a probléma adott mérethatár fölött nem megoldható.) A valós fehérjék esetében a probléma legtöbbször kezelhető, mert ¾a valós fehérjék szekvenciái meglehetősen specifikusak (evolúció során kiválogatódtak); ¾a predikcióhoz tudásbázisként felhasználhatjuk a már ismert térszerkezeteket
20
2009. 03. 21.
Bioinformatika 2
Térszerkezet előrejelzés szintjei
21
2009. 03. 21.
Bioinformatika 2
Térszerkezet előrejelzés szintjei
1D: egy dimenziós string-ként leírható, az egyes aminosavakhoz rendelhető tulajdonságok Pl.: szekvencia, másodlagos szerkezet, oldószer általi elérhetőség, hidrofobicitás
22
2009. 03. 21.
Bioinformatika 2
Térszerkezet előrejelzés szintjei
2D: aminosavpárok közötti távolságok, kontaktusok
Pl.: HB plot – hidrogénhidas kötések elemzése) 23
2009. 03. 21.
Bioinformatika 2
Térszerkezet előrejelzés szintjei
3D: az összes atomi koordináta megadása ab-initio módszerek Homológia modellezés
24
2009. 03. 21.
Bioinformatika 2
EXPASY Tools: http://www.expasy.ch/tools/#primary/
1D predikciók – Másodlagos szerkezet
25
2009. 03. 21.
Bioinformatika 2
1D predikciók – Másodlagos szerkezet 1. és 2. generációs módszerek: az egyes aminosavak különböző másodlagos szerkezetekben való előfordulási gyakoriságai alapján. Pontosság <70%, β-szerkezetre csak 28−48%, túl rövid α−hélixek és β−szálak ¾ Chou−Fasman: α−hélix: 6 egymás melletti aminosav közül 4 hélixbéli előfordulási valószínűsége legalább 1,03; β−szál: 5 egymás melletti aminosav közül 3 β−szálbéli előfordulási valószínűsége legalább 1,0. Kiterjesztés mindkét irányban, amíg 4 egymás melletti aminosav átlagos α−hélix, ill. β−szál képzési valószínűsége 1,0 alá nem csökken ¾ GOR (Garnier−Osguthorpe−Robson): 17 aminosav szélességű ablakban vizsgálja az aminosavakat, előfordulási gyakoriság alapján jósolja az ablak közepén található aminosav másodlagos szerkezetét 3. generációs módszerek: a vizsgált szekvenciákhoz hasonlóakból többszörös összerendezés, majd a többszörös összerendezésekben található információk felhasználása [pl. információk az együtt mutálódó aminosavakról (korrelált mutációk), amelyek a térszerkezetben általában egymáshoz közel vannak]. Mivel tehát a többszörös összerendezés információt tartalmaz a fehérje harmadlagos szerkezetéről, így lehetővé teszi a másodlagos szerkezet jóslását.
26
Konszenzusos módszerek: több módszert (fejlettebb 2. és 3. generációs módszereket) 2009.alkalmaznak, 03. 21. Bioinformatika 2 és az eredmények konszenzusát veszik.
B. Rost.: Meth. Enzymol. 1996, 266, 525-539.
Másodlagos szerkezet – PHD módszer
1. Rokon szekvenciák a SwissProt adatbázisból (BLAST program) 2. Többszörös összerendezés (MaxHom program) 3. Az összerendezés szűrése, jó homológok megtartása, újbóli összerendezés 4. A végső összerendezés alapján minden pozícióra elkészül az előforduló aminosavcserék profilja 5. Ez a neuronhálózat bemenete (két szintű: PHDsec és PHDhtm; vagy egy szintű: PHDacc) 27
2009. 03. 21.
Bioinformatika 2
PredictProtein: http://www.predictprotein.org/submit.php
Másodlagos szerkezet – PHD módszer
28
2009. 03. 21.
Bioinformatika 2
PredictProtein: http://www.predictprotein.org
Másodlagos szerkezet – PHD módszer
29
2009. 03. 21.
Bioinformatika 2
Másodlagos szerkezet – Konszenzus módszer
Ezen az ábrán három automata szekunder szerkezet predikció (PHD, SOPMA and SSPRED) látható 12 glutamil tRNA reduktáz szekvencia alatt A konszenzus szekvencia és a szemrevételezés tovább finomíthatja az eredményeket
30
2009. 03. 21.
Bioinformatika 2
JPred: http://www.compbio.dundee.ac.uk/~www-jpred/
Másodlagos szerkezet – Konszenzus módszer
31
2009. 03. 21.
Bioinformatika 2
JPred: http://www.compbio.dundee.ac.uk/~www-jpred/
Másodlagos szerkezet – Konszenzus módszer
32
2009. 03. 21.
Bioinformatika 2
Oldószer elérhetőség becslése
Oldószer elérhetőség becslés ¾ Az adott oldallánc felszíni vagy eltemetett ¾ Kezdetleges módszerek: az oldallánc hidrofobicitása alapján −> gyenge eredmény ¾ Jobb becslés: evolúciós információ bevitele többszörös összerendezésekkel −> 75% pontosságú jóslás (PHDacc) Az előző példákból látható volt, hogy a legtöbb szekunder szerkezet becslő program becslést ad az oldószer elérhetőségről is.
33
2009. 03. 21.
Bioinformatika 2
2D predikciók Oldallánc kölcsönhatások becslése
Az összes oldallánc kölcsönhatás figyelembe vételével elvben felépíthető a 3D szerkezet (ld. később NMR módszerek) Kölcsönhatások becslésére felhasznált sajátságok/adatok: ¾ a szekvenciában távoli aminosavak együtt előforduló (korrelált) mutációi ¾ statisztikai adatok ¾ átlagtér−potenciálok ¾ neuronhálózatok Az oldallánc kölcsönhatások becslésére tett eddigi próbálkozások nem jártak kielégítő eredménnyel.
34
2009. 03. 21.
Bioinformatika 2
3D szerkezetek – Kísérleti módszerek ? Valóság - Kísérlet – Modell ?
?
35
2009. 03. 21.
Bioinformatika 2
Fehérjék szerkezetének meghatározása HTP kristályosítás
36
2009. 03. 21.
Bioinformatika 2
Fehérjék szerkezetének meghatározása HTP kristályosítási eredmények
37
2009. 03. 21.
Bioinformatika 2
Fehérjék szerkezetének meghatározása Röntgen krisztallográfia
38
2009. 03. 21.
Bioinformatika 2
Fehérjék szerkezetének meghatározása NMR spektroszkópia
Az NMR mérések során a magok mágneses perdületének változásai követhetőek a magok környezetétől függően. Értkető módon a magok érzékenyen reagálnak a kémiai környezet változásaira így a módszer erről ad információt. Az NMR spektroszkópusok alapvetóen a proteinek oldatfázisú szerkezetét képesek vizsgálni. Fontos információk nyerhetőek a fehérjék dinamikus viselkedéséről is.
39
2009. 03. 21.
Bioinformatika 2
Fehérjék szerkezetének meghatározása NMR módszer lépései
40
2009. 03. 21.
Bioinformatika 2
Fehérjék szerkezetének meghatározása NMR spektroszkópia
41
2009. 03. 21.
Bioinformatika 2
42
2009. 03. 21.
Bioinformatika 2