Bioinformatika 2 − 9. előadás Prof. Poppe László BME Szerves Kémia és Technológia Tsz. Bioinformatika – proteomika Előadás és gyakorlat
2017.11.06.
Bioinformatika 2
Térszerkezet előrejelzés fő módszerei
Homológia modellezés (komparatív modellezés): ha található ismert térszerkezetű, a vizsgált szekvenciával elegendően nagy azonossággal (> 20%) rendelkező homológ, akkor annak térszerkezete alapján a vizsgált szekvencia térszerkezete modellezhető Tekeredés felismerés (fold recognition): ha található az ismert térszerkezetek között a vizsgált szekvenciával alacsony szekvenciaazonosságot mutató ám kompatibilis tekeredés, akkor homológia modellezéssel erre is készíthető szerkezet.
Ab initio predikció: ismert térszerkezetű fehérjével nincs megfelelő szekvenciaazonosság és kompatibilis tekeredés sem található. A térszerkezet előrejelzése ekkor fizikai elvek felhasználásával kísérelhető meg.
2017.11.06.
Bioinformatika 2
A bioinformatika térképe
3
2009. 04. 17.
Bioinformatika 2
Hatóanyag-receptor kölcsönhatás modellezés Receptor primer szekvencia
Ligandum szerkezete kémiai 3D Farmakofór modellezés (QSAR, AAA,CoMFA)
3D Receptor modellezés
”Farm” ligand konformáció
3D kötöhely
Dokkolá s Fejlettebb kvantummechanikai módszerek (pl. QM/MM) alkalmazhatóak
4
2009. 04. 17. 2017.11.06.
A hatóanyag–receptor kölcsönhatás elméleti modellezésének folyamatábrája és kapcsolata a kísérletekkel.
Ligandum-receptor komplex Stabilitás elemzése (Molekuladinamika) Kötésenergia számítások (Szabadenergia szám.)
Az elméleti vizsgálatok a téglalapokban, míg a kísérleti adatok az ellipszisekben találhatóak. A szürke terület a kis molekulák modellezése, a fehér területek függenek össze a bioinformatikával. Bioinformatika 2
Farmakofór modellek készítése D1 dopamin receptor Aktív vegyületek
Farmakofór modell: a ligandumok térbeli egymásra illesztése. Mintegy az aktív hely 3D komplementer képe. megengedett farmakofór régiók
Inaktív vegyületek
nem megengedett régiók
5
2009. 04. 17.
Bioinformatika 2
Molekulák dokkolása fehérjékhez Kis molekula (ligandum, szubsztrát, koenzim, stb.) kötődésének jóslása / vizsgálata egy fehérje (receptor) felszínén ill. belsejében
Két fehérje egymáshoz való illeszkedésének / kötődési helyének jóslása / vizsgálata Fehérje és DNS egymáshoz való illeszkedésének / kötődési helyének jóslása / vizsgálata
6
Az illeszkedés értékelésének módja: 1. Egyszerű geometriai illeszkedés figyelembe vétele 2. Az illeszkedés értékelése: bonyolult energiafüggvény, elektrosztatikus komplementaritás, stb. A modell szerint: 1. Mindkét molekula merev 2. Az egyik molekula (általában a ligandum) flexibilis, a másik (általában a fehérje) merev 3. Mindkét molekula flexibilis (a keresés nagyon időigényes) Az algoritmus szerint: Molekuladinamika Monte Carlo módszerek (pozíciók véletlenszerű generálása) Szimulált hőkezelés: szimuláció során magas hőmérsékletről lassan lehűtjük a rendszert, ez segíti az energiaminimum elérését Egyéb módszerek
Bioinformatika 2
QM/MM módszerek A fehérjék kezelése több régióban. Az aktív hely fontos részeit és a szubsztrátot (vagy terméket, reaktív intermediert, átmeneti állapotot) a pontosabb számításokra alkalmas QM régió tartalmazza.
Szubsztrát
QM régió MM régió
7
2017.11.06.
A QM régió elektronikus / kvantum kölcsönhatások elemzésére is alkalmas (szemiempírikus, HF ill. DFT módszerek). A fehérje többi részét klasszikus MM forcefield segítségével kezeljük.
Bioinformatika 2
QM/MM módszerek A klasszikus és a kvantum régió határfelülete MM régió
QM régió
Egy glutamát oldallánc felosztása kvantum és klasszikus régiókra. A terminális CH2CO2 csoportot kvantum mechanikával, míg a főlánc atomjait molekula mechankai force-field segítségével kezeljük. A vágási felület meghatározása a legnehezebb kérdés (általában C(sp3)-C(sp3) kötés mentén).
A határfelületek kezelésének két fő megközelítése van.
Az egyik az ún. ‘‘link atom approach’’ [MJ Field, PA Bash, M Karplus: J Comput Chem, 1989, 6, 700], ahol a QM régiót egy megfelelő virtuális atom hozzáadásával ”zárjuk le”.
8
A másik az ún. ‘‘ frozen orbital approach’’ [G Monard, M Loos, V Thery, K Baka, J-L Rivail: Int J Quant Chem, 1996, 58, 153]. Itt az elektronsűrűség határfelületre eső folyamatosságát egy a kvantum és klasszikus atom közötti ”megfagyasztott” pálya Bioinformatika 2 segítségével biztosítják (local self-consistent field, LSCF).
QM/MM módszerek alkalmazása A trióz-foszfát izomeráz (TIM) mechanizmus
Dihidroxiaceton foszfát
Enediolát
Enediol
Enediolát
Dglicerinaldehid3-foszfát
Az aktív hely fontos részeit és a szubsztrátot a reaktív intermediereket, átmeneti állapotokat ill. terméket QM/MM módszerekkel kezelve felderíthetővé vált a trióz-foszfát izomeráz (TIM) reakció lefutásának enzimen belüli pontos értelmezése [PA Bash, MJ Field, RC Davenport, GA Petsko, D Ringe, M Karplus: Biochemistry 1991, 30, 5826–5832; JR Knowles: Phil Trans Roy Soc Lond B 1991, 332, 115–121]. 9
2017.11.06.
Bioinformatika 2
Kötésenergia számítások Két független kísérlettel meghatározzuk két ligand és a receptor kötési szabadenergiáját: Ligand 1 + Receptor ΔG1 Ligand 1/Receptor Ligand 2 + Receptor ΔG2 Ligand 2/Receptor A két ligandum relatív kötési szabadenergiája a következő ciklikus séma szerint állapítható meg: Ligand 1 + Receptor ΔG1 Ligand 1/Receptor ⇓ ⇓ ΔG3 ΔG4 ⇓ ⇓ Ligand 2 + Receptor ΔG2 Ligand 2/Receptor ahol ΔG3 és ΔG4 formálisan megfelel a Ligand 1 -> Ligand 2 oldatfázisbeli ill. receptorhoz kötött állapotbeli kémiai átalakításnak szabadenergia különbségének. Mivel ΔΔGciklus = 0, ΔΔG = ΔG + ΔG - ΔG - ΔG = 0 ciklus
1
2
3
4
tehát ΔΔGkötés = ΔG1 - ΔG2 = ΔG3 - ΔG4 10
A relatív ΔΔGkötés értékek alkalmazása kiküszöböli a tényleges ligandum receptor ΔG1 és Bioinformatika 2 ΔG2 kötésállandók igen számításigényes meghatározásának szükségességét.
2009. 04. 17.
Célfehérjék azonosítása Néhány évvel ezelőttig a célfehérjék direkt kísérleti azonosítása nem volt megoldható. Történetileg csak néhány olyan gyógyszer ismert, melynek célfehérjéje ugyanakkor vált ismertté, mint maga a gyógyszer. Ennek az oka az, hogy az új gyógyszerek fejlesztése tradícionálisan nagyrészt a már ismert gyógyszerek módosításán alapult a molekuláris hasonlóságok intuitív alkalmazásával. A módosítások kísérletileg azonnal tesztelhetők voltak in vitro és in vivo. Így tehát a gyógyszer hatékonysága megítélhető volt akár a célfehérje ismerete nélkül is. Ennek a következménye az, hogy a jelenleg piacon található gyógyszerek becslések szerint egy kb. 4-500 tagú célfehérje készletre hatnak [Drews, J.: Die verspielte Zukunft, 1998, Basel: Birkhauser Verlag], miközben a potenciális célfehérje készlet 2-3000 fehérjére tehető [Bull & Doig: PLoS One, 2015, 10, e0117955] .
A célfehérjék azonosítása a mai orvos és gyógyszertudomány szűk keresztmetszete.
11
2017.11.06.
Bioinformatika 2
Célfehérjék azonosítása - genomika Manapság a molekuláris biológia új módszerei – melyek csak néhány éve fejlődtek ki – alapvetően új lehetőségeket biztosítanak a célfehérjék azonosítására. E fejlődés példájaként a DNS chip technológia [DeRisi, J. L, Iyer, V. R., Brown, P. O., Science, 1997, 278(5338), 680-686] említhető. Az általános képhez természetesen ezen kívül még számos fejlesztés alatt álló további módszer / lehetőség is tartozik. Az alábbi ábra szemlélteti a cellák (egy chip néhány 10 – ~2 millió cella) működési elvét:
rögzített próbák
Jelölt DNS (minta)
különböző tulajdonságok (pl. különböző gének kötése) teljesen komplementer szálak erősen kötődnek
12
2017.11.06.
részben komplementer szálak gyengébben kötődnek
Bioinformatika 2
Célfehérjék azonosítása - genomika
Az ábra egy DNS chip egy részletét mutatja. Ez a DNS chip különbség képet jelenít meg azon fehérjékról, melyeket az élesztő sejtek két különböző sejt-állapotben termelnek. Az egyik állapot (zöld) glükóz jelenlétében – a sejtek ”egészséges” állapotában – , a másik (piros) glükóz hiányában – a sejtek éhező állapotában – készült. A világos zöld foltok olyan fehérjéket jeleznek, melyek nagyrész a sejtek ”egészséges” állapotában expresszálódnak. A piros foltok olyan fehérjék, melyek zömében az éhező állapotban képződnek. Ha egy fehérje mindkét állapotban képződik, a folt sárga (a zöld és a piros szín additív keveréke). A sötét foltok olyan fehérjék, melyek nem nagy gyakorisággal expresszálódnak. A foltok színe alapján eldönthető tehát, hogy egy fehérje a sejt milyen állapotában képződik gyakrabban.
13
2017.11.06.
Bioinformatika 2
Célfehérjék azonosítása - genomika Igen fontos kérdés, hogy pontosan milyen kísérlet is eredményezi az adott képet. Ami ugyancsak nagy jelentőségű, az hogy milyen információ mennyiség rendelhető a kép egyes színes pontjaihoz. Ezzel kapcsolatban a következő általános megjegyzeseket tehetjük: 1. A fehérje azonosítására a színes folt koordinátái szolgálnak. Az egyszerűség kedvéért feltételezhetjük bár ez nem feltétlenül mindíg igaz, többszörös foltokat alkalmazhatnak pl. Kalibrációs célokból hogy a különböző foltok különböző fehérjéket jelentenek. A foltok pontos helyét a DNS chip gyártása előtt már meghatározzák. A DNS chip tervezése számos fehérje azonosítását és a chip felületén történő elrendezésének megoldását igényli. A pontos elhelyezkedés a határoló feltételektől és a kísérlet jellegétől is függ, de nem számottevő fontosságú az eredmények interpretálásának szempontjából.
14
2. Az egyes foltokhoz csak részleges / elemi információk rendelhetőek. A legjobb esetben a kísérlet a gén ill. fehérje teljes szekvenciájának felel meg. Számos esetben előfordul azonban, hogy a szekvenciának csak egy rövidebb ám szükségszerúen releváns 2009.részlete 04. 17. áll rendelkezésre. Bioinformatika 2
Genomika vs. proteomika A genomika módszereivel nem a tényleges fehérjéket vizsgáljuk, hanem azokat az expresszálódott géneket, amelyek transzlációja az adott fehérjét eredményezi. A proteomika módszereivel a ténylegesen képződött fehérjéket vizsgáljuk. Az előző ábrán látható DNS chip az expresszálódott génekről szolgáltat információkat, így tehát csak közvetett adatokhoz juthatunk a tényleges fehérje termékekről. A genomikai megközelítés előnye, hogy a gének kisérletileg jobban hozzáférhetőek és egyszerűbben kezelhetőek, mint a fehérjék. Ennek köszönhetően napjainkban a genomikai módszerek elterjedtebbek, mint a proteomikai eljárások. A kísérleti technikák fejlődésével párhuzamosan előre jelezhető a proteomika egyre nagyobb térnyerése.
15
Tisztában kell lennünk azonban a genomikai megközelítés hátrányaival is. Első az, hogy egy gén expressziós szintje nem feltétlenül felel meg a megfelelő protein magas sejtbéli koncentrációjának, holott ez fontosabb ha a tényleges protein expresszió mértékére és az ezzel összefüggő betegségre vagyunk kíváncsiak. Talán még fontosabb az, hogy a fehérjék jelentős része a transzlációt követően módosul (posttranslational modifications). Ilyen módosulások a glikozilálások (összetett cukor egységek fehérje felszínhez kötődése) és foszforilálások (foszfát egységek kötödése a fehérjéhez). Ezek a transzlációt követő módosulások az azonos primer aminosav szekvenciával rendelkező proteinek számos eltérő változatához amelyek számos 2009. 04. 17. vezethetnek. A genomika nem képes ezen módosulások követésére, Bioinformatika 2 esetben alapvető fontosságűak lehetnek.
Enzim adatbázisok Enzim nómenklatúra és osztályozási adatbázisok:
16
EXPASY – ENZYME:
http://www.expasy.ch/enzyme/
BRENDA:
http://www.brenda-enzymes.org/
2017.11.06.
Bioinformatika 2
Enzim adatbázisok Enzim adatbázisok:
Az enzimekkel összefüggő adatok és nómenklatúra részletes adatbázisai Minden olyan jellemzett enzimosztályt részletesen ismertetnek, amelyhez az EC (Enzyme Commission) EC számot rendelt hozzá
17
2017.11.06.
Bioinformatika 2
ENZYME: http://www.expasy.ch/enzyme/
ENZYME adatbázis
Keresés az ENZYME adatbázisban: EC szám szerint Enzim osztály szerint Leírás (official name) vagy alternatív név(ek) szerint Kémiai vegyületek szerint Kofaktor szerint A komment szövegeiben elóforduló szavakra
18
2017.11.06.
Bioinformatika 2
ENZYME: http://www.expasy.ch/enzyme/
ENZYME adatbázis
19
2017.11.06.
Bioinformatika 2
ENZYME: http://www.expasy.ch/enzyme/
ENZYME adatbázis
20
2017.11.06.
Bioinformatika 2
ENZYME: http://www.expasy.ch/enzyme/
ENZYME adatbázis
21
2017.11.06.
Bioinformatika 2
BRENDA: http://www.brenda-enzymes.org/
BRENDA adatbázis
Keresés a BRENDA adatbázisban (részletes keresési lehetőségek): Nómenklatúra szerint Reakció & specifitás szerint Funkcionális paraméterek szerint Izolálás és preparálás szerint Szervezet szerint Stabilitás szerint Enzim szerkezeti sajátságok szerint Betegségek és hasonló információk szerint Alkalmazás és mérnöki vonatkozások szerint
22
2017.11.06.
Bioinformatika 2
BRENDA: http://www.brenda-enzymes.org/
BRENDA adatbázis
23
2017.11.06.
Bioinformatika 2
BRENDA: http://www.brenda-enzymes.org/
BRENDA adatbázis
24
2017.11.06.
Bioinformatika 2
BRENDA: http://www.brenda-enzymes.org/
BRENDA adatbázis
25
2017.11.06.
Bioinformatika 2
BRENDA: http://www.brenda-enzymes.org/
BRENDA adatbázis
26
2017.11.06.
Bioinformatika 2
BRENDA: http://www.brenda-enzymes.org/
BRENDA adatbázis
27
2017.11.06.
Bioinformatika 2
BRENDA: http://www.brenda-enzymes.org/
BRENDA adatbázis
28
2017.11.06.
Bioinformatika 2
BRENDA: http://www.brenda-enzymes.org/
BRENDA adatbázis
29
2017.11.06.
Bioinformatika 2
BRENDA: http://www.brenda-enzymes.org/
BRENDA adatbázis
30
2017.11.06.
Bioinformatika 2
BRENDA: http://www.brenda-enzymes.org/
BRENDA adatbázis
31
2017.11.06.
Bioinformatika 2
BRENDA: http://www.brenda-enzymes.org/
BRENDA adatbázis
32
2017.11.06.
Bioinformatika 2
KEGG: http://www.genome.jp/kegg/
KEGG adatbázis rendszer
33
2017.11.06.
Bioinformatika 2
KEGG: http://www.genome.jp/kegg/
KEGG adatbázis rendszer - PATHWAY
34
2017.11.06.
Bioinformatika 2
KEGG: http://www.genome.jp/kegg/
KEGG adatbázis rendszer - PATHWAY
35
2017.11.06.
Bioinformatika 2
KEGG: http://www.genome.jp/kegg/
KEGG adatbázis rendszer - PATHWAY
36
2009. 04. 17.
Bioinformatika 2
KEGG: http://www.genome.jp/kegg/
KEGG adatbázis rendszer - PATHWAY
37
2017.11.06.
Bioinformatika 2