Bioinformatika 2 − 7. előadás Prof. Poppe László BME Szerves Kémia és Technológia Tsz. Bioinformatika – proteomika Előadás és gyakorlat
2009. 04. 03.
Bioinformatika 2
Térszerkezet előrejelzés fő módszerei
¾Homológia modellezés (komparatív modellezés): ha található ismert térszerkezetű, a vizsgált szekvenciával elegendően nagy azonossággal (> 20%) rendelkező homológ, akkor annak térszerkezete alapján a vizsgált szekvencia térszerkezete modellezhető ¾Tekeredés felismerés (fold recognition): ha található az ismert térszerkezetek között a vizsgált szekvenciával alacsony szekvenciaazonosságot mutató ám kompatibilis tekeredés, akkor homológia modellezéssel erre is készíthető szerkezet. ¾Ab initio predikció: ismert térszerkezetű fehérjével nincs megfelelő szekvenciaazonosság és kompatibilis tekeredés sem található. A térszerkezet előrejelzése ekkor fizikai elvek felhasználásával kísérelhető meg.
2
2009. 04. 03.
Bioinformatika 2
Térszerkezet előrejelzés lehetőségei
3
2009. 04. 03.
Bioinformatika 2
A szekvenciaösszerendelések két zónája Aminosav azonosság %
Összerendezett aminosavak száma 4
2009. 04. 03.
Bioinformatika 2
Homológia modellezés alapesete start
célszekvencia rokon szerkezetek azonosítása
Templát szerkezet
templát kiválasztása
célszekvencia és templát összerendelése
összerendelés
cél modell építése a templát szerkezetből
Cél modell cél modell elemzése
nem
igen
5
2009. 04. 03.
Bioinformatika 2
Homológia modellezés lépései
A gyakorlatban a homológia modellezés többlépcsős folyamat az alábbiak szerint: 1. Templát felismerés és kezdeti összerendelés 2. Összerendelés kiigazítása 3. Főlánc generálás 4. Hurok modellezés 5. Oldallánc modellezés 6. Modell optimalizálás 7. Modell validálása 8. Iteráció
6
2009. 04. 03.
Bioinformatika 2
Homológia modellezés automatizálása
Szerver
URL
Automatikus homológia modellező szerverek SwissModel http://swissmodel.expasy.org/ 3D-Jigsaw http://www.bmm.icnet.uk/servers/3djigsaw/ CPHModels http://www.cbs.dtu.dk/services/CPHmodels/ EsyPred3D http://www.fundp.ac.be/urbm/bioinfo/esypred/ Robetta http://robetta.bakerlab.org/ Fél-automatikus homológia modellező szerverek (saját összerendelést igényelnek) WHAT If http://swift.cmbi.kun.nl/WIWWWI/ HOMER http://protein.cribi.unipd.it/homer/help.html
7
2009. 04. 03.
Bioinformatika 2
Homológia modellezés – térszerkezeti hasonlóság
elasztáz
tripszin
Az elasztáz és a tripszin szerkezeti összeillesztése
A két szerin proteáz, az elasztáz és a tripszin esete mutatja, hogy a kémailag meglehetősen divergens (ld. a két ábrán az eltérő karakterű aminosavakat) és nem túl magas szekvencia azonosságot mutató (kb. 37 %) szerkezetek között is nagyfokú térszerkezeti azonosság lehetséges 8
2009. 04. 03.
Bioinformatika 2
Homológia modellezés – szekvencia összerendelés A homológia modellezés limitáló tényezői a célszerkezet és a templát közötti szekvencia azonosság százalékának függvényében:
Sebesség
Minőség
Összerendelés
Felismerés
Első lépés: modell szekvencia - PDB szekvencia tipikus BLAST eredménye:
9
2009. 04. 03.
Bioinformatika 2
Homológia modellezés – 1. Szekvencia összerendelés
A VATTPDKSWLTV és ASTPERASWLGTA szekvenciák összerendelési mátrixa (az összerendelési mátrix kialakítása: ld. korábbi előadások) A jobboldali összerendelést eredményező útvonalat a szürke sáv jelzi. A hasonló sajátságú aminosavakat csillag (*) jelzi. A szaggatott vonal egy alternatív összerendelést jelöl, amely magasabb összerendelési pontszámmal rendelkezne, de egy új beszúrást igényel (gap penalty). 10
2009. 04. 03.
Bioinformatika 2
Homológia modellezés – 1. Szekvencia összerendelés A mai gyakorlatban a célszekvenciát betápláljuk a Web-en elérrhető számtalan BLAST szerver egyikébe úgy, hogy az a cél szekvenciát a PDB adatbázis ellen vizsgálja, várunk pár másodpercet, amjd megkapjuk a találatok listáját - a modellezés alapjául szolgáló templátokat és a megfelelő összerendeléseket. Általában a legnagyobb szekvencia azonosságot mutató találatot választjuk templátnak, de ne feledjük, hogy egyéb szempontokat is figyelembe kell / lehet venni (pl. a fehérjének lehetnek aktív / inaktív kísérleti szerkezetei, fontos lehet a szerkezetben a kofaktor ill. egyéb ligandumok jelenléte, multimer komplexek, stb.). Manapság, a számítási teljesítmények növekedése lehetővé teszi többszörös templátok alkalmazását a modellezéshez és a legjobb modell kiválasztását a további vizsgálatokhoz. Ugyancsak lehetséges több templát kombinálása egyetlen szerkezetté, amelyet a modellezéshez felhasználunk. Az online automatikus Swiss-Model és Robetta homológia modellező szerverek (Peitsch et al., 2000 and Kim et al., 2004) például ezt a módszert alkalmazzák. 11
2009. 04. 03.
Bioinformatika 2
Homológia modellezés – 2. Szekvencia összerendelés korrekció
A kis szekvencia azonosságú régiók problémája: Az A és B szekvenciákat lehetetlen összerendezni, hacsak igénybe nem vesszük a homológ C szekvenciát. A fenti példa szemlélteti a többszörös szekvencia összerendelés koncepció hasznosságát a homológia modellezés során. A rokon szekvenciák többszörös összerendelésére több program is rendelkezésre áll, pl. CLUSTALW
12
2009. 04. 03.
Bioinformatika 2
Homológia modellezés – 2. Szekvencia összerendelés korrekció
Jó modell
Templát
Rossz modell 13
2009. 04. 03.
Bioinformatika 2
Homológia modellezés – 3. Főlánc konformáció előállítás Amint a szekvencia összerendelés kész, a modell készítés indulhat. A főlánc generálása triviális a legtöbb modell esetében: egyszerűen a templát szerkezet összerendelésben szereplő aminosavainak főláncbéli atomkoordinátáit át kell másolni a modellbe (ld. ábra). Ha a modell és templát aminosavak eltérnek, a főlánc N,Cα,C és O koordináták és sok esetben a Cβ másolható. Ha az aminosavak megegyeznek, az oldallánc atomkoordinátái is másolhatóak.
14
2009. 04. 03.
Bioinformatika 2
Homológia modellezés – 3. Főlánc konformáció előállítás A kísérleti fehérjeszerkezetek sem tökéletesek. A hibák eredhetnek kristályosítás során történő részleges degradációból, a gyenge elektronűrűségi képból, vagy akár a szerkezetmegoldás / közététel során elkövetett emberi hibákból. Jellemző, hogy a PDB 2007 végi állása szerinti 50’000 szerkezetben több mint 25’000’000 probléma található. Kézenfekvő megoldás, hogy több templát esetén a kevesebb hibát tartalmazót válasszuk [PDBREPORT, www.cmbi.ru.nl/gv/pdbreport, Hooft et al. 1996].
15
Mi a teendeő, ha két templát szerkezet létezik, mindegyik gyengébben definiált régiókkal, de a rosszabb minőségű régiók nem ugyanott találhatóak? Nyilvánvaló, hogy célszerű a jó régiókat kombinálni. Ezen az elven alapulnak többszörös templátot felhasználó modellezési módszerek. Bár ez egyszerűnek tűnik (ld. automata modellező szerverek: Swiss-Model, Robetta), a gyakorlatban nem egyszerű olyan szerkezetet találni, amelyik ténylegesen jobb, mint a felhasznált templátok együttesen. Azt hogy ez lehetséges a CASP4 során Andrej Šali csoportja bizonyította (DALI). 2009. 04. 03.
Bioinformatika 2
Homológia modellezés – 4. Hurkok modellezése
Az esetek többségében a modell és a templát szerkezet közötti összerendelés beszúrásokat ill. törléseket is tartalmazhat. A törlések esetében egyszerűen kihagyjuk a templát felesleges részeit és a képződő hiányt összekötjük. A beszúrások esetén a templát folyamatos láncát elhasítjuk, majd beszúrjuk a modellbe a plusz aminosavak alkotta hurkot. Belátható, hogy mindkét eset a főlánc konformáció változásával jár. 16
2009. 04. 03.
Bioinformatika 2
Homológia modellezés – 4. Hurkok modellezése Jó hír: a konformációs változások nem szokták érinteni a reguláris szekunder szerkezeti elemeket. Ezért a beszúrások eléggé nagy biztonsággal helyezhetőek a hélix ill. redő szerkezeteken kívül eső régiókba, a hurkokba és kanyarokba. Rossz hír: A hurok-konformációkat igen nehéz előre jelezni (ez a homológia modellezés jelenlegi legkomolyabb megoldatlan problémája).
17
2009. 04. 03.
Bioinformatika 2
Homológia modellezés – 4. Hurkok modellezése A valóságban sok esetben még akkor is jelentősen eltér a cél és a templát szerkezet hurok konformációja, ha nincsenek a szekvencia összerendelésben törlések ill. beszúrások. A hurok konformációkban történő eltérések három fő oka (Rodriguez és Vriend, 1997): ¾ A felszíni hurkok sok esetben kristály szerkezeti kölcsönhatásokban vesznek rész, ami jelentős konformációs eltéréseket okozhat a cél és a templát szerkezet között. ¾ Az egyes aminosavak esetében a kicsi ill. nagy térigényű oldaláncok cseréje jelentősen befolyásolhatja a főlánc elrendeződést. ¾ Hurokbéli aminosav mutációja prolinra, ill. hurokbéli glicin mutációja bármely más aminosavra. Mindkét esetben az új aminosavnak a Ramachandran plot jelentősen behatároltabb területére kell esnie, ami normál esetben hurok-konformáció változással jár. A rövidebb hurkok esetében (5-8 aminosav) a modellezett szerkezetek sok esetben jó konformációt szolgáltatnak. A kísérleti szerkezettől való eltérés felszini hurkok esetében esetenként kristály szerkezeti kölcsönhatások eredménye is lehet. 18
2009. 04. 03.
Bioinformatika 2
Homológia modellezés – 4. Hurkok modellezése A hurok modelezésnek három fő típusa van: ¾ Tudásbázis alapú (Knowledge base): a PDB vizsgálata olyan hurkokra, amelynek végpontjai megegyeznek a beszúrandóval, majs a hurok konformáció másolása. A főbb molekuláris modellező programok és szerverek alkalmazzák [pl. 3D-Jigsaw (Bates et al. 1999), Insight (Dayringer et al. 1986), Modeller (Sali et al. 1993), Swiss-Model (Peitsch et al. 2000), WHAT IF (Vriend, 1990)]. ¾ Rosetta-szerű: a kisebb részletekre osztott hurok részeit külön- külön hasonlítjuk a PDB szerkezetekhez (Kim et al., 2004). A kis fragmensek egy olyan ab initio hurok modellt adank, amely még ismert fehérjeszerkezeteken alapul. [p. ECEPP software by the Scheraga group (Zimmerman et al. 1977). ¾ Energia alapú: mint az igazi ab initio tekeredés predikció esetén, az energia funkciót használjuk a hurok jóságának a megítélésére. Monte Carlo (Simons et al. 1999) vagy molekula dinamika (Fiser et al. 2000) módszerek felhasználásával végzett energia minimalizálásokkal juthatunk a legjobb hurok konformációhoz. 19
2009. 04. 03.
Bioinformatika 2
Homológia modellezés – 5. Oldallánc modellezés - Hasonló fehérjéknél a Cα – Cβ kötés körüli torziós szögek gyakran megyegyeznek - Homológ ( > 40%) fehérjék esetében (legalább 75% ): a Cγ ugyanolyan orientációjú Æmagas szekvencia azonosság: a konzervált aminosavakat teljes egészében át lehet másolni a templátból a modellbe (pontosabb, mint a főlánc átmásolása + oldalláncok ab initio módszerekkel való előrejelzése) Æalacsony szekvencia azonosság (< 35%): az oldalláncok az esetek 45%-ban különböznek - Gyakorlatban: az oldallánc elhelyezés tudásbázis alapú Æ könyvtárakból - „Fix” könyvtárak: az egyes aminosav összes lehetséges oldallánc elhelyezkedési lehetősége tárolva van - „Pozíció specifikus” könyvtárak: az oldallánc megfelelő térbeli elhelyezkedésének kiválasztása a főlánc szerkezet szerint történik. -
20
Egyszerű: a főlánc másodlagos (hélix vagy redő) szerkezete alapján
Összetett: nagy felbontású szerkezetekből az adott aminosav (módszertől 2009. 04. 03. függően 5-9) egymásra helyezése során kapott főlánc nyújtási foka Bioinformatika 2 alapján
Homológia modellezés – 5. Oldallánc modellezés - Általában adott főlánc konformációnak egy oldallánc orientáció felel meg. - Példa olyan főláncra, amelyhez két oldallánc elhelyezkedés rendelhető hozzá:
A főlánc konformációhoz kétféle tirozin oldallánc elrendeződés rendelhető
21
2009. 04. 03.
Bioinformatika 2
Homológia modellezés – 5. Oldallánc modellezés - Az oldallánc elrendeződés előrejelzése a hidrofób részekre pontosabb, mint a felületi aminosavakra. Okai: - Kísérletek alapján: a flexibilis oldalláncok sokféle konformációt vehetnek fel - Elmélet alapján: a hidrofób részeket (Van der Waals kölcsönhatásokat) leíró energia funkciók egyszerűek, míg a felületi kölcsönhatások (vízzel való H-híd kötések és az ezzel járó entrópia effektusok) számítása sokkal bonyolultabb. De a felületi részek számítását több erőtér is tartalmazza már. - Biológiai okok: a felületi hurok részek sokszor ki kell mozduljanak, például ahhoz, hogy egy szubsztrát bejuthasson a fehérjébe. 22
2009. 04. 03.
Bioinformatika 2
Homológia modellezés – 6. Modell optimálás A modellező programok számítás kapacitása véges, a megoldás: az atomi pozíciók rögzítése és/vagy az energia minimalizálási lépések korlátozása (pár száz ciklusra).
Optimálási lehetőségek: - Molekulamechanikai erőtér: nagy molekulák kezelésére alkalmasak, csak az atommagok pozícióját veszik figyelembe. A Van der Waals vonzóerők például nehezen kezelhetők, ezért figyelmen kívül hagyják. Az erőtér pontossága nagyjából a klasszikus erőterekével összevethető. - Saját magát parametrizáló erőtér (self-parameterizing force-field): a Van der Waals sugarakat, atomi töltéseket is tartalmaz. - Molekula dinamikai szimulációk: femtoszekundum (10-15 s) időskálán szimulálja a fehérje mozgását. Előny: entrópia effektusokat is tartalmaz; Hátrány: nem elég pontos erőterek 23
2009. 04. 03.
Bioinformatika 2
Homológia modellezés – 6. Modell optimálás Homológia modellek energia minimalizációja
klasszikus erőtér
-
önmagát parametrizáló erőtér
-
14 HM két különböző erőtérben való optimálása során számolt RMSD átlag. Mindkét erőtér már ~500 ciklus után nagyjából kioptimálta a szerkezeteket, de a klasszikus erőtér rossz irányba mozdítja a modellt. A modell optimálás eléri a kísérletileg meghatározott szerkezetek pontatlanságát: ha az RMSD eléri ~ 0,5 Å
energia minimalizációs lépések száma x 1000
24
2009. 04. 03.
Bioinformatika 2
Homológia modellezés – 7. Modell validáció
A fehérjék 3D szerkezetvizsgálatára bemutatott módszerekkel: ¾ Ramachandran plot ¾ WhatIf ¾ PROCHECK
25
2009. 04. 03.
Bioinformatika 2