Bioinformatika 2016 A Magyar Tudományos Akadémia Bioinformatikai Osztályközi Állandó Bizottsága és a Magyar Bioinformatikai Társaság tudományos konferenciája
2016. november 10. MTA Természettudományi Kutatóközpont földszinti kis előadó terem 1117 Budapest, Magyar Tudósok körútja 2.
Program* Délelőtti 1. szekció, elnök: Patthy László 10:00 – 10:05 Köszöntő 10:05 – 10:30 Csermely Péter Semmelweis Egyetem, Orvosi Vegytani, Molekuláris Biológiai és Patobiokémiai Intézet
Molekuláris hálózatok adaptációs folyamatai 10:30 – 10:55 Csikász-Nagy Attila Pázmány Péter Katolikus Egyetem, Információs Technológiai és Bionikai Kar, King’s College London
Biológiai hálózatok matematikai modellezése térben és időben 10:55 – 11:20 Grolmusz Vince Eötvös Loránd Tudományegyetem, Természettudományi Kar, Matematikai Intézet
Az emberi agy gráfja 11:20 – 11:45 Kávé szünet
Délelőtti 2. szekció, elnök: Simon István 11:45 – 12:10 Boross Gábor Magyar Tudományos Akadémia Szegedi Biológiai Központ, Biokémiai Intézet
A kompenzáló evolúció rendszerszintű vizsgálata élesztőben 12:10 – 12:35 Makai Szabolcs Magyar Tudományos Akadémia Agrártudományi Kutatóközpont, Mezőgazdasági Intézet
Okos hálózatok, avagy hogyan tegyük a ko-expressziós hálózatokat biológiailag relevánsabbá 12:35 – 13:10 Ebéd szünet
Délutáni 1. szekció, elnök: Harrach Balázs 13:10 – 13:35 Dosztányi Zsuzsanna Eötvös Loránd Tudományegyetem Természettudományi Kar Biokémiai Tanszék
Az LC8 dinein könnyű lánc kölcsönhatási hálózatának feltérképezése bioinformatikai módszerekkel. 13:35 – 14:00 Turu Gábor Semmelweis Egyetem, Általános Orvostudományi Kar, Élettani Intézet
Szaglás és tumorellenes gyógyszerek interakcióinak predikciója: tapasztalatok két DREAM Challenge-ről
1
14:00 – 14:25 Horváth Péter Magyar Tudományos Akadémia Szegedi Biológiai Központ, Biokémiai Intézet
Fenomika: élet a pixelek mögött. Sejtek fenotípusos elemzése nagy áteresztőképességű mikroszkópia segítségével 14:25 – 14:45 Kávé szünet
Délutáni 2. szekció 14:45 – 15:45 Fórum a bioinformatika magyarországi helyzetéről, jövőjéről, a bioinformatika oktatásáról
(* A Magyar Bioinformatikai Társaság a tudományos program előtt tartja a közgyűlését. Amennyiben a közgyűlés határozatképtelen lenne, az megismételt közgyűlést a délelőtti szekciók közötti szünetben, 11:20-tól lesz megtartva.)
2
Előadások kivonatai Boross Gábor Magyar Tudományos Akadémia Szegedi Biológiai Központ, Biokémiai Intézet
A kompenzáló evolúció rendszerszintű vizsgálata élesztőben A klasszikus darwini evolúciós nézet szerint az adaptáció előnyös változatok egymás utáni elterjedésével, a populációban való fixálódásával történik. Ugyanakkor káros mutációk is elterjedhetnek a genomban, amelyek negatív hatása az organizmus rátermettségére enyhülhet kompenzáló evolúció segítségével. Kompenzáló evolúciónak nevezzük azt a jelenséget, amikor egy mutáció káros hatását a genom egyéb területein egy másik mutáció részben, vagy egészben kijavítja, ezért elterjed a populációban. A kompenzáló evolúció az adaptáció menetét nagyban módosíthatja. Munkánk során élesztő modellorganizmusban (Saccharomyces cerevisiae) rendszerszinten vizsgáltuk a génvesztésre mutatott kompenzáló evolúciót. A géndeléciós törzsekkel laboratóriumi evolúciós kísérletet végeztünk, hogy megvizsgáljuk az élesztő genom kompenzációs potenciálját, illetve olyan gén- és fehérjetulajdonságokat azonosítsunk, amelyek meghatározzák, hogy egy gén elvesztését képes-e kompenzálni az organizmus. Különböző táptalajokon végzett kísérletekkel meghatároztuk a kísérletünk során megfigyelt kompenzációk környezetfüggését és próbáltunk választ találni a kérdésre, hogy a kompenzáció vajon a kiütött gén funkciójának visszaállításán vagy a funkció helyettesítésén keresztül történike. Csermely Péter Semmelweis Egyetem, Orvosi Vegytani, Molekuláris Biológiai és Patobiokémiai Intézet
Molekuláris hálózatok adaptációs folyamatai Az előadás során néhány olyan modellt és vizsgálati eljárást mutatok be, amelyekkel a hálózatos kutatócsoportom (http://linkgroup.hu) tagjai komplex rendszerek adaptációját vizsgálják. A modellrendszerek közül vizsgáljuk a vastagbéltumor kialakulásának három stádiumát, a normál vastagbél-hám sejteket, a kezdeti tumornak megfelelő adenoma és az előrehaladott tumoros állapotnak megfelelő carcinoma állapotot. Megfigyeltük a hálózatos entrópia növekedését, majd csökkenését ezekben az esetekben. Adataink azt mutatják, hogy a jelátvitelben központi fehérjék szomszédjai is igen fontos gyógyszertargetek lehetnek a célzott kemoterápiás beavatkozások során. A másik modellrendszer a rákos őssejteknek, a "normál" tumorsejteknek és az egészséges sejteknek az összehasonlítása. Itt is a hálózatos entrópia növekedését figyeltük meg rákos őssejtek esetén a "normál" tumorsejtekhez képest. Rákos modellrendszerekben vizsgáljuk a jelátviteli hálózat által meghatározott állapottér attraktorait, az azok közötti lehetséges átmenetek valószínűségét és irányíthatóságát. Vizsgáljuk komplex, valós hálózatok a Hebb-szabály alapján történő "tanításának" és "újratanításának" hálózatszerkezeti következményeit is. Csikász-Nagy Attila Pázmány Péter Katolikus Egyetem, Információs Technológiai és Bionikai Kar, King’s College London
Biológiai hálózatok matematikai modellezése térben és időben Kutatócsoportunk a sejtek növekedésének és osztódásának szabályzásáért felelős molekuláris hálózatok dinamikai viselkedését vizsgálja. A hasadó élesztő sejtek polarizáltan növekednek és ez a polarizáció szabályozottan változik a sejtciklus folyamán. A két rendszer kapcsoltságáért felelős molekuláris regulációs hálózat nem teljesen ismert. Bioinformatikai, modellezési és kísérleti módszerek kombinációjával felderítettük a szabályzó hálózat kulcselemeit és azok kölcsönhatásainak eredményeképp létrejövő dinamikai rendszer viselkedését. Az előadás összefoglalja ezeket az eredményeket és bemutatja a használt innovatív módszereket.
3
Dosztányi Zsuzsanna Eötvös Loránd Tudományegyetem Természettudományi Kar Biokémiai Tanszék
Az LC8 dinein könnyű lánc kölcsönhatási hálózatának feltérképezése bioinformatikai módszerekkel. A fehérje-fehérje kölcsönhatások egy jelentős része a fehérjék rendezetlen részein található lineáris motívumok és hozzájuk specifikusan kapcsolódó globuláris domének között jön létre. Bár a lineáris motívumok által közvetített kölcsönhatások nagyon fontos szerepet játszanak számos biológiai folyamatban, az ilyen típusú kölcsönhatások nagy része még feltárásra vár. Egy speciális lineáris motívum kötő fehérje az LC8, ami egy erősen konzervált, kis intracelluláris homodimer fehérje. Eredetileg a dinein motor komplex egyik könnyű láncát írták le, aminek a szállítmányok közvetítésében van szerepe. Azonban több mint ötven ismert, nagyon különböző folyamatokban részt vevő kötőpartnere arra utal, hogy az LC8 dineintől független funkcióval is rendelkezik. Jelenleg az LC8-ra mint egy általános eukarióta csomóponti fehérjére tekintenek, amelynek fő feladata különböző fehérjék oligomerizációjának elősegítése. A munkánk során az LC8 kölcsönhatási hálózatát vizsgáltuk bioinformatikai módszerekkel. Ehhez összegyűjtöttünk ismert LC8 kötő partnereket, irodalmi adatok illetve fehérje kölcsönhatási adatbázisok felhasználásával. A kötőrégiók szekvenciái alapján létrehoztunk egy pozíció specifikus pontozó mátrixot, illetve meghatároztuk az ismert partnerekre jellemző szekvenciális tulajdonságokat. Ezek alapján kidolgoztunk egy szűrési kritérium rendszert, amelynek révén további potenciális LC8 kötőpartnert azonosítottunk a humán proteomban. A lehetséges partnerek azonosításában rendkívül hasznosnak bizonyult egy általunk kidolgozott új szekvencia összehasonlító eljárás, amely lehetővé tette a motívumok evolúciós történetének pontosabb feltárását. A kidolgozott bioinformatikai eljárással új motívum osztályokat, ismert partnereken belül új kötőrégiókat, illetve további partnereket azonosítottunk. A meghatározott kötőpartnerek egy kis részét kísérletes vizsgálatoknak vetettük alá, amellyel igazoltuk, hogy a módszer valóban képes új kötőpartnereket azonosítani. Vizsgálataink nemcsak az LC8 fehérje kölcsönhatási hálózatának illetve sejten belül funkciójának jobb megértését segíthetik elő, hanem alkalmazhatóak egyéb lineáris motívum kötő domének esetén is. Grolmusz Vince Eötvös Loránd Tudományegyetem, Természettudományi Kar, Matematikai Intézet
Az emberi agy gráfja Az elmúlt években az MRI készülékek és a számítástechnikai háttér fejlődésével lehetővé vált az emberi agy gráfjának tanulmányozása. A neuron-szintű agygráf még az ecetmuslica 100 000 neuronja között sincs feltérképezve, így ma teljesen reménytelen az ember 80 milliárd neuronja közötti sejtszintű gráf megismerése. Azonban egy sokkal durvább, 1000 csúcsú agygráfot már az emberi agy esetében is fel tudunk építeni, itt a csúcsok az agy szürkeállományának 1-1,5 négyzetcentiméteres területeinek felelnek meg, és két csúcs össze van kötve éllel, ha egy diffúziós MRI alapú eljárással, az agy fehérállományában közvetlen összeköttetéseket találunk ezen két terület között. Kutatócsoportunk az amerikai Human Connectome Project adatait használva, több száz emberi agygráfot számolt ki, ezeket nyilvánosan elérhetővé tette, és sok, még sohasem vizsgált kérdést tanulmányozott az agygráfokra vonatkozóan. Többek közt megmutattuk, hogy a nők agygráfja matematikai és számítógéptudományi értelemben - sokkal jobb összeköttetésekkel rendelkezik, mint a férfiaké. Létrehoztuk a Budapest Reference Conectome Szervert, amellyel - több száz agygráfot tekintve - a gyakori és a kevéssé gyakori kapcsolatokat lehet feltérképezni. Felderítettük, hogy mely agyterületek belső kapcsolatai között nagyobb és melyek között kisebb az egyéni változatosság. A "konszenzus konnektome dinamika" jelenség felfedezésével, véleményünk szerint, leírhatjuk az agyi kapcsolatok fejlődését is, és ez a jelenség felhasználhatónak tűnik sok agygráf-él irányítására is. Horváth Péter Magyar Tudományos Akadémia Szegedi Biológiai Központ, Biokémiai Intézet
Fenomika: élet a pixelek mögött. Sejtek fenotípusos elemzése nagy áteresztőképességű mikroszkópia segítségével A BIOMAG (Biological Image Analysis and Machine Learning) kutatócsoport biológiai problémák megoldására fejleszt számítógépes algoritmusokat. Kutatásunkat a számítástudomány, az agykutatás, rákkutatás és az
4
omikák határterületére fókuszáljuk – mindezt kísérleti laboratóriumi, fénymikroszkópos, számítógépes képfeldolgozási, és gépi tanulási módszerek kombinációjának segítségével. Olyan interdiszciplináris projekteken dolgozunk, melyeknek célja sejtvonalak, primer emberi minták és szövetmetszetek sejtjeinek automatikus felismerése és azok morfológiájának leírása. Ennek megvalósítása érdekében, 2 és 3D mikroszkópiát új generációs képelemző és mesterséges intelligenciából származó módszerekkel kombináljuk. Projectjeink során baktériumokról, vírusokkal fertőzött sejtvonalakról, daganatos metszetekről, egér, patkány és emberi agyszeletekről készült gyakran 1.000-1.000.000 mikroszkópos képen 2 és 3D képszegmentálást végezünk, rekonstruáljuk az egyes sejteket illetve azok sejtalkotóinak struktúráját. Aktív regressziós és klasszifikációs gépi tanulási módszereink segítségével automatikusan azonosítjuk a sejtek fenotípusát. Speciális fenotípus osztályból származó egyes sejteken (1) célzott nagy felbontású mikroszkópos és elektrofiziológiai felvételeket készítünk, (2) omikai analízist végzünk, és (3) populáció szintű jellemzőket azonosítunk. A képi, molekuláris, omikai, és populáció szintű méréseinket a páciensek klinikai adataival kombinálva a jövőben lehetőségünk nyílik a páciensek közötti hasonlóságok elemzésére és ezen eredmények felhasználására a személyre szabott gyógyszertervezésben, vagy korai diagnosztikában. Makai Szabolcs Magyar Tudományos Akadémia Agrártudományi Kutatóközpont, Mezőgazdasági Intézet
Okos hálózatok, avagy hogyan tegyük a ko-expressziós hálózatokat biológiailag relevánsabbá. Új generációs transzkriptom szekvenálás egy robusztus eszköz, amelyet gyakran használnak genetikai funkciók és szabályozó körök feltárására. Ugyanakkor nem minden ko-expressziós esemény hordoz biológiailag releváns információt. Sőt, szigorúan véve RNS-szek elsősorban egy adott gén aktivitását mutatja, és csak indirekt módon utal a gén termékének aktivitására. Ezért az RNS-szekvenálásból nyert információk legelsősorban egy adott gén szabályozásáról, pontosabban szabályozó régiójáról add felvilágosítást. A transzkriptom adatok társítása a szabályozó régió elemeinek adataival egy ígéretes eszköz lehet a szabályozó körök feltárására.
Turu Gábor Semmelweis Egyetem, Általános Orvostudományi Kar, Élettani Intézet
Szaglás és tumorellenes gyógyszerek interakcióinak predikciója: tapasztalatok két DREAM Challenge-ről A DREAM Challenge-ek a rendszerbiológia és transzlációs medicina területén kiírt versenyek, ahol a résztvevők különböző biológiai problémákra dolgoznak ki modelleket, melyeket a szervezők a versenyzők számára ismeretlen adatsorokon validálnak. A DREAM Olfaction Predicting Challenge során a Rockefeller University Smell Study még nem publikált kísérletsorozatának eredményeit felhasználva kellett olyan modellt kidolgozni, mely a molekuláris struktúra alapján prediktálja szaganyagok illatát. A kísérletek során 49 kísérleti alany szagolt meg 476 illatanyagot, 2 különböző koncentrációban, majd ezek intenzitását, kellemességét és 19 egyéb minőségi tulajdonságát osztályozta. A versenyzők rendelkezésére állt a 476 illatanyag kémiai struktúrája, az ezekből számított un. Dragon deszkriptorok (4780, a molekula szerkezetét jellemző paraméter) illetve 338 illatanyag esetén a kísérleti eredmények. A versenyzők feladata ezen adatok alapján olyan modellek létrehozása volt, melyek egyéni illetve populációs átlag szinten prediktálják az illat erősségét és minőségét a molekuláris struktúra alapján. A DREAM Challenge szervezői a további 138 szaganyagon tesztéltek a modelleket, és választották ki a legjobban teljesítőeket. Munkacsoportunk a Dragon deszkriptorok mellett az un. Morgan fingerprint-ek közötti hasonlóságot felhasználva dolgozott ki egy többszörös lineáris regresszió alapú modellt, amivel a szaganyagok intenzitását 0.71/0.53 (populációs/egyéni predikció), kellemességét 0.58/0.34, a további minőségi tulajdonságokat átlagosan 0.53/0.21 korrelációval prediktáltuk. Ezzel munkacsoportunk az egyéni predikcióban 2/18, a populációs predikcióban 7/19 helyezést ért el. Az AstraZeneca-Sanger Drug Combination Prediction DREAM Challenge során tumerellenes szerek kombinációjának szinergizmusát kellett prediktálni. A vizsgálathoz az Astra-Zeneca 118 szer és 85 sejtvonal összes kombinációja közül megvizsgát 11500-at, és az adatok egy részéből kellett prediktálni más drogpár-
5
sejtvonal kombinációk esetén az egyes drogok szinergizmusát. A predikciókhoz expressziós, metilációs, kópiaszám, szövettípus, monoterápia adatokat, az alkalmazott drogok célpontját és a drogok molekuláris struktúráját, valamint egyéb irodalmi adatokat használhattak a versenyzők. A munkacsoportunk által (nemzetközi kollaborációban) kidolgozott “regressziós fa” alapú modell a megadott adatokon kívül a befolyásolt jelátviteli útvonalakra vonatkozó információkat használt fel. Mindhárom meghirdetett kérdéskörben a csapatunk második helyezést ért el.
6