Genomikai Nemzeti Technológiai Platform (GNTP) „Adatfeldolgozás, bioinformatika” Munkacsoport
STRATÉGIAI KUTATÁSI TERV
Összeállította Barta Endre Patthy László
1
Tartalomjegyzék 1.
Helyzetelemzés .................................................................................................................... 3 1.1. A „Bioinformatika és adatfeldolgozás” munkacsoport célja és működési területének meghatározása.......................................................................................................................... 3 1.2. A genomikához vezető út a bioinformatikában ........................................................... 4 1.3. A bioinformatika magyarországi története .................................................................. 4 1.4. A bioinformatika mai helyzete Magyarországon......................................................... 6 1.5. A bioinformatika nemzetközi helyzete ........................................................................ 7 2. Jövőképe .............................................................................................................................. 9 2.1. „Felzárkózás és kitörés”:............................................................................................ 12 2.2. „Lassú víz”................................................................................................................. 13 2.3. „Megszegett ígéretek”................................................................................................ 14 2.4. „Sodródás” ................................................................................................................. 15 3. Stratégiai Kutatási Terv ..................................................................................................... 16 3.1. K+F területek és célok ............................................................................................... 16 3.1.1. Orvosi genomika................................................................................................ 17 3.1.2. Mezőgazdasági biotechnológia.......................................................................... 18 3.1.3. Ipari biotechnológia ........................................................................................... 20 3.2. Együttműködések....................................................................................................... 22 3.4. Oktatás, tudásmenedzsment....................................................................................... 23 3.4. Kutatási infrastruktúra fejlesztése.............................................................................. 25 3.4.2. Megvásárolni a bioinformatikai genomikai szolgáltatásokat magyar vagy külföldi cégektől ................................................................................................................ 27 3.4.2. Genomikai csoport illetve kutatóintézeti szintű bioinformatikai infrastruktúra kiépítése 27 3.4.5. Központi magyar genomikai bioinformatikai infrastruktúra kiépítése.............. 28 3.4.5. Javaslat a Magyar ELIXIR pont létrehozására .................................................. 29 3.4.5. Javaslat a magyar genomikai bioinformatikai infrastruktúra és kutatások támogatására ...................................................................................................................... 30
2
1. Helyzetelemzés 1.1. A „Bioinformatika és adatfeldolgozás” munkacsoport célja és működési területének meghatározása A Genomikai Nemzeti Technológiai Platform „Bioinformatika és adatfeldolgozás” munkacsoportja a genomikához kapcsolódóan elsősorban három területet vizsgál: 1. Mivel a genomika legnagyobbrészt a megszekvenált genomok vizsgálatán alapul, a hozzá kapcsolódó bioinformatika fő területe az elsődleges és a származtatott szekvencia információk elemzése. Ez magába fogalja: a. Az
elsődleges
szekvenálási
adatok
feldolgozását,
a
genomszekvencia
összerakását. b. A genom annotációt, amely alatt nem csak a gének (kódoló, pszeudo, riboszomális és transzfer RNS, kis RNS, mikro-RNS, nem-kódoló RNS stb. gének), genomra térképezését, hanem más tulajdonságok, mint például a repetitív szekvenciák, a DNS összetétel (például CpG szigetek) vagy éppen a kromatin szerkezet annotációját is. c. Az összehasonlító genomvizsgálatot, amely során különböző egyedekből, fajtákból vagy fajokból származó teljes vagy részleges genomszekvenciákat hasonlítanak össze és elemeznek. 2. A második fontos kihívás, a genom szintű vizsgálatok adatainak a számítógépes feldolgozása és elemzése. Ez tulajdonképpen a funkcionális genomika bioinformatikai támogatása. Jellemző, hogy ezekben az esetekben legtöbbször a vizsgált élőlény teljes genomszekvenciája ismert, ez teszi lehetővé a genom szintű vizsgálatokat. A legismertebb példa erre a mikroarray technika, amikor például egyszerre több, akár az összes gén expresszióját lehet vizsgálni. 3. Különálló területként említhetjük az előző két ponthoz kapcsolható, de inkább informatikai jellegű fejlesztéseket. Ezeket sokszor nem is biológusok, hanem például matematikusok, informatikusok végzik, és jellemző rájuk, hogy termékeiket nem csak a biológiában, hanem akár más tudományágakban vagy éppen a mindennapi életben is fel lehet használni. Az is előfordul, hogy más tudományágakban bevált algoritmusokat implementálnak bioinformatikai programokhoz. Jó példa erre például a mikroarray
3
feldolgozásban használt különféle klaszterező algoritmus, a genomillesztéshez használt módszerek vagy éppen a Google kereső algoritmusai, amelyek előbb-utóbb fel fognak bukkanni a genomikában is. Ezt a területet is két részre lehet bontani: a. A bioinformatikában használt programok, alkalmazások és az azok alapjául szolgáló algoritmusok fejlesztése. b. A bioinformatikai adatok tárolásához, megtekintéséhez, böngészéséhez és irányított elemzéséhez szükséges adatbázisok fejlesztése és fenntartása. 1.2. A genomikához vezető út a bioinformatikában A bioinformatikáról tulajdonképpen onnantól lehet beszélni, hogy először álltak a kutatók rendelkezésére szekvencia információk. Bár már az 50-es években meg tudták határozni kis peptideknek az aminosav sorrendjét, a bioinformatika robbanásszerű fejlődése, párhuzamosan a szekvenálási technológiák javulásával, a 70-es évekre tehető. Ebben az időszakban kezdték el a bioinformatikusok kidolgozni a szekvencia analízis legfontosabb algoritmusait, mint például a globális illesztést, a fehérjék kétdimenziós struktúrájának a meghatározását vagy a filogenetika alapmódszereit. A 80-as években a DNS szekvenálás térnyerése megindított egy folyamatot, amikor már szükség volt az adatok adatbázisba rendezésére, így kifejlődtek a legfontosabb és a mai napig is használt adatbázisok, mint az EMBL/GENBANK/DDBJ elsődleges DNS adatbázisok, a SWISSPROT/PIR fehérje adatbázisok, a PROSITE fehérjékre jellemző motívumokat, módosulásokat tartalmazó adatbázis, az EPD az eukarióta promóter adatbázis vagy a TRANSFAC, a transzkripciós faktor kötőhely adatbázis. A 90-es évek közepén azonban egy kisebb törést lehetett megfigyelni a bioinformatika fejlődésében, ugyanis kiderült, hogy nagyon nehéz az egyes gének szekvenciájának elemzésével általános következtetéseket levonni. A fellendülést a genom szekvenálások elindulása indította meg ismét, amit az utóbbi években elterjedt új generációs szekvenálási technológiák (Next Generation Sequencing, NGS) csak tovább fokoztak. 1.3. A bioinformatika magyarországi története A
nyolcvanas
évek
végén
elsősorban
a
szekvenálási
technikák
elterjedésével
Magyarországon is szükségessé vált a szekvenciák számítógépes kezelése. Erre az időszakra tevődött az első személyi számítógépek behozatala is az országba. Ez fontos volt, mivel az addig főleg az egyetemek informatikai karain használt (szó szerint) nagy számítógépekre
4
nyugaton nem fejlesztettek bioinformatikai programokat, a COCOM listás számítógépek pedig nem voltak elérhetőek a kutatók számára. Az első PC-ket nyugatról hazatérő kutatók hozták be az országba, és ezzel együtt már néhány bioinformatikai program is bekerült az országba, így például a Cornell Egyetem híres nucaln és protaln programjai. Megindult a programfejlesztés is, a szegedi József Attila Tudományegyetem Genetika Tanszékén és az SzBK-ban is térképező és egyszerű szekvencia analizáló programokat fejlesztettek. 1990-ben megnyitották a gödöllői Mezőgazdasági Biotechnológiai Kutatóközpontot, ahol már egy akkor még COCOM-listás MicroVAX számítógép és a hozzá kapcsolódó PC terminálok szolgálták a kutatást. A kilencvenes évek végéig a fő szekvencia analizáló programcsomag a GCG volt, amit először Gödöllőn telepítettek a MicroVax szerverre, majd az SzBK Enzimológián és később a Debreceni Egyetemen is egy-egy SUN UNIX alapú szerverre telepítettek adatbázisokkal együtt. 1993-ban a gödöllői MBK hivatalosan csatlakozott az Európai Molekuláris Biológiai Hálózathoz (European Molecular Biology Network, EMBnet) mint magyar központ („node”). Ezzel azt vállalta, hogy a GCG programcsomag liszenszét minden évben megvásárolja, az adatbázisokat napi alapon frissíti, és mindezeket ingyen elérhetővé teszi a magyar kutatók számára. Sok kutatónak abban az időben a gödöllői szerver jelentette az egyedüli e-mail levelezési lehetőséget is a szekvenciaanalízis mellett. Teljesen bioinformatikai jellegű kutatások az országban először az SzBK Enzimológiai Intézetében folytak, ahol Patthy László végzett úttörő munkát az extracelluláris fehérjék doménszerkezetének a felfedésével. Az MBK-ban Pongor Sándor köré gyűlt egy kisebb bioinformatikai csoport, azonban később közülük mindenki külföldre távozott Barta Endre kivételével, aki a gödöllői EMBnet központ vezetőjeként 1993-tól csak bioinformatikai kutatásokkal foglalkozott. 2000 után aztán több fontosabb, a genomikához konkrétan köthető, bioinformatikával is foglalkozó kutatócsoport is kialakult. Az SzBK Enzimológiai Intézetében a Patthy László vezette Funkcionális genomika csoport, az SzBK-ban a Pongor Sándor vezette Bioinformatika, a Debreceni Egyetemen az OEC Biokémiai és Molekuláris Biológiai Intézetében a Fésüs László és Nagy László által vezetett Apoptózis és genomika csoport, a Semmelweis Egyetemen a Falus András vezette Genetikai-, Sejt- és Immunológiai Intézet Orvosi Genomika Csoportja, valamint a martonvásári Mezőgazdasági Kutatóintézetben a Balázs Ervin vezette Alkalmazott genomikai osztály. Az ELTE-n Tóth Gábor és Miklós István is elkezdett több bioinformatikai projektet, de később Tóth Gábor az MBK-ba, Miklós István pedig a Rényi Intézetbe távozott. A Szegedi Tudományegyetemen a Biotechnológia Tanszéken kezdődtek elsősorban a baktériumgenomikához köthető bioinformatikai projektek. Gödöllőn az MBK-ban 2001-ben Patthy László segédletével megalakult egy Bioinformatikai csoport, 5
amelyet 2005-től Barta Endre vezetett, az intézet vezetése azonban 2008-ra teljesen leépítette, és meg is szüntette a csoportot. Fontos megemlíteni, hogy az SzBK-ban, a Semmelweis Egyetemen és a Debreceni Egyetemen is, elsősorban az előbb említett csoportokoz köthetően, több mikroarray, SNP és genomikai „core” facilitás kezdte el a működését. 1.4. A bioinformatika mai helyzete Magyarországon Az előbbiekből következően a bioinformatika mai magyarországi helyzetét jelentősen befolyásolta, hogy nem alakultak ki erős bioinformatikai csoportok Magyarországon, amit meg legnagyobbrészt azzal lehet magyarázni, hogy magyarországi csoportok nem csatlakoztak egyetlen nemzetközi genomikai (genom szekvenálási) projekthez sem, és az első magyar genom projektre is 2009-ig kellett várni. Bár több jelentős magyar bioinformatikai témájú publikáció is megjelent, igazából egyetlenegy pusztán genomikai bioinformatikával foglalkozó csoport sem tudott megerősödni Magyarországon. Ehelyett sok bioinformatikával foglalkozó kutató külföldön talált munkát, és több olyan kutató is van, aki az IT iparba távozott felhasználva a bioinformatika művelése során megtanult programozási, rendszerszervezési ismereteit. Mindezek ellenére az utóbbi egy-két évben talán elindult valami kedvező folyamat, amit a következőkkel lehet bizonyítani: 1. Az OTKA keretén belül önálló zsűrit kapott a bioinformatika 2007-ben, ami először tette lehetővé, hogy a kutatók bioinformatikai témájú pályázatokat eséllyel adjanak be. Sajnos azonban kiderült, hogy a zsűrihez inkább a bioinformatika algoritmus-fejlesztési területéhez, a proteomikához, a rendszer-szemléletű biológiához és más „egzotikus” teljesen interdiszciplináris bioinformatikai-biofizikai területekhez tartozó pályázatokat adtak be, genomikai témájúakat alig, és forráshiány miatt azok se nyertek. 2. Megalakult a Magyar Bioinformatikai Társaság, ami sikeresen összegyűjtötte a bioinformatikával foglalkozó magyar kutatókat, és konferenciák szervezésével fórumot teremtett nekik. 3. 2000 után meghonosodott a mikroarray technológia Magyarországon. Előbb Szegeden az SzBK-ban, majd a Semmelweis és a Debreceni Egyetemen, majd Gödöllőn az MBK-ban és Martonvásáron is elkezdtek mikroarray kísérleteket végezni különböző platformokon. A mikroarray eredmények kiértékelése pedig bioinformatikai módszereket kíván, tehát ezeken a helyeken a bioinformatika is erősödött. 4. A bioinformatika, genomika egyik fontos ága az adatbázisok készítése. A 2005-ös Nucleic Acids Research (NAR) adatbázis számában publikálták az első két teljesen magyar
6
fejlesztésű adatbázist (az SzBK Enzimológiáról a PDB-TM és az MBK-ból a DoOP adatbázis), majd később újabb nemzetközi jelentőségű magyar adatbázisokat publikáltak, mint például ugyancsak az Enzimológiáról a MisPred adatbázist. Az adatbázisok fejlesztéséhez genomikai, bioinformatikai módszereket kell használni, így ezek is fontosak a genomika magyarországi fejlődése szempontjából. 5. 2000 után több magyar kutatóintézetben is üzembe helyeztek második generációs kapilláris technológiát használó automata szekvenátorokat, ám a genomika szempontjából az igazi áttörés, hogy 2009-ben két cég is (a KPS és a Baygen) beszerzett egy-egy új generációs szekvenátort, ami kétség kívül hatalmas lökést ad a genomikai bioinformatika hazai fejlődésének. 6. Egészen 2009-ig a magyar genomika fejlődésének egyik jelentős hátráltatója az volt, hogy nem indult magyar genom projekt, és a magyar kutatók egyetlen egy külföldi genom programhoz se csatlakoztak, miközben nyilvánvaló, hogy amelyik csoport csatlakozott egy ilyenhez, ott a bioinformatika is hatalmas fejlődésnek indult. Ennek az az oka, hogy egy genom program gyakorlatilag két részből áll, egyrészt a klónozásból, a térképezésből és a szekvencia
meghatározásából,
másrészt
a
kapott
szekvencia
bioinformatikai
feldolgozásából, ami magába foglalja a szekvencia összerakását, annotációját és az elemzését is. 2009-ben végre elindult az első magyar genom projekt, amelynek során egy a BIOMI Biotechnológiai Szolgáltató Kft. által vezetett konzorcium a magyar mangalica sertésfajta genomszekvenciájának a meghatározását tűzte ki többek között célul. A szekvenálást a két magyar új generációs szekvenátorral rendelkező cég végzi, a bioinformatikai feldolgozást pedig az azóta megszűnt MBK Bioinformatikai csoport és a magyar EMBnet node volt infrastruktúráján végzik.
1.5. A bioinformatika nemzetközi helyzete A 80-as években elsősorban az elsődleges adatbázisok fejlesztésével párhuzamosan kialakultak a nagyobb bioinformatikai központok. Európában az EMBL adatbázis fejlesztése Heidelbergben kezdődött az EMBL laboratóriumban, majd létrejött Cambridge mellett a hinxtoni Genome Campus területén az Európai Bioinformatikai Intézet (European Bioinformatics Institute, EBI). A SWISSPROT, a PROSITE és az EPD adatbázisokat a svájci Lausanne-ban fejlesztették előbb csoport szinten, majd megalakult a Svájci Bioinformatikai Intézet (Swiss Institute of Bioinformatics). Amerikában az egyes, a bioinformatika
7
fejlődésében jelentős szerepet játszó egyetemek mellett (Wisconsin-i Egyetem, UCSC stb.) a Washington melletti Bethesdában működő, a GENBANK adatbázist fejlesztő NCBI a legjelentősebb bioinformatikai központ. Kevésbé jelentős szerepe van Japánban a DDBJ adatbázissal kapcsolatban 1995-ben alapított „Center for Information Biology and DNA Data Bank of Japan” bioinformatikai központnak. A 90-es években Európában jelentős szerepe volt a bioinformatika fejlődésében az EMBnetnek. Segítségével országonként kialakult egy-egy bioinformatikai központ, ezzel az adott ország kutatói használhatták a helyi napi frissítésű bioinformatikai adatbázisokat és szekvencia elemző programokat. Az EMBnet ezen kívül jelentős szerepet vállalt a bioinformatika oktatásában elsősorban a már végzett kutatók számára. A 90-es évek végétől az jellemző, hogy a bioinformatika terén azok az intézetek/kutatóhelyek illetve csoportok tudtak jelentősen fejlődni, amelyek csatlakoztak egy-egy genom projekthez. Jellemző az is, hogy mivel a szekvenálás költségei nagyon magasak voltak, azok a csoportok/intézetek tudtak csatlakozni ilyen projektekhez, amelyek erre célzott állami támogatást kaptak. Legjobb példa erre az angol Sanger Intézet, vagy az ugyancsak a humán genom programban (is) részvevő francia Genoscope. Nemzeti szintű és finanszírozású genom projektre jó példa a szőlő genomszekvenciájának a meghatározása, amelyet Olaszország és Franciaország állami szinten támogatott. Több esetben a szekvenálás szélesebb nemzetközi együttműködésben valósult meg, amire jó példa a burgonya és a paradicsom szekvenálása, ahol az egyes kromoszómákat osztották el különböző csoportok között. Fontos megjegyezni, hogy ezekben a genom projektekben nem, vagy csak nagyon elvétve találhatóak kelet-európai csoportok, amiből következően ezen országok a bioinformatika és a genomika területén is jelentős hátrányba kerültek. Ezt bizonyítja az oktatás helyzete is, hiszen míg például a nyugat-európai országokban mindenhol a jelentősebb egyetemek indítanak egyetemi és PhD bioinformatikai szakokat, kurzusokat, addig a kelet-európai országokban (és így Magyarországon is) egyszerűen nincs annyi bioinformatikával/genomikával foglalkozó kutató, akikre ilyeneket alapozni lehetne.
8
2. Jövőképe A következő jövőképek a magyar bioinformatika fejlődési lehetőségeit vázolják fel, a fejlődés legfontosabb elemeit, feltételeit szem előtt tartva. A jövőképeket az alábbi mátrix celláiként jeleníthetjük meg legtömörebben, ahol a mátrix sorai az ország által követett stratégiát vagy annak hiányát jelzik, az oszlopok pedig azt a kiemelt fontosságúnak értékelt dimenziót, hogy a felhasználók elutasítóan vagy támogatóan fogadják a bioinformatikai vívmányokat. Fontos hangsúlyoznunk, hogy a „stratégia” dimenzió nem önmagában a stratégia meglétére vonatkozik, hanem annak megvalósítására, megvalósulására. Egy érdemi változásokat megcélzó, megalapozott és hatásos stratégia kidolgozásának és megvalósításának jelentőségét számos külföldi példa mutatja. Gondolhatunk például az USA (NCBI), Európa (EMBL-EBI) stratégiáira, ahol világos célokat kitűzve dolgoztak ki központi programokat, fejlesztési terveket (pl. az európai ELIXIR program). Ezeknek a programoknak a hatása elsősorban hosszú
távon
érvényesül,
tényleges
gyakorlati
hasznosításukra
a
biotechnológiai,
gyógyszeripari, egészségügyi alkalmazásokban kerül sor.
Gyenge
vagy
átlagos Optimális
társadalmi elfogadottság Nincs stratégia, vagy nem „Sodródás”
társadalmi
támogatottság „Megszegett ígéretek”
valósul meg A
bioinformatika
hazai Koordinálatlan
fejlődés
a
fejlődése a jelenlegi szinthez K+F, innovációs törekvések, képest is visszaesik.
orvosi, üzleti alkalmazások
Külföldi innovatív termékek területén. „fogyasztása”. Alul-
és
Csökkenő
kihasználtságú
dezinformált bioinformatikai
társadalom negatív attitűddel. infrastrukturális kapacitások. Romló kilátások,
kutatói,
oktató Az ipar számára érdektelen csökkenő akadémiai K+F tevékenység.
9
színvonalú
élettudományos Külföldi innovatív termékek
közép- és felsőfokú oktatás.
„fogyasztása”. A kutatók és a társadalom közötti párbeszéd ad hoc jellegű, szervezetlen.
Aktív, megvalósuló stratégia
„lassú víz”
„felzárkózás és kitörés” Gyors
Lassú
fejlődés,
nemzetközi
azaz
felzárkózás
a nemzetközi
élvonalhoz;
lemaradás egyes területeken (pl. IT,
tartósul.
gyógyszeripar)
kitörési
A kutatási eredmények a lehetőségeket nemzetközi
nyújtó
trendeknél fejlesztések bevezetése.
lassabban
kerülnek
át
gyakorlatba. A
a
felhasználók
a Aktív és szervezett párbeszéd folyik
a
kutatók
és
elégtelen, felhasználók között.
nem meggyőző informálása.
A
bioinformatika
fejlődési
lehetőségeinek
tekintetében
Magyarországon
meghatározónak tekintjük a felhasználók (biotechnológia, gyógyszeripar és egészségipar) általi támogatottság mértékét. A támogatottság szintjének növeléséhez a bioinformatikusok és a felhasználók közötti intenzívebb párbeszéd szükséges. Ennek a törekvésnek a sikere nagymértékben függ attól, hogy sikerül-e átfogó, jól megalapozott, meggyőző fejlesztési stratégiát kidolgozni és végrehajtani.
10
A Bioinformatika hajtóerői fontossági sorrendben: 1. A genom megismerésének igénye: a. tudományos megismerés (különböző élőlények – köztük kiemelt fontossággal az ember – genomjának megismerése), b. a személyes emberi genom megismerésének igénye. 2. A felhasználók általi elfogadottság. 3. Társadalmi és gazdasági igények: magas hozzáadott értéket képviselő, bioinformatikai eszközök felhasználásával kifejleszthető termékek iránti kereslet: a. Orvosi alkalmazások (költséghatékony gyógyszerek és a személyre szabott orvoslás társadalmi szinten történő hasznosítása, a genomikán alapuló diagnosztika és terápia finanszírozása az egészségbiztosítási rendszerben); b. Gyógyszeripar, biotechnológia (bioinformatikai eszközök felhasználásával történő fejlesztés); c. Mezőgazdaság (növénynemesítés, állatnemesítés, élelmiszerek molekuláris ellenőrzése, diagnosztika, személyre szabott táplálkozás); d. Környezetvédelem; e. Kommersz genomika (ténylegesen nem használható eredményeket nyújtó, mégis eladható alkalmazások). 4. Tudományos és technológiai fejlődés, ezen belül is kiemelten az IT fejlődés (adatok értelmezése, illetve felhasználóbaráttá történő alakítása szoftverfejlesztés). 5. Igazodás a nemzetközi trendekhez (amerikai és EU trendek). 6. K+F irányváltás, nemzeti K+F stratégia részévé válik a genomika. 7. Fenntartható fejlődés (agrár-, élelmiszeripar és környezetvédelem).
11
2.1. „Felzárkózás és kitörés”: A jövőkép összefoglalása: A bioinformatika folyamatosan fejlődik, nemcsak követő, hanem úttörő kutatás-fejlesztés is folyik Magyarországon, a bioinformatika fontos társadalmi és gazdasági igények kielégítéséhez járul hozzá. A felhasználók igénylik a bioinformatikai K+F és innováció támogatását, és követelik az eredmények alkalmazását. A bioinformatika az élet- és orvostudományok integráns részévé válik, az oktatás gyorsan továbbadja a kutatási eredményeket. A jövőkép fő jellemzője, hogy a bioinformatikához pozitívan viszonyul a társadalom és a szakmai közvélemény is, a területet a progresszió letéteményesének tekintik. Ez
megjelenik
a
bioinformatika
KFI
tevékenységek
állami
és
vállalati
finanszírozásában is. Így a legfontosabb hajtóerők a megismerési vágy mellett a magas szintű társadalmi elfogadottság és az anyagi támogatás. A legfontosabb keretfeltételek tehát mind optimálisak. Az alapkutatás magas színvonalú, nemzetközileg is versenyképes csoportok működnek a hazai egyetemeken és kutatóintézetekben, egymással hatékonyan együttműködve, sikeres hálózatokat képezve. Anyagilag jól ellátottak (pl. egy Nemzeti Bioinformatikai Program keretében célzott támogatásokban részesülnek). A munkát jól szervezett központ segíti, mely az ELIXIR program eredményeként létrejövő hálózat magyar nemzeti központjának szerepét tölti be. A nemzetközileg versenyképes alapkutatások jelentős külső kapcsolatokat, együttműködéseket eredményeznek, és jelentős külföldi, döntően EU-támogatásokat is hoznak. A bioinformatikai megközelítéseket használó és azon alapuló kutatások vonzóak a fiatal kutatók számára: ezért számos fiatal kutató kezd ilyen témájú kutatást, illetve jelentős a verseny a bioinformatikát művelő kutatócsoportokba való bejutásért. Az alapkutatást végző munkacsoportok eredményei spin-off és start-up cégek alapításához vezetnek. A bioinformatikai célú és alapú alkalmazott kutatás is fejlett. Ez egyrészt az alapkutatást is végző kutatócsoportok számára adott ipari megrendelésekből adódik, másrészt 12
az alkalmazott kutatást művelő kis- és közepes méretű cégek (pl. biotech vállalkozások) és a gyógyszergyárak
együttműködésén
alapul.
Az
alkalmazott
kutatást
végző
cégek
összehangolják, egyeztetik a nagy értékű infrastruktúrák felállítását és működtetését célzó erőfeszítéseiket. Jelentős, az európai rendszerekhez (vö. ELIXIR program) szorosan kapcsolódó bioinformatikai hálózat épül ki. A hazai gyógyszeripar, biotechnológia nagymértékben támaszkodik a hazai K+F infrastruktúrára, és sok szálon működik együtt a kutatóhelyekkel és KKV-kel. Hazai és külföldi cégek KKV-k által előállított szellemi termékeket, vagy sikeres, K+F-re szakosodott cégeket vásárolnak. Külföldi befektetőket is vonzanak a magyar bioinformatikai cégek. Különösen jelentős az információtechnológia beépülése a bioinformatikai alkalmazott kutatásokba. Az IT ipar önálló fejlesztései is segítik a bioinformatikai K+F-t. A bioinformatika mint módszer és szemlélet interdiszciplináris módon hatja át a magyar élet- és információs tudományt. Különösen jelentős az orvostudományt, gyógyszerfejlesztést érintő fejlődés. A fentiek alapja egy jól kimunkált nemzeti bioinformatikai fejlesztési stratégia megvalósítása, ami összehangolja az infrastruktúra-fejlesztést is, s ezzel megelőzi a szellemi és pénzügyi erőforrások szétforgácsolódását, a pazarlást.
2.2. „Lassú víz” A jövőkép összefoglalása: Bár a bioinformatika fejlődése elindul, hamar megtorpan, így annak ellenére, hogy nemcsak követő, hanem úttörő kutatások és fejlesztések is elindulnak, a bioinformatika nem tud jelentős mértékben hozzájárulni a társadalmi-gazdasági fejlődéshez. A felhasználók az egyes bioinformatikai alkalmazások alapos megismerése elől elzárkóznak, azokkal szemben elhamarkodottan, megalapozatlanul, negatív előítéletek által befolyásolva alakítanak ki véleményt.
13
A kidolgozott stratégia érvrendszerének felhasználásával sikerül meggyőzni a vállalati és tudománypolitikai döntéshozókat, hogy érdemes invesztálni bioinformatikai KFI-be, azonban ezeknek a ráfordításoknak az aránya csökkenő tendenciájúvá válik, mivel mind az ipari, mind az állami támogatások újraértékelése a kiadások más területekre történő átcsoportosításához vezet. Stagnál a bioinformatikai termékek, szolgáltatások felhasználása, nem hatja át a bioinformatikai szemlélet az egészségügy, az ipari ágazatok és a környezetvédelem fejlődési koncepcióit. Így a bioinformatika végső soron nem gyakorol semmilyen érzékelhető befolyást a társadalomra. Ezen a ponton a jövőkép kettéválik és valamelyik szomszédos jövőkép felé indul meg a további változás. A pesszimista változat szerint a negatív hatások tovább erősödnek, a stratégia fokozatosan elhalványodik, súlytalanná válik, ezért Magyarország a korábbi anyagi és szellemi befektetések ellenére a „sodródás” állapotába kerül. Az optimista változat szerint a bioinformatika meghatározó szereplői folyamatosan, szisztematikusan, közérthetően és meggyőzően tájékoztatják a társadalmat, hatékony párbeszédet alakítanak ki, és ennek eredményeként sikerül a társadalom negatív attitűdjét pozitívvá alakítani. Bár jelentős időveszteséggel, de végső soron Magyarország eléri az optimális jövőképben felvázolt állapotot. 2.3. „Megszegett ígéretek”
A jövőkép összefoglalása: A társadalom igényli és követeli a bioinformatika elismerését és alkalmazását, megjelennek a bioinformatikához kapcsolódó állami és vállalati források. A bioinformatika ennek ellenére nem tud az élet- és orvostudományok integráns részévé válni, és az eredményeket sem terjeszti a szükséges széles körben az oktatási rendszer. Így a bioinformatika nem válhat a magyar KFI rendszer meghatározó elemévé: a Magyarországon folyó bioinformatikai KFI tevékenységek szétaprózódnak, az infrastrukturális beruházásokat nem hangolják össze, sok a párhuzamosan, alacsony kihasználtsággal működtetett K+F kapacitás, és nincs hatékony együttműködés az ipari és kutatói szféra között sem. Mivel a társadalom éhes a bioinformatika új eredményeire, de ezzel párhuzamosan nem nő a belső kínálat, Magyarország a bioinformatikai technológiák vásárlójává válik, alapvetően a 14
külföldi alkalmazások lesznek elérhetőek. Társadalmi nyomás hatására ugyan elindulnak államilag támogatott kutatási programok, de a hazai intézmények érdekellentétei lelassítják, vagy rosszabb esetben eleve kudarcra ítélik ezen programok megvalósulását. 2.4. „Sodródás” A jövőkép összefoglalása: Tartalmazza mind a „megszegett ígéretek” mind a „lassú víz” jövőképek negatívumait, azok „negatív szinergiájában”. Nagyon sötét jövőkép! A hazai sajátosságokat figyelmen kívül hagyó „importált” igények kielégítésére importált alkalmazások jelennek meg Magyarországon. Az alul- és dezinformált társadalom nem nyitott a bioinformatika eredményeire, célzott állami támogatás nem is jelenik meg sem az ipari ágazatok, sem az egészségügy területén. Nincs stratégia, azaz nincsenek elemzések, elképzelések, korszerűsítési törekvések. Gyógyszer- és biotech cégeknél illetve egyetemi, akadémiai bázisokon ugyan folynak kutatások, de ezek leginkább egymástól függetlenül történnek, egymás igényeit és lehetőségeit nem veszik figyelembe, leginkább külföldi megrendelők „beszállítóiként” dolgoznak a magyar kutatók. Vannak közös fejlesztések is, de azok finanszírozására nincs célzottan elérhető támogatás. A kedvezőtlen körülmények ellenére létrehozott piacképes termékek értékesítése sem itthon történik, a magyar piacra már csak elavulása után, külföldről jutnak vissza ezek a termékek. Végső soron a társadalom kutatásellenes attitűdje olyan szintre jut, hogy Magyarországon még az alapkutatás is szinte lehetetlenné válik. Ez az élettudományi oktatók és kutatók kivándorlásához vezet, ami viszont a természettudományos képzés további romlását eredményezi.
15
3. Stratégiai Kutatási Terv 3.1. K+F területek és célok Ha a genomika történetét nézzük, nyilvánvaló, hogy a szekvenálandó fajok kiválasztásánál két fő szempont volt. Az egyik a hasznosíthatóság, tehát olyan új tudományos ismeretek szerzése, amelyekkel vagy a gyógyításban vagy a mezőgazdaságban vagy a biotechnológiában olyan terméket lehet fejleszteni, amely hasznot hoz. A másik, ugyancsak nem elhanyagolható és az előzővel azért összefüggő szempont, a tudományos megismerés igénye, az, hogy például nyomon tudjuk követni az evolúciós folyamatokat a genom szintjén. Erre jó példa a gerinces fajok szekvenálása, hiszen miután a legfontosabb célt, a humán és a fontosabb genetikai modellállatok genomszekvenciáját meghatározták, elkezdték egyrészt a mezőgazdaságilag fontos fajok (szarvasmarha, csirke, sertés, juh, ló, kutya), másrészt az evolúciósan érdekes fajok (például a kacsacsőrű emlős, a Monodelphis domestica, a karmosbéka stb.) szekvenálását is. Jól nyomon követhető cél, hogy az evolúciós fa minden ágáról legyen olyan faj, amelynek meghatározzák a szekvenciáját. Ma már nincsenek nagyobb lyukak a fán, ezért a legjellemzőbb, hogy elkezdték több, már ismert genomszekvenciájú faj újraszekvenálását is. Emellett nekiláttak egyes nagyobb genomú, eddig megszekvenálhatatlannak tartott fajok szekvenálásának (például a búza), valamint elkezdték a kisebb gazdasági jelentőségű mezőgazdasági fajok valamint egyes fontos mezőgazdasági fajok változatainak a szekvenálását is. Az új generációs szekvenálási módszerekkel történő genom szekvenálás lehetővé teszi, hogy pontosabb legyen a szekvencia, hogy feltérképezzék a genom változatosságait (SNP-k CNV-k), valamint hogy nagyobb genomok szekvenciáját is meghatározzák.
16
3.1.1. Orvosi genomika A genomika egyik legfontosabb
felhasználási területe a
gyógyászati kutatás.
Természetesen ebben nem csak a humán genom szekvenciáját használják, hanem más, rendszertanilag akár távol lévő fajok szekvenciáit is. A gyógyászat területén a következő területeken lenne szükséges bioinformatikával megerősített kutatás-fejlesztés: • Egyes, különböző betegségekben szerepet játszó gének vizsgálata „klasszikus” genomikai módszerekkel. Ebbe elsősorban a transzkriptomikai módszerek tartoznak, így mikroarray vizsgálatok, valamint az egyes gének expressziója szabályozásának a kutatása a promóter régió bioinformatikai és kísérleti elemzésével. Fontos szerepe lehet ezekben a vizsgálatokban az összehasonlító genomikai módszerek széles körű felhasználásának is. • Egyes betegségek genetikai okainak a felderítése SNP genotipizálással (teljes genom asszociációs vizsgálatok, GWA). Jelenleg ez a leggyorsabban fejlődő gyógyászati kutatási terület, eredményeit a legrangosabb újságokban publikálják, ugyanakkor sajnálatos módon Magyarországon csak egy-két példát látunk rá. A hagyományos magyar klinikai gyógyászat fejlettsége, a biobankok létrejötte lehetővé tenné, hogy több, a magyar lakosságot súlyosan érintő betegséget (például a szívinfarktus, a különböző rosszindulatú daganatok, cukorbetegség, elhízás stb.) is elkezdjünk vizsgálni ilyen módszerrel. Ehhez nagyon fontos lenne a megfelelő kutatási infrastruktúra megteremtése is (lásd később). Az ilyen típusú vizsgálatok eredményeképp pedig újabb célgének kerülhetnének a látókörünkbe, amelyeket aztán az első pontban részletezett módszerekkel lehetne vizsgálni. • Daganatos betegségek okainak, következményeinek a kutatása a még egészséges és a beteg szövetek teljes genomszekvenciájának az összehasonlításával. • Várhatóan egy-két éven belül ezer dollár alá süllyed egy teljes humán genom megszekvenálásának a költsége. Ez új távlatokat fog megnyitni a gyógyászati kutatásokban, amire fontos lenne időben felkészülni. Ma már nem tudományos fikció, hogy a korházba bekerült betegnek nem csak a vérképét, a cukor-, zsír-, hormon- vagy különböző enzimszintjeit mérik meg, hanem meghatározzák a genomszekvenciáját is, és ha szükséges, meghatározzák a rokonai vagy akár egy biobankból elővett mintából a már elhunyt felmenői genomszekvenciáját is. Ennek nemcsak diagnosztikai
17
jelentősége lehet, hanem nagyban segítheti az adott betegség gyógyítását célzó kutatást is azzal, hogy a betegség okairól, kialakulásának a mechanizmusáról pontosabb képet kaphatunk. • Az orvosi diagnosztika területét is forradalmasíthatja a közeljövőben a genomika. Nemcsak a fent említett teljes genom szekvenálás révén, hanem annál jóval olcsóbb és egyszerűbb, szekvencián alapuló diagnosztikai kitek tömkelegét fogják a közeljövőben kidolgozni. A bioinformatika feladata ebben többek közt az lesz, hogy folyamatosan (az újabb és újabb szekvencia adatok figyelembe vételével) frissítse és ellenőrizze a használt módszereket, és újabb, jobb markereket javasoljon. • A személyre szabott orvoslás területén is jelentős kutatás-fejlesztési erőfeszítések várhatóak a közeljövőben. Ismert, hogy az emberek genetikai hátterüktől függően másként reagálhatnak egyes gyógyszerekre. A jövő orvostudományának az egyik legjelentősebb kihívása, hogy mindenkinek a megfelelő gyógyszereket tudja ajánlani. • Az orvosi metagenomika területén is jelentős fejlesztések várhatóak, ugyanis a közelmúlt genomikai kutatási eredményei szerint jelentős szerepe lehet például az elhízásban a bél baktériumflórájának, vagy a bőr, a nyálkahártyák egészségét is jelentősen befolyásolják a rajtuk élő baktériumok, és nem csak genetikai anyagunkban, de a bennünk illetve rajtunk élő mikroorganizmusok mennyiségében, összetételében is jelentősen különbözünk egymástól.
3.1.2. Mezőgazdasági biotechnológia Míg a 2000-es évek elején a genomika fő érdeklődési területe a humán genom, valamint a fontosabb modellszervezetek genom szekvenciájának a meghatározása volt, az utóbbi években egyre nagyobb hangsúlyt kapott a mezőgazdaságilag fontos állatok és növények szekvenálása. Ebben szerepet játszott az is, hogy mára világossá vált, hogy a 90-es évek nagy mezőgazdasági vívmánya, a génmódosított növények és állatok kifejlesztése nem tudja megváltani a világot. Egyrészt nem annyival jobb és olcsóbb, mint sokan gondolták, másrészt jelentős társadalmi ellenállás is kibontakozott a használatuk ellen. Ez az ellenérzés különösen erős Magyarországon is, ezért fontos, hogy alternatív, modern módszereket találjunk a növény- és állatnemesítésre. A genomika erre kiválóan alkalmas, ahogy azt már sok komolyabb mezőgazdasági kutatásokat folytató országban felismerték. Ez azt jelenti, hogy állami szinten elkezdték a mezőgazdaságilag fontos fajok (rizs, kukorica, búza, marha, sertés, juh stb.)
18
genomjainak a szekvenálását, valamint kiemelten támogatták, támogatják a genomikán alapuló növény- és állatnemesítést. A genom szekvenálás fő előnyei a nemesítésben: • Átfogó ismeretet ad a géntartalomról és a genom felépítéséről, ezáltal segít megérteni például a nemesítés során bekövetkezett evolúciós folyamatokat, vagy például a heterózis hatást. • A genetikai és a genom szekvencia adatok összevetésével meg lehet keresni azokat a kulcsgéneket, amelyek a nemesítés szempontjából fontosak. • A Marker Asszisztált Szelekcióhoz (MAS) markereket lehet keresni. • Olyan SNP-ket lehet keresni, amelyek fontosak lehetnek egyes jellegekben való eltérésben, így célzottan ezekre lehet szelektálni. • Az egyes, a nemesítés szempontjából fontos jelleget (pl. rezisztencia vagy szárazságtűrés) hordozó fajták, fajok megszekvenálásával könnyen meg lehet találni az ezeket a jellegeket hordozó géneket. Ezek alapján a mezőgazdasági biotechnológia területén a következő területeken célszerű genomikai kutatás-fejlesztési projekteket indítani: • Marker asszisztált szelekció (Marker Assisted Selection, MAS). Ez tulajdonképpen egy felgyorsított nemesítés, amelynek a „hagyományos” formája rendkívül időigényes, ugyanakkor ezt a genomikai módszerek alkalmazásával jelentősen fel lehet gyorsítani. A módszer nagy előnye, hogy GMO-mentes fajtákat lehet kinemesíteni, tehát a társadalmi elfogadottsága is sokkal pozitívabb lehet. A genomika két szinten segíthet, egyrészt a már megszekvenált fajoknál a kísérletek megtervezése, a markerek keresése és vizsgálata, valamint a célgének nyomon követése sokkal egyszerűbb, másrészt előbb-utóbb elérhetővé válik az a megoldás is, hogy a markereknek az utódnemzedékekben a fáradságos hagyományos (például PCR) úton történő tesztelése helyett egyszerűen megszekvenáljuk ezeket az egyedeket. Ugyancsak jelentős előny, hogy lehetővé válik az egyes jellegek már embriókorban történő vizsgálata, amivel például egy húsmarha esetén éveket lehet megspórolni. A magyar mezőgazdaságban használt fajok közül ismert a szekvenciája az állatok közül a marhának, a sertésnek, a juhnak, a csirkének, és rövidesen várható a pulyka genom szekvenciája is. A növények közül ismert a rizs, a kukorica, a dohány, a repce, a burgonya és a paradicsom szekvenciája, és rövidesen várható a búza és a lucerna teljes genom szekvenciája. • Mezőgazdaságilag fontos fajok, fajták szekvenálása. Az új generációs szekvenálási technológia ma már lehetővé teszi, hogy egy-egy nagyobb (néhány százmillió) forintos
19
pályázat keretében, egy teljesen új faj vagy fajta teljes genom szekvenciáját is meghatározzuk (2009-es adat, ugyanakkor a szekvenálás költségei rohamosan csökkennek). Ennek nemcsak a mezőgazdaság, hanem a biodiverzitás megőrzése, megismerése tekintetében is fontos szerepe lehet. Természetesen magától értetődik, hogy Magyarországnak e tekintetben az egyik legfontosabb feladata, hogy az őshonos és jellemző magyar fajtákat sorolja előre. Nagyon jó példa erre a már említett MANGFOOD konzorcium, akik többek közt elhatározták, hogy megszekvenálják a mangalica sertés genomját. Az elsőként szóba jöhető fajok az állatoknál a már említett mangalica mellett a magyar szürkemarha, a rackajuh, a világbajnok trófeákat adó szarvas, egyes pontyfélék vagy a jellegzetes magyar kutyafajták. A növényeknél a legfontosabb célnövény valamelyik magyar fűszerpaprika fajta lehet, valamint a különböző kiváló magyar gyümölcsfajták. • Eredetiségvédelem. A már említett MANGFOOD konzorcium fő célkitűzése, hogy egy egyszerű teszttel ellenőrizni lehessen a mangalica hústermékek eredetiségét. Ez nagyon fontos,
és
jövőben
minőségellenőrzésben
egyre és
az
jobban
elterjedő
módszer
élelmiszerhamisítások
lesz
elleni
az
élelmiszer
védelemben.
Az
eredetiségvizsgálat fontos lehet például a védett állatok (pl. a kerecsensólyom) vagy állatpopulációk (pl. a gemenci szarvas állomány) védelmében is. 3.1.3. Ipari biotechnológia A mikroorganizmusok használata az ipari biotechnológiában már régóta elfogadott és használt módszer. Ezen a területen az is teljesen elfogadott, hogy sokszor genetikailag módosított baktériumokat használnak különféle célokra. Természetesen a kilencvenes évek közepétől egymás után kezdték el megszekvenálni a különféle, az ipari biotechnológiában használt baktériumoknak a genomjait is. Ez természetesen ma is gőzerővel folyik, százával határozzák meg az iparilag fontos mikroorganizmusok (baktériumok, gombák, algák) genomszekvenciáját. Ez nagy lehetőséget ad a genomok elemzésére, az ipari biotechnológiai folyamatokban fontos kulcsgének megkeresésére, módosítására. Az utóbbi évek újdonsága a metagenomika, amikor is kevert tenyészeteknél, mintáknál határozzák meg a különböző hosszúságú DNS daraboknak a szekvenciáját, majd megpróbálják ezeket összerakni (ami természetesen nagy bioinformatikai kihívást jelent) és annotálni. A cél, amellett hogy a biodiverzitásról kapunk nagyon értékes információkat, az, hogy olyan új enzimeket, folyamatokat találjunk, amelyek aztán felhasználhatóak az ipar, a mezőgazdaság vagy éppen a 20
gyógyítás területén. Magyarországon is nagy lehetőségei vannak a metagenomikai kutatásfejlesztésének, az „átlagos” talaj és édesvízi flóra felmérésén kívül érdemes lenne vizsgálni olyan extrémitásokat, mint az alföld szikes talajainak, sós tavainak a baktériumflóráját vagy éppen a hőforrásainknak, termál kútjainknak a mikroorganizmusait. A fent felsorolt kutatási-fejlesztési területekre mind jellemző, hogy a jövőbeni fejlődésük nagyban összefonódik a genomikával. A genomikai kötődés abból áll, hogy a kutatás: • vagy egy már megszekvenált genom elemzésén alapul, • vagy egy már megszekvenált genomot vagy a közeli rokonát újraszekvenálunk azért, hogy az egyedek, a fajták, vagy a közeli rokon fajokról nyerjünk információt, hiszen tudjuk, hogy akár a diploid kromoszómapárok is viszonylag jelentősen eltérhetnek egymástól, • vagy egy új faj genomszekvenciáját határozzuk meg.
Mindhárom esetben jelentős bioinformatikai támogatást kíván a munka, hiszen egyszerre egy egész genomból származó információt kezelni, értékelni csak bioinformatikai módszerekkel lehet, és természetesen maga a szekvenálás is ma már egyre inkább arról szól, hogy a gépek ontják magukból a szekvenciát, a bioinformatikusok pedig feldolgozzák. Nem szabad ugyanakkor elfeledkezni arról, hogy a „hagyományosnak” számító kutató-fejlesztői munkában is egyre nagyobb szerepet kap a bioinformatika, gondoljunk csak a mikroarray adatok feldolgozására vagy az összehasonlító genomikai vizsgálatokra. Az új generációs szekvenálás elterjedése a direkt genomszekvenáláson kívül több téren is forradalmasította a molekuláris
biológiát.
Ilyenek
az
RNS
szekvenálás
(RNA-seq)
a
kromatin-
immunoprecipitáció-szekvenálás (ChIP-seq), az exon-szekvenálás, a metagenomika vagy a TSS „tag” szekvenálás. A hagyományos expressziós mikroarray vizsgálatoknak ma már árban is versenyképes alternatívája például az RNS szekvenálás, a promóter vizsgálatokat pedig forradalmasította a ChIP-seq analízis. Mindezek a módszerek általánosan használhatóak a genomikában, közös jellemzőjük ugyanakkor, hogy mivel nagy mennyiségű adattal kell dolgozni, komoly bioinformatikai hátteret kíván az alkalmazásuk.
21
3.2.Együttműködések A bioinformatikára jellemző, hogy kétféleképpen vesz, vehet részt a kutatás-fejlesztésben. Egyrészt bioinformatikai csoportok végezhetnek pusztán in silico fejlesztéseket, amelyek lehetnek: • Algoritmus fejlesztések; • Adatbázis fejlesztések; • In silico adatelemzések. Ezeket extrém esetben a konkrét biológiai kérdésektől teljesen elvonatkoztatva is lehet végezni, ideális esetben azonban valamilyen biológiai, genomikai problémára irányulnak a fejlesztések. Ehhez kapcsolódik a bioinformatikának egyfajta szolgáltató jellege is, a kifejlesztett algoritmusokat, programokat, adatbázisokat olyan formában kell elérhetővé tenni, hogy a bioinformatikában nem jártas molekuláris biológusok is könnyen tudják azokat használni. A másik módja a bioinformatika részvételének a genomikai kutatásokban, hogy a bioinformatikusok a nedves laborban dolgozó molekuláris biológusoknak segítenek megtervezni, valamint kiértékelni a kísérleteket. Érthető, hogy a genomika előretörésével nagyon megnőtt a jelentősége a kutatások bioinformatikai támogatásának, ezért látható is, hogy a genomikával foglalkozó kutatócsoportok vagy megpróbálnak felvenni bioinformatikusokat, vagy együttműködést próbálnak kialakítani egyéb bioinformatikai fejlesztéssel foglalkozó csoportokkal. Sajnálatos módon, mivel Magyarországon nincsenek az egyetemeken bioinformatikával foglalkozó tanszékek, nincs speciális bioinformatikai graduális és posztgraduális képzés, és ezzel összefüggően nagyon kevés bioinformatikával foglalkozó csoport van, nehéz ilyen együttműködésre kész bioinformatikust találni. Ezért a genomikai kutatásokat folytató vagy kezdő kutatócsoportoknak sokszor külföldön kell bioinformatikai együttműködő partnert keresni. Pozitív változás ugyanakkor, hogy felismerve a lehetőséget, megjelentek Magyarországon a bioinformatikai fejlesztésekkel foglalkozó cégek, amelyeknek jó lehetőség nagy genomikai pályázatokba beszállni és biztosítani a bioinformatikai támogatást. Összefoglalva elmondhatjuk, hogy a genomikai területen pályázó és dolgozó magyarországi csoportoknak gondot, szűk keresztmetszetet jelenthet a bioinformatikai támogatás, ezért mindenképpen lépéseket kellene tenni, hogy egyrészt az egyetemek szervezeti kereteket is
22
adva erősítsék a bioinformatikai képzést, másrészt a pályázati rendszerben írjanak ki speciális pályázatokat bioinformatikai vagy bioinformatikával is foglalkozó csoportok támogatására. 3.4.Oktatás, tudásmenedzsment Mint már említettük a bioinformatika oktatása elhanyagolt terület volt (és maradt) a magyar egyetemeken. 2001-ben egy pályázatnak köszönhetően a Szegedi Tudományegyetemen és az ELTE-n elindult a bioinformatikai oktatás. Az ELTE-n ezt azonban jórészt külsős oktatókkal oldották meg, akik nem kaptak egyetemi pozíciót, így nem tudott kialakulni az egyetemen egy olyan bioinformatikai műhely, amelyre alapozva később például meg lehetett volna hirdetni egy bioinformatikai mesterszakot. Szegeden egy bioinformatikai szakosodási lehetőséget alakítottak ki a biológus hallgatóknak, azonban egyrészt itt is külsős oktatókat alkalmaztak, másrészt a szegedi egyetemen se volt olyan dedikált bioinformatikai műhely, amely felvállalta volna a szak gondozását, és a hallgatói érdeklődés is viszonylag csekély volt, ezért szép lassan elhalt ez a kezdeményezés. Az utóbbi években más egyetemeken is tartottak, vagy elkezdtek tartani különböző szintű és területű bioinformatikai kurzusokat, de egyik helyen sincs hivatalos egyetemi oktatói szintű képviselete a bioinformatikának, ami kérdésessé teszi e tárgyak jövőjét. Természetesen az se mindegy, hogy mit oktatnak bioinformatika néven. A genomika szempontjából az lenne a fontos, hogy a diákok amellett hogy megértsék a legfontosabb genomikai fogalmakat, megismerjék a genomikában használt vizsgálati módszereket, a genom és alkotórészeinek a sajátosságait, elsajátíthassák a biológiai adatok (szekvenciák) keresését, letöltését és elemzését. Természetesen az igazi az lenne, ha emellett a diákok megtanulnának alapszinten programozni is, hogy kezelni tudják a genomika tárgyát képző nagy mennyiségű szekvenciaadatot, valamint hogy megismerjék és megértsék a genomikában használt programok algoritmusait. Az itt felsoroltakhoz legközelebb az ELTE-n kidolgozott bioinformatikai kurzusok állnak, ahol egy félévben a diákok a funkcionális genomika, a genom és fehérje evolúció alapjait sajátíthatták el, majd a következő félévben az elméleti órákon a különböző bioinformatikai programok, adatbázisok elméleti alapjait, a gyakorlatokon pedig ezeknek az alkalmazását tanulhatták meg. Az alap- és mesterszakok indulásával egy kicsit átrendeződik az oktatás és mivel ilyen tapasztalata még senkinek sincs, ezért állandóan változik az egyetemeken, hogy mikor, kik és milyen bioinformatikát tanítanak az alap- és a mesterszakokon. Pozitív példaként lehet említeni az ELTE mellett a Debreceni Egyetem Molekuláris biológus mesterszakot, ahol a diákok tanulnak egy félév genomikát, majd egy
23
félév bioinformatikát gyakorlattal, és végül felvehetik a Genomi bioinformatika tárgyat, ahol megtanulhatják, hogyan lehet kezelni a genomika nagy mennyiségű adatát. A PhD képzésben talán még rosszabb a helyzet, mint az egyetemi képzésnél, csak az ELTE-n volt meghirdetve dedikált bioinformatikai kurzus, de az utóbbi években ez is elhalt. Ezek után nem meglepő, hogy az országban csak néhány PhD fokozatot szereztek tisztán bioinformatikai munkával, azokat is nagyrészt az ELTE Klasszikus és Molekuláris Genetika doktori programjában. Mivel a bioinformatika napjaink egyik leggyorsabban fejlődő területe, nagyon fontos lenne a már végzett, és a PhD-vel rendelkező kutatók bioinformatikai oktatása is. Erre a kétezres évek elején már volt példa, amikor is a gödöllői magyar EMBnet pont szervezett először több egynapos bioinformatikai kurzust is kutatók számára, majd két egyhetes kurzust az ELTE-n, amelyre rangos nemzetközi előadókat hívtak meg. Ezek nagyon sikeresek voltak, de mivel az európai EMBnet forrás, amiből finanszírozták, elapadt, magyar forrást meg ilyesmire nem lehetett találni, több ilyet nem tudtak szervezni. Az utóbbi két évben a Magyar Bioinformatikai Társaság szervezett egy-egy bioperl kurzust, ami ismét csak nagyon sikeres volt, jelezve, hogy nagy szükség lenne ilyen típusú kurzusokra. Mindezek alapján a következőket javasoljuk az oktatás területén: • A tudomány-, orvos- és agráregyetemeken minél előbb létre kellene hozni a genomikai és/vagy bioinformatikai tanszékeket, ha kell, akkor külföldi vagy külföldről hazacsábított oktatókkal. Erre a legalkalmasabb forma speciális pályázatok kiírása lenne, amelyek megnyerése biztosítaná ezeknek az oktató- és kutatóhelyeknek a túlélését az első néhány évben. • A biológus, orvos és agrárszakokon lehetővé kell tenni már alapszinten a bioinformatika tanulását a diákoknak. A mester szakokon kötelezővé kellene tenni valamilyen szintű bioinformatikai elméleti és gyakorlati oktatást. • Legalább
egy-két
Magyarországon,
bioinformatikus lehetővé
téve,
mester hogy
ebbe
szakot az
akkreditáltatni informatika
vagy
kellene egyéb
természettudományos alapszakot végzett hallgatók is belépjenek. Erre is forrásokat kellene biztosítani, hiszen az elején, amíg az egyetemek saját bioinformatikai, genomikai kutatásai nem erősödnek meg, mindenképpen külsős, esetleg külföldi előadókat is alkalmazni kellene. • A doktori iskolákban is minél több bioinformatikai témájú tárgyat kellene meghirdetni.
24
• Kampányt kellene szervezni a már végzett kutatók bioinformatikai, genomikai oktatására, speciális kurzusok, egynapos tanfolyamok tartására. Erre jó keret lenne a magyar EMBnet pont. Az EMBnet-ben már régen kialakult egy a kutatóknak szóló bioinformatikai oktató anyag, és az ebben tapasztalatot szerzett külföldi oktatók is rendelkezésre állnak. Mivel a magyar kutatócsoportoknak sokszor nincs elegendő forrásuk finanszírozni egy-egy résztvevő költségeit, főleg az elején mindenképpen központi forrásból kellene finanszírozni ezeket a kurzusokat.
3.4. Kutatási infrastruktúra fejlesztése A következő évtized során a genomikai kutatás-fejlesztés egyik fő kihívása a bioinformatikai háttér biztosítása lesz. Nyilvánvaló, hogy ugyanaz fog lejátszódni most, mint 2000 után. Akkor egyre több magyarországi kutatócsoport engedhette meg magának, hogy második generációs (kapilláris elven működő) automata szekvenátorokat vásároljon. Ugyanígy, az első két új generációs automata szekvenátort 2009-ben telepítették Magyarországon (igaz, hogy nem az akadémiai szférába), és a nyugaton tapasztaltakhoz hasonlóan várható, hogy a közeljövőben egyre több ilyen készülék lesz telepítve. Ezt segíti, hogy a gépek ár/teljesítmény aránya rohamosan csökken, és bár a mostani 100–150 millió forint körüli készülékenkénti ár még soknak tűnik, de például az egyik gyártó már 2010-ben piacra dob egy 20–25 millió forint körüli árú „junior” szekvenátort a kisebb laborok számára. Bioinformatikai szempontból is vannak hasonlóságok a két időszak között, a különbség azonban az, hogy a 2000-es évek elején az automata szekvenálás hazai elterjedésekor, a web-es alkalmazások és a PC-k akkori nagy fejlődése (processzor teljesítmény, memória és merevlemez kapacitás), a hálózatok gyorsasága akkor még biztosítani tudta a megfelelő bioinformatikai hátteret. Az új generációs szekvenáló készülékek azonban hirtelen akár 1000szer több adatot is kibocsátanak, és ez a szám exponenciálisan növekszik. Hogy ez mekkora informatikai és persze bioinformatikai kihívás, az bizonyítja, hogy több bioinformatikai szolgáltatónál megkongatták a vészharangot, hiányoznak a webről azok az adatbázisok, weboldalak, amelyekkel ezeket az adatokat analizálni vagy egyáltalán letölteni lehetne. A nagy szekvenáló és bioinformatikai szolgáltató központok közötti adatcsereforgalmat már nem bírják a hálózatok, ezért hasonlóan a kilencvenes évek elejéhez, amikor mágnesszalagon küldték az adatbázisokat, most ugyanezt csinálják merevlemezeken. Ezek a változások egyrészt jelentős informatikai kihívásokat jelentenek:
25
• Biztosítani kell a technológiát az adatforgalomhoz. Gyorsabb külső és belső hálózatokat kell kiépíteni. A belső hálózatokat is gyorsítani kell, ugyanis a belső adatforgalom is számottevően meg fog növekedni. • Új eljárásokat, protokollokat kell kidolgozni az adatok archiválására. Meg kell határozni, hogy milyen típusú adatoknak milyen szintű és sűrűségű mentés kell. El kell dönteni például, hogy a szekvenálás első szintű (tulajdonképpen a szkennelés során keletkezett) adatait érdemes-e archiválni, melyek azok az adatok, amelyeket off-line (tehát „dobozban”, közvetlen elérés nélkül), és melyek azok, amelyeket közvetlen eléréssel kell archiválni. • Ki kell alakítani azt a bonyolult számítógépes architektúrát, hálózatot, amely ezt a rendszert kezelni tudja. Nyilvánvalóan dedikált számítógépeket kell alkalmazni például a kívülről érkező adatok fogadására, az adatok tárolására, az adatok feldolgozására, valamint a felhasználókkal való interakcióra. Másrész bioinformatikai szempontból is jelentős fejlesztéseket kell tenni: • Ki kell dolgozni, és a különböző célok és szekvenálási módszerek igényeihez adaptálni kell a megfelelő bioinformatikai feldolgozási folyamatokat. • Ki kell dolgozni a szekvenálási adatok annotálási folyamatait. • Ki kell dolgozni az adatok adatbázisokba rendezésének a módját. • Ki kell dolgozni az adatok külső adatbázisokba küldésének a módját. Nyilvánvaló, hogy ezek a feladatok meghaladják a legtöbb magyar genomikai kutatással foglalkozó kutatóintézet vagy csoport kapacitását és/vagy tudását. Ennek alapvetően két oka van: • Nincs megfelelő számítástechnikai kapacitás, és az se elég, ha van rá pénz, ugyanis ezek installálása, működtetése speciális szaktudást igényel. • Nincs elég megfelelően képzett bioinformatikus, aki nem csak az adatok feldolgozását tudná elvégezni, hanem átlátná, és irányítani tudná az egész folyamat informatikai vonatkozásait is. Ezekre a kihívásokra a magyar genomikai kutatásokban háromféleképpen lehet válaszolni.
26
3.4.2. Megvásárolni a bioinformatikai genomikai szolgáltatásokat magyar vagy külföldi cégektől Ebben a modellben a genomikai bioinformatikai elemzéseket a kutatók külső, bioinformatikai adatfeldolgozással is foglalkozó cégektől rendelik meg pénzért. A módszer előnye, hogy a „profi” cégektől „profi” szolgáltatást is várhatunk, ugyanakkor a tapasztalatok azt bizonyítják, hogy ezek a cégek valóban kidolgoznak egy-egy eljárást, és azt magas szinten alkalmazzák is, ugyanakkor nem tudnak minden esetben a felhasználók egyedi igényeire megfelelően reagálni, nem mindig ismerik a biológiai hátteret. A hátránya még ennek a megoldásnak, hogy így nem megoldott a nagy mennyiségű adat tárolása vagy éppen a nemzetközi adatbázis szerverekre való eljuttatása.
3.4.2. Genomikai csoport illetve kutatóintézeti szintű bioinformatikai infrastruktúra kiépítése Ebben a modellben, a csoportok, esetleg egyes nagyobb kutatóhelyek, intézetek maguk építik ki a bioinformatikai infrastruktúrájukat. Ez megoldás lehet, azonban rövidebb és hosszabb távon is jelentős hátrányai lehetnek. A helyi infrastruktúra kiépítésére mindenekelőtt jelentős informatikai beruházásokra van szükség, komoly számítógép szervereket kell üzembe helyezni, fejleszteni kell a hálózatot, meg kell oldani a nagy mennyiségű adatok tárolását. A számítógép szerverek, hálózatok fenntartására szükség van egy informatikus szakértőre, valamint számolni kell a szerverek és a klimatizálás áramfelhasználásának a költségével. Az adatok feldolgozásához egy a genomikához, a szekvencia analízishez értő bioinformatikai szakemberre is szükség van, még akkor is, ha a feldolgozást kereskedelmi szoftverekkel végzik. Megjegyzendő, hogy bár ezek a szoftverek elsőre nagyon jó megoldásnak tűnnek, azonban nem mindig tudják beváltani az ígéreteket, ráadásul a gyártó cégeknek nem teljesen felhasználóbarát az árpolitikájuk, legtöbbször éves liszenszeket lehet vásárolni, amelyek lejártakor már nem garantált, hogy a program működőképes lesz, az meg biztos, hogy az újabb fejlesztéseket nem lehet beépíteni.
27
3.4.5. Központi magyar genomikai bioinformatikai infrastruktúra kiépítése Ebben a modellben egy központi magyar bioinformatikai genomikai facilitás épülne ki központi pénzből. Ez magába foglalná: • A feldolgozást biztosító számítógépes szerverkapacitást. • Az adatok hosszú távú biztonságos tárolását szolgáló tárolókapacitást. • A gyors adatáramlást lehetővé tevő külső hálózati kapcsolatot és a belső biztonságos LAN hálózatot. • A hardverek működtetését végző informatikai szakembereket. • Az adatfeldolgozást végző és a külső felhasználókat segítő bioinformatikusokat. • És egy vagy több bioinformatikai genomikai kutatást végző csoportot. Ennek a modellek a fő előnyei: • Központi pénzből, nem elaprózva a rendelkezésre álló forrásokat sokkal nagyobb és átgondoltabb, a célnak jobban megfelelő infrastruktúrát lehetne létrehozni. • A központi facilitás hosszú távon biztosíthatná a magyar genomikai adatok tárolását, archiválását, ez nem függene egy-egy kutatóhely, kutatóintézet vagy kutatócsoport lététől vagy anyagi helyzetétől. • A facilitás a magyar akadémiai szférában dolgozó kutatók számára ingyen vagy minimális díj ellenében segítséget adna a genomikai adatok feldolgozására, annotálására és tárolására. Ez biztos, hogy a kutatók számára sokkal olcsóbb, mint a saját infrastruktúra kiépítése és fenntartása, amit ugyanúgy központi költségvetési pénzből (pályázatok, célzott költségvetési támogatások) tennének meg, de valószínűleg az egész költségvetés szempontjából a központi facilitás finanszírozása sokkal hatékonyabb. • Mivel ebben a facilitásban koncentrálódna a magyar bioinformatikai genomikai adatfeldolgozás és kutatás, valószínűleg a kutatásban is végre kialakulhatna egy nemzetközi hírű magyar genomikai bioinformatikai központ, ami jótékony hatással lenne a magyar bioinformatikai oktatásra is, és így a későbbiekben egy önmagát erősítő folyamat jöhetne létre.
28
3.4.5. Javaslat a Magyar ELIXIR pont létrehozására A mai genomikában, elsősorban az új generációs szekvenálási technológiák révén kialakult helyzet óriási kihívást jelent a bioinformatikusoknak. Jelenleg az Európai Bioinformatikai Intézet, az EBI végzi a főbb európai adatbázisok (EMBL, UNIPROT, INTERPRO, ARRAYEXPRESS, ENSEMBL stb.) fejlesztését, és biztosítja ezek ingyenes elérhetőségét a világ kutatói számára. Ugyancsak az EBI a központja sok európai összefogással megvalósuló genomikai bioinformatikai kutatásnak is. Az utóbbi évek genomikai fejlődése azonban nyilvánvalóvá tette, hogy az „egy központi facilitás csinál mindent” modellje hosszú távon nem tartható. Egyrészt nehéz finanszírozni a jelenlegi keretek mellett (az EBI jelenleg főleg az EMBL-től, az angol Wellcome Trusttól és az EU-tól pályázatokon keresztül kap pénzt), másrészt az adatok kezelése, elérése már most akadozik, és látható, hogy a számítógépek, a hálózatok fejlődése most először lemaradni látszik a biológiai, genomikai adatok növekedésével szemben. Hogy időben ki lehessen dolgozni az erre a kihívásra adandó európai válaszokat, az EU 2008-ban megítélt egy 4,5 millió eurós pályázati támogatást egy, az EBI által vezetett európai konzorciumnak, arra a célra, hogy kidolgozzák az ESFRI keretében létrehozandó európai bioinformatikai infrastruktúra kereteit. A kezdeményezésnek az ELIXIR nevet adták, és Patthy László (MTA SzBK Enzimológiai Intézet) révén a közép- és keleteurópai régióból egyedüliként magyar képviselője is van a konzorciumnak. A project WP10-es „Interdisciplinary Interactions with Chemical, Plant, Environmental & Agriculture Databases Committee” munkacsoportjának is van egy magyar tagja Barta Endre személyében. A projektben való erőteljes magyar részvétel felértékeli Magyarországot a régióban és remélhetőleg a későbbiekben is előnyt jelent majd. Ez az ELIXIR előkészítő projekt jelenleg a végső fázisánál tart, ami azt jelenti, hogy most dolgozzák ki a végső ajánlásokat, és remélhetőleg 2011-ben elindulnak majd a konkrét fejlesztések is. Az ELIXIR-ben kidolgozott európai bioinformatikai kutatási infrastruktúra modell lényege, hogy létrehoznának egy központi „node”-ot, ami természetszerűleg az EBI lenne, és ehhez csatlakoznának az egyes országok nemzeti „node”-jai. A EBI végezné továbbra is a legfontosabb adatbázisok fejlesztését, a főbb adatoknak a tárolását, valamint protokollokat dolgoznának ki az adatok feldolgozására, tárolására. A nemzeti központok biztosítanák a nemzeti adatok tárolását, az egyes országokban kidolgozott adatbázisok fejlesztését és elérését, valamint az EBI által szolgáltatott adatbázisoknak, programoknak különböző szintű tükörszerverei lennének. Fontos követelmény lenne, hogy az egyes nemzeti „node”-okban önálló bioinformatikai, genomikai kutatások is legyenek, hiszen ez egyben biztosíték lenne a
29
magas szintű szolgáltatásokra is. Az egyes nemzeti „“node”-oknak ugyancsak szerepet kellene vállalni a bioinformatikai oktatásban is. A finanszírozási módszer kidolgozása még folyamatban van, de mindenképpen számítanak az egyes résztvevő országok jelentős befizetéseire is. A fentiek alapján nyilvánvaló, hogy az ELIXIR-ben megfogalmazott modell pontosan megegyezik az általunk felvázolt harmadik modellel, azonban ahhoz képest még külön pozitívuma, hogy az EBI és a többi nemzeti ELIXIR „node”-ok módszerei, eljárásai így hozzáférhetővé, alkalmazhatóvá válhatnának a magyar bioinformatikai genomikai facilitás számára, ami jelentősen megkönnyítené a munkát. A résztvevő csoportok, intézetek kvázi közösséget alkotnának, ami lehetőséget adna a tapasztalatok kicserélésére, valamint közös projektek indítására is.
3.4.5. Javaslat a magyar genomikai bioinformatikai infrastruktúra és kutatások támogatására A magyar genomika fejlődését jelentősen hátráltatta, hogy nem voltak kiírva speciális genomikai nemzeti pályázatok. Az egyetlen kivétel a Biotechnológia 2001 pályázat, amelynek révén 2001 után kialakulhatott a bioinformatika oktatása az ELTE-n és a Szegedi Tudományegyetemen, valamint megerősödhetett a gödöllői MBK bioinformatikai csoportja és több más, például biobanking-gal foglalkozó csoport. Mint már többször hangsúlyoztuk, a magyar genomika létezéséhez és megerősödéséhez speciális genomikai pályázatokra lenne szükség. Természetesen tudatában vagyunk annak, hogy az utóbbi évek nagy NKTH pályázataiba lehetőség volt / lett volna genomikai témájú pályázatokat is beadni, azonban úgy gondoljuk, hogy ennek az (is) a feltétele lett volna, hogy egyáltalán legyenek genomikai kutatások, projektek Magyarországon. Ugyancsak fontos lenne egy akadémiai új generációs szekvenálási facilitás létrehozása is. Ezek alapján a következő specifikus nem hasznosításorientált pályázatok kiírását javasoljuk: • Pályázat magyar genomikai bioinformatikai központi facilitás létrehozására és működtetésére. • Pályázat magyar új generációs szekvenáló facilitás(ok) létrehozására. • Célpályázat orvosi genomikai kutatásokra. • Célpályázat mezőgazdasági genomikai kutatásokra. • Célpályázat metagenomikai kutatásokra.
30
• Célpályázat genom szekvenálási projektekre, kiemelt tekintettel az őshonos magyar fajokra, fajtákra. • Pályázat magyar genomikai bioinformatikai genomikai kutatásokra (adatbázis és algoritmusfejlesztések). • Pályázat a magyar bioinformatikai genomikai oktatás feltételeinek a megteremtésére a nagyobb tudományegyetemeken. • Pályázat a magyar kutatók bioinformatikai genomikai oktatásának az elősegítésére
31