BioMIMS - SOA platform a ritka örökletes betegségek kutatásához Alexander Melament, Yardena Peres, Edward Vitkin, Igor Kostirev, Noam Shmueli IBM Kutatás - Haifa Laboratórium Haifa, Izrael
[email protected]
Dr. Luca Sangiorgi, Dr. Marina Mordenti Orvosgenetikai részleg Rizzoli Ortopédiai Intézet Bologna, Olaszország
[email protected]
Sergio D'Ascia Nier Soluzioni Informatiche NSI Bologna, Olaszország
[email protected] Összefoglaló — Bevezetés: A BioMIMS egy kiváló minőségű* platform, amely megvalósítja azt az elképzelésünket, hogy az informatika hogyan támogathatja a ritka örökletes betegségek kutatását. Egy betegség akkor tekinthető ritkának, ha a lakosságnak csak kis hányadát érinti; a ritka betegségek többsége genetikai eredetű. A ritka örökletes betegségek kutatása több jelentős problémát is felvet az erre a célra szánt informatikai eszközök tekintetében. A kutatási folyamat kritikus eleme az együttműködést, és a kutatóközpontok közötti partnerség alapvető fontosságú az ilyen betegségek megértésében és kezelésében elérhető előrelépések érdekében. Mivel egyetlen kutatóközpont rendszerint nem rendelkezik elegendő adattal ahhoz, hogy megfelelő kutatást végezzen, az információkat partnerségben meg kell osztaniuk egymással. Ennek következtében a közös platformmal kapcsolatos első megoldandó probléma az, hogy hogyan egyesíthetők a különböző kórházak, kutatóközpontok, klinikai laboratóriumok és egyéb létesítmények által összegyűjtött információk. Emellett különböző típusú adatokat (pl. klinikai, genetikai, képalkotó vizsgálati adatokat és származási adatokat) kell egyesíteni ahhoz, hogy a betegségről átfogó képet alakíthassanak ki. A rendelkezésre álló adatok megszerzése és képi megjelenítése az első lépés ahhoz, hogy az analízis segítségével betekintést nyerjenek. A kutatással kapcsolatos kérdések nem mindig előre ismertek, és idővel módosulhatnak is, ezért egy hatékony platformnak képesnek kell lennie arra, hogy különböző adatgyűjtő és analitikai algoritmusokat integráljon. A platform felépítése: A BioMIMS platformot a Service Oriented Architecture (szolgáltatásorientált architektúra) (SOA) alapelveit követve alakítottuk ki. A BioMIMS architektúra egy központi buszra kapcsolódó számos kifinomult szolgáltatásból áll össze. A busz előre meghatározott munkafolyamatok szerint, a Message Oriented Middleware (üzenetorientált middleware) (MOM) koncepciót követve vezényli a meglévő szolgáltatásokat. Az üzenetsorok átmeneti tárhelyül szolgálnak az üzenetek számára, amikor a megcélzott szolgáltatás foglalt, vagy nincs kapcsolat. A buszon áthaladó és a különböző szolgáltatások által kezelt valamennyi üzenet elfogadott iparági szabványokon alapul. Az orvosi felvételek DICOM v3.0 formátumban tölthetők fel, illetve le a megfelelő rendszerben, míg a klinikai és a családi anamnesztikus adatok fel- és letöltése a HL7 v2.x és HL7 v3 családianamnézis-szabványoknak megfelelően történik. A betegeknek a különböző rendszerekben különböző azonosítójuk lehet. A betegek megfelelő azonosítása
érdekében, valamint hogy adataik a szabványoknak megfelelőek legyenek, a BioMIMS támogatja az IHE Patient Identifier Cross-Reference (betegazonosító kereszthivatkozás) (PIX) és a Patient Demographic Query (demográfiai betegadatok lekérdezése) (PDQ) műveleteket. A kórházak közötti és regionális szintű átjárhatóság érdekében a tárolt információkból az IHE Cross-enterprise Document Sharing (vállalatközi dokumentummegosztás) (XDS/XDS-I) profilok szerinti metaadatokat nyerünk. A szokványos kommunikációs felületeken alapuló SOA megközelítésnek számos előnye van, nevezetesen: a) rugalmas architektúra, amely lehetővé teszi új szolgáltatások beépítését, új munkafolyamatok létrehozását a már meglévők ismételt felhasználásával, valamint a meglévő alkalmazásokkal való egyszerű egyesítést; b) beépített méretezhetőség; c) gyors, egyedileg módosítható alkalmazásfejlesztés, amely csökkenti az informatikai költségeket. A platform értékelése: A BioMIMS rendszert a Rizzoli Ortopédiai Intézet (IOR) kutatói értékelték. Az IOR kutatói két ortopédiai betegség (a multiplex osteochondroma (MO) és az osteogenesis imperfecta (OI)) adatait töltötték fel és vizsgálták. A kutatók a BioMIMS segítségével a rendelkezésre álló adatokból több feltételezett elmélet helyességét erősítették meg. Emellett az értékelési folyamat során több érdekes momentum is felmerült, amely hozzájárult a jövőben elvégzendő vizsgálatok céljainak meghatározásához. * BioMIMS 2010-ben elnyerte a Computerworld érdemrendjét és az IBM Smarter Planet Reference Account díjat. Kulcsszavak: szolgáltatásorientált architektúra; egészségügyi szabványok; orvosi képalkotó vizsgálatok; adatbányászat; adatintegrálás; adatelemzés; ritka örökletes betegségek; szolgáltatáskezelés; kutatás; családfaelemzés; üzenetorientált middleware I. BEVEZETÉS A BioMIMS platform a 2010-es év Computerworld érdemrendjének [1,2] és az IBM Smarter Planet [3] Reference Account díjának nyertese, amely megvalósítja azt az elképzelésünket, hogy az informatika hogyan támogathatja a ritka örökletes betegségek kutatását. Egy betegség akkor ritka, ha a lakosságnak csak egy kis hányadát érinti. Az, hogy mi számít kis hányadnak földrajzi területenként változó. Az Amerikai Egyesült Államokban például egy betegséget akkor tekintenek ritkának, ha 1500 újszülött közül kevesebb mint egyet érint. Európában egy betegség akkor ritka, ha 2000 közül egy esetben fordul elő; Japánban pedig akkor, ha 2500 közül egy esetben. A ritkának tekintett betegségek száma az Amerikai
Egyesült Államokban a 7000-hez közelít, és ezek a betegségek 25 millió embert érintenek. Európában a ritka betegségek száma 6000 és 8000 között van, és ezek mintegy 30 millió embert érintenek. A legritkább betegségek mozgásszervi eredetűek. A ritka betegségek mintegy 80%-a örökletes, gyakran krónikus és életveszélyes [4, 5]. A ritka örökletes betegségek többsége jelenleg nem gyógyítható, főként azért, mert a betegséget kiváltó mechanizmusokat nem ismerjük. Ez a tény jelentős orvostudományi kutatásokra sarkall, és igényt teremt a megfelelő informatikai eszközök kidolgozására. A ritka örökletes betegségek kutatása több jelentős problémát is felvet az erre a célra szánt informatikai eszközök tekintetében. Az első megoldandó probléma a különböző forrásokból származó információk egyesítése. Mivel egyetlen kutatóközpont rendszerint nem rendelkezik elegendő adattal a megfelelő kutatás lefolytatásához, az adatokat partnerséget alkotva meg kell osztani más kórházakkal, kutatóközpontokkal, klinikákkal, laboratóriumokkal és egyéb létesítményekkel. A ritka betegségek kutatásának kritikus eleme az együttműködés, és így a platform kialakításának támogatnia kell a különböző kutatóközpontok közötti partnerséget. A másik kihívást a különböző típusú adatok kombinálása jelenti. Ahhoz, hogy a betegségről átfogó képet kapjunk különböző típusú információkat, mint például a családfák, klinikai, genetikai és képalkotó-vizsgálati adatok kell egymással kombinálni. A rendelkezésre álló adatok intuitív módon történő begyűjtése és megjelenítése ez első lépés ahhoz, hogy különböző analitikai módszerekkel elérjük a kívánt eredményt. Az összegyűjtött adatok elemzése is kihívást jelent az informatikai platform számára. A rendelkezésre álló adatok magukban foglalják az adatbányászattal kapcsolatos szokásos problémák nagy részét:
a) az információ zajos és hiányos, b) a rendelkezésre álló adatforrások közötti összefüggések alapmodelljei nehezen érhetőek és c) ami a legrosszabb, még a várhatóan felmerülő kérdések sem tisztázottak. E problémák megoldása érdekében a ritka betegségek kutatására szánt informatikai platformot többkliensű rendszerként kell kialakítani, amely lehetővé teszi a rendelkezésre álló adatok biztonságos fel- és letöltését a legkülönfélébb helyekről. A platformnak különböző elemzési technikákat kell lehetővé tennie, hogy a kutatók igény szerint végezhessenek adatbányászatot. Az új vagy már meglévő szolgáltatások és alkalmazások összeépítésének is egyszerűnek kell lennie. A platformnak meg kell felelnie az orvosi informatika legújabb szabványainak, így biztosítva az átjárhatóságot és bővíthetőséget. Tekintettel arra, hogy a platform felhasználói nem informatikus szakemberek, a felhasználói felületnek egyszerűnek és intuitívnak kell lennie, hasonlóan egy hagyományos internetes böngészőhöz. Cikkünk további része az alábbiak szerint épül fel: A II. fejezetben áttekintést adunk a BioMIMS rendszer felépítéséről, és ismertetjük, hogyan oldja meg a BioMIMS rendszer a fent felsorolt problémákat. A III. fejezetben röviden bemutatjuk két ritka ortopédiai betegséggel (multiplex osteochondroma (MO) és osteogenesis imperfecta (OI)) kapcsolatos előzetes kutatásunkat. A IV. fejezetben ismertetjük következtetéseinket. II. A PLATFORM FELÉPÍTÉSE A BioMIMS rendszer tervezése során az alábbi fő problémákat tartottuk szem előtt:
1. ábra: A BioMIMS felépítése
A BioMIMS felépítése Kórházak (képalkotó rendszerek (PACS); klinikai és genetikai laboratóriumok)
Orvosok és kutatók
DICOM
Analitikai szolgáltatás
GePh-CARD (Fenotípus, Genotípus
Egészségügyi BUSZ – HL7 v2 X, HL7 v3, WS, IHE profilok
PIX/PDQ szolgáltatás
Családfa szolgáltatás
1. Adatgyűjtés a különböző kutatóközpontokból 2. Egyetlen átfogó nézőpont kialakítása a számos különböző adattípusból (mint pl. orvosi képalkotó vizsgálat, családi és személyes anamnézis, klinikai kórlapok, genetikai vizsgálatok stb.) 3. Különböző adatbányászati és analitikai algoritmusok beépítése 4. Valamennyi rendelkezésre álló adat biztosítása intuitív, könnyen érthető módon 5. Bővíthetőség és az egészségügyi informatikai szabványoknak való megfelelés E problémák megoldása érdekében platformunkat a Service Oriented Architecture (szolgáltatásorientált architektúra) (SOA) alapelveit követve alakítottuk ki. A BioMIMS architektúra egy központi buszra csatlakozó számos kifinomult szolgáltatásból áll össze (lásd: 1. ábra). A busz előre meghatározott munkafolyamatok szerint, a Message Oriented Middleware (üzenetorientált middleware) (MOM) koncepciót követve vezérli a meglévő szolgáltatásokat [7]. Az üzenetsorok átmeneti tárhelyül szolgálnak az üzenetek számára, amikor a megcélzott szolgáltatás foglalt, vagy nincs kapcsolat. A buszon áthaladó és a különböző szolgáltatások által kezelt valamennyi üzenet elfogadott iparági szabványokon alapul (lásd: I. táblázat). I. TÁBLÁZAT
A BIOMIMS ÁLTAL TÁMOGATOTT SZABVÁNYOK
A szabvány neve
Támogatott verziók
DICOM
v3.0
HL7
v2.x
HL7 Családi anamnézis
v3
Az orvosi felvételek DICOM v3.0 formátumban tölthetők fel, illetve le a megfelelő szolgáltatórendszerben [8]. A DICOM a kórházakban legelterjedtebben használt formátum a digitális orvosi felvételek továbbítására. A klinikai és a családi anamnesztikus adatok továbbítása a HL7 v2.x és HL7 v3 családianamnézis-szabványoknak megfelelően történik [9, 10]. A HL7 [11] a klinikai adatok közvetítőnyelve. Az Amerikai Egyesült Államokban a legtöbb kórház a HL7 v2.X szabványt használja a belső munkafolyamatokhoz. Az IHE informatikaiinfrastruktúra-profilok [12] pontosan meghatározzák a szabványok, például a DICOM, HL7, W3C és a biztonsági előírások alkalmazásának módját annak érdekében, hogy megfeleljenek az átjárhatósággal kapcsolatos konkrét igényeknek a betegek egyedi azonosítása és a klinikai dokumentumok kórházak közötti megosztása tekintetében. A betegeknek a különböző rendszerekben különböző azonosítójuk lehet. A betegek megfelelő azonosítása érdekében, valamint hogy adataik a szabványoknak megfelelőek legyenek, a BioMIMS támogatja az IHE Patient Identifier Cross-Reference (betegazonosító kereszthivatkozás) (PIX) és a Patient Demographic Query (demográfiai betegadatok lekérdezése) (PDQ) műveleteket. Ez lehetővé teszi a különböző kutatóközpontokból összegyűjtött betegadatok egyetlen átfogó rendszerbe történő beépítését. A kórházak közötti és regionális szintű átjárhatóság érdekében a tárolt információkból az IHE Cross-enterprise Document Sharing (vállalatközi dokumentummegosztás) (XDS/XDS-I) profilok szerinti metaadatokat nyerünk. A szabványos felületek (lásd: I. táblázat) és az IHE-profilok támogatása mellett az általunk választott SOA-megközelítésnek számos egyéb előnye is van. Az architektúra rugalmas, az új munkafolyamatok és alkalmazások könnyen integrálhatók. Emellett az új munkafolyamatok és alkalmazások
létrehozása jelentősen leegyszerűsödik a meglévő modulok ismételt felhasználásával. Ez a megközelítés felgyorsítja a testreszabott alkalmazások fejlesztését, és jelentősen csökkenti az informatikai költségeket. A modulrendszerű architektúrának van egy másik nagy előnye. Mindegyik szolgáltatási modul könnyen átméretezhető anélkül, hogy ez hatással lenne a többi szolgáltatás alkalmazására. Az alábbi alfejezetekben a BioMIMS által nyújtott szolgáltatásokat tárgyaljuk részletesebben. A. GePh-CARD szolgáltatás A GePh-CARD több szervezetet érintő webes alkalmazási szoftver, amelyet a ritka betegségben szenvedő betegek klinikai-genetikai adatainak tanulmányozására, gyűjtésére és elemzésére specializálódott klinikusok és kutatók munkájának támogatására fejlesztettünk ki. Öt fő forrásból származó információkat kezel: 1. Személyes adatok tartomány – az egyes betegek vagy hozzátartozójuk személyes adatai 2. Klinikai adatok tartomány – a beteg vonatkozó klinikai adatai attól függően, hogy milyen típusú betegségben szenved 3. Genetikai adatok tartomány – a beteg genetikai adatai az alkalmazott genetikai vizsgálati módszer típusától függően 4. Családfaadatok tartomány – a beteg családfája, amely elősegíti a beteg rokonai közötti kapcsolatok megértését 5. Dokumentációs adatok tartomány – különböző típusú klinikai és genetikai dokumentumok A GePh-CARD-ot különböző klinikai és kutató szervezetek használják saját betegadataik kezelésére. Szerepkör alapú hozzáférési vezérlőrendszerrel rendelkezik, amely a különböző szervezetekhez tartozó felhasználók számára egyedi hozzáférési jogokat biztosít a betegek adataihoz. A BioMIMS rendszerben a GePh-CARD egy sor kifinomult lekérdezést támogat. A lekérdezés eredményei a különböző típusú adatok (pl. képalkotó vizsgálatok, fenotípus és genetikai adatok) kombinációját tartalmazhatják. A GePh-CARD kommunikál a BioMIMS webes szolgáltatásokon, az IHE integrációs profilokon (pl. IHE PIX/PDQ) és szabványos protokollokon (pl. HL7) alapuló egyéb szolgáltatásaival. B. PIX/PDQ szolgáltatás Egyes országok nemzetközi azonosítókat adnak meg a betegek egyedi azonosítására. Ez a nemzetközi egyedi azonosító azonban nem mindig érhető el az ellátás helyszínén. Emellett egyes kórházak, laborok és klinikák saját azonosítórendszerrel dolgoznak, így ugyanannak a betegnek több helyi betegazonosítója is lehet. Az átjárhatóság érdekében a betegek rendszerben történő megfelelő azonosítása kulcsfontosságú. A PIX/PDQ szolgáltatás fő célja az egyazon beteghez tartozó összes helyi azonosító megfelelő kezelése és megfeleltetése. A rendszer az IHE integrációs profilok (IHE PIX és IHE PDQ) által meghatározott szabványos kommunikációs felületeket alkalmazza. A Patient Identifier Cross Referencing (betegazonosító kereszthivatkozás) (PIX) integrációs profil az alábbiak útján támogatja a különböző betegazonosító tartományokból származó betegazonosítókra való kereszthivatkozást: Támogatja a különböző azonosítási forrásokból származó betegazonosítási információk továbbítását, és egy betegazonosító törzsadatbázist vezet az összes betegazonosító kereszthivatkozásról
Hozzáférést biztosít a kereszthivatkozott betegazonosítók listájához/listáihoz lekérdezés/válasz vagy aktualizáló értesítés formájában A Patient Demographics Query (demográfiai betegadatok lekérdezése) (PDQ) integrációs profil segítségével az alkalmazás egy központi beteginformációs kiszolgálóról kérdezi le a beteg demográfiai adatait és a vonatkozó információkat. C. Orvosi képalkotós vizsgálati szolgáltatás Az Orvosi képalkotós vizsgálati könyvtár (CMO) egy nagymértékben bővíthető, hosszú távú archiváló rendszer az orvosi felvételek számára. Az IBM Enterprise Content Management termékekre épül [13]. A CMO lehetővé teszi a biztonságos, hitelesítésen alapuló, DICOM alapú kommunikációt az összes résztvevő intézmény között. A intézmények megadhatják, hogy mely felhasználók férhetnek hozzá orvosi felvételeikhez. A CMO emellett olyan DICOM illesztőfelületet biztosít, amely támogatja a különböző kórházakból és klinikákról származó DICOM felvételek fogadását, kiértékelését és archiválását. A DICOM illesztőfelület támogatja a DICOM lekérdezéseket és a felvételek letöltését is. Ezenkívül a CMO biztosít egy webes szolgáltatási illesztőfelületet a PIX/PDQ kiszolgálóról történő lekérdezésekhez, és webes szolgáltatási illesztőfelületeket a GePh-CARD által küldött lekérdezések támogatására. A CMO átfogó webes alapú felügyeleti kezelőpultot biztosít, amely lehetővé teszi a távoli kórházakkal (modalitások, képalkotó (PACS) rendszerek) való CMO-kapcsolatok beállítását. Egyéb előnyei mellett a CMO beállítása lehetővé teszi a kívánt DICOM paraméterek, hitelesítési és engedélyezési házirendek és egyéb beállítások megadását. D. Családfa szolgáltatás A Családfa szolgáltatás a GePh-CARD szolgáltatást használja webes szolgáltatásokon keresztül, és lehetővé teszi a családfaábrák dinamikus megjelenítését. A családfaábrán látható csomópontok személyeket jelölnek. A BioMIMS felhasználói kiválaszthatnak egy csomópontot a családfaábrán, és behívhatják a kiválasztott személlyel kapcsolatban rendelkezésre álló valamennyi információt. Ezenkívül ez a szolgáltatás lehetővé teszi az előre meghatározott feltételek alapján történő családfa-osztályozást. A Családi anamnézis megjelenítése és megosztása a HL7 V3 családianamnézis-szabványon alapul. Ez a szabvány lehetővé teszi egy személy családi anamnézisének alkalmazások közötti cseréjét. A családfastruktúrát, valamint az egymással összefüggő klinikai-genetikai adatok megfelelő megjelenítését megtartja. E. Analízis szolgáltatás Az Analízis szolgáltatás célja, hogy különböző adatelemző eszközöket biztosítson a kutatók munkájának segítéséhez. A GePhCARD, CMO, PIX/PDQ és Családfa szolgáltatás lehetővé teszi a betegekre vonatkozó átfogó klinikai, genetikai, orvosi képalkotós vizsgálati és családfaadatok gyűjtését és megjelenítését. Amikor ezek az adatok megvannak, a kutatók különböző analitikai módszerekkel elkezdhetik megkeresni az összefüggéseket. Mivel a kívánt elemzési algoritmusok sora előre nem ismert, az Analízis szolgáltatás a SOA irányelvek alkalmazásával bővíthető. Az Analízis szolgáltatásba két fő összetevőt építettünk
be: az Automatikus tanulási algoritmus összetevőt és Statisztika összetevőt. Az első összetevő a különféle automatizált tanulási technikákat, például a Döntésfákat [14], Fürtözési módszereket [15] és a Bayes-hálókkal történő adatvalószínűségi elemzéseket [16] támogatja. A második összetevőbe egy Apache általános matematikai statisztikai csomag [17] van beépítve, amely támogatja az általánosan elfogadott statisztikai vizsgálatokat, például a Pearson-Spearman korrelációs teszteket, és az ANOVA és khi-négyzet próbákat. A kutatók mindkét összetevőt a kutatás potenciális irányainak vizsgálatára használhatják fel. A kívánt algoritmusnak az összegyűjtött adatokra való alkalmazása előtt a kutatónak meg kell határozni a vizsgálandó betegcsoportot. A betegek célcsoportjának kiválasztása után a kutató megadja az elemzendő jellemzőterületet. A jellemzőterület a beteggel kapcsolatos témakörök bármely alcsoportja lehet, például klinikai adatok (pl. vérvizsgálati eredmények), demográfiai adatok (pl. életkor) vagy genetikai adatok (pl. bizonyos mutáció jelenléte). A célcsoport és a jellemzőterület kiválasztása után a kutató lefuttathatja az adatelemzési algoritmust. A helyes algoritmus megválasztásához a kutatónak meg kell határoznia a kutatási kérdést. Például a kutató azt szeretné vizsgálni, hogy milyen összefüggések vannak két meghatározott jellemző között, hogy bizonyos jellemzőket más jellemzők kombinációja alapján megmagyarázzon, vagy hogy megtalálja, hogy egy jövőbeni laboratóriumi kutatáshoz melyik lehet a legígéretesebb betegalcsoport. Az ilyen kérdések megválaszolására számos technika áll rendelkezésre. Platformunk használatával könnyen integrálhatók és lefuttathatók az e célt szolgáló megfelelő algoritmusok. III. A PLATFORM ÉRTÉKELÉSE Az előző fejezetben ismertetett különböző szolgáltatások kombinációja maga a BioMIMS rendszer, amely a ritka örökletes betegségek kutatását segítő platform. A rendszerbe különböző entitások, például kórházak, klinikák és orvosi laboratóriumok juttatnak be adatokat (1. ábra). Valamennyi családi és klinikai adat gyűjtése HL7 és HL7 Családi anamnézis formátumban [9, 10, 11], tárolásuk pedig a GePh-CARD rendszerben történik. Valamennyi orvosi felvétel gyűjtése DICOM formátumban, és a felvételek tárolása pedig a CMO rendszerben történik. A különböző családok a PIX/PDQ szolgáltatás segítségével kombinálhatók. Az IHE XDS/XDS-I protokollokkal gyűjtött metaadatok segítségével minden tárolt adat könnyen hozzáférhető. A tudósok egy előre meghatározott adatfolyam-sorozat használatával tölthetik fel, hívhatják be és tanulmányozhatják az adatokat, amely sorozat egyszerűen bővíthető. A platform használhatóságát a Rizzoli Ortopédiai Intézet (IOR) kutatói tesztelték. A kutatók két ritka örökletes betegséget (multiplex osteochondroma (MO) és az osteogenesis imperfecta (OI) [19]) vizsgáltak. Az IOR szakértői különböző klinikai betegadatokat töltöttek fel, és különféle adatelemzési technikákat alkalmaztak. A BioMIMS használatával a kutatók a meglévő adatokra vonatkozó számos sejtést igazoltak. Emellett az értékelési folyamat során olyan új kérdések merültek fel, amelyek hozzájárultak a jövőben elvégzendő vizsgálatok céljainak meghatározásához. A fejezet további részében az IOR kutatói által elvégzett vizsgálatokat ismertetjük részletesebben.
A. Multiplex osteochondroma (MO) Az osteochondroma egy porccal borított jóindulatú csontdaganat, a csöves csontok metaphysiseinek külső részén található kinövés. A multiplex osteochondroma (MO) egy ritka örökletes ortopédiai betegség, amelyet röntgenvizsgálattal diagnosztizálnak, amikor legalább két (de rendszerint számos) osteochondroma jelenik meg a csöves csontok epiphysealis területén a 2. ábrán látható módon. Az osteochondroma gyermekkorban alakul ki a csontvázrendszer fejlődése során, és ülő (sessilis) (széles alapú) vagy nyeles (pedunculosus) (karfiol alakú) formát vehet fel. A MO-betegeknél többféle tünet jelentkezhet, a majdnem észlelhetetlen klinikai jelektől egészen a súlyos szövődményekig, jelentős családon belüli és családok közötti variabilitással. A betegek nagy többségénél (90%) az exostosin-1 (EXT1), ill. az exostosin-2 (EXT2) gén mutációja figyelhető meg, ami általában az EXT fehérje funkcióvesztését eredményezi.
1.
2.
3. 4.
Férfiaknál a betegség általában súlyosabb formában jelentkezik, mint nőknél, mind családok közötti, mind családon belüli nézőpontból vizsgálva. Az EXT1 mutációk súlyosabb betegséget eredményeznek és konkrét klinikai megjelenési formákkal vannak összefüggésben (pl. mozgáskorlátozottság a III. osztályba tartozó betegeknél) A III. osztályba tartozó betegek testsúlya rendszerint alacsonyabb A negatív családi anamnézis III. osztályú betegségre utal
2.) Az értékelés eredményei Az 1. összefüggést (a beteg neme és a betegség súlyossága között) döntésfa [14] alkalmazásával elvégzett adatelemzéssel igazolták, néhány finomítással. Megtudtuk például, hogy a súlyosság mértéke csak az EXT1 génmutáció és ismert családi anamnézis együttese esetén függ a nemtől (3. ábra), míg az EXT2 génmutáció esetében nem találtunk ilyen összefüggést. Ez az eredmény a megfelelő EXT gének által kódolt fehérjék eltérő szabályozási mechanizmusaira utalhat. EXT1 és pozitív családi anamnézis
2. ábra: Multiplex osteochondroma (MO) 1) Értékelési adatok Az értékeléshez közel 700 beteg adatait töltöttük fel a rendszerbe. Ez a valaha értékelt legnagyobb MO-betegcsoport. Minden beteg törzslapja több mezőt tartalmazott, klinikai és demográfiai adatokkal, amelyeket a II. táblázatban mutatunk be. II. TÁBLÁZAT Mezőnév Azonosító
Az MO-betegek kórlapján szereplő mezők Leírás A beteg egyedi azonosítója a rendszerben (név nélkül)
Nem
A beteg neme
Életkor
A beteg életkora
Testmagasság
A beteg magassága
Súly
A beteg testsúlya
Családi anamnézis
Ha a betegnek vannak beteg hozzátartozói
Genetikai besorolás A mutáció típusa
Klinikai besorolás
A mutáció által érintett gén neve (EXT1 vagy EXT2) A mutáció típusa: frameshift (keretelmozdulásos), splice site (vágási helyet érintő mutáció), deléció, inszerció stb. A betegnél meghatározott súlyossági osztály; az I. osztály a legkevésbé súlyos és a III. osztály a legsúlyosabb, a deformitásoktól és a mozgáskorlátozottságtól függően
Az értékelési folyamat során a kutatók több ismert eredményt próbáltak megerősíteni a szakirodalomban rendelkezésre álló adatok alapján. A vizsgált összefüggések a következők voltak:
I
II
III
-♦-Férfi
18%
24%
46%
-■-Nő
29%
27%
14%
3. ábra: Az MO betegség súlyosságának nemtől függő manifesztációja, amely egyértelműen azt mutatja, hogy a súlyosság fokozódásával csökken a nőbetegek és nő a férfibetegek aránya
A 2. összefüggést (a mutáns gén és a betegség súlyossága között) ugyancsak döntésfa elemzéssel igazolták (4. ábra) Emellett a khi-négyzet próba is szignifikáns összefüggést mutatott ki a klinikai besorolás és a genetikai besorolás dimenziók között. A kapott tesztérték 16,9 volt, ami 0,005 p-értéknek felel meg.
1.) Értékelési adatok Az értékeléshez 140 beteg adatait töltöttük fel a rendszerbe. Minden beteg kórlapja több mezőt tartalmazott, klinikai és demográfiai adatokkal, amelyeket a III. táblázatban mutatunk be. III. TÁBLÁZAT
I
II
III
-♦-Extl
60%
77%
92%
-■-Ext2
40%
23%
8%
4. ábra: Az EXT1 génmutáció az MO betegség két legrosszabb megjelenési formájával van összefüggésben, amit egyértelműen jelez az, hogy a súlyosság fokozódásával csökken az EXT2-betegek és nő az EXT1-betegek aránya
Az alacsony testsúly és a III. osztályba tartozó betegek közötti harmadik összefüggés tekintetében sem alátámasztó, sem ellentmondó bizonyítékot nem találtunk. Meglepő módon a rendelkezésre álló adatok döntésfa technikák alkalmazásával cáfolták azt a feltevést, hogy a negatív családi anamnézis III. osztályba sorolt betegségre utal; az EXT1 géndefektus esetén ellentétes tendenciát figyeltünk meg. Az eredmények azt mutatták, hogy a III. osztályba sorolt, EXT1 génmutációval rendelkező betegek 65%-ánál a családi anamnézis pozitív. B. Osteogenesis imperfecta (OI) Az osteogenesis imperfecta (OI), más néven üvegcsontúság jellemzője a csonttörésre való hajlam (azaz fokozottan törékeny csontok), az alacsony csontsűrűség és egyéb kötőszöveti manifesztációk. A leggyakrabban alkalmazott osztályozás négy klinikai típust különít el, amely a betegség súlyossága alapján hét egymástól elkülöníthető típusra bővíthető. A súlyosság mértéke az enyhe (I. típusú OI) és a perinatális halálos (II. típusú OI) között változik, és autoszomális domináns és recesszív séma szerint öröklődik. A betegek többségénél a problémát az I. típusú kollagén (a csont legfontosabb szerkezeti fehérjéje) láncát kódoló két gén (Col1A1 és Col1A2) egyikének mutációja okozza. Egyes személyeknél azonban nem mutatható ki ilyen mutáció. Az ilyen betegségben szenvedő emberek csontjai könnyen törnek, gyakran már enyhe trauma hatására vagy látható ok nélkül is. Az 5. ábrán az OI betegségről készült röntgenfelvételek láthatók [20].
Mezőnév Azonosító
Az OI-betegek kórlapján szereplő mezők
Leírás A beteg egyedi azonosítója rendszerben (név nélkül)
Nem
A beteg neme
Életkor
A beteg életkora
Ha a betegnek vannak beteg hozzátartozói A beteg klinikai státuszának Klinikai besorolás besorolása A mutáció által érintett gén neve Genetikai besorolás (COL1A1 vagy COL1A2) A mutáció típusa: frameshift (keretelmozdulásos), splice site A mutáció típusa (vágási helyet érintő mutáció), deléció, inszerció stb. Kvantitatív vagy kvalitatív A defektus típusa mutációtípus A beteg sclerájának színe (kék, fehér, A sclera színe szürke, lila…) Családi anamnézis
Bőr
A beteg bőrének érzékenysége
Süketség
A beteg süketségének mértéke
Dentinogenesis Igen / Nem imperfecta Szívet érintő Igen / Nem elváltozások Cutis laxa
Igen / Nem
Az értékelési folyamat során a kutatók a következő összefüggéseket próbálták igazolni: A kvantitatív genetikai defektusok (frameshift (keretelmozdulásos), kezdő metionin, nonszensz, splice site (vágási helyet érintő mutáció), splice variant (vágási variáns)) általában az I. osztályba tartozó betegeknél fordulnak elő Kvalitatív genetikai defektusok (kereten belüli inszerció, kereten belüli deléció, kereten belüli inszerció-deléció, misszensz) általában a II. osztályban fordulnak elő 2) Az értékelés eredményei Mivel számos érték hiányzott, ezt az összefüggést nem sikerült igazolni. A khi-négyzet próba azonban szignifikáns és nem várt összefüggéseket fedett fel, amelyeket a IV. táblázatban tüntettünk fel.
5. ábra: Osteogenesis imperfecta (OI)
a
IV. TÁBLÁZAT
#
1. jellemző Genetikai
1 besorolás
Genetikai
2 besorolás
Genetikai 3 besorolás Klinikai 4 besorolás Klinikai 5 besorolás
6 Süketség
V. IRODALOM
MEGFIGYELT OI-ÖSSZEFÜGGÉSEK 2. jellemző Klinikai besorolás Családi anamnézis Dentinogenesis imperfecta Családi anamnézis
Khi-négyzet próba értéke
P-érték
[1] [2]
137,41
0,0
45,88
3,3967e-6
[3]
28,67
1,6622e-4
[4]
56,72
3,6159e-6
48,56
1,1331e-6
A mutáció típusa 55,47
1,6783e-4
Cutis laxa
[5] [6] [7]
IV. ÖSSZEFOGLALÁS ÉS KÖVETKEZTETÉSEK Az elmúlt években egyre növekvő érdeklődés mutatkozik a ritka örökletes betegségek kutatása iránt. Az informatikai ipar legújabb fejlesztései egyre nagyobb számítástechnikai potenciált, jobb algoritmikus megoldásokat és új szoftverkialakítási koncepciókat biztosítanak a kutatók számára. Ezekkel az új technikákkal lehetőség nyílik nagy mennyiségű összetett és heterogén adat egyszerű és gyors elemzésére. A ritka betegségek kutatása több követelményt is támaszt az informatikai platformokkal szemben. Különböző laboratóriumokból és kutatóközpontokból származó adatokat kell kombinálniuk. Emellett különböző típusú adatokat (pl. családfákat, felvételeket, klinikai és genetikai adatokat) kell egyetlen összefüggő nézetté integrálni. A tudósoknak különböző elemzési technikákhoz kell tudniuk hozzáférni, és szükséges számukra az adatok megfelelő megjelenítése. Jelen cikkünkben a BioMIMS rendszert mutattuk be, amely a ritka betegségeket kutató szakemberek munkáját segítő új platform. A platform kialakítása a legújabb szoftverfejlesztési elképzeléseken, a SOA és a MOM előíráson alapul. A rendszer szíve egy központi busz, amely számos szolgáltatást köt össze és vezérel. A buszon áthaladó üzeneteket a rendszer az elfogadott iparági szabványoknak megfelelően állítja elő (felvételek esetén DICOM formátumban, a klinikai és családi anamnesztikus adatok esetén HL7, az azonosítók esetén PIX/PDQ szabványt alkalmazva, a metaadatok kinyerésére pedig XDS/XDSI rendszert használva). A BioMIMS kibővíti az együttműködési lehetőségeket, javítja a létesítmények bővíthetőségét, és csökkenti a szoftverfejlesztésre fordítandó költségeket. A platform használhatóságát ritka örökletes ortopédiai betegségek kutatásával foglalkozó szakemberek tesztelték két mozgásszervi betegség, a multiplex osteochondroma (MO) és az osteogenesis imperfecta (OI) esetében. Az MO esetén két ismert adatösszefüggést erősítettek meg és finomítottak tovább. Az OI esetében hat új összefüggésre bukkantak, amelyek tesztelése jelenleg is folyik egy részletesebb értékelési folyamat keretében. A nemzetközi informatikustársadalom 2010-ben a Computerworld érdemrenddel és az IBM Smarter Planet Reference Account díjjal ismerte el a BioMIMs rendszer újdonságát és értékét.
[8] [9]
[10]
[11] [12] [13] [14] [15]
[16]
[17] [18]
[19] [20]
The Computerworld Honors Program http ://www.cwhonors.org/ BioMIMS Case Study http://cwhonors.org/viewCaseStudy2010.asp?NominationID =222&U sername=cbroibi IBM Smarter Planet http://www.ibm.com/smarterplanet/us/en/ Office of the Secretary, DoD, "TRICARE; rare diseases definition. Final rule." Fed Regist. 2010 Aug 6;75(151):47458. www.eurordis.org, "Rare Diseases : Understanding this Public Health Priority" Eurordis, 2005 B.Michael. "Introduction to Service-Oriented Modeling: Service Analysis, Design, and Architecture." John Wiley and Sons, 2008. Banavar G, Chandra T, Strom R, Sturman D. "A case for message oriented middleware". Proceedings of the 13th International Symposium on Distributed Computing, Bratislava, Slovak Republic, Springer: Berlin, 1999; 1-18. Cong Yu and Zhihong Yao, "XML-Based DICOM Data Format", Journal of Digital Imaging. Volume 23, Number 2, 192-202, DOI: 10.1007/s10278-008-9173-5 , 2009 Shabo, A., Hughes, S.K. "Family History Information Exchange Services Using HL7 Clinical Genomics Standard Specifications." International Journal on Semantic Web & Information Systems, 1(4), 42-65, 2005. Dolin, R.H., Alschuler, L., Boyer, S. Beebe, C., Behlen, F.M., Biron, P.V., Shabo, A. "HL7 Clinical Document Architecture, Release 2". Journal of the American Medical Informatics Association. 2006, 13(1): 30-39. Health level 7 - http://www.hl7.org/ IHE Profiles - http://www.ihe.net/profiles/ IBM Enterprise Content Management http://www-01.ibm.com/software/data/content-management/ Quinlan, J. R., "Induction of decision trees" Machine Learning, 1(1), 81-106, 1986 MacQueen, J. B. "Some Methods for classification and Analysis of Multivariate Observations". Proceedings of 5th Berkeley Symposium on Mathematical Statistics and Probability. University of California Press. 1967, pp. 281-297. Ben-Gal, Irad "Bayesian Networks". In Ruggeri, Fabrizio; Kennett, Ron S.; Faltin, Frederick W. Encyclopedia of Statistics in Quality and Reliability.John Wiley & Sons. doi: 10.1002/9780470061572.eqr089. ISBN 978-0-470-01861-3. 2007 Commons-Math - http ://commons.apache.org/math/ Bovee JVMG, Hogendoorn PCW: "Multiple osteochondromas. In World Health Organization classification of tumours. Pathology and genetics of tumours of soft tissue and bone." Edited by: Fletcher CDM, Unni KK and Mertens F. Lyon, IARC Press; 2002:360-362. Rauch F, Glorieux FH "Osteogenesis imperfecta". Lancet 363 (9418), 1377-85. doi: 10.1016/S0140-6736(04)16051-0. PMID 15110498. 2004 Osteogenesis Imperfecta (OI) http://www.easilybrokenbones.com/