Informatika a felsőoktatásban 2008
Debrecen, 2008. augusztus 27-29.
KÉPI INFORMÁCIÓK KEZELHETŐSÉGE Forczek Erzsébet SZTE ÁOK Orvosi Informatikai Intézet Összefoglaló Tanórákon és az önálló tanulás részeként is, az informatika világában a rendelkezésünkre álló óriási mennyiségű szakmai kép segítségével, a képi kommunikáció egyre mindennaposabbá válik. Az utóbbi években az oktatás számára is használható képi adatbázisok száma ugyan látványosan megnőtt, de ez a mennyiségi növekedés nem vonta maga után képanyagaink kezelhetőségére módot adó, általánosan is elfogadott konvenció, vagy szoftver eszközök létrejöttét ill. annak „hétköznapi” eszközzé válását. Célunk volt, hogy kialakítsuk a közös tanár-diák szaktárgyi munka során összegyűjtött képek egységes szempont szerinti tárolásának, formai és tartalmi jegyek alapján történő hatékony visszakeresésének lehetséges módszereit. Megvizsgáljuk továbbá, a szaktárgyi tudományos fogalomalkotás felhasználásával, a formalizált szöveges annotáció létrehozásának lehetőségét. Fontos volt még a kidolgozott módszer és eszköz egyszerű gépi megvalósíthatósága, az elvégzett munka azonnali eredményessége, és a létrehozott produktum illeszkedése a „Szemantikus Web” fejlesztési irányvonalába, hogy eredményeink a várható fejlődési folyamatok és struktúraváltozások után is felhasználhatóak legyenek.
Kulcsszavak Kép, annotáció, Szemantikus Web Abstract With the large amount of professional images available in the world of informatics, visual communication becomes more and more common in the classes and as part of self-directed learning. Although the number of image databases usable in education has significantly increased, this quantitative growth has not involved the development and expansion of generally accepted conventions or softwares that allow us better manageability of our image material. Our aim was to develop possible methods of storing the images - collected during common teacher-student work - by standardized aspects and of efficient retrieval by formal and content characteristics. We also investigate the possibility of developing a formalized textual annotation, using the scientific conceptformation of a specific field. Easy digital realization of the developed tool and method, immediate results, fitting of the tool into the development trends of ‘Semantic Web’ was also important, so that our results may be applicable after the prospective development processes and changes in structure.
Keywords image, annotation, Semantic Web
1
Informatika a felsőoktatásban 2008
1.
Debrecen, 2008. augusztus 27-29.
Bevezetés
A világ egyre inkább az elektronikus formában, elsősorban interneten elérhető információs tartalmak használata irányába halad. A weben az információk nagyon sokféle alakban vannak jelen, a klasszikus szöveges információk mellett két- és háromdimenziós képek, videók, zenék formájában is. Megjelenési formától függetlenül, a tartalmak nagy részét adatbázisokban tárolják, így ennek a tartalomnak egy része a kereső motorok elöl rejtve marad, s ezáltal a felhasználók számára is. Az információt elsősorban a felszíni web általában szövegszerű és dokumentum típusú szabad szöveges megjelenési formájában találjuk meg. Itt az adatszerkezet többnyire laza, a dokumentumok belső struktúra nélkül, ömlesztve tartalmazzák az információt, gyakran különböző terminológiai elnevezésekkel. Gépi szövegelemzések sora segíti a kereső motorokat, hogy a felhasználó igényihez igazodó információkat megtalálják. Bár a keresők szolgáltatta eredmény nem mindig tökéletes és messze nem teljes körű, de az emberek könnyen tudnak inkoherens vagy nem teljes információkat használni, fénykép tartalmát értelmezni, áthidalni terminológiai különbségeket, és sokszor félkész információkat teljessé alakítani.
2.
Képi információ
A digitális reprezentálás során speciálisan kezelendők azonban a multimédia elemek, elsősorban képek, amelyek se nem adatszerűek, se nem szövegszerűek. Az általuk hordozott információ többnyire szubjektív fogalom, mely szorosan kötődik az információt fogadó egyénhez és az egyén terminológiai ismeretéhez. A képeken tartalomra utaló „digitális jegyek” általában nincsenek, így a tartalmi jegyek leképezésének módszerét, struktúráját vagy folyamatát általánosságban nem ismerjük. A multimédia elemek, ezen belül a képek, tartalmi jegyeinek azonosítása sem a weben, sem a saját tárolási médiumainkon nem megoldott feladat. Kutatások folynak ugyan a képek automatikus felismerésére színek, alakok segítségével, de komoly eredményeket csak az alaki jegyek felismerésében értek el, vagy speciális esetekben, például röntgen képek elemzésénél, egyedi programokkal. (Sántáné-Tóth, et al., 2008) Mivel a tartalmi jegyek továbbra is fedve maradnak, a képekhez, mint a többi multimédia elemhez is, metainformációkat, metaadatokat kell rendelni. A metaadatok elméletileg bármilyen típusúak lehetnek, akár egy kép részlet is, ennek előnye a képiség megtartása lenne. A kiértékelhetőség miatt azonban, a szöveges annotáció tűnik célszerűnek. A szöveges annotációt természetesen lehet adatszerűen vagy szövegszerűen is leképezni a rendszerrel szemben támasztott igényeknek megfelelően, de az emberi gondolkodás a szabadszöveges, vagy a szabad szöveg látszatát keltő leírást helyezi előtérbe.
3.
Képek származása és használhatósága
Az oktatás számára különösen fontosak azok a gyógyításban használt integrált kórházi rendszerek, melyek, az elektronikus betegrekord segítségével, a beteg teljes kórtörténetének együttes kezelésére hivatottak. Ugyancsak fontosak azok a képi adatbázisok is, amelyek nem a betegek, hanem különböző betegségek köré vannak csoportosítva, kísérleteket írnak le, vagy
2
Informatika a felsőoktatásban 2008
Debrecen, 2008. augusztus 27-29.
tudományos adatokat kezelnek. Kiegészíthetjük előadásaink, gyakorlataink vagy az önálló munka anyagát tradicionális webes keresések eredményeivel is, ahol szembe kell ugyan nézni az „információ túlterheltséggel” a keresések során kapott nagyszámú találat miatt, de a találatok között elég sok a releváns információ, és némi időráfordítással sok releváns anyaghoz juthatunk. Értékes lehet az általunk, vagy munkacsoportunk által készített, gyakran több száz vagy akár több ezer kép is, melyek általában könyvtárainkban, egymástól függetlenül, egyszerű könyvtárstruktúrába rendezve találhatók. Gyűjtőmunkánk eredményeként nagyon sok szabadszöveges, kódolt és képi információ áll rendelkezésünkre, és mindezen információk együttes használata, integrálása az orvosok és ápolók oktatásában, a kutatásban és a gyógyításban is kiemelkedő szerepet játszanak. Az oktatás számára azonban a különböző adatbázisok, internetes portálok, betegarchívumok és általunk összegyűjtött információk halmazának gyakorlati haszna attól függ, hogy milyen gyorsan találjuk meg benne a számunkra hasznos információt, esetünkben a képeket. A különböző elérési helyek integrálása, a többféle megjelenési mód, azonosítási forma és jogosultsági rendszer miatt nem lehetséges. Ezért, egy adott oktatási célra, a különböző előfordulási helyekről célszerű összegyűjteni egy „munkaterületre” képeinket, és egy szélesebb körben, tanárnak és diáknak is használható nyílt, webes keresőkkel elérhető adatrendszerré szervezni. A létrehozott új szisztémában a képek azonosítása, szöveges annotációk révén, keresők segítségével történik. A képekhez csatolt annotációk azonban ritkán hordozzák az elnevezések, a kapcsolatok és az összefüggések következetes rendszerét, melyek alkalmasak lennének egy egyértelmű azonosításra, visszakeresésre.
4.
Kódrendszerek használata
A különböző módon és helyeken tárolt orvosi képek hatékony, új szempontok szerinti felhasználása metaadatok nélkül nem lehetséges. A képek tartalmának és technikai paramétereinek szabványos metaadat címkézése nélkül nem tudunk hatékonyan keresni, az összegyűjtött képeket megosztani, könnyű hozzáférést biztosítani a tartalomhoz, közzétenni interneten. A metaadatnak azonosítania kell az egész képet, vagy akár egy régióját is. Orvosi képeknél szükséges továbbá az alaki leírás, az anatómiai részletek, a morfológiai és diagnosztikai kommentek használata. A hallgatónak látnia és gyakorolnia kell a számítógépes formalizálás módszerét. A metaadatok készítésekor érvényesíteni kell az információ formalizálásának és a tartalmak „digitális közzétételének” követendő elveit. Éppen ezért nagyon fontos az annotáció létrehozásakor a pontos fogalomalkotás, a szakma által használt szakkifejezések pontos használata. Az egészségügyben kódrendszerek sora található a gyógyítás elemeinek és folyamatának leírására. A kódrendszerek közül vannak klasszifikációs rendszerek az általános jellegű, és nómenklatúrák az egyedi információk formalizálására. Ehhez több különböző célú kódrendszer és szabvány is létezik (MeSH, SNOMED, BNO,…). Speciális kódrendszer az UMLS, amely meta szókincset is tartalmaz, ahol az egyik szótárból át lehet járni a másikba, kapcsolatba hozható a szemantikus nyelvekkel, átkonvertálható RDF vagy OWL formátumra is. (Kékes E. et al., 2000). Az annotáció készítésnél használnia kell tudni ezeket a szótárakat, a szabad szöveg és a kulcsok helyett. (Máthé, 2004)
3
Informatika a felsőoktatásban 2008
5.
Debrecen, 2008. augusztus 27-29.
Annotációk készítése
Képi annotációnk készítésénél, az általánosan használt orvosi kódrendszereken túl, azt a formátumot és fejlesztő eszközt is meg kell találni, amely a pontos szintaktikai jelentések mellett az adatok szemantikájának a bevitelével is segíti a fejlesztést és a jövőbeni fejlesztések esetén is használható lesz. Mindkét elvárásra ad megoldást a Semantic Web technology használata. (Gottdank, 2005). Nagyon egyszerű megoldást kínál a 15 alapelemből álló Dublin Core séma, ami valószínűleg egyszerűsége miatt népszerű. A DC-ban univerzálisan értelmezhető szemantikájú elemek kerülnek alkalmazásra (pl. egy tudományos cikk szerzője és egy forgatókönyv írója is "creator"). Ha ezt kiegészítjük a tartalmi elemek orvosi kódrendszerekkel történő leírásával, akkor elérhetjük képeink kereshetőségét, publikálhatóságát, és a szabadszöveges kódolás technikájának gyakorlatba való átültetését. (Szeredi, Lukács, Benkő, 2005). 6.
Összefoglaló
A digitális képek kezelhetőségét, jelen eszközök mellett, elsősorban a verbális fogalmi síkra történő vetítéssel tudjuk megoldani. A képekhez csatolt szöveges annotáció módot ad, a képek, mint objektumok azonosítására, a technikai, technológiai megoldások leírására. A leggyakrabban használt orvosi kódrendszerek segítségével megadjuk a legfontosabb fogalmak hierarchikus felépítését a tartalmi jegyek felsorolására, mint betegségek leírása, a diagnózisok, a terápiák megjelölésére. Az OSZK Dublin Core űrlapjának segítségével, mely lehetőséget ad a kialakított tartalmi jegyek bevitelére is, dokumentáltuk képeinket. Irodalomjegyzék [1] Nyíri K., Mentális képek mint teoretikus http://www.phil-inst.hu/highlights/agytudat/nyiri.htm
konstrukciók
[2] Dezsényi Cs. (2004/5) Tudásalapú információkinyerés: az IKF projekt. Tudományos és Műszaki Tájékoztatás, http://tmt.omikk.bme.hu/ [3] Futó I.: Mesterséges intelligencia. (1999) Budapest, Aula Kiadó [4] Gottdank Tibor: (2005) Szemantikus web. Budapest, ComputerBooks [5] Hector Garcia-Molina Jeffrey D. Ullman-Jennifer Widom Adatbázisrendszerek megvalósítása Panem-John Wiley & Sons
(2001)
[6] Jeffrey D., Ullman-Jennifer Widom (1998) Adatbázisrendszerek Panem-PrenticeHall [7] Kékes E., Surján Gy., Balkányi L., Kozmann Gy. (2000) Egészségügyi informatika. Budapest [8] Máthé S.: (2004) Fogalomtárak közös adatszerkezetének kialakítása az eEgészség Programban IME III. évfolyam 6.szám [9] Sántáné-Tóth E., Bíró M., Gábor A., Kő A., Lovrics L. (2008) Döntéstámogató rendszerek. Budapest [10] Szeredi P.-Lukács G.-Benkő T. (2005).: A szemantikus világháló elmélete és gyakorlata. Budapest, Typotex
4
Informatika a felsőoktatásban 2008
Debrecen, 2008. augusztus 27-29.
[11] Vámos T. Ember-gép kapcsolat és http://makogxi.btk.pte.hu/meghiv.htm#mero MTA SZTAKI
5
reprezentáció