MultiMédia az oktatásban Zsigmond Király Fıiskola Budapest, 2008. szeptember 25–26.
FORCZEK ERZSÉBET
Metaadatok szerepe a multimédia elemek kereshetıségében SZTE ÁOK Orvosi Informatikai Intézet
[email protected]
Absztrakt
A metaadat adat az adatról. A metaadatok egy része technikai, az objektumok meghatározására és paramétereinek leírására szolgál, más részük leíró jellegő, a tartalom azonosítását segíti. A leíró jellegő adatok, az annotációk, lehetnek szabadszövegek, strukturált, hierarchikus szövegek vagy logikai összefüggésekkel ellátott leírások, ontológiák. A metaadatok a tartalom állandóságát, következetességét, és a különbözı objektumok összekapcsolhatóságát is képesek biztosítani a megfelelı szervezettség esetén, ez pedig elengedhetetlen a multimédiás és szöveges dokumentumok hathatós gépi feldolgozásában. A metaadatokat, megnövekedett szerepük ellenére, csak szórványosan, részleteiben és speciális esetekben oktatjuk. Az elıadás egy nagyvonalú áttekintést ad a metaadatok szerepérıl, típusairól, szükséges szervezési formáiról és szorgalmazza az oktatásba való megjelenésüket.
Az adatok tárolása, reprezentálása a kereshetıség szempontjából
•
Adatainkat, még multimédia elemeinket is, leggyakrabban adatbázisokban tároljuk. Elınye, hogy egy konzisztens, általában relációs adatmodell szerint az információt „adatszerősíthetjük”, a tulajdonságokat, kapcsolatokat pontosan meghatározhatjuk. A „finoman” kódolt adatok és struktúrák manipulációja egyszerő, és adatbázison belül könnyen és pontosan kereshetı. Hátránya, hogy a feladat indulásakor pontosan kell látni a feladat minden részletét, a lehetséges adatokat, kapcsolatokat és elnevezéseket. Így az adatbázisok lényegi bıvítése, a mozgástér (adatbázistér) kiterjesztése nehézkes. Hátránya még, hogy zárt rendszer, így a „felszíni” weben nem látható, a keresık általában nem találják meg, tartalma rejtve marad a felhasználók elıl [3.], [4.].
•
A hagyományos WEB térhódításával a szöveges dokumentumok száma óriási mértékben megnıtt. A dokumentumokhoz kapcsolódó információk nagy része szabad szöveg, min-
MultiMédia az oktatásban Zsigmond Király Fıiskola Budapest, 2008. szeptember 25–26.
denféle struktúra és kapcsolat nélkül. A lapokon található képek, vagy más multimédia elemek csak a környezetükben lévı szövegek, linkek és más paraméterek, esetleg képelemzések alapján azonosíthatók, ha egyáltalán ez lehetséges. Éppen ezért, a hagyományos keresések csak a keresı szavak próbálgatásával, a kereséshez adott plusz információkkal adnak releváns eredményeket. Elınyük azonban, hogy ezek nyílt rendszerek, és a keresık megtalálják ıket. [1.], [8.]. •
A hagyományos webnek elınye tehát, hogy a keresık látogatják ıket. A keresık azonban a szabadszöveges keresés során fıként alaki tulajdonságok, és nem tartalmi jegyek alapján azonosítanak. Ha meghagyjuk a lehetıségét a strukturálatlan, szabadszöveges vagy „kvázi” szabadszöveges adatfeldolgozásnak, de az adatokat oly módon írjuk le, hogy a gépi programok a tartalmuk alapján kezelni is tudják ıket, akkor ezzel az asszociációs kapcsolattal nemcsak az adatok alaki megjelenésére, de a tartalmi jelentésére is képesek leszünk keresni [2.], [11.].
•
A keresı programok egy része, funkciója („desktop”) bıvülésével már nemcsak a webes felületekrıl tud keresni, hanem lokálisan is, például dokumentumok, képek között. Ez utóbbinak azért is van nagy jelentısége, mert a háttértárolók kapacitásának ugrásszerő növekedésével nehezen kezelhetı mennyiségő adat van digitálisan tárolva. Az összegyőjtött adatok közötti navigáláshoz viszont nem kapunk kellı támogatást, így célszerő a keresıktıl kapott lehetıséget maximálisan kihasználni.
Tartalmak reprezentálása metaadatokkal
Napjainkra mérhetetlen mennyiségő dokumentum, és ezen belül, multimédia tartalom áll rendelkezésre a világhálón, saját állományainkban és az archívumokban. A különbözı adatbázisok, az internetes portálok, és az általunk összegyőjtött információk halmazának gyakorlati haszna attól függ, hogy megtaláljuk-e bennük, és milyen gyorsan a számunkra hasznos információkat. A hagyományos keresés legnagyobb problémája, hogy a keresık nem a fellelhetı dokumentumok és a keresıkérdések jelentésével foglalkoznak, hanem kizárólag annak szöveges elıfordulásával. A tartalmak „átjárhatósága”, ami a keresés alapja, szabványos megoldások nélkül nem biztosítható. A megoldások egyik szabványos módja, hogy a weben megtalálható
információkat
jelentéssel
ruházzuk
fel
úgy,
hogy
a
webes
tartalmakhoz
metainformációkat társítunk, akár úgy is, hogy ezeken az információkon következtetéseket is végezhessünk [2.].
MultiMédia az oktatásban Zsigmond Király Fıiskola Budapest, 2008. szeptember 25–26.
A metaadatok használata általános eszköz arra, hogy azonosítsuk objektumainkat, fájljainkat, leírjuk technikai, technológiai paramétereiket, és az intelligensebb kereshetıség érdekében, a tartalmi jegyeiket is: •
Metaadatokkal írjuk le a fájlok paramétereit (méretét, létrehozás dátumát, …), de a fájlban található elemek jellemzıit, például a dokumentum vagy kép szerzıjének nevét, keletkezési idejét és helyét is. A webes felületeknek is részét képezhetik a metainformációk (pl. a META nevő HTML elem). A fájlokhoz általában csatolhatunk szabadszöveges formátumú annotációkat, tartalmi megjegyzéseket is. Amíg az elızıek inkább technikai, technológiai, ez utóbbi leíró jellegő metaadatokat feltételeznek. A létrehozás mikéntjétıl és környezetétıl függıen ezen speciális adatok egy része a fájl nevével együtt, vagy a fájlon belül, míg más esetekben az elemet leíró fájltól függetlenül tárolódnak [7.].
•
A dokumentumok (beleértve a multimédia elemeket is) a valóság bármely elemét felölelhetik, így a technika, a tudomány a mővészet területeit is. Az annotáció lehetıséget kínál a fájl tartalmát leíró információk bevitelére. Különösen jelentıs ez a multimédia elemeknél, mert ott gyakran nincs más lehetıség a tartalmi azonosításra. Ha szabadszöveges leírást választunk, akkor az erre épülı kiértékelés általában gyenge eredményre vezet. Jobb eredményt kapunk, ha a szöveges információt formalizált adatbevitellel, kódrendszerek, tezauruszok, tématérképek vagy ontológiák segítségével, és a szemantikus web adta lehetıségekkel visszük be. Különös jelentıséggel bír ez a multimédia elemek tulajdonságainak leírásában és a felszínre hozásában, ahol a „kvázi” szabad szöveges keresı szavak jól behatárolhatják az egyébként rejtve maradó tartalmat [9.].
•
Az annotációk leírhatnak egy önálló eseményt, témát: - felsorolhatják a tartalmi jegyeket, mint történelmi kor, földrajzi hely, személyre, eseményre vonatkozó adatok, stb. Ezek a mutatók egy egyedi elıfordulásra vonatkoznak. A feldolgozandó kérdések a különbözı elemek egymáshoz és környezetükhöz való viszonyára is vonatkozhatnak, mint, technikai, technológiai megoldások idıbeli áttekintése, vagy vonatkozhatnak keresztmetszeti adatokra, stb.
•
Elıfordulhat az is, hogy csak a fájl tartalmát leíró információk, az annotációk érhetık el szabadon a felhasználók számára, a tényleges tartalom elérése már feltételekhez kötött (ilyen esetek a fizetıs cikkek).
MultiMédia az oktatásban Zsigmond Király Fıiskola Budapest, 2008. szeptember 25–26.
Annotációk szervezése; kódrendszerek használata
A képek, hangok általános elemzése még kevés eredményt szolgáltat a keresıknek, sokszor a szöveges dokumentumok „szövegbányászata” sem hoz kellı eredményt. A tartalmat figyelembe vevı keresésekhez segítséget nyújthatnak a metaadatok. A tartalom feltárásának lehetısége elsısorban ezen metainformációk kiértékelhetıségén múlik, azaz az objektumok és a hozzájuk csatolt metaadatok elérhetıségén, minıségén és szervezettségén. Az elérhetıség egyik szempontja a felhasználás felületének és kiterjedtségének a meghatározása, ha az objektumunkat széles körben elérhetıvé akarjuk tenni, azaz publikálni akarjuk a weben, vagy akár csak egy kisebb közösség számára készítjük, akkor is célszerő a felszíni weben közzé tenni. A hathatós gépi kiértékeléshez azonban szükséges lenne, hogy ezen információk hordozzák az elnevezések, a kapcsolatok és az összefüggések következetes rendszerét. Éppen ezért nagyon fontos az annotáció létrehozásakor a pontos fogalomalkotás, a szakma által használt szakkifejezések pontos használata. Elsıdleges szempont, hogy a fogalomrendszer ne csak az aktuális munkára, feladatra korlátozódjon, hanem más feladatok elnevezés és összefüggés rendszerével is megegyezzen, de legalábbis átkonvertálható legyen egyik a másikba [10.], [11]. Ha rendelkeznénk egy, a képek, hangok, dokumentumok szöveges annotációjához rendelhetı ontológiával, ami nemcsak a fogalmak hierarchikus rendszerét tartalmazná, hanem a leíró logikai formalizmusukat is, akkor az elemi adatokból azok összes asszociációja és kapcsolatai is elıállíthatók, és természetes módon bıvíthetık lennének. Ontológiát szervezni rendkívül idıigényes feladat, különösen azokon a területeken, ahol a tudományterület, a szakma nem rendelkezik egy egységes paradigmarendszerrel. Tezauruszokkal, tématérképekkel több területen is találkozunk, de leggyakrabban kódrendszerek állnak rendelkezésünkre. A kódrendszerek általában nem rendelkeznek a fogalmak pontos leírásával és a logikai összefüggések tárházával, de a hierarchia felvázolja a fogalmi struktúrát, a benne elfoglalt hely pedig utal a tartalomra [5.], [6.].
A metaadatok reprezentációjának technikai kérdései
Metaadatokkal írjuk le a fájlok paramétereit (név, méret, típus, dátumok, állapot,…), de a fájlban található elemek jellemzıit, például a dokumentum vagy kép szerzıjének nevét, kelet-
MultiMédia az oktatásban Zsigmond Király Fıiskola Budapest, 2008. szeptember 25–26.
kezési idejét és helyét is. Ezek a paraméterek hagyományosan is a fájlhoz „tartoznak”. A fájlrendszerek gyakran a fájlokon kívül, de a fájlnévvel együtt adminisztrálják ezen jellemzıket. Ha például kitöltjük a WINDOWS operációs rendszer „tulajdonságok” „Összegzés” menüpontját, akkor az itt felvett adatokat pl. a Google keresı „Desktop” funkciójával – rövid idı múlva - megtaláljuk. A multimédia elemek több formátuma is alkalmas metaadatok tárolására. Ezek közül a legismertebbek: •
A JPEG típusú képek esetén a részletes leírást adhatunk a kép formai és tartalmi jegyeirıl.
•
A DICOM formátum a digitális képkezelés és kommunikációs szabványok átfogó halmaza a képek tárolására és továbbítására az orvostudományban.
•
A térinformatikai rendszereket használók körében a TIFF formátum speciális alkalmazásával a raszteres képeket tehetjük hordozhatóvá (GeoTIFF) a GIS (Geographical Information System - Földrajzi Információs Rendszer) rendszerek között.
•
Az MP3-as formátumok esetében az ID3 ad lehetıséget a jellemzıjegyek leírására.
•
Programozási nyelvek, pl. a JAVA tartalmazhatnak metaleírásokat.
•
Metainformáció pl. a pdf vagy doc fájlok leírása, vagy az adatbázist leíró adathalmazok (pl. táblaszerkezet, relációs információk, stb.) összessége is.
A felsorolt példák közös jellemzıje, hogy a metainformációk többnyire a fájlon belül találhatók és a tárolt információknak legfeljebb csak egy részét látják a jelenlegi keresık. Mivel a formátumok igen sokfélék, ezért csak néhányról képzelhetı el, hogy a közeljövıben a teljes tartalmuk kiértékelhetıvé válik, és felszínre kerül a mélyrıl. A tartalmi keresésre szabványos megoldást nyújt azonban a Szemantikus Web (Semantic Web technology) irányzata. Több lehetıséget is kínál, de minden esetben az adatokhoz rendelt tartalom a felszíni weben elérhetı [2.]. Az egyik ilyen szabványos megoldás a minimum elvet kielégítı Dublin Core (DC) séma, ami mindössze 15 alapelembıl áll. Valószínőleg egyszerősége miatt népszerő. A DC-ben univerzálisan értelmezhetı szemantikájú elemek kerülnek alkalmazásra (pl. egy tudományos cikk szerzıje és egy forgatókönyv írója is "creator"), de kiegészíthetı annotációs leírással is (13. elem). A szabad formátumú kiértékelés ebben a formában még kevés lehetıséget ad a tartalmi leírásoknak. Ha az annotációt ontológiába szervezzük, felvesszük a belsı kapcsolataikat és egymáshoz való viszonyukat is, akkor a kialakított eszköztárral (Protege, OWL) egy konzisztens annotációs szisztémát tudunk kiépíteni. Ez a
MultiMédia az oktatásban Zsigmond Király Fıiskola Budapest, 2008. szeptember 25–26.
megoldás azonban rendkívül munkaigényes, de ha egyszer elkészül, a karbantartása már gyors és megbízható, a kiértékelések teljes értékőek lesznek. Összefoglalás
A hallgatónak látnia és gyakorolnia kell a számítógépes formalizálás módszerét. A metaadatok készítése jó lehetıség arra, hogy megismertesse az információ formalizálásának, és a tartalmak „digitális közzétételének” követendı elveit, gyakorlati megvalósítását. A pontos fogalomalkotás, a szakma által használt szakkifejezések pontos használata mellett, az információ struktúrák és a strukturális elemek összefüggésének vizsgálatát is lehetıvé teszi. Az elkészítendı annotációs szisztémának megtervezése során a nyílt rendszerek esettanulmányokkal történı felépítését is tanulmányozhatják. Jó példája ez a szakmai integrációnak is, mivel a metainformácók szervezési kérdéseinek megvitatásánál nem fiktív példákon, hanem „éles” szakmai anyagokon, kódrendszereken, esetleg ontológiákon keresztül jutnak el az ábrázolásig, miközben „komoly” informatikai területeket, információszervezési kérdéseket is érintenek.
Irodalomjegyzék
[1.] Dezsényi Cs.: Tudásalapú információkinyerés: az IKF projekt. Tudományos és Mőszaki Tájékoztatás (2004/5) http://tmt.omikk.bme.hu/ [2.] Gottdank Tibor: Szemantikus Web. Budapest, ComputerBooks (2005) [3.] Hector Garcia-Molina Jeffrey D. Ullman-Jennifer Widom Adatbázisrendszerek megvalósítása Panem-John Wiley & Sons (2001) [4.] Jeffrey D., Ullman-Jennifer Widom Adatbázisrendszerek Panem-Prentice-Hall (1998) [5.] Kékes E., Surján Gy., Balkányi L., Kozmann Gy. Egészségügyi informatika. Budapest (2000) [6.] Máthé S.: Fogalomtárak közös adatszerkezetének kialakítása az eEgészség Programban IME III. évfolyam 6.szám (2004) [7.] Obrenovic Z., Multimedia Semantics: Overview of Relevant Tools and Resources (2005) http://www.w3.org/2005/Incubator/mmsem/XGR-image-annotation [8.] Pajor E., A láthatatlan/mély web felhasználása a könyvtári tájékoztatásban Doktori diszszertáció Budapest (2006)
MultiMédia az oktatásban Zsigmond Király Fıiskola Budapest, 2008. szeptember 25–26.
[9.] Raphaël T, Ossenbruggen, Pan Z, Stamou G., Image Annotation on the Semantic Web (2005) http://www.w3.org/2005/Incubator/mmsem/XGR-image-annotation/ [10.] Sántáné-Tóth E., Bíró M., Gábor A., Kı A., Lovrics L. Döntéstámogató rendszerek. Budapest (2008) [11.] Szeredi P., Lukács G., Benkı T.: A szemantikus világháló elmélete és gyakorlata. Budapest, Typotex (2005).