JAMPAPER 3./II./2007.
KÉPEK HASZNÁLATÁNAK KORLÁTAI AZ OKTATÁSBAN Forczek Erzsébet
[email protected] SZTE, ÁOK Orvosi Informatikai Intézet
Szanyi Ágnes
[email protected] PTE, Kommunikáció Doktori Iskola
1.
Bevezető:
A digitális technika, ezen belül is elsősorban a tárolási és az átviteli médiumok hallatlan gyors fejlődése teremtette meg azt a közeget, amely a vizuális elemek, és eszközök széles skáláját kínálja az eddig elsősorban verbális nyelvi elemekre épülő oktatásunknak. A hang és képkészítés egyszerű módszerei, a felhasználás, ill. az internet segítségével a könnyű elérhetőség utat nyit egy hatékonyabb, - vizuális és verbális elemeket ötvöző - eszközrendszernek, mely érthetőbbé teszi a "face to face" oktatást, és mellette más oktatási formák kialakulásának is alappillére. Feltételezhető, hogy a képekkel való közvetlen kapcsolatunk, a képek létrehozásának, manipulálásának és célirányos felhasználásának napi rutinná válása képalkotási és befogadási képességeinket fejleszti, s ezáltal a képek formájában is megjelenő információ egyre meghatározóbb eszközévé válhat az oktatásnak [1] [2] [6]. 2.
Reprezentálási szempontok kialakítása
A multimédia térhódításával a képek tárolására, tartalomalapú gépi visszakeresésére és azonosíthatóságára is óriási az igény. A képek digitális formátuma többféle szabvány szerint is készülhet. Tárolásuk történhet szekvenciálisan vagy valamilyen hierarchia szerint, tehetjük mappákba egymástól függetlenül, vagy adatbázisokba, képarchívumokba kapcsolataikkal együtt. Visszakeresésük azonban nagymértékben különbözik a nem multimédiás jellegű egyéb adatok visszakeresésétől. Automatikus felismerésük még csak speciális területeken, speciális szoftverekkel hoz számottevő eredményt. Azonosíthatóságuknak, keresésüknek a minőségét alapvetően az határozza meg, hogy mely dimenzióban tudunk a képekbe vagy a képek mellé információt tenni. Amennyiben a képekhez előállításuk során algoritmikusan vagy kiértékelésük során kontrollált többletinformációt tudunk kapcsolni (pl. szimuláció, vagy a röntgenfelvételek kiértékelése), akkor a kontrollált tartalom alapján ismertté, elérhetővé válik a kép. Azonban ha a tartalom fölött nincsen semmilyen algoritmikus megközelíthetőség, és a tartalomalapú kódolás is elmarad nehezen vagy egyáltalán nem azonosítható a kép. A képzőművészeti és a tudományos képek zöme az oktatás számára ily módon áll rendelkezésre [3] [4] [5].
52
JAMPAPER 3./II./2007. 3.
Szokásos megoldások
Míg néhány éve a tanárok és a diákok akár több napos vagy hetes kutatómunkát is folytattak egyegy szemléltetőkép vagy videó felkutatására, addig mára ez az esetek nagy részében csak néhány órára, esetleg néhány percre redukálódik. Ha valamely témakörhöz képeket keresünk, leggyakrabban webes keresőrendszerekhez fordulunk. Keresésünk, a nagyszámú találat ellenére sem teljes körű. A képek nagy része nemcsak azért marad fedve, mert tudásbázisokban vagy adatbázisokban vannak, hanem azért is, mert azonosításuk nem megoldott, elsősorban nevükből, vagy a környezetükben lévő szövegből és a ráhivatkozó linkekből, vagy metaadatokból történik. Tegyük fel, hogy híres festmények között szeretnénk válogatni, és a nő és a hattyú megjelenése a festészetben érdekel bennünket. Gépeljük be a „Google”-ba a ”Nő” és „hattyú” szavakat. Több mint 4000 találatot kapunk. Ha szűkítjük a „festmény” kereső szóval, még akkor is 200 fölötti a találatok száma. A megtalált képek zömének nincs köze a keresett témához. A számunkra releváns képeket érdemes kiválogatni, és elmenteni a saját könyvtárunkba. A mentés oka nemcsak az, hogy legközelebb nem teljesen ezt a listát kapjuk, hanem az is, hogy elég sok időbe telik összegyűjteni a különböző lekérdezésekből a kívánt képek listáját. A kiválogatott képek egy részletét láthatjuk a 1. ábrán. Ha a képeket több relációban is használjuk, akkor gyakran több helyen is tároljuk. Így kezdetben egy laza szerkezetű képbankunk lesz, ahol az összes rendezőelv a fejünkben van. Ez a lehető legjobb módszer mindaddig, amíg nem akarjuk átadni a kollegáknak vagy hallgatóknak használatra, vagy a képek számának növekedésével nem áll be a káosz az agyunkban. A káosz beállta után kétségbeesve próbálunk rendet teremteni, megjegyzéseket, kiegészítő fájlokat írni, kereteket formálni. Így az újabb zűrzavar ideig-óráig elnapolható. [10]
1. ábra Képek tárolásának gyakori formája
53
JAMPAPER 3./II./2007. 4.
Technikai és tartalmi szempontok
Egy képet, vagy akár a képnek egy részletét, adott esetben az oktatás több területéhez, több témaköréhez is felhasználhatjuk, tehát egy kép több kategóriához is tartozhat. (Salvador Dali alább látható Leda Atomica című képe, például, a következő kategóriákba sorolható: ’szürrealizmus’, ’Dali festészete’, ’nőideál’, ’Léda-téma’, ’fotorealizmus’ stb.). Így egyetlen kategória módosítása, vagy alkategóriákra bontása maga után vonhatja a többi módosítását is. A jellemző jegyek képi megfogalmazása informatikailag még nem megoldott, ezért a kategóriák leírása elsősorban verbálisan történik. Egy festészeti téma kis részletén keresztül nézzük meg a kép azonosításához és tulajdonságai leírásához szükséges adatok előállítását! [10].
Kategóriától független adatoknak tekinthetjük a képfájl, mint objektum, azonosítási adatait.
− − − −
Képfájl neve: Készítés időpontja: (digitalizálás vagy tárolás) Kép technikai készítője: Kép mérete, felbontása, minősége, technikai részletek, …
A képek a jellemző jegyeik, vagyis egyedi tulajdonságaik alapján kerülnek a kategóriákba. A jellemző jegyek, mint adatok, lehetnek szöveg (pl. kép címe), numerikus adat (festmény készítésének éve) vagy kódolt (szekvenciális, hierarchikus) értékek. Ezek az adatok hordozzák nemcsak az egyszerű, tértől és időtől független tartalmat, hanem az időfüggő, földrajzi helyeket, történeti,
történelmi
eseményeket,
társadalmi
és
emberi
tényezőket
figyelembe
vevő
összefüggéseket is. Minden jellemző jegy verbális megfogalmazása valamely fogalomrendszerben történik. A fogalomrendszer kezelhetőségére számítógépes ontológiákat dolgoznak ki, melyek nemcsak a fogalmakat és azok hierarchiáját, hanem logikai kapcsolatukat is tartalmazzák. [4] [7] [9].
− − − − − − −
A kép szerzője, a kép címe, készítés dátuma. A kép készítésének technikai megoldásai, egyéni stílusjegyek. A kép kompozíciója. Mit ábrázol kép, milyen történethez köthető? A festő egyéni stílusára, életére vonatkozó információk. Milyen társadalmi réteghez tartozó életideált mutat be? …
54
JAMPAPER 3./II./2007. Az órára való felkészüléskor, egy téma feldolgozásánál, kérdéseinket megfogalmazhatjuk az idő függvényében, a megfigyelési időszak irányában, de egy festő vagy csoport, stílusjegy, korszak, ország, népcsoport, stb. relációjában is. Ha a témánk a reneszánsz korszak szépségideálja, akkor a meglévő „reneszánsz” és „szépségideál” kategóriák keresztmetszetében lévő képeket használhatjuk. A 2. és 3. ábrán látható képcsoportokon megfigyelhetjük a kategóriák használatának módját és egymáshoz való viszonyukat. Egy időintervallum, egy téma és egy stílus jellegzetességei (Keresztmetszeti adatok).
2. ábra Reneszánsz korszak szépségideáljai
Peter Paul Rubens (1577-1640) - Egy szerző és egy téma képei
3. ábra Rubens nőalakjai: időpillanatban vagy időintervallumban
55
JAMPAPER 3./II./2007. A megfigyelési időszak különböző korokat, földrajzi helyeket is összeköthet, egy vagy több konkrét szempont szerint. Itt lehet egy szempont: a festészeti technikák hatása a mai technikákra, Salvador Dali-ra és Salvador Dali várható hatása a jövőre. A szempontok követhetik egymást szekvenciálisan, de lehetnek párhuzamosak is.
...
... ...
...???
Római kori mozaik
Leonardo
t0 időpillanat
tanulmányozás iránya
megfigyelés iránya
4. ábra Az időbeli folyamatok szerepe egy konkrét szempont feldolgozásánál 5.
Tárolási technikák
Ha összegyűjtöttünk elég sok képet, ha feldolgoztuk őket a pillanatnyilag szükséges kategóriák és jellemzőik szerint és ha meghatároztuk az ontológiákat, akkor szeretnénk egy informatikai eszközt a tárolás és visszakeresés megvalósításához. A megvalósítás tervezésekor elsődleges szempont a kereshetőség. Figyelembe kell venni, hogy rendszerünk egy nyitott rendszer, ahol sem a képek, sem a jellemző tulajdonságok, sem a kategóriák száma nem állandó, így az ontológiák új elemekkel és tartalmi összefüggésekkel bővülhetnek, más ontológiákkal kerülhetnek kapcsolatba. Mivel a normál keresők csak részben képesek a tartalmi jegyeket figyelembe venni, ezért érdemes a szemantikus web alkalmazásait is megvizsgálni. Szerkesztők, fejlesztőkörnyezetek, érvényesítők, konverterek, adatbáziskezelők, adatintegrálók, kereső motorok, stb. támogatják a tartalomkinyerést (pl. SKOS: tezauruszok, taxonómiák, terminológiák felépítésére; OWL: ontológiák leírására). Ezek a fejlesztő környezetek remek megoldások lehetőségét kínálják a szakembereknek, de túl bonyolultak egy tanárnak, vagy egy átlagos felhasználónak Nem találtunk azonban helyi gépeken futó, magas szintű, egyszerűen kezelhető alkalmazást, mely a tartalom integrációját teremtené meg a tárolási ill. a lekérdezési folyamatok között. [7] [8].
56
JAMPAPER 3./II./2007. Találhatunk
viszont
egy
egyszerű
eszközt
a
számítógépes
formában
elérhető
dokumentumok/források/szolgáltatások leíró adatainak szabványosítására; ez a Dublin Core. Az alábbi űrlap kitöltésével Dublin Core metaadatokat készíthetünk a digitális dokumentumainkhoz, majd bemásolhatjuk őket a HTML fájlok fejlécébe – így a keresők is felismerik -, vagy elmenthetjük XML formátumban a dokumentum mellé. Az űrlap és fogalomrendszere bővíthető. Természetesen a tartalomszerinti keresés problémáját nem oldja meg teljes körűen, de lehetővé teszi a képek megfelelő dokumentálását.
5. ábra Dublin Core űrlap egy részlete Sokan használják a .JPG képek dokumentálására az EXIF, IPTC vagy a Comment opciókat, melyekben a képek keletkezésére és tulajdonságaira vonatkozóan számos egyedi információ is tárolható. Olvasásukhoz freeware illetve shareware programokat is használhatunk. Nem tudtuk azonban „rávenni” sem a Google-t, sem a Yahoo-t, hogy az így tárolt tartalmakat felismerje és a „Desktop” funkció alatt találatként ezeket meg is jelölje. Másik megoldás, ha a képekhez szöveges információt teszünk a file „Tulajdonság” menüpontja alatt. Ezek a szövegek tartalmazhatnak - bár nagyon korlátozott módon - jellemző kategória és kulcsszavakat, megjegyzéseket. Ezt a csatolt információt már egy Google Desktop is fel tudja dolgozni. Ha van egy jól felépített ontológiánk, ami lehetővé teszi az átgondolt szóhasználatot, akkor az igen korlátozott terjedelmű szöveg is segíthet a képek visszakeresésében mindaddig, amíg erre jobb megoldások nem születnek.
57
JAMPAPER 3./II./2007. 6.
Összefoglaló:
Az utóbbi években a képi adatbázisok száma ugyan látványosan megnőtt, de ez a mennyiségi növekedés nem vonta maga után képanyagaink kezelhetőségére módot adó, általánosan is elfogadott konvenció, vagy szoftver eszközök létrejöttét ill. elterjedését. A digitalizált képek kezelhetőségének problémáját, jelen eszközök mellett, elsősorban a verbális fogalmi síkra történő vetítéssel tudjuk megoldani. Bár, ezzel a dimenzió csökkenéssel éppen a képek legjellemzőbb sajátosságát, a képiségüket veszítjük el, mégis, a képekhez rendelt szöveges információ ad némi esélyt a tartalomalapú tárolásra, karbantartásra és ezáltal a visszakeresésre. Ennek érdekében elvi kritériumokat és gyakorlati szabványokat kell megfogalmazni a vizuális információ és adatkinyerés módszerére, a különböző szinteken keletkező adatok és információk egységes ontológiába rendezésére, a kinyert információk és adatok térbeli és időbeli rendszerbefoglalására, keresésre alkalmas metaadatok képzésére. Általános szoftver megoldások fejlesztése adhat a jövőben egyszerű eszközt technikai problémáink megoldására, a vizuális elemek egyszerű használatára, és publikus könyvtárak létrehozására az oktatók és a hallgatók számára egyaránt.
58
JAMPAPER 3./II./2007. Irodalomjegyzék: [1] Nyíri K.- Mentális képek, mint teoretikus konstrukciók http://www.phil-inst.hu/highlights/agytudat/nyiri.htm [2] Vámos T.- MTA SZTAKI – Ember-gép kapcsolat és reprezentáció http://makogxi.btk.pte.hu/meghiv.htm#mero [3] Kormos, K. Veréb - Recognition of chain-coded patches, COMCON 8, Proceedings of 8th International Conf. on Advances in Communication and Control (Telecommunications/Signal Processing), (2001), 37-45 [4] Dezsényi Cs.- Tudásalapú információkinyerés: az IKF projekt. Tudományos és Műszaki Tájékoztatás, 2004/5. http://tmt.omikk.bme.hu/ [5] Futó I.- Mesterséges intelligencia. Budapest, Aula Kiadó (1999) [6] Sik Lányi C.- Multimedia Medical Informatics System in Healthcare, Intelligent Paradigms for Assistive and Preventive Healthcare, Ichalkaranje, A., et al. (Eds.), Springer-Verlag, 2006, pp. 39-91. [7] Szeredi P.-Lukács G.-Benkő T.- A szemantikus világháló elmélete és gyakorlata Budapest Typotex 2005. [8] Gottdank T.- Szemantikus web. Budapest, ComputerBooks (2005) [9] Obrenovic Z.- Multimedia Semantics: Overview of Relevant Tools and Resources http://www.w3.org/2005/Incubator/mmsem/XGR-image-annotation [10] Raphaël T, Ossenbruggen, Pan Z, Stamou G,- Image Annotation on the Semantic Web http://www.w3.org/2005/Incubator/mmsem/XGR-image-annotation/
59
JAMPAPER 3./II./2007. Képek forrása: http://arts.guardian.co.uk/pictures/image/0,8543,-11004985083,00.html http://commons.wikimedia.org/wiki/Image:CaravaggioSalomeLondon.jpg http://fr.wikipedia.org/wiki/Haute_Renaissance/ http://traumwerk.stanford.edu/philolog/art/ http://www.art-prints-on-demand.com/a/luini-bernardino/salome-with-the-head-joha.html http://www.berze-nagy.sulinet.hu/stilus/modern/salome.htm http://www.brigidmarlin.com/Pages/Visionary/Leda.html http://www.creuxdelenfer.net/corps/activites/vladimir_skoda/vladimir_skoda.htm http://www.dmbowers.com/recent_work/index.html http://www.ecsel.psu.edu/~rreynold/Leda.htm http://www.fotos.org/galeria/showphoto.php/photo/1501 http://www.gae.hu/mitologia/Gemini/Gemini.htm http://www.greatbassviol.com/nh.html http://www.liverpoolmuseums.org.uk/walker/exhibitions/rossetti/works/beauties.asp#a http://www.marcelproust.it/proust/leda_boldini_moreau.htm http://www.marcelproust.it/proust/leda_boldini_moreau.htm http://www.mozaik.info.hu/mozaweb/Stilus/page4119.htm http://www.ragani.com/model/index.html http://www.shakespeares-sonnets.com/131comm.htm http://www.sk-szeged.hu/kiallitas/leonardo/festmenyei.html http://www.vroma.org/images/raia_images/index5.html http://www.welshartsarchive.org.uk/article6.htm
60