Networkshop, 2008 Márc. 1719., Dunaújváros − Holl Erdődi: Fejlett kereső ... 1
Fejlett kereső és lekérdező eszközök egy elektronikus szakfolyóirathoz (IBVS) Holl András Erdődi Péter MTA KonkolyThege Miklós Csillagászati Kutatóintézete Cikk: http://www.konkoly.hu/staff/holl/Duna/dunau.pdf
Networkshop, 2008 Márc. 1719., Dunaújváros − Holl Erdődi: Fejlett kereső ... 2
Tartalmi kivonat Az Information Bulletin on Variable Stars egy kis, elektronikus formában is megjelenő csillagászati szakfolyóirat (lásd Holl, Networkshop 2001). A folyóiratban publikált cikkekben, ábrák között, valamint a cikkekhez tartozó adatállományokban való keresés céljából új eszközt fejlesztettünk. A kereső jellemző tulajdonsága, hogy a megszokott, hasonló programoktól elvárható funkciókon túl (keresés a metaadatokban és a teljes szövegben) keresni tud ábrákat és adatállományokat is. Továbbá lehetőség van csillagászati objektumok keresésére, objektumnevek helyett: ugyanazon objektum szerepelhet különböző neveken, és bármelyik névvel megtalálható. Hasonló a szerzők nevére való keresés is: a többféle változatban használt nevek bármelyik írásmódja használható a keresési feltételben. Ezeket a tulajdonságokat nem csupán lokális szótárakkal, de GRID avagy Virtuális Obszervatóriumjellegű funkcionalitással: a hálózaton elérhető szolgáltatások segítségül hívásával érjük el. A fenti rendszerre alapozva olyan lekérdezési lehetőséget is készítünk, melynek segítségével objektumnevek és adattípusok (pl. adott típusú ábra) megadásával lehet majd külső adatbázisokból linkeket generálni az IBVSben közölt információkra.
Networkshop, 2008 Márc. 1719., Dunaújváros − Holl Erdődi: Fejlett kereső ... 3
A folyóirat Information Bulletin on Variable Stars (IBVS) kis szakfolyóirat rövid cikkek a változócsillagászat témakörében Nemzetközi Csillagászati Unió 27es és 42es Kommissziói MTA KonkolyThege Miklós Csillagászati Kutatóintézete kiadásában Holl A., Networkshop 2001
Networkshop, 2008 Márc. 1719., Dunaújváros − Holl Erdődi: Fejlett kereső ... 4
Miért kell új kereső? megnövekedett az elektronikusan ekérhető terjedelem elavult a régi kereső
Igények
fejlettebb logikai feltétel és reguláris kifejezés kezelés bővebb keresési lehetőségek a metaadatokban (pl. objektumnév) tartalmi feltárás ábrák, adatállományok objektumok és szerzők azonosítása használt névtől és írásmódtól függetlenül az eredmények igényesebb prezentációja
Networkshop, 2008 Márc. 1719., Dunaújváros − Holl Erdődi: Fejlett kereső ... 5
Miért nem a Google? az ADS? Google: magasra ttett mérce az IBVS túl speciális, a Google nem ismeri a szerkezetét, metaadatait a Google Images nem találja meg az ábrákat biztosan NASA ADS sem megfelelő ritka frissítés
Networkshop, 2008 Márc. 1719., Dunaújváros − Holl Erdődi: Fejlett kereső ... 6
Tartalmi feltárás keresés többnyire bibliográfiai adatok szerint kulcsszavak IBVS: szabadon választható, nem segít igény cikkelemek (adatállomány, ábra: keresőtérkép, fénygörbe) szerinti keresésre ábrák és adatállományok metaadatokkal való ellátása adott kulcsszókészlet közvetlen hozzáférés az ábrákhoz, egyedi azonosító alapján adatbázisszerű használat
Networkshop, 2008 Márc. 1719., Dunaújváros − Holl Erdődi: Fejlett kereső ... 7
Networkshop, 2008 Márc. 1719., Dunaújváros − Holl Erdődi: Fejlett kereső ... 8
Összefonódó szolgáltatások emberi és gépi olvasóknak A csillagászat haszontalan tudomány: sok szabadon hozzáférhető információ IBVS elérés: szakirodalmi és objektumadatbázisok, folyóiratok IBVS linkek: NASA ADS, CDS Simbad Adataggregáció: különböző forrásból származó adatok összesítése IBVS DataService adatok más szolgáltatások számára API az ADS teljes szövegű keresőszolgáltatásához gépgép kapcsolatok; szemantikus web; OAIPMH
Networkshop, 2008 Márc. 1719., Dunaújváros − Holl Erdődi: Fejlett kereső ... 9
Névfeloldás csillagászati objektumok: egy objektum sok név melyik nevet használják a keresésnél? helyi szótár nem tartható karban! külső tudásbázis igénybevétele: CDS (Strasbourg), GCVS (Moszkva) szerzők neve: különböző névalakok, transzliterációk az ADS igeénybevétele külső tudásbázisként GRID avagy Virtuális Obszervtóriumjellegű funkcionalitás: hálózati szolgáltatások beépítése alkalmazásokba
Networkshop, 2008 Márc. 1719., Dunaújváros − Holl Erdődi: Fejlett kereső ... 10
Megvalósítás ELTE IK programtervező szak kooperatív képzés az MTA KTM CsKIben (E.P.) Perl: szabad szoftver; reguláris kifejezések támogatása magas szinten; dokumentáció CsKIban meglévő hardver és szoftverkörnyezet adatbáziskezelők használata nélkül előnyök és hátrányok egyszerű és funkcionális kezelőfelület minden funkció elérése URLalapon
Networkshop, 2008 Márc. 1719., Dunaújváros − Holl Erdődi: Fejlett kereső ... 11
Networkshop, 2008 Márc. 1719., Dunaújváros − Holl Erdődi: Fejlett kereső ... 12
Felhasználói réteg: a kereső űrlap és a találatok megjelenítése
Az alkalmazás lényegi része a két modul: az indexelő és a kereső. Az előbbi hozza létre/frissíti az adatfájlt, a második pedig a keresést végzi.
A strukturált adathalmaz.
Networkshop, 2008 Márc. 1719., Dunaújváros − Holl Erdődi: Fejlett kereső ... 13
Networkshop, 2008 Márc. 1719., Dunaújváros − Holl Erdődi: Fejlett kereső ... 14
Tesztek batch tesztelés elfogadható sebesség: 220 másodperc
Dokumentáció forráskódba ágyazva készül
IBVSlatest felhasználás: a legfrissebb számok prezentálása
Networkshop, 2008 Márc. 1719., Dunaújváros − Holl Erdődi: Fejlett kereső ... 15
Irodalom/URLek Holl A., 2001, "Elektronikus folyóiratok a természettudományok területén egy hazai példa", Networkshop előadás: http://www.konkoly.hu/staff/holl/sopron/sopron.html NASA Astrophysics Data System FAQ: http://doc.adsabs.harvard.edu/abs_doc/faq.html CDS Simbad adatbázis: http://simbad.ustrasbg.fr/simbad/ General Catalogue of Variable Stars: http://www.sai.msu.su/groups/cluster/gcvs/gcvs/