MISKOLCI EGYETEMI PUBLIKÁCIÓS ADATBÁZIS: TAPASZTALATOK, TERVEK Vitéz Gáborné,
[email protected] Miskolci Egyetem Számítóközpont Kiss Andrea,
[email protected] Miskolci Egyetem Könyvtár, Levéltár, Múzeum Veréb Norbert,
[email protected] Miskolci Egyetem Számítóközpont
2 év, 9060 publikáció bibliográfiai adatai a Miskolci Egyetemi Publikációs Adatbázisban (MEPA)! Elégedettek lehetünk? Igen. 98 publikáció érhető el teljes szöveggel a MEPA-ban, 87 publikáció kereshető az Nemzeti Digitális Adattár (NDA) közös keresőjében. Elégedettek lehetünk? Nem igazán. Ez az arány (10%), az eddigi tapasztalatok összegzésére késztet, és újabb tervek megfogalmazására ösztönöz. Mi volt példaértékű a projekt életében? Informatikus és könyvtáros szakemberek közös, összehangolt együttműködése. Hogyan lesz vonzóbb, hasznosabb a MEPA az Egyetemnek, az egyetemi oktatóknak és a külső felhsználóknak? Erre a kérdésre keressük a választ. Egészitsük ki statisztikai modullal a rendszert! További szabványos csereformátumok szolgáltatásával épitsünk utat más Publikációs Adatbázisok felé! (Pl. Web of Science / ISI Web of Knowledge Export formátum) Nyújtson a rendszer lehetőséget idézet, és idézettség kezelésére is! Ezekre a témákra fokuszálunk.
UNIVERSITY OF MISKOLC PUBLICATION DATABASE: EXPERIENCES, PLANS Vitéz Gáborné,
[email protected] University of Miskolc Computer Center Kiss Andrea,
[email protected] University of Miskolc Library, Archives, Museum Veréb Norbert,
[email protected] University of Miskolc Computer Center
2 years, the bibliographical data of 9060 publications in the Publications Database of the University of Miskolc (MEPA). Are we content? Yes. The full text of 98 publications can be found in the MEPA, 87 publications can be searched for in the joint query system of the National Digital Data Archives (NDA). Are we content? Not really. This proportion (10%) stimulates the summarising of our former experiences and forging new plans. What was exemplary in the development of our project? The harmonic cooperation of our experts of different backgrounds; computer scientists and librarians. How will MEPA become more useful and appealing for the university, its instructors and for external users? We are looking for the answer to this question. Let us complete the system with a statistical module. By supporting further standardised exchange formats let us pave the road towards more publications databases. (E.g.: Web of Science, ISI Web of Knowledge Export format) The system should facilitate the use of citations and citation indexing. These questions are in the focus of our interest.
MISKOLCI EGYETEMI PUBLIKÁCIÓS ADATBÁZIS: TAPASZTALATOK, TERVEK Vitéz Gáborné,
[email protected] Miskolci Egyetem Számítóközpont Kiss Andrea,
[email protected] Miskolci Egyetem Könyvtár, Levéltár, Múzeum Veréb Norbert,
[email protected] Miskolci Egyetem Számítóközpont
1. Előzmények 2004 végén felkérés érkezett az Miskolci Egyetem vezetésétől az Egyetemi Számítóközpontba. A feladat egy központi adatbázis létrehozása volt az Egyetemhez kapcsolódó publikációkból, amely adatokat szolgáltat a különböző egyetemi beszámolók számára. A munka elvégzéséhez - mivel elsősorban bibliográfiai adatokat tároló adatbázisról van szó - a Számítóközpont az Egyetemi Könyvtár segítségét kérte. 2. Célok és tervezés Célkitűzésünk egy olyan egységes adatbázis megteremtése volt, amely − egy helyen gyűjti össze a szükséges anyagokat − több szempontú keresést biztosít − bibliográfiai hivatkozások szabványának megfelelő egységes megjelenítésre alkalmas − helyet biztosít a tartalmi kivonatok, mellékletek, teljes szövegek számára is − a publikációk metaadatait szabványos formában tárolja, lehetővé téve más rendszerekben való felhasználásukat is. Ez utóbbi szempont miatt az NDA által is támogatott qDC metaadat séma ajánlásokat is figyelembe vettük. A programozás és a tesztelés 2005-ben kezdődött el, 2006-ban pedig elindult az éles adatok feltöltése. 3. Eredmények Beviteli felület: − csak regisztrált felhasználóknak − szerzői és publikációs adatok rögzítése, módosítása, törlése − teljes szövegek feltöltése az adatbázisba Keresőfelület: Böngészés:
− címek betűrendes listája − szerzők és közreműködők nevének betűrendes listája − szervezeti egységek vagy karok szerinti listák
Egyszerű keresés:
− a publikációk címében előforduló szavak − szerzői, közreműködői nevek − tárgyszavak Összetett keresés:
− a publikációk címében előforduló szavak - a keresési metódust is beállíthatjuk (and, or kapcsolat, vagy a kifejezés egészének keresése) − szerzői, közreműködői nevek - testületi nevekben is − tárgyszavak − szervezeti egységek − azonosítók (pl. ISBN, ISSN, szabványszám stb.) Szűkítési szempontok összetett keresésnél:
− megjelenési év − a dokumentum típusa − a dokumentum nyelve
Kimenetek: − rövid megjelenítés (a hivatkozási szabványnak megfelelően) − részletes megjelenítés (az adatok bővebb halmazát mutatja meg címkés formában); innen érhetők el további információk az egyes közreműködőkkel kapcsolatban (e-mail, honlap) − letölthető lista .txt fájlban − OAI (Open Archive Initiative) interface az NDA (Nemzeti Digitális Adattár) számára − teljes szövegek; link már a rövid megjelenítésnél is A teljes szöveget fel lehet tölteni (ezt szorgalmazzuk is, mivel így biztosíthatjuk, hogy a felvett URL címek élők is maradjanak), a feltöltés egyszerű webes formában történik. Statisztika: − gyarapodási statisztika − használati statisztika 4. Tapasztalatok Hogyan állunk most? Nézzünk meg néhány statisztikai adatot: Év
Publikáció
Szerző
Egyetemi szerző
2006
4352
756
207
2007
4558
1059
166
2008
727
159
34
Publikáció
Szerző 9797
2008. 02. 27-i állapot
Egyetemi szerző 2023
415
Az adatokból látható, hogy csaknem 10000 publikáció bibliográfiai adatai kerültek be az adatbázisba eddig (2008. február vége). Azonban a részleteket nézve feltűnik, hogy kevés az egyetemi szerzők száma. Mi ennek az oka? Nem érzik fontosnak az oktatók, hogy kereshető legyen a publikációjuk az Interneten? Nincs idő ezen adatok összegyűjtésére, rendszerezésére? Mi úgy gondoljuk, hogy nem volt megfelelő eddig az adatbázis népszerűsítése. Idén februárban azonban az egyetem vezetése az akkreditáció miatt felkarolta ezt az ügyet, a vezetői utasítás hatására pedig az oktatók tömegével küldték el publikációs listáikat a feldolgozást végző könyvtárosoknak. Ennek következtében a gyarapodás ugrásszerűen megnőtt, és a listák feldolgozása jelenleg is nagy erőkkel folyik. Hónap
Böngészés
Gyors keresés
Összetett keresés
2007. 08.
1941
107
57
2007. 09.
2797
371
72
2007. 10.
3197
314
138
2007. 11.
3476
391
162
2007. 12.
3074
275
89
2008. 01.
4002
309
122
2008. 02.
3478
490
363
A látogatottsági statisztika természetesen tükrözi az egyetem életét, tehát nyáron ill. decemberben alacsonyabb számokat látunk, mint szorgalmi időszakban. Figyelemre méltóan kiugró a böngészések száma, ennek oka valószínűleg az, hogy a kezdő oldalon a böngészés a legszembetűnőbb lehetőség. A közeljövőben valószínűleg változtatunk a kereső felület kinézetén és ez bizonyára a keresési szokások változását is magával hozza majd. Másik elgondolkodtató adat a teljes szöveggel elérhető publikációk száma. Nem egészen 100 publikáció érhető el teljes szöveggel a MEPA-ban, és ezen publikációk kereshetők az Nemzeti Digitális Adattár (NDA) közös keresőjében 2007-től. Ennek az évnek a fejlesztése volt az OAI (Open Archive Initiative) interface elkészítése. Íme az eredmény: NDA KERESŐ: MISKOLCI EGYETEM SZÁMÍTÓKÖZPONT ADATAI Összesen 98 találat megjelenített: 1-5.[Előző] 1, 2, 3, 4, 5, 6, 7, 8 [Következő] Miskolci Egyetem Bibliográfia Elérhető: 2006.02.17. http://www.uni-miskolc.hu/~mepublic/data/ME-PUB-29
Metarekord
Digitális áramkörök szimulációja Gárdus Zoltán Kulcsszavak: logikai függvények, kombinációs hálózatok, szinkron sorrendi hálózatok, aszinkron sorrendi hálózatok Bibliográfia
Metarekord
Elérhető: 2006.02.17. http://www.uni-miskolc.hu/~mepublic/data/ME-PUB-31 Mikroprocesszorok és alkalmazásuk Gárdus Zoltán Kulcsszavak: Intel 8885 mikroprocesszorok, Intel 8886 mikroprocesszorok Metarekord
Bibliográfia Elérhető: 2006.02.17. http://www.uni-miskolc.hu/~mepublic/data/ME-PUB-32
NDA KERESŐ: REKORD MEGJELENÍTÉSE Mező Cím
Minősítő
Érték
Miskolci Egyetem Egységesített cím Miskolci Egyetem Kiadó Borsod Megyei Lapkiadó Vállalat Dátum Kibocsátva 1990 Típus idoszaki_kiadvany nyomtatott dokumentum Formátum Azonosító Bibliográfiai hivatkozás 0866-4102 Példányazonosító ME-PUB-29 http://www.uni-miskolc.hu/~mepublic/data/ME-PUB-29 Nyelv hun „Az OAI egy nyílt, nemzetközi mozgalom, melynek célja digitális tartalom terjesztésének javítása.” - olvasható az NDA honlapján. Egy ilyen integrált rendszer jó lehetőséget adna a meglevő publikációs adatbázisok és adattárak adatainak együttes kereshetőségére országosan is. Az NDA-ban azonban csak olyan munkák bibliográfiai adatai kereshetők, ahol maga a mű is elérhető az Interneten. Ezért annyira fájó, hogy nálunk ilyen kevés a teljes szövegű elérés, holott ma már nincs technikai akadálya, hogy a publikációkat ilyen formában is közzétegyük. A felhasználói visszajelzések is azt mutatják, hogy nagy szükség lenne a teljes szövegekre. Tipikus kérdés felénk: „Megtaláltam a Google segítségével X.Y. oktató egy publikációját, hogyan olvashatnám el?” Ezek a problémák az eddigi tapasztalatok összegzésére késztetnek, és újabb tervek megfogalmazására ösztönöznek minket. Megvizsgáltuk, mi volt pozitívum a rendszer életében, érkeztek-e olyan újabb kérések, amire
a rendszer nem tud most még választ adni. Mi volt példaértékű a projekt életében? Az informatikus és könyvtáros szakemberek közös, összehangolt együttműködése. A könyvtárosi szakértelem fontos volt már a rendszer tervezésénél is, hogy a kimenetek megfeleljenek a bibliográfiai hivatkozások szabványának. Ez nagy kihívásokat támasztott a rendszerrel szemben. A pontos adatbevitel és tárolás azonban csak lehetőség a rendszerben. Ha nem használjuk ki, értékét veszti a metaadat. Hiába van lehetőség tárgyszó szerinti keresésre, ha nincs a rekordhoz tárgyszó kapcsolva. A könyvtárosi szakértelemre a használat, az adatbevitel során is szükség van. Bár van lehetőség arra, hogy az oktatók regisztráció után maguk vigyék fel adataikat, mégis az a jellemző, hogy a publikációs listákat többnyire vagy egyénileg, vagy egy-egy szervezeti egység összes publikációját összegyűjtve küldik el a Könyvtárba. Ezek az egyéni listák Word dokumentumként érkeznek meg a rendszeradminisztrátorhoz, aki továbbadja az adatbevitellel foglalkozó könyvtárosoknak. Egy publikáció leírásához olykor kutatni kell a tartalmazó folyóirat, kiadvány pontos címe, megjelenése, kiadója, stb. után, a szerzők elérhetőségi adatait is keresni kell olykor. De talán a tárgyszavazás lenne a legfontosabb, ez azonban a teljes szöveg nélkül kivitelezhetetlen. Az eredeti elképzelésünk az volt, hogy a publikáció teljes szövegét kellene elküldeni az egyetemi Könyvtárba digitálisan, ebből nem csak a szerző nevét, a mű címét, a tartalmazó dokumentum paramétereit lehetne helyesen kiemelni, hanem a tárgyszavazás könyvtárosi szakértelmet igénylő feladata is elvégezhető lenne. Így azonban ez is csak egy kihasználatlan lehetősége rendszerünknek. Pedig ha a Google keresőjébe beírjuk: „publikációs adatbázis”, a MEPA előkelő helyen jelenik meg (2. helyen):
A MAGYAR TUDOMÁNYOS AKADÉMIA KÖZTESTÜLETI HONLAPJA www.mtakoztest.hu/ - 6k - Tárolt változat - Hasonló oldalak
Miskolci Egyetem Publikációs Adatbázis A Miskolci Egyetem Publikációs Adatbázisa az intézmény oktatóinak, dolgozóinak nyomtatott vagy elektronikus formában megjelent, tudományos és egyéb ... www.uni-miskolc.hu/~mepublic/ - 26k - Tárolt változat - Hasonló oldalak 5. Igények Hogyan lesz vonzóbb, hasznosabb a MEPA az Egyetemnek, az egyetemi oktatóknak és a külső felhasználóknak? Statisztikák fontossága Az Egyetemnek különböző statisztikákra lenne a szüksége a publikációkról Ilyenek például: • szervezeti egységekre lebontott statisztika • adott tanszéken / karon / intézményben hány publikáció született összesen / adott évben • hány oktató publikációi szerepelnek az adatbázisban (összesen / adott szervezeti egységben) Az oktatóknak személyre szabott statisztikára van szükségük, például:
• • •
összesen / kiadvány-típusonként hány db publikációja van az adatbázisban adott évben hány publikációja jelent meg (összesen / kiadvány-típusonként) típus szerint / év szerint rendezett listák megjelenítése
Hivatkozások kezelése Lényeges eleme a publikációs listáknak, hogy nem csak publikációk adatait, hanem az azokra vonatkozó hivatkozásokat is tartalmazzák. Úgy látjuk, valós igény van arra, hogy ezen hivatkozások nyilvántartására is alkalmassá tegyük a rendszert. Csereformátumok Megfogalmazódott az oktatók részéről, hogy miért kellene a MEPA-ba felvinni azokat a publikációkat, melyek a Köztestületi Publikációs Adattárban (KPA) már megjelentek. Ésszerű lenne olyan modul, mely importálni tud más adattárakból bibliográfiai adatokat. 6. Fejlesztési tervek Eddigi tapasztalataink és a megfogalmazott igények alapján meghatároztuk, milyen irányban kívánunk továbbfejlődni. Három fő irány fogalmazódott meg az igények alapján. 1. Statisztikai modul készítése. Célszerű lenne egyeztetni az egyetem vezetésével, a karok vezetőivel, hogy pontosan mire van szüksége az egyetemnek, és milyen statisztikákat várnak el, illetve milyen szempont szerint rendezett, csoportosított listákat szeretnének az oktatók. Azt már jelezték, hogy szervezeti egységenkénti statisztika feltétlenül szükséges. A pontos specifikáció után lehet elkezdeni a fejlesztést. 2. Hivatkozások kezelése. Ez már jóval több feladatot jelent. Bővíteni kell az adatstruktúrát, új adattáblára van szükség. Meg kell határozni, milyen adatjellemzőket tároljunk, milyen részletességgel. Ez az elem összhangban van a qDC relation alapelemével, nevezetesen az „isReferencedBy” minősítővel, tehát ebből a szempontból nincs probléma. 3. A metaadatok exportja, importja. Ez a kérdés a legösszetettebb és legmesszebbre mutatóbb a rendszer életében, de megkerülhetetlen, ha a kereshetőséget, az adatbázisban szereplő publikációk ismertségét, elérhetőségét szeretnénk növelni. Ugyanakkor jogos igény is, hogy a más adatbázisban már szereplő adatokat ne kelljen újra „kézzel” feldolgozni. A KPA-ban szereplő publikációk adatait át kell vennünk automatikusan. A KPA több exporttal is rendelkezik, ezek közül a ris formátum tűnik a leghasznosabbnak. El kell tehát készíteni egy ris formátumú metaadat konverziós modult. A ris formátum két karakteres kódokkal definiálja az adattípust, pl.: TY - RPRT A1 - Esparza,J.
T1 - Report of a WHO workshop on the measurement and significance of neutralizing antibody to HIV and SIV, London, 3-5 October 1988 Y1 - 1990 VL - 4 SP - 269 EP - 275 RP - Not In fájl CY - San Francisco CA PB - UC Berkeley KW - HIV KW - SIV KW - AIDS T3 - World Health Organisation Global Programme on AIDS ER melyet nem nehéz „map”-elni a MEPA objektumába. Azonban a szerző, és a szervezeti egység kezelése mindenképpen emberi erőforrást fog igényelni, azaz a szerzőt először fel kell venni a rendszerbe, ha még nem szerepel, és a kapott szerzőkód alapján kell a publikáció adatait konvertálni. Terveink között szerepel egy FN ISI Export Format kimenet készítése is. Ez azért lenne lényeges, mert a Web of Science / ISI Web of Knowledge többek között ebben a formában exportálja az adatait. FN ISI Export Format VR 1.0 PT J AU Skwish, S Asensio, F King, G Clarke, G Kath, G Salvatore, MJ Dufresne, C
TI FIZICS: Fluorescent imaging zone identification system, a novel macro imaging system
SO JOURNAL OF BIOMOLECULAR SCREENING SN 1087-0571 PD DEC PY 2004 VL 9 IS 8 BP 663 EP 670 UT ISI:000225914100001 ER EF Látszik, hogy közeli rokonságot mutat a ris formátummal, így megoldható egy ilyen modul készítése is. Ezt az import formátumot a KPA is támogatja, így a különböző rendszerek átjárhatósága megoldható lenne.
Jóllehet XML formátum lenne igazán ajánlatos (az OAI/PMH esetében ez már elkészült a MEPA-hoz), de az általunk vizsgált, hazai publikációs adatbázisokban ilyen export-import formával nem találkoztunk. Adott tehát egy rendszer közel 10 ezer publikáció, folyóirat metaadataival. Látjuk erényeit és hiányosságait, valamint látjuk az irányt is, amerre haladva jobb minőséget és hasznosabb szolgáltatást tudunk majd nyújtani. Elérhetőség: http://www.uni-miskolc.hu/~mepublic/