Cestovní zpráva
Workshop on CRIS, CERIF and Institutional Repositories CNR Aula Marconi, Piazzale Aldo Moro, Roma,, Itálie 22. 5. 2011 2011 – 26. 26. 5. 2011 2011
Účastníci: PhDr. Petra Pejšová,
[email protected], odd. 51
květen 2011
1
1. Účel cesty Cílem zahraniční služební cesty byl pracovní workshop k systému CRIS a institucionálním repozitářům. Workshop byl určen zástupcům organizací, které jsou členy the European Organisation for International Research Information. V rámci této organizace je vyvíjen euroCRIS (Current Research Information System), což je informační nástroj určený pro poskytování přístupu k výzkumu a šíření informací. CRIS se skládá z datového modelu popisujícího objekty, které jsou předmětem zájmu výzkumu a vývoje a soubor nástrojů pro správu dat. CRIS je založen na datovém modelu CERIF, který popisuje entity, vztahy a strukturu vědeckých informací. Za Českou republiku se akce zúčastnila PhDr. Petra Pejšová z NTK, která byla přizvána z důvodu vedení Národního úložiště šedé literatury a nebyl po ní požadován účastnický poplatek v euroCRIS. Cílem workshopu bylo představení již existujících implementací a vytvoření podkladů pro plenární zasedání EuroCRIS, které mají navrhnout postup, jak vyvíjet CRIS, aby podporoval přístup k informacím z výzkumu v EU bez bariér. Cílem organizátorů bylo zasvětit zástupce NTK do tohoto složitého systému a představit mu euroCRIS komunitu. Co je CRIS? CRIS je informační nástroj určený k poskytování přístupu k výzkumu a šíření informací. CRIS se skládá z datového modelu popisujícího objekty, které jsou předmětem zájmu výzkumu a vývoje a nástroj či soubor nástrojů pro správu dat. Cílem CRIS je pomoci uživatelům v zaznamenávání údajů, podávání zpráv a rozhodovacích procesech při výzkumu. Dále též v přidělování prostředků, hodnocení projektů, generování výsledků, vyhodnocení projektů, ale též při výměně dat. Na institucionální úrovni je to nástroj pro manažerské rozhodování, hodnocení výzkumu na základě výstupů, dokumentování výzkumných činností a výstupů a podpora při plánování dalších projektů. Jednotlivým koncovým uživatelům CRIS pomáhá vyhodnotit příležitosti pro financování výzkumu, vyhnout se duplikaci výzkumné činnosti, analyzovat trendy a identifikovat nové trhy pro výsledky výzkumu. Typické formy výstupu jsou životopis vědce, manažerské informace, zprávy pro investory, bibliografie výzkumu a zprávy pro komerční využití. Příloha č. 1 – leták o euroCRIS
2. Časový průběh cesty a ubytování ubytování Pro cestu na konferenci byla zvolena nízkonákladová letecká společnost WizzAir, létající z Prahy Ruzyně na letiště Rome Fuimicino. Odlet 22. 5. 2011 ve 14:35 byl bez zpoždění. Pro přepravu mezi letištěm a hotelem byl použit vlak. Zpáteční let 25. 5. 2011 byl zpožděn kvůli problémům se sopečným popelem nad Evropou. Služební cesta, která měla skončit dle plánu 25. 5. 2011 večer, byla díky okolnostem o několik hodin prodloužena do 26. 5. 2011 s příletem 00.20. Ubytování bylo rezervováno přes sytém Booking.com.
2
3. Průběh navštívené akce/jednání Tato část je rozdělena do dvou částí A) představení implementací CRIS a B) podklady pro další vývoj CRIS
A) Představení implementací CRIS Bernard Rentiér Představil implementaci OA na jejich universitě - University of Liege v Belgii. Vytvořili úspěšný repozitář s mnoha fulltexty s cílem zajistit přístup ke všem výsledkům výzkumu za veřejné peníze. Nebylo to těžké technicky, ale s výzkumníky. Jejich repozitář je indexovaný pomocí search engines, ale pořád mají embargo na mnoho fulltextů, proto je u nich e-print na vyžádání od autora. Na začátku si kladli otázku, jaký typ repozitáře je nejlepší budovat, zda centralizovaný, tématický nebo institucionální? Po zkušenostech je podle něj nejlepší řešení budovat institucionální repozitář. Vše je nařízeno a jasně financováno. Těžké je přesvědčit výzkumníky, protože míchají spoustu dojmů a mají obavy. Je nutné na jedné straně jim vše trpělivě vysvětlovat a na druhé straně nařídit. Repozitář je skvělým nástrojem pro šíření jejich práce. Neuvidí sice výsledky okamžitě, ale funguje to dlouhodobě. Představuje to archivování a kompletování jejich práce. Mají problém s nepublikovanými daty a s podpůrnými daty k vyhledání. Institucionální repozitář představuje kvalitu výzkumu organizace, slouží jako osobní propagační nástroj autorů a lze jej též využít k hodnocení výzkumníků. Zdůraznil, že vše úspěšně funguje, když je na to mandát! Pracovníci univerzity museli od roku 2002 dávat všechny fulltexty do repozitáře ORBi, jinak výstupy neplatí. Z ORBi se dělá zpráva na osobu. Generuje publikační list do životopisu a list nejstahovanějších článků. Zajímavý úkaz – když začalo ORBi a univerzitní autoři do něj začali dávat články, které jim vycházeli v časopisech – bylo hodně stažení. Mysleli si, že se přestane prodávat časopis, ale naopak se zvýšila prodejnost. Důvodem bylo, že když si někdo stáhl zajímavý článek a zjistil v jakém časopise byl vydaný, tak pak chtěl celý časopis. Další informace k ORBi v bodech: • Všechny zprávy musí být oficiální dokumenty • ORBi website je dostupná pro každého • Každé dva roky mají blok propagace • Úspěch 60tis referenci • Jsou v ROARu • Výsledek – autoři publikují více • Propojeno s business inteligence Přidané hodnoty: • právní aspekt – právní kancelář na univerzitě, protože autoři se sami nevyznají v právních otázkách publikování, • provozují hot line, • 5 lidí na plný úvazek se stará o ORBi • blog, který vysvětluje proč zveřejňovat práce
3
Mnoho fulltextů je přístupných až na dotaz. To funguje tak, že si uživatel nejde záznam a chce si to přečíst, požádá autora, ten dostane krátký dotaz a může odpovědět ANO x NE. http://orbi.ulg.ac.be
Brian Matthews Science and Technology Facilities Council (STFC) Výstavba střediska stála biliony liber a 400 mil. liber stojí roční provoz. Mají 30 tis. návštěvníků a 5tis. high impact článků ročně. Z toho důvodu musí mít propracované procesy, proto vznikl projekt ICAT. ICAT je databáze s detailně definovaným API, které poskytuje rozhraní pro zajištění práce s velkými objemy experimentálních dat a mechanismus, který propojuje všechny aspekty výzkumu od návrhu až po zveřejnění. Cílem je znovu využívat data, například nový výzkum založený na starých datech, dostupnost dat má zamezit opakování výzkumů, ukládají zde i materiály k výuce apod.
4
Více na: http://code.google.com/p/icatproject/ www.e-science.stfc.ac.uk
Jose Manuel Barrueco Crus Požadavky na hodnocení výzkumu OAR (Open Access Repositoriem) je nové médium jak šířit výsledky výzkumu. Mají 1800 záznamů v ROAR. Ovšem autory zajímá impact ne OA, jsou zvyklí na publikování v OA časopisech ne OAR. U tématických repozitářů (Subjekt based rep.) jako jsou CiteSeer, aXiv, RePEc je implementován citační index. Ale u institucionálních repozitářů nic takového neexistuje – mělo by se to udělat! Případová studie CitEc RePEc (Research Pápera in Economics) -popisuje instituce, autory, publikační kanály, výzkumné výstupy – každý má persistentní ID Jsou tam reference, citace Příklady http://citec.repec.org http://econpapers.repec.org/ http://ideas.repec.org/top/ Může být citační analýza implementována do OAR? Ano, ale … Nevýhody současných OAR: • Repozitáře jsou prázdné 43% OAR má méně než 1 tis. záznamů • Nejsou limitovány na výzkumné výstupy, ale můžou tam být také učební materiály apod. • Často není přístup do fulltextu • Málo repozitářů má „ask authors list of refernces“ Příležitosti: • Vytvořit citační službu • Potřebujeme guidelines pro poskytovatele služeb • DRIVER nestačí • Zlepšit interoperabilitu a kvalitu metadat • CRIS+OAR – persistentní identifikátory • OpenID
Paul Beckers European Science Foundation Project MERIL = Mapping the European Research Infastructure Landscape
5
Původní portál www.riportal.eu, který od roku 2006 zlepšují 4 pracovní skupiny. Tento projekt začal 1. října 2010 s rozpočtem 800 tis. EUR. PROČ? Unikátní zdroj informací o výzkumné infrastruktuře v Evropě. Přístup k velkému množství materiálů, předcházení duplicit atd. V řídícím výboru jsou zástupci různých vědeckých oblastí.
Sally Rumsey Informace z výzkumu a služby založené na semantic web technologiích Oxford University Research Archive (ORA) ( – Oxford ORA obsahuje publikace a další výsledky výzkumu z produkce zaměstnanců University of Oxford. Obsah zahrnuje kopie časopiseckých článků, konferenčních příspěvků, výzkumné zprávy a další druhy výzkumných publikací. Plné znění většiny z těchto prací je volně k dispozici pro použití v souladu autorskými právy a s oprávněními pro koncové uživatele. http://ora.ouls.ox.ac.uk Popisují a porovnávají entity a k tomu používají slovníky. Harvestují data s různých zdrojů a znovu je využívají.
Building the research information Infrastructure (BRII) http://brii.medsci.ox.ac.uk/
6
Projektový diagram
Paolo Magni OpenAIRE DRIVER – OAR nutná harmonizace různých dat
7
D-Net SW Toolkit www.d-net.research-infrastructure Driver guidelines pro manažery repozitářů Metadata formát – jednoduchý DC = dc:type + value formát, repository info + lokace Protokol – OAI-PMH OA mandát COAR – konfederace OA repozitářů CRIS-OAR federace – zkušenosti z projektu OpenAIRE Nabízí uložení sirotčích děl Datamodel = články + projekty Spojit informace o projektu s publikacemi Řešení duplicit Bude složeno z D-NET s novými službami a z INVENIA pro sirotčí díla Publikace z repozitářů a od koncových uživatelů CRIS systém http://www.openaire.eu/
Keith Jeffery Architektura založená na CRIS Typické otázky na výzkumný projekt: • Kdo financuje projekt • Co bylo za publikace z projektu • Kdo a z jakých organizací se na projektu podílí • Jaké patenty byly výsledkem projektu
8
•
a další
Co potřebujeme mít v metadatech: • dotační projekt • členové týmu • financující org. • publikace • produkt • patenty • organizace … Většina údajů není v DC! Proto vznikl datový model a odpovídající architektura CERIF-CRIS. CERIF-CRIS poskytuje odpovědi pro manažery atd., proto použit pro OpenAIRE.
Sara Di Giorgio Cultura Italia Mají pouze bibliografickou bázi a z ní odkazují k poskytovatelům, se kterými uzavírají licenční smlouvy a vše vystavují pod CC. Propojeno s Europeanou PICO type vocabulary – persóna PICO Thesaurus http://culturaitalia.it/pico Guidelines jak vytvořit systém, který bude kompatibilní s tímto portálem. Slabé stránky poskytovatelů dat: chybí standardy, metadata … http://www.culturaitalia.it/pico/FootMenu/progetto/en/index.html
9
Další projekty: • MuseiD Italia • Internet Culturale
Ed Simons DC, MODS vs. CERIF DC • • •
velice jednoduchý, není možné popsat čísla časopisu, CD apod. reflektuje tradiční knihovnickou kulturu politický aspekt nebo kulturu – robustní
MODS • více podrobný • role autorů • aspekty • je schopné v záznamu popsat i části • také reflektuje knihovnický aspekt • ale ne aspekt pro výzkumné informace CERIF-XML • v jednom záznamu popisuje části • popisuje autory a linky k jejich publikacím • autor k publikaci • článek k časopisu • kapitolu k knize • editora k knize • atd. • velice špatně se vysvětluje lidem mimo CRIS komunitu • není omezen bibliograficky
Brigitte Jorg The CERIF Model = Common European Research Information Format Jednoduchá reprezentace určitého kontextu, která je formálně popsaná. Popisuje vazby. Jsou zde různé typy metadat, proto je nutné je strukturovat • popisná • administrativní • strukturovaná Systém CRIS – Current Research Information Popisuje změny – lidé např. mění pracovní místo – změna vztahů Není to jen databázový model, ale jedná se zároveň o koncepci.
10
Typy entit – base, results, 2 level, link entities (nejsou pojmenované, jsou proměnlivé , je jich spousta např. role=autor, role=autor… - mění se podle kontextu) CERIF Ontology • osoba • organizace • publikace • financování…
Anne Asserson Cristin – Current Research Information System in Norway Metadata, která linkují do lokálních repozitářů. Založeno na datovém modelu CERIF. Koupily ISI Thomson Reuters data pro Skandinávii, která využili v Cristin. Vstup pouze jednou a vícekrát využito! Cílem dávat dohromady informace.
Lee Van Campe FRIS – Flanders Research Inf Space Využili CERIF architekturu http://www.researchportal.be/en/index.html
11
Susanna Monati CILEA (Consorcio Interuniversitario) Staly se partnery univerzit a výzkumných organizací proto začali využívat CRIS. SURplus architektura Datacolection databáze – management lidí, open archive atd. Dělají z dat hodnocení – mají business inteligence nástroj, statistické analýzy Využívají DSpace Nyní implementovali stejné řešení pro University of Honkong http://hub.hku.hk/
Fabricio Luglio CINECA –universitní konsorcium Sdružuje 49 vysokých škol a slouží, jak k sdílení znalostí tak k zjednodušení administrativních procesů. Používá CRIS model. Nemá vlastní prezentační rozhraní, ale využívá k tomu webové rozhraní. www.u-gov.eu
12
U-GOV architektura http://www.u-gov.eu/repository/DOCUMENTI/WhitePaperU-GOVArchitectureENG.pdf
B) Podklady pro další vývoj CRIS Poučení z vývoje Open Access repozitářů a CRIS a jejich integrace Definování pojmů: • Repozitář je komponenta digitální knihovny (DL) • Digitální knihovna je služba nad repozitářem Zaměřit se především na: • Kvalitu dat • Identifikátory CRIS zlepšuje kvalitu dat pomocí bohaté struktury = kontext Repozitáře mají být jednoduché – flexibilní
Výhody integrace Open Access repozitářů a CRIS a jejich propagace Rozdíl mezi Open Access Repository (AOR) a institucionálním repozitářem! Kontext – potřeba vysoké kvality vědeckých informací Výhody OAR/CRIS
13
• •
kombinovaný přístup povede k lepším službám, výhody pro management CRIS dává výzkum do kontextu
Příležitosti OAR/CRIS • těžit ze současných slovníků, tezarů apod. • integrace je výzva • různé přístupy • integrování dat a služeb pro koncové uživatele • obohacení metadat o další informace – z jakého projektu, kdo spolupracoval • propojení na statistiky – kolik stály výsledky, nové metriky = impakt na výzkum • vložení dat jednou a následné vícenásobné využití • data můžou využít další systémy pro různé uživatele - pro ty, co dělají rozhodnutí, co financují, co spravují, co využívají • přidaná hodnota – fulltextová analýza Hrozby • • •
mnoho jazyků, národností a standardů složitost a komplikovanost CRIS, aby se implementoval pouze pro jednu organizaci zajištění komplexnosti, aby systém přinášel všechny výhody
Výzvy pro budoucí vývoj Co bude za 10 let Tři klíčová slova – open data, data sparing, support for openes = flexible, easy, seamless Sdílení: • • •
universální identifikátory právní problematiku bezproblémové nastavení
Open standart: • kooperace • udržitelnost • integrace = technická i politická • transparentnost Obsah: • • • • • •
kvalita dat multimediální objekty automatický harvesting vícenásobná přístupnost vícenásobné využití dat ochrana dat
14
4. Závěry/shrnutí Na workshopu byly představeny již existující implementace z různých evropských zemí, následovala práce ve skupinách, které připravovaly podklady, jejichž cílem bylo, jak postupovat, aby byl zajištěn přístup k informacím z výzkumu v EU bez bariér. Byly připraveny podklady pro plenární zasedání euroCRIS ve třech oblastech – poučení z vývoje Open Access repozitářů a CRIS a jejich integrace – výhody integrace Open Access repozitářů a CRIS a jejich propagace – výzvy pro budoucí vývoj. Následně se účastníci shodli na potřebě vydání deklarace euroCRIS směrem k podpoře Open Access a zpřístupnění výstupů vědy a výzkumu v EU, jejíž návrh též připravili. Workshopu se zúčastnilo 50 zástupců z 12 zemí Evropské unie a zástupce European Science Foundation. European Science Foundation implementuje CRIS v rámci svého projektu MERIL, který má být zdrojem informací o výzkumné infrastruktuře v Evropě. Pro další vývoj byly mnohokrát opakovány potřebné výchozí podmínky – mít mandát, nutné je nařízení shora, budování jakýchkoliv repozitářů nefunguje na základě dobrovolnosti. Důležité je implementovat do repozitářů přidanou hodnotu např. fulltextová analýza, propojení na statistiky, různé formy hodnocení, vícenásobné využití jedné informace apod. Důležité je uvědomit si, že přínos je pro různé uživatele (vědce, management, sponzora, atd.) rozdílný. Petra Pejšová předběžně dohodla s vedoucí pracovní skupiny pro datový model CERIF Brigitte Jörg z Berlína přednášku o datovém modelu CERIF na Semináři ke zpřístupňování šedé literatury, který pořádá NTK 25. října 2011. Brigitte Jörg souhlasila, že všechny náklady s cestou budou hrazeny ze strany euroCRIS. Petru Pejšovou dále velice zaujala přednáška Bernarda Rentiéra o implementaci OA na jejich universitě University of Liege v Belgii, proto doporučuje jeho oslovení a požádání o přednášku na Semináři ke zpřístupňování šedé literatury. Vedení euroCRIS se zajímalo, zda by bylo možné některou z akcí pořádat v NTK. Petra Pejšová přislíbila, že zjistí podmínky v NTK a ozve se. Vzhledem k rozšiřování formátu CRIS a jeho implementaci v rámci projektu MERIL, který řídí European Science Foundation, je potřeba spojit se s zástupci v euroCRIS s České republiky a zjistit stav implementace na národní úrovni. Pro další vývoj Národního úložiště šedé literatury by byla implementace přínosná, ale závisí na implementaci formátu ve zdrojových databázích shromažďujících data o výzkumu v ČR. Na základě těchto skutečností doporučuje Petra Pejšová NTK, aby podpořila implementaci formátu CRIS v ČR.
15