Státní technická knihovna Projekt Národní úložiště šedé literatury
Podkladová analýza pro definici metadatového formátu NUŠL
Beta verze 0.2
Zpracovatel: Veronika Synková, Radka Římanová
Prosinec 2008
Citace: Podkladová analýza pro definici metadatového formátu NUŠL. Zpracovatel Veronika Synková a Radka Římanová. Verze Beta 0.2. Praha : Státní technická knihovna, 2008.
Abstrakt: Dokument obsahuje podklady pro vytvoření metadatového formátu pro databázi Národní úložiště šedé literatury (NUŠL). Analýza zahrnuje stručný popis výchozích formátů Dublin Core, OpenSIGLE, EVŠKP, ASEP, RIV. Dle předpokladů budou záznamy především v těchto formátech do báze NUŠL importovány. Hlavní část dokumentu tvoří srovnání výše uvedených formátů. Z hlavní části dokumentu vyplývá návrh formátu NUŠL, který vznikl výběrem prvků potřebných pro bázi NUŠL a doplněním administrativních a dalších prvků specifických pro bázi NUŠL. Popsány jsou také sporné otázky, které je potřebné vyřešit.
OBSAH 1
ÚVOD..............................................................................................................................................................................1
2
METADATOVÉ FORMÁTY DUBLIN CORE, OPENSIGLE A MODS ................................................................2 2.1 2.2 2.3
DUBLIN CORE ..........................................................................................................................................................2 OPENSIGLE............................................................................................................................................................2 MODS.....................................................................................................................................................................3
3 PŘEHLED ZDROJOVÝCH FORMÁTŮ PRO NÁVRH METADATOVÉHO FORMÁTU NUŠL - EVŠKP, ASEP A RIV.............................................................................................................................................................................4 3.1 3.2 3.3 4
EVŠKP-MS ............................................................................................................................................................4 ASEP ......................................................................................................................................................................5 RIV - REJSTŘÍK INFORMACÍ O VÝSLEDCÍCH VÝZKUMU A VÝVOJE ...........................................................................5
NÁVRH FORMÁTU NUŠL ..........................................................................................................................................1 4.1 METADATOVÝ ZÁZNAM NUŠL - NUSL:METADATA .................................................................................................1 4.2 IDENTIFIKÁTOR ZDROJE - DC:IDENTIFIER .................................................................................................................1 4.3 NÁZEV – DC:TITLE ...................................................................................................................................................2 4.4 ALTERNATIVNÍ NÁZEV, PODNÁZEV ZDROJE – DCTERMS:ALTERNATIVE ...................................................................2 4.5 AUTOR – DC:CREATOR.............................................................................................................................................3 4.6 SPOLUAUTOR, PŘISPĚVATEL – DC:CONTRIBUTOR ....................................................................................................5 4.7 ÚDAJE O KONFERENCI NEBO JINÉ AKCI – NUSL:EVENT .............................................................................................6 4.7.1 Identifikátor konference nebo jiné akce – dc:identifier .....................................................................................6 4.7.2 Místo konání konference nebo jiné akce – nusl:eventPlace...............................................................................7 4.7.3 Stát konání konference nebo jiné akce – nusl:eventState...................................................................................7 4.7.4 Datum konání konference nebo jiné akce – nusl:eventDates.............................................................................7 4.7.5 Typ konference nebo jiné akce – nusl:eventType ...............................................................................................8 4.8 ÚDAJE SOUVISEJÍCÍ S VYSOKOŠKOLSKOU PRACÍ – THESIS:DEGREE ..........................................................................8 4.8.1 Zkratka jména akademického titulu nebo vědecko-pedagogické hodnosti – thesis:name..................................9 4.8.2 Typ studijního programu – thesis:level..............................................................................................................9 4.8.3 Studijní program a studijní obor – thesis:discipline........................................................................................10 4.8.4 Instituce přidělující titul – thesis:grantor ........................................................................................................10 4.9 ÚDAJE O VÝSLEDKU, PATENTU, PROJEKTU, VÝZKUMNÉM ZÁMĚRU NEBO JINÉ VĚDECKO-VÝZKUMNÉ PRÁCI – NUSL:RESULT .......................................................................................................................................................................11 4.9.1 Identifikační číslo nebo kód vědeckovýzkumné práce – nusl:resultID.............................................................11 4.9.2 Parametry výsledku vědeckovýzkumné práce – nusl:resultParam...................................................................12 4.9.3 Název vlastníka výsledku vědeckovýzkumné práce – nusl:resultHolder ..........................................................12 4.9.4 IČO vlastníka výsledku vědeckovýzkumné práce – nusl:resultHolderIco........................................................12 4.9.5 Poskytovatel projektu – nusl:resultGrantGarant.............................................................................................13 4.10 NAKLADATEL – DC:PUBLISHER..............................................................................................................................13 4.11 DATUM VYDÁNÍ – DCTERMS:CREATED ..................................................................................................................14 4.12 DATUM PŘEDLOŽENÍ VŠKP– DCTERMS:DATESUBMITTED.....................................................................................14 4.13 DATUM SCHVÁLENÍ VŠKP– DCTERMS:DATEACCEPTED ........................................................................................15 4.14 DATUM ÚPRAV – DCTERMS:MODIFIED ...................................................................................................................15 4.15 VĚCNÝ POPIS – DC:SUBJECT,..................................................................................................................................16 4.16 ABSTRAKT – DCTERMS:ABSTRACT ........................................................................................................................16 4.17 TYP – DC:TYPE ......................................................................................................................................................17 4.18 FORMÁT/NOSIČ – DCTERMS:MEDIUM .....................................................................................................................18 4.19 JAZYK – DC:LANGUAGE .........................................................................................................................................19 4.20 BIBLIOGRAFICKÁ CITACE – DCTERMS:BIBLIOGRAPHICCITATION ...........................................................................19 4.21 AUTORSKÁ PRÁVA – DC:RIGHTS ...........................................................................................................................19 4.22 ROZSAH (STRANY, VELIKOST SOUBORU) – DCTERMS:EXTENT ...............................................................................20 4.23 ZPŘÍSTUPNĚNÍ SOUBORŮ – DCTERMS:AVAILABLE .................................................................................................20 4.24 DATUM ULOŽENÍ METADAT DO BÁZE NUŠL – NUSL:DATEDELIVERED .................................................................21 4.25 DATUM ZMĚNY METADATOVÉHO ZÁZNAMU – NUSL:MODIFIED .............................................................................21 4.26 POČET SOUBORŮ, KTERÉ PŘÍSLUŠÍ K METADATOVÉMU ZÁZNAMU (PLNÝ TEXT, OBRAZ…) – NUSL:FILENUMBER ..21 4.27 VLASTNOSTI JEDNOTLIVÝCH SOUBORŮ – NUSL:PROPERTIES .................................................................................22
-i-
4.28 4.29 4.30
URL ADRESA SOUBORU VE ZDROJOVÉ DATABÁZI – NUSL:TRANSFER ....................................................................23 SERVER ZPŘÍSTUPŇUJÍCÍ DOKUMENT(NUŠL/EVŠKP/ASEP/RIV/JINÉ) – NUSL:SERVER .......................................24 DATUM ZMĚNY ZÁZNAMU METADATOVÉHO (NIKOLI PLNÉHO TEXTU), VČETNĚ DATA PRVNÍHO IMPORTU – NUSL:MODIFIED ...................................................................................................................................................................24 5
NEIMPORTOVANÉ ÚDAJE .....................................................................................................................................26 5.1 5.2 5.3 5.4 5.5 5.6 5.7 5.8 5.9 5.10 5.11 5.12 5.13 5.14
6
VERZE, VYDÁNÍ .....................................................................................................................................................26 MÍSTO ZPŘÍSTUPNĚNÍ/VYDÁNÍ ...............................................................................................................................26 ZEMĚ ZPŘÍSTUPNĚNÍ/VYDÁNÍ ................................................................................................................................26 CELKOVÝ POČET AUTORŮ , POČET DOMÁCÍCH AUTORŮ .......................................................................................26 ÚDAJE O KONFERENCI NEBO JINÉ AKCI ..................................................................................................................26 OBSAH PRÁCE ........................................................................................................................................................26 JAZYK RESUMÉ ......................................................................................................................................................26 ÚDAJE O EDICI .......................................................................................................................................................26 POZNÁMKA............................................................................................................................................................27 ÚDAJE O ZDROJOVÉM DOKUMENTU (KAPITOLA Z KNIHY) ......................................................................................27 ADMINISTRATIVNÍ ÚDAJE RIV A ASEP.................................................................................................................27 ÚDAJE O NÁVAZNOSTECH RIV ..............................................................................................................................27 RIV - INFORMACE O DODÁVCE ..............................................................................................................................27 ADMINISTRATIVNÍ ÚDAJE EVŠKP.........................................................................................................................27
SHRNUTÍ ÚKOLŮ PRO DALŠÍ ŘEŠENÍ................................................................................................................28
- ii -
1
Úvod
Státní technická knihovna v Praze se stala spolu s Vysokou školou ekonomickou v Praze řešitelem projektu podporovaného Ministerstvem kultury "Digitální knihovna pro šedou literaturu - funkční model a pilotní realizace". V rámci projektu řeší otázku budování Národního úložiště šedé literatury (NUŠL). Databáze NUŠL bude obsahovat záznamy tzv. šedé literatury. Záznamy do databáze NUŠL budou převážně získávány z již existujících databází. Jde o báze Národního registru vysokoškolských prací, příp. z bází jednotlivých spolupracujících vysokých škol, ASEP (Automatizovaný systém evidence publikací) a z bází, které jsou primárně zpracovávány pro zasílání záznamů do báze RIV (Rejstřík informací o výsledcích výzkumu a vývoje). Tento dokument obsahuje východiska pro návrh metadatového formátu pro bázi NUŠL, stručný popis zdrojových bází a formátů zvažovaných při navrhování formátu NUŠL, srovnání formátů zdrojových bází a vlastní návrh formátu. Uvádí také problémy, které je potřeba dále řešit a které se nepodařilo do doby zveřejnění vyřešit. Základními požadavky, které byly na formát NUŠL kladeny, byla co největší jednoduchost formátu, jeho kompatibilita se standardem Dublin Core, možnost konverze (nikoliv však bezztrátové) záznamů ze zdrojových bází do báze NUŠL. Již od počátku se počítá s tím, že pro některé prvky v bázi NUŠL budou vytvořeny rejstříky. Mohou se však lišit od rejstříků zdrojových bází. V takových případech se počítá s tím, že v prvku mohou být kromě hodnot z rejstříku obsaženy také importované hodnoty ze zdrojových bází. Při navrhování metadatového formátu byly zásadní formáty bází, které budou zdrojovými bázemi pro bázi NUŠL. Jak bylo uvedeno výše, jde o Národní registr VŠKP, resp. metadatový soubor EVSKP-MS pro elektronické vysokoškolské kvalifikační práce v ČR, o báze ASEP a lokální báze s metadatovým formátem pro RIV. Vybrané záznamy z těchto bází budou do báze NUŠL importovány, bude nutné vytvořit konverzní tabulky a mechanismy. Dalším zdrojem mohou být báze jiných smluvních partnerů. Předpokládá se také možnost přispívat do báze NUŠL prostřednictvím webového formuláře. Zásadní však zůstávají formáty a údaje z bází EVŠKP, ASEP a pro RIV. Proto byly údaje z těchto formátů porovnány a pro účely formátu NUŠL vybrány ty, které budou do báze NUŠL ukládány. Mezi základní požadavky na formát NUŠL patří mimo jiné jeho kompatibilita s formátem Dublin Core. Návrh formátu NUŠL byl tedy koncipován tak, aby tento požadavek splňoval. Zároveň byl hlavním vzorem formát EVSKP-MS, který je navržen pro české prostředí vysokých škol a který ze standardu Dublin Core také vychází, je však obohacen o další specifické prvky. V úvodních fázích projektu bylo zvažováno také zapracování metadatového formátu MODS. Proto je jeho stručný popis součástí tohoto dokumentu. Protože se předpokládá, že záznamy z báze NUŠL budou dodávány do báze OpenSIGLE, měl být součástí analýzy také formát používaný pro tuto bázi. V prosinci 2008 se podařilo od představitelů iniciativy OpenSigle získat první návrh metadatového formátu OpenSigle. Pracovníci projektu NUŠL byly požádání o zpětnou vazbu. Zapracování formátu báze OpenSIGLE do formátu NUŠL nebo alespoň vytvoření konverzních mechanismů pro převod záznamů z báze NUŠL do báze OpenSIGLE je jedním z úkolů pro další práci. Stejně tak porování existující verze formátu OpenSigle s formátem NUŠL bude zpracováno v 1. pol. roku 2009. Další spornou otázkou, kterou je potřebné vyřešit, je, zda plně převzít praxi formátu EVŠKP-MS v oblasti popisu autorit a dovolit použití formátů PersCZ a CorpCZ, které na nižších úrovních podrobně identifikují konkrétní autoritu. Na stanovisku k této otázce se prozatím zástupci projektu NUŠL neshodli. Pro další práci je ponecháno také vytvoření konkrétních konverzních tabulek a konverzních mechanismů, aby bylo zajištěno co největší sjednocení obsahů polí, do kterých budou importovány údaje z různých bází. Konverzní tabulky bude zřejmě nutné vytvářet také s ohledem na možnosti a požadavky vybraného softwaru pro bázi NUŠL. Prozatím se předpokládá vytvoření konverzních tabulek pro převod mezi formátem NUŠL a formáty RIV, EVŠKP, ASEP, OpenSIGLE a Dublin Core. V budoucnu není vyloučeno vytvoření konverzních tabulek pro další formáty. Po výběru softwaru bude vhodná také celková revize návrhu formátu a schválení jeho oficiální verze. Je možné, že v souvislosti s výběrem softwaru dozná návrh formátu NUŠL změn. V neposlední řadě je potřeba vytvořit validační schémata XML. -1-
2
Metadatové formáty Dublin Core, OpenSIGLE a MODS
2.1 Dublin Core Dublin Core je mezinárodně uznávaný metadatový standard pro popis elektronických zdrojů. Původní formát obsahoval patnáct prvků, které jsou stále součástí aktualizovaného slovníku metadatových termínů. Definice termínů je dostupná na stránkách Iniciativy Dublin Core http://dublincore.org/documents/dcmi-terms/. Formát Dublin Core je použit v řadě projektů a systémů po celém světě. Jde o otevřený formát, který dovoluje při zachování základních pravidel přidávat nové prvky a modifikovat formát tak, aby vyhovoval potřebám různých uživatelských skupin. Zdroje: Dublin Core Metadata Initiative. 2008. DCMI Metadata Terms [online]. Dublin Core Metadata Initiative, 200801-14 [cit. 2008-05-27]. Dostupný z WWW:
.
2.2 OpenSIGLE V roce 1980 vznikl Systém pro informace o šedé literatuře v Evropě (System for Information on Grey Literature in Europe, SIGLE). V roce 2005 obsahovala databáze, na které se podílelo šestnáct zemí, 855 260 záznamů výzkumných zpráv, vysokoškolských prací, konferenčních sborníků, datových souborů a překladů z různých vědeckých oblastí. Databáze byla spravována neziskovou organizací EAGLE. EAGLE nezajistila dostatečný rozvoj databáze SIGLE, možnost online katalogizace, sklízení metadatových záznamů a propojení na plné texty a jiné zdroje. Nešlo o jediné problémy a proto došlo v roce 2005 k ukončení činnosti EAGLE. Organizace INIST, francouzský člen EAGLE, vyvinula na základě softwaru MIT Dspace databázi OpenSIGLE a uložila do ní záznamy bývalých členů EAGLE, kteří vyjádřili souhlas, z databáze SIGLE ve zjednodušeném formátu XML. V prosinci 2008 se podařilo od pracovníků iniciativy OpenSigle získat metadatový formát v první verzi k připomínkování. Úkolem 1. pololetí roku 2009 bude jeho konfrontace s formátem NUŠL, zaslání případných připomínek do Francie, případně změny formátu NUŠL. Na první pohled je ze zaslaného formátu zřejmé, že se jedná o formát, který respektuje více standard kvalifikovaný Dublin Core a je univerzálnějším formátem než pro NUŠL výchozí formát e-VŠKP. I v této souvislosti bude pro další řešení projektu klíčové, zda zachovat původní koncepci úzkého propojení formátu NUŠL a formátu EVSKP-MS, který kombinuje DC s dalšími prvky. Pro toto rozhodnutí však bylo nutné zpracovat na základě formátu EVŠKP-MS návrh formátu NUŠL. Rozhodnutí o metadatovém formátu pro pilotní verzi je závislé i na dalších analýzách, které byly v roce 2008 učiněny (především analýzy zahraničních systémů viz práce M. Pfeiferové Grey Literature ve světě, dostupné z www: http://nusl.stk.cz/images/GL_ve_svete_text.pdf nebo analýze typologie dokumentu NUŠL. Zdroje: SCHÖPFEL, Joachim; STOCK, Christiane; HENROT, Nathalie. From SIGLE to OpenSIGLE: An in-depth look on resource migration in the European context. In Eighth International Conference on Grey Literature : Harnessing the Power of Grey, New Orleans, United States, 4-5 December 2006. (Conference Program and Abstracts : GL-conference series, ISSN 1385-2308 ; No. 8). Preprint konferenčního příspěvku dostupný z WWW: -2-
.
2.3 MODS Formát MODS (Metadata Object Description Schema) zahrnuje množinu polí formátu MARC, které jsou v některých případech pro účely tohoto formátu přeskupeny. Prvky nejsou číselné ale vyjádřené slovy. Pro zápis a uložení se používá formát XML. Formát nabízí více možností než Dublin Core a více vyhovuje tradičním knihovnickým systémům. Je jednodušší než plný formát typu MARC a je více orientován na koncového uživatele než schéma MARCXML, které představuje zápis plného záznamu typu MARC v XML (více o formátu MARCXML na oficiálních stránkách formátu MARCXML http://www.loc.gov/standards/marcxml/). Zdroje: Metadata Object Description Schema (MODS) MODS: Uses and Features. Library of Congress, January 8, 2008 [cit. 2008-05-27]. Dostupný z WWW: .
-3-
3
Přehled zdrojových formátů pro návrh metadatového formátu NUŠL - EVŠKP, ASEP a RIV
3.1 EVŠKP-MS Formát EVŠKP-MS je určen pro popis vysokoškolských prací. Byl vytvořen a nadále je spravován Odbornou komisí pro otázky elektronického zpřístupňování vysokoškolských kvalifikačních prací, která je odbornou komisí Asociace knihoven vysokých škol ČR. Komise byla založena z iniciativy Klubu vysokoškolských knihoven při SKIP v lednu 2004 (Krčál, 2008). Formát je pro popis vysokoškolských kvalifikačních prací používán ve třinácti školách a jeho používání plánují s přechodem na nový software další tři školy. Ostatní školy používají pro popis vysokoškolských prací formáty typu MARC, případně formáty vlastní (Horová, 2008). V České republice jsou prozatím budovány samostatné lokální registry vysokoškolských kvalifikačních prací. V roce 2008 je však řešen projekt „Národní registr VŠKP a systém na odhalování plagiátů“, jehož cílem je vybudování celonárodního registru vysokoškolských kvalifikačních prací. Za koordinaci projektu odpovídá Masarykova univerzita a spolupracuje na něm sedmnáct vysokých škol (Masarykova univerzita, 2007). Komise publikovala metadatové formáty PersCz pro popis fyzických osob, CorpCz pro popis korporací a EVSKP-MS pro popis elektronických vysokoškolských prací. Pro účely databáze a formátu NUŠL bude analyzován pouze formát EVSKP-MS. Autority v databázi NUŠL by měly být prozatím řešeny odkazem na autority z autoritní báze STK. Formát EVSKP-MS vychází z formátu Dublin Core. Na základě změn, které přinesla verze definic termínů DCMI publikovaná v lednu 2008, byl upraven i formát EVSKP-MS. Kromě toho obsahuje formát také vybrané prvky z nejvýznamnějšího mezinárodního standardu ETD-MS, který využívá mezinárodního databáze NDLTD. Při tvorbě formátu byl také brán zřetel na německý národní metadatový standard XmetaDiss a francouzskou normu pro metadata pro elektronické disertace TEF 2.0 (EVSKP-MS, 2008). Popis formátu je na stránkách Odborná komise pro otázky elektronického zpřístupňování VŠKP AKVŠ ČR na adrese http://www.evskp.cz/standardy/evskp/. Zdroje: • EVSKP-MS : metadatový soubor pro elektronické vysokoškolské kvalifikační práce v ČR [online]. Zpracovatelé Eva Bratková, Jan Mach. Verze 1.1. Praha: Odborná komise pro otázky elektronického zpřístupňování VŠKP AKVŠ ČR, 15. července 2008 [2008-09-05]. Dostupný z WWW: . • Horová, Iva. 2008. Aktuální stav zřístupňování vysokoškolských kvalifikačních prací v ČR : výsledky průzkumu z prosince 2007 [online]. Asociace knihoven vysokých škol ČR, Odborná komise pro otázky elektronického zpřístupňování vysokoškolských kvalifikačních prací, [6.3.2008] [cit. 2008-05-27]. Dostupný z WWW: . • Krčál, Martin. 2008. O Komisi : základní informace [online]. Asociace knihoven vysokých škol ČR, Odborná komise e-VŠKP, aktualizováno 14.4.2008 [cit. 2008-05-27]. Dostupný z WWW: . • Masarykova univerzita. 2007. Projekt NR VŠKP a systém na odhalování plagiátů [online]. Brno : Masarykova univerzita, [2007] [cit. 2008-05-27]. Dostupný z WWW: .
-4-
3.2 ASEP ASEP (Automatizovaný systém evidence publikací) obsahuje bibliografické záznamy o výsledcích vědeckého výzkumu v ústavech Akademie věd ČR od roku 1985, v úplnosti od roku 1993. Záznamy jsou vytvářeny on-line prostřednictvím webových formulářů. Záznamy z databáze ASEP se používají také pro zasílání do databáze RIV. ASEP má však širší rozsah. Protože v pokynech pro předávání dat do RIV dochází každoročně k úpravám, je také v databázi ASEP pozměňována struktura záznamů. Změny se týkají především přidávání nových polí a definování jejich obsahu, případně zařazování nových typů dokumentů. Povinnost ohlášení práce má první autor z AV ČR uvedený ve zveřejněné publikaci. Do ASEP jsou povinně hlášeny všechny dokumenty, které podléhají povinnosti hlášení do RIV a další původní vědecké práce pracovníků ústavu, které byly zveřejněny v tištěné nebo elektronické formě a vznikly v rámci pracovního poměru na tomto ústavu. Kromě povinně hlášených dokumentů rozlišuje ASEP dokumenty pro hlášení přípustné a vyloučené. Přípustné je hlásit do ASEP přehledové práce (tzv. Reviews), popularizační a informační články, beletrii, literaturu faktu, práce vypracované na jiných pracovištích (např. v rámci stáže a pod.), souhrny nebo abstrakta přednášek publikované v konferenčních sbornících, disertace. Záznamy o těchto pracích slouží k vytváření přehledů o celkových aktivitách AV ČR, avšak nepředávají se do RIV. Vyloučené z hlášení do ASEP jsou práce dosud nezveřejněné (kromě typu W) a to i v případě, že spadají do předchozích kategorií (např. práce v tisku), dále postery (plakátová sdělení) a práce, které se tematicky nevztahují k činnosti daného ústavu. Formát ASEP je formátem typu MARC s doplněnými vlastními poli. Data jsou uchovávána v systému ARL. Informace k databáze ASEP včetně popisu formátu jsou dostupné na stránkách Akademie věd na internetové adrese http://www.lib.cas.cz/cs/ASEP. Zdroje: Knihovna Akademie věd České republiky. 2007. Evidence publikační činnosti v AV ČR : Manuál [online]. Praha : Knihovna AV ČR, [c2007] [cit. 2008-05-23]. Dostupný z WWW: .
3.3 RIV - Rejstřík informací o výsledcích výzkumu a vývoje RIV (Rejstřík informací o výsledcích výzkumu a vývoje) je jednou z částí informačního systému výzkumu a vývoje (IS VaV), který spravuje Rada pro výzkum a vývoj (RVV). RVV je odborný a poradní orgán vlády České republiky. Registr eviduje a uveřejňuje informace o výsledcích projektů výzkumu a vývoje a výzkumných záměrů podporovaných z veřejných prostředků podle zákona č. 130/2002 Sb., o podpoře výzkumu a vývoje z veřejných prostředků a o změně některých souvisejících zákonů. Údaje do RIV předávají poskytovatelé účelové a institucionální podpory z veřejných prostředků, kterými jsou správci příslušných kapitol státního rozpočtu (ústřední orgány státní správy, Grantová agentura České republiky, Akademie věd České republiky) nebo územní samosprávné celky. Obsah RIV, postup při předání, zařazení, zpracování a poskytování údajů je stanoveno zákonem č. 130/2002 Sb., o podpoře výzkumu a vývoje, nařízením vlády č. 267/2002 Sb., o informačním systému výzkumu a vývoje, zvláštními právními předpisy a provozním řádem IS VaV. RIV navazuje na databázi RIP (Registr informací o publikacích výzkumu a vývoje v rozpočtových a příspěvkových organizacích), která byla provozována Úřadem vlády ČR do roku 1995. RIV obsahuje údaje o výsledcích výzkumu a vývoje uplatněných od roku 1993 (Rada pro výzkum a vývoj, 2008b). -5-
V RIV nejsou jako výsledky sledovány učebnice, skripta, odborné posudky, žádosti o grant, články v denním tisku, populárně naučná literatura, interní výzkumné zprávy, abstrakta a sborníky abstrakt, diplomové práce (Rada pro výzkum a vývoj, 2008a). Do RIV jsou pravidelně každý rok předávána data o nových výsledcích, které vznikly od posledního dodání dat do RIV. Data jsou dodávána ve formátu XML a jsou doplněna průvodkou. XML soubory se předávají dávkově prostřednictvím elektronické pošty, průvodky je možné dodat i v tištěné. Dodaný soubor musí být v kódování CP 1250. Formát pro sběr dat je každoročně kontrolován a podle potřeby měněn a rozšiřován (Rada pro výzkum a vývoj, 2007). Popis formátu je uveřejněn na stránkách Rady pro výzkum a vývoj na adrese http://www.vyzkum.cz/storage/att/7AD4F05CCBA9E4FC005C48CE31494364/riv08_s3.pdf a http://www.vyzkum.cz/storage/att/2CA1E5A95CEB33B96E85F81D35B4CCF1/struktury-xml-2008v2.pdf. Zdroje: • Rada pro výzkum a vývoj. 2007. Předávání údajů do Informačního systému výzkumu a vývoje RIV – Rejstřík informací o výsledcích 2008 [online]. Rada pro výzkum a vývoj, 26. září 2007 [cit. 2008-05-23]. Dostupný z WWW: . • Rada pro výzkum a vývoj. 2008a. Informace pro předávání údajů do "Rejstříku informací o výsledcích" RIV [online]. Rada pro výzkum a vývoj, c2008 [cit. 2008-05-23]. Dostupný z WWW: . • Rada pro výzkum a vývoj. 2008b. Rejstřík informací o výsledcích RIV [online]. Rada pro výzkum a vývoj, c2008 [cit. 2008-05-23]. Dostupný z WWW: .
-6-
4
NÁVRH FORMÁTU NUŠL
4.1 Metadatový záznam NUŠL - nusl:metadata nusl:metadata Označení Jméno URI Povinnost Opakovatelnost Atribut povinný Atribut volitelný Definice Poznámky Příklady
Kořenový prvek pro záznam o zdroji nusl:metadata URI Ano Ne Ano Ne Kořenový prvek metadatového záznamu o zdroji. Všechny ostatní prvky jsou vnořené v tomto prvku. http://nusl.stk.cz/terms/nusl/metadata
4.2 Identifikátor zdroje - dc:identifier dc:identifier Označení Jméno URI Povinnost Opakovatelnost Atribut povinný Atribut volitelný Definice
Poznámky
Příklady
Identifikátor zdroje dc:identifier http://purl.org/dc/terms/identifier Ano Ano
Jednoznačný identifikátor zdroje. Může jít o trvalý identifikátor nebo o označení místa uložení zdroje v elektronické formě, z něhož ji uživatel může získat (například URL). Hodnota povinného atributu typu identifikátoru zahrnuje libovolné schválené schéma "dcterms:URI" (podle seznamu udržovaného organizací IANA, http://www.iana.org/assignments/uri-schemes.html), například "http:", "urn:nbn", "info:" aj. Při zápisu identifikátorů se postupuje podle doporučení DCMI http://dublincore.org/architecturewiki/ResourceIdentifierGuidelines. Identifikátor NUŠL se povinně doplní v záznamech po té, co jsou importovány do NUŠL databáze. V tomto prvku budou ukládány také identifikátory z lokálních záznamů od přispěvovatelů do NUŠL, která umožní propojení z NUŠL do lokální báze. 1. trvalá URL adresa http://www.vse.cz/vskp/eid/5265 2. identifikátor Handle (hdl) mapovaný do http:// http://hdl.handle.net/1721.1/14399 3. a) identifikátor URN:NBN urn:nbn:de:bsz:291-scidok-4956 3. b) identifikátor URN:NBN mapovaný do německé směrovací služby http://nbn-resolving.de/urn:nbn:de:bsz:291-scidok4956
-1-
Identifikátory, které budou importovány ve formátu EVŠKP, a identifikátory typu ISBN, ISSN a DOI budou respektovat schéma "dcterms:URI" a bude možné namapovat je na urn.
4.3 Název – dc:title dc:title Označení Jméno URI Povinnost Opakovatelnost Atribut povinný Atribut volitelný Definice Poznámky
Příklady
Název zdroje dc:title http://purl.org/dc/terms/title Ano Ano xml:lang="[kód jazyka]" nusl:typeTranslated="translated" (nusl:typeTranslated="translated") Hlavní název zdroje. Uvádí se ve znění z její titulní stránky. Pomocí volitelného atributu „nusl:typeTranslated“(„nusl:typeTranslated“) se uvádí varianta hlavního názvu v jiném jazyce. Atribut vskp:typeTranslated="translated"¨(nusl:typeTranslated="translated”) se přiděluje také hlavnímu názvu v cizím jazyce, který uvedl autor v prelimináriích česky psaného dokumentu (souběžný název). 1. Na titulní stránce název pouze v češtině Primární elektronické informační zdroje z oblasti technických a aplikovaných přírodních věd pro vědu a výzkum Primary electronic information sources in the area of technical and applied natural sciences for science and research 2. Na titulní stránce název v češtině a souběžně ve francouzštině Použití souřadnice ”hydrostatický tlak” pro integraci elastického modelu dynamiky atmosféry v numerickém předpovědním systému ARPEGE/ALADIN Utilisation de la coordonnée ”pression hydrostatique” pour l'integration des équations élastiques de la dynamique atmosphérique dans le système de prévision numérique ARPEGE/ALADIN Use of ”hydrostatic pressure” coordinate for integration of dynamic atmosphere elastic model in the numeral prevision system ARPEGE/ALADIN 3. Na titulní stránce anglicky psané práce název pouze v angličtině Dynamics of phase transitions and chemical reevents in semiconductors and semiconductors thin films induced by laser pulse irradiation
POZOR! Při importu z báze ASEP oddělovat podnázev umístěný za tečkou do pole podnázev (dcterms:alternative) Jazyk překladu z pole 541$z v bázi ASEP umístit do atributu xml:lang a upravit kód. Pro import ve formátu RIV zajistit správné převedení kódů jazyků.
4.4 Alternativní název, podnázev zdroje – dcterms:alternative dcterms:alternative Označení Jméno URI Povinnost Opakovatelnost Atribut povinný Atribut volitelný
Podnázev zdroje dcterms:alternative http://purl.org/dc/terms/alternative Ne Ano xml:lang="[kód jazyka]" nusl:typeTranslated="translated" (nusl:typeTranslated="translated")
-2-
Definice
Poznámky
Příklady
nusl:titleType=“volTitle“ nusl:titleType=“ volNumber“ Podnázev zdroje nebo další informace k hlavnímu názvu. Uvádějí se ve znění z titulní stránky. Podnázvů nebo dalších informací k hlavnímu názvu může být více. Pomocí volitelného atributu „nusl:typeTranslated“ („nusl:typeTranslated“) se uvádí varianta podnázvu v cizím jazyce. Atribut nusl:typeTranslated="translated" (nusl:typeTranslated="translated") se přiděluje také podnázvu v cizím jazyce, který uvedl autor v prelimináriích česky psaného dokumentu (souběžný podnázev). Pro názvy části, příp. i pořadové označení, bude využito atributů NUŠL: (volume Title) (volume Number) Thalamus modulátor normální a patologické aktivity mozku Thalamus the modular of normal and pathological activity of brain
4.5 Autor – dc:creator dc:creator Označení Jméno URI Povinnost Opakovatelnost Atribut povinný Atribut volitelný Definice
Poznámky
Příklady
Autor dc:creator http://purl.org/dc/terms/creator Ano Ne
Fyzická osoba, která je primárně odpovědná za vytvoření obsahu dokumentu, tj. Autor vysokoškolské kvalifikační práce, hlavní řešitel projektu, vedocí výzkumného záměru... Korporace, která nese primární autorskou odpovědnost za dílo. Jméno autora se zapisuje dvěma možnými způsoby: 1) ve formě: Příjmení, Křestní jméno. Příjmení je od křestního jména odděleno povinně čárkou a mezerou. Příjmení může zahrnovat více částí, oddělených mezerou, pomlčkou apod. Křestní jméno může být po další mezeře následováno dalšími jmény (například Kolínský, Jiří František). Pokud nelze u určitých typů jmen rozlišit příjmení a křestní jméno, zapisuje se v nestrukturované formě. Doplňující informaci pro jednoznačnější identifikaci autora lze uvést po středníku a mezeře (například rok narození, tituly aj.) 2) ve formě prvku pcz:person vnořeného v prvku dc:creator (specifikace prvků pcz:person je uvedena v dokumentu Metadatový soubor pro popis fyzických osob (PersCZ), viz http://www.evskp.cz/standardy/perscz/ Název korporace je doporučeno uvádět ve tvaru z národní autoritní databáze viz http://sigma.nkp.cz:4505/F/?func=file&file_name=finda&local_base=aut10: 1) ve formě autoritní, pouze název např. Státní technická knihovna 2) ve formě CorpCZ 1.1 Zápis autora ve formě Příjmení, Křestní jméno Šonková, Jitka 2. a) Zápis autora se zdvojeným příjmením a datem narození Beshajová Pelikánová, Ivana; 1971
-3-
2. b) Zápis autora se zdvojeným příjmením a datem narození ve formě prvku pcz:person Ing. Ivana Beshajová Pelikánová 1971 3. a) Zápis nestrukturovaného jména (vietnamské) Nguyen Thi Ngoc Chan 3. b) Zápis nestrukturovaného jména (vietnamské) ve formě prvku pcz:person Nguyen Thi Ngoc Chan 1. 2 Zápis ve formě autoritní , pouze název Státní technická knihovna 2.2 Zápis korporace ve formě prvku ccz. … Vysoká škola ekonomická v Praze 61384399 Praha Fakulta managementu Jindřichův Hradec http://fm.vse.cz/ Knihovna FM VŠE …
Problematiku zápisu údajů o autoritách (osoby, korporace, příp. akce) je nutné dořešit. V úvahu je potřeba vzít argumenty zástupců formátu EVŠKP o důležitosti zachycení údajů o autoritě v okamžiku vzniku práce, předpokládané potřeby formátu NUŠL, možnosti transformace dat z dalších vstupních bází ASEP a RIVa technické možnosti softwaru vybraného pro bází NUŠL. Je možné: a) Zapisovat do prvku dc:creator nebo dc:contributor přímo základní údaje o autoritě b) Zapisovat údaje o autoritě ve formátu CorpCZ a PersCZ (hierarchicky členěný vnořený prvek) c) Odkazovat na autoritu do externí báze Je také potřeba zvážit, zda importovat údaje o roli autora, typu autorské odpovědnosti a autorském podílu, které se vyskytují především v bázi ASEP. Pro další analýzy je podstatné, že tento prvek je v databázi OpenSigle je potlačen je používán pouze v případě, že je obsažen v metadatovém záznamu přispěvovatele. Metadatový formát OpenSigle navrhuje prioritu používání prvku contributor s kvalifikátory jednotlivých rolí.
-4-
4.6 Spoluautor, přispěvatel – dc:contributor dc:contributor Označení Jméno URI Povinnost Opakovatelnost Atribut povinný Atribut volitelný Definice Poznámky
Příklady
Spoluautor, přispěvatel dc:contributor http://purl.org/dc/terms/contributor Ne Ano thesis:role="[advisor|referee]" Fyzická osoba odpovědná za vedení nebo oponování VŠKP, spoluautor dokumentu – fyzická osoba. Označení role se uvádí jako volitelný atribut s hodnotou v anglickém jazyce (vedoucí práce = advisor; oponent = referee, spoluautor), pokud je ve zdrojovém souboru tato hodnota uložena. V případě, že při importu údajů není obsažena žádná role, pak se zápis uvádí bez kvalifikátoru. Jméno vedoucího nebo oponenta se zapisuje dvěma možnými způsoby: 1) ve formě: Příjmení, Křestní jméno. Příjmení je od křestního jména odděleno povinně čárkou a mezerou. Příjmení může zahrnovat více částí, oddělených mezerou, pomlčkou apod. Křestní jméno může být po další mezeře následováno dalšími jmény (například Mareček, Karel Václav). Pokud nelze u určitých typů jmen rozlišit příjmení a křestní jméno, zapisuje se v nestrukturované formě. Doplňující informaci pro jednoznačnější identifikaci osoby lze uvést po středníku a mezeře (například rok narození; identifikátor autoritního záznamu aj.) 2) ve formě prvku pcz:person vnořeného v prvku dc:contributor (specifikace prvků pcz:person je uvedena v dokumentu Metadatové schéma pro popis fyzických osob (PersCZ)) 1. Zápis vedoucího práce ve formě Příjmení, Křestní jméno Kotrba, Vladimír; 1945 2. Zápis oponenta ve formě prvku pcz:person prof. PhDr. Karel Bílek Ph.D. 3. Zápis spoluautora bez uvedení role
Problematiku zápisu údajů o autoritách (osoby, korporace, příp. akce) je nutné dořešit. V úvahu je potřeba vzít argumenty zástupců formátu EVŠKP o důležitosti zachycení údajů o autoritě v okamžiku vzniku práce, předpokládané potřeby formátu NUŠL, možnosti transformace dat z dalších vstupních bází ASEP a RIVa technické možnosti softwaru vybraného pro bází NUŠL.Dalším rozhodujícím prvkem bude rozhodnutí, zda je pro databázi NUŠL udržitelná snaha o vytváření databáze autoritních podob jmen. Z analýz zahraničních systémů spíše vyplývá, že perspektivní a reálné Je možné: d) Zapisovat do prvku dc:creator nebo dc:contributor přímo základní údaje o autoritě e) Zapisovat údaje o autoritě ve formátu CorpCZ a PersCZ (hierarchicky členěný vnořený prvek) f) Odkazovat na autoritu do externí báze Je také potřeba zvážit, zda importovat údaje o roli autora, typu autorské odpovědnosti a autorském podílu, které se vyskytují především v bázi ASEP. Pojetí uvedené v této analýze vychází z formátu pro e-VŠKP. Prvek dc:contributor thesis: role... je převzat do e-VŠKP z německého standardu METADISS / METAPERS. Pojetí prvku neakcentuje možnost uvedení spolupracující instituce. V 1. pol. roku 2009 je nutné rozvážit, zda přijmout řešení vycházející z metadatového formátu OpenSigle, zápis role ve formě kvalifikovaného Dublin Core např. Příjmení, křestní jméno. Toto pojetí umožňuje zápis rolí, který požaduje databáze ASEP, a zároveň možnost zápisu rolí vycházejících z VŠKP.
-5-
4.7 Údaje o konferenci nebo jiné akci – nusl:event Pro příspěvky přednesené na konferenci, články v novinách či časopisech, překlady či sborníky, uspořádané akce, abstrakty z periodik a sborníků a další související akce typu školení, seminář, výstava, kongres apod.
nusl:event (následující prvky jsou v prvku nusl:event vnořeny) Označení Údaje o konferenci nebo akci Jméno nusl:event URI URI Povinnost Ne Opakovatelnost Ne Atribut povinný Atribut volitelný Definice Poznámky
Údaje o konferenci nebo jiné akci, s níž se pojí vznik popisovaného zdroje.
Příklady
Conference on Biochemistry London …
4.7.1
Identifikátor konference nebo jiné akce – dc:identifier
dc:identifier (prvek vnořený v prvku nusl:event) Označení Identifikátor konference nebo akce Jméno dc:identifier URI http://purl.org/dc/terms/identifier Povinnost Ne Opakovatelnost Ne Atribut povinný Atribut volitelný Definice Poznámky
Identifikátor (URL, příp. jiný identifikátor) konference nebo akce
Příklady
http://nusl.stk.cz
Poznámka – nutné ošetřit při definování vlastností prvků metadatového formátu v software pro NUŠL, aby všechny Url adresy, které budou do systému ukládány byly funkčně aktivní. Tento požadavek generuje i nutnost, aby SW obsahoval nástroje, nebo byl přístupný nástorjům pro kontorlu plantnosti URL odkazů.
4.7.2
Název konference nebo jiné akce – dc:title
dc:title (prvek vnořený v prvku nusl:event) Označení Název konference nebo jiné akce Jméno dc:title URI http://purl.org/dc/terms/title Povinnost Ne
-6-
Opakovatelnost Atribut povinný Atribut volitelný Definice Poznámky Příklady
4.7.3
Ne xml:lang="[kód jazyka]" nusl:typeTranslated="translated" Název konference nebo jiné akce Pomocí volitelného atributu „nusl:typeTranslated“ se uvádí varianta názvu konference nebo akce v cizím jazyce. Seminář o ekologickém bydlení Conference on Biochemistry
Místo konání konference nebo jiné akce – nusl:eventPlace
nusl:eventPlace (prvek vnořený v prvku nusl:event) Označení Místo konání konference nebo jiné akce Jméno nusl:eventPlace URI URI Povinnost Ne Opakovatelnost Ano Atribut povinný Atribut volitelný Definice Poznámky
Místo konání konference nebo jiné akce
Příklady
Praha
Při importu z báze ASEP oddělit opakované výskyty (více míst konání), které jsou uloženy v jednom poli a odděleny pomlkou s mezerami.
4.7.4
Stát konání konference nebo jiné akce – nusl:eventState
nusl:eventState (prvek vnořený v prvku nusl:event) Označení Stát konání konference nebo jiné akce Jméno nusl:eventState URI URI Povinnost Ne Opakovatelnost Ne Atribut povinný Atribut volitelný Definice Poznámky
Stát konání konference nebo jiné akce
Příklady
kód RIV??? kód MARC21
ASEP kód země RIV kód země, kódovník na http://www.vyzkum.cz/FrontClanek.aspx?idsekce=1383. Zvážit, zda převzít kódovník (dvojpísmenné kódy) nebo kódovník MARC21 viz http://www.loc.gov/marc/countries/.
4.7.5
Datum konání konference nebo jiné akce – nusl:eventDates
nusl:eventDates (prvek vnořený v prvku nusl:event) Označení Datum nebo rozmezí dat konáná konference nebo jiné akce Jméno nusl:eventDates URI URI Povinnost Ne Opakovatelnost Ne
-7-
Atribut povinný Atribut volitelný Definice
Datum nebo rozmezí dat konáná konference nebo jiné akce, zápis dle normy ISO 8101
Poznámky
Zapisuje se v plném tvaru DD-MM-YYYY, v případě, že je znám pouze rok pak ve tvaru YYYY. Vícedenní akce jsou uvedeny ve tvaru DD-MMYYYY/DD-MM-YYYY.
Příklady
30-09-2008 30-09-2008/03-10-2008 2008 Pozn – dopsat zápis podle normy ISO 8101 – zápis datumu z rozpětí
Pro import: Ve formátu RIV v případě konference, workshopu nebo výstavy s uvedeným prvkem doplnit při importu za pomlčku – “-”.
4.7.6
Typ konference nebo jiné akce – nusl:eventType
nusl:eventType (prvek vnořený v prvku nusl:event) Označení Typ akce Jméno nusl:eventType URI URI Povinnost Ne Opakovatelnost Ne Atribut povinný Atribut volitelný Definice Vyjádření typů psát přirozeným jazykem ne kódy (např místo W napsat workshop). Pokud vstupní data obsahují kódy typů akcí, apk při importu tyto kódy převádět na přirozený jazyk. Poznámky Z hlediska dostupnosti primárních dokumentů není typ akce směrodatným prvkem, navíc je někdy velmi sporné označení typů akcí, které určuje pořadatel akce. Definice workshopu a semináře se může prolínat. Příklady
4.8 Údaje související s vysokoškolskou prací – thesis:degree NUŠL se v části k vysokoškolským pracím bude držet vzoru EVŠKP, resp. mezinárodního formátu EDT-MS: an Interoperability Metadata Standard for Electronic Theses and Dissertations (http://www.ndltd.org/). I v části k vysokoškolským pracím je nutné dořešit zápis údajů o autoritách (vnořené hierarchické úrovně CorpCZ). Prvek thesis:grantor (garant) bude však oproti EVŠKP prvkem opakovatelným pro případ, že z báze ASEP bude importován prvek s polem C30$l Místo obhajoby disertace.
thesis:degree Označení Jméno URI Povinnost Opakovatelnost Atribut povinný Atribut volitelný Definice
Akademický titul nebo vědecko-pedagogická hodnost thesis:degrese http://www.ndltd.org/standards/metadata/current.html#thesis.degree Ne Ne
Údaje o akademickém titulu nebo vědecko-pedagogické hodnosti a instituci, která ho přiděluje.
-8-
Poznámky Příklady
4.8.1
Ph.D. Doktorský Ekonomie/Ekonomické teorie Vysoká škola ekonomická v Praze. Národohospodářská fakulta
Zkratka jména akademického titulu nebo vědecko-pedagogické hodnosti – thesis:name
thesis:name (prvek vnořený v prvku thesis:degree) Označení Zkratka jména akademického titulu nebo vědecko-pedagogické hodnosti Jméno thesis:name URI Povinnost Ne Opakovatelnost Ne Atribut povinný Atribut volitelný Definice Zkratka jména akademického titulu nebo vědecko-pedagogické hodnosti přidělované vysokou školou (například Ph.D., doc., JUDr. Mgr., Ing. aj.). Poznámky Uváděné hodnoty budou přebírány ze stanoveného číselníku a budou v souladu s platným Zákonem o VŠ/1998 (§ 45-47 a 72), popřípadě legislativou platnou v minulosti (pro potřeby retrospektivního zpracování VŠKP). Příklady Ph.D. ...
4.8.2
Typ studijního programu – thesis:level
thesis:level (prvek vnořený v prvku thesis:degree) Označení Typ studijního programu Jméno thesis:level URI Povinnost Ne Opakovatelnost Ne Atribut povinný xml:lang="[kód jazyka]" Atribut volitelný Definice Typ studijního programu, v jehož rámci byla připravena VŠKP (doktorský, magisterský, bakalářský aj.). Poznámky Uváděné hodnoty budou přebírány ze stanoveného číselníku a budou v souladu s platným Zákonem o VŠ č.111/1998 (§ 45-47 a 72), popřípadě legislativou platnou v minulosti (pro potřeby retrospektivního zpracování VŠKP). Typ studijního programu se uvádí v českém jazyce podle číselníku PASP viz http://founder.uiv.cz/katalog/ciselnik.asp. Příklady Doktorský Doctoral ...
-9-
4.8.3
Studijní program a studijní obor – thesis:discipline
thesis:discipline (prvek vnořený v prvku thesis:degree) Označení Studijní program a studijní obor Jméno thesis:discipline URI Povinnost Ne Opakovatelnost Ne Atribut povinný Atribut volitelný xml:lang="[kód jazyka]" Definice Studijní program a studijní obor akreditovaný příslušnou komisí MŠMT, v jejichž rámci byla připravena a obhájena VŠKP. Poznámky Studijní obor se uvádí v českém jazyce podle číselníku AKVO (Studijní obory vysokých škol) na adrese http://founder.uiv.cz/katalog/ciselnik.asp. Seznamy akreditovaných programů a studijních oborů jsou také k dispozici i na WWW serverech jednotlivých škol. Zapisuje se dle modelu: Studijní program/Studijní obor Uváděné hodnoty budou přebírány ze stanoveného číselníku. Příklady Ekonomie/Ekonomické teorie ...
4.8.4
Instituce přidělující titul – thesis:grantor
thesis:grantor (prvek vnořený v prvku thesis:degree) Označení Instituce přidělující titul Jméno thesis:grantor URI Povinnost Ne Opakovatelnost Ano Atribut povinný Atribut volitelný xml:lang="[kód jazyka]" Definice
Poznámky
Příklady
Instituce (škola, ústav apod.) garantující přidělení titulu spojené s vytvořením VŠKP. Pro pole C30$l místo obhajoby disertace z báze ASEP je určeno pole ccz department. Pole se uvádí pouze v případě, že místo obhajoby je odlišné od pracoviště, na němž byla disertace vypracována. Jméno instituce se zapisuje dvěma možnými způsoby: 1) celé jméno se uvádí v prvku "thesis:grantor"; jde-li o podřízenou jednotku, zapisuje se pomocí formalizovaného zápisu: Instituce. Podřízená jednotka 2) v prvku ccz:universityOrInstitution vnořeném v prvku thesis:grantor (specifikace prvku ccz:universityOrInstitution je uvedena v dokumentu Metadatové schéma pro popis korporací (CorpCZ)) Jména institucí se přebírají ze zákona (veřejné vysoké školy) a statutů škol, příp. z obchodního/živnostenského rejstříku. 1. Vysoká škola ekonomická v Praze. Národohospodářská fakulta ... 2.
- 10 -
Vysoká škola ekonomická v Praze Národohospodářská fakulta ...
4.9 Údaje o výsledku, patentu, projektu, výzkumném záměru nebo jiné vědeckovýzkumné práci – nusl:result nusl:result (následující prvky budou v prvku nusl:result vnořeny) Označení Údaje o výsledku, patentu, projektu, výzkumném záměru, normě apod. Jméno nusl:result URI URI Povinnost Ne Opakovatelnost Ne Atribut povinný nusl:resultType=”result|project|plan|patent|standard|other” Atribut volitelný Definice Údaje o výsledku, projektu, výzkumném záměru, patentu, normě, případně jiném vědeckovýzkumném výsledku. Jednotlivé typy budou odlišeny povinným atributem nusl:resultType Poznámky Pro povinný atribut budou hodnoty vybírány z kódovníku typu dokumentu: result – výsledek project – projekt plan – výzkumný záměr patent – patent standard – norma other - jiný Příklady …
4.9.1
Identifikační číslo nebo kód vědeckovýzkumné práce – nusl:resultID
nusl:resultID (prvek vnořený v prvku nusl:result) Označení Identifikační číslo nebo kód vědeckovýzkumné práce Jméno DCidentifier URI URI Povinnost Ne Opakovatelnost Ne Atribut povinný Atribut volitelný Definice Poznámky Příklady
CEZ:AV0Z2065902
- 11 -
4.9.2
Parametry výsledku vědeckovýzkumné práce – nusl:resultParam
nusl:resultParam (prvek vnořený v prvku nusl:result) Označení Parametry výsledku vědeckovýzkumné práce Jméno nusl:resultParam URI URI Povinnost Ne Opakovatelnost Ano Atribut povinný nusl:paramType=”technical|economic“ Atribut volitelný Definice
Technické nebo ekonomické parametry výsledku vědeckovýzkumné práce
Poznámky Příklady
4.9.3
Vlnová délka: 1542 nm, stabilita pro integrační dobu 100 s: 3.10-12 Navržen a realizován pro provoz jako základní národní normál optické frekvence pro Laboratoř primární metrologie ČMI v Praze.
Název vlastníka výsledku vědeckovýzkumné práce – nusl:resultHolder
nusl:resultHolder (prvek vnořený v prvku nusl:result) Označení Název vlastníka výsledku vědeckovýzkumné práce Jméno nusl:resultHolder URI URI Povinnost Ne Opakovatelnost Ne Atribut povinný Atribut volitelný Definice Poznámky
Název vlastníka výsledku vědeckovýzkumné práce
Příklady
Ústav přístrojové techniky Akademie věd ČR
4.9.4
IČO vlastníka výsledku vědeckovýzkumné práce – nusl:resultHolderIco
nusl:resultHolderIco (prvek vnořený v prvku nusl:result) Označení IČO vlastníka výsledku vědeckovýzkumné práce Jméno nusl:resultHolderIco URI URI Povinnost Ne Opakovatelnost Ano Atribut povinný nusl:paramType=”technical|economic“ Atribut volitelný Definice
IČO vlastníka výsledku vědeckovýzkumné práce
- 12 -
Poznámky
Pokud bude pro NUŠL přijat pro zápis korporace formát CorpCZ, pak jeho součástí bude i identifikátor typu IČO Viz příklad - CorpCZ Metadatový soubor pro popis korporací Verze 1.0 . >
Příklady
68081731 61384399 nusl:reultHolder:dc:identifier>
4.9.5
Poskytovatel projektu – nusl:resultGrantGarant
nusl:resultGrantGarant (prvek vnořený v prvku nusl:result) Označení Poskytovatel projektu Jméno nusl:resultGrantGarant URI URI Povinnost Ne Opakovatelnost Ne Atribut povinný Atribut volitelný Definice Poznámky
Poskytovatel projektu Pokud bude pro NUŠl přijat formát zápisu korporací CorpCZ, pak pro zápis korporací vždy používat tyto prvky. Součástí záznamu o primárním dokumentu (např. Závěrečné zprávě, pak bude pouze název, případně identifikátor, který zajistí vazbu mezi záznamem o instituci) Toto rozhodnutí také ovlivní práci s prvkem dc:contributor
Příklady
GA AV ČR
Při importu zajistit sjednocení kódů a slovních vyjádření v poli. Rozpory mohou být v bázi ASEP v obsahu polí C12$b poskytovatel CEP a C12$c poskytovatel ostatní. Obsah pole C12$b se vybírá z rejstříku. Na základě anaylýzy zahraničních systémů ŠL bylo zjištěno, že patenty nejsou součástí těchto systémé a jsou zpřístupňovány jinými informačními kanály než repozitáři šedé literatury. Z tohoto důvodu byla v prosinci 2008 z návrhu metadatového formátu NUŠL odstraněna pole mající přímou vazbu k identifikaci a popisu patentu. Z této analýzy vyplynulo, že jsou shromažďovány údaje o článcích o výzkumu jehož výsledkem byl patent nikoli patenty samé.
4.10 Nakladatel – dc:publisher dc:publisher Označení Jméno URI Povinnost Opakovatelnost Atribut povinný Atribut volitelný Definice
Poznámky
Instituce archivující a nebo zpřístupňující VŠKP dc:publisher http://purl.org/dc/terms/publisher Ne Ano xml:lang="[kód jazyka]" Instituce odpovědná za uložení, trvalou archivaci a nebo zpřístupnění práce v elektronické formě. Může jít o instituci jako celek (např. Státní technická knihovna) nebo o její podřízenou jednotku (Univerzitní knihovna Ostravské univerzity). Zpřístupňující institucí nemusí být instituce (škola), která přidělila akademický titul. Jméno instituce se zapisuje dvěma možnými způsoby:
- 13 -
Příklady
1) celé jméno se uvádí v prvku "dc:publisher" jako text; jde-li o podřízenou jednotku, zapisuje se pomocí formalizovaného zápisu: Instituce. Podřízená jednotka 2) v prvku ccz:universityOrInstitution vnořeném v prvku dc:publisher (specifikace prvku ccz:universityOrInstitution je uvedena v dokumentu Metadatový soubor pro popis korporací (CorpCZ)) V opakovatelných výskytech prvku dc:publisher lze uvést i více institucí. V případě potřeby lze popis instituce uvádět v opakovatelných výskytech v cizích jazycích. 1. Zápis jména instituce textem Národní technická knihovna 2. Zápis jména instituce a podřízené jednotky textem Vysoká škola ekonomická v Praze. Centrum informačních a knihovnických služeb 2. Zápis jména instituce a podřízené jednotky ve formě prvku ccz:universityOrInstitution Akademie múzických umění Hudební fakulta
Pro účely báze NUŠL by měl být dostačující zápis nakladatele textem v prvku dc:publisher. Při importu z báze EVŠKP však bude vhodné zachovat možnost zápisu v hierarchicky vnořených prvcích CorpCZ.
4.11 Datum vydání – dcterms:created Při sestavování této verze metadatového formátu byly ponechány údaje obsahující časová data v podobě, jak je navržena pro e-VŠKP. Časová data související s dokumentem šedé literatury považujeme za významný identifikační prvek a jejich váhu a výskyt budeme schopní otestovat až po prvních testovacích importech dat. dcterms:created Označení Jméno URI Povinnost Opakovatelnost Atribut povinný Atribut volitelný Definice Poznámky
Příklady
Datum vytvoření dcterms:created http://purl.org/dc/terms/created Ne Ne
Datum vytvoření. Je zpravidla uvedeno na titulní straně. Údaj o datu vytvoření se zapisuje podle standardu W3CDTF (ISO 8601) (http://www.w3.org/TR/NOTE-datetime). Uplatněno může být úplné datum vytvoření v modelu RRRR-MM-DD nebo jen rok vytvoření v modelu RRRR. 2008-10-29 2008
4.12 Datum předložení VŠKP– dcterms:dateSubmitted dcterms:dateSubmitted Označení Jméno
Datum odevzdání či podání VŠKP nebo podání patentové přihlášky dcterms:dateSubmitted
- 14 -
URI Povinnost Opakovatelnost Atribut povinný Atribut volitelný Definice
Poznámky
Příklady
http://purl.org/dc/terms/dateSubmitted Ne Ne
Datum odevzdání, provedení (u netextových typů prací) či podání (včetně elektronického) dokumentu (např. závěrečné zprávy projektu, kvalifikační práce) Údaj o datu odevzdání, provedení či podání se zapisuje podle standardu W3CDTF (ISO 8601) (http://www.w3.org/TR/NOTE-datetime). Uplatněno může být úplné datum odevzdání či podání v modelu RRRRMM-DD nebo jen rok odevzdání či podání v modelu RRRR. 2008-10-29 2008
4.13 Datum schválení VŠKP– dcterms:dateAccepted dcterms:dateAccepted Označení Jméno URI Povinnost Opakovatelnost Atribut povinný Atribut volitelný Definice Poznámky
Příklady
Datum obhajoby VŠKP nebo schválení patentu dcterms:dateAccepted http://purl.org/dc/terms/dateAccepted NE Ne
Datum obhajoby VŠKP. Zapisuje se přesné datum obhajoby, které je uvedeno také v protokolu obhajoby. Údaj o datu obhajoby nebo schválení se zapisuje podle standardu W3CDTF (ISO 8601) (http://www.w3.org/TR/NOTE-datetime). Uplatněno může být úplné datum v modelu RRRR-MM-DD nebo jenom rok obhajoby v modelu RRRR. 2008-01-25 2008
4.14 Datum úprav – dcterms:modified dcterms:modified Označení Jméno URI Povinnost Opakovatelnost Atribut povinný Atribut volitelný Definice Poznámky
Příklady
Datum modifikace dcterms:modified http://purl.org/dc/terms/modified Ne Ano
Datum a popř. čas ukončení procesu modifikace zdroje (například v rámci migrace souborů za účelem trvalého uložení práce v digitálním úložišti). Údaj o proběhlé změně souboru se zapisuje podle standardu W3CDTF (ISO 8601) (http://www.w3.org/TR/NOTE-datetime). Je preferováno co nepřesnější datum včetně hodin a minut. 2008-10-29T19:20+01:00 2008-10-29
- 15 -
4.15 Věcný popis – dc:subject, Třídění ze zdrojových bází bude zachováno v prvku dc:subject. V prosinci 2008 bylo zjištěno, že tvůrci OpenSIGLE již nepočítají s dalším implementací předmětových kategorií (předběžná ústní informace). Vzhledem k podobnosti databáze NUŠL s databází Souborného katalogu ČR lze převzít i přístup platný zde, tj. akceptovat v importovaných datech údaje z různých systémů věcného třídění, a indexovat je pro vyhledávání. Pro orientaci v takovém souboru je výhodné ukládat zároveň s významovým prvkem i označení pořádacího systému, ze kterého je převzat. Toto označení by mělo být povinným prvkem, včetně možnosti uložení prvku “noScheme”. Pro orientaci v databázi podle atributu věcného tématu se nabízí využití "word clouds". dc:subject Označení Jméno URI Povinnost Opakovatelnost Atribut povinný Atribut volitelný
Definice
Poznámky
Příklady
Věcný popis dc:subject http://purl.org/dc/terms/subject Ne Ano xml:lang="[kód jazyka]" nusl:typeSubject="[nusl:noScheme|dcterms:LCSH| nusl:typeSubject="[evskp:noScheme|dcterms:LCSH;sigleCat| dcterms:MESH|dcterms:UDC|dcterms:DDC|dcterms:LCC|…]" Téma dokumentu ŠL vyjádřené buď ve formě volně tvořených klíčových slov (jednoslovných i víceslovných, nusl:typeSubject=“nsul:noScheme“), nebo ve formě termínů z některého z řízených předmětových systémů (hesláře, tezauru), popřípadě ve formě třídníků klasifikačních systémů. Jednotlivé termíny (klíčová slova, předmětová hesla, deskriptory, třídníky) budou oddělovány od předchozích pomocí středníku a mezery. V opakovatelném výskytu lze v případě předmětových systémů zapisovat ekvivalenty v cizích jazycích, přednostně v angličtině. Kódy vybraných řízených předmětových systémů užívaných v ČR jsou uvedeny v autorizovaném číselníku NK ČR (http://www.nkp.cz/pages/page.php3?page=fond_kodovnik.htm). Kódy vybraných významných světových pořádacích systémů jsou uvedeny v seznamu termínů DCMI (http://dublincore.org/documents/dcmi-terms/#H4). 1. (volně tvořená klíčová slova) mluvená čeština; morfologie; frekvenční analýza; počítačové zpracování spoken Czech; morphology; frequency analysis; computer processing 2. (řízené předmětové heslo NK ČR z databáze AUT) uživatelská rozhraní user interfaces 3. (třídník Deweyho desetinné klasifikace) 02
4.16 Abstrakt – dcterms:abstract - 16 -
dcterms:abstract Označení Jméno URI Povinnost Opakovatelnost Atribut povinný Atribut volitelný Definice Poznámky Příklady
Abstrakt dcterms:abstrakt http://purl.org/dc/terms/abstract Ne Ano xml:lang="[kód jazyka]" Textový popis, zahrnující detaily vztahující se k pojednávanému tématu. V dalším výskytu se zapisuje text abstraktu v cizím jazyce. V rámci projektu Licence na online přístup do periodik z oblasti biologických a lékařských věd byly s ohledem na průkazný zájem komunikty VaV vyjednány a provozovány přístupy do významných elektornických časopisů z oblasti biomedicíny a příbuzných oborů a to vydavatelů NPG, CP, APS a elektornických knih Elsevier a Wiley. The electronic access to impotant electronic journals and book from biomedicine and related research areas have been agreed and operated in framework of the projekt Online journal for biomedical area. These journals are published by NPG, CP, APS and AAAS publishers and e-books by Elsevier and Wiley.
4.17 Typ – dc:type Práce s tímto prvkem se odvíjí od zpracovávané typologie dokumentů. Tato studie mimo defnování vlastní typologie NUŠL analyzuje i typologie užívané v dalších systémech ŠL. Jednozančně v ní vyplývá poměrně vysoká míra chaosu, která reflektuje situaci, kdy v jendotlivých typologiích jsou míchány dohromady definované položky typologí vycházejích z formálních a obsahových znaků dokumentu. Během analýzy bylo práve z důvodu tohoto chaosu uvažováno i odstranění tohoto prvku z metadatového schématu NUŠL, nakonec však bylo rozhodnuto jej ponechat, neboť má význam pro třídění databáze a je definován i ve standardu DC. Jeho problematičnost si však uvědomujeme. dc:type Označení Jméno URI Povinnost Opakovatelnost Atribut povinný Atribut povinný Atribut volitelný Definice Poznámky
Typ zdroje (obsahové hledisko, forma) dc:type http://purl.org/dc/terms/type Ano Ano xml:lang="[kód jazyka]" nusl:typeType="[TypVSKP|dcterms:DCMIType|NuslTyp]" nebo nusl:typeType… Označení dílčího typu dokumentu. Tento atribut je detailně zpracován ve formátu e-VŠKP. Z tohoto důvodu jsou v popisu této části ponechány příklady z této definice. Pro NUŠL bude primárním prvkem v typu zdroje prvek nusl:typeType. Při importu údajů v e-VŠKP však považujeme za vhodné ponechání prvku ecskp:typeType=”TypVSKP”. Otevírá se možnost vytvření pro data pocházející z databáze ASEP prvek dc:type nový atribut např. “AsepType”. Pomocí povinného atributu evskp:typeType se uvádí typ VŠKP. Atribut evskp:typeType="evskp:TypVSKP" označuje hodnoty ze stanoveného číselníku platného v ČR. Povinně se v tomto prvku uvádějí hodnoty v českém jazyce podle národního číselníku evskp:TypVSKP (např. hodnota „Disertační práce“). Atribut evskp:typeType="dcterms:DCMIType"
- 17 -
Příklady
(http://www.dublincore.org/documents/dcmi-terms/#H7) označuje v nepovinných výskytech prvku dc:type hodnoty z obecné typologie informačních zdrojů iniciativy DCMI, tyto hodnoty se uvádějí pouze anglicky. Hodnota "PhysicalObject" označuje metadatový záznam tištěné kvalifikační práce, u které neexistuje elektronická verze (viz příklad 3). 1. typologie VŠKP podle národního číselníku evskp:TypVSKP Disertační práce Doctoral thesis 2. příklady typologie zdrojů podle DCMI Text Dataset MovingImage InteractiveResource Sound Software Service 3. příklad záznamu tištěné VŠKP bez elektronické verze Disertační práce PhysicalObject
4.18 Formát/nosič – dcterms:medium dcterms:medium Označení Jméno URI Povinnost Opakovatelnost Atribut povinný Atribut volitelný Definice Poznámky
Příklady
Médium (formát souboru) dcterms:medium http://purl.org/dc/terms/medium Ano Ano
Označení datového formátu digitálního souboru hlavní části zdroje (například RTF, PDF, LaTeX, HTML aj.). Hodnoty se zapisují podle mezinárodního autorizovaného číselníku formátů organizace IANA (http://www.iana.org/assignments/mediatypes/). application/msword application/rtf application/pdf text/html application/zip application/x-compressed image/jpeg audio/mpeg audio/mp4
- 18 -
4.19 Jazyk – dc:language dc:language Označení Jméno URI Povinnost Opakovatelnost Atribut povinný Atribut volitelný Definice Poznámky
Příklady
Jazyk zdroje dc:language http://purl.org/dc/terms/language Ano Ano
Jazyk intelektuálního obsahu zdroje. Jazyk se v povinném atributu zapisuje buď pomocí 2- nebo 3- znakového kódu v souladu s mezinárodní normou ISO 639. Kódy jazyků lze převzít ze seznamu, uveřejněném na webu Registrační autority (Kongresová knihovna) (http://www.loc.gov/standards/iso6392/). V dalším výskytu lze zaznamenat i jiný jazyk, v němž jsou napsány významné části práce. cs
4.20 Bibliografická citace – dcterms:bibliographicCitation dcterms:bibliographicCitation Označení Jméno URI Povinnost Opakovatelnost Atribut povinný Atribut volitelný Definice Poznámky Příklady
Bibliografická citace práce dcterms:bibliographicCitation http://purl.org/dc/terms/extentbibliographicCitation Ne Ano Ne Ano Stručný záznam ve formě bibliografické citace. Zapisuje se v souladu s mezinárodním standardem ČSN ISO 690 a ČSN ISO690-2 (s ohledem na české prostředí). KUDRA, František. Integrace finančních trhů. Praha, 2006. 320 s., 30 s. příl. Disertační práce (Ph.D.). Vysoká škola ekonomická. Finanční fakulta
4.21 Autorská práva – dc:rights dc:rights Označení Jméno URI Povinnost Opakovatelnost Atribut povinný Atribut volitelný Definice
Práva k využívání práce dc:rights http://purl.org/dc/terms/rights Ano Ano xml:lang="[kód jazyka]" Textová informace o právech k využívání. Specifikují se podmínky, na základě kterých může být práce distribuována, reprodukována atd.; stanovit lze i dobu, po kterou dané podmínky platí a kontakt na osoby, které se o práva starají. Obsahem prvku může volný text nebo URI adresa na WWW stránky
- 19 -
Poznámky
Příklady
s popisem práv. Obsahem prvku může být přepis licenční smlouvy. Strojově čitelná přístupová práva k jednotlivým souborům jsou řešena v rámci prvků evskp:transfer a dcterms:available. Hodnoty v tomto poli musí být v souladu s licenční dohodou mezi poskytovatelem dat a NUŠL. Pokud by hodnoty v poli měly povahu interní poznámky v rámci dané instituce, pak při importu měnit hodnoty v souladu s licenční smlouvou. Stejně tak pokud bude toto pole ve zdrojové databázi prázdné, pak povinné údaje přiřazovat opět v souladu s licenční smlouvou. 1. Práva k využívání práce jako volný text Text práce může být volně využíván prostřednictvím Internetu podle licence Creative Commons BY SA. 2. Práva k využívání práce popsána na uvedené URL http://www.amu.cz/studium/bakalarske-a-magisterske-prace/licencnismlouva-ve-formatu-pdf-1
4.22 Rozsah (strany, velikost souboru) – dcterms:extent dcterms:extent Označení Jméno URI Povinnost Opakovatelnost Atribut povinný Atribut volitelný Definice Poznámky Příklady
Rozsah práce dcterms:extent http://purl.org/dc/terms/extent Ne Ano
Rozsah nebo velikost práce. V případě potřeby se zapisuje přesný rozsah práce (počet stran, příloh apod.), délka trvání zvukového záznamu aj. 320 s., 30 s. příl. 2:50 hod. 15 MB
4.23 Zpřístupnění souborů – dcterms:available dcterms:available Označení Jméno URI Povinnost Opakovatelnost Atribut povinný Atribut volitelný Definice Poznámky
Zpřístupnění souborů dcterms:available http://purl.org/dc/terms/available Ne Ne
Datum nebo interval, ve kterém mohou být soubory s dílem zpřístupněny veřejnosti. Údaj o zpřístupnění souborů s dílem se zapisuje podle standardu W3CDTF (ISO 8601) (http://www.w3.org/TR/NOTE-datetime). V případě intervalu se dvě data oddělují znakem lomítko /. Pokud je aktuální datum nižší než datum uvedené v tomto prvku nebo pokud aktuální datum není v intervalu uvedeném v tomto prvku, nesmí registr zpřístupnit plné texty ani v případě, že je má k dispozici.
- 20 -
Zpřístupnění souborů díla v primárním (lokálním) registru se může řídit zvláštními pravidly, pro tento registr se toto omezení nevztahuje. 1. Zpřístupnění povoleno od daného data 2007-12-18 2. Zpřístupnění povoleno v daném intervalu 2007-12-18/2010-31-12
Příklady
4.24 Datum uložení metadat do báze NUŠL – nusl:dateDelivered nusl:dateDelivered Označení Jméno URI Povinnost Opakovatelnost Atribut povinný Atribut volitelný Definice Poznámky Příklady
Datum doručení metadatového záznamu do báze NUŠL nusl:dateDelivered URI Ano Ne
Datum doručení metadatového záznamu do báze NUŠL 1. Datum doručení s přesností na den 2008-10-29 2. Datum doručení s přesností na hodinu a minutu 2008-10-29T18:50+01:00
4.25 Datum změny metadatového záznamu – nusl:modified nusl:modified Označení Jméno URI Povinnost Opakovatelnost Atribut povinný Atribut volitelný Definice Poznámky
Příklady
Datum změny záznamu nusl:modified URI Ne Ano
Datum a popř. čas změny metadatového záznamu (například modifikace záznamu katalogizátorem knihovny při importu do knihovního katalogu). Údaj o změně metadatového záznamu se zapisuje podle standardu W3CDTF (ISO 8601) (http://www.w3.org/TR/NOTE-datetime). Je preferováno co nepřesnější datum včetně hodin a minut. 2008-10-17T18:50+01:00 2008-10-17
4.26 Počet souborů, které přísluší k metadatovému záznamu (plný text, obraz…) – nusl:fileNumber nusl:fileNumber Označení Jméno
Počet souborů nusl:fileNumber
- 21 -
URI Povinnost Opakovatelnost Atribut povinný
URI Ne Ne Ne
Atribut volitelný
Ano
Definice
Počet všech dokumentů a příloh tvořících komplení dílo, které metadatový záznam popisuje (hlavní práce, přílohy, posudky apod.). Soubory jsou nepovinně popsány v opakováních prvku nusl:fileProperties.
Poznámky Příklady
2
4.27 Vlastnosti jednotlivých souborů – nusl:properties nusl:Properties Označení Jméno URI Povinnost Opakovatelnost Atribut povinný Atribut volitelný Atribut volitelný Atribut volitelný Atribut volitelný Atribut volitelný Atribut volitelný Atribut volitelný Definice Poznámky
Popis konkrétního souboru NUŠL nusl:fileProperties URI Ne Ano fileID (jednoznačná identifikace prvku nusl:fileProperties, např. Systémové číslo ve zdrojové databázi) fileType=[document|appendix|advisorReview|refereeReview|errata|presentation] fileName (název souboru pro download; povinný při uvedení prvku nusl:transfer) fileDirectory (adresář se souborem v rámci ZIP archivu; povinný při uvedení prvku nusl:transfer s odkazem na ZIP archiv) fileSize (velikost souboru v bytech) format (formát souboru, příp. verze) characterSet (kódová stránka, ve které je soubor uložen) creation (název, příp. verze programu, ve kterém byl soubor vytvořen) Název souboru je uveden jako obsah prvku, upřesňující specifikace souboru je uvedena v nepovinných kvalifikátorech. Počet opakování prvku nusl:fileProperties je roven hodnotě prvku nusl:fileNumber, tj. počtu všech souborů NUŠL. V případě, že je použit prvek nusl:transfer, povinně se v prvku nusl:fileProperties uvádí atribut fileName, který odpovídá názvu souboru v prvku nusl:transfer. V případě, že soubory jsou zabaleny pro přenos v archivu ZIP, uvede se povinně atribut directory (directory=”/”, pokud soubor není v žádném podadresáři archivu).
Příklady
4 Závěrečná zpráva projektu Příloha 1 Tabulky v OpenOffice
- 22 -
creation="PDFlib.3.03(WIN32)" fileDirectory="/posudky/">Hodnocení oponenta Oponentura V. Dvořák
4.28 URL adresa souboru ve zdrojové databázi – nusl:transfer nusl:transfer Označení Jméno URI Povinnost Opakovatelnost Atribut povinný
Atribut volitelný Definice
Poznámky
Identifikátor odkazující na soubor tvořící záznam NUŠL nebo archiv ZIP se soubory obsahujícími záznam NUŠL nusl:transfer URI Ne Ano accessRights="[domain|restrictedAccess|public|shibboleth|eduroam]" (informace o přístupu k souboru: domain=soubor je přístupný pro vyhrazené IP adresy, restrictedAccess=soubor není veřejně přístupný, public=soubor je veřejně přístupný bez omezení, shibboleth=soubor je přístupný pouze po autorizaci protokolem shibboleth, eduroam=soubor je přístupný pouze po autorizaci protokolem eduroam) fileID (viz prvek nusl:fileProperties; uvádí se, pokud se nejedná o odkaz na archiv ZIP s více soubory) Identifikátor URI odkazující na jeden soubor NUŠL s plným textem (prvek nusl:fileNumber=1) nebo archiv souborů komprimovaných formátem ZIP s jedním či více soubory VŠKP (prvek vskpFileNumber>=1). Obsahem prvku je URL adresa souboru pro přenos platná v době zpřístupnění metadatového záznamu. Jednotlivé soubory NUŠL jsou popsány v metadatových prvcích nusl:fileProperties. Prvek nusl:transfer se uvádí pouze tehdy, pokud je možné soubor stáhnout do jiného registru mimo primární (lokální) registr Soubory na uvedené adrese nemusí být přístupné bez omezení všem registrům. Konkrétní práva pro stažení souboru jsou řešena samostatně (např. povolením IP adresy v lokálním registru, BASIC/DIGEST autentizací, HTTPS přenos ...). Přístup veřejnosti k danému souboru na uvedené adrese je specifikován v povinném atributu accessRights, vzdálený registr musí toto omezení respektovat i tehdy, pokud má přístup k plnému textu (např. pro kontrolu plagiátů). Namísto poskytnutí plného textu např. nabízí URL adresu lokálního registru. V případě použití archivu ZIP s jednotlivými soubory NUŠL se v prvku nusl:transfer neuvádí atribut fileID, v prvcích nusl:fileProperties se povinně uvádí atributy fileName a fileDirectory. V případě odkazování na jednotlivé soubory NUŠL se v prvku nusl:transfer povinně uvádí atribut fileID z prvku nusl:fileProperties, v prvcích nusl:fileProperties se povinně uvádí atributy fileName a fileDirectory.
Příklady
1. Dokument NUŠL je tvořen jedním souborem PDF, lze poskytnout plný text
- 23 -
veřejnosti http://www.server.cz/files/soubor.pdf 2. Dokument NUŠL je tvořen více soubory popsanými v prvcích nusl:fileTransfer, přenos v archivu ZIP, přístup k plnému textu veřejností je omezen v lokálním registru IP adresami http://www.server.cz/files/archiv.zip
4.29 Server zpřístupňující dokument(NUŠL/EVŠKP/ASEP/RIV/jiné) – nusl:server nusl:server Označení Jméno URI Povinnost Opakovatelnost Atribut povinný Atribut volitelný Definice Poznámky
Příklady
Název serveru nusl:server URI Ano Ano, ale pouze při výskytu prvku NUŠL + zdrojového serveru. Je nutné aby byl vždy uveden server za který nese odpovědnost producent dokumentu Ano Ne Inofrmace o serveru zpřístupňujícím dokument Obsahem prvku je jedna buď jedna ze zkratek velkých souborných bází dat : nusl – zdrojem záznamu je báze NUŠL vskp – zdrojem záznamu je báze EVŠKP, příp. jednotlivá vysoká škola asep – zdrojem záznamu je báze ASEP riv – zdrojem záznamu je web – zdrojem záznamu je webový formulář NUŠL nebo název instituce, která danou databázi zpřístupňuje. V tomto případě se opět nabízí možnost využití atributů z formátu CorpCZ. nusl riv Státní ústav národního zdraví
4.30 Datum změny záznamu metadatového (nikoli plného textu), včetně data prvního importu – nusl:modified nusl:modified Označení Jméno URI Povinnost Opakovatelnost Atribut povinný Atribut volitelný Definice Poznámky
Datum změny metadatového záznamu NUŠL nusl:modified URI Ano Ano
Datum a popř. čas změny metadatového záznamu NUSĽ Údaj o změně metadatového záznamu se zapisuje podle standardu W3CDTF (ISO 8601) (http://www.w3.org/TR/NOTE-datetime). Je preferováno co
- 24 -
nepřesnější datum včetně hodin a minut. Příklady
2007-12-14T19:20+01:00 2007-12-14
- 25 -
5
Neimportované údaje
Na základě zvážení cílů projektu bylo rozhodnuto, že níže uvedené údaje jsou pro bázi NUŠL nadbytečné a nebudou v bázi NUŠL uchovávány a evidovány. Jedná se o prvky, které se vyskytují v analyzovaných formátech RIV, ASEP, e-VŠKP-MS. Prvky nejsou identifikovány atributy jednotlivých formátů, jedná se o slovní zachycení rozhodování o formátu NUŠL. Předmětem řešení projektu v roce 2009 bude dokončení konverzních tabulek. V těchto tabulkách bude ošetřeno, které údaje budou importovány a do kterých polí metadatového schématu NUŠL.
5.1 Verze, vydání Při sestavování této anylýzy bylo zvažováno, zda v bázi dat NUŠL shromažďovat i verze souborů, tak jak to známe z prostředí VŠKP (před oponenturou, po oponentuře). Pro pilotní verzi bylo rozhodnuto přijímat do NUŠL pouze poslední verze, tedy verze, které jsou konečným obrazen o proběhlém výzkumu a vývoji v dané etapě (průběžné zprávy rozhodně není možné považovat za verze). Indikátorem rozhodnutí byl cílový záměr projektu zprostředkovávvat výsledky V a V., které jsou komunikovány ve formě šedé literatury. Z toho důvodu nebyly přijaty navrhované prvky .
5.2 Místo zpřístupnění/vydání Tento údaj byl v databázi NUŠL zahrnut do prvku nusl:server.
5.3 Země zpřístupnění/vydání Tento údaj byl v databázi NUŠL zahrnut do prvku nusl:server.
5.4 Celkový počet autorů , Počet domácích autorů Údaje o počtu autorů nebudou pro účely báze NUŠL použity. Nebudou importovány.
5.5 Údaje o konferenci nebo jiné akci Pro účely báze NUŠL byl navržen prvek nusl:event s vnořenými prvky dc:identifier, dc:title, nusl:eventPlace, nusl:eventState, nusl:eventDates a nusl:eventType. Záznam akce bude vždy součástí záznamu vlastní práce, rozhodutí, zda bude v NUŠL existovat databáze akcí samostatně je podobné jako rozhodnutí, zda budovat samostanou databázi korporací.
5.6 Obsah práce Prvek Obsah práce nebude pro účely báze NUŠL ukládán.
5.7 Jazyk resumé Údaj o jazyku resumé nebude pro účely báze NUŠL uchováván. Prvek dcterms:abstract obsahuje možnost vložení kódu jazyka abstraktu.
5.8 Údaje o edici - 26 -
Údaje o edici nebudou do báze NUŠL importovány. Vyskytují se v bázích ASEP a RIV, kde je evidována především publikační činnost a šedá literatura pouze okrajově. Předpokládáme, že se údaje o edici u šedé literatury vyskytovat nebudou. Problematika se dotýká otázky pokračujících děl šedé literatury. V pilotní realizaci se s vlastností pokračovacího díla neuvažuje. I pokračující díla, typu výročních zpráv, budou zpracována jako monografie. Toto rozhodnutí platí k datu 31. 12. 2008. Toto rozhodnutí platí s “otazníkem”, je možné, že bude nutné mít nástroje pro zpracování i pokračujících a integrujících zdrojů.
5.9 Poznámka Pro účely báze NUŠL nebudou poznámky ukládány.
5.10 Údaje o zdrojovém dokumentu (kapitola z knihy) Řešitelský tým projektu NUŠL rozhodl, že údaje zdrojovém dokumentu nebudou do báz NUŠL importovány. Vyskytují se v bázích ASEP a RIV, kde je evidována především publikační činnost a šedá literatura pouze okrajově. Předpokládáme, že se údaje o zdrojovém dokumentu u šedé literatury vyskytovat nebudou.
5.11 Administrativní údaje RIV a ASEP Administrativní údaje ASEP a RIV nebudou do báze NUŠL importovány. Původně uvažovaný údaj o důvěrnosti údajů (atribut “duvernost-udaju” u prvků a ., se týká pouze údajů poskytovaných do báze RIV a nikoliv obsahu samotného výsledku. Proto ani tento údaj nebude do báze NUŠL ukládán.
5.12 Údaje o návaznostech RIV Údaje o návaznostech v bázi RIV nebudou do báze NUŠL ukládány. Nebudou importovány ani údaje o typu projektu/programu/zdroje (údaj N01), protože jejich obsahem je pouze kód typu zdroje, v rámci kterého probíhalo financování výsledku. Je možné zvážit, zda ukládat údaj <projekt identifikacni-kod> a (údaj N03), které obsahují identifikační kód projektu nebo záměru, jehož řešením vznikl daný výsledek.
5.13 RIV - informace o dodávce Údaje o dodávce z báze RIV nebudou do báze NUŠL importovány.
5.14 Administrativní údaje EVŠKP Z administrativních prvků EVŠKP bude pro účely báze NUŠL použit pouze prvek datum (interval) zpřístupnění souboru (díla).
- 27 -
6
Shrnutí úkolů pro další řešení
Harmonogram projektu počítá s dořešením následujících úkolů do 30. 6. 2009 Jednotlivé odstavce obsahují okruhy problémů, které jsme vydefinovali k dalšímu řešení. Pořadí odstavců nijak nevyjadřuje prioritu ani hierarchii. •
Analýza formátu OpenSigle, konfrontace s navržených formátem NUŠL, zpracování vyžádaného vyjádření pro CNRS INIST - Institut de l'Information Scientifique et Technique. Formát jsme obdržely v prosinci při osobním jednání řešitelky na konferenci GL10.
•
Definitivní rozhodnutí o tom, zda pro NUŠL budovat autoritní databázi korporací (pravděpodobně ano), akcí (pravděpodobně ne), osob (pravděpodobně ne). Součástí metadatového formátu NUŠL mohou kompletní prvky z MS CorpCZ a PersCZ. Dále je uvažováno i ukládání vazeb na národní autoritní soubor budovaný Národní knihovnou ČR. Navržené řešení musí odpovídat požadavku na nízkou potřebu ruční práce a zároveň dobrou orientaci v databázi…
•
Dopracování konverzní tabulky. K 31. 12. 2008 je zpracována první verze tabulky, která neobsahuje údaje z formátu OpenSigle. Vzhledem k tomu, že řešitelský tým považuje tento formát za klíčový pro rozhodování o definitivním formátu NUSL, není tato tabulka součástí tohoto dokumentu.
•
Finální podoba metadatového formátu NUŠL k 30. 6. 2009 bude použita jako podklad pro parametrizaci software. Tato finální podoba bude zahrnovat i zpracování doporučení pro producenty šedé literatury, které bude součástí finální publikace projektu.
•
Vytvoření workflow sledování změn ve zdrojových databázích a jejich reflektování.
•
Vytvoření validačních schémat XML pro MS NUŠL.
•
Kódovníky a validační soubory pro NUŠL – zásadou je najít vhodné a standardizované, nikoli vytvářet vlastní. Pozn. – kódovník RIV dostupný na adrese: http://www.iach.cz/knav/manual/manual.htm
•
Vytvoření URI pro jednotlivé prvky MS NUŠL, lze řešit ve spolupráci s projektem pro e-VŠKP.
•
Identifikátory – po výběru identifikátorů je třeba konfrontovat s rozhodnutím MS NUŠL. Výběr identifikátorů pro databázi NUŠL je předmětem řešení v roce 2009. Problém charakterizuje i poznámka v dokumentaci – dc:identifier vs. nusl:record:ID.
•
Na základě inspirací MS Europeana doplnit do dokumentu podmínky pro vyhledávání (resjtřík, volné hledání, neindexováno – popisný údaj) viz http://www.europeana.eu/portal/
•
Nutnost definování objektu NUŠL, v dokumentu prozatím uveden termín „dokument NUŠL“, ale při dalším zpracování je nutné pracovat spíše s termínem „objekt NUŠL“ nebo rodina dokumentů. Tato problematika souvisí s problémem pokračujících a integrujících děl ŠL. - 28 -