Registr digitalizace (RD) URL adresa: Kontaktní e-mail:
http://registrdigitalizace.cz/
[email protected]
Registr digitalizace (RD) je společným projektem Národní knihovny ČR, Knihovny Akademie věd ČR a společnosti INCAD. Záměrem projektu je vytvořit národní registr digitalizovaných dokumentů, který by eliminoval duplicitní digitalizaci a umožnil sdílení jejích výsledků. Registr může být také využíván k řízení digitalizačního workflow jednotlivých institucí. Obsah dokumentu: Co RD Nabízí Jak se zapojit Co se hlásí do RD Jak se stát aktivním uživatelem RD Jakým způsobem chci RD využívat Jak posílat data Hlášení za použití tabulky excel Hlášení pomocí exportu MARCxml Automatizované shrabování pomocí protokolu OAI-PMH Informace o systému Další dokumenty Jak hledat v RD (Nápověda) Jak získat číslo ČNB (Návod) Jak vyplnit excelovské tabulky k hlášení digitalizace Dokumenty je stažení: • excelovské tabulky: RD_hlaseni_tabulka.xls, RD_prispevatel.xls
•
texty: rd_registr_digitalizace.pdf, rd_jak_hledat.pdf, rd_jak_vyplnit_tabulku_hlaseni.pdf, rd_jak_ziskat_cCNB.pdf
Co RD nabízí V RD se soustřeďují údaje o dokumentech, které byly zdigitalizovány nebo jejichž digitalizace se plánuje či probíhá. Pasívní uživatel zde může vyhledávat podle různých hledisek (viz Nápověda), Konkrétní dokumenty může hledat z několika důvodů: • Aby zjistil, kde může získat přístup k digitálnímu dokumentu. Pokud je uvedeno URL a nebrání tomu autorský zákon, může si dokument přímo zobrazit, pokud ne, dozví se, kam je třeba se obrátit.
•
•
Aby zjistil, zda dokument již někdo digitalizuje či zdigitalizoval. Toto využije instituce, která zamýšlí konkrétní dokument digitalizovat. Pokud je digitalizace již hotová nebo v plánu, může se díky RD dohodnout s vlastníkem digitálního dokumentu na poskytnutí či výměně dat. Případně aby zjistil, co je v určité digitální knihovně, či které dokumenty digitalizovala která instituce.
Pokud má RD plnit svou hlavní “evidenční” funkci, je třeba, aby se zapojilo hlášením své digitalizace co nejvíce digitalizujících institucí jakožto aktivní uživatelé. Aktivní uživatel musí být zaregistrován a dodržovat níže popsaný způsob spolupráce.
Jak se zapojit Co se hlásí do RD Instituce přispívá do RD, pokud zdigitalizované dokumenty zpřístupňuje, bez ohledu na to, zda jsou přístupné online z webu, nebo vzhledem k omezením daným autorským zákonem pouze na vyhrazených počítačích v prostorách instituce, nebo pouze lokálně offline (např. z CD). Existují tři situace, kdy lze data do RD hlásit • Plánovaná digitalizace = vybráno k digitalizaci = záměr digitalizace (Z) • Pokud ještě digitalizace neprobíhá, ale instituce chce dopředu nahlásit svůj digitalizační plán. Obvykle nejsou k dispozici veškeré údaje k předlohám, hlášení obsahuje základní bibliografické údaje na úrovni titulu. • Digitalizace probíhá = ve zpracování = průběh digitalizace (P) • Instituce je v procesu digitalizace. Záměr digitalizace mohl, ale nemusel být nahlášen. Součástí hlášení jsou základní bibliografické údaje o titulu a údaje o konkrétních přelohách určených k digitalizaci. • Zdigitalizováno = dokončeno = hotová digitalizace (H) • Instituce dokončila digitalizaci. Instituce mohla (ale nemusela) nahlásit před tím záměr nebo probíhající digitalizaci. Součástí hlášení jsou vždy základní bibliografické údaje o titulu a URL na zdigitalizovaný dokument (u seriálu alespoň na úrovni titulu), může být rozpracováno na úroveň logických částí = předloh (s URL na konkrétní část/rok/ročník); není-li URL, hlášení bude obsahovat informaci o uložení na jiném nosiči.
Jak se stát aktivním uživatelem RD Co musím udělat
1. 2. 3. 4.
Rozhodnout se, jakým způsobem chci do RD přispívat - viz níže. Zaregistrovat se, tzn. zaslat tabulku s požadovanými údaji na kontaktní e-mail. Domluvit způsob spolupráce přes kontaktní email, případně rovnou zaslat vzorek dat. Zahájit zasílání dat dle dohody - viz níže.
Instituce, která chce být aktivním uživatelem RD, by při hlášení měla splňovat následující podmínky:
• • • • •
Záznam (z)digitalizovaného dokumentu má identifikátor v lokálním katalogu, který je jedinečný a neměnný (v MARC pole 001); pokud katalog neexistuje, je možno použít jiný lokální identifikátor (pro ochranu před duplicitními importy). Je žádoucí, aby byl záznam v Souborném katalogu ČR. Publikované dokumenty české provenience vydané po roce 1800 by měly mít přiděleno číslo ČNB (pro seriály je povinné, pro ostatní dokumenty žádoucí). Pro seriály je žádoucí ISSN. Povinné je pro VISK 7 v roce 2011 a v případě, že čČNB nelze přidělit. Pokud titul ISSN nemá, je třeba požádat o přidělení Národní agenturu ISSN. Při hlášení menšího rozsahu by mělo být prověřeno, že (z)digitalizované dokumenty v RD opravdu nemají záznam – viz nápověda.
Jakým způsobem chci RD využívat •
• • •
Chci nahlásit dokumenty, které mám ve své digitální knihovně, aniž bych je sám digitalizoval. Dokumenty byly získané replikací, v rámci kooperace; takové dokumenty sice mohla již nahlásit instituce, která je digitalizovala, ale pro uživatele je přidané URL vždy užitečné. Chci nahlásit dokumenty, které jsem zdigitalizoval a mám je ve své digitální knihovně (případně na jiném nosiči) Chci nahlásit záměr digitalizace a po skončení dodat k nahlášeným titulům URL. V případě seriálů URL nejvyšší úrovně, tzv. URL na titul, nepovažuji za nutné dodávat detaily k jednotlivým předlohám, Chci postupně nahlásit záměr digitalizace, průběh digitalizace a dokončenou digitalizaci vlastních dokumentů (nebo pouze průběh a dokončení). Chci mít v systému dokument na úrovni předlohy a jeho logické části (u seriálu).
Jak posílat data Pro dodání dat do RD CZ existují zatím následující možnosti: 1. Vyplnit excelovskou tabulku. Je vhodné pro jednorázové importy dat, při malém množství dokumentů. 2. Vytvořit importní dávku v MARCxml. Je vhodné pro jednorázové i pravidelné importy, při jakémkoliv množství dokumentů (možno zautomatizovat). 3. Nabízet data pro stahování pomocí OAI-MPH. Je vhodné pro průběžné doplňování dat při masové digitalizaci. Do budoucna se plánují možnosti další.
Hlášení za použití tabulky excel Příprava před prvním hlášením:
Stáhněte si zde šablonu tabulky. Uložte ji a přejmenujte podle sigly vaší knihovny. Odeslaná hlášení si ukládejte, protože základ tabulky “z” využijete pro doplnění údajů do RD v průběhu digitalizace či pro doplnění URL při skončené digitalizaci. Popis tabulky: • První list - první strana: Základní údaje k titulu = fialové sloupce se vyplňují pro všechny typy hlášení. Pro nahlášení záměru (z) jsou dostačující. Při jednorázovém hlášení hotové digitalizace (h) je k těmto údajům potřeba přidat URL na zdigitalizovaný dokument na úrovni titulu (zelený sloupec první stránky). Stejné údaje se vyplňují v případě, že knihovna chce dodat pouze informaci o replikovaném digitálním dokumentu (r) - jestliže nemá kramerius 4, z něhož budou tato data v budoucnu sklízena. • První list - druhá strana: Podrobné údaje k rozpisu předloh = hnědé sloupce na druhé stránce se vyplňují, pokud je potřeba pro potřeby workflow evidovat samostatně jednotlivé předlohy/exempláře (roky, svazky, díly). Jsou součástí tabulky pro probíhající digitalizaci (p), kdy je např. potřeba mít číslo zakázky. Pokud byla takto detailně nahlášena probíhající digitalizace, obdobně se nahlásí i digitalizace hotová (h), je-li potřeba doplnit URL (na titul). Podrobné údaje k hotové digitalizaci jsou nepovinné v každém případě. • Druhý list - nápověda pro vyplnění Zpracování hlášení: Šablonu tabulky uložte pod jménem souboru doplněným o označení druhu hlášení (z/p/h) a datum vytvoření tabulky (např. aba001_z_110320.xls). Výsledná odesílaná tabulka musí mít jméno podle uvedené konvence! Toto jméno vyplňte také do prvního řádku tabulky. Dále vyplňte všechny potřebné údaje podle pokynů v komentářích u hlaviček jednotlivých sloupců nebo využijte samostatnou podrobnější nápovědu. Pole, která jsou povinná vždy, jsou označena hvězdičkou, ale pro konkrétní situace jsou povinné i další údaje (čČNB, ISSN, URL na titul). Komentáře k polím najdete přímo v tabulce, podrobnější vysvětlivky v druhém listu tabulky nebo zde v nápovědě. Při editaci tabulky nepoužívejte zalamování ani ALT+ENTER uvnitř jednotlivých polí. Pokud do tabulky vkládáte vyexportovaná data, důkladně zkontrolujte, zda jsou v patřičných sloupcích! Tabulku odešlete na kontaktní adresu
[email protected]. O jejím zpracování budete vyrozuměni emailem. Konvence pro pojmenování souborů: • sigla_druhhlášení_RRMMDD.xls Druh hlášení: • z=záměr digitalizovat
• • •
p=digitalizace probíhá (nebo brzy začne - dodávají se údaje k předlohám) h=hotová digitalizace (zdigitalizováno) r=replikace (dodáváme naše URL, ale nezdigitalizovali jsme) Příklad: aba007_z_110508.xls Použití tabulek pro různé situace: • hlášení záměru digitalizovat (vybráno k digitalizaci, rezervace titulu): • vyplňují se pouze fialové sloupce na první stránce tabulky • tabulka se ukládá a odesílá pod jménem sigla_z_RRMMDD • lze použít i v případě probíhající digitalizace, pokud není potřeba sledovat podrobné údaje o předlohách (částech) • hlášení probíhající digitalizace (dosud není URL, potřebujeme detailní uložení údajů o předlohách pro další práci): • vyplňují se obě stránky tabulky, fialové a hnědé sloupce • tabulka se ukládá a odesílá pod jménem sigla_p_RRMMDD • hlášení hotové digitalizace bez předchozího nahlášení “předloh” jakožto digitalizace probíhající (jediné hlášení na úrovni titulu, nebo předtím nahlášen záměr): • vyplňuje se pouze první stránka tabulky, důležitý je zelený sloupec pro URL (pokud dokument není online dostupný, uvádí se CD, DVD apod.) • tabulka se ukládá a odesílá pod jménem sigla_h_RRMMDD • hlášení hotové digitalizace doplněním dříve zaslaných údajů o předlohách o URL, příp. další údaje k digitalizaci; lze použít též v případě jediného hlášení, pokud např. chceme nahlásit URL na jednotlivé roky/svazky seriálu, konkrétní počty zdigitalizovaných stran ap. • vyplňují se obě stránky tabulky • tabulka se ukládá a odesílá pod jménem sigla_h_RRMMDD • hlášení URL “cizího” digitalizovaného dokumentu z digitální knihovny (dodání URL) • vyplňuje se pouze první stránka tabulky, důležitý je zelený sloupec pro URL • tabulka se ukládá a odesílá pod jménem sigla_r_RRMMDD
Hlášení pomocí importní dávky MARCxml Je určeno knihovnám, které dokážou ze systému exportovat data ve formátu MARCxml s patřičnými úpravami potřebnými pro import do RD. Pro knihovny se systémem Aleph je připraven prototyp skriptu pro hlášení probíhající digitalizace (pracuje s úrovní exempláře). Obdobným, ale jednodušším způsobem je možno vyexportovat data pro hlášení na úrovni titulu. Knihovna, která bude mít zájem přispívat tímto způsobem, dořeší podrobnosti s kontaktními osobami. Po zpracování testovacích vzorků se předpokládá automatizované zpracování. Data v příslušném formátu pod patřičným jménem souboru musí knihovna umístit na ftp server. Konvence pro pojmenování souborů: • sigla_druhhlášení_RRMMDD.xml Druh hlášení: • z=záměr digitalizovat • p=digitalizace probíhá (nebo brzy začne - dodávají se údaje k předlohám)
• •
h=hotová digitalizace (zdigitalizováno) r=replikace (dodáváme naše URL, ale nezdigitalizovali jsme) Příklad: aba007_p_110508.xml (k pojmenování je možno dle dohody přidat další idenfikující informace před datum, soubor se může jmenovat např. aba001_p_dg01_110330.xml)
Automatizované shrabování pomocí protokolu OAI-PMH Knihovna musí mít OAI provider, který dokáže vytvořit požadovaný xml formát, a vytvořit set, který bude obsahovat množinu digitalizovaných či k digitalizaci nachystaných dokumentů. Pravidelné shrabování aktualizovaných záznamů zajistí přidání/doplnění dat do RD. Podrobnosti je nutno dohodnout, využijte kontaktní adresu
[email protected].
Informace o systému Systém je postaven na aplikačním frameworku RIII (J2EE) a data jsou ukládána do relační databáze Oracle. Pro zpřístupnění aktuální informace o stavu digitalizace koncovým uživatelům je použit vyhledávací nástroj Fast. Všechny uživatelské přístupy jsou realizovány prostřednictvím webové aplikace. Při tvorbě systému byl kladen důraz na robustnost a snadnou rozšiřitelnost systému. Řešení navazuje na další systémy využívané v knihovnách – Aleph, Kramerius, Sirius. S plánovaným přechodem na hromadnou digitalizaci s využitím robotických skenerů bude systém rozšířen o automatické sklízení dat a jejich následné zpracování a evidenci. Aktualizace: 30. 5. 2011