Digitalizace v ČR a její podchycení v registru digitalizace Helena Dvořáková Národní knihovna ČR
Národní lékařská knihovna, Praha, 22. 5. 2014
Počátky digitalizace v ČR - rukopisy 1995 – NK ČR - Memoria Mundi (Paměť světa, UNESCO) – rukopisy pro CD => od r. 2000 VISK6 – Manuscriptorium „Národní program digitálního zpřístupnění vzácných dokumentů Memoriae Mundi, Series Bohemica“ http://www.manuscriptorium.com - později též staré tisky - zapojení do mezinárodních projektů (Enrich) - nezahrnuto do centrální evidence v RD
Počátky digitalizace v ČR - ostatní 1999 – NK ČR - digitalizace mikrofilmů (staré noviny) => od r. 2000 VISK7 – Kramerius „Národní program mikrofilmování a digitálního zpřístupňování dokumentů ohrožených degradací kyselého papíru“ - převážně noviny a časopisy
- NK ČR + další instituce - kramerius NK + lokální instalace krameria
Rozvoj digitalizace po r. 2007 • Norské fondy (Norway grants) 2007-09 - převážně knihy 19. století (NK ČR, MěK Praha - HISPRA) • digitalizační linka KNAV • digitalizace i mimo VISK7 • Národní digitální knihovna (NDK) 2011–14 (NK ČR + MZK) • Krajské digitalizační projekty
=> potřeba „souborného katalogu” digitalizovaných dokumentů !!!
=> Registr digitalizace jako součást projektu „Evidence digitalizovaných dokumentů, sledování procesu zpracování a vývoj systému pro zpřístupnění“ (VaV MK ČR, 2008-11, KNAV + NK ČR + INCAD s.r.o.) • 2011 – NK ČR přebírá zodpovědnost za RD – smlouva o údržbě s firmou INCAD • Vývoj – vývojová skupina (NK ČR + KNAV + MZK) + firma INCAD • Financování – VISK, účelová dotace MK
Poslání a možnosti využití • Celostátní evidence digitalizovaných dokumentů (co + kdo + stav) • Ochrana před duplicitní digitalizací • Sledování workflow (původní záměr) => Rdflow, součást ČDK
Pro digitalizující instituce : • Koordinace digitalizačních projektů (možnost „rezervace“ titulu)
•
Sdílení výsledků digitalizace (stažení URL, kontakt pro dohodu o replikaci)
Pro koncového uživatele: co je kde k dispozici
Uživatelské rozhraní = vyhledávání http://registrdigitalizace.cz
Administrátorské rozhraní - pro přehled vlastních záznamů - k editaci vlastních záznamů (výmaz, změna stavu)
Přispívání do RD - kdo a kdy? • Kdo digitalizuje tištěný dokument (nutno nejprve „zaevidovat“ instituci) • Při plánované digitalizaci – rezervace titulu • Při spuštění digitalizace (závazný výběr) – později dodání URL + změna stavu • Zpětné nahlášení dřívější digitalizace (včetně URL) => 3 stavy digitalizace:
Přispívání do RD – jak? • MARCXML export z katalogu od výběru záznamů lze zcela automatizovat
• sklízení pomocí OAI-PHM po nastavení setů automatizovaně
• MARCXML export ze SKC nutno doplnit editací záznam v SKC a odeslat
• tabulka excel (-> csv) s vybranými údaji ruční práce na straně přispěvatele i RD Importní program: kontrola na duplicitu, zpráva
Kontrola duplicit a identifikátory Možnost kontroly: • „hlavoručně“ z uživatelského rozhraní • automatizovaně při importu (identifikátory, autor+název+rok)
Identifikátory: • ČČNB = číslo české národní bibliografie (báze ČNB, žádost přes záznam v SKC)
• ISSN a ISBN • lokální identifikátor (001 MARC)
Identifikátory v uživatelském rozhraní -slučování dle identifikátorů
- linkování přes ČČNB/ISSN
- detaily vlastníků a svazků/předloh - link do lokálního katalogu
Podchycená digitalizace 2008-2013 Celkem více než 110.000 záznamů = cca 3000 titulů novin a časopisů + cca 80000 ostatních dokumentů 140000 120000 100000 80000 60000 40000 20000
0 2008
2009
2010
2011
2012
Zapojeno 77 institucí
2013
Obsah RD koncem r. 2013 Podíl přispívajících institucí MZK 24%
ostatní 29%
velké regionální knihovny 7%
podrobněji „ostatní“
Městská knihovna Praha a další MěK 16%
NK ČR 47% Ostatní 34%
Podíl projektů a financování
muzea, galerie, archivy 10%
odborné knihovny (vč. VŠ) 23%
KNAV 44%
Norské fondy NK 13%
Krajské digitalizace 3% VISK7 7%
NDK 43%
Další rozvoj? • zapojení dalších digitalizujících institucí • větší automatizace • lepší zapojení do spolupráce s ostatními systémy v procesu digitalizace • přívětivější www rozhraní
Spolupráce systémů při digitalizaci
URL+metadata (harvest)
metadata
metadata
dg.objekt
URL
URL
stav (webservice) metadata (?)
metadata URL URL (harvest) URL
S čím nejsme spokojeni Nechtěné duplicity • hlášení až v okamžiku hotové digitalizace • nepřítomnost identifikátorů, zejména čČNB Doplňování URL • instalace K4 nejsou připraveny na harvest • nepravidelné doplňování importem / přes SQL dávky
Informace k RD, kontakt Informační stránky: http://www.registrdigitalizace.cz/rdcz/uzivatele/ Dotazy, zasílání xls souborů:
[email protected] [email protected]
Děkuji za pozornost.