České digitalizační projekty, jejich výsledky a agregace
Ing. Martin Lhoták Knihovna AV ČR, v. v. i.
Konference Knihovny současnosti 10. 9. 2015, Olomouc
Obsah Digitalizační projekty Výsledky průzkumu mezi knihovnami Česká digitální knihovna - agregace
Digitalizační projekty
Národní digitální knihovna (IOP)
Krajská digitalizace (IOP)
1 500 svazků / 450 000 stran ročně (data předávána do NK)
VISK 6 Manuscriptorium – rukopisy a staré tisky
60 000 svazků / 11 000 000 stran
VISK 7 – novodobé dokumenty
110 000 svazků / 30 000 000 stran Kramerius 3 v NK 12 200 svazků / 8 700 000 stran
13 750 000 stran
Google books v NK ČR
110 000 svazků / 11 000 000 stran
+ další individuální projekty knihoven např. KNAV, MKP, NLK
Digitalizace - průzkum
Počet digitalizovaných stran novodobých dokumentů Počet kompletně zpracovaných stran novodobých dok. Používaný SW pro digitální knihovnu a jeho verze Zdroje financování Plánované digitalizační projekty a počet stran do roku 2016 Dotaz na používání Registru digitalizace
Stejné dotazy týkající se rukopisů a starých tisků Průzkum probíhal v období červenec – srpen 2015 Odpověď poskytlo 22 knihoven
Počet zdigitalizovaných stran novodobých dokumentů (cca od 1801) Národní knihovna ČR
37 941 254
Moravská zemská knihovna
30 800 000
Knihovna Akademie věd ČR
5 400 000
Vědecká knihovna v Olomouci
1 544 502
Jihočeská vědecká knihovna
1 530 000
Národní lékařská knihovna
1 050 000
Studijní a vědecká knihovna v Hradci Králové
998 000
Městská knihovna v Praze
960 000
Knihovna Vojenského historického ústavu
800 000
SVI Fakulty sociálních věd Univerzity Karlovy
676 308
Moravskoslezská vědecká knihovna v Ostravě
537 706
Knihovna Ústavu pro českou literaturu AV ČR
370 000
Studijní a vědecká knihovna Plzeňského kraje
366 664
Krajská knihovna Františka Bartoše ve Zlíně
344 774
Knihovna Národního filmového archivu
325 000
Severočeská vědecká knihovna v Ústí nad Labem
323 000
Národní technická knihovna
306 328
Muzeum východních Čech v Hradci Králové
300 000
Středočeská vědecká knihovna v Kladně
271 783
Knihovna Divadelního ústavu
190 000
Krajská knihovna Karlovy Vary
179 146
Městská knihovna Česká Třebová
CELKEM
12 000
85 226 465
Počet zdigitalizovaných stran novodobých dokumentů (cca od 1801) včetně metadat
Celkem 81 215 274 stran – rozdíl pouze 4 000 000 stran
Financování – jednotlivé projekty a programy
NDK IOP – 300 000 000 Kč Krajská digitalizace z OP – cca 150 000 000 Kč (odhad) VISK 7 – 3 800 000 Kč v roce 2015 VISK 6 – 8 300 000 Kč v roce 2015 Google Books NK ČR – 4 000 000 Kč ročně + dalších 80% hrazeno Googlem (16 000 000 Kč) PRALIT – 6 850 000 Kč
Plánovaný přírůstek do konce roku 2016
Novodobé dokumenty – 5 636 587 stran – cca 6,5 % nárůst (+ NDK NK) Rukopisy a staré tisky – 12 695 000 stran – cca 60 % nárůst
Hlavní charakteristika Zastřešení českých digitálních knihoven Sklízení metadat Jedno vyhledávání nad všemi digitalizovanými daty
Jedno rozhraní pro doručení plných textů Dynamické nahrávání plných textů Nejedná se pouze o index
Agregátor pro projekt Europeana Výstupy projektu volně dostupné pod licencí GNU GPL
Tři podcíle
- systém pro zpřístupnění digitálních dokumentů
- systém pro sledování digitalizačního workflow
- produkční a archivační systém
http://www.czechdigitallibrary.cz
http://cdk-test.lib.cas.cz/client/index.vm
http://cdk-test.lib.cas.cz/client
Systém pro sledování digitalizačního workflow Vychází z Registru digitalizice CZ Propojení s produkčním systémem ProArc umožní automatizované zaznamenávání jednotlivých digitalizačních kroků Automatická aktualizace dat v Registru digitalizace Provedeny analýzy a návrhy obrazovek Funkční verze plánována na podzim 2015
Produkční a archivační systém Produkce digitálních dokumentů Dodržování standardů NK ČR - kompletní PSP balíček NDK (METS, MODS, MIX, PREMIS, ALTO, Dublin Core) Přebírání dat z externích systémů (Aleph, Registrdigitalizace.cz) Kompatibilita se systémem Kramerius Podpora identifikátorů URN:NBN, UUID Dlouhodobá archivace digitálních dokumentů – LTP (ve vývoji)
Dodržovaní standardů pro LTP - OAIS, ISO Propojení s Archivematicou
Dlouhodobě využíván v KNAV, SVKHK, MKP + ??? Open source založený na Fedora Commons repository
Vytváření popisných metadat
Možnosti exportu
Testovací provoz ČDK v Knihovně AV ČR 25 mil. stran KNAV, NK, MZK, NTK Přesun do Národní knihovny a zahájení ostrého provozu Nutno zajistit finanční zdroje pro stabilní provoz Smluvní ošetření mezi KNAV a NK Smlouvy s knihovnami o spolupráci Poskytnutí metadat, náhledů a OCR textů Zajištění trvalých odkazů
Spolupráce s TEL a Europeanou
Děkuji Martin Lhoták
[email protected] http://www.knav.cz