Hârtie
− <extent> [4] f. , 464 p.Ornamentată cu iniţiale, frontispicii şi viniete.
−Pe verso paginii de titlu se află stema Ţîrii Româneşti şi versurile politice.
−F. [4] v.: gravura reprezentându-l pe Sf. Ioan Damaschin.
−Legătura din piele brună pe scoarţe din lemn. Coperţile sunt ornamentate prin presare cu fiare la rece. Poarta urme de încuietori metalice.
− <listBibl> −
Za povšimnutí stojí odkazy na obrazová data na rumunském serveru.
10
Cesta z Evropské knihovny TEL do Manuscriptoria k distribuovaně uloženému dokumentu TEL
Výsledek vyhledávání v TEL z pohledu Manuscriptoria
Manuscriptorium
Přechod z TEL do Manuscriptoria: zobrazení popisu dokumentu v Manuscriptoriu
11
Manuscriptorium ve spolupráci se serverem Národní knihovny Rumunska
Studium dokumentu v Manuscriptoriu: obrazy jsou uloženy v rumunském datovém úložišti
Vnitřní prostředí databáze Manuscriptoria Aplikace TEI P5 Během agregace dokumentů do Manuscriptoria počaly vznikat závažné problémy v oblasti popisu rukopisů, resp. starých tisků. Obecně lze rozdělit komunitu zacházející s těmito dokumenty na dvě části: 1. knihovny a jim podobné instituce, které dokumenty vlastní a jejichž úkolem je je zpřístupnit, 2. badatelská veřejnost. Knihovnám je vlastní relativně stručný identifikační popis dokumentu většinou na bázi formátů typu MARC, kdežto badatelská veřejnost popisuje rukopisy za účelem jejich prezentace (TEI description; tady se blíží roli MARC) a edice (přepisu textu) v prostředí TEI (TEI transcription). Původně jsme si kladli za úkol přemostit starší a novou verzi TEI (P4 a P5) a rozpor s MARC řešit paralelním umístěním popisů v příslušném oddíle formátu METS s tím, že pravděpodobně žádný identifikační popis nebude hlavní, což by znamenalo samostatné transformace jak pro indexaci, tak i zobrazení. Z tohoto důvodu byla definována a provedena analýza interoperability MARC21 a TEI P5 s tím, že konkrétní řešení této otázky bude vnitřním řešením Manuscriptoria (tzn. DTD respektující kritickou granularitu obou v oblasti identifikačního popisu). Současně v projektu ENRICH, koordinovaném Národní knihovnou ČR, vznikalo pod vedením Oxford University Computing Services nové DTD pro popis rukopisů na platformě TEI P5. K problematice nového DTD proběhla schůzka ENRICH v Kodani v únoru 2008 a vyjasňování přístupů řešitelských týmů bylo předmětem každé schůzky ENRICH, zejména setkání v Reykjavíku. De facto šlo o dialog řešitelů tohoto výzkumného záměru, AiP Beroun a Oxfordu. Po nelehkých jednáních vzniklo enrich.dtd 12
http://tei.oucs.ox.ac.uk/ENRICH/Deliverables/referenceManual_en.html, které na základě naší analýzy vzalo v úvahu nezbytné identifikační rozšíření. Kromě toho nové enrich.dtd vzalo i v úvahu nezbytnost mapování struktury složeného digitálního dokumentu vč. vazby na binární data. Enrich.dtd bude zveřejněno též na http://enrich.manuscriptorium.com.
Tři hlavní bloky enrich.dtd
Tím se z pohledu interoperability a spolupráce v Manuscriptoriu podstatně snížila úloha METS. Dosažení této shody a zpracování enrich.dtd v TEI P5 je kvalitativně lepším výsledkem, než jakékoli řešení v rámci METS. Váhu mu může v budoucnu dodat i postoj TEI konsorcia. Enrich.dtd se jako takové stane vnitřním formátem Manuscriptoria a bude produkováno též novým M-TOOL On-line a bude s ním pracováno i v Manuscriptoriu pro kandidáty. Protože jde o výraznou vazbu na mezinárodní komunitu, budou veškeré aplikace enrich.dtd široce testovány. Tento převrat v řešení popisu rukopisů umožní zapojení dalších institucí do Manuscriptoria. To má t.č. více než 40 přispěvatelů v ČR a kolem 30 zahraničních institucí v něm má data, resp. projevilo zájem o spolupráci. Zájem přitom neustále roste; aplikace TEI P5 pro zpracování rukopisů tomu výrazně přispěje. TEI P5 bude muset být namapováno i do databáze evidenčních záznamů.
Aplikace QCatalog Off-line aplikace QCatalogue je určená pro vyhledávání duplicitních úseků v TEI dokumentech – viz http://digit.nkp.cz/qcatalogue/qcatalog.zip. Aplikace má návaznost na mss-fulltext.dtd, dle níž se strukturují plné historické texty v Manuscriptoriu. Případné zabudování do interface Manuscriptoria bude předmětem dalšího řešení.
Další práce Spolu s národními knihovnami Rumunska, Polska a Litvy byl podán projekt REDISCOVER do programu Kultura 2000, který by v případě získané podpory umožnil jejich rychlejší integraci do Manuscriptoria. Dále probíhají práce na personalizaci uživatelského prostředí; testuje se tvorba individuálních sbírek.
13
Oblast digitalizace a zpřístupnění novodobých fondů Automatizace vstupních procesů digitalizace Řešení navázalo na aktivity v r. 2007. Pro automatizaci byly využity soubory xls, vytvářené zpočátku manuálně, později generované z knihovního systému ALEPH. Jejich transformací byly vytvářeny předávací protokoly pro dodavatelské firmy a pro evidenci výpůjček. Současně byly v knihovním systému změněny statusy exempláře, které uživatele informovaly o nedostupnosti dokumentu a skutečnosti, že je digitalizován. Další oblastí automatizace bylo vytváření bibliografických předloh pro mikrofilm dle normy ISO 4087, které byly vytvářeny manuálně a nyní jsou transformovány ze záznamu v elektronickém katalogu NK ČR. Bibliografické předlohy pro mikrofilmování a záznamy exportované z katalogu do systému RELIEF jsou využívány pro tvorbu popisných metadat. V procesu přípravy dokumentů pro mikrofilmování a digitalizaci se nyní využívá výpůjční protokol knihovního systému, jehož prostřednictvím se nyní evidují výpůjčky dokumentů, a vytváří se dílčí sbírka, jejímž prostřednictvím se do systému RELIEF exportují informace o jednotlivých dokumentech. Tím se redukuje role hlavního xml souboru a jeho manuální transformace, které byly časově náročnější než stávající postup. Využití výpůjčního protokolu pomáhá při operativnějším vracení digitalizovaných dokumentů do skladiště. Původní systém předávaných dávek se mohl opustit a knihy mohou být vraceny individuálně bez ohledu na příslušnost k dané dávce. To výrazně zjednodušilo a urychlilo proces navracení knih do běžného provozu. Podmínkou využití funkcí knihovního systému bylo rozhodnutí rekatalogizovat veškeré dokumenty, které nemají dosud záznam v elektronickém katalogu, a opatřit všechny svazky čárovými kódy, které se dále v procesu mikrofilmování a digitalizace využívají jako základní jedinečný identifikátor. Vyvinuté procesy byly v průběhu roku ověřovány v praxi
Zveřejnění informací o digitalizovaných dokumentech v katalozích NKC a SKC Systém Kramerius byl vytvořen jako autonomní systém pro zpřístupňování digitalizovaných dokumentů. V případě periodik byly postupně zveřejňovány údaje o titulech, obsažených v Krameriovi, v záznamech elektronického katalogu NK ČR (NKC) a později i v souborném katalogu CASLIN (SKC). Propojení mezi oběma systémy se uskutečňuje prostřednictvím ISSN, což vyžadovalo přidělování tohoto identifikátoru i starším periodickým titulům. Zahájením projektu tzv. Norských fondů, zaměřeného na mikrofilmování a digitalizaci velkého počtu monografií, bylo třeba řešit i předávání informací o digitalizovaných dokumentech do uvedených katalogů. K tomuto účelu byl využit nově vytvářený identifikátor HANDLE, který může propojit oba systémy. Vzhledem k velkému počtu titulů (celkem bude v rámci projektu zpracováno cca 20 tis. svazků), se neuvažuje o manuálním plnění těchto údajů, ale byl navržen a realizován automatizovaný proces přenosu dat mezi systémy. 14
Prostřednictvím protokolu OAI-PMH poskytuje Systém Kramerius odkazy na digitalizované dokumenty pro systém RELIEF III, který je po doplnění dál předává do katalogu NKC a SKC. Do konce roku 2008 bude do NKC a po té i do SKC importováno cca 4000 odkazů na digitalizované dokumenty v Systému Kramerius.
RELIEF III – přestěhování do sídla NK ČR V r. 2008 byl schválen programový projekt VaV Knihovny AV ČR, který řeší další rozvoj systému. V rámci výzkumného záměru se realizovalo přemístění aplikace RELIEF III do Centrálního depozitáře v Hostivaři. Přestěhováním se řešil problém zrychlení odezvy systému. Současně byl zahájen ověřovací provoz rozšířené aplikace a její plnění staršími daty o digitalizovaných dokumentech. Ukázalo se, že původní nástroje pro evidenci procesů mikrofilmování a digitalizace, soubory xls, jejichž obsah bylo třeba importovat do systému, obsahují chyby, které bylo nutné identifikovat a opravit. Současně byly optimalizovány procesy využívající aplikaci RELIEF III.
Role jedinečných identifikátorů Pokrok v oblasti automatizace procesů digitalizace včetně přípravných prací byl umožněn zavedením jedinečných persistentních identifikátorů v Systému Kramerius. Pro jejich tvorbu byl využit mechanismus vytváření UUID (číslo síťové karty a časové razítko), který se transformuje do podoby HANDLE, která je vhodnější pro uživatele. V procesu digitalizace se tvoří identifikátory pro všechny úrovně dokumentu až na úroveň reprezentace. Identifikátory zajišťují trvalý přístup prostřednictvím Internetu ke zveřejněným dokumentům a jejich částem. V současné době se jedná o identifikátory vlastní dané instanci Krameria, ty nejsou využívány mimo ni (není národní resolver). Identifikátory se využívají v procesu výroby a slouží k propojení digitální knihovny a katalogu. Kromě systémových identifikátorů digitálních dokumentů se využívá čárový kód identifikující konkrétní fyzický exemplář, pole 001 identifikující daný záznam v systému ALEPH pro NKC a systémové číslo knihy (SYSNO) identifikující popsané dílo. Pole 001 i SYSNO jsou taktéž pouze identifikátory vlastní dané instanci systému. Pomocí těchto nástrojů lze účinně čelit duplicitám a identifikovat různé druhy chyb v odkazech. Pro kooperaci mezi systémy a na národní úrovni chybí jedinečný persistentní identifikátor, který by mohl sloužit pro identifikaci duplicit mezi systémy, příp. by mohl být využíván pro další operace. V současné době se připravuje využití čísla národní bibliografie (NBN) jako celonárodního jedinečného persistentního identifikátoru. Bez jeho zavedení by bylo budování Národní digitální knihovny velmi obtížné. V procesu digitalizace se používají ještě evidenční identifikační údaje jako čísla zakázek pro části digitalizovaných dokumentů (na bázi elementů PeriodicalVolume, Monograph a MonographUnit), které tvoří součást pojmenování obrazových souborů. Mikrofilmy jsou identifikovány podle svých lokačních údajů: ČAN – číslo archivního negativu, MfD – signatura periodického titulu a MfE signatura monografie na mikrofilmu. Udržování
15
konzistence v systému těchto údajů bylo velmi náročné. Pro jednotlivé evidence sloužily soubory xls, ve kterých docházelo k chybám (překlepy, posunutí řádků apod.) jejichž výsledkem byly chybné odkazy mezi evidenčními údaji a identifikátory. Efektivní udržování konzistence všech evidenčních údajů a identifikátorů je možné pouze pomocí robustnější databáze, kterou disponuje systém RELIEF III, kde lze využít kontrolní mechanizmy.
Kontrola kvality obrazových souborů Tvorba obrazových souborů byla do nedávné doby centralizována na několika pracovištích v knihovnách a u dodavatelských firem. Vzhledem k tomu, že se pro skenování mikrofilmů, příp. hybridní snímkování, se většinou využívají přístroje s automatickým nastavováním skenovacích parametrů, nebylo nutné provádět podrobnější kontrolu a řízení kvality obrazových souborů. Vznikla však nová pracoviště využívající digitální fotoaparáty, u kterých je větší riziko chybných nastavení, pro které je třeba stanovit pravidla kontroly kvality obrazových souborů. Dalším důvodem je koncepce centralizované archivace národního kulturního dědictví v digitální podobě, která předpokládá spolupráci různých institucí při digitalizaci různých zdrojových dokumentů. I v tomto případě bude výhodné využívat společné mechanismy pro kontrolu kvality zdrojových obrazových souborů. V současné době neexistuje universální metoda, která by mohla být využita pro kontrolu kvality obrazových souborů. Pro tuto potřebu byly stanoveny tři základní přístupy: 1. Vytvoření provozních metod pro kontrolu stability zpracování. Bude se jednat o operace prováděné v denním nebo průběžném režimu vyžadující minimální vybavení 2. Metody určené pro diagnostiku chyb 3. Metodu pro automatizovanou průběžnou kontrolu dokumentů určených pro trvalou archivaci Součástí příručky je navržená sada obrazců, které bude možné používat. Obrazce budou snímkovány pro dané nastavení a v případě jeho změny bude nutné snímek obrazce opakovat. Postup měření je popsán v příloze.
Funkcionalita WEB 2.0 V r. 2008 byl vytvořen nový informační portál Systému Kramerius a zpracována studie mapující možnosti využití funkcionality WEB 2.0. Další vývoj je možný dvěma směry, a to buď postupně implementovat vybranou funkcionalitu prostřednictvím portálu do Systému Kramerius nebo pořídit nástroj, který již těmito funkcemi disponuje a který by sloužil např. na úrovni portálu Jednotné informační brány i pro další aplikace. Mohlo by se jednat např. o: § RSS technologii, informace o nově importovaných dokumentech § bookmarkovací služby, vytváření příručních knihoven § podporu sdílení § budování znalostní báze o dokumentech § editace a doplňování metadat
16
Navázně bude ještě zpracována analýza porovnávající různé knihovnické portály pro zpřístupňování zdrojů využívající funkcionalitu WEB 2.0 (Aquabrowser, Primo, Encore atd.). Studie budou využity pro další rozhodování. Systém Kramerius je dokumentová platforma poskytující současně zdrojový dokumentový materiál pro výzkum zejména ve společenských vědách, ale i odborné publikace, které mají charakter příruční literatury. Barierou pro plné využití bez ohledu na místo badatele jsou omezení daná autorským zákonem (ochrana autorského díla 70 let po smrti autora). V důsledku toho mohou knihovny zpřístupnit kopie těchto děl pouze ve svých prostorách. Digitalizace však může být i přes tato omezení přínosem pro badatele. V sídle knihovny mohou získat přístup k těmto digitalizovaným dokumentům, příp. i dalším elektronickým zdrojům podle charakteru licence, v kombinaci s klasickými dokumenty, poskytovanými pouze k prezenčnímu studiu. Pomocí funkcionality WEB 2.0 si mohou uživatelé vytvářet vlastní elektronické příruční knihovny profilované přesně podle vlastní specializace a současně i vlastní knihovny pramenných dokumentů v digitální podobě pro svůj výzkum. Další rozvoj služeb, spojený s novostavbou nebo rekonstrukcí Klementina předpokládá vybudování individuálních studoven, ve kterých by VIP uživatelé mohli mít k dispozici elektronické dokumenty, přístupy do elektronických bází i dlouhodobě rezervované knihy. Takového služby však bývají v zahraničních knihovnách zpoplatňovány.
Migrace CD Rom a DVD médií na datové úložiště Migrace pokračovala v r. 2008 v omezeném rozsahu, což bylo dáno jednak nedostatkem finančních prostředků pro OON a jednak nedostatkem prostoru na datovém úložišti.
Pravidla tvorby popisných metadat V r. 2007 byla optimalizována pravidla pro tvorbu popisných metadat. Tím bylo dosaženo poměrně stabilního stavu a nebylo nutné dále pravidla měnit nebo doplňovat. V následujících letech ale bude nutné počítat s vytvořením pravidel pro popis dle nového standardu (MODS), který se řeší v souvislosti s přechodem Systému Kramerius na Fedoru. Role pravidel bude odlišná od stávajícího standardu založeného na definici jednotlivých druhů dokumentů (DTD). Stávající standard slučoval bibliografický popis, popis logické a fyzické struktury dokumentu a základ technických metadat. Současně představoval i návod pro tvorbu digitálních dokumentů, zejména jejich strukturálního členění na definované úrovně (Periodical-PeriodicalVolume-PeriodicalItem-PeriodicalPage-PageRepresentation, obdobně u monografií). V případě Fedory bude role standardu redukována na popisnou funkci. Fedora umožní akceptovat dokumenty s různou fyzickou strukturou a umožní jejich popis. Základem je formát METS, používající standardy MODS pro popisná metadata, PREMIS a MIX pro administrativní metadata. Cílem je max. automatizovat vytváření metadat. Popisná metadata budou vytvářena konverzí z bibliografických záznamů, ostatní by mněla být generována v procesu digitalizace.
17
C. Návrhová část V r. 2008 budou realizovány následující činnosti:
Historické fondy a) Zabudování enrich.dtd do všech součástí Manuscriptoria, testování aplikací a jejich nasazení do provozu b) pokračování prací na personalizaci uživatelského prostředí (individuální a virtuální kolekce) c) získávání nových přispěvatelů a propagace výsledků, vč. možných školení v zahraničí
Novodobé fondy a) další rozvíjení systému REILEF III (Registr digitalizace CZ) a optimalizace pro hromadný provoz. Systém bude třeba propojit s externím editorem metadat. Dále budou identifikovány a odstraňovány chyby zavlečené z původních xls souborů a z katalogu b) v procesu digitalizace bude implementován jedinečný perzistentní identifikátor c) dopracování příručky pro vyhodnocování kvality obrazových souborů a navržení funkčního modelu programového nástroje pro automatizovanou kontrolu kvalitativních parametrů d) v případě funkcionality WEB 2.0 bude navržen další postup (implementace knihovního nástroje, nebo postupná aplikace navržených funkcí v rámci informačního portálu Systému Kramerius) e) Migrace CD-R a DVD médií na datové úložiště f) Optimalizace způsobu archivace digitalizovaných dokumentů.
Řešitelský tým V souvislosti s odchodem Aleše Dostála z Národní knihovny ČR a v souvislosti se změnami priorit v řešení navrhujeme posílit oblast integrace zdrojů do digitální knihovny Manuscriptorium. Vzhledem k tomu také navrhujeme vyřadit z týmu Miloše Dostála, neboť na práci jím vykonávanou bude kladen menší důraz. Do týmu naopak navrhujeme přijmout tyto dva pracovníky oddělení rukopisů a starých tisků Národní knihovny ČR: Tomáš Klimek, nar. 1979, studoval historii (Mgr., pokračuje PhD.); již pracoval na projektech (zejména ENRICH a dále na přípravě nově podaných projektů EU, jako jsou ANCHISAE, REDISCOVER, resp. SLAVO); bude se věnovat zejména agregaci dat partnerů do Manuscriptoria; účast v týmu 60% pracovního úvazku.
18
Zuzana Kulová, nar. 1977, vystudovala latinu, historii a pomocné vědy historické (Mgr.); již pracovala na projektech (zejména ENRICH a dále na přípravě nově podaných projektů EU, jako jsou ANCHISAE, REDISCOVER, resp. SLAVO); bude se věnovat zejména agregaci dat partnerů do Manuscriptoria; účast v týmu 40% pracovního úvazku.
19
E. Stručné résumé V návaznosti na projekt EU ENRICH - http://enrich.manuscriptorium.com - a ve spolupráci s ním došlo k zásadnímu obratu v aplikaci TEI P5 pro popis rukopisu. Vznikl nový komplexní standard, jehož mezinárodní dosah je nesmírný. Tento standard, pojmenovaný enrich.dtd se stává vnitřním standardem Manuscriptoria se všemi důsledky jak ve zpracování dat ze strany přispěvatele, tak i pro zpracování dat pro uživatele. Tím dochází k nebývalému mezinárodnímu posílení Manuscriptoria jako agregátora dat dalších digitálních knihoven nebo primárního prostředí pro ty, kteří digitálním knihovnami nedisponují, přestože mají digitální data. Tento standard musí zapracovat všechny produkty Manuscriptoria: M-TOOL On-Line, Manuscriptorium pro kandidáty - http://candidates.manuscriptorium.com - testovací klon Manuscriptoria - http://enrichdata.manuscriptorium.com - zároveň vyhovuje svou granularitou v identifikační oblasti záznamům typu MARC. V oblasti digitalizace novodobých dokumentů probíhaly především práce na optimalizaci procesu pořizování dat. Obě digitální knihovny jsou napojeny na Evropskou knihovnu TEL a probíhá i dialog ohledně zpřístupnění vybraných dat v portálu Europeana.
20
F. Přílohy 1. Analýza MARC21 vs. TEI P5 2. M-TOOL On-line - rozvaha 3. Posouzení kvality a použitelnosti digitálních dat 4. Kontrola kvality obrazových souborů v procesu digitalizace 5. Web 2.0 a jeho dopad na digitální knihovny 6. Optimalizace agend v systému RELIEF III 7. Kopie publikací navržených jako výsledky do RIV: nelze zveřejnit on-line 8. Cestovní zprávy 9. Software - Qkatalog
Kromě finančních údajů a publikovaných článků vše přístupno též na adrese http://digit.nkp.cz/projekty/CurrentProjects_cz.htm – odkaz výzkumný záměr Vytvoření virtuálního badatelského prostředí pro zpřístupnění a ochranu digitálních dokumentů, Zpráva za rok 2008
21