KNIŽNÍ SKENOVÁNÍ
Z papíru na web a ke čtenáři. Digitalizace regionální literatury v Moravskoslezském kraji.
Praha 16.05. 2013
Prezentace projektu Digitalizace knihovního fondu Moravskoslezského kraje
Reg.č.: CZ.1.06/2.1.00/08.07383
Tento projekt je spolufinancován z prostředků Evropské unie, Evropského fondu pro regionální rozvoj prostřednictvím Integrovaného operačního programu
Představení projektu Moravskoslezského kraje, realizační období 1.10.12 – 30.9.13 KNIŽNÍ SKENOVÁNÍ
Zadávací dokumentace Veřejná zakázka na služby „Digitalizace knihovního fondu“ zadávaná v otevřeném řízení podle § 27 a násl. zákona v rámci projektu reg. č. CZ.1.06/2.1.00/08.07383 spolufinancovaného z prostředků Evropské unie, Evropského fondu pro regionální rozvoj, prostřednictvím Integrovaného operačního programu
ZADAVATEL: Moravskoslezský kraj Sídlem 28. října 117, Ostrava – Moravská Ostrava, PSČ 702 18
IČ: 70890692
Klasifikace: •
Kód CPV: 79999100-4, název – Skenování
•
Kód CPV: 72310000-1, název – Zpracování dat
•
Kód CPV: 72311100-9, název – Konverze dat
Tento projekt je spolufinancován z prostředků Evropské unie, Evropského fondu pro regionální rozvoj prostřednictvím Integrovaného operačního programu
2
Představení projektu Moravskoslezského kraje, realizační období 1.10.12 – 30.9.13 KNIŽNÍ SKENOVÁNÍ
Zúčastněné paměťové instituce Knihovny • Moravskoslezská vědecká knihovna v Ostravě (Ing. Lea Prchalová, Mgr. Monika Oravová, Mgr. Aleš Drahotušský)
Muzea •
Muzeum v Bruntále (Mgr. Hana Garncarzová, Jana Nováková)
•
Muzeum Novojičínska (PhDr. Sylva Dvořáčková, Irena Jašíková)
•
Muzeum Těšínska (PaedDr. Zbyšek Ondřeka, Mgr. Helena Macurová)
•
Muzeum Beskyd Frýdek-Místek (PhDr. Zuzana Břízová, Radmila Matěnová)
•
Slezské zemské muzeum (Mgr. Antonín Šimčík, Mgr. Jitka Štěrbová)
•
Ostravské muzeum (RNDr. Jiřina Kábrtová, Mgr. Jitka Šmehlíková)
Archivy •
Archiv města Ostravy (PhDr. Blažena Przybylová, Mgr. Jozef Šerka)
Externí doplnění fondů • Moravská zemská knihovna Brno • Moravský zemský archiv Brno • Vědecká knihovna v Olomouci
Tento projekt je spolufinancován z prostředků Evropské unie, Evropského fondu pro regionální rozvoj prostřednictvím Integrovaného operačního programu
3
Odborný garant - Moravskoslezská vědecká knihovna v Ostravě, příspěvková organizace KNIŽNÍ SKENOVÁNÍ
MSVK • je krajskou knihovnou •
byla založena v roce 1951
•
její roční návštěvnost činí téměř 170 000 osob a virtuální návštěvnost téměř 500 000 osob
•
vlastní více než 1,1 mil. knihovních jednotek, poskytuje cca 540 000 výpůjček ročně
•
realizuje celoživotní vzdělávání knihovníků e-learningem i klasickými kurzy a semináři
•
systematicky retrospektivně stopuje regionální literaturu s vazbou na Moravskoslezský kraj a vytváří bibliografické databáze
•
od roku 2005 buduje Digitální knihovnu Moravskoslezského kraje, kde jsou kromě fondů MSVK i dokumenty z dalších paměťových institucí kraje (knihovny, archivy, muzea)
Tento projekt je spolufinancován z prostředků Evropské unie, Evropského fondu pro regionální rozvoj prostřednictvím Integrovaného operačního programu
4
Představení projektu Moravskoslezského kraje; realizační období 1.10.12 – 30.9.13 KNIŽNÍ SKENOVÁNÍ
Cíle projektu •
•
digitalizace 306 000 stran knihovního fondu paměťových institucí MSK •
příprava dokumentů k digitalizaci (kontrola úplnosti, sepsání chybějících a poškozených částí dokumentu, sepsání anotace, základní očištění dokumentu)
•
skenování dokumentů v RGB (standard: TIFF, 300DPI nebo vyšší )
•
úprava obrazových souborů (ořez vně okraje dokumentu, vyrovnání řádků textu, potlačení pozadí a průtisků, vymazání stínů, korekce zakřivení stran)
•
konverze obrazových souborů TIFF -> JPEG2000 archivní a zpřístupňující (LTP, Kramerius 4)
•
vytěžení textové informace pomocí OCR do formátu ALTO XML a TXT
•
doplnění katalogizačních údajů (tiskař, rozměry, anotace, DTD, vnitřní části, chyby paginace aj.)
•
vybrané tituly seriálů zpracovat též na analytické úrovni (vnitřní části)
poskytnutí veškerých souvisejících služeb, činností a plnění •
zajištění dopravy, skladování (6 svozů)
•
kompletace dodávky PSP (balíčků) na DVD nebo HD nosičích
•
zajištění publicity a účasti na reprezentativních domácích výstavách či konferencích,
Tento projekt je spolufinancován z prostředků Evropské unie, Evropského fondu pro regionální rozvoj prostřednictvím Integrovaného operačního programu
5
Dodavatelská struktura projektu KNIŽNÍ SKENOVÁNÍ
Objednatel: Objednatel: Moravskoslezský kraj Moravskoslezský kraj
Odborný garant: Moravskoslezská vědecká knihovna
Archivní instituce Dodavatel:
Konica Minolta Business Solutions Czech, spol. s r.o.
Zhotovitel: scanservice a.s.
Tento projekt je spolufinancován z prostředků Evropské unie, Evropského fondu pro regionální rozvoj prostřednictvím Integrovaného operačního programu
6
Bibliografické požadavky na zhotovitele KNIŽNÍ SKENOVÁNÍ Popis M /P – požadavky na kontrolu / doplnění => de facto REKATALOGIZACE: 1.
Identifikátory (dle aktuálních požadavků systémů Kramerius, registru digitalizace (RD) apod.)
2.
Autor - v případě, že kniha je tvořena příspěvky více autorů, uvést všechny autory (rozpor s RD ;)
3.
Role autora - např. autor, překladatel, ilustrátor, ...
4.
Název, příp. podnázev, souběžný název
5.
Druh dokumentu
6.
Vydavatelské údaje – vydavatel, místo a datum vydání, Tiskařské údaje – tiskař, místo a datum tisku
7.
Fyzický popis - rozměry, počet stran, technika, materiál (Aleph obvykle neobsahuje nebo neúplné)
8.
Jazyk - např. cze, ger
9.
Klíčové slovo - používat hesla MSVK, předmětová hesla dle Národní knihovny ČR či klíčová slova z katalogizačního záznamu instituce vlastnící dokument (max. 10 klíčových slov)
10. MDT - pokud ho lze dohledat v katalogu instituce, které patří dokument, nebo v Souborném katalogu ČR 11. Edice 12. Anotace - stručný popis obsahu knihy, poznámka - zajímavé informace o knize (např. fotografie) 13. Signatura, sigla MSVK 14. Dostupnost (vlastník dokumentu, možnost prezenční/absenční výpůjčky) 15. Stav z hlediska ochrany fondu (např. chybějící strany, nekvalitní předloha)
Tento projekt je spolufinancován z prostředků Evropské unie, Evropského fondu pro regionální rozvoj prostřednictvím Integrovaného operačního programu
7
Datová struktura - přehled KNIŽNÍ SKENOVÁNÍ Kalkulovaný počet stran
306 000
Počet svazků monografií
210
Počet svazků periodik
649
Průměrná skenovací rychlost
240 stran / hod
Písmo Gotika : Latinka
70 % gotika, 30 % latinka
Ruční zpracování gotického OCR
5 – 28 min /stránku (cca 11 000 znaků A3+)
Hranice pro manuální zpracování:
od 10 % gotika od 5 % latinka
Obvyklý poměr automat / operátor
Monografie cca 20:1 (pět ze sta) Periodika cca 5:1 (20 ze sta)
(častý a nepředpokládaný mix)
Tento projekt je spolufinancován z prostředků Evropské unie, Evropského fondu pro regionální rozvoj prostřednictvím Integrovaného operačního programu
8
Datová struktura – ukázka seznamu digitalizovaných děl - periodika
KNIŽNÍ SKENOVÁNÍ
Tento projekt je spolufinancován z prostředků Evropské unie, Evropského fondu pro regionální rozvoj prostřednictvím Integrovaného operačního programu
9
Datová struktura – ukázka seznamu digitalizovaných děl - monografie
KNIŽNÍ SKENOVÁNÍ
Tento projekt je spolufinancován z prostředků Evropské unie, Evropského fondu pro regionální rozvoj prostřednictvím Integrovaného operačního programu
10
Zabezpečení skladu a pracovišť
o
KNIŽNÍ SKENOVÁNÍ
Kamerový systém Řízené povolení vstupu Karty - vstupní dveře • • • •
budovy chodby jednotlivá burreau sklady
Tento projekt je spolufinancován z prostředků Evropské unie, Evropského fondu pro regionální rozvoj prostřednictvím Integrovaného operačního programu
11
Knižní skenery 4DigitalBook použité v projektu MSK
KNIŽNÍ SKENOVÁNÍ
MINI-DL-i & Scan2Page
2x A3
2 x A2+
Tento projekt je spolufinancován z prostředků Evropské unie, Evropského fondu pro regionální rozvoj prostřednictvím Integrovaného operačního programu
12
Knižní skenery 4DigitalBook použité v projektu MSK
KNIŽNÍ SKENOVÁNÍ
Kniha založená v knižní kolébce •
mapy a volné nadrozměrné přílohy se skenují na průtahovém skeneru A0
přílohy
Tento projekt je spolufinancován z prostředků Evropské unie, Evropského fondu pro regionální rozvoj prostřednictvím Integrovaného operačního programu
13
Knižní skenery 4DigitalBook použité v projektu MSK
KNIŽNÍ SKENOVÁNÍ
Skenery řídí SW CopiNet + HMI
Tento projekt je spolufinancován z prostředků Evropské unie, Evropského fondu pro regionální rozvoj prostřednictvím Integrovaného operačního programu
14
Řešení Scan4Book KNIŽNÍ SKENOVÁNÍ Vlastní vývoj zhotovitele scanservice a.s. Procesy pro digitalizaci monografií a periodik dle NDK 2012
Založení zakázky
Pořízení obrazů
PT
•Safebook •Zakázka = monografie nebo svazek periodik = čárový kód •Protokoly •Logování operací
•Skenování pomocí aplikace pro obsluhu robotického knižního skeneru CopiNet+HMI. •Vložení naskenovaných obrazů do zakázky, přiřazení profilů s metadaty pomocí aplikace ScanPortal.
•ScanBus •Návrh a manuální korekce úprav obrazů •Ořez, vyrovnání textu, snížení průsvitu
OCR
MDE PSP
•ScanBus + Abbyy SDK •Rozpoznání latinkou psaného textu •Tvorba ALTO XML, TXT •Výpočet úspěšnosti rozpoznání pro každou stránku
•Safebook MDE: paginace, určení typu stran, rekatalogizace •Rozdělení svazku na intelektuální entity •Přesun stran •Smazání stran •Začlenění obrázků po importu, sloučení •Kontroly •Doplnění popisných metadat •Safebook •Získání URN:NBN z Resolveru •Kompletace PSP dle NDK 2012 •Verifikace validátorem
Tento projekt je spolufinancován z prostředků Evropské unie, Evropského fondu pro regionální rozvoj prostřednictvím Integrovaného operačního programu
15
Řešení Scan4Book KNIŽNÍ SKENOVÁNÍ Moderní windows aplikace umožňující uživateli přehledné a efektivní vkládání naskenovaných obrazů do zakázky a případně i opravu již vložených obrazů. Hlavní charakteristika řešení: • Drag & Drop • Barevné rozlišení stavu • Možnost volby PT a MDE • Volba profilu skeneru ke každému skenu • Operace probíhají na serveru • Využití čárových kódů • Další implementace řešení v rámci projektu Technologického centra Ústeckého kraje – jeho Krajské digitalizační jednotky
Tento projekt je spolufinancován z prostředků Evropské unie, Evropského fondu pro regionální rozvoj prostřednictvím Integrovaného operačního programu
16
Řešení Scan4Book KNIŽNÍ SKENOVÁNÍ
Tento projekt je spolufinancován z prostředků Evropské unie, Evropského fondu pro regionální rozvoj prostřednictvím Integrovaného operačního programu
17
Řešení Scan4Book MetaEditor přizpůsobený požadavkům MSK KNIŽNÍ SKENOVÁNÍ
Tento projekt je spolufinancován z prostředků Evropské unie, Evropského fondu pro regionální rozvoj prostřednictvím Integrovaného operačního programu
18
Přehled svazků (knihovny, archivy) KNIŽNÍ SKENOVÁNÍ Hmotnost a velikost svazků • obvyklé podmínky pro skenování: do 10 cm výšky hřbetu a 10 kg
R E A L I T A
Tento projekt je spolufinancován z prostředků Evropské unie, Evropského fondu pro regionální rozvoj prostřednictvím Integrovaného operačního programu
19
Příprava projektu: 2 - 3 roky KNIŽNÍ SKENOVÁNÍ Co předchází výběru svazků pro digitalizaci • vyhledání zdrojů v katalozích i fyzicky • zjištění stavu a úplnosti knihovních, archivních a sbírkových fondů • akviziční činnost pro kompletaci sbírek • doplnění identifikátorů (ččnb, kde lze) prostřednictvím NK • předání dat Registru digitalizace, příznak připravenosti • vyjednání zápůjček od archivních institucí MSK • vyjednání zápůjček od mimoregionálních institucí • fyzická příprava vybraných děl k určeným datům na místa svozu
Tento projekt je spolufinancován z prostředků Evropské unie, Evropského fondu pro regionální rozvoj prostřednictvím Integrovaného operačního programu
20
Ukázky svazků (knihovny, archivy) KNIŽNÍ SKENOVÁNÍ
Tento projekt je spolufinancován z prostředků Evropské unie, Evropského fondu pro regionální rozvoj prostřednictvím Integrovaného operačního programu
21
Přehled svazků (knihovny, archivy) KNIŽNÍ SKENOVÁNÍ
Tento projekt je spolufinancován z prostředků Evropské unie, Evropského fondu pro regionální rozvoj prostřednictvím Integrovaného operačního programu
22
Přehled svazků (knihovny, archivy) KNIŽNÍ SKENOVÁNÍ Svazek periodika s přílohou snadno opomenutelnou při robotickém skenování
Tento projekt je spolufinancován z prostředků Evropské unie, Evropského fondu pro regionální rozvoj prostřednictvím Integrovaného operačního programu
23
Přehled svazků (knihovny, archivy) KNIŽNÍ SKENOVÁNÍ Svazky periodik: a. se všitou reklamou b. se dvěma deníky a občasnými přílohami
a) reklama na šicí stroje (neřezáno)
b) dvojí nepravidelně se střídající ččnb
Tento projekt je spolufinancován z prostředků Evropské unie, Evropského fondu pro regionální rozvoj prostřednictvím Integrovaného operačního programu
24
Přehled svazků (knihovny, archivy) KNIŽNÍ SKENOVÁNÍ Vzhled některých stránek… Tmavé oblasti na okrajích - průhledná páska Tento projekt je spolufinancován z prostředků Evropské unie, Evropského fondu pro regionální rozvoj prostřednictvím Integrovaného operačního programu
25
Přehled svazků (knihovny, archivy) KNIŽNÍ SKENOVÁNÍ Není
Palcát jako Palcát aneb změna formátu během roku…
Tento projekt je spolufinancován z prostředků Evropské unie, Evropského fondu pro regionální rozvoj prostřednictvím Integrovaného operačního programu
26
Přehled svazků (knihovny, archivy) KNIŽNÍ SKENOVÁNÍ Monografie má smysl skenovat v barvě; (u periodik jde spíše o nejasné autoritativní kompetence…)
Tento projekt je spolufinancován z prostředků Evropské unie, Evropského fondu pro regionální rozvoj prostřednictvím Integrovaného operačního programu
27
Předpokládaná dostupnost svazků v systémech Kramerius 4
KNIŽNÍ SKENOVÁNÍ
Výsledky projektu budou zpřístupněny ve formě technologií známých pod souhrnným označením Kramerius 4 v průběhu prvního pololetí 2014 v rámci Koncepce rozvoje VKIS v Moravskoslezském kraji na léta 2013-2016 • volná díla bez omezení • díla chráněná budou k dispozici v interních prostorách knihovny a studovnách zúčastněných institucí, z nichž většina modernizuje počítačové vybavení co do kvality i počtů tak, aby uspokojily narůstající zájem čtenářů
Tento projekt je spolufinancován z prostředků Evropské unie, Evropského fondu pro regionální rozvoj prostřednictvím Integrovaného operačního programu
28
KNIŽNÍ SKENOVÁNÍ
Děkujeme za pozornost
Praha 16. 05. 2013
Zrušení monopolu na informace = vzdělání + naděje pro budoucnost
Tento projekt je spolufinancován z prostředků Evropské unie, Evropského fondu pro regionální rozvoj prostřednictvím Integrovaného operačního programu
29