ZPŘÍSTUPNĚNÍ A ARCHIVACE PLNÝCH TEXTŮ ČESKÝCH LÉKAŘSKÝCH A ZDRAVOTNICKÝCH ČASOPISŮ Konference Knihovny současnosti 2010
Lenka Maixnerová, Filip Kříž, Ondřej Horsák
Úvod
V roce 2004 zapojení do programu VISK 6 Manuscriptorium a v roce 2OO8 do programu VISK 7 Kramerius V roce 2008 zprovozněn Digitální archiv NLK v systému Kramerius http://www.medvik.cz/kramerius Systém Kramerius je propojen se systémem Medvik včetně databáze BMČ
Zdroje dokumentů Replikace plánováno 2% Replikováno 10%
VISK Konverze z Manuscriptoria Vlastní digitalizace
VISK 1%
Digital-born 29%
Vlastní digitalizace 33%
Vlastní digitalizace plánováno 24%
Vlastní digitalizace plánováno Digital-born Replikováno Replikace - plánováno
Obsah DA NLK
Disertace / kvalifikační práce 12%
Knihy / monografie
Drobné CD/DVD tisky 2% 5%
Granty / výzkumné zprávy 9%
Staré tisky / muzejní sbírky 33%
digitalizovaná tištěná periodika a monografie
Knihy / monografie 32%
Časopisy / periodika 7%
digitalizované staré tisky
Časopisy / elektronické časopisy periodika tisky / grantové zprávy (IGA Staré závěrečné muzejní sbírky MZ ČR), atestační práce IPVZ Granty / výzkumné zprávy konferenční materiály Disertace / digital-born dokumenty kvalifikační práce tisky 41 titulů periodik, 576 Drobné K 2.9.2010:
„monografií“; další ve zpracování
celkem cca 900 dokumentů
Podmínky zpřístupnění - licence Lic. NLK volně přístupné 9% Creative Lic. NLK Commons pouze pro reg. 7% 1%
Volně přístupné dle AZ
Volně přístupné dle AZ 30%
Pouze ze sítě NLK dle AZ Creative Commons Lic. NLK volně přístupné
Pouze ze sítě NLK dle AZ 53%
Lic. NLK pouze pro reg.
BMČ – Bibliographia medica Čechoslovaca
Národní bibliografická databáze z biomedicínských oborů V NLK budována od roku 1947 Články v odborných časopisech a sbornících české (do roku 2000 i slovenské) provenience + bohemika V elektronické podobě přístupná v portálu Medvik a na DVD Bibliomedica (ročníky 1953-56, 1967 až současnost) – celkem cca 600.000 záznamů Indexace dle tezauru MeSH
BMČ a plné texty
Požadavky uživatelů odborné literatury: snadný a rychlý přístup k plným textům Od roku 2007 je součástí záznamu BMČ i URL odkaz (pokud existuje) na plný text článku – cca 18 000 článků Problémy: volně přístupné texty jsou k dispozici cca 3-24 měsíců po tištěném vydání, intervaly se často mění, po 3letém provozu cca 60 % nefunkčních
Archivace elektronických verzí periodik v DA NLK
V roce 2009 zahájena spolupráce s českými nakladateli odborných biomedicínských periodik Podmínkou archivace je uzavření smlouvy o poskytování elektronických online zdrojů Podepsání smlouvy – značně problematické, nakladatelé často nemají ošetřená práva ohledně zpřístupnění článků volně přes Internet, někdy není jasné, kdo má smlouvu podepsat (nakladatel, vydavatel, provozovatel elektronických verzí apod.)
Uzavřené licenční smlouvy
Medica Healthworld, Institut rodinné terapie a psychosomatické medicíny v Liberci, Solen, Česká akupunkturistická společnost ČLS JEP, Státní ústav pro kontrolu léčiv, Ambulantní centrum pro vady pohybového aparátu, Remedia, Sdružení SCAN, Česká společnost HPB chirurgie, Česká lékařská společnost Jana Evangelisty Purkyně, Aprofema, Rekesh Comp.
Smluvně ošetřeno 53 titulů periodik, u 5 titulů časové embargo, u 4 titulů přístup pouze pro registrované uživatele Konferenční materiály –zatím se nepodařilo realizovat
Doporučení
Vydavatelé
Autoři
ošetření vztahů s autory dosažení win-win situace - vyvážený stav výhodný pro všechny zainteresované strany dodržování základních W3C standardů PDF s korektním kódováním
využívat CreativeCommons licencí vyhnout se restriktivním vydav. podmínkám, bránícím self-archivaci
Hlavně - nebát se podepsat licenční smlouvu s NLK!
Získávání dat
CD-ROM, mail, ftp Webová stránka časopisu – využíváme software WebHarvest – umožňuje stáhnout data dle vytvořeného profilu Pokud jsou stránky pouze v HTML, provedeme kompletaci článků s obrazovými soubory a konverzi do formátu PDF Chyby v HTML – upozorníme nakladatele, pokud není schopen chyby opravit, upravíme my Někdy nelze soubory s plnými texty nalézt
Zpracování dat
Výsledkem jsou PDF soubory celých čísel nebo jednotlivých článků pojmenovaných dle definovaného schématu + XML soubor se staženými metadaty Porovnání metadat se záznamy BMČ, v případě shody jsou metadata obohacena o identifikátor článku BMČ Kontrola úplnosti, zda ke každému článku existuje záznam v BMČ a obráceně Chybějící články – zhotovení vlastní el. kopie, chybějící záznamy dopíšeme, chyby opravíme
Import dat
Připojení PDF souborů pomocí speciálního modulu Medvik-Dawinci k bibliografickému záznamu časopisu Vygenerování XML souboru podle DTD Kramerius pro periodika, pokud jsou PDF soubory na úrovni článků, je XML soubor obohacen o základní metadata článků (PeriodicalInternalComponentPart) Validace a import do archivu
Propojení s portálem Medvik
U monografií je URL odkaz ukládán ručně
U článků to není možné – 100-1000 článků pro jednotlivé tituly
Propojení u článků
Vytvořen linkovací mechanismus, který umožňuje dynamické zobrazování u záznamů článků BMČ v portálu Medvik URL odkazy do Krameria Java, ODBC konektor Výsledkem je zobrazení odkazů na všechny úrovně metadat – článek, číslo, ročník, časopis Řešení umožňuje propojení nejenom na „digitalborn“ dokumenty, ale i na digitalizované dokumenty Propojeno 15.500 článků
Zdroje
Autoři
Digitalizace fondů a sbírek NLK
Vydavatelé
Licenční smlouvy s NLK
Licence
Získávání a zpracování dat Archivace
metadata Trvalá archivace
KIS MEDVIK katalogy, BMČ Přístup
Kramerius
Portál Medvik
Uživatelé Digitální archiv NLK - schéma informačních toků
Portál Medvik > Odkaz na digitální knihovnu
Kramerius – plný text
Odkazy z portálu Medvik do Krameria – monografie, IGA zprávy
Propojení na článek
Propojení na číslo časopisu
Bohmische Curorte
Elektronické časopisy
Konferenční materiály
Závěr
rozšiřování spolupráce s vydavateli & autory, další zdroje pro archiv nová verze portálu Medvik - integrované vyhledávání ve všech NLK databázích, OpenURL, web API nová verze Krameria - podpora více typů objektů, OAIS kompatibilní formalizace procesů DA, řízení&plánování, audit, národní identifikátory do budoucna možnost self-archivace přímo autory v prostředí DA získání finanční podpory – MK ČR řeší kulturní dědictví, ne vědecké informace partnerství