STANOU SE ONLINE DOSTUPNÉ ELEKTRONICKÉ ZDROJE INTEGROVANOU SOUÈÁSTÍ DIGITÁLNÍCH KNIHOVEN? Ludmila Celbová Národní knihovna ÈR
Úvod V rámci programu Ministerstva kultury ÈR Zpøístupòování a ochrana knihovních fondù formou digitalizace, s vyuitím sítì Internet v souvislosti s vytváøením informaèní spoleènosti, tedy programu zamìøeného na výzkum a vývoj získala Národní knihovna ÈR grant také na øeení projektu Registrace, ochrana a zpøístupnìní domácích elektronických zdrojù v síti Internet (øeení v letech 2000 2001). Cílem tohoto pilotního projektu je pøipravit podmínky pro zpracování èeské národní bibliografie elektronických zdrojù se zamìøením zejména na zdroje vzdálenì pøístupné. S bibliografickým zpracováním souvisí zajitìní trvalého uchování domácích elektronických monografických i seriálových dokumentù publikovaných v síti Internet a jejich zpøístupnìní, respektující autorské právo vydavatelù. Proè se elektronickými zdroji dostupnými online zabývat? Exploze v elektronickém publikování, tj. zejména v tvorbì elektronických zdrojù pøístupných v síti Internet, vyaduje nový pøístup ke zpracování, ochranì a zpøístupòování tìchto informací. Vzdálenì pøístupné elektronické zdroje se stávají nedílnou souèástí národní produkce a národního kulturního dìdictví, i obrazem doby, který je tøeba zachytit a uchovat pro budoucnost. Pøi budování digitálních knihoven, které se stávají globálními integrovanými systémy umoòujícími uivatelùm pøístup k dokumentùm bez ohledu na jejich typ èi lokalitu, se vedle digitalizovaných dokumentù zaèíná vìnovat pozornost rovnì dokumentùm, které jsou publikovány na Internetu a existují èasto pouze v elektronické podobì. Vzhledem k tomu, e v pøípadì internetových elektronických zdrojù se jedná o nehmotné dokumenty, vùèi nim navíc je zpracovatelská instituce v externím postavení, je zajitìní jejich pokud mono trvalého zpøístupnìní podmínìno øeením øady problémù, z nich nìkteré jsou spoleèné s tvorbou/zpøístupòováním tradièních dokumentù pøevádìných do digitální formy èi digitálních dokumentù uloených na hmotných nosièích (napø. digitální zvukové záznamy), nìkteré jsou zcela specifické pro tuto kategorii digitálních dokumentù. Pøi procesu integrace internetových elektronických zdrojù do fondù knihoven vystupují do
NÁRODNÍ KNIHOVNA, 12, 2001, è. 2
popøedí technické, knihovnické, organizaèní a legislativní aspekty, které lze stìí od sebe oddìlit. V zásadì je tøeba øeit nìkolik okruhù problémù: w kritéria výbìru (obsahová a formální) tìchto zdrojù pro registraci a archivaci v souladu s politikou budování fondù depozitních knihoven (souèást národní bibliografie konzervaèní fond) w legislativní opora získávání elektronických zdrojù pro konzervaèní fond (zahrnutí elektronických zdrojù do kategorie dokumentù, na nì se vztahuje povinný výtisk) w bibliografická kontrola elektronických zdrojù (metadatové standardy) w zajitìní trvalého pøístupu k vybraným publikacím uloeným v elektronickém archivu a s tím související otázka jejich autenticity (pøidìlování jednoznaèných identifikátorù, napø. URN) w strategie archivace digitálních dokumentù jako nezbytného pøedpokladu pro jejich dlouhodobé zpøístupnìní w stanovení podmínek pøístupu k archivovaným elektronickým zdrojùm (autorské právo). Ve svìtì (zejména v USA, Kanadì, Austrálii a v evropských severských zemích) existuje ji nìkolikaletá zkuenost s projekty zamìøenými na sbírky elektronických dokumentù publikovaných v síti Internet. V Evropì se za podpory Evropské komise zabývají touto problematikou spoleèné mezinárodní projekty (CoBRA+ [1], BIBLINK [2], NEDLIB [11]), jejich cílem je stanovit budoucí úlohu evropských národních knihoven ve vztahu k elektronickým publikacím a vytvoøit podmínky pro propojení národních bibliografických agentur a vydavatelù elektronických publikací, které by bylo uiteèné pro obì strany. K nejvýznamnìjím národním projektùm patøí PANDORA (Austrálie) [10], EVA (Finsko) [3], INDOREG (Dánsko) [4], Kulturarw3 (védsko) [5] a DNEP (Nizozemí) [6]. Ze zemí bývalého východního bloku zatím ádná s øeením obdobného projektu nezaèala. Øeení problematiky v Èeské republice Ani v Èeské republice se dosud komplexnì problematikou registrace, ochrany a zpøístupòování elektronických publikací nikdo nezabýval. Vzhledem k tomu, e se jedná o národní bibliografii a národní konzervaèní fond, pøísluí øeení této problematiky institucionálnì pøedevím Národní knihovnì ÈR. Na projektu Registrace, ochrana a zpøístupnìní domácích elektronických zdrojù v síti Internet, který by mìl vejít ve známost pod jednoduchým názvem WebArchiv, spolupracuje NK ÈR s Ústavem výpoèetní techniky Masarykovy univerzity v Brnì a s Ikaros, o. s. WebArchiv se prezentuje na webovských stránkách na adrese http://webarchiv.nkp.cz. Aplikace v naich podmínkách pøedstavuje mj. stanovení kritérií výbìru zdrojù pro národní bibliografii, legislativní zajitìní akvizice domácích elektronických publikací, technické a programové øeení jejich indexace
91
i archivace, zajitìní standardù pro budoucí èitelnost zdrojù a pro vyhledávání v síti; archivace a zpøístupnìní primárních síových elektronických zdrojù vyadují øeení otázek autorského práva, vytvoøení podmínek pro kooperaci centrálních, regionálních a specializovaných knihoven, resp. informaèních pracovi a propojení s vydavateli elektronických zdrojù. Problematika øeená v tomto projektu je velmi komplexní, zahrnuje oblast knihovnictví a vydavatelství, práva i informaèních technologií. Navíc vyaduje aplikaci mezinárodních standardù a kompatibilitu øeení s jinými podobnými projekty zpracovávanými ve svìtì v nedávné minulosti i v souèasnosti, na nich pracují velké týmy specialistù. Øeitelé proto vìnovali znaènou pozornost informaèním prùzkumùm, získání dostupných informaèních materiálù publikovaných v titìné a zejména v elektronické formì, jejich analýze a navázání kontaktù s vytipovanými zahranièními pracoviti, od nich lze získat cenné informace, zkuenosti i softwarové nástroje jako výsledky øeených národních i mezinárodních projektù. Jedním z nejrozsáhlejích a nejvýznamnìjích mezinárodních projektù na tomto poli byl projekt NEDLIB [11] podporovaný Evropskou komisí, na jeho realizaci se podílelo osm národních knihoven západoevropských zemí a tøi instituce zajiující technickou stránku øeení. Tento projekt, který navázal na øadu podobnì zamìøených národních i nadnárodních projektù (v oblasti naeho zájmu zejména projekty Nordic Metadata I, II [11] severských zemí) a jeho pøedmìtem je budování evropské depozitní knihovny elektronických dokumentù, se zabýval vemi elektronickými dokumenty vèetnì ménì problematických offline zdrojù. Díky jeho irokému zábìru je vhodné a moné pøevzít mnohé z toho, èeho v nìm bylo dosazeno. Monost získání zkueností z øeení klíèových projektù pøi zahranièní cestì do Finska (návtìva Helsinki University Library národní projekty i úèast v mezinárodních projektech) [23] napomohla do znaèné míry k technickému zamìøení øeení na vyuití nástrojù, které jsou výsledkem výe zmínìných projektù a které lze získat za výhodných podmínek. K úèelùm testování softwarových nástrojù na vybraném vzorku elektronických zdrojù slouí vysoce výkonný poèítaè s velkými kapacitami operaèní i diskové pamìti pro pøipojení na sí, pracující v OS Linux. Tento stroj má ve fázi testování suplovat unixový server a slouí k instalování nástrojù pro stahování a archivaci dokumentù, pro ukládání údajù pro popis zdrojù aj. a pro ukládání zdrojù do webovského archivu. Øeení pilotního projektu pøedstavuje principiálnì testování dvou metod, které by v optimálním pøípadì mìly být aplikovány paralelnì s cílem umonit dlouhodobé uchování a vyuívání elektronických zdrojù: w shromaïování, registrace a archivace vybraných domácích elektronických online dostupných dokumentù jako legitimní souèásti národní publikaèní produkce podle stanovených kritérií výbìru pro úèely Èeské ná-
92
rodní bibliografie (tato èinnost klade znaèné nároky na intelektuální práci zpracovatelù), w automatizovaný proces shromaïování a archivace domácích zdrojù z Internetu v relativní úplnosti (servery v národní doménì .cz a dalí omezení) pomocí speciálního indexaèního programu. Oblast problematiky vztahù knihoven, vydavatelù a legislativy Pro úèely pilotní fáze projektu, jejím smyslem je testovat stanovené postupy pøi zpracování online dostupných elektronických dokumentù, bylo vybráno celkem 14 elektronických domácích odbornì zamìøených èasopisù jako vhodný vzorek publikaèních aktivit v prostøedí World Wide Web. Výrazem domácí se v tomto kontextu míní ty dokumenty, které jsou zpøístupnìny na serverech s doménou I. stupnì .cz. Kategorie elektronický èasopis byla vymezena v souladu s pøíslunými mezinárodními normativními pøedpisy ISBD(S), ISBD(ER) a AACR2R jako podmnoina seriálových publikací. Z tìchto titulù pouze èasopis Ikaros soustavnìji podléhá bibliografické kontrole v celostátním mìøítku (v Bibliografické databázi záznamù o dokumentech z oblasti VTEI a knihovnictví SPOJ od srpna 1999 a v databázi èlánkù z èeských periodik ANL jako souèásti Èeské národní bibliografie od kvìtna 1999). Výbìr èasopisù byl proveden na základì spolupráce s vysokokolskými a dalími odbornými knihovnami. Jejich pøehled je uveden v tabulce 1. Základním kritériem výbìru byla neomezená dostupnost na webu, dalími kritérii bylo vydávání minimálnì po dobu jednoho roku a nereklamní charakter èasopisu (tzn., e není pouze prostøedkem prezentace vydavatele soukromé osoby, osob nebo instituce). Základní identifikaèní údaje byly excerpovány jednak z vlastních primárních dokumentù, jednak ze sekundárních zdrojù (zejména ISSN Register). K tomu je nutné dodat, e jen mení èást z tìchto èasopisù je oznaèena ISSN. Vìtina z tìchto èasopisù vychází pouze v elektronické podobì, nìkteré tituly vak mají charakter tzv. online supplementu, který do jisté míry figuruje jako samostatný dokument, nebo se po obsahové stránce s titìným èasopisem zcela neshoduje a také má odlinou periodicitu. Zvlátní skupinu seriálù, která se vymyká zabìhnuté klasifikaci seriálových publikací, avak je tøeba ji brát rovnì v úvahu, tvoøí prùbìnì aktualizované systémy (nìkdy oznaèované jako zpravodajské servery), které mají z technického hlediska charakter dynamické databáze, z ní jsou jednotlivé dokumenty generovány na základì uivatelského dotazu. Z této skuteènosti pak plynou ve srovnání se staticky zpøístupòovanými èasopisy (tj. èasopisy, jejich obsah se mìní v urèitých intervalech) rùzná omezení pøi registraci dokumentù na analytické úrovni. Úmyslnì byly opomenuty elektronické verze titìných èasopisù, pøestoe jim bylo pøidìleno vlastní ISSN.
NÁRODNÍ KNIHOVNA, 12, 2001, è. 2
Tab. 1: Domácí odbornì zamìøené elektronické èasopisy vybrané k testování metadatového schématu Dublin Core
Pøedbìnì byla dohodnuta spolupráce pøi testování vyuití metadatového schématu Dublin Core (viz dále odstavec Dublin Core) s nìkolika informaèními a dalími institucemi, které pùsobí souèasnì jako vydavatelé elektronických zdrojù, nebo v rámci svých webovských prezentací mj. publikují dokumenty, které nejsou jiným zpùsobem dostupné, avak z hlediska cílových uivatelských skupin jsou povaovány za významné. Spolupráce s vytipovanými vydavateli bude nutná hlavnì z legislativních dùvodù. Dohody o spolupráci by mìly øeitelùm projektu umonit testování výe uvedených nástrojù se souhlasem vydavatelù testovaných zdrojù, tj. umonit pøístup do zdrojù a jejich stahování a uloení na serveru umístìném v NK ÈR. Problematiku archivace a zpøístupòování elektronických online zdrojù z právního hlediska bude ovem tøeba výhledovì øeit obdobnì jako u ostatních druhù dokumentù, tj. uzákonìním práva povinného výtisku pro depozitní knihovny. Otázka zákonù o povinném výtisku i otázka autorského zákona je v této souvislosti velmi ivá, v souèasné dobì se jí intenzivnì zabývá i konference CENL (Conference of European National Librarians) spoleènì s federací evropských vydavatelù (FEP Federation of European Publishers). Na této úrovni dolo prozatím k dohodì, e vydavatelé budou poskytovat elektronické online publikace depozitním knihovnám na bázi dobrovolnosti. Byla stanovena pravidla pro dobrovolné poskytování kopie elektronických online dokumentù do elektronického archivu.
NÁRODNÍ KNIHOVNA, 12, 2001, è. 2
Ve fázi pilotních projektù by mìly knihovny s vydavateli dohodnout otázky definic pojmù dokument a vydavatel, otázky postupù a øízení celého procesu. Implementace by mìla být prùbìnì monitorována a na základì zkueností by mìla být navrena úèinná a obìma stranám vyhovující legislativa. Ustanovení CENL/FEP [13] vycházejí z pøedchozí rozsáhlé práce provedené v rámci projektu CoBRA+ [1], podporovaného Evropskou komisí a zamìøeného na zlepení vzájemné spolupráce evropských národních knihoven. Jeho cílem bylo nalézt taková øeení, která umoní uloení dokumentù v knihovních fondech, tj. vytváøení (relativnì) kompletní sbírky dokumentù, ale souèasnì umoní také kontrolu pøístupu k uloeným dokumentùm tak, aby nedocházelo k naruení komerèních zájmù vydavatelù. Zdùrazòuje se, e implementace zásad v ustanovení musí pøináet výhody obìma stranám: knihovnám v uchování kompletní národní produkce pro souèasné i budoucí uivatele, vydavatelùm v uchování jejich produkce elektronických dokumentù a zpøístupnìní informací o jejich existenci pro irí veøejnost prostøednictvím soupisù národních bibliografií. Podle analýzy provedené na základì dostupných informaèních pramenù i dotazù adresovaných na vybrané depozitní knihovny je ji v nìkterých zemích právo povinného výtisku (depozitní kopie) online elektronických zdrojù uzákonìno, jinde probíhá schvalovací øízení takového zákona (viz dále odstavec Výsledky øeení. Legislativa).
93
Oblast problematiky informaèních technologií Z výsledkù zkoumaných zahranièních projektù a výzkumù jsou pro ná projekt dùleité tyto body: Registrace, ochrana, archivace Prùmìrná doba existence elektronického dokumentu na Internetu je asi tøi roky. Z hlediska institucí, jejich zájmem je dlouhodobé uchovávání kulturního dìdictví, je proto nutné pøistoupit k aktivní ochranì tìchto dokumentù formou archivace. Z dosavadních zahranièních zkueností, z poètu ji existujících dokumentù a z pokraèujícího exponenciálního rùstu poètu elektronických online dostupných dokumentù vyplývá, e jediný prakticky reálný/zvládnutelný zpùsob vytváøení relativnì úplného konzervaèního fondu (elektronický archiv) a národní bibliografie je postup plnì automatizovaný. Selektivní pøístup je reálný pouze u velmi omezeného výseku specifických publikací na Internetu. Odhadovaná velikost národního webu je pøekvapivì relativnì malá (pomìøováno technickými i cenovými parametry ji dnes bìnì dostupných archivaèních technologií); na základì aproximací experimentálnì zjitìných parametrù v severských zemích (Finsko a védsko) ji odhadujeme kolem 300 GB. Souèasné technologie nám dovolují realizovat automatizovaný zpùsob archivace za pøijatelnou cenu, pokud se omezíme jen na oblast národních elektronických zdrojù. V rámci projektu NEDLIB [11] jsou vyvíjeny nástroje pro sbìr, archivaci a indexaci elektronických online dokumentù. Nìkteré z tìchto nástrojù jsou k dispozici zdarma a jejich lokalizace a nasazení je v naich podmínkách reálné. Nejvýznamnìjím z této skupiny nástrojù je NEDLIB Harvester, nástroj pro stahování a archivaci elektronických dokumentù. Zpøístupnìní archivovaných dokumentù Ve védském projektu Kulturarw3 [5] byly realizovány první pokusy o zpøístupnìní webového archivu s vyuitím standardních uivatelských pøístupových technologií (webového prohlíeèe). Nástroj pro dokonalejí zpøístupnìní archivovaných dokumentù je v projektu NEDLIB sice také vyvíjen, ale u nebude k dispozici zdarma. Tento nástroj by mìl umoòovat prohlíení archivovaných dokumentù nejen v rámci vzájemných odkazù, ale i vzhledem k èasové ose. V dlouhodobìjím horizontu se zde otevírá pole pro uplatnìní pøístupù z oblasti analýzy pøirozeného jazyka (pøekraèuje rámec stávajícího projektu). Jak vlastní sbìr a archivace, tak zejména zpøístupnìní dokumentù vyaduje odpovídající národní legislativní rámec. Metadata Pro zkvalitnìní automaticky vytváøených indexù je vhodné propagovat mezi veøejností publikující v prostøedí World Wide Web jednotné metadatové standardy pro popis elektronických zdrojù, pouitelné pøímo samotnými autory. Nejvýznamnìjím z tìchto standardù je Dublin Core (DC) [16], pøípadnì z nìj odvozené standardy. Za uplynulý rok bylo dosaeno jistého pokroku v rozvoji kvalifikova-
94
ného DC a byly nastartovány významné iniciativy k irímu uznání standardu DC (ANSI/NISO standardizace). Dolo také k vytvoøení èeské verze standardu DC jako základu pro irí národní vyuití. Pro podporu pouívání DC vzniklo nìkolik zdarma online dostupných nástrojù, po irí lokalizaci pouitelných i u nás. Jednoznaèná globální trvalá identifikace Pro usnadnìní identifikace elektronických dokumentù byl vytvoøen koncept Uniform Resource Name (URN) [18] jednoznaèných identifikátorù dokumentu. Tyto identifikátory jsou generovány a adatelùm pøidìlovány automaticky. Jednou z aplikací URN mohou být registraèní èísla národní bibliografie (NBN), dále ISBN a ISSN. Dalí moností je vytvoøit identifikátor URN na základì kontrolního souètu MD5 tímto zpùsobem je moné snadno ovìøit i to, zda byl dokument po pøidìlení tohoto identifikátoru zmìnìn. V této oblasti lze také pøevzít zkuenosti a postupy z projektù Nordic Metadata I a II [12] a projektu NEDLIB [11]. Výsledky øeení Na Linux-serveru poøízeném pro testování vyvíjených, resp. lokalizovaných nástrojù (napø. elektronický formuláø pro jednoduchý zápis údajù Dublin Core s moností uloení do zdrojového dokumentu, nástroj pro automatické pøidìlování URN) a pro uloení vybraných elektronických zdrojù staených z webu (webovský archiv) byla zøízena doména URL: http://webarchiv.nkp.cz, kde jsou prezentovány výsledky øeení projektu WebArchiv a dalí relevantní informace. Výbìr vydavatelù, resp. dokumentù pro testování Na základì studia zahranièních projektù byla stanovena kritéria pro výbìr typù dokumentù do vzorku, na nìm je tøeba testovat stanovené postupy pøi zpracování online dostupných elektronických dokumentù publikovaných v síti Internet. Hlavní kritéria výbìru byla následující: w pùvodní vydání dokumentu v elektronické formì (online) w vydávání minimálnì po dobu jednoho roku w dokument není pouze prostøedkem prezentace vydavatele (soukromé osoby, osob nebo instituce). Jako typ dokumentù nejvhodnìjích pro testování byly vybrány elektronické èasopisy. Jde o kategorii dokumentù pomìrnì stabilních. Èasopisy mají navíc tu výhodu, e u nich není v souèasné dobì problém s pøidìlováním ISSN pouitelným pro úèely projektu jako identifikátor URN, take je moné na nich ovìøovat pøipravené postupy a nástroje. Dalí uvaovanou skupinou dokumentù pro testování jsou domovské stránky vybraných informaèních a podobných institucí. Pøedbìnì byla s tìmito institucemi dohod-
NÁRODNÍ KNIHOVNA, 12, 2001, è. 2
nuta spolupráce pøi vyuití metadatového schématu Dublin Core. Problematika výbìru vzorku pro testování a souvisejících otázek ji byla blíe popsána v odstavci Oblast problematiky vztahù knihoven, vydavatelù a legislativy. Legislativa Byla provedena dùkladná analýza legislativního zabezpeèení získávání elektronických online dostupných publikací a souvisejících otázek ve vybraných zemích. Platný zákon o povinném výtisku zahrnující i vzdálenì pøístupné elektronické zdroje je zatím pouze v Dánsku, Norsku a po úpravách pùvodního zákona i na Slovensku; pøipraven ke schválení je zákon v Austrálii, Finsku, védsku; v Holandsku funguje bez problémù spolupráce s vydavateli na základì dohod. Výsledky analýzy byly publikovány v èasopise Ikaros, è. 10/2000 [20].
Dublin Core Do èetiny byla pøeloena nejnovìjí verze standardu Dublin Core Metadata Element Set, Version 1.1 [14]. Národní èeská verze DC byla zaregistrována v rámci DCMI (Dublin Core Metadata Initiative) [17]. Pro iniciativu Dublin Core byly vytvoøeny èeské webovské stránky [15]. Byly zpracovány pøehledové analýzy z oblasti vývoje a vyuití standardu Dublin Core [21], [22]. Byla vytvoøena beta-verze lokalizovaného DC-metadatového formuláøe pøevzatého od Helsinské univerzitní knihovny z projektu Nordic Metadata (obr. 1). Tento nástroj podporuje kvalifikovaný DC podle nejnovìjí specifikace a zároveò umoòuje propojení na nástroj pro automatické pøidìlování URN. Podporuje jak syntaxi HTML, tak XML (RDF). Hardwarové nároky pro provoz tìchto nástrojù jsou minimální, protoe jde o relativnì jednoduché skripty v programovacím jazyce Perl. Oba tyto nástroje budou k dispozici vem zájemcùm publikujícím pøedevím na èeském Internetu.
Obr. 1: Lokalizovaný generátor záznamu metadat ve schématu Dublin Core vyvinutý v rámci projektu Nordic Metadata
NÁRODNÍ KNIHOVNA, 12, 2001, è. 2
95
Záznamy v metadatovém schématu Dublin Core vygenerované pomocí lokalizového formuláøe jsou pokusnì zaøazovány do zdrojových kódù èlánkù elektronického èasopisu Ikaros (obr. 2-3).
Obr. 2: Vygenerovaný záznam metadat ve schématu Dublin Core ve formátu HTML
Obr. 3: Vygenerovaný záznam metadat ve schématu Dublin Core ve formátu XML (RDF)
96
NÁRODNÍ KNIHOVNA, 12, 2001, è. 2
Harvester Je analyzován aktuální stav, monosti a podmínky lokalizace nástroje Harvester z projektu NEDLIB na Linuxserveru instalovaném z prostøedkù projektu v Národní knihovnì ÈR. Na vývoji tohoto nástroje se stále pracuje, nicménì ji bylo s jeho pomocí dosaeno v nìkterých zemích pozoruhodných výsledkù. Tento nástroj, vyuívající databáze MySQL pro ukládání dat, byl pùvodnì napsaný v jazyce Perl, ale na zakázku Helsinské univerzitní knihovny byl pøepsán do jazyka C, èím dolo k jeho výraznému zrychlení a zároveò byla zlepena i jeho funkènost. Harvester má relativnì vysoké nároky na hardwarové vybavení pro svùj provoz. Vzhledem k jeho specifikùm vyaduje rychlou pøípojku do sítì Internet, dostateènou velikost pamìti a odpovídající kapacitu pamìti na pevných discích a pøípadnì i páskových jednotkách. Pro rutinní provoz je proto doporuèen nìkterý z vìtích znaèkových unixových serverù (Sun, HP, IBM, Compaq) kombinovaný s dostateènì velkým diskovým a páskovým polem. Pro akce meního rozsahu je ale moné pouít i stanici s Linuxem, co èiní tento nástroj dostupným i pro ná projekt. Pøedpokladem je dostateèné mnoství pamìti (nejlépe alespoò 512 MB), výkonný procesor (napø. AMD Athlon) a pøedevím velké diskové pole (v naem pøípadì 90 GB RAID 0+1). Pro uloení vìtích mnoství dat poèítáme s moností vyuití páskové robotické knihovny, která je v majetku Národní knihovny ÈR. Pøestoe tento nástroj nebude nutné lokalizovat z hlediska uivatelského, bude nutné o to vìtí úsilí vìnovat jeho pøizpùsobení èeským podmínkám na úrovni programové. Ani samotná instalace tohoto nástroje nebude jednoduchá vzhledem k tomu, e na jeho finální verzi se stále jetì pracuje. Také specifikace mnoiny dokumentù pro archivaci (specifikace èeského webu) bude relativnì nároèná. Ovìøovaè URL Bylo provedeno pøedbìné orientaèní zmapování vybraných volnì dostupných nástrojù èi programù shareware urèených pro kontrolu interních a externích HTML odkazù. Ve vech pøípadech jde o prostøedky na bázi perl skriptù. Pro serióznìjí analýzu by bylo tøeba specifikovat pøedpokládaný zpùsob nasazení a poadované funkce v kontextu celkového øeení projektu. Dalí perspektivní moností je vyuití existujících volnì dostupných perlovských modulù pro vytvoøení aplikace pøesnì podle potøeb projektu. Smìry dalího øeení 1. Pøipravit podmínky pro realizaci bibliografické kontroly v oblasti elektronických online dokumentù. 2. Usilovat o co nejvyí efektivitu aplikací výsledkù øeení podobných zahranièních èi mezinárodních projektù vèetnì aplikace volnì dostupných nástrojù i nástrojù poskytovaných za úhradu.
NÁRODNÍ KNIHOVNA, 12, 2001, è. 2
3. Zohlednit související projekty a èinnosti v ÈR: w zpøístupòování národní èlánkové bibliografie a plných textù elektronických periodik w integrace automatizovaných systémù pro systematické a vìcné poøádání (Mezinárodní desetinné tøídìní, Pøedmìtová hesla Národní knihovny a dalí) w digitalizace klasických knihovních fondù w programový projekt Ministerstva kultury ÈR Jednotná informaèní brána pro hybridní knihovny.
Závìr V rámci dosavadního øeení projektu WebArchiv byla analyzována øada zahranièních i mezinárodních projektù zabývajících se problematikou získávání, registrace, ochrany a zpøístupòování elektronických online dokumentù. Výzkum ukázal, e se jedná o velmi komplexní problematiku, zahrnující oblast spolupráce a propojení knihoven s vydavateli, oblast práva a oblast informaèních technologií. Navíc vyaduje aplikaci mezinárodních standardù a kompatibilitu øeení s jinými podobnými projekty. Díky tomu, e lze vyuít výsledkù jiných projektù (zahranièních a mezinárodních) a e znaèná èást nástrojù potøebných pro realizaci projektu je volnì k dispozici, je moné v relativnì krátkém èase a za relativnì nízkých finanèních nákladù pøipravit v rámci pilotního projektu podmínky pro jeho realizaci. Na druhé stranì je nutné poèítat s tím, e jen samotná instalace, lokalizace a vzájemná integrace není samozøejmou záleitostí a e na dosaení poadované funkènosti bude tøeba intenzivnì pracovat. Øeení právních otázek, které nelze samozøejmì v této souvislosti opomenout, je dlouhodobou záleitostí. Nejprve bude nutné zváit vechny aspekty (provozní, technické aj.), které se váou k mnoinì dokumentù podléhajících povinnosti vydavatelù poskytovat/ohlaovat vydané publikace, a teprve následnì bude moné pøipravit podklady pro zmìnu zákona obsahujícího ustanovení o povinném výtisku seriálových publikací (tiskový zákon), resp. výklad a smìrnice k zákonu týkajícímu se povinného výtisku neperiodických publikací a k autorskému zákonu (zákon è. 37/1995 Sb., o neperiodických publikacích; zákon è. 46/2000 Sb., o právech a povinnostech pøi vydávání periodického tisku a o zmìnì nìkterých dalích zákonù tiskový zákon; zákon è. 121/2000 Sb., o právu autorském, o právech souvisejících s právem autorským a o zmìnì nìkterých zákonù autorský zákon).
Poznámka: Ke zpracování èlánku jsem pouila podkladù externích spolupracovníkù podílejících se na øeení projektu RNDr. Miroslava Bartoka, CSc. (ÚVT MU Brno), Ing. Petra abièky (MZK Brno), Mgr. Ivy Celbové a Mgr. Filipa Vojtáka (oba Ikaros, o. s.) pro výroèní zprávu k projektu za rok 2000 [24].
97
Pouité informaèní zdroje 1. Cobra+ [online]. Boston Spa : British Library, 1997 [cit. 9. dubna 2001]. Dostupné na World Wide Web:
. 2. Biblink [online]. Bath (Anglie) : UKOLN, last updated 12-Jul-2000 [cit. 9. dubna 2001]. Dostupné na World Wide Web: . 3. EVA : the acquisition and archiving of electronic network publications [online]. Helsinki (Finsko) : Helsinki University Library, last updated 15-Dec-1997 [cit. 9. dubna 2001]. Dostupné na World Wide Web: . 4. INDOREG : Internet Document Registration : project report [online]. Ballerup (Dánsko) : Dansk Bibliotheks Center, 16-Sep-1997 [cit. 9. dubna 2001]. Dostupné na World Wide Web: . 5. Kulturarw3 Heritage Project [online]. Stockholm (védsko) : Royal Library, [1998] [cit. 9. dubna 2001]. Dostupné na World Wide Web: . 6. FEIJEN, Martin. DNEP : fond holandské produkce elektronických publikací. Národní knihovna, 6, 1995, è. 6, s. 206-210. ISSN 0862-7487. 7. National Library of Canada Electronic Collection [online]. Ottawa (Kanada) : NLC, revised 2001-0226 [cit. 9. dubna 2001]. Dostupné na World Wide Web: . 8. OCLC. Preservation resources [online]. Dublin (Ohio, USA) : OCLC, c1999, 21-Sep-2000 [cit. 9. dubna 2001]. Dostupné na World Wide Web: . 9. OCLC. Internet Cataloging Project [online]. Dublin (Ohio, USA) : OCLC, 1996 [cit. 9. dubna 2001]. Dostupné na World Wide Web: . 10. PANDORA [online]. Canberra (Austrálie) : NLA, last updated 10-Oct-2000 [cit. 9. dubna 2001]. Dostupné na World Wide Web: . 11. NEDLIB : Networked European Deposit Library [online]. Hague (Nizozemí) : Koninklijke Bibliotheek, c1998, last updated 11-Mar-2001 [cit. 9. dubna 2001]. Dostupné na World Wide Web: . 12. The Nordic Metadata projects [online]. Helsinki (Finsko) : Helsinki University Library, 1996, last updated 21-Feb-2000 [cit. 9. dubna 2001]. Dostupné na World Wide Web: . 13. International declaration on the deposit of electronic publications : conference of European National Librarians/Federation of European Publishers (CENL/ FEP). Dialog mit Bibliotheken, 2000, vol. 12, no. 3, s. 2-14. ISSN 0936-1138.
98
14. Dublin Core Czech : soubor metadatových prvkù Dublin Core, verze 1.1 : referenèní popis [online]. Brno : Masarykova univerzita, 12-06-2000 [cit. 9. dubna 2001]. Dostupné na World Wide Web: . 15. Dublin Core Czech [online]. Brno : Masarykova univerzita, posl. aktualizace 26-2-2000 [2001?] [cit. 9. dubna 2001]. Dostupné na World Wide Web: . 16. Dublin Core Metadata Initiative [online]. Dublin (Ohio, USA) : DCMI, c2000 [cit. 9. dubna 2001]. Dostupné na World Wide Web: . 17. Dublin Core Metadata Initiative : Translations of DCMI Documents [online]. Dublin (Ohio, USA) : DCMI, c2001 [cit. 9. dubna 2001]. Dostupné na World Wide Web: . 18. Internet Engineering Task Force. Uniform Resource Names (urn) [online]. Preston (Virgin., USA); Leeds : IETF, last modified 30-Mar-2001 [cit. 9. dubna 2001]. Dostupné na World Wide Web: . 19. CELBOVÁ, Ludmila. Elektronické zdroje publikované v síti Internet jako souèást èeské národní bibliografie. Ikaros [online]. 2000, è. 6 [cit. 9. dubna 2001]. Dostupné na World Wide Web: . 20. CELBOVÁ, Ludmila. Povinný výtisk elektronických publikací, zejména vzdálených elektronických zdrojù. Ikaros [online]. 2000, è. 10 [cit. 9. dubna 2001]. Dostupné na World Wide Web: . 21. ABIÈKA, Petr. Dublin Core jako standard pro popis elektronických síových zdrojù. In Èesko-slovenská konference RUFIS 2000, Brno 5.6. 9. 2000 [online]. Brno : Vysoké uèení technické : Masarykova univerzita, 2000 [cit. 9. dubna 2001]. Dostupné na World Wide Web: ; . 22. ABIÈKA, Petr. Dublin Core metadata pro popis elektronických dokumentù. Pøedneseno na konferenci DATASEM 2000, konané 21. a 24. øíjna 2000 v Brnì. Dostupné na World Wide Web: . 23. Zpráva ze sluební cesty do Finska. Praha : Národní knihovna ÈR, 2000. 2 s. Dostupné té na World Wide Web: . 24. Registrace, ochrana a zpøístupnìní domácích elektronických zdrojù v síti Internet : souhrnná zpráva za rok 2000 [online]. Praha : Národní knihovna ÈR, 2000 [cit. 9. dubna 2001]. Dostupné na World Wide Web: <webarchiv.nkp.cz/zprava2000.pdf>.
NÁRODNÍ KNIHOVNA, 12, 2001, è. 2