Syst´emy pro tvorbu digit´aln´ıch knihoven Vlastimil Krejˇc´ıˇr,
[email protected] ´ Ustav v´ ypoˇ cetn´ı techniky, Masarykova univerzita, Brno
INFORUM 2006, Praha
Obsah pˇredn´aˇsky
´ • Uvod • Fedora • DSpace • EPrints • CDSware • Greenstone • Lokalizace syst´ em˚ u
´ Uvod Syst´emy pro tvorbu digit´aln´ıch knihoven: • realizace ,,knihovny‘‘ v poˇ c´ıtaˇcov´em prostˇred´ı • des´ıtky r˚ uzn´ych syst´em˚ u • komerˇ cn´ı x volnˇ e dostupn´ e (opensource) syst´emy • obecn´ e x specializovan´e • pˇr´ıstup k tvorbˇ e obsahu repozit´aˇre Existuje svat´ y gr´ al mezi syst´emy? Pˇredstavovan´e syst´emy: Fedora, DSpace, EPrints, CDSware, Greenstone
Fedora Flexible Extensible Digital Object and Repository Architecture • vyv´ıjen na Cornell University a University of Virginia • obecn´ y syst´em pro uchov´av´an´ı dat • stav´ı na teoretick´ ych modelech
V souˇcasnosti poskytuje pouze robustn´ı j´adro – repozit´aˇr pro ukl´ad´an´ı dat, kter´y poskytuje API pro pˇr´ıstup a spr´avu. Rozhran´ı pro koncov´e uˇzivatele si mus´ı instituce vytvoˇrit sama.
Fedora Digit´aln´ı objekt
Digit´aln´ı objekty v syst´emu Fedora: • metadata a data (dokumenty, fotografie, hudba, . . . ) • sluˇ zby nad daty (poskytov´an´ı, pˇrevody, . . . ) Data spojen´a se sluˇzbami jsou z´akladn´ım prvkem syst´emu. Technologie: XML, webov´e sluˇzby – SOAP, WSDL => nez´ avislost na platformˇ e a lokaci.
Fedora Dalˇs´ı vlastnosti
Dalˇs´ı vlastnosti syst´emu Fedora: • export dat ve form´ atu METS • poskytov´ an´ı metadat – protokol OAI-PMH • metadata MODS, DC, . . . • spr´ ava verz´ı • rozhran´ı, programov´ e vybaven´ı • ...
Fedora Z´avˇer
Uˇzivatel dost´av´a do rukou motor F#1 – z´aleˇz´ı jen na nˇem, jak s n´ım naloˇz´ı. Je netrivi´ aln´ı poskl´ adat v´ ykonn´ y monopost a ˇr´ıdit jej. Praktick´e nasazen´ı? Testy na milionech DOs, avˇsak zat´ım ne pˇr´ıliˇs velk´e rozˇs´ıˇren´ı. . . Vhodn´e pro velk´e instituce, kter´e to ,,mysl´ı v´aˇznˇe‘‘.
DSpace
Digital Archive Project • p˚ uvodnˇe vyv´ıjen MIT a HP • nyn´ı ˇsirok´ a a ˇcinn´a celosvˇetov´a komunita • obecn´ y syst´em pro uchov´av´an´ı, sd´ılen´ı a prezentaci dat
Ve srovn´an´ı se syst´emem Fedora je DSpace kompletn´ı osobn´ı automobil okamˇzitˇe pˇripraven´y pro sv´eho majitele. => Menˇs´ı flexibilita syst´emu :-(, ale tak´e m´enˇe pr´ace :-).
DSpace Rozhran´ı
DSpace poskytuje kompletn´ı webov´e rozhran´ı: • uˇ zivatelsk´e u´ˇcty a syst´em pˇr´ıstupov´ych pr´av • proch´ azen´ı obsahem repozit´aˇre, vyhled´av´an´ı • vkl´ ad´an´ı dat uˇzivatelem • workflow syst´ em • spr´ ava syst´emu • ... Vzhled webov´eho rozhran´ı lze mˇenit dle potˇreb instituce (standard CSS).
DSpace Dalˇs´ı vlastnosti
Podporovan´e standardy: • export do METS • poskytov´ an´ı metadat pˇres OAI-PMH • metadata ukl´ ad´a v DC
DSpace Z´avˇer
DSpace je velmi ˇziv´y: • stovky instalac´ı na cel´ em svˇetˇe (des´ıtky tis´ıc DOs) • lok´ alnˇe modifikovan´e verze pro r˚ uzn´e u´ˇcely • rychl´ y v´yvoj syst´emu • pˇrispˇ et m˚ uˇze kdokoli (komunita kolem syst´emu) Univerz´ aln´ı, praktick´ y a perspektivn´ı syst´em, ale (zat´ım) ne u´plnˇe dobˇre modifikovateln´y.
EPrints
Syst´em EPrints: • vyv´ıjen na University of Southampton • specializovan´ y na oblast STI • kompletn´ı pˇripraven´ y okamˇzitˇe k pouˇzit´ı • starˇs´ı ,,l´ ety provˇeˇren´y‘‘
Specializace na oblast STI ovlivˇnuje cel´y syst´em (spr´ava dokument˚ u, workflow, uˇzivatelsk´e rozhran´ı, . . . ).
EPrints Vlastnosti
Uˇzivatelsk´e webov´ e rozhran´ı: • vyhled´ av´an´ı, proch´azen´ı (ˇclenˇen´ı do kategori´ı dle LoC) • uˇ zivatelsk´e u´ˇcty, jednoduch´y syst´em pr´av • propracovan´ y syst´em vkl´ad´an´ı dokument˚ u • spr´ ava syst´emu Webov´e rozhran´ı je ˇc´asteˇcnˇe statick´ e – pˇredem generovan´e: • vloˇ zen´ı nov´eho dokumentu se neprojev´ı ihned • rychlejˇs´ı odezva syst´ emu pˇri pˇr´ıstupu uˇzivatel˚ u
EPrints Z´avˇer
Syst´em EPrints je nasazov´an v praxi (des´ıtky tis´ıc dokument˚ u), zejm´ena v oblasti STI. Modifikace syst´emu jsou ˇc´asteˇcnˇe moˇzn´e – zmˇena vzhledu webov´eho rozhran´ı, zmˇena postupu pˇri vkl´ad´an´ı nov´eho dokumentu, . . . Syst´em je vhodn´y pˇredevˇs´ım pro ukl´ad´an´ı a prezentaci textov´ ych dokument˚ u v pˇr´ıpadˇe, kdy uˇzivatel´e sami vytv´aˇrej´ı obsah repozit´aˇre.
CDSware CERN Document Server Software ˇ ycarsku • vyv´ıj´ı CERN ve Sv´ • zamˇ eˇren´ı na potˇreby CERNu • uˇ zivatelsk´e rozhran´ı na pomez´ı Fedory a EPrints • robustn´ı syst´ em s velk´ym mnoˇzstv´ım funkc´ı • moˇ znost placen´e podpory • GNU syst´ em
Vysok´a modularita syst´emu – vyuˇz´ıv´an´ı pestr´e kolekce aplikac´ı tˇret´ıch stran.
CDSware Vlastnosti
Uˇzivatelsk´e webov´ e rozhran´ı nen´ı ve v´ychoz´ım syst´emu kompletn´ı – nutnost vytvoˇrit si pomoc´ı maker a dalˇs´ıch n´astroj˚ u z´akladn´ı rozhran´ı pro r˚ uzn´e typy dokument˚ u. Z dalˇs´ıch vlastnost´ı: • slovn´ıky kl´ıˇ cov´ych slov a autorit • moˇ znost modifikovat vyhled´avac´ı algoritmus • propracovan´ y syst´em pˇr´ıstupov´ych pr´av, uˇzivatelsk´e role • podpora OAI-PMH, metadata MARC 21 • ˇ c´asteˇcnˇe statick´y (podobnˇe jako EPrints)
CDSware Z´avˇer
Hlavn´ı nasazen´ı v CERNu – pˇres 300 tis´ıc dig. objekt˚ u (dokumenty, fotografie, . . . ). ,,Obrovsk´y‘‘ syst´em, netrivi´aln´ı instalace (asi 10 dalˇs´ıch aplikac´ı) a spr´ava. Vhodn´y pro instituce, kter´e chtˇej´ı robustn´ı syst´em a jsou ochotny si zaplatit podporu ze strany v´yvoj´aˇr˚ u.
Greenstone
Greenstone Digital Library Software • vyv´ıj´ı University of Waikato (Nov´ y Z´eland) • podpora organizace UNESCO • GNU syst´ em • filozofie podobn´ a syst´emu CDSware
Syst´em Greenstone byl podrobnˇe testov´an a pops´an ˇ na Fakultˇe informatiky MU. v diplomov´e pr´aci Jakuba Rehana
Greenstone
Zaj´ımav´e vlastnost´ı: • podpora Z39.50, OAI-PMH, DC • import dokument˚ u pˇrevodem do intern´ıho form´atu • j´ adro poskytuj´ıc´ı sluˇzby, modul´arn´ı syst´em • Java aplikace Librarian pro spr´ avu • slabˇs´ı podpora uˇ zivatelsk´ych u´ˇct˚ u a pr´av Prov´est nˇekter´e u´pravy je i pˇres modularitu syst´emu ne vˇzdy zcela snadn´e.
Lokalizace syst´em˚ u
• ˇ cesky nejl´epe Greenstone, ˇc´asteˇcnˇe CDSware a DSpace • probl´ emov´a indexace ˇcesk´ych dokument˚ u • nefunguje ,,ceske vyhledavani‘‘
Z´avˇer
Kaˇzd´y syst´em m´a sv´e klady i z´ apory. Aˇz pˇri ostr´em provozu mnohdy vyjdou najevo nedostatky. Kaˇzd´y syst´em je moˇzn´e pˇrizp˚ usobit s vˇetˇs´ım ˇci menˇs´ım u´sil´ım – z´aleˇz´ı na konkr´etn´ıch poˇzadavc´ıch. Co je snadn´e v jednom, je obt´ıˇzn´e ve druh´em a naopak. . . Aktu´aln´ı funkce a schopnosti syst´em˚ u se st´ale mˇen´ı a vylepˇsuj´ı.