Digitální knihovny: principy a problémy Jaroslav Pokorný MFF UK Katedra softwarového inženýrství Praha email:
[email protected]
J. Pokorný, Knihovny 01
1
Úvod • digitální knihovna - od r. 1994 (elektronická knihovna, virtuální knihovna) • vize: J.C.R. Licklider, 1965 • rozvoj: – knihy (Fox, Arms, …)
– časopisy (D-Lib Magazine, Int. J. on DL) – konference (ACM Int. Conf. on DL) – předmět výuky J. Pokorný, Knihovny 01
2
Úvod
?
• digitální knihovna jako disciplína knihovníci: další krok v automatizaci knihoven databázisti: architektura federativních databází propagátoři hypertextu: aplikace hypertextové technologie informatici: aplikace workflow systémů propagátoři Webu: Web je digitální knihovna
J. Pokorný, Knihovny 01
3
Obsah • • • • •
vymezení pojmu digitální knihovny komponenty digitální knihovny architektura digitální knihovny budování digitální knihovny od digitální knihovny k automatizované digitální knihovně • závěr J. Pokorný, Knihovny 01
4
Vymezení pojmu DK Co je společné mnoha definicím: • DK není jednotlivá entita • DK vyžaduje technologii umožňující propojit několik informačních zdrojů • propojení mezi více DK a informačními službami má být pro uživatele transparentní • cílem budování DK je univerzální přístup k informačním zdrojům a službám J. Pokorný, Knihovny 01
5
Vymezení pojmu DK Zde: DK je řízená kolekce informací spolu s jistými službami, přičemž tyto informace jsou uloženy v digitální formě a jsou přístupné po síti Lépe: systém DK
J. Pokorný, Knihovny 01
6
komunikace (průchodnost, konektivita)
Umístění digitální knihovny ve výpočetním a komunikačním prostoru
trajektorie v technologii digitálních knihoven: intelektuální přístup ke globálně distribuovaným informacím
počítačové zpracování (flops) digitální obsah méně J. Pokorný, Knihovny 01
více
(původ: S. Griffin, NSF) 7
Komponenty digitální knihovny • elementy – data – metadata – procesy
• doména ⇒ fyzické, digitální, hybridní knihovny
• přístup: onl-line přes knihovnu, přímo, na CDROM (např. ACM a IEEE Digital libraries) J. Pokorný, Knihovny 01
8
Komponenty digitální knihovny data objekty převedené kniha, časopis, z fyzických zdrojů video
nové digitální objekty
J. Pokorný, Knihovny 01
hypertextová kniha, počítačový program, vizualizace vědeckých dat, elektronický časopis
metadata
procesy
statický index, tezaurus, klasifikace, prostorové umístění
akvizice dat,
dynamický index, profily uživatelů, anotace zdrojů, tématické portály, ontologie
fulltextové vyhledávání, perzonalizace nabídek přírůstků, výběr pomocí agentů
katalogizace, vyhledávací služby, výpůjční služby
9
Architektura digitální knihovny klasické konceptuální schéma
uživatel uživatel
knihovník knihovník
tvůrce tvůrce informací/ informací/ vydavatel vydavatel
J. Pokorný, Knihovny 01
server server digitální digitální knihovny knihovny
klient klient digitální digitální knihovny knihovny
10
Architektura digitální knihovny brány
uživatelská rozhraní
procesor pro MM/ HT
manažer pracovních toků
vyhledávací stroje, klasifikátory, … SŘBD data, MM Info J. Pokorný, Knihovny 01
manažer práv přístupu repozitář
11
Architektura digitální knihovny konceptuální schéma s distribuovanými informačními zdroji uživatel uživatel
knihovník knihovník tvůrce tvůrce informací/ informací/ vydavatel vydavatel tvůrce tvůrce informací/ informací/ vydavatel vydavatel tvůrce tvůrce informací/ informací/ vydavatel vydavatel J. Pokorný, Knihovny 01
server server digitální digitální knihovny knihovny
klient klient digitální digitální knihovny knihovny
Internet 12
Architektura digitální knihovny kooperace na různých úrovních Úroveň
Způsob kooperace
Příklad
federace
striktní standardy
MARC, Z39.50
sklízení dat shromažďování dat vyhledávací middelware J. Pokorný, Knihovny 01
DK nabízí základní metadata, protokol, otevřené archivy registraci DK nekooperují; vyhledávání vyhledávací pomocí služeb
stroje
zdroje s metadaty jsou volně Z93.50, XML, zapojovány do sítě
RDF, SDLIP
13
Federace autonomní DK založené na standardech a dohodách standardy a dohody: • technické: formáty, protokoly, systémy ochrany, apod. • obsahové: data a metadata (včetně sémantiky) • organizační : přístup, služby, placení, autentizace, apod. Př.: Z39.50 a MARC federace jsou potřebné, ale velmi náročné a dost řídké J. Pokorný, Knihovny 01
14
Sklízení dat DK: • poskytují stručná metadata pro každý prvek dat (např. Dublin Core) • podporují jednoduchý protokol pro přístup k metadatům
automatičtí ženci: • sklízejí metadata automaticky • budují se automatické služby Př.: Open Archives Initiative J. Pokorný, Knihovny 01
15
Shromažďování dat služby pro otevřený přístup k informacím dokonce i když jejich poskytovatelé se nedohodnou na standardech
• vyhledávací robot shromažďuje informace, které jsou otevřené k přístupu a indexuje je • možné jsou automatizované služby (např. ResearchIndex) Př.: Internet Archive, Google J. Pokorný, Knihovny 01
16
Vyhledávací middleware uživatel uživatel ontologie
dotaz odpověď
mediátor 1
mediátor 3 ontologie 3
mediátor 2
ontologie 1 repozitář 1 informační zdroj 1
J. Pokorný, Knihovny 01
ontologie 2
Z 39.50,
repozitář 2
XML, RDF informační zdroj 2
SDLIP
17
Model 5S
Societies Scenarios Spaces Structures Streams J. Pokorný, Knihovny 01
18
Model 5S • Společenství: interakce lidí (, počítačů) • Scénáře: služby, funkce, operace, metody • Prostory: domény + omezení (např. vzdálenost, sousedství): 2D, vektory, pravděpodobnost • Struktury: relace, stromy, uzly a hrany • Proudy: posloupnosti prvků (text, audio, video, síťový provoz)
J. Pokorný, Knihovny 01
19
5S: kombinace • Společenství + Scénáře = uživatelský model • Společenství + Scénáře + Prostory = uživatelské rozhraní • Proudy + Struktury = značkování • Proudy + Struktury + Scénáře = objekt • Struktury + Scénáře = SŘBD J. Pokorný, Knihovny 01
20
DK zkracuje řetěz mezi autorem a čtenářem autor editor
Recenzent
vydavatel A&I akvizice knihovna čtenář J. Pokorný, Knihovny 01
21
Přechod od klasické knihovny k digitální • vybudování technické infrastruktury (sítě, technika) • konstrukce digitálních kolekcí (skenování, tvorba metadat, popis zdrojů a jeho kódování, ontologie), • přehodnocení některých klasických knihovnických služeb, případně zavedení zcela nových, které vyžaduje nový způsob zpracování. ⇒ s technologickými problémy se spojují i problémy metodologické a ryze informatické
Nové standardy: DC, XML, RDF Další problémy: jména digitálních objektů J. Pokorný, Knihovny 01
22
Absorbování nových forem reprezentace informací do DK objevování informací pomocí Webu: • konkurence knihovně nebo její nový element? anonymní uživatel (knihovny): „Dříve jsem používal Inspec. Nyní místo toho používám Google.“ proč? – širší záběr (šedá literatura, multimediální informace) – lepší řazení – bezprostřední přístup k informacím (např. otevřený přístup k publikaci) J. Pokorný, Knihovny 01
23
Absorbování nových forem reprezentace informací do DK webové vyhledávací služby mají mnoho slabin ------
výběr je velmi libovolný indexování je nahrubo žádné řízení autorit detekce duplicit slabá nízká přesnost (ale vysoká úplnost!)
mnoha uživatelům to vyhovuje ...
J. Pokorný, Knihovny 01
24
Absorbování nových forem reprezentace informací do DK webové vyhledávání: • výběr každé webové stránky • indexování každého slova • opakuje se každý měsíc rysy: hrubá síla jednoduché algoritmy + škálovatelná výpočetní kapacita
J. Pokorný, Knihovny 01
25
Absorbování nových forem reprezentace informací do DK archivace a konzervace Př.: Internet Archive • měsíčně, webový robot sbírá každou otevřenou webovou stránku včetně obrázků • webové stránky jsou konzervovány pro příští generace • soubory jsou dostupné akademickým institucím Problémy: dynamika Webu (poločas rozpadu webové stránky je 2 roky)
J. Pokorný, Knihovny 01
26
Absorbování nových forem reprezentace informací do DK vazby pomocí odkazů Př.: ResearchIndex (CiteSeer, ScienceIndex) • tvorba: plně automatická • otevřený přístup ke všemu z informatiky • služba zdarma kontrast k Web of Science • tvorba: kombinace automatických prostředků a odborníků • omezený počet časopisů • velmi drahé
J. Pokorný, Knihovny 01
27
Od DK k automatizované digitální knihovně Změny: • v kvalitě knihovnických služeb • v kvantitě knihovnických služeb • nové ekonomické modely • pojem automatizované digitální knihovny
J. Pokorný, Knihovny 01
28
Vědecké knihovny jsou drahé Každá z těchto knihoven stojí více než skenování všech jejich knih
J. Pokorný, Knihovny 01
29
Vědecké knihovny jsou drahé
materiál knihovny
J. Pokorný, Knihovny 01
budovy a zařízení
personál
30
Potenciál digitálních knihoven
otevřený přístup
materiál
J. Pokorný, Knihovny 01
budovy a zařízení
personál
31
4 ekonomické modely Příklad: televizní vysílání Otevřený přístup reklama externí financování
komerční televize veřejno-právní televize
Omezený přístup předplatné zaplať za použití
J. Pokorný, Knihovny 01
kabelová televize zaplať za pořad
32
Příklady staré
nové
knihy v tisku (předplatné)
Amazon.com (reklama)
Medline (zaplať za použití)
Grateful Med (externí)
časopisy (předplatné)
archivy ePrint (externí)
Westlaw (zaplať za použití)
Legal Information Institute (externí)
Inspec (předplatné)
Google (reklama)
J. Pokorný, Knihovny 01
33
Náklady na automatizované digitální knihovny společnost Google • 5.5 milionů vyhledávání denně • 85 lidí (polovina technický personál, 14 má PhD v informatice) • 2,500 PC pod Linuxem, s 80 terabytes na discích
Internet Archive • 7 lidí + podpora od Alexa J. Pokorný, Knihovny 01
34
O budoucnosti otevřeného přístupu Dominantní silou bude tlak autorů, který zdůrazňuje spíše otevřený přístup než uzavřený. • bude působit více ekonomických modelů současně • otevřený přístup bude možná ke všem vědeckým či odborným informacím • nejčastější ekonomický model: informace budou publikovány organizací, která je produkuje Organizace, které budou produkovat informace budou univerzity, konference, laboratoře, společnosti atd. J. Pokorný, Knihovny 01
35
Potenciál automatizovaných digitálních knihoven otevřený přístup
? materiál
J. Pokorný, Knihovny 01
buildings počítače && facilities sítě
personál
36
Nové role vědeckých knihoven Akademické knihovny a asociace by měly poskytovat podporu pro otevřený přístup k informacím: -- zakládat standardy pro kvalitu výstupů výzkumu -- udržovat lokální archivy -- dlouhodobě pečovat o digitální informace a chránit je Důsledek: obnovení primární funkce - být vzdělávací institucí J. Pokorný, Knihovny 01
37
6 trendů místo závěrů Z konference Asociace amerických knihoven, 2000: • Jak zajistit věrohodnost a prestiž digitálních informačních zdrojů? • Jak prohledávat digitální kolekce, které jsou ve více jazycích? • Jak integrovat digitální kolekce, aby samy poskytovaly uživateli další nabídku možností vztažených k jeho problému? • Jak perzonalizovat služby podle profilu a zájmu uživatele? • Jak organizovat, aby informace samy hledaly svého uživatele? J. Pokorný, Knihovny 01
38