BIBLIOMETRIE PRO MĚŘENÍ KVALITY INFORMACÍ J. Potomková Knihovna LF UP v Olomouci
[email protected] Programové vybavení ordinace zubního lékaře
Definice bibliometrie • Bibliometrie je vědní disciplína, založená na kvantitativní analýze a měření dokumentů určených na zaznamenání a komunikaci vědeckých poznatků. • Bibliometrické metody vycházejí z předpokladu, že dokumenty jsou odrazem stavu vědeckého poznání, myšlení a komunikace znalostí.
BIBLIOMETRIE a příbuzné vědní obory • Infometrie – kvantitativní a kvalitativní hodnoty informací získané z různých komunikačních médií
• Scientometrie – zákonitosti vědecké produktivity a její výsledná prospěšnost
• Kybermetrie – funkce a efektivita počítačových systémů a internetového prostoru.
Historie bibliometrie • 1917 - F.J.Cole a N.B. Eales publikovali práci pro výzkum oboru anatomie “Statistická analýza literatury”. Snažili se dokázat vývoj zájmu o tento obor v jednotlivých zemích pomocí metod statistického rozložení. • 1923 - Knihovník britského patentového úřadu E. W. Hume vytvořil statistickou analýzu vývoje vědy. Vycházel z bibliografických záznamů v časopisech ze 17 sekcí Mezinárodního katalogu vědecké literatury. • 1927 - Vznikla první analýza citací. Její autoři P.L.K.Gross a E.M.Gross spočítali a analyzovali citace článků v chemických časopisech. Poté nastal prudký nárůst aplikování citační analýzy.
Bibliometrické zákony
Bibliometrické zákony Zákonitosti růstu, rozptylu a stárnutí publikací. • Bradfordův - rozptyl informací • Lotkův - měření autorské produktivity • Zipfův – lingvistická frekvenční analýza, indexace a vyhledávání v Internetu
Bradfordův zákon ZÁKON ROZPTYLU INFORMACÍ S. C. Bradford - americký knihovník, jeden ze zakladatelů bibliometrie zkoumal rozptyl relevantních článků v časopisech vůči konkrétnímu oboru maximální počet relevantních článků je soustředěn v minimálním počtu časopisů tvořících tzv. jádro oboru. vědecké časopisy je možno rozdělit podle klesající produktivity článků o daném tématu takto:
jádro – články výhradně o příslušném tématu zóny, které mají stejný počet článků jako jádro
Počet časopisů v jádru a sestupných zónách je v poměru 1:n:n2 Zákon byl formulován 1934 při řešení rešeršního problému v oblasti geofyziky.
Bradfordův zákon Algoritmus • Všechny články lze rozdělit na jádro a 2 zóny – jádro i každá zóna obsahují přibližně 1/3 všech článků. – články z jádra jsou publikovány v časopisech, specializovaných na danou tématiku
• články 1. zóny jsou publikovány v n-krát větším počtu průřezových časopisů a časopisů hraničních oborů. • články z 2. zóny jsou rozptýleny v přibližně n2 časopisech.
Bradfordův zákon Jak to zjistil? • Bibliografie z oboru geofyziky – 326 časopisů • 9 časopisů = 429 článků • 59 časopisů = 499 článků • 258 časopisů = 404 článků
• Použití v knihovnách při tvorbě časopiseckých fondů
Bradfordův zákon – příklad: Celkový počet článků = 690 Počet titulů časopisů = 26 Jádro = 2 (23O) Zóna1 = 6 (230) Zóna2 = 18 (230) Algoritmus: 1:n:n2 1:3:9 n=3 (číslo získáme vydělením počtu titulů v 1. zóně počtem titulů obsažených v jádru)
Lotkův zákon MĚŘENÍ VĚDECKÉ PRODUKTIVITY A. Lotka (1880 – 1949), americký matematik, fyzikální chemik a statistik oblast fyziky a chemie
produktivita autorů - rozložení autorů podle produkce 1926 - srovnávání publikační činnosti chemiků a fyziků pokud a1 autorů publikuje jeden článek, pak an bude počet autorů, kteří publikují n článků.
an = a1 / n2
podle Lotky můžeme předem stanovit, kolik autorů publikuje více článků v případě, že známe počet autorů, kteří publikovali 1 článek v dané tématické oblasti. počet autorů s n tituly (např. knihami, články) činí cca 1/n2 z počtu těch, kteří jsou autory pouze 1 titulu. podíl autorů pouze 1 titulu je cca 60%, podíl autorů většího počtu titulů exponenciálně klesá. na každých 100 autorů/1 článek připadá 25 autorů/2 články 11 autorů/3 články 6 autorů/4 články
Aplikace Lotkova zákona Objektivní kritéria hodnocení pracovníků a pracovišť akademických institucí. • Publikace Masarykovy univerzity 1994 – 2004 – 4179 autorů – 70 936 publikací
• Jaký počet autorů napsalo kolik publikací
Zipfův zákon FREKVENČNÍ ANALÝZA, LINGVISTICKÁ STATISTIKA
G.K. Zipf (1902-1950) americký filolog a statistik, profesor lingvistiky na Harvardské univerzitě Slova uspořádal podle frekvence ( f ) výskytu a slovo s hodnotou nejvyššího výskytu dostalo „rank 1 ( r =1), další slovo „rank 2“ atd. Zipfův zákon vyjadřuje skutečnost, že základ lexiky (slovní zásoby) vytváří relativně malý počet silně frekventovaných slov Jsou-li slova delšího textu seřazena podle pořadí klesající četnosti výskytu, potom součin pořadí ( r ) a četnosti ( f ) pro každé slovo v textu bude přibližně = konstanta ( C ), která závisí na délce textu. rxf=c
Na základě Zipfova zákona se konstruovaly slovníky rešeršních slov a nevýznamových (stop) slov, které jsou základem pro automatické vyhledávání a uspořádání výsledků podle relevance. Využití při koncipování základních funkcí Internetu včetně rozvoje vyhledávacích služeb.
Povrchový a hluboký web Povrchový web volně přístupný pro vyhledávací stroje obsahuje cca 1 miliardu webových stránek
Hluboký web
nepřístupný pro vyhledávací stroje dokumenty profesionálních databází 500x obsáhlejší než povrchový 550 miliard dokumentů 7 500 terabytů informací 100 000 webových sídel (www.completeplanet.com) 60 největších sídel obsahuje cca 750 terabytů informací
nejrychleji rostoucí webová kategorie s novými informacemi kvalita obsahu (pode jeho autorů) 1000- až 2000-x vyšší.
Kybermetrie hlubokého webu 1 Scirus http://www.scirus.com 2001 firma Elsevier Science Vyčlenění informací relevantních pro vědu, výzkum a vzdělávání Ocenění WebAward 2004 Pokrytí cca 167 milionů webových stránek univerzit, vědeckých, výzkumných a vládních organizací, odborných společností, konferencí aj. Používá pokročilé vyhledávání a operátory Uveřejňuje své zdroje Možnost porovnání výsledků s Googlem
Kybermetrie hlubokého webu 2 Google Scholar http://www.scholar.google.com Vyhledávání vědeckých textů Citační ohlasy („Cited by“) Indexace dokumenty ze všech významných databázových center kromě Elsevier Science volně přístupné archivy s garantovaným obsahem,
„Pagerank“ – vyhodnocení relevance vyhledaných dokumentů Vydavatelé, agregátoři, profesních organizace, repozitáře preprintů Prolinkování vvyhledaných výsledků s plnými texty v databázích (např. EBSCO, Proquest, JSTOR) podle institucionálních licencí.
Institute for Scientific Information • Philadelphia, Penn. • 1960, E. Garfield – chemik, lingvista, informatik – Science Citation Index – Impact Factor
Citační rejstříky Web of Knowledge http://isiknowledge.com • Science Citation Index • Social Sciences Citation Index • Art & Humanities Citation Index
Citační analýza 1 • Metoda hodnocení kvality a významu vědeckých publikací – sledování četnosti citování
• Optimalizace informačních toků • Profilování knihovních fondů • Citační mapování vědy pomocí konstrukce citační sítě.
Citační analýza 2 • Které prameny jsou v dokumentu citovány • Ve kterých dokumentech je pramen citován • Které dokumenty jsou citovány hodně / málo /vůbec • Které citace se objevují často spolu • Kteří autoři se objevují často spolu / se navzájem citují • Které prameny jsou klíčové pro určitý obor / téma
Impakt faktor časopisů • Faktor dopadu publikovaných výsledků na jejich praktické využití a rozvoj oboru • Stupeň vědeckého uznání autora • Ohlas publikací u odborné veřejnosti • Stav a vývoj různých vědních disciplín – ve světě – v jednotlivých zemích – na pracovištích.
Oblasti aplikace bibliometrického výzkumu 1 • Zkoumání citačních vazeb dokumentů • Citační analýza vědeckých časopisů • Analýza publikační činnosti vědeckých pracovníků • Zkoumání mezinárodních publikačních trendů • Počítačová analýza publikací tvůrčích pracovníků • Rozložení tvůrčí výkonnosti
Oblasti aplikace bibliometrického výzkumu 2 • Zkoumání informačních potřeb • Zjišťování tématického rozptylu literatury v časopisech • Vyhledávání informací včetně hodnocení kvality • Hodnocení vědců, publikací a vědeckých institucí
Problémy bibliometrie •
Nekompletnost údajů ISI – citovanost i z jiných zdrojů (Scholar Google, Scopus)
•
Autocitace – rozumná míra, cykličnost vědy
•
Vícenásobné autorství – hodnocení pracoviště
•
Kolísání v čase – vědecké projekty (začátek – průběh – konec)
•
Zvláštnosti vědních disciplín – Různé možnosti publikovat
• • • •
Jazykové bariéry Chyby v citování Nadřazenost multidisciplinárních časopisů Impakt faktor časopisů – monopol ISI, časová náročnost
Autorství Podíl vědců na • Výzkumných projektech • Vedení výzkumných skupin • nemělo by se zapomínat na ty členy týmu, kteří sice nepřispívají aktivně k výzkumu, ale jsou důležití pro zajišťování prostředků na výzkum – většinou jsou málo citovaní
• Účelové vzájemné citování • Citování negativních výsledků.
Cíle informačních analýz • • •
Sledování úrovně a trendů rozvoje • oborů, států, regionů … Hodnocení výsledků a přínosu vědy • obory, týmy… Profilování a optimalizace informačních fondů • vytipování nejvhodnějších zdrojů informací • inovace fondu vzhledem k rozvoji oboru • vytipování a odstranění zbytečných zdrojů informací • rozbory spokojenosti uživatelů.
Závěr • Citační analýza a její prostředky jsou doposud nejspolehlivějším nástrojem hodnocení vědeckého výzkumu, publikací, vědců a vědeckých institucí. • Je nepostradatelná v modelování rozvoje výzkumu, vědy a technologie • Je jedním z hodnotících kritérií vědeckého výkonu.
Literatura • Na požádání u autorky přednášky
[email protected]