Dnešní témata
Vědecký zákon Obecná, stálá, vnitřní a nutná souvislost mezi jevy a věcmi, zpravidla matematicky vyjádřitelná
Zákony ICT a informačního managementu Kvantitativní metody v dokumentové komunikaci
Typy vědeckých zákonů: zákony fungování / vývojové zákony zákony logické (teoretické) / empirické zákony
VOŠIS – ZIZ 4
1
VOŠIS – ZIZ 4
Příklady: zákon fungování – vývojový zákon
Příklad „vývojového zákona“ v ICT: Historický vývoj sociální komunikace Nový typ sociální komunikace je vždy podmíněn vznikem nového média
Zákon akce a reakce Síly, jimiž na sebe vzájemně působí dvě tělesa, mají vždy stejnou velikost a opačný směr. Zákon ffloristické a ffaunistické pposloupnosti p Fosilní flóry i fauny následují jedny po druhých v určitém a trvalém pořádku, přičemž každá geologická formace má odlišný ráz života od formace podložní (starší) i nadložní (mladší). VOŠIS – ZIZ 4
2
3
1)
řečová komunikace (jazyk)
2)
dokumentová komunikace písmo – rukopisy, knihtisk − tisky
3))
masmédia uchování a přenos obrazu, záznam a přenos zvuku – hromadné sdělovací prostředky – fotografie, telegrafie, telefonie, rádio, film, televize
4)
elektronická komunikace počítače, informační technologie, digitalizace
5)
Internet
VOŠIS – ZIZ 4
4
1
Inženýrské (technické) zákony 1) Zákony logické (teoretické, „přírodní“) určují, jak věci v technice fungují Archimedův zákon Ohmův zákon Kirchhoffův zákon
„If there's more than one way to do a job, and one of those ways will result in disaster, then somebody will do it that way.“ (1949) 5
Ranganathanovy zákony
VOŠIS – ZIZ 4
6
7±2
Shyali Ramamrita Ranganathan
George A. Miller (3. 2. 1920)
(1892 – 1972) indický matematik a knihovník
profesor psychologie na Princetonské univerzitě
5 knihovnických zákonů 1. Knihy jsou určeny k užívání 2 Knihy jsou pro všechny – aneb každému čtenáři jeho 2. knihu 3. Každé knize jejího čtenáře 4. Časem čtenáře je třeba šetřit 5. Knihovna je rostoucí organismus VOŠIS – ZIZ 4
Edward A. Murphy, Jr. (1918 – 1990) letecký inženýr
2) „Ty druhé“ – empirická pravidla (rules of thumb) vycházejí ze zkušenosti (empirie) VOŠIS – ZIZ 4
Murphyho zákon
7
The Magical Number Seven, Plus or Minus Two: Some Limits on Our Capacity for Processing Information. The Psychological Review. 1956, vol. 63, pp. 81-97. VOŠIS – ZIZ 4
8
2
Pravidlo šesti stupňů oddělení six degrees of separation
Steven Strogatz, Strogatz Duncan Watts (2001)
Obecný charakter kvantitativních „zákonů“ v ICT empirická povaha neberou v úvahu kvalitu (obsah)
Platí v grafech (sítích) s velkým počtem smysluplně propojených uzlů
1) exponenciální vzrůst (dynamické jevy) zákony rychlosti změny, změny vzrůstu počtu zdrojů 2) inverzní poměr / rozdělení (statické jevy – objekty) zákony struktury zdrojů VOŠIS –- ZIZ 54
9
1) Zákony „rychlosti změny“, vzrůstu počtu zdrojů
VOŠIS – ZIZ 4
10
Informační exploze
exponenciální nárůst zdrojů informační / publikační exploze informační zahlcení ekonomika nadbytku dynamická povaha informačního prostředí (prostoru) x neměnná kapacita lidského mozku VOŠIS – ZIZ 4
11
VOŠIS – ZIZ 4
12
3
Informační exploze
VOŠIS – ZIZ 4
Informační exploze
13
14
Informační exploze
Informační exploze
VOŠIS – ZIZ 4
VOŠIS –- ZIZ 54
15
VOŠIS – ZIZ 4
16
4
Mooreův zákon
Metcalfův zákon
Gordon E. Moore (3. 1. 1929) spoluzakladatel firmy Intel
Robert M. Metcalfe (1946) autor koncepce sítě Ethernet
Počet tranzistorů, které lze integrovat na jeden čip, se při konstantních nákladech každý rok zdvojnásobí. VOŠIS – ZIZ 4
Užitečnost sítě stoupá tempem, které se rovná druhé mocnině počtu jejích uživatelů 17
18
Metcalfův zákon a jeho alternativy
Metcalfův zákon (1980)
VOŠIS – ZIZ 4
VOŠIS – ZIZ 4
19
VOŠIS –- ZIZ 54
20
5
Matoušův efekt
2) Zákony struktury zdrojů
Kdo má, tomu bude dáno a bude mít ještě víc, kdo nemá, tomu bude odňato i to, co má. Mat. 13,12
inverzní poměr (nepřímá úměrnost) Paretovo rozdělení (20/80) power law pozitivní ii zpětná ě vazba b
též: haló efekt, kumulativní efekt, pozitivní zpětná vazba (čím víc, tím víc) VOŠIS – ZIZ 4
21
VOŠIS – ZIZ 4
22
Inverzní poměr (nepřímá úměrnost) – příklady
The Long Tail
texty tvoří malé množství slov s vysokou frekvencí výskytu a velké množství slov s nízkou frekvencí výskytu je mnoho autorů, kteří publikují málo, a málo autorů, kteří publikují hodně
Chris Anderson, šéfredaktor časopisu Wired
velké množství článků je publikováno v malém počtu časopisů čím vyšší přesnost, tím nižší úplnost VOŠIS – ZIZ 4
23
VOŠIS – ZIZ 4
24
6
Analýza komunikace pomocí kvantitativních (matematických a statistických) metod
Bibliometrie předmět zkoumání: informační zdroje kolekce (soubory, fondy) dokumentů nebo údajů o nich (bibliografických citací), autoři, instituce
informetrie (infometrie) scientometrie (scimetrie) bibliometrie webometrie data mining web minig VOŠIS – ZIZ 4
využití kvantitativních charakteristik: správa rozsáhlých kolekcí indikace kvality kritéria relevance metody: frekvenční analýza měření relevance citační analýza 25
Kvantifikovatelné atributy (vlastnosti) informace
VOŠIS – ZIZ 4
26
Zipfův zákon
stárnutí – nikoli s časem, ale s objevením se novější relevantnější informace („poločas rozpadu“ informace) počet (množství) − nově vytvořená informace nenahrazuje zcela informaci předchozí kumulativnost, exponenciální růst
předmět: rozložení slov podle frekvence jejich výskytu v textech inverzní vztah mezi četností jevu a jeho pořadím
rozptyl − seskupení relevantních dokumentů ve velkých souborech do zón podle určitého pravidla užitná hodnota / relevance je relativní, nikoli absolutní VOŠIS – ZIZ 4
27
VOŠIS – ZIZ 4
28
7
Zipfův zákon
Lotkův zákon předmět: rozložení autorů podle produkce
Součin pořadí slov uspořádaných podle frekvence jejich výskytu v textech a jejich frekvence je konstantní.
VOŠIS – ZIZ 4
inverzní vztah mezi počtem autorů a počtem jimi publikovaných dokumentů
29
Počet autorů s n tituly (např. knihami, články) činí cca 1/n z počtu těch, kteří jsou autory pouze 1 titulu. Podíl autorů, kteří jsou autory pouze 1 titulu, je cca 60 %, podíl autorů většího počtu titulů exponenciálně klesá. VOŠIS – ZIZ 4
Bradfordův zákon
30
Bradfordův zákon 1 : n : n2
předmět: rozložení relevantních článků v odborných periodikách
2. zóna 1. zóna
inverzní vztah mezi počtem časopisů a počtem v nich publikovaných článků
jádro 1
Maximální počet relevantních článků je soustředěn v minimálním počtu časopisů tvořících tzv. jádro oboru. VOŠIS – ZIZ 4
1*n 1 * n2 31
VOŠIS – ZIZ 4
32
8
Relevance
Měření relevance hodnocení výsledků vyhledávání informací
důležitost, závažnost (opak: irelevance, šum) vztah vyhledaného informačního objektu (zdroje, záznamu, dokumentu) a informačního požadavku (dotazu), příp. informační f potřeby b
relevance informační šum ú l úplnost t přesnost
informace, které jsou z hlediska požadavku či potřeby důležité, jsou relevantní VOŠIS – ZIZ 4
33
VOŠIS – ZIZ 4
34
Informační šum (information noise)
Typy relevance a) formální shoda h d kódu kód dotazu d t s kódem kód (selekčními ( l kč í i údaji) úd ji) dokumentu určuje vyhledávací program
chyba vyhledávacího systému:
b) věcná
nevyhledání relevantních dokumentů vyhledání hl d nerelevantních l h dokumentů d k ů (odpad, false drop)
vztah obsahové blízkosti dokument – dotaz určuje uživatel – objektivně
c) pertinence vztah obsahové blízkosti dokument – informační potřeba určuje uživatel – subjektivně VOŠIS – ZIZ 4
35
VOŠIS – ZIZ 4
36
9
Určování formální relevance
Určování věcné relevance Rozdělení prohledávaného souboru na 4 podmnožiny
Skórování relevance (relevance ranking): porovnání slov z dotazu se slovy v dokumentu rozsah shody četnost inverzní četnost hustota VOŠIS – ZIZ 4
37
rele antní relevantní
A
B
irelevantní
C
D 38
Přesnost (precision)
pravděpodobnost, že relevantní informační objekt bude vybrán počet vyhledaných a relevantních objektů
pravděpodobnost, že vybraný informační objekt bude relevantní počet vyhledaných a relevantních objektů
celkový počet relevantních objektů v souboru VOŠIS – ZIZ 4
nevybráno
VOŠIS – ZIZ 4
Úplnost (recall, výtěžnost, rozsah)
vybráno
celkový počet vyhledaných objektů 39
VOŠIS – ZIZ 4
40
10
Vztah nepřímé úměrnosti přesnost – úplnost
Cíl vyhledávání informací
čím vyšší úplnost, tím nižší přesnost (a naopak)
co nejvyšší úplnost (recall) a přesnost (precision)
Čím více se přiblížíte úplnému zachycení celého tématu, tím více irelevantního materiálu najdete VOŠIS – ZIZ 4
41
Úplnost na úkor přesnosti
VOŠIS – ZIZ 4
VOŠIS – ZIZ 4
42
Přesnost na úkor úplnosti
43
VOŠIS – ZIZ 4
44
11
Významnost slov v textu vzhledem k vyhledávání
Přijatelný kompromis
významná slova (slova s velkou selektivní silou): mohou vyjadřovat téma dotazu a jejich použití v dotazu vymezí nějakou „rozumně velkou“ množinu dokumentů málo významná slova: vzhledem k dané množině dokumentů vykazují velmi malou selektivní sílu – tj. vyskytují se ve většině textů VOŠIS – ZIZ 4
45
Selektivní síla slova
46
Citační analýza Eugen Garfield (1925) kvantifikace vztahů mezi autory, dokumenty a vědními obory na základě bibliografických citací a odkazů (referencí)
A počet dokumentů ve fondu (zdroji, databázi) A – B B počet vybraných dokumentů S= A S selektivní síla
využití: i počet citací dokumentu − impact (vliv, impakt), PageRank vztahy dokumentů (obsahová souvislost vyjádřená citací)
0 nejnižší (A = B nic se nevyřadí, vybere se celý fond) 1 nejvyšší (B = 0 nic se nenajde) Optimální je selektivní síla blížící se 1 VOŠIS – ZIZ 4
VOŠIS – ZIZ 4
47
VOŠIS – ZIZ 4
48
12
Problémy citační analýzy stanovené hypotézy (obsahová souvislost, impakt faktor) platí jen v určitých sférách publikační praxe (věda, výzkum) důvodem k citování nemusí být vždy kvalita díla porušování citační etiky nepřesné uvádění citací (citace nejsou zachyceny při automatizovaném zpracování) VOŠIS – ZIZ 4
49
13