c
Úvod
Úvod Účel tezauru
Tezaurus technické knihovny Škoda Auto a. s. slouží pouze potřebám této instituce, jelikož při jeho tvorbě se vycházelo z jejího fondu. Technická knihovna zpřístupňuje čtenářům přes 8500 svazků knih (monografií, sborníků, absolventských prací), téměř 200 CD-ROMů, 30 audio- a 90 videokazet. Ke katalogizaci těchto dokumentů slouží automatizovaný knihovnický systém BIBIS, který obsahuje programy pro tezaurus. V současnosti tyto programy obsahují skoro 1800 spíše, než-li deskriptorů, klíčových slov. Mezi těmito slovy nejsou tedy vytvořeny žádné vztahy (hierarchie, asociace, ekvivalence). Lexikální jednotky jsou mnohdy zaneseny
duplicitně
(analytická
chemie,
chemie
analytická),
s
překlepy a ve tvarech, které katalogizační pravidla nepřipouští (chem. průmysl). Tyto nedostatky by měl odstranit právě vzniklý tezaurus.
Struktura a tematické oblasti tezauru
Záběr pracovních činností jednotlivých útvarů společnosti Škoda Auto a. s. je velice široký, což se odráží i v rozmanitém složení obsahu dokumentů fondu knihovny. Lexikální jednotky bylo tedy možno rozčlenit do čtyř tematických oblastí (vědy, průmysl a služby, vyrábění, ostatní). V některých těchto oblastech vykrystalizovaly silné skupiny, které jsou v tezauru nazývány mikrotezaury a tvoří základ systematického
pořádání.
Celkový
počet
mikrotezaurů
se
ustálil na čísle 15. Obsahy jednotlivých oblastí by se daly jednoduše charakterizovat takto: -
vědy: vědní disciplíny a jejich zkoumané objekty a jevy
d
Úvod
-
průmysl a služby: průmyslová odvětví, předměty jejich zájmu a stroje, přístroje, nástroje, zařízení
-
vyrábění: výrobní procesy a to, co slouží k dalšímu zpracování (látky, suroviny, jednoduché výrobky)
-
ostatní:
pojmy
nezařaditelné
do
žádné
z
předchozích
třech oblastí Rozsáhlé polyhierarchické řetězce jsou v mikrotezaurech zaneseny pouze jedenkrát. Od příslušného pojmu, který je na obecnější úrovni, je odkázáno (→ → SAMOSTATNÝ MIKROTEZAURUS XX) k termínu na nižší úrovni, který obsahuje svůj úplný hierarchický řetězec. Systematické uspořádání mikrotezaurů je rozčleněno do dvou sloupců. V prvním jsou zachyceny hierarchické řetězce a ve druhém jsou deskriptory seřazeny podle abecedy. V systematickém rejstříku však nejsou zachyceny nepreferované termíny a vztahy asociace, což z tohoto uspořádání dělá pouze doplňující prostředek k abecednímu rejstříku. Základem tezauru je tedy abecední rejstřík. Obsahuje preferované i nepreferované lexikální jednotky. Uspořádání prefixů
v deskriptorových odstavcích preferovaných termínů
je následující:
MT
- mikrotezaurus
VP
- vysvětlující poznámka
EKV – nedeskriptor; uvede se jako prefix nepreferované lexikální jednotky ND
- nadřazený deskriptor
PD
- podřazený deskriptor
AD
- asociovaný deskriptor
U každého deskriptoru je vyjádřeno jeho zařazení do mikrotezauru a sémantické vztahy k dalším pojmům v tezauru – vztah ekvivalence, vztah hierarchie, vztah asociace. U
e
Úvod
deskriptorů, jejichž význam je méně známý nebo není zcela jednoznačný, jsou uvedeny vysvětlující poznámky. Kromě deskriptorů jsou v abecedním rejstříku obsaženy i nedeskriptory. Jsou uvedeny jednak u příslušného deskriptoru, kde jsou označeny zkratkou EKV a jsou dále zařazeny i abecedně. Na rozdíl od deskriptorů nejsou vyznačeny tučným písmem a obsahují vždy odkaz (VIZ) k příslušnému deskriptoru; jsou to tedy pojmy, kterých se při indexování nepoužívá. Nedeskriptory jsou dvojího druhu – buď jde o synonymní, tedy obsahově ekvivalentní výrazy, z nichž jen jeden se může používat pro popis dokumentů, nebo může jít o pojmy nesynonymní, významově podřazené, avšak s vyhledávací silou natolik malou, že je vhodnější zvolit příslušný pojem nadřazený.
Pravidla a statistické údaje
Tezaurus byl vypracován v souladu s normou ČSN 01 0193 ISO 2788 : dokumentace : pokyny pro vypracování a rozvíjení jednojazyčných tezaurů, která je stručně popsána v první části absolventské práce. Při
řazení
lexikálních
jednotek
byl
brán
ohled
na
existenci normy ČSN 97 6030 : abecední řazení. Tezaurus technické knihovny k 4. 12. 2000, kdy byla zařazena poslední lexikální jednotka, měl tyto statistické údaje: počet lexikálních jednotek celkem
716
-
z toho deskriptorů
459
-
z toho nedesriptorů
257
Užívání a aktualizace tezauru
Prvním důležitým krokem, který indexátor vykonává, je obsahová analýza dokumentu. Po důkladném promyšlení obsahu
f
Úvod
vytvoří zpracovatel soubor slov, která postihují všechny podstatné obsahové složky příslušného dokumentu (klíčová slova). Protože však k popisu dokumentu může indexátor použít jen výrazy uvedené v tezauru, musí vybraná klíčová slova
s tezaurem
porovnat.
K vyhledávání
v tezauru
používá
abecední rejstřík, kde je každý termín uveden v širším kontextu s nadřazenými i podřazenými pojmy, což indexátorovi buď
potvrdí
správnost
volby
daného
termínu
nebo
vede
k upřesnění výrazu. Důležitým jsou
prostředkem
jednotlivé
z určité
oblasti.
k
usnadnění
mikrotezaury, Hledání
které
práce
indexátora
shrnují
v mikrotezaurech
termíny
má
význam
v případech, když se indexátorovi nepodaří nalézt klíčové slovo v abecedním rejstříku. Pak je tedy třeba prohledat celou oblast, do níž hledaný pojem obsahově spadá, to znamená prohledat příslušné mikrotezaury. Porovnáváním klíčového
slova
s deskriptory
daného
mikrotezauru
indexátor
zjišťuje, zda se některý z deskriptorů může z hlediska obsahu i rozsahu pojmu použít jako ekvivalent klíčového slova. Může však nastat případ, že ani po prohledání příslušného
mikrotezauru
není
rovnocenný
deskriptor
nalezen.
V tomto případě je třeba redakci tezauru navrhnout zařazení klíčového slova do tezauru jako nového deskriptoru. Dokud však slovo jako nový deskriptor nebylo redakci schváleno, neměl by jej indexátor použít a měl by se o jeho vyjádření pokusit jiným způsobem - u víceslovných spojení rozkladem na sémantické složky nebo musí volit k jeho vyjádření obecnější deskriptor na nejbližší vyšší hierarchické úrovni. Po převedení všech klíčových slov do selekčního jazyka indexátor znovu zkontroluje vybrané deskriptory a uváží, zda
přesně
vyjadřují
obsah
dokumentu.
Aby
nedocházelo
k změnám gramatických forem a pravopisu deskriptorů, použije pracovník knihovny k přiřazení jednotlivých deskriptorů
g
Úvod
předem nadefinovaný tezaurus obsažený v systému BIBIS. Pokud indexátor bude přiřazovat deskriptory ručním vypisováním jednotlivých slov, bude muset dbát zvláštní obezřetnosti, neboť každý deskriptor musí přesně odpovídat tvaru uvedenému v tezauru. Co se týče počtu deskriptorů použitých k popisu dokumentu, záleží to pochopitelně na obsahu dokumentu. Obecně však lze říci, že na základě prováděných výzkumů se za nejvhodnější považuje použít k popisu 5 – 8 deskriptorů. [2] Menší složky
počet
může
obsahu
znamenat,
dokumentu,
že
větší
nejsou počet
postiženy může
všechny
naopak
vést
k tomu, že z hlediska obsahu jsou postiženy i složky méně závažné. Kromě deskriptorů uvedených v tezauru se mohou pro popis dokumentů použít i jakékoli vlastní názvy (jméno osobnosti, zeměpisný název, název organizace, instituce apod.). Těmto pojmům se říká identifikátory. Jejich soupisy jsou vypracovávány odděleně od abecedního soupisu lexikálních jednotek, jelikož zařazování nových identifikátorů je jednodušší než zařazování ostatních lexikálních jednotek. V Tezauru technické knihovny nejsou identifikátory zařazeny, jelikož by způsobily enormní nárůst lexikálních jednotek. Z toho důvodu zde uvádím zásady, které je nutné respektovat při jejich přiřazování k dokumentům: -
jména osob se píší v invertované podobě s plně uvedenými křestními jmény (např. Laurin, Václav). Osoby stejného jména se odlišují doplňkem (např. Benz, Carl, 1844 1929; Ford, Henry, otec);
-
zeměpisné názvy se uvádějí v tvaru obvyklém pro češtinu (např. Londýn, nikoli London);
-
názvy institucí a organizací píšeme v plném tvaru, nikoli zkratkou (např. České vysoké učení technické). Pro mezinárodní organizace a instituce platí stejné pravidlo jako pro zeměpisné názvy;
h
Úvod
-
názvy jednotlivých variant, typů, modelů produktů doporučuji zaznamenávat s názvem jeho výrobkové řady (např. Favorit je název modelu výrobkové řady automobilů Škoda; při indexování by se u dokumentu měly objevit identifikátory Škoda a Favorit) Kromě deskriptorů a identifikátorů mohou být dokumen-
tům přiřazovány i formální deskriptory, což jsou pojmenování druhů dokumentů (např. slovníky, encyklopedie, tabulky). Při přiřazování formálních deskriptorů by měla být dodržována tato pravidla: -
názvy dokumentů uvádíme v množném čísle
-
pokud možno vyhýbáme se obecným pojmenováním dokumentů (např. použijeme slovníky, nikoli příručky) Pokud to indexování vyžaduje, mohou být dokumenty vy-
mezeny i z hlediska jazykového (např. Česko-francouzskému slovníku by byly přiřazeny tyto deskriptory: slovníky, čeština, francouzština).
Redakce tezauru
Michal Mulač U Stadionu 818 293 01
Mladá Boleslav
0326/733624, 0607/616328
Doufám, že nový Tezaurus technické knihovny přispěje k efektivnějšímu ukládání a vyhledávání informací, a že i přes možné nedostatky, které ukáže až čas, bude velkým pomocníkem uživatelů informačního systému technické knihovny Škoda Auto a. s.