Předmětové pořádání informací - rekvalifikační kurz
Předmětové pořádání informací 1. Úvod: obecná metodika předmětové katalogizace Předmětové pořádání informací (též heslování, indexace, předmětové zpracování, verbální pořádání) je druh věcného pořádání informací, kdy slovně vyjádřený obsah, téma či předmět dokumentu je převáděn do více či méně normalizovaných a formalizovaných hesel, klíčových slov, deskriptorů. Předmětový selekční jazyk je selekční jazyk na bázi přirozeného jazyka. Je výrazovým a vyjadřovacím prostředkem předmětové katalogizace. Předmětové selekční jazyky jsou ovládány principem abecedního řazení, tzn. že rododruhové a druho-rodové vztahy mezi názvy nehrají při pořádání roli - jsou jen pomocným prostředkem při odstraňování nedostatků těchto jazyků. Rodo-druhové a druho-rodové vztahy můžeme vyjádřit systémem přidružovacích odkazů: psi viz též
domácí zvířata anglický buldok argentinská doga baset
viz též
psi
baset Každý selekční jazyk je konstruován tak, aby odstraňoval nebo usměrňoval homonymii a synonymii. Každému pojmu nebo významu by měl odpovídat právě jeden jazykový výraz. Selekční jazyk vzniká zjednodušením přirozeného jazyka. Dochází k redukci používaných výrazů a slovních tvarů, tvary vzniklé ohýbáním slov se převádějí na tvary základní, některé slovní druhy se zcela vylučují. Speciální prostředky přirozeného jazyka pro parafrázování emocí a expresí se do selekčního jazyka nezařazují. Srovnání: přirozený jazyk
X
selekční jazyk
asymetrický - jeden pojem více slovy - jedno slovo více pojmů
symetrický - každému významu přiřadit jeden symbol
apelační + komunikační f-ce - nařídit, emoce, přesvědčit
jen komunikační f-ce
asociační spojení skrytá
asoc. spojení lze vyjádřit zjevně - zvýší se síla jazyka
možnost obměny slov nebo vyjádření
je silně omezena a nežádoucí, např. management X podniky -- řízení; soutěž hospodářská -- strategie X strategie konkurenční 1
Předmětové pořádání informací - rekvalifikační kurz ústní užití - je brán ohled na fonetiku (d X t) záznamy
fonetika nezávažná, protože se hledají písemné
slova libovolně dlouhá
mnohdy je rovnoměrnost kódu pro slova žádoucí
je redundantní (nadbytečný)
omezujeme redundanci, např. jídla -- příprava
dominuje podst.jméno a sloveso
dominuje podst. jméno a přídavné jméno
slovesné kategorie
nemají slovesné kategorie
dovede popsat sama sebe (metajazyk)
SJ se popisují přirozeným jazykem pravidla se tvoří před použitím
Synonymie (souznačnost slov) = jazykový jev, při němž různé znaky (slova) mají stejný denotát (předmět či jev označený pojmenováním) pro 1 denotát existuje více než 1 znak (slovo) -
lexikální gramatická
Lexikální: na označení denotátu lze použít 2 a více slov s rozdílnými kmeny, např.: zápalky X sirky postel X lůžko požárníci X hasiči Gramatická: na označení denotátu jsou použita slova se stejným kmenem, ale jinou morfologií, takže patří k různým gramatickým kategoriím, např.: studenti X studentstvo živočichové X živočišstvo (fauna) letci (množina lidí) X letectvo (+ i množina strojů) Lexikální synonyma, která nás zajímá především, lze rozdělit na: - kontextuální - tematická - pravá a) kontextuální (frazeologická) - slovo je zaměnitelné jen v určitém větném kontextu - např. "hraje si s ohněm, manipuluje, zapaluje…" - z hlediska SJ nemá význam b) tematická - synonyma vztahující se ke slovu, jež označuje velmi široké téma - např. "pohybovat se kupředu, jít, běžet, letět…" 2
Předmětové pořádání informací - rekvalifikační kurz
c) pravá -
-
za tematická synonyma mohou být pokládány druhové termíny, jsou-li přiřazovány k rodovému termínu, např.: dopravní prostředky - auta, kola, vlaky, autobusy z hlediska PH je dobré pojmy asociovat (odkazovat na příbuznost), např.: výtvarné umění viz též malířství, grafika … slova, která různě znějí, ale mají stejný denotát, dají se stejně definovat např.: dospívání, adolescence fotbal, kopaná vojenská cvičení, manévry v rámci předmětového katalogu nebo báze věcných autorit je nutné (v zájmu toho, aby do systému byly zavedeny principy řízeného slovníku a aby byl jeho selekční jazyk formalizován) zvolit jeden ze synonymních termínů za předmětové heslo a to pak důsledně preferovat na úkor ostatních k němu se vztahujících synonym, jež je třeba označit vylučovacími odkazy
Předmětové selekční jazyky se dělí na jazyky prekoordinované a postkoordinované. 2. Typy předmětových selekčních jazyků Prekoordinované SJ: Jejich slovník se skládá nejen z jednotlivých slov, ale i ze sousloví, popřípadě vět. Podstatné je to, že v souslovích a větách jsou jednotlivá slova syntakticky uspořádána již v průběhu pořádání a označování témat dokumentů se děje ještě před uložením do informační paměti. předmětová hesla tradičního typu - řetězce PH používají bohatou strukturu • jména osobní česká -- rod ženský -- jména osobní německá -- srovnání • jména osobní německá -- rod ženský -- jména osobní česká -- srovnání lexikální jednotky získané obsahovou analýzou jsou uváděny do vztahu podle předem stanovených pravidel - syntagmatických, a výsledkem je lineární posloupnost lexikálních jednotek podávající selekční obraz dokumentu Postkoordinované SJ: Vycházejí ze vzájemně izolovaných slov, popřípadě sousloví, a skládají z nich témata dokumentů nebo uživatelských dotazů teprve v průběhu selekce dokumentů deskriptorové selekční jazyky klíčová slova (volně tvořená nebo řízená) • osobní jména • čeština • němčina • ženský mluvnický rod - lexikální jednotky nejsou vzájemně provázány syntaktickými pravidly
3
Předmětové pořádání informací - rekvalifikační kurz 3. Předmětové zpracování dokumentů -
-
předmětová hesla podle ČSN 010188 PH NK ČR klíčová slova - tezaury (řízené slovníky) univerzální (polytematické) individuální, např. Moravskoslezské vědecké knihovny v Ostravě souborné, např. Polytematický strukturovaný heslář, www katalog Clavius nebo LANius oborové, např.: Eurovoc (problematika Evropské unie) MeSH (lékařství a zdravotnictví)
Předmětová hesla - obecně • můžeme jimi vyjádřit cokoliv: - osobu: Maciuchová, Hana, 1945- korporaci: Moravské divadlo Olomouc Flora Olomouc 2004 Kostel Nejsvětější Trojice (Písek, Česko) - rod, rodina: Slavníkovci (rod) Krylovi (rodina) - název dokumentu: Bible Rukopis zelenohorský Amsterodamská smlouva, 1997 Versailleská mírová smlouva, 1919 - autor / název: Kafka, Franz, 1883-1924. Proces Aristotelés, 384-322 př. Kr. Politica - věcné téma: psi pěstování okrasných rostlin prusko-rakouská válka, 1866 Lidice, vyhlazení, 1942 Srpen, 1968 dům čp.17 (Dobruška, Česko) Československo -- národní hospodářství -- 1989-1992 etika -- díla do r. 500 Švejk, Josef (literární postava) - geografický název: Hodolany (Olomouc, Česko) Jávské moře Morava, řeka - forma/žánr dokumentu: učebnice základních škol české romány vědecko-fantastické povídky terminologické slovníky
4
Předmětové pořádání informací - rekvalifikační kurz Předmětové heslo vzniká na základě ukončené obsahové analýzy celého dokumentu, nikoliv jen podle jeho názvu (Šperky ve stříbře). To znamená, že si musíme přečíst úvod, záložku, obsah, zjistit údaje ve slovnících atp. Dodržujeme pravidlo nejužšího pojmu, např. vysoké technické školy ne vysoké školy). Výjimku tvoří použití tzv. kategorie osob: příklad: Kniha o životě Karla Poláčka Poláček, Karel, 1892-1944 čeští spisovatelé -- 20. stol. biografie Kniha o díle Karla Poláčka Poláček, Karel, 1892-1944 česká literatura -- 1918-1945 žurnalistika -- Česko literárněvědné rozbory studie
Předmětová hesla z období ČSN 010188
Předmětová hesla se používala hlavně v předmětových katalozích a kartotékách, v bibliografických záznamech a seznamech, ve věcných rejstřících. Systémy předmětových hesel byly vytvářeny v jednom národním jazyce. Pomocí předmětových hesel se zpracovává převážně odborná literatura (včetně periodických publikací). Krásná jen tehdy, je-li předmětem skutečná osoba nebo událost a jsou-li zachovány známé historické skutečnosti. 1. Sklo -- tříštivost 2. Dřevo -- obrábění 3. Pohřeb žehem 4. Škola -- rodina -- vztahy 5. Železnice -- Čechy 6. Dvořák, Antonín (dramatik) -- hry divadelní a televizní -- bibliografie 7. Hudba vokální chrámová česká 8. Sbory pěvecké dětské slovenské 9. Bankovnictví -- učebnice - školy vys.:univ. -- fak.obchod.podnikatel. 10. Rýže -- pěstování -- Slovensko jižní 11. Rýže -- Slovensko jižní -- pěstování 12. Němcová, Božena: Babička -- rozbory 13. Francie -- Prusko -- války -- r. 1870-1871 14. Prusko -- Francie -- války -- r. 1870-1871 15. Sochařství indické -- stol. 5. př.n.l.-10. n.l.
komentář: 1. podheslo vyjadřuje vlastnost pojmu 2. podheslo vyjadřuje proces 3. případ ustálených spojení, kde těžiště významu je v procesu a nikoli v objektu 4. podheslo vyjadřuje pojem, který je k pojmu v hesle v bezprostředním vztahu 5. podheslo vyjadřuje zeměpisné určení 6. jednoslovný doplněk hesla, víceslovné tematické podheslo, jednoslovné formální podheslo 7.-8. k přesnému vyjádření pojmu je zapotřebí několika přídavných jmen a ta se uvádějí ve sledu, který postupně a logicky upřesňuje (zužuje) pojem vyjádřený substantivem 5
Předmětové pořádání informací - rekvalifikační kurz 9. pro rozlišení většího množství formálně příbuzných dokumentů se formální podheslo rozšiřuje o údaj charakterizující zaměření, resp. určení druhu dokumentu 10.-11. pořadí podhesel - podle ČSN je správně Rýže -- pěstování -- Slovensko jižní, nicméně praxe některých katalogizačních agentur se lišila 12. podheslo má formu sběrného prvku PH 13.-14. historický jev nemá charakter oficiálního názvu, uvádí se přednostně zeměpisný název, přičemž vzájemné souřadné vztahy je nutno vyjádřit dvěma předmětovými hesly 15. chronologické podheslo Národní soubor věcných autorit NK ČR (AUV) - báze AUT Báze věcných autorit (AUV) je od r. 2002 integrovanou součástí báze národních autorit NK ČR (AUT). Obsahuje soubory tematických, geografických a formálních autorit, zpřístupnění souboru chronologických autoritních termínů se připravuje. V rámci této báze je zveřejněn i soubor skupin Konspektu (česká i anglická verze) a soubor autorit pro místa vydání starých tisků.
www.nkp.cz - katalogy a databáze - přehled bází NK ČR - AUT Báze národních autorit NK ČR Soubor věcných autorit je řízený a měnitelný abecedně uspořádaný soubor věcných selekčních údajů - lexikálních jednotek, mezi nimiž jsou vyjádřeny základní sémantické vztahy (ekvivalence: preferovaný a nepreferovaný termín, hierarchie, asociace) - příklad: kvalita potravin - jakost potravin, jantar - minerály, pryskyřice, lesní živočichové - fauna. Součástí autoritního záznamu je notační znak MDT-MRF související s autoritním záhlavím a nezbytný poznámkový aparát (příklad: historiografie, Rusko). Tvar lexikálních jednotek Při výběru se řídíme těmito zásadami: • volí se substantivní tvar v 1. pádě, kterým může být jednoslovné substantivum - kombinatorika víceslovná lexikální jednotka, jejíž základ tvoří substantivum, a to adjektivní spojení - paličkovaná krajka genitivní vazba - teorie množin, geografie cestovního ruchu, psychologie dítěte předložková vazba - překlady do polštiny, publikace pro děti, práce s mládeží komplexní termín - dvě souřadně spojená substantiva označující komplexní pojem, tj. vztah daných pojmů, např. rodina a škola; rozklad tohoto komplexního pojmu na jednotlivé dílčí pojmy by vedl ke vzniku nežádoucího ohlasu irelevantních dokumentů Sjednotila se indexace v oblasti literatury: přívlastek v předmětovém hesle má i funkci etnického přívlastku nejen jazykového příklad: Studie o estonských překladech básní Vítězslava Nezvala Nezval, Vítězslav, 1900-1958 česká poezie -- 1918-1956 nikoli estonská poezie překlady do estonštiny literárněvědné rozbory studie
6
Předmětové pořádání informací - rekvalifikační kurz
singulár a plurál počitatelná substantiva se uvádějí v plurálu - kočky, omyly abstrakta, počitatelná substantiva použitá jako abstrakta, názvy vědních oborů se uvádějí v singuláru - odvaha, omyl (filozofie), odvoz odpadků, výtvarné umění -
• • • • • •
• •
dodržuje se přirozený slovosled až na: kyselina sírová, kaštanovník jedlý - tady zůstane tvar invertovaný, protože jde o odborné názvosloví, pro které jsou charakteristické postponované přívlastky pravopisná forma se řídí platnou normou, v případě existence pravopisných dublet se preferuje spíše progresivní podoba psaní velkých a malých písmen - respektujeme pravidla českého pravopisu, v zásadě PH zapisujeme malými písmeny transliterace se řídí platnými normami cizojazyčné výrazy je možné použít neexistuje-li adekvátní překladový výraz - gender je-li termín běžně používán v daném vědním oboru - diabetes mellitus zkratky - preferuje se rozepsaná podoba, zkrácená podoba se odkáže - MVS viz meziknihovní výpůjční služba, DPH viz daň z přidané hodnoty, ORL otorinolaryngologie Ale: syndrom získané imunodeficience viz AIDS - jedná se o běžně ustálené a všeobecně srozumitelné zkratky Zvláštní kapitolou jsou termíny: SMS zprávy, HIV pozitivní, HIV pozitivní děti, virus HIV, MARC 21 formát, CT angiografie, databáze DNA, DNA (nukleová kyselina), DOS (operační systém) synonymie lexikálních jednotek se řeší odkazovým aparátem (odkaz viz) - myš vodní viz hryzec vodní, náboženské písně viz duchovní písně, orchideje viz vstavačovité, ortografie viz pravopis homonymie lexikálních jednotek různé významy homonym se důsledně rozlišují specifikací termínu - listy rostlin, nohy viz dolní končetiny uvedením kvalifikátoru (relátoru) v závorce, závorkové doplnění je součástí deskriptoru - letci, letci (ptáci), zámky, zámky (zámečnictví)
Definice, vymezení rozsahu preferovaného termínu je důležitou součástí záznamu věcné autority univerzálního systému, protože v tomto systému se často vyskytují výrazy, které se běžně používají ve více oborech. Struktura sémantických vztahů • vztah ekvivalence, který je jedním ze základních předpokladů řízeného slovníku VIZ, např. nordické jazyky viz skandinávské jazyky •
vztah hierarchie, vyjadřuje poměr podřazenosti a nadřazenosti VIZ TÉŽ BT - nadřazený termín (broader term) NT - podřazený termín (narrower term) např. obdělávání půdy, BT zemědělské práce, NT orba 7
Předmětové pořádání informací - rekvalifikační kurz •
vztah asociace, lexikální jednotky spolu významově souvisejí, avšak jejich vztah nelze považovat za vztah hierarchický VIZ TÉŽ RT (related term) např. odběr krve, RT krev, RT transfuze krve, RT dárcovství krve kadeřnictví, RT péče o vlasy
Aplikační syntax Pravidla pro tvorbu souboru věcných autorit nabízejí dvě možnosti postupu: 1. autorizovat řetězce předmětových hesel; • výhodou postupu je možnost vyjádřit komplexní téma dokumentu výstižně už v prvním plánu, což ve svém důsledku znamená zachovat informační hodnotu řetězce předmětových hesel a umožnit snadnější orientaci jedné skupiny uživatelů • nevýhodou tohoto postupu je komplikovanost struktury řetězce PH, která má za následek nesnadnou orientaci uživatele v případech, kdy se bohatě větvená struktura PH nezobrazí (mizí za obrazovkou), případně se zobrazí na jiném řádku nedostupnost těchto složitě strukturovaných záznamů pro většinu vyhledávacích služeb komplikovanost pravidel pro tvorbu předmětového hesla nesnadná a nákladná údržba takto koncipovaného autoritního souboru rozdílnost při formulaci dotazu při vyhledávání v databázích 2. autorizovat jednotlivé segmenty předmětových hesel; výhodou postupu je • přehlednost záznamů • snadná orientace uživatele • jednoduchá pravidla pro aplikaci • snadnější budování hierarchických struktur • snadná údržba • homogenní prostředí pro vyhledávání Výzkum realizovaný Národní knihovnou v r. 1997 prokázal, že v oblasti věcných selekčních jazyků naprosto převládá používání izolovaných lexikálních jednotek, tj. klíčových slov, oborových deskriptorů, polytematických tezaurů a heslářů. Prekoordinovaná PH s rozvinutou strukturou jsou v naprosté menšině a navíc se nejčastěji používají pouze jako alternativní SJ. Znamená to tedy, že při věcném pořádání je dominantní princip postkoordinace. Při konkrétní aplikaci souboru věcných autorit, tj. při ukládání věcných údajů v bibliografickém záznamu, se volí kombinovaný postup (princip prekoordinace a postkoordinace se kříží): • tematické selekční prvky se ukládají ve vstupních pozicích - princip postkoordinace (psi, chov domácích zvířat, příručky X psi -- chov -- příručky) výjimkou jsou tematická zpřesnění: dějiny vlastivěda národní hospodářství zahraniční vztahy … aspekty (psychologické, duchovní, ekonomické…) 8
Předmětové pořádání informací - rekvalifikační kurz
•
•
… poměry (přírodní, hospodářské, sociální…) díla do r. 500 díla do r. 1800 přátelé a spolupracovníci geografické okolnosti tématu, pokud nejsou předmětem dokumentu, se zapisují v příslušném podpoli - princip prekoordinace (pěstování lesa -- Srbsko). Používat pro názvy zemí, nadnárodních oblastí a kontinentů výjimkou jsou konkrétní geografické lokality - město, obec, místo, oblast: Církevní umění gotiky a renesance na Šumpersku, Zábřežsku a Mohelnicku důvody: zjednodušení pravidel pro aplikační syntax kompatibilita záznamů zvýraznění geografických termínů v BIB záznamech zařazení do hierarchických struktur a tedy zapojení odkazového aparátu do procesu vyhledávání chronologické okolnosti tématu, pokud nejsou předmětem dokumentu, se zapisují v příslušném podpoli - princip prekoordinace (čeští spisovatelé -- 19.-20. stol.) 1. stol. př. Kr. 14. stol. 8.-12. stol. 106-43 př. Kr. 1901-1950 (pro 1. pol. 20. stol., nikoli 1900-1950) 2001
Funkce notačního znaku MDT v záznamu věcné autority Základní funkcí notačního symbolu v univerzálním systému, kterou můžeme pracovním názvem označit jako fixaci termínu, je určení dominantního oboru, posouzení jeho pozice v univerzu lidského poznání, posouzení jednoznačnosti a systémovosti daného termínu v pojmové struktuře oboru/oborů. Nicméně důležitou funkcí je podpora při tvorbě hierarchické struktury univerzálního souboru, podíl na mezinárodní srozumitelnosti selekčního jazyka. Jako referenční jazyk pomáhá při tvorbě vícejazyčného nástroje. V neposlední řadě, především ve fázi vzniku autoritního souboru, slouží jako kontrola kvality přidělovaných údajů.
9
Předmětové pořádání informací - rekvalifikační kurz
Polytematický strukturovaný heslář http://www.stk.cz/cgi-bin/dflex/CZE/STK/PSH http://www.stk.cz/psh.html -
informace
Polytematický strukturovaný heslář je původním produktem Státní technické knihovny, který by se mohl stát pokud možno univerzálním prostředkem pro věcnou indexaci dokumentů a současně by měl být nástrojem pro vyhledávání v bázích dat knihoven. Práce na hesláři byly zahájeny v roce 1993. Několikrát byly tyto aktivity podpořeny grantovými prostředky MK a MŠMT. Od března r. 1997 byl PSH distribuován všem zájemcům knihovnám i komerčním firmám. Tezaurus EUROVOC http://www.psp.cz/cgi-bin/eng/sqw/ev/evquery.sqw?snt=1
http://www.psp.cz/kps/knih/e_zakinf.htm - informace Tezaurus Eurovoc je vícejazyčný polytematický tezaurus zaměřený na oblast práva a legislativy Evropské unie. Eurovoc lze využít zejména v knihovnách a informačních střediscích specializovaných na právo, legislativu a politiku. V rámci EU se Eurovoc používá v knihovně Evropského parlamentu, Úřadu pro úřední tisky ES a dalších informačních institucích EU. Překlad Eurovocu provedla Parlamentní knihovna ve spolupráci s dalšími institucemi. Parlamentní knihovna je také správcem a distributorem české verze Eurovocu. Tezaurus MeSH http://dec2.nlk.cz:4001/ALEPH/CZE/NML/CLA/MES/START
Tezaurus Medical Subject headings byl vytvořen Národní lékařskou knihovnou USA a slouží od r. 1969. Českou verzi spravuje Národní lékařská knihovna ČR.
1