Aplikovaná informatika Získávání a zhodnocování informací z volně dostupných databázových zdrojů na dané profesní téma. ZEMÁNEK, Z. – PLUSKAL, D. – SMETANA, B.
Operační program Vzdělávání pro konkurenceschopnost Název projektu: Inovace magisterského studijního programu Fakulty ekonomiky a managementu Registrační číslo projektu: CZ.1.07/2.2.00/28.0326
Získávání a zhodnocování informací z volně dostupných databázových zdrojů na dané profesní téma. 1. 2. 3.
Selekce a restrikce informací Specifikace profesních témat Možnosti databázových zdrojů pro profesní téma Kontrolní otázky a úkoly samostudia
Cíle přednášky
1.
Předat studentům poznatky o selekci a restrikci informací.
2.
Uvést a objasnit základy specifikace profesních témat.
3.
Objasnit možnosti databázových zdrojů pro profesní téma.
Práce s informací Každá množina reálných objektů a jevů má své zákonitosti, konitosti své zařazení do hierarchie světa, svou klasifikaci na podtypy, podtypy své vztahy k okolí. Také podmnožiny atributů mohou mít mezi sebou důležité vztahy – asociace: korelace, příčiny a následky, sledky skryté faktory apod., které v matematických disciplínách nazýváme proměnnými. [1] [1]
Popis těchto atributů bývá často poměrně vágní.
Například: Chceme-li popsat člověka, o kterém budeme mluvit, řekneme například: „…ten mladý blonďák, s rozcuchanou ofinou, asi ze sousedního vchodu.“ „Reálnou skutečnost poznáváme po částech, často se navzájem překrývajících podle toho, proč nás právě tato část světa (atributů) zajímá.“
Práce s informací
Jakmile začneme hlouběji zkoumat některé jevy systematicky, začínáme pozorováním reality, shromažďováním údajů a zkoumáním toho, jaká fakta o údajích platí. Ověřujeme, jestli se z faktů dají formulovat obecně platná pravidla, pravidla nebo dokonce dokázat některé (přírodní, společenské, …) zákonitosti. konitosti Získáváme tak schopnost vytvářet informace a tyto dále předávat. [1] [1]
„Samotný proces „práce s informací“ je velmi rozmanitý vzhledem k jejich charakteru a podílu na řízení subjektů.“
Selekce, agregace a restrikce informací
[2,3]upraveno upraveno [2,3] Obr:Vlivy Vlivypůsobící působícíběhem běhemzpracování zpracovánídat dat––zakódované zakódovanéinformace. informace. Obr: Při komunikačním procesu vždy dochází k výběru informací (selekci), který je obvykle ovlivněn potřebami a přáním příjemce. [2] Současně s tím dál dochází ke kumulaci (agregaci) dat do skupin, neboli agregátů. Takto úsporná opatření, většinou vynucená časovou náročností zpracování dat a také omezením kapacity úložného prostoru, mohou vést k dalšímu, nepřesnému zpracování informace.
Selekce, agregace a restrikce informací
[2,3]upraveno upraveno [2,3] Obr:Vlivy Vlivypůsobící působícíběhem běhemzpracování zpracovánídat dat––zakódované zakódovanéinformace. informace. Obr: Dalším krokem je restrikce - znamená omezení, např. redukci objemu dat konverzí obrázků a podobná úsporná opatření. Užívá se pro omezení daná vlastním rozhodnutím nebo jiné autority, nikoli faktickými překážkami a nedostatky. Výsledkem předchozích jevů je, že informace mohou být často zkreslené. Následuje interpretace dat, která spočívá v analýze významu sdělení pro příjemce informace. [2]
Databázový přístup k základním pojmům výběru Pracujeme s uspořádaným typem dat. Úvodním procesem je prostá selekce. Hlavním znakem je zúžení zobrazovaných záznamů podle informačního zájmu. Informační zájem je formulován jako informační dotaz. Pro prostou selekci lze použít nástroje, označované jako filtrace, spojená s agregací dat – zobrazí záznamy uspořádané podle vybrané vlastnosti.
Příklady prosté selekce – databázový přístup
Výběr prvních n záznamů seřazených podle vlastnosti x [4] Příklad: Vyber prvních n (= 3) záznamů podle nejnižší ceny (= 0 … 9 526,00 Kč)
Obecná restrikce – databázový přístup Vybíráme záznamy ne dle pořadí vybraného atributu, ale podle celkového významu pro informační dotaz – například prostá existence atributu. [4] Příklad: Zajímám se o výrobce, ale vyloučím firmu ALZA …
Kombinace restrikce a projekce – databázový přístup Využijeme postupu výběru podle celkového významu pro informační dotaz. Zúžíme počet zobrazených atributů – projekce. Příklad: vybírám podle kódu výrobku a současně mne nezajímá nejnižší cena a dodavatel…[4]
Nástroje výběru – databázový přístup Pro vytváření selekce a restrikce využíváme vnitřní nástroje – dotazy. Dotazy využívají dotazovací jazyk, který má svou syntaxi – skladbu. Základem jsou jednoduché příkazy pro výběr a operátory „and“, „or“, not… Pomocí výrokové logiky lze sestavit libovolné smysluplné tvrzení – v důsledku i dotaz.
Proč dotazovací jazyk?? Přirozený jazyk vyjadřuje emoce a míra neurčitosti je snižována způsobem užití – neverbální komunikace, profesní mluva, argot… Pro strojové využití je nevhodný. Tvrzení – věta, je základem výběrového dotazu. Složitější věty – rozklad na atomické, jednoduché požadavky. Atomické požadavky za pomocí operátorů tvoří pak složitější věty – „formule-predikáty-dotazy“ (poznatky z matematiky).
Definice - dotazovací jazyk Je nástroj pro předávání požadavků na vyhledání databázových záznamů splňujících určitá formálně definovaná kritéria. Současně je pokyn k výpočtu určitých hodnot na základě takto vyhledaných záznamů.
Příklad databázového dotazovacího jazyka SQL (Structured Query Language) Strukturovaný dotazovací jazyk. Příkazově orientovaný relační má nejčastější příkaz: klíčová slova [5] SELECT seznam položek FROM tabulka WHERE podmínky
Příklad databázového dotazovacího jazyka QBE (Query By Example) obrazovkově (formulářově) orientovaný relační dotazovací jazyk; dotaz je definován vyplňováním formuláře znázorňujícího strukturu tabulky; [6] Příjmení
Jméno
ID_číslo
Matematika
Jazyk
Maturita
»
»
xxxxxxxx
>=80
>=80
1-4
Analogie základních pojmů výběru ve fulltextu Problém výběru je v neuspořádanosti dat a jejich nepravidelném výskytu v textu. Řešení selekce a restrikce ve fulltextu: Správná volba klíčových slov a lemmatizace u prosté selekce. Využití jazyků a nástrojů pro využití operátorů, využití možností vyhledávání textu v XML u kombinované restrikce.
Možné problémy při selekci a restrikci ve fulltextu Vytvoření správného lemmatu Psychologická bariéra – koncentrace na úvodní stránky Jazyková bariéra při hledání zdrojů a překladu klíčových slov Záměrná manipulace autorů zdroje – klíčová slova na pozadí, vystavování jiného textu pro vyhledávací roboty…
Možné problémy při selekci a restrikci ve fulltextu Neodpovídající obsah snippetů – úryvků ve vyhledávači. Problém s koncentrací zdrojů v neviditelném – nedostupném webu. Nevhodné vyhledávací prostředí v databázi textových zdrojů - bibliografie… Nedostatečná znalost vyhledávané problematiky a sémantické konflikty…
Vyhledávací nástroje fulltextu K významným nástrojům patří vyhledávací systém produktů firmy Tovek, Tovek využívané armádou USA. Využívá indexaci a ohodnocení dokumentů. Mimo operátorů a možností restriktivního definování poddotazů zkoumá relevanci dokumentu k dotazu (váha). [7]
Jak hledat profesní informace Motto: „Chcete-li vybudovat velký podnik, vybudujte nejdříve sebe.“ Tomáš Baťa
Získávání znalostí profesních témat je součástí vašeho projektu!
Profesní orientace Je dlouhodobý cílevědomý proces přípravy, volby a udržení zaměstnání. Součástí procesu, na kterou klade důraz i Evropská unie je testování vlastních předpokladů, schopností a zájmů. Nezbytným předpokladem je dobrá znalost profesních témat a umění vyhledání, identifikace a analýzy informací z profesní sféry.
Oblasti profesních témat Prvním předpokladem úspěchu profesní orientace je obeznámení se s odbornou tématikou a terminologií zvolené profese. Velmi důležité je práce na svých osobnostních předpokladech v oblastech:
práce s vizí jako motivačním prvkem, hodnoty a motivace jako předpoklad k efektivnosti práce, práce se stresem a řešení konfliktních situací, komunikativní dovednosti, time managament, [8] sebeuvědomění, sebeřízení a sebekontrola. sebekontrola
Jak hledat profesní informace Hledání profesních informací se koncentruje do dvou oblastí: Nalezení vhodného zaměstnání v rámci zvolené profesní orientace – zde lze také získat z požadavků základní přehled o požadovaném vzdělání, znalostech, dovednostech a praxi. Rozšíření znalostí v oblasti odbornosti a profesní terminologie – odborná literatura a otevřené zdroje… [8]
Možnosti databázových zdrojů pro profesní téma Informace najdeme jak ve fultextových databázích, tak ve formě databázových systémů, třídících nabídky podle různých kritérií ve formě inzerátů – snippetů s danou strukturou. Prostředím jsou jednak oficiální aplikace MPSV, jednak agenturní nabídky, projekty ESF a oborové portály, např. www.army.cz.
Ukázka profesních informací – www.army.cz
Kontrolní otázky a úkoly samostudia Analyzujte možnosti selekce a restrikce při získávání profesních informací. Uvědomte si možnosti profesní orientace ve svém zvoleném povolání - specializaci. Vytvořte si seznam základních profesních pojmů pro vyhledávání zdrojů.
Zdroje – doplňující studijní literatura: 1.
2.
3. 4.
5. 6. 7. 8.
ŠARMANOVÁ, J. METODY ANALÝZY DAT - Učební text. [online]. [cit. 2013-11-10] © 2012, Ostrava: VŠB-TU. 170 s. ISBN 978-80-248-2565-6 Dostupné z: http://www.person.vsb.cz/archivcd/FEI/MAD/ BARTÁK, M. Vliv komunikace na konkurenceschopnost podniku pomocí nástrojů business inteligence – Disertační práce. [online]. [cit. 2013-11-13] © 2006, Praha: ČZU-PEF. 185 s. ISBN 978-80-248-2565-6 Dostupné z: www.pef.czu.cz/cs/?dl=1&f=13008 CATS-BARIL, W.-THOMPSON, R. Information technology and Management. USA: The McGraw-Hill Companies, Inc., ISBN 0-256-17618-3 Databáze standardu SQL, díl 8.: Restrikce v SQL. Http://www.penguin.cz/ [online]. 1999, 2013 [cit. 2013-11-14]. Dostupné z: http://www.penguin.cz/noviny/chip/sql/SQL8.pdf SQL. Http://cs.wikipedia.org [online]. 2013 [cit. 2013-11-15]. Dostupné z: http://cs.wikipedia.org/wiki/SQL QBE (Query By Example). Http://www.cecak.cz [online]. 2009 [cit. 2013-11-15]. Dostupné z: http://www.cecak.cz/fel/dba/referaty/qbe_query_by_example Querylanguage_cz. Http://muj.anopress.cz [online]. 2011 [cit. 2013-11-18]. Dostupné z: http://muj.anopress.cz/Search/PagesHelp/querylanguage_cz.pdf Profese-povolani. Http://www.orienteexpress.cz [online]. 2007 [cit. 2013-11-18]. Dostupné z: http://www.orienteexpress.cz/hledam-informace-z-oblasti/