Systémy pro podporu rozhodování Datové sklady, OLAP
1
4. Datový management: sklady, přístup a vizualizace
2
Principy MSS
Nové koncepce
Objektové databáze
Inteligentní databáze
Datové sklady
On-line analytické zpracování (OLAP)
Multidimensionalita
Dolování v datech (Data mining)
Internet / Intranet / Web
4.8 Datové sklady
3
Fyzická separace operačního prostředí a prostředí na podporu rozhodování
Účel: vytvořit úložiště dat umožňující přístup k operačním datům
Transformace operačních dat do relačního tvaru
Z TPS přicházejí pouze data potřebná pro podporu rozhodování
Data jsou transformována a integrována do konzistentní struktury
Datové skladování (nebo skladování informací): řešení problému přístupu k datům
Koncoví uživatelé provádějí ad hoc dotazování, analýzu reportů a vizualizaci dat
Výhody datových skladů Zvýšení produktivity znalostních pracovníků Podporují všechny požadavky rozhodovatelů na data Zabezpečují okamžitý přístup ke kritickým datům
Izolují operační databáze od ad hoc zpracování dat Dávají souhrnné informace na vysoké úrovni Zabezpečují možnosti detailních pohledů
4
Výhody datových skladů
Datové sklady poskytují: Zvýšenou podnikovou inteligenci (business intelligence) Konkurenční výhodu Zlepšené služby zákazníkům a jejich spokojenost Možnost tvorby rozhodnutí Pomoc při usměrňování podnikových procesů
5
Architektury datových skladů Dvojúrovňová (two-tier) architektura Tříúrovňová (three-tier) architektura (http://www.executionmih.com/business-intelligence/architecture-tiers-data-warehouse.php)
6
Dvouúrovňový DS
7
Tříúrovňový DS
8
Jednoúrovňový „DS“
9
Složky datového skladu Velká fyzická databáze
Logický datový sklad Datový trh (data mart)
a aplikace: Systémy pro podporu rozhodování (DSS) a exekutivní informační systémy
(EIS)
12
Vhodnost použití datových skladů Pro organizace, ve kterých Data se nacházejí v různých systémech Management využívá řídící přístupy založené na informacích
(information-based) Velká báze zákazníků různého typu Některá data mají různou reprezentaci v různých systémech Data jsou ukládána ve vysoce technické a těžko dekódovatelné formě
13
Charakterizace datového skladování Data jsou organizována dle konkrétního typu subjektu a obsahují pouze informace relevantní konkrétní podpoře rozhodování (např. zákazník, obor činnosti apod.) Data jsou integrovaná z různých formátů v různých zdrojích do konzistentního tvaru Časově proměnná data za období 5-10 let Po vstupu do skladu se data už nemění ani neaktualizují
14
Výhody struktury datových skladů Integrita dat Konzistence v časových dimenzích Vysoká efektivnost Nízké provozní náklady Lze uchovávat data na různých úrovních sumarizace Poskytuje zákazníkům rychlý přehled
15
4.9 Vizualizace dat a multidimensionalita Technologie pro vizualizaci dat Digitální obrázky Geografické informační systémy Grafická uživatelská rozhraní Multidimenzionální prezentace Tabulky a grafy Virtuální realita Prezentace Animace
16
Multidimenzionalita
17
3-D + tabulky
Data mohou být organizována způsobem, jakým je chtějí vidět spíše manažeři než systémoví analytici
Lze lehce a rychle dosáhnout různých způsobů prezentace stejných dat
Dimenze: výrobky, prodejci, segmenty trhu, obchodní jednotky, geografické lokality, distribuční kanály, země, průmysl
Jednotky: peníze, objemy prodeje, propočty na hlavu, majetkový profit, aktuální versus předpověděné
Čas: denně, týdně, měsíčně, čtvrtletně nebo ročně
Omezení multidimenzionality Až o 40% více paměti počítače než odpovídající relační databáze Vyšší cena až o 50% Navýšení spotřeby systémových prostředků a času Složitější rozhraní a údržba
Multidimenzionalita je obzvláště populární u exekutivních informačních a podpůrných systémů
18
4.10 OLAP: Přístup k datům, dolování, dotazování a analýza Online Analytical processing (OLAP) DSS a EIS výpočty prováděné koncovými uživateli
pomocí online systémů V protikladu je online zpracování transakcí (online transaction processing OLTP)
Aktivity OLAP Generování dotazů Požadování ad hoc reportů Provádění statistických analýz Konstrukce multimediálních aplikací 19
http://www.databeacon.com/Downloads/Demos.htm
OLAP využívá datový sklad a soubor nástrojů Nástroje pro dotazování Tabulky Nástroje pro dolování v datech Nástroje pro vizualizaci dat
20
Data S o u rc e s
Bu sin ess Com m u n ica t ion Qu er yin g
In t er n a l Da t a Sou r ces E xt er n a l Da t a Sou r ces
Da t a Acqu isit ion , E xt r a ct ion , Deliver y Tr a n sfor m a t ion
Repor t Gen er a t ion Da t a Wa r eh ou se
Spr ea dsh eet F or eca st in g An a lysis Modelin g
Da t a P r esen t a t ion and Visu a liza t ion
Mu lt im edia E IS, Ot h er s On lin e An a lyt ica l P r ocessin g
FIGURE 4.1 Data Warehousing and Online Analytical Processing (OLAP).
Architektura multidimenzionálního OLAP (MD-OLAP) http://mstr.insightstrategy.cz/files/case_for_rolap.pdf
Architektura relačního OLAP (ROLAP) http://mstr.insightstrategy.cz/files/case_for_rolap.pdf
OLAP Packages
24
DSS Web (MicroStrategy, Inc.) Oracle Express Server (Oracle Corp.) DataFountain (Dimensional Insight Inc.) Pilot Internet Publisher (Pilot Software, Inc.) WebOLAP (Information Advantage Inc.) Focus Fusion (Information Builders, Inc.) Business Objects Inc. (Business Objects) InfoBeaconWeb (Platinum Technology, Inc.) BrioQuery (Brio Technology Inc.) Data multidimensionality - In Touch/2000 - Pilot personal cubes
Data Mining - dolování v datech Pojem pokrývající odkrývání znalostí v databázích extrakci znalostí datová archeologie explorativní analýza dat zpracování obrazců dat
“bagrování” v datech rozsáhlý sběr informací (“žně”)
25
Hlavní charakteristiky a cíle dolování v datech
26
Data jsou často hluboko zahrabána
Architektura klient/server
Účinné nové nástroje -- zahrnují pokročilé vizualizační nástroje -- pomáhají odstranit “nánosy” na informacích
Úprava a synchronizace dat
Užitečnost “měkkých” dat (obvykle textové soubory)
Koncový uživatel, provádějící dolování, mívá k dispozici nástroje pro detailizaci pohledů na data (data drills) a jiné mocné dotazovací nástroje bez potřeby znalostí programování
Často zahrnuje nálezy neočekávaných výsledků
Nástroje jsou často kombinovány s tabulkovými procesory atd.
Paralelní zpracování pro dolování v datech
Aplikační oblasti pro dolování v datech
27
Marketing
Bankovnictví
Prodej
Výroba
Obchodování na burze
Pojišťovnictví
Počítačový hardware a software
Vláda a obrana
Letectví
Péče o zdraví
Rozhlasové a televizní vysílání
Kriminalistika
4.11 Inteligentní databáze a dolování v datech Vývoj aplikací pro MSS vyžaduje přístup do databází
AI technologie (ES, ANN) pomáhají při řízení databáze Propojení ES s velkými databázemi Příklad: optimalizace dotazů Rozhraní v přirozeném jazyce
28
Inteligentní dolování v datech Použití inteligentního prohledávání k nalézání informací v datových
skladech, které dotazy a reporty nejsou schopny efektivně objevit Nalézání obrazců v datech a na jejich základě odvozování pravidel Použití obrazců a pravidel k návodům při rozhodování a předpovědích Dolováním v datech lze získat pět obecných typů informací: 1) asociace, 2) posloupnosti, 3) klasifikace, 4) shluky a 5) předpovědi
29
Hlavní nástroje používané v inteligentním dolování v datech Případové uvažování (Case-based Reasoning) Neurální výpočty (Neural Computing) Inteligentní agenti (Intelligent Agents) Jiné nástroje rozhodovací stromy indukce pravidel vizualizace dat
30
Inteligentní databáze jako integrace ES a databáze
4.12 Souhrn
32
Data pro rozhodování přicházejí z interních a externích zdrojů
Systém pro řízení báze dat (SŘBD) je jednou z hlavních složek většiny systémů na podporu managementu
Znalost nejnovějšího pokroku v této oblasti je velmi důležitá
Data jsou zlatým dolem informací, pokud je dokážeme vydolovat
Organizace skladují data a dolují v nich
Nástroje pro multidimenzionální analýzu a nové podnikové architektury systémů jsou velmi užitečné
Užitečné jsou rovněž nástroje OLAP
Souhrn (pokrač.)
33
Objektový přístup k analýze systémů, k jejich návrhu a implementaci může být velmi vhodný
Nové formáty dat pro multimediální SŘBD
Internet a intranety použitím Webovských prohlížečů pro přístup SŘBD
Zabudované metody umělé inteligence v SŘBD
Konec
35