# "#
$ % # " $ "!
)%#% $"!), ,##, !% %+%+ !*"$ ("# #( (")% "$,$"##$# ,$)% $! %/#/%% %+%#% '# %#%-/#%,#%+ $ #% %&%+%"#"#
$"#"##"$ /# $ .#% !"( ) #+%"% %$%% )"#"#,#%'-*)$'/( # "#% ( +-$ #% +%,"%"%)% )$%#, "&/ #" $" "/% $!
Edice Management v informaèní spoleènosti Edièní rada: doc. Ing. Josef Basl, CSc. ZÈU v Plzni, VE v Praze pøedseda PhDr. Jiøí Adamík Grada Publishing, a.s. místopøedseda prof. Ing. Jan Ehleman, CSc. Technická univerzita Liberec doc. Ing. Karol Matiako, CSc. ilinská univerzita v iline doc. RNDr. Jaroslava Mikulecká, CSc. Univerzita Hradec Králové prof. RNDr. Jaroslav Pokorný, CSc. MFF UK v Praze doc. Ing. Jan Pour, CSc. VE v Praze doc. Ing. Karel Richta, CSc. FEL ÈVUT v Praze doc. Ing. Milena Tvrdíková, CSc. VB-TU Ostrava prof. Ing. Ivan Vrana, DrSc. Èeská zemìdìlská univerzita v Praze
Ing. Ota Novotný, Ph.D. doc. Ing. Jan Pour, CSc. Ing. David Slánský
Business Intelligence © Grada Publishing, a.s., 2005 Cover Design © Grada Publishing, a.s., 2005 Vydala Grada Publishing, a.s., U Prùhonu 22, Praha 7 tel.: +420 220 386 401, fax: +420 220 386 400, www.grada.cz jako svou 2113. publikaci Odpovìdný redaktor Mgr. Petr Muálek Sazba Milan Vokál Poèet stran 256 První vydání, Praha 2005 Vytiskla tiskárna PBtisk Prokopská 8, Pøíbram VI Nakladatelství dìkuje spoleènosti ADASTRA, s.r.o., za podporu pøi vydání této knihy.
(tištČná verze) ISBN 80-247-1094-3 (elektronická verze ve formátu PDF) ISBN 978-80-247-6685-0 © Grada Publishing, a.s. 2011
1
Obsah O autorech . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 Úvod . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 Èást I: Principy Business Intelligence . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 1. Business Intelligence vývoj a základní principy . . . . . . . . . . . . 1.1 Vývoj Business Intelligence . . . . . . . . . . . . . . . . . . . . . . 1.2 Business Intelligence v øízení firmy . . . . . . . . . . . . . . . . . . 1.3 Základní principy øeení Business Intelligence . . . . . . . . . . . . 1.3.1 Základní principy multidimenzionálních databází . . . . . . 1.3.2 Porovnání analytických a OLTP systémù . . . . . . . . . . 1.4 Hlavní komponenty, typy aplikací a vrstvy v Business Intelligence . . 1.4.1 Produkèní (zdrojové) systémy . . . . . . . . . . . . . . . . 1.4.2 Extraction, Transformation and Loading ETL . . . . . . . 1.4.3 Enterprise Application Integration EAI . . . . . . . . . . . 1.4.4 Doèasné úloitì dat DSA (Data Staging Areas) . . . . . 1.4.5 Operativní úloitì dat ODS (Operational Data Store) . . . 1.4.6 Datový sklad DWH (Data Warehouse) . . . . . . . . . . . 1.4.7 Datové tritì DMA (Data Mart) . . . . . . . . . . . . . . 1.4.8 OLAP databáze . . . . . . . . . . . . . . . . . . . . . . . 1.4.9 Reporting . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.4.10 Manaerské aplikace EIS (Executive Information Systems) 1.4.11 Dolování dat (Data Mining) . . . . . . . . . . . . . . . . . . 1.4.12 Oborová znalost know-how . . . . . . . . . . . . . . . . . 1.4.13 Technická znalost . . . . . . . . . . . . . . . . . . . . . . 1.4.14 Nástroje pro zajitìní datové kvality . . . . . . . . . . . . . 1.4.15 Nástroje pro správu metadat . . . . . . . . . . . . . . . . . 1.4.16 Dalí komponenty související s BI . . . . . . . . . . . . . . 1.5 Rozdíly v pojetí datových skladù a tri . . . . . . . . . . . . . . . 1.6 Integrace komponent Business Intelligence . . . . . . . . . . . . . . 1.7 Business Intelligence pøíklady základních principù . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . .
17 17 17 20 20 25 26 28 29 29 30 30 32 33 33 34 34 35 36 36 36 36 37 38 38 39
2. Øízení projektù a aplikací Business Intelligence . . . . . . . . . 2.1 Pøístupy k øeení Business Intelligence . . . . . . . . . . . . 2.1.1 Postupné budování datových tri . . . . . . . . . . 2.1.2 Jednorázové vybudování celkového øeení . . . . . 2.1.3 Pøírùstkový pøístup . . . . . . . . . . . . . . . . . . 2.2 Principy a úlohy øízení Business Intelligence . . . . . . . . . 2.3 Business Intelligence v kontextu øízení informaèního systému
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
45 45 45 48 49 51 54
Obsah
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
5
2.4
2.5
2.3.1 Strategie rozvoje BI . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3.2 Plánování a koordinace projektù BI . . . . . . . . . . . . . . . . . . . . 2.3.3 Øízení slueb BI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3.4 Øízení zdrojù BI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3.5 Øízení projektù BI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3.6 Øízení provozu aplikací BI . . . . . . . . . . . . . . . . . . . . . . . . . Øízení a postupy projektù Business Intelligence . . . . . . . . . . . . . . . . . . 2.4.1 Úvodní studie BI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.4.2 Specifikace pøírùstku . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.4.3 Analýza BI øeení . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.4.4 Modelování a návrh datového skladu a BI øeení . . . . . . . . . . . . . 2.4.5 Návrh technologické platformy pøírùstku . . . . . . . . . . . . . . . . . . 2.4.6 Návrh transformací ETL . . . . . . . . . . . . . . . . . . . . . . . . . 2.4.7 Implementace BI øeení . . . . . . . . . . . . . . . . . . . . . . . . . . Podstatné parametry pro øízení Business Intelligence . . . . . . . . . . . . . . . 2.5.1 Strategické a plánovací parametry . . . . . . . . . . . . . . . . . . . . . 2.5.2 Parametry komplexních øeení, poskytovaných slueb a jejich dodavatelù 2.5.3 Parametry zdrojù a komponent øeení BI . . . . . . . . . . . . . . . . . 2.5.4 Parametry øízení projektù, pøesnìji øeèeno pøírùstkù BI . . . . . . . . . . 2.5.5 Provozní parametry BI . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
55 55 57 58 59 59 60 61 64 66 68 71 73 75 78 80 83 86 90 91
Èást II: Øeení a realizace úloh Business Intelligence . . . . . . . . . . . . . . . . . . . . . . . . . . 95 3. Pøíprava, plánování, analýzy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97 3.1 Strategie rozvoje Business Intelligence . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97 3.1.1 Analýzy uivatelských (business) poadavkù . . . . . . . . . . . . . . . . . . . . . . 97 3.1.2 Formulace strategických zámìrù v BI . . . . . . . . . . . . . . . . . . . . . . . . . . 101 3.1.3 Analýza pøipravenosti firmy na BI a analýza stavu IS/ICT . . . . . . . . . . . . . . . 101 3.1.4 Návrh architektur BI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102 3.2 Plánování projektu Business Intelligence . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103 3.2.1 Formulace plánu vývoje BI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103 3.2.2 Výbìr øeení a jeho dodavatele . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104 4. Návrh øeení Business Intelligence . . . . . . . . . . . . . . . . . . . 4.1 Detailní specifikace uivatelských poadavkù . . . . . . . . . . . . 4.2 Modelování Business Intelligence øeení . . . . . . . . . . . . . . 4.2.1 Dimenzionální modelování . . . . . . . . . . . . . . . . . 4.2.2 Modelování datového skladu (logický model) . . . . . . . . 4.2.3 Zmìny v dimenzích SCD (Slowly Changing Dimensions) 4.3 Návrh technologické platformy . . . . . . . . . . . . . . . . . . . . 4.3.1 Návrh technologické architektury . . . . . . . . . . . . . . 4.3.2 Fyzický model datového skladu . . . . . . . . . . . . . . . 4.3.3 Øeení velikosti databáze datového skladu a nárùstu dat .
6
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
107 107 108 108 113 121 126 127 128 130
Business Intelligence
4.4
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
132 132 142 144
5. Provoz aplikací Business Intelligence . . . . . . . . . . . . . . . 5.1 Øízení provozu Business Intelligence . . . . . . . . . . . . . 5.1.1 Provoz aplikací BI ve srovnání s provozními systémy 5.1.2 Systém øízení provozu BI . . . . . . . . . . . . . . . 5.1.3 Organizace provozu BI . . . . . . . . . . . . . . . . 5.1.4 Role v BI . . . . . . . . . . . . . . . . . . . . . . . 5.2 Úlohy v provozu Business Intelligence . . . . . . . . . . . . . 5.2.1 Øízení technické infrastruktury . . . . . . . . . . . . 5.2.2 Ladìní výkonu databáze . . . . . . . . . . . . . . . 5.2.3 Udrovaní dat a metadat . . . . . . . . . . . . . . . 5.2.4 Øízení rùstu objemu datového skladu . . . . . . . . 5.3 Ekonomika Business Intelligence . . . . . . . . . . . . . . . 5.3.1 Náklady na BI . . . . . . . . . . . . . . . . . . . . . 5.3.2 Efekty øeení BI . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
147 147 147 148 150 152 154 154 154 154 154 155 155 156
6. Implementace úloh Business Intelligence . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.1 Základní východiska implementace úloh Business Intelligence . . . . . . . . . . . . . . . 6.2 Pøíprava produkèních systémù a dalích zdrojù dat pro Business Intelligence . . . . . . . 6.3 Implementace DSA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.4 Implementace ETL mezi produkèním systémem a DSA . . . . . . . . . . . . . . . . . . . 6.5 Implementace aplikací datových skladù . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.6 Implementace datových pump . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.6.1 Zdroje dat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.6.2 Transformaèní úlohy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.6.3 Øízení prùbìhu transformace . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.6.4 Základní doporuèení pro implementaci datových pump . . . . . . . . . . . . . . 6.7 Naplnìní datového skladu daty . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.8 Implementace OLAP databází . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.8.1 Vytvoøení OLAP databáze a definice umístìní (zpùsobu pøipojení) datových zdrojù 6.8.2 Vytvoøení dimenzí . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.8.3 Vytvoøení definic OLAP kostek . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.8.4 Nastavení pøístupových práv . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.9 Implementace klientských aplikací . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.9.1 Pøipojení k OLAP databázi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.9.2 Vytvoøení kontingenèní tabulky . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.9.3 Vytvoøení kontingenèních grafù . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.9.4 Vytvoøení dalích speciálních výstupù . . . . . . . . . . . . . . . . . . . . . . . 6.9.5 Pracovní panely uivatelù . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . .
159 159 160 160 160 161 164 164 165 167 169 169 171 171 172 180 185 185 186 187 187 190 190
4.5
Obsah
Øeení transformací a kvality dat . . . . . . . . . 4.4.1 Analýzy a øízení kvality dat . . . . . . . . 4.4.2 Návrh transformací dat datových pump . Návrh klientských aplikací . . . . . . . . . . . . .
. . . .
. . . .
. . . .
. . . .
. . . .
7
Èást III: Aplikace a uití Business Intelligence . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 193
8
7. Aplikaèní oblasti Business Intelligence . . . . . 7.1 Finance . . . . . . . . . . . . . . . . . . . . 7.2 Marketing . . . . . . . . . . . . . . . . . . . 7.3 Výroba . . . . . . . . . . . . . . . . . . . . 7.4 Logistika . . . . . . . . . . . . . . . . . . . 7.5 Øízení vztahù s dodavateli . . . . . . . . . . 7.6 Lidské zdroje . . . . . . . . . . . . . . . . . 7.7 Informatika . . . . . . . . . . . . . . . . . . 7.8 Corporate Performance Management (CPM) 7.9 Web Analytics . . . . . . . . . . . . . . . . 7.10 Customer Intelligence . . . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
195 195 196 197 197 198 198 199 199 200 201
8. Dolování dat . . . . . . . . . . . . . . . . . . . 8.1 Úlohy dolování dat . . . . . . . . . . . . . 8.2 Techniky dolování dat . . . . . . . . . . . 8.3 Proces dolování dat . . . . . . . . . . . . 8.3.1 Definice problému . . . . . . . . . 8.3.2 Výbìr dat . . . . . . . . . . . . . 8.3.3 Pøíprava dat . . . . . . . . . . . . 8.3.4 Data Mining . . . . . . . . . . . . 8.3.5 Zprovoznìní modelu (Deployment) 8.3.6 Obchodní akce . . . . . . . . . . 8.4 Technologie dolování dat . . . . . . . . . 8.5 Aplikace dolování dat . . . . . . . . . . . 8.5.1 Segmentace . . . . . . . . . . . . 8.5.2 Automatizovaný skóring zákazníkù
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
205 205 206 207 207 207 207 208 208 208 208 209 209 213
9. Trendy na trhu Business Intelligence . . . . . . . . . . . . . . . . . 9.1 Trh Business Intelligence . . . . . . . . . . . . . . . . . . . . . 9.1.1 Rùst . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9.1.2 Konvergence . . . . . . . . . . . . . . . . . . . . . . . 9.1.3 Posun k dodavatelskému zpùsobu vývoje øeení BI . . . 9.1.4 Vývoj standardù . . . . . . . . . . . . . . . . . . . . . . 9.1.5 Zamìøení na data o zákaznících Customer Intelligence 9.2 Zákazníci a øeení Business Intelligence . . . . . . . . . . . . . 9.3 Architektury Business Intelligence . . . . . . . . . . . . . . . . . 9.3.1 Vývoj architektur øeení BI . . . . . . . . . . . . . . . . 9.3.2 Vývoj komponent BI . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
217 217 220 220 221 221 221 221 224 224 225
10. Faktory úspìnosti øeení Business Intelligence . . . . . . . . . . . 10.1 Faktory úspìnosti ve strategii a plánování Business Intelligence 10.1.1 Úroveò øízení firmy, firemní kultura . . . . . . . . . . . . 10.1.2 Existence potøeby BI aplikací . . . . . . . . . . . . . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
231 232 233 233
. . . . . . . . . . . . . .
Business Intelligence
10.2
10.3
10.4
10.5
10.1.3 Kvalita vize a strategie BI . . . . . . . . . . . . . . . . . . . 10.1.4 Identifikace efektù øeení . . . . . . . . . . . . . . . . . . . 10.1.5 Definování realizovatelných cílù BI . . . . . . . . . . . . . . 10.1.6 Stav zdrojových informaèních systémù a produkèních dat . . 10.1.7 Existence silného sponzora . . . . . . . . . . . . . . . . . . 10.1.8 Motivace uivatelù na kooperaci v BI projektech . . . . . . . 10.1.9 Kvalita a akceptování uivatelských poadavkù . . . . . . . 10.1.10 Volba pøístupu k øeení BI . . . . . . . . . . . . . . . . . . 10.1.11 Jasná definice rozsahu projektù . . . . . . . . . . . . . . . Faktory kvality øeení a slueb Business Intelligence . . . . . . . . . 10.2.1 Rozsah outsourcingu a kvalita dodavatele . . . . . . . . . . 10.2.2 Øízení rizik a kvality slueb BI . . . . . . . . . . . . . . . . 10.2.3 Kvalita smluv SLA . . . . . . . . . . . . . . . . . . . . . . 10.2.4 Kvalita celkové architektury BI . . . . . . . . . . . . . . . . Faktory úspìnosti disponibilních zdrojù . . . . . . . . . . . . . . . . 10.3.1 Objem a doba pro získání financí . . . . . . . . . . . . . . . 10.3.2 Alokace dostateèných pracovních kapacit . . . . . . . . . . 10.3.3 Kvalita technologické platformy BI . . . . . . . . . . . . . . Faktory úspìnosti øízení a øeení projektù Business Intelligence . . . 10.4.1 Úroveò øízení projektu . . . . . . . . . . . . . . . . . . . . 10.4.2 Doba trvání projektu . . . . . . . . . . . . . . . . . . . . . 10.4.3 Úroveò sdílení informací . . . . . . . . . . . . . . . . . . . 10.4.4 Kvalita modelování datových skladù a tri . . . . . . . . . Faktory úspìnosti spojené s provozem aplikací Business Intelligence 10.5.1 Celková úroveò provozu BI aplikací . . . . . . . . . . . . . 10.5.2 Výkonnost BI øeení . . . . . . . . . . . . . . . . . . . . . . 10.5.3 Zpùsob aktualizace datových skladù, øízení nárùstu dat . . . 10.5.4 Nároènost øeení na administraci . . . . . . . . . . . . . . . 10.5.5 Podpora uivatelù . . . . . . . . . . . . . . . . . . . . . . . 10.5.6 Kvalita zmìnových øízení . . . . . . . . . . . . . . . . . . . 10.5.7 Úroveò øízení kvality dat . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
233 234 234 234 235 235 235 236 236 237 237 237 238 238 239 239 239 239 240 241 241 241 241 242 242 242 243 244 244 244 245
Zdroje . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 247 Literatura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 247 Webové adresy související s tematikou . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 249 Terminologický slovník
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 250
Rejstøík . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 251
Obsah
9
O autorech Ing. Ota Novotný, Ph.D. Vystudoval Vysokou kolu ekonomickou v Praze, kde získal i titul Ph.D. v oboru informatika. Od roku 1996 zde na katedøe informaèních technologií pøednáí problematiku business intelligence, ERP produktù, mìøení výkonnosti informaèních systémù a jejich auditu. V souèasné dobì se zamìøuje na aplikaci principù business intelligence v øízení podnikové informatiky a pøi strategickém øízení podniku. Dále zastupuje Èeskou republiku v mezinárodním výboru ISO/IEC JTC1 SC7 Softwarové inenýrství, kde pøipravuje a pøipomínkuje mezinárodní normy ISO/IEC z oblasti mìøení jakosti informaèních systémù a softwarových produktù. Ota Novotný se úèastní øady projektù spojených s návrhem a øízením implementace informaèní podpory firemních procesù a následného auditu. Je spoluautorem dvou knih, autorem èi spoluautorem nìkolika skript a øady èlánkù èi pøíspìvkù na konferencích. Doc. Ing. Jan Pour, CSc. Vystudoval Vysokou kolu ekonomickou v Praze v roce 1970. Je pracovníkem katedry informaèních technologií VE v Praze. Orientuje se na otázky øízení podnikové informatiky, systémovou integraci a øeení úloh business intelligence a datových skladù. Je autorem nebo spoluautorem ètyø kniních publikací, 25 vysokokolských skript a øady èlánkù a pøíspìvkù na konferencích. V souèasné dobì je èlenem Rady Èeské spoleènosti pro systémovou integraci a éfredaktorem èasopisu Systémová integrace. Je èlenem programových výborù mezinárodních konferencí, pùsobí rovnì jako analytik v konzultaèní a analytické spoleènosti ITG se sídlem v Praze. Jan Pour se podílí na øeení projektù v oblasti øízení podnikové informatiky a v oblasti návrhù informaèních systémù v prùmyslu, obchodu, energetice i v organizacích státní správy. Ing. David Slánský Vystudoval katedru informaèních technologií Vysoké koly ekonomické v Praze, pùsobil rovnì v jaderné laboratoøi CERN ve výcarsku. V souèasné dobì pracuje ve spoleènosti Adastra, kde zastává pozici Business Analyst Manager. David Slánský se intenzivnì vìnuje oblasti business intelligence a následnému vyuití v zákaznicky orientovaných procesech v podnicích, zejména v telekomunikaèních spoleènostech a finanèních institucích. Kromì business intelligence se specializuje na analýzu, design a implementaci IS/ICT architektur a na související problematiku mìøení pøínosù a nákladù IS/ICT øeení.
O autorech
11
Úvod Business Intelligence (BI) je termín, oznaèující celý komplex èinností, úloh a technologií, které dnes stále èastìji tvoøí bìnou souèást øízení podnikù a jejich informaèních systémù. Business Intelligence není právì ryzí èeský termín, ale v odborné praxi se ji tak vil a souèasnì je natolik obtíné pro nìj najít nìjaký pøijatelný pøeklad (podniková inteligence, obchodní inteligence, inteligentní obchod,
), e jsme u nìj radìji zùstali, za co se vem ètenáøùm omlouváme. Na úvod této publikace si musíme zodpovìdìt tøi obvyklé otázky: l l l
Co je jejím úèelem? Komu je urèena? Co je jejím obsahem a na co je orientována?
Úèel: Text je koncipován jako základ pro práci a dalí studium v oblasti Business Intelligence (BI). Jeho úèelem je podat v pomìrnì komprimované formì celkový pøehled o principech, na nich jsou úlohy a aplikace BI zaloeny, o pøístupech k jejich øeení a rovnì o monostech jejich vyuití v øízení podniku nebo instituce. Zámìrem autorù proto není podat detailní výklad jednotlivých produktù nebo technologií, které se v dané oblasti pouívají. Na druhé stranì je snahou dokumentovat prezentované principy øeení na konkrétních pøíkladech. Pro tento úèel jsou zde pøevánì vyuívány prostøedky spojené s databázovým prostøedím Microsoft SQL Server 2000, a v jeho rámci integrovanými produkty BI, zejména Analysis Services a Data Transformation Services (DTS). Vzhledem k tomu, e jde o oblast informatiky, která se dynamicky rozvíjí, jsou v této textové formì obsaeny pøedevím obecnì platné charakteristiky a metody spojené s øeením BI, zatímco aktuální informace o produktech, novinky na trhu BI a dalí doplòující informace najde ètenáø na www stránkách rùzných informaèních serverù, napø. Èeské spoleènosti pro systémovou integraci, Datawarehouse klubu, Centra pro BI a dalích uvedených v závìru knihy. Urèení: Publikace je primárnì urèena pracovníkùm v oblasti informatiky, kteøí a dosud pracovali v oblasti transakèních aplikací a chtìjí rozíøit svoji specializaci i pro oblast analytických a rozhodovacích úloh v rámci øeení podnikových informaèních systémù, dále pracovníkùm pùsobícím v uivatelské sféøe informatiky, kteøí se budou podílet na øeení uvedeného typu aplikací jako konzultanti nebo zadavatelé tìchto úloh, a v neposlední øadì i studentùm oborù informatiky jako studijní literatura pro kursy BI, resp. aplikaènì orientované kursy informaèních systémù. Obsah: Obsah celé publikace se dìlí do tøí èástí, které na sebe velmi úzce navazují, a to: l
Èást I Principy Business Intelligence, podává celkový pøehled o obsahové i technologické podstatì Business Intelligence, jeho hlavních komponentách a úlohách spojených s jeho øeením a øízením.
l
Èást II Øeení a realizace úloh Business Intelligence, se detailnìji zabývá jednotlivými otázkami a úlohami BI, poèínaje urèením jejího strategického zamìøení, plánováním projektù, pøes analýzu, modelování, návrh a implementaci a po zajitìní organizace, øízení provozu BI aplikací a hodnocení jejich efektù vzhledem k pøedpokládaným nebo vynaloeným nákladùm. Kadá z dílèích úloh v této èásti zahrnuje vymezení jejich úèelu (proè se realizují), jejich obsahové podstaty (co je jejich náplní) a faktorù jejich úspìné realizace (co je pøi jejich øeení dobré respektovat a které dosavadní zkuenosti zohlednit).
Úvod
13
l
Èást III Aplikace Business Intelligence, nabízí základní pøedstavu o monostech uití technologií a aplikací BI pøi øízení firmy nebo instituce, a to od dnes ji vcelku obvyklých øeení v oblasti finanèních, obchodních nebo marketingových analýz a po stále atraktivnìjí typy aplikací, jako je tzv. Customer Intelligence, aplikace BI ve strategickém øízení firmy apod. Èást III má tak odpovìdìt na otázky, kde lze BI ve firmì vyuít, jaké jsou zde jeho monosti a pøípadná omezení.
Celkovou strukturu textu dokumentuje úvodní obrázek.
Business Intelligence
A. Principy BI
B. Øeení a realizace úloh BI
C. Aplikace a uití BI
[1] BI vývoj a základní principy
[3] Pøíprava, plánování, analýzy
[7] Aplikaèní oblasti BI
[2] Øízení projektù a aplikací BI
[4] Návrh øení BI
[8] Data Mining
[5] Provoz aplikací BI
[9] Trendy na trhu BI
[6] Pøíklad implementace úloh BI
[10] Faktory úspìchu BI øeení
Struktura textu S obsahem souvisí i forma textu a proto na tomto místì upozorníme na pouité piktogramy uvozující standardní èásti jednotlivých kapitol:
y ` 2
F Ò
Orientace a úèel kapitoly nebo èásti textu. Vymezení nebo definice pojmu. Pøíklady nebo dílèí kroky pøi realizaci jednotlivých funkcí. Doporuèení pro øeení úlohy, problému nebo operace. Shrnutí kapitoly nebo vybrané èásti textu.
Na závìr by autoøi chtìli touto cestou podìkovat spolupracovníkùm i absolventùm Katedry informaèních technologií Vysoké koly ekonomické v Praze, kteøí se podíleli na pøípravì podkladù. Jejich práce jsou uvedeny v celkovém pøehledu literatury. Zvlátní dík patøí zamìstnancùm spoleènosti Adastra (zejména Ing. Ondøeji òupárkovi, Ing. Jaroslavu Vlèkovi, Ing. Tomái Koèkovi, Ph.D., a Ing. Martinu álymu), kteøí poskytli pro tuto publikaci cenné materiály, pøipomínky a námìty.
14
Business Intelligence
I
ÈÁST I: PRINCIPY BUSINESS INTELLIGENCE Cílem celé první èásti je objasnit podstatu Business Intelligence a zpùsob øízení a øeení jeho provozu a rozvoje. Celkový pohled na témata prezentovaná v této èásti poskytuje následující obrázek. Vývoj a základní principy BI Vývoj v BI (technologie, aplikace, uití) Pozice BI v øízení firmy a v IS/ICT Principy øeení BI multidimenzionální databáze (MOLAP, ROLAP HOLAP) rozdíly OLAP a OLTP technologie Komponenty øeení BI datové sklady datová tritì operativní úloitì dat (ODS) doèasné úloitì dat (DSA) ETL nástroje EIS, manaerské aplikace nástroje zajitìní kvality dat nástroje pro správu metadat nástroje dolování dat
Øízení rozvoje, provozu a projektování BI
Úlohy v øízení BI (v kontextu øízení celého systému) Pøístupy k øeení BI (pøírùstkový, globální, atd.)
Øízení rozvoje a provozu strategie BI plánování projektù BI øízení slueb v BI øízení zdrojù BI øízení projektù øízení provozu BI
Projektování BI úvodní studie specifikace pøírùstku analýza modelování datového skladu a návrh øeení technologická platforma návrh transformací (ETL) implementace
Podstatné parametry pro projektování a øízení BI
Pøíklady øeení BI (MS SQL 2000, ProClarity)
Struktura témat prezentovaných v èásti I
15
1 1. Business Intelligence vývoj a základní principy y
Business Intelligence (BI) pøedstavuje komplex pøístupù a aplikací IS/ICT, které témìø výluènì podporují analytické a plánovací èinnosti podnikù a organizací a jsou postaveny na principu multidimenzionality, kterým zde rozumíme monost pohlíet na realitu z nìkolika moných úhlù. Cílem této kapitoly je vysvìtlit dosavadní vývoj a základní principy tìchto technologií a aplikací.
1.1 Vývoj Business Intelligence Øeení smìøující k podpoøe manaerských a analytických úloh v podnikovém øízení se zaèala objevovat ji na konci sedmdesátých let minulého století v souvislosti s rozvojem on-line zpracování dat. Prvotní pokusy a aplikace jsou spojeny s americkou firmou Lockheed. V polovinì osmdesátých let byly publikovány první významné práce k tomuto typu aplikací (prof. Rockart: CEO Goes On-line a nìkteré dalí). V druhé polovinì osmdesátých let pøily na trh v USA první firmy s komerèními produkty, zaloenými na multidimenzionálním uloení a zpracování dat, oznaèovanými jako EIS (Executive Information System), a to firmy Comshare a Pilot. Trh s EIS produkty se pak velmi rychle rozvíjel a na zaèátku devadesátých let (od roku 1993) se tyto produkty zaèaly prosazovat i na èeském IS/ICT trhu. Koncem osmdesátých a zaèátkem devadesátých let se v USA zaèal velmi silnì prosazovat i dalí trend v multidimenzionálních technologiích, a to datové sklady (Data Warehouse) a datová tritì (Data Marts). Za rozvojem tìchto technologií stáli pøedevím Ralph Kimball a Bill Inmon. Vìtí uplatnìní datových skladù a tri je na èeském trhu patrné spíe a v druhé polovinì devadesátých let. V souvislosti s datovými sklady a narùstajícím objemem dat v tomto prostøedí se v prùbìhu devadesátých let zaèaly prosazovat i technologie a nástroje tzv. dolování dat (Data Mining)1 zaloené na vysoce sofistikovaných analýzách dat s pomocí nejrùznìjích matematických a statistických metod. K jednotlivým technologiím, nástrojùm a aplikacím zaøazovaným do Business Intelligence se budeme postupnì vracet v dalích èástech tohoto textu.
1.2 Business Intelligence v øízení firmy V prostøedí stále tvrdí konkurence musí podnikoví analytici a manaeøi rozhodovat pod èasovým tlakem a souèasnì s vysokou zodpovìdností. To znamená, e pro tato rozhodnutí musí mít dostatek relevantních a objektivních informací, které jsou dostupné rychle, s minimální technickou nároèností na manipulaci, a pøitom s moností rychle formulovat nové poadavky na dalí informace odpovídající aktuální obchodní nebo výrobní situaci. Zpracování a uloení dat v transakèních systémech, pøedevím v aplikacích ERP, je zaloeno vesmìs na vyuití relaèních databázových systémù. Toto øeení je v mnohém ohledu velmi výhodné. Data jsou zde pøehlednì uspoøádána, a v pøípadì efektivnì navrené datové základny umoòují rychlé provádìní jednotlivých 1
V této publikaci jsou oba termíny pouívány ve stejném významu
Business Intelligence vývoj a základní principy
17
1 transakcí a poskytují odpovídající dobu odezvy na zadané dotazy. Navíc zajiují integritu dat, bezpeènost pøístupu k datùm a dalí potøebné charakteristiky spojené s øízením firmy na taktické nebo operaèní úrovni. ERP aplikace vak mají z hlediska analytických a plánovacích èinností podniku nìkterá omezení: l
Neumoòují rychle a prunì mìnit kritéria pro analýzy podnikových dat (napø. sledovat data o prodeji v èase, podle zákazníkù, produktù, segmentù trhu, obchodních zástupcù, podnikových útvarù, a dále i v nejrùznìjích kombinacích uvedených kritérií).
l
Stejnì tak se v obrovských objemech dat souèasných databází obtínì øeí zajitìní okamitého pøístupu pracovníkù k agregovaným datùm, a to na nejrùznìjích úrovních agregace (za podnik, útvar, za vechny zákazníky, skupiny zákazníkù, jednotlivé zákazníky atd.).
l
ERP a ostatní transakèní aplikace jsou primárnì urèeny pro poøizování a aktualizace dat, pøièem nìkteré z nich pracují neustále témìø na 100 % svého moného výkonu; analytické úlohy tyto systémy nadmìrnì zatìují a v mnohých pøípadech nejsou ani díky jejich vytíení moné.
l
Dalím problémem je narùstající objem dat v podniku, který se v prùmìru zdvojnásobí kadých pìt let. Vìtina firem tak nemá problém s nedostatkem dat, ale naopak firmy jsou jimi zahlceny, a to èasto redundantními a nekonzistentními daty, která jsou v rozhodovacích procesech obtínì vyuitelná.
Pokud o tìchto omezeních mluvíme v souvislosti se systémy ERP, pak to neznamená, e by aplikace ERP a dalí transakèní úlohy nebyly schopny zmínìné operace realizovat. Jde vak o jejich rychlost a prunost vzhledem k uivatelským poadavkùm. Øeení uvedených problémù se tak postupnì stalo doménou speciálních technologií a aplikací Business Intelligence. Termín Business Intelligence zavedl v roce 1989 Howard J. Dresner, analytik spoleènosti Gartner Group, který jej popsal jako sadu konceptù a metod urèených pro zkvalitnìní rozhodnutí firmy. Vyzdvihuje zde význam datové analýzy, reportingu a dotazovacích nástrojù, které provádìjí uivatele mnostvím dat a pomáhají mu se syntézou hodnotných a uiteèných informací. Moná právì díky krátké dobì existence tohoto termínu není pro nìj v dnení dobì zavedena jednotná definice, podporovaná jakoukoliv organizací, zabývající se standardy (napø. ANSI). Napøíklad definice ze serveru searchCRM.com definuje Business Intelligence jako urèitou kategorii aplikací a technologií pro sbìr, skladování, analyzování a zpøístupòování dat, jejich úèelem je pomoci podnikovým uivatelùm dìlat lepí rozhodnutí. BI aplikace podle searchCRM.com zahrnují funkènost systémù pro podporu rozhodování, dotazování a reportingu, statistických analýz, vytváøení prognóz a Data Mining. Server firmy iOLAP charakterizuje BI jako sbìr a analýzu dat, jejím cílem je lepí porozumìní a reakce na zmìny, kterým organizace èelí2. Definici zaloenou na znalostech a informacích nabízí server DM Review3, který definuje BI jako znalosti o podniku získané za pomoci rozlièných hardwarových a softwarových technologií, které umoòují organizaci pøemìnit data na informace. Tento popis povauje technologie pouze za prostøedek, nikoli za podstatu Business Intelligence. Pro dalí úèely tohoto textu vyuijeme definici na serveru Èeské spoleènosti pro systémovou integraci (www.cssi.cz): 2 3
18
iOLAP http://www.iolap.com/bi_getting_started.htm DM Review http://www.dmreview.com
Business Intelligence
1 `
Business Intelligence je sada procesù, aplikací a technologií, jejich cílem je úèinnì a úèelnì podporovat rozhodovací procesy ve firmì. Podporují analytické a plánovací èinnosti podnikù a organizací a jsou postaveny na principech multidimenzionálních pohledù na podniková data. Aplikace BI pokrývají analytické a plánovací funkce vìtiny oblastí podnikového øízení, tj. prodeje, nákupu, marketingu, finanèního øízení, controllingu, majetku, øízení lidských zdrojù, výroby, IS/ICT apod. Do nástrojù a aplikací Business Intelligence se zahrnují: l l l l l l l l l l l l l l
produkèní, zdrojové systémy, doèasná úloitì dat (DSA Data Staging Area), operativní úloitì dat (ODS Operational Data Store), transformaèní nástroje (ETL Extraction Transformation Loading), integraèní nástroje (EAI Enterprise Application Integration), datové sklady (DWH Data Warehouses), datová tritì (DMA Data Marts), OLAP, reporting, manaerské aplikace (EIS Executive Information Systems), dolování dat (Data Mining), nástroje pro zajitìní kvality dat, nástroje pro správu metadat, ostatní.
K uvedenému pøehledu nástrojù, které zahrnujeme do BI, je nutné poznamenat, e i na tuto otázku existují rùzné názory. Vedle toho, který chápe BI jako iroký rámec od manaerských aplikací po reporting, existuje i jiný pohled, který chápe BI pouze jako jeden z nástrojù vedle, resp. nad datovými sklady nebo datovými triti. V naem pøípadì se budeme nadále dret první z uvedených variant. Ze vech pøedcházejících vymezení a definic vak vyplývá, e BI je orientován na vlastní vyuití informací v øízení a rozhodování, a nikoli na základní zpracování dat a realizaci bìných obchodních, finanèních a dalích transakcí. To, jak jsou monosti BI vyuity, dnes do znaèné míry ovlivòuje výkonnost a kvalitu øízení firmy, a v souvislosti s tím nakonec i její celkovou úspìnost a konkurenceschopnost. Business Intelligence pøedstavuje ji iroký komplex nástrojù a aplikací, jejich postavení v architektuøe IS/ICT dokumentuje obrázek 1.1. Z obrázku vyplývá, e BI je úzce provázána s ostatními aplikacemi IS/ICT, èerpá z nich vstupní data a v poslední dobì i data èasto do ostatních aplikací vrací. To vede k dílèímu pracovnímu závìru, e kvalita øeení BI je úzce závislá na kvalitì ostatních (transakèních) aplikací, zejména na kvalitì jejich tzv. produkèních dat, resp. databází.
Business Intelligence vývoj a základní principy
19
1
GØ, poboèky
Vedení podniku
Dceøiné spoleènosti
Business Intelligence, strategický IS
Interní infrastruktura, intranet, OIS, work-flow
BI
M
Elektronický obchod, øízení ext. vztahù
Dodavatelé
Øízení obchodu prodej, nákup, sklady, marketing
Zákazníci
R
Øízení zdrojù majetek, personál PAM, dopravy, ekologie
Øízení ekonomiky úèetnictví, controlling, treasury, finanèní plánování
BI
Øízení výroby, provozu TPV, plánování hlavní výroby, OØV, dílenské øízení výroby, plánování kapacit
C
BI
(EIS, datové sklady, data marts, reporting)
Øízení vztahù s dodavateli a ostatními partnery BI
Ostatní partneøi (státní správa, burza,
)
Obrázek 1.1 Postavení BI v aplikaèní architektuøe IS/ICT
1.3 Základní principy øeení Business Intelligence V pøedchozí èásti kapitoly jsme vymezili hlavní komponenty BI øeení (manaerské aplikace, datové sklady atd.). I kdy jsou mezi nimi podstatné rozdíly, pøesto celá øada základních principù je spoleèná. Na tomto místì se proto zamìøíme na: l l
základní principy muItidimenzionálních databází, hlavní rozdíly mezi analytickými a transakèními systémy.
1.3.1 Základní principy multidimenzionálních databází Z pøedchozího textu vyplývá, e informaèní systémy mohou pracovat se dvìma základními typy informací operativními a analytickými. První typ, operativní informace, slouí pro realizaci obchodních a dalích transakcí v podniku. Jsou uloeny vìtinou v relaèních databázích, zobrazují aktuální stav podniku a v prùbìhu jednoho dne se mohou i nìkolikrát mìnit. Pøíkladem mùe být napø. úèetnictví, data v dokumentech obchodních pøípadù apod. Transakèní systémy realizují jejich zpracování v reálném èase a oznaèují se jako OLTP (On Line Transaction Processing) systémy. Vzhledem k analytickým aplikacím se data OLTP systémù chápou jako primární, zdrojová nebo produkèní.
20
Business Intelligence
1 Na druhé stranì systémy pracující s analytickými informacemi vyuívají primární data vytvoøená v OLTP systémech. Pro své uloení a operace s daty se pro tyto systémy vil v osmdesátých letech minulého století název OLAP On Line Analytical Processing. Se zavedením pojmu BI (který ve své podstatì kopíruje výe zmínìný význam výrazu OLAP) a souèasnì s rozvojem nástrojù a technologií pro podporu analytických èinností v organizaci se vak výraz OLAP ponìkud zúil.
`
Uí význam definuje OLAP èistì technologicky, tedy jako informaèní technologii zaloenou pøedevím na koncepci multidimenzionálních databází. Jejím hlavním principem je nìkolikadimenzionální tabulka umoòující rychle a prunì mìnit jednotlivé dimenze, a mìnit tak pohledy uivatele na modelovanou ekonomickou realitu. Tato kniha bude nadále pracovat s uím technologickým významem výrazu OLAP. Pro irí význam budeme pouívat výraz analytické nebo BI systémy.
Na rozdíl od OLTP systémù jsou analytické systémy charakteristické pøedevím tìmito vlastnostmi: l
l l l
informace poskytují na základì vstupù získaných z primárních dat (viz pøedchozí schéma architektury IS/ICT); jejich data jsou uloena multidimenzionálnì, resp. v multidimenzionálních databázích; obsahují rùzné úrovnì agregace dat, podle hierarchické struktury dimenzí (viz dále); zachycují faktor èasu a umoòují realizovat èasová srovnání, èasové øady, predikovat moný vývoj sledovaných ukazatelù apod.
Pro snadnìjí pochopení principù fungování analytických systémù, a jejich rozdílu oproti systémùm transakèním (OLTP), budeme v následujících odstavcích vycházet z pøedpokladu, e analytické øeení bude pokrývat typické poadavky na reporting, tedy nejstarí, a jetì stále nejrozíøenìjí, funkcionalitu analytických aplikací. 1.3.1.1 Architektura multidimenzionální databáze Pro data analytického typu se nehodí, aby byla ukládána v relaèních databázích do podoby tøetí normální formy (typické pro transakèní systémy). Aby analytické systémy mohly poskytovat rùzné analýzy a pøehledy slouící pro strategické rozhodování, je nutné, abychom se na jejich data mohli dívat z více hledisek souèasnì. Mìlo by tedy být moné vytváøet tzv. multidimenzionální pohledy, co je pro data uloená v tøetí normální formì velký problém. Nástroje koncového uivatele musí umoòovat analýzu ve smyslu nacházení souvislostí, které nejsou z primárních dat na první pohled zøejmé. Navíc je nutné procházet velká mnoství dat, vypoèítávat agregace (které v databázích modelovaných ve tøetí normální formì nejsou automaticky uloeny), rychle mìnit pohledy na data, rychle, a co moná automatizovanì, je ukládat do pøehledných tabulek a grafù. Multidimenzionální databáze jsou ji optimalizované pro uloení a interaktivní vyuívání multidimenzionálních dat. Výhodou multidimenzionality, resp. nasazení OLAP technologií (v uím chápání), je rychlost zpracování a efektivní analýzy multidimenzionálních dat (drilling, slice and dice apod.). Základním principem, na nìm jsou aplikace Business Intelligence zaloeny, je nìkolikadimenzionální tabulka umoòující velmi rychle a prunì mìnit jednotlivé dimenze, a nabízet tak uivateli rùzné pohledy na mo-
Business Intelligence vývoj a základní principy
21
1 delovanou ekonomickou realitu. Jde tak v podstatì o princip n-dimenzionální Rubikovy kostky naplnìné nejdùleitìjími podnikovými daty viz obrázek 1.2.
závod 1
or ga n
iz aè
ní j
ed
no t
ky
dalí dimenze tabulky
ukazatele (napø. prodej urèité komodity, stav zamìstnancù, dosaené trby)
napø.
30.9.
31.10. 30.11. 31.12.
prvek tabulky vyjadøuje hodnotu stav zamìstnancù k 31.12. v závodì 1
èas
Obrázek 1.2 Princip multidimenzionální databáze Z obrázku vyplývá, e standardními dvìma dimenzemi jsou tu ukazatele (ekonomické promìnné) a èas. Ostatní dimenze se pro jednotlivé modely definují podle potøeby, napø. organizaèní jednotka, komodita, zákazník, dodavatel, teritorium, konkurent apod. Obsah dimenzí je tvoøen prvky dimenzí, tj. konkrétními závody, provozy nebo zákazníky, dodavateli, komoditami apod. Promítnutí vech dimenzí do jednoho bodu tvoøí prvek multidimenzionální databáze. Kadý prvek mùe pak obsahovat data nebo pøedpisy (algoritmy) pro jejich transformace. Je tøeba vak souèasnì pøipomenout, e rùzné produkty rùzných výrobcù pouívají pro výe uvedené termíny rùznou terminologii, v tomto pøípadì odkazujeme na pøíslunou firemní dokumentaci. Zpùsoby konkrétní realizace uvedených principù jsou uvedeny v èástech vìnovaných pøíkladùm vybraných produktù. Prvky dimenzí jsou vìtinou uspoøádány v hierarchické struktuøe, tzn. e se rozdìlují na skupiny prvkù, podskupiny a na jednotlivé prvky. Produkty Business Intelligence pak zajiují automatické agregace hodnot (napø. ekonomických promìnných), a to podle definovaných hierarchických úrovní dimenzí.
22
Business Intelligence
1 Jednoduchým pøíkladem takových struktur mùe být dimenze organizaèní struktura: Podnik celkem Závod 1 Provoz 11 Dílna 111 atd. Závod 2 atd. Aplikace Business Intelligence pak budou automaticky sledovat napø. hodnoty výroby, prodejù zboí, zásob, zisku apod. podle uvedené organizaèní struktury a budou zajiovat agregace podle takto definované hierarchické struktury. Tato metoda je vyuívána pro urychlení odezvy systému na analytické poadavky. Pokud by toti bylo nutné on-line vypoèítávat souèty pøi zobrazování tabulky èi grafu ze statisícù èi milionù hodnot, odezva systému by mohla být neúnosnì veliká. Hierarchie uloení agregovaných dat pak uivateli umoòuje se prunì po poadovaných úrovních agregace pohybovat (na úrovni závodù, provozù apod.), ani by bylo nutné vdy znovu poadované agregace poèítat. Tento princip se oznaèuje drill-down (pohyb zpøístupnìní dat pro nií úroveò agregace detailnìjích dat) nebo drill-up (v opaèném smìru). Multidimenzionalita dat mùe být implementována na dvou úrovních: l l
na úrovni relaèní databáze, v tzv. STAR scheme nebo SNOWFLAKE scheme (viz níe), na úrovni speciální binární databáze.
1.3.1.2 Implementace na úrovni relaèní databáze Jak ji bylo øeèeno, databáze produkèních transakèních systémù bývají modelovány v tzv. tøetí normální formì. Jedná se o design databáze, který nejvíce vyhovuje poadavkùm na tyto systémy tedy monosti data rychle a jednodue ukládat a souèasnì optimalizovat velikost databáze. Datové modely produkèních systémù jsou komplexní, obsahují mnoho tabulek a jejich vazby. Neexistuje jedineèný zpùsob, jak provést dotaz do databáze. Tìchto zpùsobù je vìtí mnoství a záleí jen na uivateli, kterou vazbu mezi tabulkami zvolí. Rùzné dotazy tedy mohou dát stejné výsledky. Tím se ovem pro bìného uivatele stává databáze velmi nepøehledná. Pro dotazy do více tabulek navíc musí vytváøet jakési propojovací mùstky, a jak si dále ukáeme, právì tato propojení jsou nejvìtí zátìí systému. Pro výe uvedené nedostatky se objevily snahy o zjednoduení ERD diagramu, pøizpùsobení jej pro tvorbu datových skladù, a pøedevím pøiblíit data koncovému uivateli. Vznikl tak relaèní dimenzionální model kterému se také bìnì øíká Schéma hvìzdy (STAR scheme), resp. Schéma snìhové vloèky (SNOWFLAKE scheme) viz obr. 1.3 a obr. 1.4. V centru schématu je tzv. tabulka faktù, tedy tabulka sledovaných ekonomických a dalích ukazatelù identifikovaných klíèem sloeným z klíèù tzv. dimenzionálních tabulek, v nich jsou uloeny prvky jednotlivých dimenzí. Dimenzionální tabulky slouí jako úloitì textových informací o hodnotách uloených v tabulce faktù. Typicky si ji lze pøedstavit jako èíselník. Pro reálné dimenzionální tabulky je typické veliké mnoství atributù, pro nì se nejlépe hodí atributy textové a diskrétní. Pøesto obèas bývá problematické rozhodnout, které pole bude zaøazeno do fakt tabulky, a které do tabulky dimenzionální. Nae rozhodnutí je vìtinou závislé na tom, je-li sledovaná velièina mìøitelná a mìnící se v èase pak patøí do fakt tabulky, èi zda je diskrétní a vystupuje spíe jako konstanta pak jde o poloku z dimenzionální tabulky.
Business Intelligence vývoj a základní principy
23