IT Strategie
Dejme manažerovi, co potřebuje aneb Business intelligence a podniková praxe Manažerské vyhodnocování, business intelligence (zkráceně BI), dolování dat (data mining), datový sklad (data warehouse), OLAP, ... Musí manažer znát tyto hrozné pojmy a zkratky? Může v dnešní době někdo podnikat, aniž by tyto nástroje používal v denní praxi? Týká se to pouze vrcholových manažerů velkých podniků, nebo má zpozornět i místní pekař, stolař či internetový prodejce? V následujících odstavcích si dovolím nabídnout stručný vhled do těchto pojmů a jejich významu a třeba se mi podaří čtenáře v tomto prostoru více zorientovat. Na jednu otázku ovšem s dovolením odpovím hned: zpozornět by měli úplně všichni. Co vlastně manažer potřebuje? Hlavní úlohou manažera (česky řídícího či vedoucího pracovníka) je řídit a rozhodovat o dalším směrování své firmy, svého oddělení, svého střediska, svého obchodu nebo svého malého podniku. A aby tuto činnost mohl vykonávat dobře, musí mít především dobré informace. Informace získáme z dat
daného podniku – faktur, skladových pohybů, plateb, výroby, docházky, telefonní ústředny atd. Aby z těchto dat vyhodnocené informace manažerovi sloužily, musí to být: Informace rychlé Manažer musí v krátkém čase rozhodovat v mnoha otázkách. Pokud má pro něj mít nějaké vyhodnocení smysl, musí jej mít
Jan Šarman
prakticky okamžitě v momentě potřeby. Je iluzorní představa, že na nějaké vyhodnocení bude čekat minuty, nebo dokonce hodiny. Informace přehledné Poskytované informace musí být přehledné a názorné. K tomu významně napomáhá soustava jednoduchých tabulek, názorných grafů, barevných zvýraznění atd. Nepřehledná změť písmenek a čísel je rovněž něco, s čím manažera těžko potěšíme. Informace efektivní Předkládaná vyhodnocení musí obsahovat všechny informace, které manažer potřebuje, a zároveň nesmí obsahovat žádné, které nepotřebuje. Zajímá-li někoho například obrat za jednotlivé měsíce, je sestava všech faktur, na níž je po každém měsíci uveden součet za daný měsíc, sice použitelná, ale neefektivní. www.SystemOnLine.cz
2
IT Systems 11/2011
Strategie IT
Informace pravdivé Ačkoliv se může zdát být tento požadavek zřejmý, jeho splnění v podnikatelské praxi už tak samozřejmé není. Všechny pohledy na data musí vzájemně korespondovat a křížově souhlasit. Například u vyhodnocení, podle kterých jsou všechna střediska prosperující, ovšem podnik samotný krachuje, je evidentně něco v nepořádku.
Jak lze takové informace získat? Ať již používáme ve svém podniku informační systém s manažerskou nadstavbou, nebo bez ní, případně si vedeme evidenci ručně, vždy budeme vycházet z dokladů. Z nich pak sestavíme požadované pohledy, zpravidla jedním z níže uvedených způsobů: Pravidelné reporty Manažer pověří své podřízené, aby mu v pravidelných časových intervalech (den, týden, měsíc, rok) předkládali různá vyhodnocení v jasně definovaném formátu. Ať jsou již tato vyhodnocení v papírové podobě, nebo v elektronickém formátu (Word, Excel, PDF, ...), určitě tato metoda funguje v nějaké podobě v každém podniku. Má mnoho výhod, protože splňuje skoro všechny výše uvedené požadavky. Zároveň je tím splněn i požadavek na správnou komunikaci mezi nadřízeným a podřízeným, kdy podřízeným je zřejmé, které ukazatele manažera zajímají, a které mají tedy pozitivně naplňovat. Bohužel není tento způsob vyhodnocování příliš operativní a existuje zde také riziko nepravdivosti informací. Blíže se k tomu dostaneme dále. Je ovšem také pravdou, že tento způsob jako jediný umožňuje manažerovi ke svým vyhodnocením nepoužívat počítač.
Grafy
Semafory
Prezentační vrstva
Tabulky
Datový sklad
OLAP
OLAP server
Datový sklad
Datová pumpa ERP
Docházka
Relační databáze
Primární data
Informace operativní Častokrát vyvstane potřeba vyhodnocení, které je nové. Manažer se například dozví, že v nějakém regionu rapidně stoupá počet obyvatel. Okamžitě chce znát objemy prodeje v tomto regionu za poslední kvartál, aby mohl adekvátně upravit zásobování této oblasti, a to aniž by doposud takové vyhodnocení prováděl. Představa, že svolá odpovědné pracovníky, kterým začne formulovat svůj požadavek na vyhodnocení, a tito začnou následně dávat dohromady vyhovující sestavu (samozřejmě za úplatu), je o ničem. Zatímco předešlé požadavky lze splnit i s velmi jednoduchými nástroji, a někdy i za absence výpočetní techniky vůbec, tento požadavek je pravděpodobně bez moderního nástroje, jakým je OLAP, nemyslitelný.
Call centrum
Extrahování Vyčištění Transformace
Externí zdroje dat
Obr. 1: Struktura toku dat v manažerském vyhodnocení
Počítačové sestavy Manažer si sám z informačního systému spouští různé sestavy. Tento způsob je rovněž velmi rozšířený. Kromě výhod, kdy si lze získávat informace kdykoliv a s rozmanitými parametry, má ovšem tento způsob celou řadu nevýhod. Především, stejně jako v předchozím případě, nejsou vyhodnocení operativní. I když budeme mít k dispozici tisíc různých sestav s desítkami rozmanitých parametrů, stejně budeme potřebovat tisící první sestavu, kterou ještě nemáme, nebo alespoň stý prvý parametr, který ještě nemáme. Další poměrně významnou nevýhodou je technika získávání dat danou sestavou. Každá sestava musí projet kompletně vyhodnocovaný vzorek dat. Chceme-li například zobrazit sumární obraty za vybraný artikl po letech, tedy za každý rok jedno číslo, tak ačkoliv je výstup velmi jednoduchý, počítač musí projet úplně všechny záznamy a požadované hodnoty vypočítat, což může docela dlouho trvat. Jakmile pak chceme totéž vidět, ovšem za jiný artikl, za zákazníka nebo za jiných podmínek, běží výpočet znovu. Při větším objemu dat může pak být tento způsob u některých vyhodnocení zcela nepoužitelný. OLAP s jednoduchým prohlížečem Efektivní a moderní způsob vyhodnocování dat. Splňuje všechny výše uvedené požadavky. I kdyby manažer sám nechtěl s počítačem, případně s daty přímo pracovat, vždy je pro podřízeného pohodlnější požadovaná vyhod-
nocení poskytovat z OLAPu, případně nadřízenému přednastavit pohledy do OLAPu, než volit některý z klasických způsobů. A jakmile si manažer osvojí velmi jednoduchý způsob nahlížení do tzv. datových kostek OLAPu, otevře se mu úžasný svět informací, které se o svém podniku dozví. Hlavní předností tohoto způsobu je totiž právě již zmiňovaná operativnost spojená s rychlostí poskytování informací.
Datový sklad Strukturu toku dat v manažerském vyhodnocení znázorňuje obrázek 1. Sestavení datového skladu (data warehouse) je prvním krokem k efektivnímu manažerskému vyhodnocení. Očištění dat Jedním z významů této tabulky je uložení již hotových dat. To znamená, že se sem kopírují pouze data z již uzavřených dokladů, u kterých se nepředpokládá jejich změna. Vyhodnocení z datového skladu tedy nejsou zkreslována aktuálními změnami dokladů, které ještě nemají finální podobu. Dále se datový sklad nezatěžuje daty, která jsou důležitá pouze pro aktuální provoz informačního systému, ovšem pro manažerské vyhodnocení nemají žádnou relevanci. Archivace dat Data se z ERP systému kopírují zpravidla od nějaké časové hranice, ovšem uložena jsou v datovém skladu za celé období fungování podniku. Lze tedy z ERP systému postupně
www.SystemOnLine.cz IT Systems 11/2011
3
IT Strategie Osy (Dimensions) Datum Den 12.5.2000 12 23.9.2004 23 1.1.2006 1 15.10.2011 15
Měsíc 5 9 1 10
Rok 2000 2004 2006 2011
Artikl LIMO1 LIMO1 AUTO1 LIMO2
Zákazník O2 Vítkovice Budweiser O2
Středisko 10 10 20 10
Region A T C A
Druh zb. Limo Limo Moto Limo
Hodnoty (Measures) Množství Prodej 1.560 28.392 3.654 62.118 45 16.290.000 987 21.023
Náklady 19.246 43.482 10.751.400 12.614
Zisk 9.146 18.636 5.538.600 8.409
odmazávat již uzavřená období, aby nebyl zatěžován denní provoz systému starými daty. Přitom v datovém skladu jsou data k dispozici pro veškerá vyhodnocení napříč všemi obdobími.
cení měla být sestava, šel by počet takovýchto sestav do milionů. A teď si představte, že byste všechny ty sestavy neměli jenom pojmenovat, ale dokonce někoho zaškolit do jejich používání. Nejvyšší čas začít, ať to stihneme!
Hodnoty (measures) Hodnotami rozumíme čísla, která se k jednotlivým kombinacím os ukládají. Těch je zpravidla jen několik – množství, prodejní cena, nákladová cena. Rozdílem prodejní a nákladové ceny dostaneme zisk. Máme tedy čtyři hodnoty. V tabulce je znázorněn vzorek jednoduchého datového skladu. Ze všech milionů kombinací vyhodnocení můžeme nastínit sestavení například těchto třech: A) Poměr prodeje kategorií Limo a Moto v letech a měsících 1. ze všech řádků si vyfiltrujeme přes Druh zboží pouze Moto a Limo 2. z hodnot si vybereme Prodej v Kč 3. z os si vybereme Měsíc, Rok a Druh zboží, a za všechny jejich kombinace hodnoty sečteme (seskupíme) 4. sestavíme jednoduchou tabulku: do řádků dáme Roky, do sloupců Měsíce a Druh zboží 5. jednoduchým způsobem (např. v tabulkovém procesoru) pak vždy sousedící hodnoty za Limo a Moto podělíme
Úprava struktury dat Zatímco v informačním systému je struktura dat navržena tak, aby vyhovovala především dennímu chodu systému, v datovém skladu jsou data určena pouze k archivaci a vyhodnocování. Jedná se principiálně o jednu velkou tabulku pro každou klíčovou agendu – obchod, výroba, účetnictví, mzdy, která v sobě zahrnuje všechna data z informačního systému, jež mohou být kdykoliv pro jakákoliv vyhodnocení relevantní.
Osy (dimensions) Z matematického pohledu naštěstí není situace zdaleka tak dramatická. Když vyjmenujeme tzv. osy, podle kterých lze data do datového skladu ukládat, dojdeme i v těch nejrozsáhlejších systémech maximálně k desítkám. Osami se rozumí především čas (datum), artikl a partner (zákazník). To jsou tři. Pak samozřejmě přidáme středisko, region, druh zboží, cenovou skupinu zákazníka, prodejního zástupce, rozpad času na den v měsíci (1–31), den v týdnu (1–7), měsíc (1–12) a rok. To máme dvanáct. S touto strukturou už jsme schopni vyhodnotit spoustu zajímavých ukazatelů. Orientačně jsem si spočítal, kolik základních druhů vyhodnocení lze sestavit při dvanácti osách, a došel jsem k počtu 13.020.613.464. Pozor, to není nějaká IP adresa, ale něco přes 13 miliard kombinací. Určitě nebudou mít úplně všechny praktický význam, ale pokud zaměstnáte libovolný počet programátorů, kteří vám budou podle potřeb vyrábět různé důležité sestavy jen nad takovouto jednoduchou tabulkou, jsou všichni doživotně zabezpečeni. A to i za předpokladu, že na žádnou již hotovou kombinaci nezapomenete a omylem si ji nenecháte vyrobit znovu.
B) Prodej v Kč a Hektolitrech Limo v regionech a letech 1. ze všech řádků si vyfiltrujeme přes Druh zboží pouze Limo 2. z hodnot si vybereme Prodej v Kč a Množství v hektolitrech 3. z os si vybereme Rok, Druh zboží a Region a za všechny jejich kombinace hodnoty sečteme (seskupíme) 4. sestavíme jednoduchou tabulku: do řádků dáme Roky, do sloupců Regiony a Hodnoty Prodej a Množství C) Prvních dvacet nejziskovějších zákazníků v roce 2010 1. ze všech řádků si vyfiltrujeme přes Roky pouze rok 2010 2. z hodnot si vybereme Zisk v Kč 3. z os si vybereme Zákazníka a podle nich hodnoty sečteme (seskupíme) 4. sestavíme jednoduchou tabulku: do řádků dáme Zákazníky, do sloupce pak Zisk 5. tabulku podle hodnoty setřídíme sestupně a necháme zobrazit pouze prvních dvacet řádků
Struktura datového skladu Na první pohled si můžete říci, že manažer toho pro svou práci moc nepotřebuje – několik základních sestav, obraty zboží, obraty zákazníků, nějaký ten zisk, počty kusů a to je vše. No dobře, pak ještě zjistíme, že bude dobré vidět prodeje do jednotlivých regionů a samozřejmě podle druhů prodávaného sortimentu. No a ještě za střediska a pak podle jednotlivých obchodních zástupců. A samozřejmě v čase a součet celkem. A pak ještě... Pokud byste měli vyjmenovat všechna možná vyhodnocení, která mohou být relevantní, věřte, že byste jmenovali hodně dlouho. A pokud by v systému na každý typ vyhodno-
Pokud jste měli trpělivost pečlivě číst předchozí příklady, pak jste zjistili, že postup je vždy stejný a velmi jednoduchý: www.SystemOnLine.cz
4
IT Systems 11/2011
Strategie IT 1. vybíráme osy, podle kterých budeme filtrovat 2. vybíráme si hodnoty, které chceme sčítat a zobrazit 3. vybíráme osy, podle kterých řádky seskupíme 4. seskupené osy zařadíme do řádků nebo sloupců
OLAP – efektivní způsob jak vyhodnocovat data Jsou-li data již připravená v datovém skladu, máme opět několik možností, jak je prezentovat: SQL dotaz Víte, že prapůvodní důvod vzniku jazyka SQL v 70. letech 20. století byla myšlenka, že si budou manažeři nad tabulkami podle potřeby sestavovat vlastní SQL dotazy, aby tak mohli operativně získávat požadované informace? Proto také název Structured Query Language – strukturovaný dotazovací jazyk. Tedy do toho: napíšeme do konzoly databáze SELECT, pak vypíšeme názvy os a hodnot požadovaného výstupu. Následuje název tabulky datového skladu za příkazem FROM. Příkazem WHERE napíšeme filtrovací podmínky a nakonec uvedeme, za které sloupce chceme data seskupit příkazem GROUP BY a setřídit příkazem ORDER BY. Vzhledem k tomu, že máme data již vypreparována a nachystána v datovém skladu, je sestavení takového dotazu velmi jednoduché. Vyděsil jsem vás? Nebojte se. Naštěstí se od té doby již informatici posunuli dále k řadovému uživateli a dali k dispozici poněkud uchopitelnější nástroje. Kromě toho u SQL dotazů stále ještě zůstává problém s výkonem požadovaných vyhodnocení. Kontingenční tabulka v MS Excelu Tento nástroj už je velmi schopný a je přímo stavěný pro vyhodnocování právě takových tabulek, jako je příklad našeho jednoduchého datového skladu. Uživatel-manažer si velmi jednoduše nad zdrojovou tabulkou vybere, které osy chce mít v řádcích, které ve sloupcích a ve kterých osách chce filtrovat. MS Excel pak automaticky nadefinovanou tabulku sestaví a zobrazí. Takto sestavené pohledy si pak jednoduše uložíme jako obyčejné sešity, a když budeme chtít později zobrazit stejné vyhodnocení nad novými daty, zmáčkneme tlačítko Aktualizovat a data se obnoví. Kontingenční tabulka má pouze jeden, ovšem velmi podstatný nedostatek. V reálném podniku se plní takový datový sklad
prodeje řádově miliony řádky ročně. Zkuste je všechny dostat do MS Excelu, abyste například zjistili, jaký jste měli v jednotlivých letech obrat. OLAP (on-line analytical processing) Ponechme tedy stranou kontingenční tabulku a přibližme si, co se pod touto tajemnou zkratkou skrývá. OLAP si představme jako nadstavbu nad tabulkou datového skladu. Tato nadstavba v sobě speciálním způsobem již v rámci plnění dat do datového skladu ukládá všechny možné součty v rámci jednotlivých os. A tato speciální technologie je především stavěná pro velké objemy dat. Když pak uživatel-manažer položí dotaz na nějaký pohled do datového skladu, neprobíhá již významný výpočet z primární tabulky, ale OLAP použije již vypočtené pohledy. Ovládání uživatelských nástrojů na nahlížení do OLAPu je pak prakticky shodné s ovládáním již zmíněné kontingenční tabulky. Rozdíl je ovšem v tom, že při použití OLAPu dostanete odpověď na jakýkoliv pohled prakticky okamžitě, a to i v případě obrovských objemů dat. Máme tak možnost při návrhu rozšířit tabulku datového skladu o celou spoustu na první pohled zbytečných údajů – skladník, umístění ve skladu, dopravce, typ auta dopravce, prodejního referenta, telefonního operátora objednavatele atd. U všech osob pak můžeme evidovat celou řadu atributů – datum narození, barvu očí, pohlaví, bydliště, ... Zkrátka a dobře, fantazii se meze nekladou, běžný informační systém ve spojení s OLAPem vám tato data bez problémů poskytne a vyhodnotí. Je už pouze na vás, zdali vám jsou ku prospěchu, nebo ne.
K oživení tohoto démona nepotřebujete mnoho. Stačí si nechat zhotovit datové pumpy do datového skladu, nad kterým zkušený programátor nastaví datové kostky, a manažerská nadstavba je připravena k použití. Pokud navíc vlastníme program jménem MS Excel, stačí vypustit druhého dřímajícího démona, o kterém jsme doposud nic netušili. Excel totiž umí velmi účinně formou kontingenční tabulky prezentovat i data z OLAPu. Pokud vezmeme investici do samotného serveru jako nutné zlo, protože bez něj nám většina ERP systémů jaksi nepojede, a vlastnictví nejrozšířenějšího kancelářského software považujeme za samozřejmost, pak můžeme vnímat přiložený OLAP jako něco, co je zadarmo. Všímavý pozorovatel IT trhu ovšem již delší dobu vnímá stále sílící komunitu open source, kde když se řekne, že je něco zadarmo, tak je to skutečně zadarmo. Pro takové mám potěšující zprávu. Společnosti jako Pentaho nebo Jaspersoft nabízí mimo jiné nad databází MySQL, která je samozřejmě zadarmo, OLAP server, a to rovněž zadarmo. Již samotné zprovoznění datového skladu s OLAPem otevírá většině manažerů zcela nové možnosti vyhodnocování dat. Podaří-li se vám toto zprovoznění za rozumné náklady (řádově desítky tisíc korun), dosáhnete neuvěřitelného poměru ceny a výkonu ve vašem vyhodnocování. Pro většinu potřebných pohledů vám bude taková jednoduchá konstrukce bohatě stačit. Manažer, který používá vlastní selský rozum k hledání způsobu, jak zvyšovat výkon svého oddělení, a sám zkoumá v datech systému příčiny a souvislosti jednotlivých ukazatelů, Inzerce
Nejcennější věci jsou zadarmo Asi si už kladete otázku, kde se dá takový OLAP koupit a kolik vlastně stojí. Do konce minulého století patřily pro běžného podnikatele manažerské nadstavby s technologií OLAP do sféry sci-fi. Průkopnickou roli na tomto poli sehrály firmy IBM a Oracle. Implementace takového BI se normálně pohybovala v milionech amerických dolarů. Asi největší průlom na tomto poli provedla firma Microsoft, která ještě před rokem 2000 zabudovala OLAP (Microsoft SQL Server Analysis Services) přímo do svého SQL serveru. Dnes je MS SQL server jedním z nejrozšířenějších na našem trhu. Přitom stále ještě drtivá většina uživatelů, jejichž systém pracuje s MS SQL, ani neví, že pod kapotou jejich informačního systému dřímá démon jménem OLAP.
ÕÃiÃÃÌi}iVi Þ`ÃÌÕ«?«À>j wÀÞÛÃÞÃÌjÕÃ`i ÃvÌÜ>ÀiViÌÞ° "Ĕ*>ÃÕČ?ÃÌ i``ÕV
j
] ÌÕÌÛ
>`iÀ
,*°
ÜÜÜ°Ã`iðVâ
°°°LÕíÌi Ã`i
www.SystemOnLine.cz IT Systems 11/2011
5
IT Strategie pracuje vysoce efektivně. Vytváří si totiž vlastní zkušenostní bázi, a ta patří mezi nejcennější. A právě jednoduchá konstrukce datového skladu s OLAPem a jednoduchým prohlížečem se pro takového řídícího pracovníka velmi rychle stane nástrojem, který už nedá z ruky.
Jak je na tom malý podnikatel? Vyhodnocování nad OLAPem se dostává stále více do povědomí veřejnosti. A vzhledem k výše uvedené skutečnosti, že OLAP je automatickou součástí databázového stroje, nad kterým většina ERP systémů pracuje, začínají i výrobci nejjednodušších programů zpřístupňovat data svým uživatelům pomocí této nadstavby. Pokud je struktura dat malého systému dobře navržena, může jeho výrobce velmi jednoduše rovnou do samotného systému zabudovat datovou pumpu, která bude automaticky plnit datový sklad. Drobný podnikatel pak může rovnou využívat nejmodernější manažerskou nadstavbu, aniž by do jejího zprovoznění investoval jedinou korunu.
Co je to business intelligence? Business intelligence je souhrnný název pro celý komplex nástrojů, které slouží manažerům pro efektivní vyhodnocování a řízení. My si nyní ty hlavní nástroje popíšeme: Prohlížeč OLAPu Už výše jsme zmínili MS Excel jako velmi silný nástroj pro prezentaci dat datového skladu. Kromě něj samozřejmě existují jiné nástroje, které umí s datovým skladem provádět celou řadu dalších operací než jen zobrazovat tabulky a grafy. Rozšířeným nástrojem je například program ProClarity, který je stavěn přímo pro MS OLAP a který za rozumnou cenu poskytuje více nástrojů BI. Předními hráči na trhu komerčních BI jsou kromě společnosti Microsoft společnost IBM se systémem Cognos, dále MicroStrategy, SAP nebo Oracle. Implementace těchto nástrojů ve velkých podnicích zatím stále ještě dosahuje víceciferných částek. Jak si ovšem ukážeme dále, u větších podniků to určitě smyl má. Ovšem již zmíněné open source firmy Pentaho a Jaspersoft také nejsou žádnými popelkami. Zadarmo je totiž pouze základní výbava OLAPu. Ovšem ve chvíli, kdy začnete pokukovat po vyšších nástrojích BI, kterými i tyto firmy disponují, začne vám neviditelná ruka rovněž citelně odsávat nemalé prostředky z vašich kapes.
Signály (semafory, barvy) Jsou to nástroje, které umožňují definovat podmínky hlášení ať již pozitivních, nebo výstražných informací. Asi každý slyšel rčení „pohybujeme se v červených číslech“, „konečně jsme se dostali do černých čísel“ apod. Samozřejmě, že obarvení číselných hodnot podle různých definovaných mezí zvládne běžný tabulkový procesor. Zde ovšem jde o mnohem rafinovanější nástroj. Když si například zobrazíme sumární prodeje za jednotlivé druhy zboží (Limo, Moto), mohou být obě zobrazované celkové hodnoty pozitivní. My ale chceme být červeným semaforem upozorněni, že v sortimentu Limo se v posledním kvartálu nepodařilo v některých regionech naplnit kvótu u jednoho konkrétního artiklu. Sumární hodnota tedy bude svítit červeně. My si pak budeme rozbalovat jednotlivá zanoření, až nás barevné semafory navedou k problémovým hodnotám. Všímavější čtenář možná začíná tušit, že definování kritérií pro odpovídající barvení zobrazovaných čísel, aby skutečně odpovídala denní potřebě manažerů, nebude žádná procházka růžovou zahradou. Modelování, prognózy, simulace Na základě vývoje skutečnosti chceme vidět odhady, kudy povede další vývoj hodnot. Zároveň chceme ručně měnit některé parametry a simulovat si tak jejich očekávaný dopad. Dolování dat (data mining) Data mining je velmi zajímavá disciplína. Doposud jsme vždy popisovali, jak odpovědět efektivně na dotaz, který manažer položí: Jaké jsou obraty v daném regionu atd. Data mining si však klade za cíl řešit zcela opačnou úlohu: ukázat na souvislosti v datech, které by nikoho nenapadly, tudíž se na ně nikdo ani nezeptá. Matematici zkoumají různé modely nad tzv. multidimenzionálními maticemi, kterými právě datové sklady jsou, a sestavují nástroje, jak zjistit případné souvislosti. Představíme-li si jednotlivé záznamy datového skladu jako body uvnitř mnoharozměrné matice, lze předpokládat, že pokud se v nějaké oblasti vyskytuje více bodů u sebe, pak to bude mít určitě nějakou příčinu. Popis souřadnic okolí takové skupiny bodů se pak převede do uživateli srozumitelné věty. Na příjemci takovéto informace pak záleží, jestli bude této informaci věnovat další pozornost. Pro běžného smrtelníka nemá smysl se snažit chápat principy těchto modelů. Důležitý je praktický výsledek jednotlivých metod.
Představte si, že máte prohlížeč OLAPu, který v sobě obsahuje nástroje data miningu. Vy jednoduše naplníte datový sklad a pak spustíte některou z těchto metod. Chvíli si počkáte a pak vám systém zobrazí třeba větu ve stylu: objednavatelé ženského pohlaví nakupují pravidelně druhý čtvrtek v měsíci násobně větší množství limonád než v jiné dny. No a na vás pak je, jestli se nad touto informací pozastavíte, budete ji dále zkoumat a třeba na tom vyděláte miliony, nebo ji označíte za nesmysl a budete se věnovat jiným otázkám. Controlling Jde o další oblast spadající do BI. Cílem controllingu je efektivně nastavit výše zmíněné semafory a signály, jejichž aktivace následně spustí požadavky na zásahy do řízení podniku, aby bylo dosaženo co nejlepšího efektu. V předchozích odstavcích u popisu funkce semaforu jsme například uvedli upozornění, že konkrétní druh limonády v některých regionech vykázal červená čísla. Controlling si pak klade za cíl definovat, jaké opatření se má v takovém případě provést – snížení ceny, zvýšení reklamy, snížení odměny regionálním manažerům pro prodej daného artiklu atd., aby došlo nejen k vyřešení signalizovaného problému, ale také aby byli všichni účastníci motivováni své výkony zvyšovat.
Konzultační firma pro implementaci BI Jak začíná být asi zřejmé, chceme-li využívat v podniku vyšší nástroje BI, bez zkušených poradců, kteří nám pomohou vhodně zvolit a nakonfigurovat jednotlivé programy, se neobejdeme. Minimální úlohou pro takovou firmu je vhodný návrh struktury datového skladu a základní nastavení datových pump. Obzvlášť důležitá je úloha těchto odborníků, pokud do datového skladu importujeme data z různých systémů a datových zdrojů. Stejně tak definice účinných signálů, případně celého systému controllingu, je bez zkušených odborníku těžce představitelné. Už ze samotné povahy výše popisovaných principů je zřejmé, že místního stolaře nebo pekaře nechávají pokročilé nástroje business intelligence chladnými a že tyto zřejmě navždy zůstanou výsadou velkých podniků. Pevně ovšem věřím, že se mi podařilo navést i drobné podnikatele, případně manažery středních podniků, k používání nástrojů, které mohou mít k dispozici za nulových nebo minimálních nákladů a přitom jim přinesou velmi vysoký užitek. ■ Autor je jednatelem společnosti Inside software. www.SystemOnLine.cz
6
IT Systems 11/2011