České vysoké učení technické v Praze Fakulta elektrotechnická Katedra počítačů
Bakalářská práce
Business Intelligence na platformě open source Ondřej Šlosárek
Vedoucí práce: Ing. Pavel Náplava
Studijní program: Softwarové technologie a management, Bakalářský Obor: Softwarové inženýrství 24. května 2010
Poděkování Na tomto místě bych rád poděkoval všem, kteří mi při tvorbě této práce pomáhali. Zejména panu Ing. Pavlu Náplavovi za vedení práce, cenné podněty při tvorbě práce a trpělivost. Dále společnostem Microsoft, jmenovitě Michalu Hrochovi, za poskytnutí informací, materiálů a ukázku jejich Business Intelligence řešení a společnosti SAP za poskytnutí materiálů potřebných pro vytvoření porovnání Business Intelligence produktů.
Prohlášení Prohlašuji, že jsem práci vypracoval samostatně a použil jsem pouze podklady uvedené v přiloženém seznamu. Nemám závažný důvod proti užití tohoto školního díla ve smyslu § 60 Zákona č. 121/2000 Sb., o právu autorském, o právech souvisejících s právem autorským a o změně některých zákonů (autoský zákon). V Praze dne 24. 5. 2010
…………………………….……………………..
Abstract The objective of this work was to clarify the Business Intelligence problems, mainly in open source projects. The work has been divided into two parts. The main objective in the first part was to assess usability of open source Business Intelligence applications in the companies, its advantages and disadvantages. This first part of my work should show the right solution of open source Business Intelligence from the perspective of business that has been decided to implement this solution. Second part compares open source solution in conjuction with selected commercial solution in practice. Most of the objectives of this work has been reached. The results of this work should present a guideline to the people who consider implementation of Business Intelligence.
Abstrakt Záměrem této práce bylo objasnění problematiky Business Intelligence, a to především v open source projektech. Práce byla rozdělena do dvou čásí. V první bylo cílem zhodnotit použitelnost open source Business Intelligence aplikací ve společnostech, jejich výhody a nevýhody. Dále měla vybrat nejvhodnější open source Business Intelligence řešení pro společnost, která se rozhodne takové řešení nasadit. Druhou částí bylo porovnání zvoleného open source řešení se zvoleným komerčním řešením v praxi. Cíle práce se povedlo naplnit z převážné většiny. Závěr z práce plynoucí může posloužit jako pomoc lidem uvažujících o nasazení Business Intelligence.
Obsah 1 - Úvod ....................................................................................................................................................1 2 – Softwarové licence .............................................................................................................................2 2.1 - Open Source software .................................................................................................................2 2.2 - Nejčastěji používané licence v open source projektech ..............................................................3 2.3 – Popis open source licencí použitých v Business Intelligence ......................................................4 2.3.1 - Licence GPL ...........................................................................................................................4 2.3.2 - GPL verze 1 ............................................................................................................................4 2.3.3 - GPL verze 2 ............................................................................................................................5 2.3.4 - GPL verze 3 ............................................................................................................................5 2.3.5 - Copyleft .................................................................................................................................5 2.3.6 - Licence BSD ...........................................................................................................................5 2.4 - Souhrn hlavních rozdílů mezi open source licencemi ..................................................................6 2.5 - Komerční licence ..........................................................................................................................7 3 - Představení Business Intelligence .......................................................................................................9 3.1 - Charakteristika Business Intelligence...........................................................................................9 3.1.1 – Co je Business Intelligence ...................................................................................................9 3.1.2 – Pojem Business Intelligence .................................................................................................9 3.2 - Určení Business Intelligence ......................................................................................................10 3.3 - Open source Business Intelligence řešení..................................................................................12 3.3.1 - Co vede společnosti k nárůstu zájmu o open source BI řešení ...........................................13 3.4 - Implementace Business Intelligence..........................................................................................14 3.4.1 - Rozdíl v implementaci open source BI a komerčního řešení ..............................................14 3.4.2 – Motivace společností k implementaci open source BI řešení ............................................15 3.5 - BI dle společnosti Gartner ..........................................................................................................16 4 - Komplexní nástroje Business Intelligence .........................................................................................17 4.1 - Kriteria hodnocení BI produktů..................................................................................................18 4.2 - Porovnávané open source BI produkty ......................................................................................19 4.2.1 - Business Intelligence and Reporting Tools (BIRT) ...............................................................20 4.2.2 - Jaspersoft BI ........................................................................................................................21 4.2.3 - OpenI ...................................................................................................................................22 4.2.4 - Pentaho BI Suite ..................................................................................................................23 4.2.5 - SpagoBI................................................................................................................................24 4.3 - Porovnávané komerční BI produkty ..........................................................................................25
4.3.1 - Microsoft Business Intelligence solution: Microsoft SQL Server 2008, SharePoint a Office 2010 (Excel) ....................................................................................................................................26 4.3.2 - BusinessObjects Enterprise .................................................................................................27 4.4 – Zhodnocení porovnávaných BI produktů ..................................................................................28 5 - Závěr z porovnání open source a komerčních Business Intelligence řešení .....................................29 5.1 – Gartner a magické čtverce ........................................................................................................30 6 – Srovnání zvolených řešení v praxi. ...................................................................................................33 6.1 - Komerční řešení společnosti Microsoft: ....................................................................................33 6. 2 - Open source řešení Pentaho BI Suite........................................................................................35 6.2.1 – Analýzy v Pentaho BI Suite .................................................................................................36 6.2.2 – Reporty v Pentaho BI Suite.................................................................................................37 7 - Závěr..................................................................................................................................................39 7.1 - Náměty na práci do příštích let ..................................................................................................40 8 – Zdroje ...............................................................................................................................................41 9 – Obsah přiloženého disku ..................................................................................................................42
Seznam obrázků Obrázek č. 1 – Model nákladů společností při zavádění BI řešení .........................................................11 Obrázek č. 2 – Počet stažení open source BI projektu BIRT v letech. ....................................................12 Obrázek č. 3 – Hodnocení BI produktů společností Gartner za rok 2008. .............................................32 Obrázek č. 4 – Hodnocení BI produktů společností Gartner za rok 2009 ..............................................32 Obrázek č. 5 – ukázka reportu v prostředí Microsft Excel 2010 beta. V 4 levých pivotech lze nasavit datové filtry. ...........................................................................................................................................34 Obrázek č. 6 – Administrace uživatelských účtů v Pentahu. Dále nastavení používaných databází, služeb a naplánovaných úloh. ................................................................................................................35 Obrázek č. 7 – ukázka prostředí aplikace Pentaho a ukázka analýzy.....................................................36 Obrázek č. 8 – ukázka práce s parametry reportu. ................................................................................37 Obrázek č. 9 – ukázka vizualizace reportu. ............................................................................................38
Seznam tabulek Tabulka č. 1 – Zastoupení licencí v open source projektech....................................................................3 Tabulka č. 2 – Shrnutí rozdílů mezi open source licencemi. ....................................................................7 Tabulka č. 3 – Hodnocení řešení BIRT ....................................................................................................20 Tabulka č. 4 – Hodnocení řešení Jaspersoft BI .......................................................................................21 Tabulka č. 5 – Hodnocení řešení OpenI .................................................................................................22 Tabulka č. 6 – Hodnocení řešení Pentaho BI Suite.................................................................................23 Tabulka č. 7 – Hodnocení řešení SpagoBI ..............................................................................................24 Tabulka č. 8 – Hodnocení zvoleného řešení od společnosti Microsoft ..................................................26 Tabulka č. 9 – Hodnocení zvoleného řešení od společnosti SAP ...........................................................27 Tabulka č. 10 – Přehled hodnocených řešení a jejich výsledky..............................................................28 Tabulka č. 11 – Schopnost realizace a nasazení projektu. .....................................................................31 Tabulka č. 12 – Úplnost a celistvost vize. ...............................................................................................31
1 - Úvod Cílem práce je sběr informací o Business Intelligence, zhodnocení open source nástrojů a porovnání vhodného open source nástroje s komerčním řešením, které proběhne nad získanými daty. Práce má více částí a jejími nejdůležitějšími částmi jsou:
Charakterizace open source Business Intelligence problematiky.
Porovnání Business Intelligence řešení různých poskytovatelů.
Porovnání open source Business Intelligence řešení, které je nejlépe hodnoceno v předchozím bodě, s jedním řešením komerčním.
Důvodem a motivací pro volbu a psaní práce je fakt, že Business Intelligence je zajímavá nová oblast na trhu a chtěl jsem se v její problematice lépe zorientovat a pochopit její principy a přínosy více do hloubky. Zajímavost práce dokládá i fakt, že se jedná o velmi rychle se vyvíjející část softwarového trhu.
1
2 – Softwarové licence Veškerý poskytovaný produkt je vázán licencí. V následujících podkapitolách se budu věnovat hlavním vlastnostem open source licencí a jejich rozšíření. Dále provedu porovnání licencí v nejpodstatnějších vlastnostech a poskytnu přehled komerčních licencí.
2.1 - Open Source software Programové produkty označované jako „Open Source software“ (OSS) začínají být poslední dobou větším a vážnějším konkurentem poskytovatelům komerčně prodávaného software. Hlavními důvody jsou nízké pořizovací náklady a technologická vyspělost. Nevýhodou OSS může být chybějící podpora a záruky za SW, které mnoho společností vyžaduje. Co si představit pod pojmem OSS vysvětluje „Definice Open Source“ od iniciativy OSI (Open Source Initiative). Ta předepisuje soubor pravidel, podle kterých lze konkrétní licenci (a tím i pod ní šířený produkt) považovat za „Open Source“. Na domovských stránkách organizace[B1] je k nalezení samotná definice open source[B2]. Zde zmíním její klíčové body:
volné rozšiřování - licence nesmí omezovat prodej nebo jinou distribuci programu jako součásti programového balíku obsahujícího software z různých zdrojů; licence by za takový prodej neměla vyžadovat autorský nebo jiný honorář zdrojový kód - produkt musí obsahovat zdrojový kód a musí umožňovat distribuci jak ve zdrojové, tak v binární („zkompilované“) podobě; pokud program není šířen včetně zdrojových kódů, musí být dobře popsána možnost jejich získání, a to za přiměřený poplatek (pokrývající náklady), nebo v případě Internetu zdarma; zdrojový kód nesmí být zamlžen; přechodné formy (např. výstup preprocesoru nebo překladače) nejsou dovoleny odvozené práce - licence musí umožňovat tvorbu odvozených prácí a musí jim umožňovat, aby byly šířeny pod stejnou licencí jako původní produkt integrita (celistvost) autorova zdrojového kódu - licence může omezovat distribuci změněné formy zdrojového kódu pouze v případě, že je umožněno šíření tzv. záplat (patch files) spolu se zdrojovým kódem; licence musí výslovně povolit šíření programu přeloženého ze změněného zdrojového kódu; licence může vyžadovat, aby odvozené práce nesly jméno nebo verzi odlišné od původního programu diskriminace vůči osobám a skupinám - licence nesmí diskriminovat osoby nebo skupiny osob diskriminace sfér užití - licence nesmí omezovat použití programu v určité sféře; nesmí například omezovat použití programu v komerčním prostředí nebo v genetickém výzkumu šíření licence - práva přiložená k programu musí platit pro všechny, bez nutnosti dalších přídavných licencí licence nesmí záviset na programovém produktu - práva přiložená k programu nesmí záviset na existenci programu v určitém programovém balíku; pokud je program z balíku vyřazen a je používán nebo šířen v souladu s licencí, všichni, ke kterým se program dostane, by měli mít stejná práva jako ti, kteří dostanou program jako součást programového balíku 2
licence nesmí ovlivňovat ostatní programy - licence nesmí klást omezení na software, který je šířen společně s licencovaným programem; licence nesmí například trvat na tom, aby všechny programy distribuované na stejném médiu splňovaly podmínky OSS.
2.2 - Nejčastěji používané licence v open source projektech Veškerý softwarový projekt, který je zamýšlen k poskytnutí dalším uživatelům kromě autora by měl být licencován. Přehled nejčastěji používaných licencí open source projektů dle Black Duck Software[B4] k 1.5.2010 poskytuje tabulka č. 1. Nejpoužívanější licencí je v open source projektech GPL licence. V posledních letech se její zastoupení ale stabilně snižuje. V lednu 2006 bylo na SourceForge.net licencováno pod GPL licencí 68% projektů. V třetím kvartálu roku 2007 to bylo necelých 65%. V květnu 2010 to je již pouze 47%.[C1] Aktuální stav potvrzuje i druhý zdroj, který popisuje tabulka č. 1. Pořadí
Zastoupení v projektech
Způsob licencování 1
GNU General Public License (GPL) 2.0
48.57%
2
GNU Lesser General Public License (LGPL) 2.1
9.31%
3
Artistic License (Perl)
9.14%
4
BSD License 2.0
6.24%
5
GNU General Public License (GPL) 3.0
5.58%
6
Apache License 2.0
4.10%
7
MIT License
4.09%
8
Code Project Open 1.02 License
3.09%
9
Microsoft Public License (Ms-PL)
1.56%
10
Mozilla Public License (MPL) 1.1
1.22%
11
Common Public License (CPL)
0.56%
12
Eclipse Public License (EPL)
0.47%
13
GNU Lesser General Public License (LGPL) 3.0
0.44%
14
zlib/libpng License
0.43%
15
Academic Free License
0.39%
16
Common Development and Distribution License (CDDL)
0.32%
17
Open Software License (OSL)
0.31%
18
Mozilla Public License (MPL) 1.0
0.26%
19
PHP License Version 3.0
0.24%
20
Ruby License
0.24%
Tabulka č. 1 – zastoupení licencí v open source projektech
Aktuální seznam všech licencí splňujících OSD (Open Source Definition) lze nalézt na stránkách OSI[B2].
3
2.3 – Popis open source licencí použitých v Business Intelligence Nyní bych chtěl blíže představit GPL, LGPL a BSD licence, protože patří k nejrozšířenějším licencím v open source projektech[B4] a jsou jimi obvykle licencovány i open source Business Intelligence nástroje a řešení. Samozřejmě bych mohl popsat i ostatní licence, ale protože jimi nejsou open source Business Intelligence nástroje obvykle licencovány či jejich rozšíření mezi projekty je malé, rozhodl jsem se jim nevěnovat. Porovnávání licencí není hlavním tématem této práce a jejich přesné znění, podmínky a další vlastnosti jsou k dispozici na stránkách OSI[B3]. Z těchto stránek je čerpáno i při popisu zvolených licencí. 2.3.1 - Licence GPL Definice licence GPL zní: Jakoukoli práci, kterou publikujete nebo předáváte, která celá nebo i částečně obsahuje nebo je odvozena z programu nebo jakékoli jeho části, musíte licencovat zdarma všem třetím stranám v podmínkách této licence. Licence GPL vychází z myšlenky Richarda Stallmana, která říká, že všechny programy by měly být dostupné včetně zdrojových kódů, zdarma nebo maximálně za cenu distribučních nákladů. Svoboda uživatele software pod GPL je explicitně zaručena povinností poskytovatele dát volně komukoli k dispozici zdrojový kód produktu, je explicitně zaručeno právo modifikovat a redistribuovat daný software kterékoli třetí straně, pokud splní podmínky uvedené v GPL. Použití kódu licencovaného GPL licencí rozšíří GPL licenci i na zbylý kód, s kterým se dostane do styku. Licence GPL řeší podmínky, za kterých je možno modifikovat program pod GPL nebo použít jeho část v jiném software. 2.3.2 - GPL verze 1 Verze 1 licence GNU GPL (GPLv1), vydaná v lednu 1989, chránila proti dvěma způsobům, kterými softwaroví distributoři omezovali svobody, které definují svobodný software:
Software takto licencovaný musí být šířen ve formě binárních souborů spolu s lidsky čitelným zdrojovým kódem.
GPLv1 definuje, že modifikované verze programů, kde aspoň jeden je již pod GPL licencí licencován, musí být jako celek šířeny pod GPLv1. Proto výsledný software šířený pod podmínkami GPLv1 lze kombinovat se softwarem pod licencí s tolerantnějšími podmínkami.
Důvod pro zavedení druhého bodu je, že distributoři mohou přidávat dodatečná omezení. Toto mohou realizovat buď přidáváním restrikcí k licenci, nebo kombinováním softwaru s jiným softwarem, který má další restrikce ohledně své distribuce. Pokud zdárně aplikujeme na software GPLv1 licenci, podmínky pod kterými se distribuuje výsledný celek se nezmění, kdežto software šířený pod restriktivnější licencí s takto licencovaným softwarem nejde kombinovat, protože by se to dostalo do konfliktu s požadavkem GPLv1 licence.
4
2.3.3 - GPL verze 2 Podle Richarda Stallmana je hlavní změnou v GPLv2 klauzule "svobodu nebo život". Tato část říká, že pokud někdo přidá omezení, které mu brání šířit software pod licencí GPL tak, aby respektoval svobodu ostatních uživatelů, nesmí ho šířit vůbec. V roce 1990 vyšlo najevo, že méně restriktivní licence by byla strategicky užitečná pro některé softwarové knihovny. Druhá verze licence GPL (GPLv2) byla vydána v červnu 1991, proto druhá licence - Library General Public License (LGPL). LGPL využívá principu, kdy je GPL kód v samostatné sdílené knihovně, aplikace může tuto knihovnu používat, aniž by musela být pod GPL. Ani knihovnu pod LGPL přitom nelze přibalit k distribuci produktu, aniž by se nakazil i zbytek aplikace licencí GPL. 2.3.4 - GPL verze 3 GPLv3 byla vydána 29. června 2007. Nejdůležitější změny dle R. Stallmana se týkají vztahu k softwarovým patentům, kompatibilitě svobodných licencí, definice "zdrojového kódu" a hardwarových omezení modifikace software. Další změny se vztahují k internacionalizaci, k tomu, jak se řeší porušení licence a jak může držitel autorských práv přidávat k licenci další podmínky nebo požadavky na distribuci díla. Jedna z takových volitelných podmínek je zamýšlena ke splnění požadavků vzhledem k softwaru jako službě (SaaS). 2.3.5 - Copyleft Distribuční práva zaručená GPL pro modifikované verze díla nejsou bez podmínek. Když někdo šíří GPL dílo se svými vlastními modifikacemi, požadavky na distribuci celého díla nemohou být jakkoli zvětšeny oproti požadavkům, které jsou v GPL. Tento požadavek je znám jako copyleft. Jeho právní moc vychází z aplikace autorského práva na počítačové programy. Protože dílo šířené pod GPL je chráněno autorským právem, nabyvatel licence nemá žádné oprávnění k šíření tohoto díla ani v modifikované podobě kromě toho, které mu určují podmínky licence. Kdo chce vykonávat práva normálně omezená autorským právem (např. šíření díla), musí přijmout podmínky licence. Naopak, když někdo distribuuje kopie díla bez přijetí podmínek GPL (například s udržením zdrojového kódu v utajení), může být postižen za porušení autorského práva.[C2] Copyleft tedy využívá autorské právo (copyright) k zajištění opaku účelu známějšího copyrightu: namísto zavádění omezení zaručuje práva ostatním lidem, a to tak, že jim nemohou být následně odebrána. 2.3.6 - Licence BSD Licence povoluje dělat se zdrojovým kódem cokoli co není zakázáno (včetně použití v closed source projektu). Jediné, co vyžaduje, je to, aby při vychvalování těch vlastností výsledného produktu, které souvisí s přejatým kódem, bylo explicitně řečeno, že kód je založen na práci originálního autora. Licence definuje následující body:
Šířený zdrojový kód musí obsahovat informaci o autorských právech, seznam podmínek používání a zřeknutí se odpovědnosti autora, za případné problémy vzniklé používáním produktu. 5
Šířený binární tvar musí nést informaci o autorských právech, seznam podmínek používání a zřeknutí se odpovědnosti ve své dokumentaci a/nebo dalších poskytovaných materiálech. Ani jméno vlastníka práv, ani jména přispěvatelů nemohou být použita při podpoře nebo právních aktech souvisejících s produkty odvozenými z tohoto software bez výslovného písemného povolení.
BSD-like licence je pak licence v základě stejná jako výše popsaná, jen se upraví vlastník, organizace a rok vzniku licence na údaje nového autora či organizace – například NetBSD či FreeBSD. BSD licence dovoluje komerční využití, včetně využití v proprietárním software bez zveřejněného zdrojového kódu. Díla založená na dílech licencovaných pod BSD dokonce mohou být zveřejněna pod komerční licencí (nejedná se o copyleft), pouze musí dodržet podmínky licence, tzn. v programu uvádět informaci o autorech a zřeknutí se odpovědnosti. Příkladem takového využití jsou části knihoven pro síťovou komunikaci použitých v Microsoft Windows či mnoho komponent z FreeBSD použitých v Mac OS X.[C3]
2.4 - Souhrn hlavních rozdílů mezi open source licencemi Nejrozšířenější licencí v open source projektech je licence typu GPL. Tato licence poskytuje dílo včetně zdrojového kódu zdarma a umožňuje znovupoužití kódu v dalších projektech, ale pouze pod podmínkou, že budou licencované stejně. Pro komerční účel se nesmí použít žádný fragment kódu licencovaného GPL licencí. Licence GPL tak mnohdy zabrání použití daného software v nekomerčním, univerzitním vývoji, protože výsledky vývoje bývají obvykle k dispozici volně a GPL je v tomto případě příliš omezující. GPL jednou provždy zamezuje použití výsledků takového výzkumu v (komerční) praxi. Licencovat svoje dílo GPL licencí je vhodné, když chcete, aby všechny práce, které váš kód obsahují byly volně dostupné včetně zdrojového kódu. Licenci GPL je vhodné použít i ve chvíli, kdy na programu nejste schopni vydělávat a chcete zabránit ostatním a schopnějším, aby svoji práci použili pro jejich komerční produkt. Licence GPL tak může vést k duplikaci úsilí při psaní softwaru, protože pro komerční aplikaci či aplikaci pod licencí nekompatibilní s GPL nemůže být použit kód již napsaný a licencí GPL licencovaný. BSD forma licencování produktu je vhodná v případě, že chcete poskytnout software pro volné užití každému a je pro vás důležité, aby z vašeho kódu mělo užitek maximální množství lidí, ať už přímo nebo nepřímo přes jiné projekty založené na vašem kódu. Licence BSD je s GNU GPL kompatibilní. Software licencovaný pod BSD licencí lze začlenit do díla pod GPL (avšak opačně to neplatí). BSD licence umožňuje programátorům psát nové metody a funkce programu, rozšiřovat tak jeho možnosti a použít již napsaný kód místo reimplementace již vyřešeného problému. Základní a obvykle nejdůležitější rozdíly mezi popsanými a některými dalšími licencemi shrnuje tabulka č. 2.
6
Licence
GNU GPL
Možnost distribuce s proprietárním SW
Licencování vlastní části práce
Znovupoužití kódu po úpravách v dalším SW
NE – všechen SW je pod GNU GPL
NE – jen v případě celého SW jako GNU GPL
ANO – jen jako GNU GPL
GNU LGPL
ANO – za splnění zvláštních podmínek
ANO – za splnění zvláštních podmínek
ANO – jen jako GNU GPL nebo GNU LGPL
BSD
ANO
ANO
ANO
MIT
ANO
ANO
ANO
ANO
ANO
ANO
Mozilla Public License 1.1
v. Tabulka č. 2 – shrnutí rozdílů mezi open source licencemi.
2.5 - Komerční licence Při pořízení komerčního programu si musí uživatel zakoupit licenci. Licence může mít několik různých omezení. Může být svázána s hardwarem, se kterým byla zakoupena a ztratit platnost změnou hardware konfigurace stroje či jeho zrušením. Typickým příkladem je OEM licence na operační systém při koupi nového PC. Na rozdíl od samostatně zakoupené plnohodnotné licence není OEM software možnost upgradovat či downgradovat na jinou vývojovou verzi. Na druhou stranu je výrazně cenově zvýhodněn. Může umožnit pouze určitý počet instalací. Nebo omezuje počet správně běžících programů dle svého nastavení a ostatní instance programu již nebude obsluhovat. Typické licence kupované na uživatele. Může být pořízena pro určitou sestavu hardwaru. Při obměně za podobné díly bude program nadále správně pracovat, ale při značném vylepšení hardwaru již program nemusí využívat všechny prostředky. Obvykle se nejedná o licence na software, který slouží pro každého. Ale spíše o programy, které běží na serveru. Nejčastěji se prodávají licence na počet uživatelů, dále jsou licence na počet procesorů a to jak fyzických procesorů, tak samostatných jader. Častokrát je volbou licence dána maximální velikost paměti, kterou může program využít. Pro mnohé firemní programy je ale potřeba k ceně licence ještě připočíst částku za implementaci, protože zdrojový kód nemusí být a není poskytován a úprav nejde dosáhnout jinak než koupí od poskytovatele softwaru. Cena za implementaci se nedá obecně určit a v největší míře závisí na množství úprav podle požadavků zákazníka a v případě náhrady stávajícího řešení novým závisí i na objemu dat, které je nutné importovat do nového řešení z řešení stávajícího. Její výše se obvykle pohybuje od 50% ceny za licence u menších řešení až po částku větší, než kolik stojí licence u velkých řešení. Tato druhá situace ale obvykle nastává v případě, že společnost již nějaké, alespoň částečné, řešení měla a jeho data potřebuje importovat do nového řešení. 7
Při volbě open source projektu, je potřeba náklady za implementaci nevynechat. Buď se mohou platit prodejci, pokud má zajištěnou podporu, která upravuje řešení na míru. Nebo se může najmout vlastní programátor či externí společnost, která úpravy zajistí. V neposlední řadě je komerční software prodáván pod licencemi akademickými, korporátními, volume licence s možností libovolné přenositelnosti, možností automatického nároku na přechod na vyšší verzi nebo obráceně.
8
3 - Představení Business Intelligence 3.1 - Charakteristika Business Intelligence 3.1.1 – Co je Business Intelligence Business Intelligence (dále pod zkratkou BI) jsou zahrnuty nástroje a systémy, které hrají klíčovou úlohu v strategickém procesu plánování vývoje společnosti. Pod pojmem BI nalezneme dovednosti, znalosti, technologie, aplikace, bezpečnostní otázky, postupy používané v praxi pro získání lepšího pochopení obchodních souvislostí a chování na trhu. Nejčastějšími funkcemi BI nástrojů je:
Tvoření reportů. OLAP (Online Analytical Processing) zpracování dat či databáze. Analýza dat. Těžba informací z databáze, souborů a textů. Optimalizace modelů a procesů ve společnosti. Tvorba podkladů pro strategické rozhodování.
Tyto systémy nejčastěji umožňují společnosti sběr, integraci, uložení, analýzu, interpretaci a prezentaci dat, které vyplývají z obchodních informací, za účelem podpory důležitého rozhodnutí. Můžou zahrnovat samotné shromážděné informace nebo explicitní znalosti získané z informací. V nynější době již BI aplikace slouží i k zpracovávání získaných informací. Umožňují jejich vytěžování v různých simulacích, predikce založené na analýze a optimalizaci obchodních procesů.[A1] BI nástroje poskytují historický, současný i očekávaný pohled na chod společnosti. 3.1.2 – Pojem Business Intelligence Pojem BI byl prvně použit roku 1958 v článku vědce společnosti IBM Hanse Petera Luhna. Definoval BI jako: „schopnost zachytit vzájemně prezentované fakty tak, že vybrané akce povedou k požadovanému cíli. (the ability to apprehend the interrelationships of presented facts in such a way as to guide action towards a desired goal.)“ BI je používáno s cílem podporovat lepší obchodní rozhodování. Tak lze také charakterizoval BI systémy jako systémy pro podporu rozhodování.[A1] V roce 1989 Howard Dresner navrhl BI označit za zastřešující systém pro: "koncepty a metody pro zlepšení obchodních rozhodnutí pomocí systémů podpory založených na skutečnostech. (concepts and methods to improve business decision making by using factbased support systems.)" Tato definice vymezuje BI do dnes.[A1]
9
3.2 - Určení Business Intelligence V současné době, mnoho společností chápe, jaké výhody jim BI programy mohou přinést. Tyto společnosti při své práci vytváří velké množství dat. S jejich zvětšujícím se množstvím se v organizacích zvyšují rizika a snižuje doba reakce. Většina těchto dat (až okolo 80%) navíc není strukturována (například ve firemní databázi). Pro zpracování těchto dat je možné použít velké množství nástrojů a programů, jako jsou například Excel či databázové aplikace pro různá oddělení společnosti. Nasazení BI řešení společnostem pomáhá analyzovat data a pochopit lépe jejich situaci na trhu a následně přijímat lepší rozhodnutí (založená na přesnějších a pouze potřebných informacích). Barry Klawans ze společnosti JasperSoft, která se zabývá tvorbou open source BI řešení, mluví o problému komerčních BI řešení s velikostí potřebného času, než řešení začne být přínosné. Je to dle něj způsobeno hlavně tím, že vlastnímu nasazení předchází vyjednávání o možnostech řešení a snaha společnosti, která si BI pořizuje, získat co nejkvalitnější řešení za své peníze. Tato zdržení komplikují a prodlužují dobu návrhu pilotního projektu, který dostane společnost k posouzení. Navíc první přínosy společnost mnohdy dostane až po vynaložení většiny nákladů na BI řešení.[A7] V tomto vidím výhodu pro open source projekty, protože při této volbě odpadá strach společností ze špatně vynaložené investice. Navíc je u open source řešení možné nasadit nejprve jeho část a až když se osvědčí, připojit další modul. Při implementaci není potřeba spolupráce s jeho výrobcem a mnohdy ani velkých dodatečných nákladů. Dále se společnost může kdykoli svobodně rozhodnout změnit (zrušit, zmenšit, rozšířit, ...) své BI řešení na základě svých aktuálních požadavků a nemusí nikoho kontaktovat a upravovat smlouvy. Možný vývoj nákladů na BI řešení popisuje obrázek č. 1. Ať už se ale společnost rozhodne pro komerční produkt nebo se vydá cestou open source řešení o době potřebné k implementaci rozhodují především kvality lidí, kteří mají nasazení BI řešení na starosti. Velkou roli také hraje kvalita zpracování a jasnost záměru společnosti o požadavcích na řešení a jeho přínosech. Neméně důležité jsou i pracovní procesy, které jsou ve společnosti využívány. Nasazení BI řešení je velmi komplexní proces a než BI společnosti přinese první výsledky musí společnost přijmout některá související opatření. Nejčastěji trvá implementace BI řešení pro společnost 3 až 6 měsíců.
10
Obrázek č. 1 – Model nákladů společností při zavádění BI řešení
Přínos BI řešení pro společnost roste s tím, jak dokáže výsledky BI uchopit a použít v praxi (poučit se z nich). Pro snazší představu můžeme využití BI ve společnostech rozdělit na tři úrovně, které vyjadřují míru využití BI a nepřímo vypovídají o její velikosti:
vizualizace dat měření Key Performance Indicatorů (KPI) využití zpětné vazby k optimalizaci business modelů
První úroveň znamená zavedení BI a první seznámení s možnostmi nového systému. Na této úrovni bývají malé a začínající společnosti. Využití spočívá především v zobrazování dat agregovaných z různých systémů, eventuálně generování sestav. Z hlediska využití jde zejména o reporty z firemních dat.[A2] Na druhé úrovni se využívají analytické funkce, agregace, pokročilejší technologie vizualizace apod. Na této úrovni bývají středně velké společnosti. Teprve na této úrovni se zobrazují data, která dávají smysl pro řízení obchodního plánu a jsou využívány vyšší úrovní vedoucích pracovníků, eventuálně přímo exekutivou. Na rozdíl od operativních reportů jsou reporty pro vyšší management na první pohled jednodušší, zobrazují zejména indikátory. Podrobné tabulky a grafy jsou využívány pouze v menší míře. Hlavní posun v této úrovni je přechod k opravdovému BI. Je potřeba provést jednak vytvoření obchodního modelu včetně návrhu mechanismů kvantitativního měření a dále jeho implementace v systému BI vytvořením sady KPI včetně vizualizace.[A2] KPI kontrolují a hodnotí měřitelné parametry, které ovlivňují chod společnosti. Jedná se například o dostupnost internetového připojení (například má být větší jak 99,5% doby) či dobu na zpracování faktur či jiných účetních položek (například se mají vyřídit do 5 dní od jejich přijetí). Indikátorů by nemělo být ani málo ani moc. Používaný standard je okolo 5 až 8 měřitelných indikátorů na jednoho manažera. Ke každému indikátoru je nastavena jeho hraniční hodnota a v případě překročení se odhalí problematický proces či část společnosti 11
velmi rychle. Indikátory jsou špatně porovnatelné v čase, pokud se ve společnosti upraví proces, který indikátor kontroluje. Třetí fáze je již pokročilé využití měření KPI k řízení business modelu. V této fázi jsou obvykle jen největší společnosti v oboru, které optimalizují za pomoci výsledků získaných z BI své obchodní modely a chod celé společnosti.[A2]
3.3 - Open source Business Intelligence řešení Původně měly open source produkty vysokou náročnost na přizpůsobení a doladění při vývoji a nasazení, a tak se více hodily do vývojového prostředí. V současnosti dodavatelé softwaru implementují ucelenější BI řešení s rozšířenější BI funkcionalitu do svých aplikací. [A3]
Poskytovatelé open source BI řešení mnohdy nabízejí svůj open source produkt zadarmo a k tomu komerční alternativu, která má několik funkcí navíc, případně je obohacena o kvalitnější podporu. Funkcionalita open source BI řešení v těchto případech je obvykle okolo 90% komerčního produktu. Ukázkovým příkladem takovéto funkce navíc je SaaS – viz tabulky porovnání produktů. Mnohdy je open source BI řešení vytvořeno pospojováním několika vhodných aplikací, které byly vyvinuty a nadále jsou vyvíjeny samostatně. Za posledních několik let se počet open source řešení znatelně zvedl. I jejich rozšíření mezi zákaznickými společnostmi se zvyšuje, což vyplývá z obrázku č. 2. Přesná čísla o počtu implementací open source BI řešení ve společnostech jde jen těžko zjistit, poněvadž kvůli stažení i implementaci se není potřeba s poskytovatelem nijak spojovat. Lze tedy evidovat jen počet stažení, ale ne všechna stažení končí implementací produktu ve společnosti.
Obrázek č. 2 – Počet stažení open source BI projektu BIRT v letech.[A4]
Okolo roku 2000 obchodníci objevili nezaplněnou/nevyužitou část trhu a začali investovat peníze do komerčních BI řešení, které onu díru zaplňují. 12
Toto bylo impulsem pro vznik open source komunit zabývajících se tvorbou open source BI řešení. V žádné oblasti neexistují open source produkty bez adekvátní komerční možnosti volby a postupem rozvoje daného odvětví to platí i obráceně. 3.3.1 - Co vede společnosti k nárůstu zájmu o open source BI řešení Důležitým prvkem je pohled na open source řešení jako na levnější model. Při přihlédnutí k tomuto a situaci, kdy jsou všichni nuceni omezovat výdaje a zvyšovat efektivitu provozu, ale pořád mají zaměstnance je pochopitelné, že neustále dochází k odkládání investice do BI řešení. Mnoho společností si nyní nemůže dovolit utratit $100,000 za komerční BI nástroj nebo další licenci k databázi i když by se jim investice během několika málo let vrátila. Společnosti ale cítí, že potřebují zvýšit svojí konkurenceschopnost na trhu, jinak přijdou postupně o zákazníky a přestanou zdravě růst. Proto se společnosti snaží nasadit open source řešení, které poskytuje veškerou základní funkcionalitu BI za zlomek peněz a nějaké speciální schopnosti se buď dají nechat dopsat na míru konkrétním potřebám společnosti nebo se společnost obejde bez nich (většinový případ). BI bylo světlým bodem na IT trhu před několika lety. Všechno přecházelo na automatizaci. Ale používání informací, které automatizace dovoluje, umožní posunout společnost zase o krok kupředu. Přední společnosti s tímto začaly již v 90tých letech 20. století.[A6] Open source BI aplikace začaly zrát do robustních platforem. Obsluhují prodej, finance a provozní potřeby celých společností. V letech 2008 a 2009 proběhlo na trhu s BI řešeními několik velkých akvizic menších specializovaných společností velkými. To způsobilo zvýšení zájmu o open source BI platformy mnoha společností, neboť majitelé proprietárních BI aplikací ladí své produktové portfolio, plány vývoje a ceny svých produktů po začlenění softwaru získaného akvizicemi. Open source BI platformy jsou obvykle uváděny na trh jako komerční open source software (COSS), podobný model propaguje Red Hat. COSS společnosti generují příjmy z podpory, příspěvků a školení. Většina vedoucích ve společnostech produkujících open source cítí, že je důležité, aby jejich aplikace měly zajištěny komerční část, která by stála za podnikovou infrastrukturu, spíše než se spoléhat na příslib open source komunity samotné.[A5]
13
3.4 - Implementace Business Intelligence Stejně jako ostatní IT projekty jsou i BI implementace náchylné k selhání. Existují různé výzkumy, názory a strategie, jaká rizika se při zavádění BI vyskytují a jak je omezit. Mezi nejčastější patří:[A2]
Přemíra zákaznických úprav standardně dodávaného řešení. Neškolená obsluha. Představa, že řešení je natolik intuitivní, že není potřeba učit se jej používat. Nedostatečná podpora projektu ve vedení společnosti. BI je ze své podstaty určeno pro řídící pracovníky všech úrovní a jejím účelem je ve výsledku pomáhat s rozhodováním ohledně obchodních modelů. Je nezbytné, aby existovala podpora zavádění BI z nejvyšších pozic. Nedostatky ve vedení a plánování projektu nasazení BI. Například podcenění role konzultanta, který má za úkol najít kompromis mezi obchodními potřebami a možnostmi implementované technologie.
Lze tedy prohlásit, že použití open source technologií při implementaci BI nepatří mezi objektivně diskutovaná rizika projektu a nerozhoduje o úspěchu či neúspěchu projektu. 3.4.1 - Rozdíl v implementaci open source BI a komerčního řešení Komerční BI řešení jsou převážně komplexní a robustní systémy. Akvizice z minulých let mají za následek snížení konkurence na trhu s BI softwarem. Na druhou stranu se nové produkty vyznačují celkovou robusností, protože se ve všech případech staly součástí ještě komplexnějšího balíku produktů a služeb. (Jmenovitě jde například o IBM, SAP, Oracle a Microsoft). V podstatě jsou tato komplexní řešení vhodná pro nasazení ve všech možných úrovních včetně třetí úrovně (optimalizace business modelů), kde jsou cílovým zákazníkem zejména největší společnosti. Nasazení takového řešení pro obyčejný reporting nebo vizualizaci dat je sice možné, ale pro takovéto zadání i velké společnosti nabízí jiné, ne tolik obsáhlé, řešení.[A2] Open source BI mají s komerčními řešeními společnou konsolidaci jednotlivých menších produktů do větších celků, které tvoří komplexnější systémy BI. Takový celek bývá zastřešován komerční společností poskytující profesionální zákaznickou podporu, školení, partnerské programy. Tyto služby jsou samozřejmě placené a z toho je financován vlastní vývoj a opravy týmem placených techniků, tzv. professional open source. Podle průzkumů mezi společnostmi, které implementovaly nebo implementují BI, se ukázalo, že profesionální podpora open source produktů je hodnocena dokonce lépe než podpora produktů komerčních (Gartner 2009). Zajímavou odlišností ale je, že vzhledem k open source licenci jednotlivých modulů jsou tyto moduly sdílené různými společnostmi poskytujícími open source BI komplexní produkt. Podstatná odlišnost od komerčních řešení je ale ve způsobu implementace, který je u open source BI zaměřen na jednoduché nasazení v první úrovni, tj. konsolidace dat, vizualizace, reporting atd. Samozřejmostí jsou ale také technologie umožňující sofistikovanější implementace i na druhé a třetí úrovni. Implementace open source řešení má pro společnost jisté výhody (obvykle levnější řešení, implementují se jen funkce jež jsou pro společnost potřebné, větší flexibilita BI řešení), ale také jisté nevýhody (ne zcela pokrytá funkcionalita open source BI řešení v porovnání s komerčními produkty, chybějící či kratší historie společnosti zabývající se vývojem BI řešení). Podpora open source BI řešení je horší jak kvalita komerční podpory k BI aplikaci.
14
3.4.2 – Motivace společností k implementaci open source BI řešení I v současném světě po zasažení globální krizí jsou technologie BI stále atraktivní. BI totiž přímo zprostředkovává náhledy na fungování obchodních modelů společnosti na základě množství dat a znalostí nahromaděných uvnitř různých firemních IT systémů. Toto může být, zvláště v těžkých recesních dobách, klíčové pro prosperitu a přežití společnosti na trhu. BI pomůže včas odhalit slabiny obchodních modelů i najít cestu k využití špatného stavu ekonomiky k vlastnímu růstu. Ještě před několika lety bylo možné implementovat BI pouze s použitím komerčních, uzavřených, licencovaných a velmi robustních řešení. To bylo efektivní řešení pro velké společnosti, kdežto pro malé a střední společnosti tato řešení nebyla ekonomicky vhodná. V současné době ale kvalita a použitelnost open source alternativ v BI dosahuje dostatečné úrovně a začíná narůstat počet jejich reálných implementací. Díky současné globální ekonomické situaci se tedy BI, možná více než v ostatních odvětvích IT, ve větší míře otevírají možnosti pro open source technologie. Dokonce i Steve Ballmer (Generální ředitel společnosti Microsoft) hovoří o „restartu“ globální ekonomiky, při kterém připouští zvyšování zájmu o open source software.[A2] Řešení implementované jako open source má dvě podstatné výhody:
nulová cena licencí možnost libovolných úprav, přístup ke zdrojovým kódům
Nulová cena licencí ale samozřejmě neznamená, že by celá realizace byla zadarmo. Cena implementace bude minimálně stejná jako s licencovaným produktem. Ale to, co je možné ušetřit za licence, je možné vložit do služeb, které ve výsledku realizované řešení zkvalitní. Jedná se například o školení obsluhy, implementaci specifických úprav do prostředí společnosti apod. Komerční, licencované produkty mají naopak implementační výhodu, že většinou již obsahují přednastavené „balíčky“ funkcionality pokrývající určité okruhy – finanční, personální, apod. Toto bývá samozřejmě argumentem pro cenu licencí. Naopak open source řešení je ze své podstaty pouze funkční rámec, pomocí kterého je potřeba požadované reporty a pohledy implementovat. Z hlediska dlouhodobějšího horizontu se ale ukazuje, že různých úprav vždy přibývá. Když ne, znamená to, že je projekt mrtvý. Možnost libovolných úprav systému a přístup ke zdrojovým kódům open source produktů je zajímavou variantou placené technické podpory uzavřených systémů. Úprava kódu v případě potřeby může proběhnout rychleji v open source řešení, pokud víme co kde změnit, než při čekání na opravu od technické podpory dodavatele nebo jeho partnerů. Ale při rozsahu open source BI řešení je potřeba počítat nejprve s časem na seznámení se s produktem (kódem), časem na doimplementování vlastní úpravy či vlastnosti a časem na otestování kódu. Proto není pro mnoho společností možnost vlastní úpravy kódu podstatná výhoda.
15
3.5 - BI dle společnosti Gartner V roce 2009 byla s BI řešeními všeobecně menší spokojenost u zákazníků velkých poskytovatelů BI řešení mj. kvůli ne zcela optimálně zvládnuté integraci „nového/druhého“ produktu k svému produktu, který společnost měla v nabídce před akvizicí společnosti specializující se na BI. To a těžké ekonomické časy způsobily pokles růstu BI odvětví v roce 2009. V současné době 5 největších společností zabývajících se BI ovládá okolo 75% trhu. Přes všechny problémy se povědomí o BI aplikacích mezi společnostmi zlepšuje a zájem o nasazení BI řešení nepatrně stoupá. Snazší pochopení výše zmíněného poskytuje shrnutí hlavních nákupních kritérií (rozhodnutí) v oblasti BI:
Používání BI při nákupu lze rozdělit do dvou situací. Na první, kde se BI implementuje hned při pořízení aplikací a na druhé, kdy se implementuje BI dodatečně. Společnosti v dnešní době krize implementují BI ve větší míře již s nákupem aplikací pro chod společností nezbytných. Vyhnou se tak pořízení nadbytečných aplikací, které nejsou nutně potřeba, a chybějící aplikace se pořídí dodatečně až v případě potřeby. Vizionáři z minulých let, kteří implementovali ve svých řešeních něco navíc již nejsou vizionáři, pokud neimplementovali něco dalšího. Trh na uvedené novinky reaguje implementací jejich vychytávky do svých řešení, což dává společnosti se zájmem o BI větší možnost výběru. Příkladem z posledních let je vizualizace dat za běhu aplikace (ad-hoc), s možností úprav, mnohdy urychlená natažením všech dat do RAM s možností vytvoření alternativy k řešením pouze s reporty. Nejprve to zavedly společnosti QlikTech a Tibco Software a nyní to po nich převzaly Microsoft (aplikace PowerPivot), SAP (aplikace SAP BusinessObjects Explorer), IBM (aplikace IBM Cognos Express) a další. Změny způsobené akvizicí společností si vybírá daň na zákaznících. Ne vždy si jsou zákazníci nyní úplně jisti jak dopadne akvizice menších společností a to může ovlivňit jejich volbu při výběru BI řešení. Změna zacílení BI nástrojů. BI nástroje nejprve sloužily k měření různých firemních dat. Nyní poskytují analýzu dat, plánování vývoje do budoucna a v nejpokročilejších případech i optimalizaci firemních procesů. Stále sice nejvíc nástrojů a lidí využívá jen měření dat, ale společností co data analyzují a dále zpracovávají stabilně přibývá. V roce 2009 proto společnost IBM koupila společnost SPSS (lídr na trhu v oblasti prediktivní analýzy). To byla v roce 2009 jediná velká akvizice mezi BI společnostmi. Ostatní společnosti se věnovaly rozšiřování a ladění svých řešení v těchto oblastech. Ekonomická situace nahrává levným alternativám. Jedná se především o open source BI řešení. Některé zákaznické společnosti ale nemohou (například kvůli zárukám a bezpečnosti) nebo nechtějí využít open source řešení. Poté se snaží najít co nejlevnější BI řešení na trhu mezi zaběhnutými společnostmi. V tom případě budou určitě uvažovat o společnosti Microsoft, která je považována za dodavatele levného BI řešení v porovnání s ostatními velkými dodavately. V posledním roce ale stoupá i rozšíření nasazení softwaru jako služby (SaaS) na hostujícím serveru. Zákaznické společnosti to snižuje náklady a přináší s sebou další možnosti. SaaS nás v nejbližších několika letech neopustí a je jen na společnostech poskytujících BI řešení jak na tento trend zareagují.
16
4 - Komplexní nástroje Business Intelligence V bakalářské práci jsem porovnal několik ucelenějších open source BI řešení různých výrobců s dvěmi komerčními produkty od společností Microsoft a SAP. Mezi open source řešení, které jsem srovnával, patří: Business Intelligence and Reporting Tools (BIRT), Jaspersoft BI, OpenI, Pentaho Business Intelligence a SpagoBI. Existují i další možnosti a nástroje, ale tato řešení nabízí ucelenou funkcionalitu od jednoho poskytovatele. Existuje mnoho nástrojů, napsaných převážně v Javě, které jsou zaměřeny pouze na jednu konkrétní část a nezaměřují se na celou funkcionalitu BI, tudíž se musí doplnit s dalšími nástroji od jiného tvůrce čímž mohou vznikat dodatečné problémy. Proto jsem je do srovnání nezařazoval, protože jejich možný přínos se může snadno vytratit z důvodu náročnější instalace, implementace a nastavení. Komerční společnosti začaly poskytovat ucelená řešení pro BI začátkem nového tisíciletí v roce 2001. První nekomerční řešení se začala vyskytovat brzy po uvedení komerčních produktů. Především Jaspersoft uvedl své BI řešení ještě před koncem roku 2001, ale byla to řešení ve fázi vývoje. Zmíněný Jaspersoft uvedl například produkt ve verzi 0.1.5, kde chyběla mnohá funkcionalita a o nahrazení komerčních produktů v prostředí společnosti nemohla být řeč. Open source BI aplikace s reálnou možností nasazení se začaly vyskytovat od roku 2005. Při porovnání produktů je potřeba rozlišit mezi komerčními produkty a open source řešeními, kde hlavní rozdíl je v ceně řešení. Komerční řešení obsahuje poplatek za licence, cenu implementace, která se může značně lišit podle požadavků společnosti na zamýšlené řešení. Implementace produktu zákazníkovi obvykle stojí přibližně 50% – 120% z poplatku za licence. Obvykle platí, že pro menší společnost s méně licencemi je implementace úměrně levnější. Velké společnosti většinou platí za implementaci více než za licence v závislosti na složitosti jejich obchodních procesů a požadovaných úpravách aplikace. Další poplatek spojený s komerčním řešením je údržba systému. Sice není výslovně vyžadována, ale systém není dodán s volným zdrojovým kódem a tudíž si zákazník nemůže systém administrovat zcela sám. Cena údržby bývá odvozena z ceny za pořízené licence a pohybuje se většinou kolem 20% z ceny licencí. Údržba se nasmlouvává na roční období. V open source řešeních odpadá poplatek za licence, místo poplatku za instalaci a údržbu se zaměstnává obvykle informační technik, který zajišťuje instalaci zvoleného řešení, chod všech programů a věci spojené s administrací systému. Jeho najmutí ale obvykle vychází levněji než poplatky komerčním společnostem za obdobnou práci. Open source řešení umožňuje úpravy ve zdrojovém kódu. Obvykle se ale úpravy nedělají, protože nastudování, pochopení, otestování a úspěšné nasazení upraveného zdrojového kódu je zdlouhavé případně neadekvátně nákladné.
17
4.1 - Kriteria hodnocení BI produktů. Před představením a porovnáním všech BI produktů je samostatně potřeba nastavit váhy pro hodnocení porovnávaných řešení. Některé hodnotitelné parametry nemá příliš význam hodnotit a bodovat pro každý vybraný produkt, protože všechny programy danou funkcionalitu poskytují. Společné podmínky a potřeby pro všechna řešení zahrnují:
Nainstalovanou Javu verze 1.5 a novější Všechna řešení mají podporu řešenou alespoň pomocí fóra, další možnosti se již budou hodnotit zvlášť Všechna řešení umí poskytnout reporty Všechny BI projekty jsou vyvíjeny cíleně podle nějakého plánu či roadmapy.
V ostatní parametrech se již porovnávaná řešení liší. Nehodnocené parametry:
Vývoj – hodnotí se, zda má produkt za nějaké rozumné období nové sestavení. Tento parametr v průběhu práce byl z hodnocení vyřazen. Důvodem k tomuto kroku bylo uvolnění nových verzí programů, které měnily hodnocení. Licence – v této položce je pouze typ licence pod jakou je produkt k dispozici.
Hodnocené parametry:
Podpora – Je hodnocena pouze podpora navíc kromě fóra či komunity, kterou poskytují všechny projekty. Datová integrace – ETL (Extract, Transform, Load), ELT (Extract, Load, Transform), či jiné další Datová transformace – Hodnocení typů a množství vstupních formátů (databáze, externí soubory, ...) Dokumentace – Zda je pro všechny části a volně k dispozici. Reporty – Reporty poskytují všichni. Hodnoceno automatické provádění reportů či pouze možnost manuálních. Dále formáty výstupů. Reporty – zvládnutí OLAP (multidimenzionalita), R/M –OLAP SaaS = možnost použití jako Software as a Service Nasazení – Hodnocena existence návodu, podpory na internetu, další pomoc zájemci Ukázky programu – Existence demo verze na webu či jiná ukázka volně k dispozici
Produkty lze samozřejmě porovnávat i z jiného pohledu, například rychlosti zpracování konkrétního dotazu, rychlosti tvorby reportů a ostatních věcí z praxe. Ty ale nemůžu hodnotit a ani to nebylo cílem práce, protože před nasazením konkrétního projektu tyto parametry nelze nijak naměřit a získat tak porovnatelné výsledky. Hodnocení produktů je rozděleno do několika skupin. Jsou jimi Podpora, Datová transformace, Analytické komponenty, Software as a service, Implementace a Instalace/Nasazení. V každé skupině bylo možné získat určité množství bodů. Získatelné množství bodů ve skupině vychází z mého subjektivního názoru na důležitost skupiny při rozhodování, a jejího vlivu na volbu BI řešení. Největší váhy jsem přidělil Instalaci/Nasazení (7bodů), Analytickým komponentám (7bodů), Podpoře (6 bodů), Datové transformaci (5 bodů). Zbylé skupiny jsou ohodnoceny 2 body. Důvod přiřazení nejvíce bodů do sekce nasazení je fakt, že při neúspěchu tohoto bodu dojde k ztrátě prostředků do projektu vložených a nedostatečná pomoc může být při nasazení 18
velkým nedostatkem jinak dobrého řešení z pohledu společnosti, která chce BI aplikaci nasadit. Velkou váhu mají i analytické komponenty, protože jejich činnost produkuje výsledky jako první a na její činnost se zaměřuje zadavatel nejdříve a nejvíce. V případě postupné implementace open source projektů navíc tento první výsledek může rozhodnout o pokračování v implementaci projektu nebo jeho zastavení, případně nahrazení jiným BI řešením.
4.2 - Porovnávané open source BI produkty Jak jsem již psal výše, rozhodl jsem se porovnávat 5 open source produktů, které patří mezi nejznámější a nejrozšířenější na trhu. Jistě jsou i další, ale volba padla na tyto produkty. Existují i specializované open source (i komerční) nástroje, které se zaměřují pouze na jednu část BI, které by šly navzájem porovnávat mezi sebou. To ale nebylo cílem této práce. Přehled a základní porovnání této problematiky je na přiloženém CD v souboru OSBR - september 2009.pdf. Mnou porovnávané open source produkty jsou v porovnání seřazeny podle názvu, čímž chci zdůraznit svoji nestrannost k žádnému produktu. Forma porovnání produktů je řešena uvedením základních faktických informací o produktu (verze, výrobce, vývoj, něco navíc). Pod těmito informacemi je u každého produktu vždy připojena tabulka, která je rozdělena po hodnocených sekcí. U každé hodnocené vlastnosti jsou slovně popsány schopnosti produktu v této oblasti a dále je přidáno bodové hodnocení, které vychází z předem popsaného obodování parametrů BI aplikací. Tabulka je zakončena součtem bodů pro zvýšení přehlednosti. Porovnávané open source produkty:
Business Intelligence and Reporting Tools (BIRT) Jaspersoft BI, JasperForge BI OpenI Pentaho BI Suite SpagoBI
19
4.2.1 - Business Intelligence and Reporting Tools (BIRT) Stabilní verze: 2.5.1. – 26. 9. 2009 (verze 2.5.2 vyšla 28.2.2010) Software (zkratka SW) vyžadující pro provoz: Java 1.5 a vyšší Výrobce: The Eclipse Foundation První verze: projekt začal 24. 8. 2004, verze 1.0 vyšla 1. 3. 2005 Vývoj: Projekt je vyvíjen skupinou Eclipse, má vývojový plán a jeho vývoj je stabilní Vlastnost
Hodnocení - slovně
Hodnocení [body]
Podpora (plus podmínky)
Návody na stránkách, komunita, fórum, wikipedia produktu
Dokumentace
Wikipedia stránky produktu, volně na webu
2 b. 1,5 b.
Datová transformace Podporované JDBC, XML, Web Services, CSV vstupní formáty
2 b.
není - v plánu pro nějakou příští verzi
0 b.
Reporty
seznam dat, grafy, 2D zobrazení dat (prodej za kvartál), text, kombinace předešlých
2 b.
výstup reportů
HTML, PDF, XLS, DOC, PPT, Postscript, CSV
OLAP
věc relačního serveru
0 b.
SW as a Service
nemá
0 b.
Implementace
vlastní - nekomerční open source volba
0 b.
Licence (cena)
Eclipse Public Licence http://en.wikipedia.org/wiki/Free_Software_Foundation
ETL Analytické komponenty:
2,5 b.
-
Forma instalace (vlastní, vlastní dle dodaného detailního návodu zajištěná)
2 b.
Zprovoznění (dodané, náročnost)
2 b.
dle návodu
Ukázky použití 1 příklad na webu nástroje programu http://www.eclipse.org/birt/phoenix/tutorial/basic/customers.rptdesign
2 b.
tutorial http://download.eclipse.org/birt/downloads/examples/reports/2.1/tutorial /tutorial.html 16 bodů
Celkem Tabulka č. 3 – Hodnocení řešení BIRT
20
4.2.2 - Jaspersoft BI Stabilní verze: 3.7 – z 19. 1. 2010 SW vyžadující pro provoz: Java 1.5 a vyšší, oficiálně podporované operační systémy Microsoft Windows, SUSE, Redhat Enterprise Linux Výrobce: Jaspersoft Corporation První verze: verze 0.1.5 – listopad 2001, verze 1.0 – 21. 7. 2005 Vývoj: Jaspersoft je vyvíjen komerčně, z této verze je odvezena open source verze Nasazení: Celosvětově BI řešení nasazeno u více než 11000 společností. Hodnocení - slovně
Vlastnost Podpora (a její podmínky)
Open source: fórum, dokoupitelná emailová podpora (3 nebo 6 incidentů ročně)
Dokumentace
placená, volně jen fórum
Hodnocení [body] 1,5 b. 1 b.
Datová transformace Podporované JDBC, text s oddělovači, poziční text, LDIF, XML vstupní formáty
2 b.
ETL
ETL i ELT
2 b.
Reporty
ano - plánované kalendářně, verzování hist. reportů
2 b.
výstup reportů
PDF, HTML, Excel, RTF, CSV, SWF (Flash), TXT, XML
3 b.
OLAP
Relational OLAP
1 b.
SW as a Service
pouze v Enterprise edici
0 b.
Implementace
vlastní - nekomerční open source volba
0 b.
Licence (cena)
Library GPL
Analytické komponenty:
-
Forma instalace (vlastní, Vlastní, na stránkách produktu základní pomoc zajištěná) Zprovoznění (dodané, náročnost)
instalace několika samostatných částí, základní pomoc na webu produktu
Ukázky použití potřeba login pro přístup ke všem souborům programu Celkem
1 b.
1,5 b.
0,5 b. 15,5 bodu
Tabulka č. 4 – Hodnocení řešení Jaspersoft BI
21
4.2.3 - OpenI Stabilní verze: 2.0 RC2 z 4. 9. 2009 – další verze zatím není (info z 13. 5. 2010) SW vyžadující pro provoz: Java 1.5 a vyšší Výrobce: OpenI První verze: existují od roku 2002, od roku 2005 nabízejí i open source řešení Vývoj: existují nápady na další rozvoj produktu, ale bez vypracovaného přesného harmonogramu Hodnocení - slovně
Vlastnost
Hodnocení [body]
Podpora (a její podmínky)
komunita, facebook, strohý manuál na wikipedii produktu
2 b.
Dokumentace
Základní uživatelský manuál na wikipedii produktu
1 b.
Datová transformace Podporované Pracuje pouze s daty v databázi vstupní formáty
1 b.
Není
0 b.
Reporty
ano – ručně
1 b.
výstup reportů
PDF, Excel
0,5 b.
OLAP
ano s OLAP servery: Mondrian, Microsoft SSAS 2005, a MSAS 2000
1 b.
SW as a Service
Ano
1 b.
Implementace
vlastní - nekomerční open source volba
0 b.
Licence (cena)
GNU GPL 2
ETL Analytické komponenty:
-
Forma instalace (vlastní, jednodušší - není tolik obsáhlé řešení zajištěná)
1 b.
Zprovoznění (dodané, náročnost)
1 b.
jednodušší - není tolik obsáhlé řešení
Ukázky použití ukázkový příklad je celý implementován na oficiálních stránkách programu volně k ozkoušení Celkem
2 b. 11,5 bodu
Tabulka č. 5 – Hodnocení řešení OpenI
22
4.2.4 - Pentaho BI Suite Stabilní verze: 3.5.0 (z 15.10.2009) (od konce února 2010 verze 3.5.2) SW vyžadující pro provoz: Java 1.5 a vyšší Výrobce: Pentaho Corporation První verze: druhá polovina roku 2005 Vývoj: Komerční Pentaho je systematicky vyvíjeno dle harmonogramu a z něj jsou vždy odvozeny open source bezplatná verze programu. Ty obsahují funkcionalitu z přibližně 90%. Přehledný plán naplánovaných rozšíření.[E1] Nasazení: Pentaho Business Intelligence používá přes 8000 společností po celém světě. Hodnocení - slovně
Vlastnost Podpora (a její podmínky)
návody na webu - po free registraci, komunita, fórum, wikipedia stránky produktu
Dokumentace
pro všechny části programu na wiki komunity, web oficiálního produktu po bezplatné free registraci
Hodnocení [body] 2 b. 1,5 b.
Datová transformace Podporované Access, CSV, Excel, XML, LDAP, LDIF, Mondrian, Text file, SQL vstupní formáty DB, Java DB
3 b.
ETL
EAI u serveru, ETL i EII
2 b.
Reporty
ano
1 b.
výstup reportů
PDF, HTML, RTF, TXT, CSV, XLS
2 b.
OLAP
ano (Mondrian), ROLAP
1 b.
SW as a Service
Pouze v komerční verzi
0 b.
Implementace
vlastní - nekomerční open source volba
0 b.
Licence (cena)
GNU LGPL, Mozilla Public License 1.1
-
Analytické komponenty:
Forma instalace návod na webu - např. (vlastní, http://mondrian.pentaho.org/documentation/installation.php zajištěná)
2 b.
Zprovoznění (dodané, náročnost)
1 b.
existuje více samostatných částí, postup a rady k instalaci na stránkách
Ukázky použití demo k různým částem nástroje na stránkách produktu programu Celkem
2 b. 17,5 bodu
Tabulka č. 6 – Hodnocení řešení Pentaho BI Suite
23
4.2.5 - SpagoBI Stabilní verze: 2.4 (z 18. 12. 2009) SW vyžadující pro provoz: Java 1.5 a vyšší Výrobce: OW2 Consortium První verze: první stabilní verze z února 2006 Vývoj: Dle naplánovaného vývoje.[E2] Hodnocení - slovně
Vlastnost Podpora (a její podmínky)
fórum, komunita, wikipedia stránky produktu, http://www.spagoworld.org/xwiki/bin/view/SpagoBI/Support
Dokumentace
volně k dispozici na webu, více přes fórum
Hodnocení [body] 2 b. 1,5 b.
Datová transformace Podporované MySQL, Postgres, Oracle, HSQL, Ingres, Microsoft SQL Server vstupní formáty
1 b.
ETL
ETL, EII
2 b.
Reporty
ano
1 b.
výstup reportů
PDF, XLS, CSV, HTML, JPG, RTF
OLAP
ROLAP i MOLAP
2 b.
SW as a Service
v plánu přidat v roce 2010
0 b.
Implementace
vlastní - nekomerční open source volba
0 b.
Licence (cena)
GNU Lesser GPL
Analytické komponenty:
2,5 b.
-
Forma instalace (vlastní, vlastní, více samostatných částí (až 5) zajištěná)
1 b.
Zprovoznění (dodané, náročnost)
1 b.
popsaná instalace každé části (ne detailně)
Ukázky použití flash tutorial na webu programu
2 b. 16 bodů
Celkem Tabulka č. 7 – Hodnocení řešení SpagoBI
24
4.3 - Porovnávané komerční BI produkty Komerční produkty nejsou nosnou částí práce. Jsou zde zahrnuty především pro porovnání, aby bylo vidět, kde open source řešení ztrácí a kde získává v porovnání s komerčním řešením. V porovnání jsou zahrnuti pouze 2 poskytovatelé (Microsoft a SAP). Oba poskytují více možných variant BI řešení. Byla zvolena spíše základní varianta, protože je lépe srovnatelná s open source řešeními. Některé studie uvádí průměrnou cenu za BI řešení pro společnosti okolo $100,000. (Například viz přiložený soubor OSBR - september 2009.pdf.) Tato cena ale zahrnuje jak licence, tak poplatky za implementaci a nasazení. Společnost Pentaho uvádí, že noví zákazníci jejího komerčního BI produktu získaní během roku 2009 si pořídili BI řešení s průměrnými náklady za software pro první rok o částce $24,000. Tato částka je tak o více jak polovinu nižší než částka uvedená výše z OSBR – september 2009.pdf. Na druhou stranu průměrná velikost těchto společností činila přibližně pouze 220 zaměstnanců. Řešení od společnosti Microsoft má pro mnohé společnosti výhodu, že již před spuštěním nasazování BI řešení, mají uhrazeny část licenčních poplatků. Je tomu tak pokud již na svém serveru mají Windows Server, mezi uživateli Microsoft Office, případně i další software potřebný pro běh BI. (Potřebný software je všechen uveden v tabulce s BI produktem od společnosti Microsoft). Z tohoto důvodu je komerční BI řešení Microsoftu považováno za jedno z nejlevnějších komerčních řešení na trhu. Řešení od společnosti SAP je možné sestavit na míru dle potřeb konkrétní společnosti. Pokud nějakou funkci využije víc, a některou méně, je možné různě zaměňovat software zvolený pro nasazení ve společnosti v rámci BI řešení. SAP má velmi velké portfolio softwarů pro všechny nástroje používané v BI a se správnou volbou softwaru zde pomáhá konzultant z SAP či partnerské společnosti. Zde je mnohem důležitější vědět co konkrétní společnost od BI očekává. Podle požadavků se společnosti dostane nejvhodnější sestava. Náklady na BI řešení jsou velmi těžko předem stanovitelné. Vše závisí na jasnosti, přesnosti a šířce záměru, velikosti společnosti, délce implementace a dalších faktorem. Obvyklá cena za zavedení BI řešení do společnosti v ČR je dle SAP několik set tisíc až několik málo milionů korun. (0,5 – 5 mil. Kč)
25
4.3.1 - Microsoft Business Intelligence solution: Microsoft SQL Server 2008, SharePoint a Office 2010 (Excel) Stabilní verze: SQL Server 2008, Excel 2007, SharePoint 2007 (produkt konkurující SAP BO Enter.) SW vyžadující pro provoz: Operační systém Microsoft Windows Server Výrobce: Microsoft corporation První verze: první aplikace pro BI v roce 1994, SQL Server v roce 2000 Vývoj: vypracovaný plán vývoje, snaha o zpřístupnění BI co největšímu množství lidí, integrace s Microsoft Excelem a SharePointem. Produkt je řazen mezi leadery v oboru - viz obrázky č. 3 a 4. Vlastnost
Hodnocení - slovně
Hodnocení [body]
Podpora (a její podmínky)
Pro všechny produkty společnosti Microsoftu zdarma podpora chyb po 8 let od vydání (i od Service Packů)
3 b.
Dokumentace
Knihy on-line (vždy aktuální verze), tištěné knihy, MSDN, technet
3 b.
Podporované Integrační služby v SQL Serveru, import všech databází vstupní formáty s definovanou strukturou. CSV, XLS a další strukturované soubory
3 b.
Datová transformace
ETL
Ano, samostatná datová pumpa pro různé zdroje dat
Analytické komponenty:
Ano, analytické služby s vytěžováním dat
Reporty
Ano, reprtovací služby, volně doinstalovatelný report builder (uživ. přívětivé). Umožňuje vytvářet reporty a analýzy s aktuálními daty.
výstup reportů
HTML, PDF, DOC, CSV, XLS, e-mail
2,5 b.
OLAP
Ano, SQL Server vytváří OLAP kostky
1 b.
SW as a Service
Ano, lze si pronajmout server Microsoftu a používat pro svá data
2 b.
Implementace
Samostatná, od partnera Microsoftu
2 b.
Licence (cena)
Dle požadavků: express zdarma (nabízí BI a další základní možnosti), Workgroup, Standard, Enterprise (nejdražší, buď 25000€/1 CPU nebo 10000€ za server a 160€ za uživatele. Doporučené ceny.)
Forma instalace (vlastní, Samostatně (uživatelsky přívětivý instalátor), od partnera Microsoftu zajištěná) Zprovoznění (dodané, náročnost)
Uživatelsky přívětivý instalátor – projde všechny části (instalace, nastavení). Od partnera – vše zajištěno, trvání a náklady jsou dány představou o produktu (rozsah implementace, přesnost záměru). Obvykle 3 nebo 4 měsíce po spuštění.
Ukázky použití Virtual laby přístupné přes internet, MSDN, technet, skripty ke programu stažení ze stránek Microsoftu.
1 b.
2 b.
-
2 b.
2,5 b.
2 b. 26 bodů
Celkem Tabulka č. 8 – Hodnocení zvoleného řešení od společnosti Microsoft
26
4.3.2 - BusinessObjects Enterprise Stabilní verze: XI R2 SP6 (produkt na úrovni řešení Microsoft včetně SharePointu). SW vyžadující pro provoz: nezávislý na volbě operačního systému, garantován Microsoft Windows Výrobce: SAP První verze: 1. 12. 2009, vývoj různých dílčích BI nástrojů započal v 90. letech 20. století Vývoj: Plánovaný vývoj nových programů dle stanoveného harmonogramu, SAP se řadí mezi vizionáře v oboru – viz obrázky č. 3 a 4. Vlastnost
Hodnocení - slovně
Hodnocení [body]
Podpora (a její podmínky)
Placená údržba - Standard support 18%, Enterprise Support --> 22%, znalostní DB, call centrum, expertise centra, konzulting
2,5 b.
Dokumentace
doručená na CD po zakoupení licence
2 b.
Datová transformace Podporované Import dat z databáze (okolo 95% implementací používá Oracle, vstupní formáty DB2 nebo SQL), sturkturovaný soubor (CSV, XLS, .. ) ETL
2,5 b.
Ano
1 b.
Reporty
Crystal reports
1 b.
výstup reportů
PDF, XLS, CSV, HTML, RTF
2 b.
OLAP
ROLAP
1 b.
SW as a Service
Ano, možnost běhu služby na pronajatém stroji
2 b.
Implementace
zákazník, konsultační společnosti, SAP consulting
2 b.
Licence (cena)
Komerční (údaj obdržím, licence na 1 uživatele na všechen SAP SW je cca 3500€)
Analytické komponenty:
Forma instalace (vlastní, zákazník, konsultační společnosti, SAP consulting zajištěná) Zprovoznění (dodané, náročnost)
Zakoupené
Ukázky (templaty) použití programu
presentace, demo verze
-
2 b.
1,5 b.
2 b.
http://www.sap.com/solutions/sapbusinessobjects/large/index.epx Celkem
21,5 bodu Tabulka č. 9 – Hodnocení zvoleného řešení od společnosti SAP
27
4.4 – Zhodnocení porovnávaných BI produktů Nyní, když víme jak si všechny produkty stojí, můžeme z přiložené tabulky (tabulka č. 10) vyčíst, který produkt kde na ostatní ztrácí a v čem je lepší. Zajímavé porovnání, které lze vyčíst z tabulky je, že komerční řešení převyšují open source produkty v podpoře (mají navíc body za možnost placené podpory), v možnosti SaaS, kterou některé open source produkty poskytují také, ale ne bezplatně. Dále komerční produkty získaly v oblasti implementace řešení. Opět se ale jedná o body, které dané řešení prodraží více, než open source volba. Dále je u některých open source produktů vidět, že dokáží v některé konkrétní oblasti s komerčními řešeními stát bok po boku (například Jaspersoft v analytických komponentách), ale ztrácí v jiné oblasti. Z výsledků tedy jde vyčíst, že open source produkty jsou někdy nerovnoměrně vyvíjeny. Například je produkt velmi silný v oblasti reportů, kde nabízí mnoho typů, ale neposkytují již stejně bohaté možnosti v oblasti jiné. Toto má jednoduché vysvětlení. V tomto případě se lze jednoduše nalézt vysvětlení, že napsání jedné drobné schopnosti (například výstup reportu, jehož tvorba a práce s ním je již napsaná) je snazší (zabere méně člověkohodin) než úprava velká části programu například kvůli poskytnutí možnosti nasazení programu jako služby (SaaS). Vlastnost něčeho navíc oproti konkurenci je vždy výhodou kvůli schopnosti zaujmout společnost při rozhodování o volbě poskytovatele BI řešení.
Produkt Podpora
SAP Jaspersoft Pentaho Microsoft BIRT OpenI SpagoBI Business BI BI Suite BI řešení Objects 3,5
2,5
3
3,5
3,5
6
4,5
Datová transformace
2
4
1
5
3
4
3,5
Analytické komponenty
4,5
6
2,5
4
5,5
5,5
4
SW as a Service
0
0
1
0
0
2
2
Implementace
0
0
0
0
0
2
2
Instalace/nasazení
6
3
4
5
4
6,5
5,5
16
15,5
11,5
17,5
16
26
21,5
Celkem bodů
Tabulka č. 10 – přehled hodnocených řešení a jejich výsledky
28
5 - Závěr z porovnání open source a komerčních Business Intelligence řešení Open source produkty poskytují obdobnou funkcionalitu jako komerční. Volba open source řešení není rozhodující faktor, který rozhoduje o úspěchu či neúspěchu BI řešení ve společnosti. U nejdůležitějších funkcí BI řešení lze vždy najít open source produkt, který si vede v konkrétní disciplíně stejně nebo i lépe než komerční řešení, ale v jiné oblasti tento produkt na komerční řešení již ztrácí. Mezi nejrozšířenější open source BI produkty patří JasperSoft a Pentaho. Je to dáno tím, že poskytují své produkty ve více verzích. Jak v čistě open source základní, komunitní edici zdarma, tak i v komerční edici, která má navíc některé funkce a výhody spjaté s komerčním řešením. (podpora, záruky, atd.) Porovnání potrvdilo, že Pentaho je oprávněně nejrozšířenější, protože je technologicky na špičce v porovnání s ostatními open source produkty. Výše jmenované 2 společnosti, jsou aktivní i na území České Republiky a poskytují zde svá řešení především přes partnery, které je zákazníkům implementují dle jejích potřeb. Jaspersoft získává přibližně 50% svých tržeb za SW z OEM části trhu. Pentaho za rok 2009 získalo přibližně 220 komerčních zákazníků s průměrnou cenou prvoročního kontraktu (náklady na BI pouze za software) v průměru $24,000. Pentaho může mít tisíce instalací po světě, ale jen velmi málo z nich je pod komerční smlouvou. Komerční zákazníci open source poskytovatelů mají nižší průměrný počet zaměstnanců než zákazníci komerčních BI poskytovatelů. Z čehož vyplývá, že i poskytnuté open source BI řešení je většinou menší, než komerční BI řešení. Ostatní open source produkty na výše jmenované méně či více ztrácí. Některé společnosti nejsou u nás příliš známé a rozšířené a tak u nich neexistuje spolehlivá lokální pomoc. Příkladem je například SpagoBI. Výhodou komerčních řešení je, že jim nechybí žádná funkcionalita. Mnohdy ale zákaznickým společnostem stačí funkcionalita open source řešení a některé komerční funkce navíc stejně využijí jen v minimální míře. Díky tomu a díky svému delšímu působení na trhu a stabilnímu vývoji (včetně možnosti akvizic) komerční BI řešení příliš neztrácí v žádné oblasti hodnocení a proto mají celkově lepší výsledky než open source produkty. Microsoft poskytuje cenově atraktivní komerční řešení pro širokou skupinu zákazníků, zatímco SAP poskytuje své řešení cílenější skupině společností, ale nabízí některé možnosti navíc (například plánovací část BI řešení). V SAP dobíhá slučování portfolia BI produktů (Business Warehouse s BusinessObjects Enterprise) po akvizici z roku 2008. Detailní informace k BI od společnosti SAP zákazník získá až ve chvíli, kdy podá oficiální poptávku o BI řešení. Proto bylo jeho porovnání s ostatními produkty náročnější. Velmi velké množství společností a uživatelů po světě používá pro oblast BI zpracování a práce s daty Microsoft Excel. Jeho kontingenční tabulka lze v mnoha směrech porovnávat s OLAP kostkou a po celém světě s ním denně pracují miliony uživatelů. Existují i další možné body hodnocení BI řešení, jako například plánování, ale další hodnotící parametry by pro nás neměly velkou vypovídající hodnotu, protože open source BI nástroje by se umístnily všechny stejně. Zajímavou možností pro nasazení BI a dalších aplikací je SaaS. Můžeme se také setkat s pojmem „cloud software“, což označuje totéž. V nejbližších několika letech nás neopustí a bude zajímavé sledovat, jak se společnosti poskytující software v příštích měsících a letech vyrovnají a zda si někdo výrazněji pomůže či ztratí. 29
5.1 – Gartner a magické čtverce Několik společností se zabývá porovnáváním poskytovaných BI řešení. Jednou z nejznámějších a nejuznávanějších společností v této oblasti je společnost Gartner. Ta každoročně porovnává BI produkty a hodnotí je dle své metodiky v názorných „magických čtvercích“. Čerstvé zprávy o situaci v BI oblasti, ale nejsou veřejně dostupné a tak jsou přiloženy obrázky č. 3 a 4, které zachycují různé poskytovatele BI řešení za poslední 2 dokončené kalendářní roky. Zpráva za rok 2009 byla získána ve spolupráci se společností Microsoft a bylo přislíbeno, že se nebude dále šířit. Proto je z této zprávy převzat pouze magický čtverec shrnující rok 2009 (obrázek č. 4) a ostatní informace čerpají ze zprávy shrnující rok 2008[G]. Společnost Gartner příliš metodiku nemění, čili změny v magických čtvercích jsou porovnatelné i bez znalosti obsahu novější zprávy. Pro pochopení magických čtverců je potřeba vědět jaké společnosti jsou porovnávány a proč některé porovnávány jsou a jiné ne. Rozhodující body jsou:
Společnost musí vytvořit ročně příjem alespoň $15 milionů za software licence a poplatky za údržbu svých BI řešení. Jedná se o příjem pouze ze softwaru a služeb. Pokud poskytují transakční řešení BI musí umožňovat běh své transakční aplikace u společností, které nemají transakční aplikace od stejného poskytovatele. Musí zvládat aspoň 9 ze 13 hlavních požadavků Gartneru na BI řešení. Některá jsou v práci detailně probrána, ale všechna jsou k nalezení na stránkách (viz zdroj zprávy). Jejich zákazníci musí poskytnout minimálně 30 reakcí na provedený (každoroční) BI průzkum Gartneru.
Největší open source poskytovatelé (konkrétně Pentaho a Jaspersoft) nejsou v magických čtvercích zahrnuti, protože nevyhověli požadavku na dostatek uživatelských reakcí. Jejich obrat by ale na zahrnutí do magických čtverců stačil. Produkty jsou v magických čtvercích hodnoceny ve dvouch souhrných kritériích, které se skládají z několika dalších bodů:
Schopnost realizace a zdárného nasazení projektu - viz tabulka č. 11. Úplnost a celistvost vize – viz tabulka č. 12.
Po vynesení hodnocení do magického čtverce, dojde k rozdělení hlavního čtverce na 4 menší. Tím vznikají 4 oblasti v magickém čtverci pojmenované Lídři, Vyzyvatelé, Vizionáři a Skrytí hráči na trhu s BI. Zájemce o BI řešení by měl zvažovat poskytovatele BI SW ze všech 4 kvadrantů, všechny vyobrazené společnosti jsou schopny úspěšně implementovat BI řešení. Oba mnou zvolení komerční poskytovatelé BI jsou Gartnerem zařazeni do menšího čtverce lídrů v obou dvou posledních letech. Obě společnosti ale přistupují k svému BI řešení trochu odlišně. Zatímco společnost Microsoft nabízí snadno nasaditelné řešení, společnost SAP nabízí řešení schopné splnit všechny potřeby všech svých zákazníků, ale volba a nasazení produktů je obtížnější. To je u společnosti SAP částečně zapříčiněno dobíhajícím procesem po akvizici společnosti Business Objects. Pokud bychom z umístnění společností v magických čtvercích získali bodové hodnocení v obou porovnávaných kritériích a takto získané body sečetli (nebo porovnali vzdálenost společnosti od počátku grafu) zjistíme, že společnosti Microsoft a SAP si vedou přibližně stejně. Při pohledu na tabulku č. 10 ale zjistíme, že mezi společnostmi v mém porovnání již nějaký rozdíl existuje. Rozdíl mezi mým hodnocením a hodnocením Gartneru je dán jiným nastavením vah pro hodnocená kritéria. Moje srovnání je dáno především tím, že porovnávám open source produkty, na které zákaznické společnosti hledí s jinými 30
očekáváními a obavami. Váhy jsou tedy nastaveny tak, aby důležitějšími kritérii byla jednoduchost nasazení projektu. Hodnotící kritérium
Váha
Konkurenceschopnost a úspěšnou výrobku či služby
velká
Celková životaschopnost produktu (poskytovatele)
velká
Nastavení prodeje a cen
velká
Reakce na požadavky trhu, schopnost přizpůsobení projektu zákazníkovi
normální
Propagace produktu na trhu (u zákazníka)
normální
Zkušenosti zákazníků
velká
Schopnost společnosti plnit své cíle a závazky
nízká
Tabulka č. 11 – schopnost realizace/nasazení projektu.
Hodnotící kritérium
Váha
Zapracovávání potřeb trhu (zákazníků)
velká
Marketingová strategie. (jasné vymezení produktu od ostatních)
velká
Obchodní strategie.
normální
Strategie vývoje produktu
velká
Inovace
velká
Vhodnost řešení pro různé části trhu (pro malé i velké společnosti)
normální
Rozšíření produktu po světě (hlavně mimo zemi kde je společnost doma)
normální
Tabulka č. 12 – Úplnost/celistvost vize.
31
Obrázek č. 3 – Hodnocení BI produktů společností Gartner za rok 2008.
Obrázek č. 4 – Hodnocení BI produktů společností Gartner za rok 2009 ( zdroj získán za pomoci společnosti Microsoft)
32
6 – Srovnání zvolených řešení v praxi. Druhá část práce byla o praktickém porovnání dvou zvolených produktů. Byla zvolena komerční řešení od společnosti Microsoft a open source řešení Pentaho, které bylo zvoleno podle výsledků porovnání (tabulka č. 10). Původním záměrem bylo otestování stejných metod a funkcí nad stejnými daty. I když bylo každé řešení dodáno s vlastními vzorovými daty, nepodařilo se bohužel realizovat jejich přenesení do druhého řešení kvůli problémům, které jsou detailněji popsanými u každého řešení. V důsledku toho jsou obě řešení porovnávána s vlastními daty a jejich práce s nimi nejde srovnávat bez přihlédnutí k tomuto faktu. Sestava testovacího notebooku byla procesor 2,4GHz Core 2 Duo, 2 či 4 GB DDR2 RAM, 160GB 2,5“ HDD (5,400 ot./min) a Windows Server 2008 R2 Enterprise (64 bit). Operační paměť byla pro potřeby řešení společnosti Microsoft zvětšena na 4 GB. Open source řešení Pentaho mělo při testování k dispozici opět jen 2 GB RAM.
6.1 - Komerční řešení společnosti Microsoft: Od společnosti Microsoft jsem obdržel jejich testovací sestavení s BI aplikacemi jejich řešení. Jednalo se o Microsoft Windows Server 2008 R2, Micorsoft SQL Server 2008, Micorsoft SharePoint 2010 a Microsoft Office 2010 (beta verze). Tyto nejpodstatnější aplikace byly doplněny o menší pomocné aplikace jako například: ReportingServices, Report Builder 3.0 a PowerPivot. Takto připravené řešení bylo dodáno na externím pevném disku (2,5“, 320GB), kde zabíralo málo přes 80GB datového prostoru včetně testovacích dat. Tato sestava musela být virtualizována pomocí aplikace Hyper-V Manager, která je součástí operačního systému testovací sestavy. Rozumného chodu BI aplikací na testovací sestavě bohužel nebylo dosaženo. Proto jsem BI řešení odzkoušel přímo v kanceláři společnosti Microsoft na Praze 4. Celkové řešení na mé sestavě nechodilo akceptovatelně především kvůli nedostatku operační paměti. Pro chod je vyžadováno minimálně 8 GB. Pro rozumný chod aspoň 10GB. S 10GB řešení provozovala na svém serveru i společnost Microsoft. Na takovémto serveru již řešení pracuje s okamžitými reakcemi. Microsoft Office 2010 přináší serverově orientovanou komponentu BI webových služeb Excel Services, s doinstalovanou bezplatnou aplikací PowerPivot. PowerPivot je analytický procesor, který umožňuje rychlou práci s velkým množstvím dat (například relační databáze o milionech řádcích) v reálném čase za pomoci natažení všeho potřebného do paměti RAM. Největší výhodou tohoto řešení, kterou ocení každý uživatel, je intuitivnost prostředí Microsoft Office. Pro společnosti může být značnou výhodou i cena BI řešení od Microsoftu. Microsoft Office obvykle společnosti mají zakoupeny i když ještě neimplementovaly své BI řešení. Nemalá část jich také funguje na Windows Serveru a v případě realizace BI řešení tak můžou odpadnout některé náklady na nové licence. Navíc nejnovější aplikace Microsoft umožňuje přes SharePoint prohlížet a upravovat dokumenty (např. XLS) bez nutnosti mít na lokálním PC s připojením k síti nainstalovaný Microsoft Office. Veškeré úpravy jsou přenášeny přes HTTP protokol. Při práci s BI řešením (například tvorba reporů) společnosti Microsoft bylo zaznamenáno výrazné zrychlení při práci s daty v prostředí Microsoft Excel 2010 oproti aplikaci Microsoft Excel 2007. Za toto zrychlení může právě nová služba přidaná do Excelu. 33
Na reporty má Microsoft 2 aplikace o jejichž volbě rozhoduje povaha reportu. Pravidelné, stabilní reporty je lépe spouštět v aplikaci ReportingServices, která se po nasazení ve společnosti již stará o vše. Pro prezentaci a manipulaci s reporty dle potřeby je lepší použít Microsoft Excel. Ten vytváří větší soubor, který obsahuje všechna potřená data, s kterými lze pracovat dle potřeby. ReportingServices vytváří menší soubor s předem definovaným množstvím detailů, neupravuje se za účelem prezentace či vyčítání dalších informací z reportu a obvykle poskytuje nový pohled na data každý den (či noc). Zisk testovacích dat od společnosti Microsoft se nezdařil, kvůli nemožnosti exportu databáze v SQL Serveru 2008 na obdrženém obrazu pevného disku. Na mém testovacím stroji SQL Server 2008 pro nedostatek paměti nenaběhl úplně a chybějící prostředky znemožnily další práci s virtualizovaným obrazem. Při návštěvě ve společnosti Microsoft jsem měl k dispozici jen omezený čas a důležitější bylo poznat celé BI řešení, než vyexportovat pouze data z databáze. Z návštěvy společnosti jsem si odnesl i XLSX soubor s ukázkovým reportem (obrázek č. 5), který byl sestaven z dat v databázi obsažených. Jeho velikost je větší jak 100MB.
Obrázek č. 5 – ukázka reportu v prostředí Microsft Excel 2010 beta. V 4 levých pivotech lze nasavit datové filtry.
Bohužel list s daty (export relační databáze) v obdrženém souboru nelze otevřít (nalézt) a tak data přenositelná do open source řešení nejsou.
34
6. 2 - Open source řešení Pentaho BI Suite Open source řešení bylo zkoušeno s dodanými daty, které jsou přílohou přiloženého CD. Jejich import do databáze proběhl bez problémů při inicializaci programu. Tato databáze obsahovala méně dat a nabízela uživatelsky přijatelné reakce – do 8 vteřin při běhu na testovacím počítači. Tato data nešla ozkoušet v prostředí BI aplikací z řešení Microsoftu kvůli nemožnosti spuštění BI aplikací na vlastním testovacím stroji. Testovací data dodaná s aplikací Pentaho BI Suite obsahují data imaginární společnosti zabývající se prodejem aut a dalších dopravních prostředků. S řešením bylo dodáno dostatečné množství příkladů, jak se co dělá a na stránkách komunity nechyběla dokumentace nutná k nasazení a používání řešení. Instalace proběhla pouhým rozbalením aplikace do složky, odkud má být spouštěna. V reálných podmínkách to vždy bude server. Musí na něm být Java verze 1.5 či vyšší. Nastavení aplikace probíhá v administrativní konsoli (viz další odstavec). Veškeré informace potřebné pro obvyklé úkony jsou buď v přiloženém manuálu (ve formě PDF souboru) nebo k dohledání na stránkách produktu a na stránkách komunity. Nevýhodou oproti komerčním produktům může být, že komerční produkt je dodán již s „předpřipravenými“ sestavami reportů, atd. Zde je obvykle potřeba si reporty sám vytvořit. Vytvoření reportu je ve všech krocích dle očekávání a bez nelogičností. Práce s Pentahem je intuitivní. Práce s uživatelskými částmi BI řešení probíhá s využitím webového prohlížeče standardně na portu 8080. Administrativní konsole (obrázek č. 6) pro administraci zdrojů, uživatelských účtů, nastavení systémových parametrů, atd. je také přes prohlížeč a to standardně na portu 8099. V Pentahu mi nechyběla žádná funkcionalita, kterou považuji za nutnou ze strany zákaznických společností.
Obrázek č. 6 – Administrace uživatelských účtů v Pentahu. Dále nastavení používaných databází, služeb a naplánovaných úloh.
35
Prostředí Pentaho je přístupné přes internetový prohlížeč. Po přihlášení do BI aplikace se zobrazí ovládací lišta s ikonami. Po levé straně jsou vidět v prvním seznamu adresáře a v druhém seznamu, umístněném níže, soubory ve zvoleném adresáři. V největší oblasti, od sloupce k prohlížení souborů v pravo, se zobrazují soubory uživatelem otevřené či kontext z aplikace dle požadavků obsluhy. Všechno se vidět na obrázku č. 7. Po přihlášení do aplikace se zobrazí hlavní volby pro práci s aplikací. Jmenovitě se jedná o tvorbu nového reportu, tvorba nové analýzy a spravování obsahu. Při přihlášení pod administrátorským profilem (jako na obrázku č. 7) je v prvním řádku okna Pentaha menu lišta se čtyřmi položkami (soubor, zobrazení, nástroje, nápověda). Položka nástroje je viditelná pouze pro administrátorské účty a obsahuje nástroje pro základní práci s databázemi, volbu jazyka a zjištění novější verze Pentaha. 6.2.1 – Analýzy v Pentaho BI Suite Analýza se dělí na 2 části. Na datovou s přesnými čísly se strukturou tabulky. Umožňuje rozbalovat či schovávat další detaily. A na vizualizační, většinou jde o grafy, které se podle množství detailů viditelných v datové tabulce sami ihned překreslují.
Obrázek č. 7 – ukázka prostředí aplikace Pentaho a ukázka analýzy.
Vlastní soubor s analýzou se zobrazuje v pravé velké části. Má vlastní jméno, pod nímž je řádek několika pomocných nástrojů. Ty jsou rozděleny do několika sekcí. V první sekci jsou úpravy OLAP kostky a práce s dotazy do databáze, vedle je uložení analýzy a 36
konfigurace OLAP tabulky. Druhá sekce pěti ikon slouží pro nastavení zobrazení tabulky s daty pro analýzu. Další čtyři ikony upravují chování aplikace na změnu množství detailů a na procházení nejprve skrytým obsahem tabulky. Jde samozřejmě vzít každá položka a tu rozbalit zvlášť a prohlédnout do posledního detailu, ale jde i změnit chování při prohlížení dalších detailů a prohlížet stejný detail (například kvartály v roce) pro všechny položky tabulky. Tím se získá lepší přehled při hlubším porovnávání. Dále jsou dvě tlačítka pro práci s grafem. Prvním se volí, zda se graf bude zobrazovat či ne. Při stisku druhého se zobrazí formulář s nastavením parametrů a typu grafu. Předposlední dvě tlačítka jsou pro nastavení tisku a přímé vytištění výchozím způsobem. Poslední tlačítko slouží pro export do souboru XLS. 6.2.2 – Reporty v Pentaho BI Suite Vytvoření reportu v Pentahu probíhá v čtyřech krocích. Nejprve se zvolí datový zdroj. Poté se musí vybrat data ze zvoleného zdroje, která budou v reportu zpracována. V dalším kroku se nastavují parametry a filtry pro práci s daty, jejichž změnou jdou data zobrazená v reportu profiltrovat. Vyobrazení parametrů pro práci s reportem je zobrazeno na obrázku č. 8. Nakonec se nastavují vlastnosti reportu. Poslední parametr se nenastavuje při vytváření reportu, ale je přidán aplikací automaticky. Nastavuje výstup reportu. Při volbách HTML, PDF a prostý text se report zobrazí přímo v prohlížeči. Při ostatních volbách (RTF, CSV, XLS) se report vygeneruje a nabídne k otevření či stažení. Všechno probíhá intuitivně v jednoduchém prostředí. Pro tvorbu složitějších reportů je k dispozici aplikace Pentaho Reporting Designer.
Obrázek č. 8 – ukázka práce s parametry reportu.
Vlastní vizualizace reportu je vidět na obrázku č. 9. Zde je zvolena vizualizace report v HTML podobě. Na obrázku č. 9 je vidět report hodnotící prodej konkrétního produktu (automobil Ferrari Enzo z roku 2001) v různých autosalonech s přehledem tržeb.
37
Obrázek č. 9 – ukázka vizualizace reportu.
Při práci s Pentahem byl zaznamenán problém s alternativními prohlížeči. Vkládání grafů či jiných generovaných grafických prvků neprobíhalo na všech prohlížečích korektně. Konkrétně v Opeře (verze 10.53) se nezobrazovaly všechny grafy.
38
7 - Závěr Volba tématu byla zapříčiněna velmi rychlým vývojem v oblasti BI, a to jak u komerčních, tak open source produktů. Tento předpoklad se během práce potvrdil. Bakalářská práce byla rozdělena na 2 části. V první, kde jsem měl vybrat nejvhodnější open source BI řešení, bylo zvoleno Pentaho BI Suite. V druhé části, kde jsem měl toto řešení porovnat s komerčním řešením na testovacích datech, došlo k nepředpokládaným problémům s testovacími daty. Tuto část se tedy nepodařilo realizovat dle původního záměru. Rozsah bakalářské práce je větší kvůli zpracování dvou na sebe navazujících bodů a začlenění informací o open source Business Intelligence, které umožňují snazší orientaci v hlavním tématu práce. Rozšíření BI ve společnostech nahrává i dnešní pokrizová doba. Společnosti chtějí mít zprovozněné BI řešení, protože díky němu mohou získat konkurenční výhodu. Pokud jej ještě nemají a rozhodnou se jej nasadit, jsou pro ně důležité náklady, rozsah a výkon BI řešení, jednoduchost používání a rychlost nasazení. Dále si krize vymínila důraz na schopnost BI hledat rozvíjející se oblast trhů, na kterých může společnost profitovat. Open source BI řešení jsou pro společnosti zajímavé, protože snižují cenu akvizice, nabízí další rozvoj možností aplikace bez dodatečných nákladů za licence a umožňují vlastní úpravy programu specifickým potřebám společnosti. Mnoho společností si ale neuvědomuje, že správně zvolené BI řešení není všechno a že jednu z nejdůležitějších rolí hraje lidský faktor. Pro eliminaci tohoto rizika mohou společnosti využít podpory a konzultačních služeb od výrobce či prodejce BI řešení. Této možnosti ale využívá při nasazování BI řešení jen necelá čtvrtina společností.[Gartner 2010] Podařilo se mi porovnat open source BI nástroje a bylo zjištěno, že při volbě vhodného nástroje i z řady produktů open source není nasazení BI řešení ve společnosti ohroženo. Při správném nasazení open source BI ve společnosti může toto řešení být výhodnější a úspěšně nahradit komerční produkt. Na druhou stranu komerční produkty poskytují záruky, větší možnosti a zkušenější podporu. V dnešních dnech se začíná velmi prosazovat nasazení softwaru jako služby (SaaS). Bude zajímavé sledovat, jak na to společnosti zareagují a zda nikdo nepřijde o svoji pozici v oblasti BI programů. V druhé části práce jsem se zaměřil na otestování dvou BI produktů. Jeden byl komerční od společnosti Microsoft a druhý open source od společnosti Pentaho, který byl zvolen na základě výsledků první části práce (viz tabulka č. 10). V druhé části se bohužel nepodařilo porovnat obě řešení při práci se stejnými daty. To bylo zapříčiněno jak nároky na operační paměť BI řešení společnosti Microsoft, tak absencí souboru s daty pro vyzkoušení v aplikaci Pentaho BI Suite. Dále při práci s BI řešeními obou společností byla ověřena jejich funkčnost a použitelnost pro společnosti. Produkty nezklamaly, pracovaly bez větších problémů a poskytovaly cenné výsledky. Součástí práce je i přiložené CD s některými materiály, z kterých jsem čerpal, a které se zabývají touto problematikou.
39
Prostředí BI nástrojů na mě působila přehledně a jednoduše, bez zbytečně velkých nároků na uživatelské ovládání, a práce v nich byla intuitivní. Vyzdvyhnout musím řešení společnsoti Microsoft, kde je velkou výhodou fakt, že Microsoft Office je mezi uživateli značně rozšířen a znám. Prostředí řešení Pentaho BI Suite využívá webový prohlížeč a programovací jazyk Java. Probíhající vývoj, zaměřený především na funkcionalitu, způsobuje, že prostředí je graficky jednodušší. Na přehlednost prostředí to vliv nemá.
7.1 - Náměty na práci do příštích let Z mých zkušeností se musím v první řadě zmínit o testovacích datech. Příští práci bych začal právě u dat na testování. Jejich absence mi znemožnila detailněji otestovat části programů, které se zabývají prací s daty. Dále je zde možnost porovnání specializovaných BI nástrojů (psaných především v jazyce Java). Při jejich nasazení je více práce, protože každý nástroj může dodávat jiný autor či výrobce, poskytovat jiný interface a zapříčinit tak zdržení při implementaci. Na druhou stranu můžou takovéto sestavy nástrojů konkurovat cenou či kvalitou výsledků. V dalších letech se otevírá i možnost otestovat produkty při nasazení na (vzdáleném) serveru. Tím by se ověřila schopnost práce produktu jako služba (SaaS).
40
8 – Zdroje A1 - http://en.wikipedia.org/wiki/Business_intelligence A2 - http://www.systemonline.cz/business-intelligence/myty-kolem-open-source-pro-resenibusiness-intelligence.htm A3 - http://www.theserverside.com/discussions/thread.tss?thread_id=58237 A4 - http://www.talentfirstnetwork.org/wiki/images/9/93/Birtdownloads.PNG A5 - http://www.linux-mag.com/id/6856 A6 - http://www.itbusinessedge.com/cm/community/features/interviews/blog/who-is-usingopen-source-business-intelligence-and-why/?cs=35889 A7 - http://www.tdwi.org/Publications/BIJournal/display.aspx?ID=8263 B1 - www.opensource.org B2 - http://www.opensource.org/docs/definition.html B3 - http://www.opensource.org/licenses/alphabetical B4 - http://www.blackducksoftware.com/oss/licenses#top20 C1 - http://sourceforge.net/search/ C2 - http://cs.wikipedia.org/wiki/GNU_General_Public_License C3 - http://cs.wikipedia.org/wiki/BSD_licence E1 - http://community.pentaho.com/roadmap/ E2 - http://www.spagoworld.org/xwiki/bin/view/SpagoBI/Roadmap G - http://mediaproducts.gartner.com/reprints/sas/vol5/article8/article8.html Gartner2010 – zpráva společnosti Gartner s magickými čtverci shrnující rok 2009
41
9 – Obsah přiloženého disku Bakalarska prace.pdf
Moje práce o open source BI ve formátu PDF
OSBR - september 2009.pdf
zpráva o open source BI
PDI transformace.png
ukázka transformace v Kettle (část Pentaho BI Suite)
Jaspersoft BI datasheet.pdf
přehledné informace o Jaspersoft BI
Pentaho Open BI Suite.png
znázornění všech částí v open source Pentaho BI Suite
ETL nastroje.pdf
porovnání ETL nástrojů
SQL server.jpg
ukázka nároků virtualizace při práci s BI od Microsoftu
Microsoft BI.xlsx
testovací data společnosti Microsoft a ukázkový report
Pentaho technical whitepaper.pdf
technické informace o řešení společnosti Pentaho
Složka SAP + soubory
informace získané ze spolupráce se společností SAP
Složka Install + její obsah
zdrojové soubory pro Pentaho BI Suite
42