Katholieke Hogeschool Kempen Campus Geel Departement Handelswetenschappen en Bedrijfskunde 3de jaar Toegepaste Informatica
Evaluatie BI-tool: Pentaho
Business Intelligence
Dries VAN LOOY (3TI3) Wesley VAN VLERKEN(3TI3) Veerle VERHEYEN (3TI3)
Academiejaar 2010 -2011
Pentaho Achtergrondinformatie Pentaho is ontwikkeld door The Pentaho BI Project, dit bestaat uit een team van veteranen uit de Business Intelligence industrie. Het is een open source applicatie, die bestaat sinds 2004. Pentaho bestaat uit 5 componenten: • • • • •
Analysis Services Reporting Data Mining Data Integration Dashboard
Analysis Services Met behulp van de analyzer tool kunnen gebruikers data verkennen en analyseren om er zo meer inzicht in te krijgen. De resultaten worden duidelijk voorgesteld zodat je er in één oogopslag een goed beeld van krijgt. Met behulp van multidimensionele drag-and-drop elementen kan je zo een rapport of grafiek opbouwen . De nodige filter- en sorteeropties zijn voorzien.
Pagina | 1
Reporting In Pentaho word rapportering beschouwd als een essentieel deel van BI. Via deze rapporten kan je op een eenvoudige manier een overzicht krijgen van je informatie en deze delen met anderen. Deze rapporten kunnen opgesteld worden vanuit verschillende soorten databronnen zoals relationele, OLAP of XML-gebaseerde databronnen. Via een handige wizard kan je snel een rapport aanmaken en ook aan deze rapporten kan je grafieken koppelen, er zijn 15 verschillende aanpasbare soorten grafieken beschikbaar. Je kan deze rapporten ook exporteren naar formaten zoals HTML, PDF, Excel, RTF of plain text. Ook kan je het rapport rechtstreeks op de BI-server publiceren.
Data Mining Met Data Mining kan je verborgen patronen en indicaties van toekomstige trends ontdekken, hierdoor leer je de industrie beter kennen en kan je beter anticiperen op trends. Pentaho voorziet hiervoor een kant-en-klare oplossing met behulp van een wizard, maar geeft je ook de mogelijkheid om een eigen, aangepaste voorstelling te maken door gebruik te maken van Java objecten en Java Server Pages. Er zijn ingebouwde algoritmes voor deze data mining. Pentaho werkt hiervoor samen met WEKA (Waikato Environment for Knowledge Analyis), een open-source tool. De output kan je grafisch bekijken of kan je omvormen tot een rapport.
Pagina | 2
Data Integration (ETL) Pentaho Data Integration baseert zich op metadata bij het ETL proces. Het ondersteunt meer dan 30 database platformen en bestanden. Ook hier kan je gebruik maken van drag-and-drop elementen en is een grafische voorstelling mogelijk. Deze integratie maakt de informatie toegankelijk voor gebruikers en andere functies in de BI Suite. De Data Integration kan enorme hoeveelheden data verwerken.
Dashboards Dashboards geven je onmiddellijk een duidelijk zicht over informatie. Pentaho biedt grafisch erg mooie dashboards, ze zijn erg interactief en werken op basis van Adobe Flash. Deze kan je eenvoudig opbouwen aan de hand van wizards. Er wordt gebruik gemaakt van metrics en KPIs. Je kan onderzoek doen naar onderliggende details en uitzonderingen opzoeken.
Pagina | 3
De tool Interface Pentaho heeft een mooie, nette interface. Je krijgt de belangrijkste mogelijkheden voorgeschoteld. Achter elk van deze knoppen schuilt een wizard waarmee je onmiddellijk aan de slag kan gaan.
Gebruiksvriendelijkheid Er worden twee consoles gebruikt: één voor de gewone gebruiker en één om de administratieve kant. Een gewone gebruiker krijgt na het inloggen bovenstaand scherm te zien. De administrator kan databronnen beheren, gebruikers beheren, servers beheren en andere configuraties beheren.
Talen Je kan kiezen uit meerdere talen, hier zit echter een fout in, als je bijvoorbeeld Nederlands kiest, wordt niet alles vertaald. In het hoofdmenu krijg je dan: Nieuw Analyzer Rapport en New Report zoals je hieronder kan zien.
Pagina | 4
Kostprijs Uit de volgende grafiek kan je aflezen wat de kostprijs van Pentaho is tegenover gevestigde BI-tools. Zoals je kan zien zijn deze bijzonder laag.
Pagina | 5
Reporting & Dashboarding in Pentaho Ad hoc rapport Wizard om snel eenvoudige rapporten te maken. Weer wordt een gebruiksvriendelijk interface gehanteerd. Je kan previews bekijken en thema’s kiezen om de algemene opmaak te bepalen. Er zijn verschillende opties om de opmaak aan te passen en om de gegevens te sorteren. Ook hier blijft de relatie tussen de gegevens aanwezig en worden de gegevens dus dynamisch aangepast aan de veranderingen die je doorvoert. Analyzer Rapport Met deze wizard kan je snel een analyserapport samenstellen. Het voordeel aan deze wizard is dat je de structuur van de data niet moet kennen, je krijgt namelijk alle mogelijke tabellen en velden voorgeschoteld. De relaties worden steeds goed bijgehouden, waardoor de data dynamisch veranderd als je een veld toevoegt dat hiermee in relatie ligt. Zoals onderstaand voorbeeld, eerst zie je het resultaat als “Department” het hoofdcriterium is, daarna zie je het resultaat als “Region” het hoofdcriterium wordt.
Je krijgt een interactieve interface voorgeschoteld waar je nieuwe velden met behulp van drag-anddrop kan toevoegen. Je kan gemakkelijk filters, subtotalen en berekende velden toevoegen. Erg handig is dat je deze data ook snel kan omzetten naar een grafiek met onderstaande knop. Je kan ook kiezen uit verschillende soorten grafieken.
Pagina | 6
Het rapport of de grafiek die je hier maakt, kan je later in een dashboard implementeren. Ook kan je kiezen om de data te exporteren, dit kan naar .pdf, Excel of CSV. Metadata zoals auteur, gebruikte filters, … wordt mee opgenomen in deze bestanden zoals je ziet in onderstaand voorbeeld. De auteur was hier “Joe”.
Bij een .pdf krijg je deze informatie op de laatste pagina te zien als samenvatting, je ziet dat er hier geen filters gebruikt werden en er wordt duidelijk vermeld welke velden gebruikt werden.
Pagina | 7
In een Excel staat deze informatie bovenaan op de pagina.
Uitgebreid rapport Met een aparte tool kan je ook erg uitgebreid rapporten maken, hierbij kan je echt in de tabellen gaan snuffelen. Dit kan via een grafische omgeving maar ook via SQL-code. Verder kan je de opmaak van het rapport tot in detail bepalen. In deze rapporten kan je ook grafieken toevoegen. Hoewel dit erg complex en uitgebreid kan worden, wordt het allemaal toch via een gebruiksvriendelijke en intuïtieve manier aangesproken. Als je klaar bent met je rapport kan je dit publiceren op de server. Dashboards Je kan zelf je eigen dashboards uitbouwen waarvan je de indeling, het thema en de inhoud helemaal zelf bepaald. Voor de indeling kies je bijvoorbeeld 2x2, dus vier vakken verspreidt over je dashboard. Als thema kies je Cool Blue en als inhoud test je eens alle mogelijkheden uit. Dan krijg je ongeveer onderstaand voorbeeld.
Pagina | 8
Zoals je ziet kan je grafieken, tabelresultaten, websites en rapporten op je dashboard plaatsen. In de grafieken kan je gemakkelijk de schaal aanpassen of labels bij de x-as en y-as plaatsen om je weergave te verduidelijken. De tabelresultaten zijn een selectie die je zelf maakt, je kiest zelf welke velden je meeneemt en welke niet. Deze kan je dan naar eigen wens filteren en sorteren. Ook zijn er opties voor paging voorzien. In je dashboard kan je ook een website plaatsen, de website van het bedrijf bijvoorbeeld. Het rapport dat je rechtsonder ziet, was op voorhand aangemaakt, je kan eigen rapporten dus eenvoudig implementeren.
Vergelijking Pentaho vs Qlikview Qlikview
Pentaho
Installatie
Gemakkelijk en snel
Duurt lang, veel ingewikkelder door gebruik van meerdere servers
Intuïtieve interface
Duidelijk, mooi
Duidelijk, mooi
Documentatie
Tutorial van 227 pagina’s op de website. Veel informatie op internet.
Bij het downloaden krijg je een account voor toegang tot de knowledge base en een handleiding/tutorial van 65 pagina’s.
Scripting
Eigen scriptingmethodes
Alles grafisch of via SQL-code
Gebruiksgemak
Veranderingen zijn snel gemaakt, je kan je selectie verfijnen gewoon door enkele velden aan te duiden
Als je aanpassingen wilt maken, moet je meestal eerst naar een ander venster, terug naar de wizard. Simpele opties zoals filteren en sorteren gaan wel direct.
Mobiele versie
Ja
Nee
Databronnen
Access, Excel, XML, ODBC, OLEDB, ERP, …
Access, Excel, XML, CSV, JDBC, RSS, …
In Magic Quadrant Gartner
Ja
Nee
Open source
Nee
Ja
Gratis
Nee
Nee
Pagina | 9
Bevindingen Forrester & Gartner Forrester Results Of The Forrester Wave™: Open Source Business Intelligence (BI), Q3 2010 “If you seek a full BI suite, then the options are BEE, Jaspersoft, Pentaho, and SpagoBI. Some critical components of enterprise-grade BI capabilities like integrated metadata management are not even fully addressed by the open source community at this point.” “Pentaho takes it up yet another notch with the availability of even more components in its community version.” “Using this approach for Forrester's 157-criteria evaluation of open source BI vendors, we found that Actuate BIRT led the pack because of richness of reporting functionality. Jaspersoft Enterprise, SpagoBI, Pentaho Enterprise, and Pentaho Community are close behind” Gartner Magic Quadrant for Business Intelligence Platforms 2009 Although Pentaho did not get placed in the actual Quadrant they did receive praise from Gartner: “However, while they don’t meet the revenue requirement, Pentaho has emerged as viable player in the BI platform market and as such we invited this firm to take part in the Magic Quadrant user survey. This open source vendor provides comprehensive BI platform capabilities that is comparable to traditional BI platform vendors. A key part of this vendor’s strategy is to forge OEM relationships with commercial independent software vendors (ISVs) looking to easily embed BI functionality at a low price point. Pentaho enables ISVs to OEM open-source BI components without being bound by the GNU General Public License (GPL) terms and conditions. Given its subscription-based model, this vendor need to provide exemplary support. This was in evidence in the MQ reference survey, Pentaho scored strongly on the customer support question — higher than any of the megavendors.” Additionally, the Gartner report goes on to summarize the Pentaho platform, which is very comprehensive and feature-rich considering its open-source foundation: “Pentaho, after just four years in existence, has put together a comprehensive open-source BI platform that includes data integration and data mining capabilities. In 2008, Pentaho was noticeably more aggressive, openly competing against traditional BI platform vendors. Like Jaspersoft, Pentaho is affordable and also offers a subscription-based model that avoids an initial large payment for the software license. Some of the significant features Pentaho introduced in 2008 include an automatic table designer that analyzes relational schemas and data patterns, performs a cost-benefit analysis of aggregation at different levels, and generates and populates those aggregate tables. Despite a handful of large customers, Pentaho reference survey respondents more frequently indicated that they had more departmental deployments (versus enterprisewide) and smaller data volumes compared with the other vendors.”
Pagina | 10
Conclusie Al bij al is Pentaho een krachtige en gebruiksvriendelijke BI-tool. Alles wordt grafisch weergegeven, wat het gemakkelijk maakt om mee te werken. Pentaho hoeft zeker niet onder te doen voor andere BI-tools zoals bijvoorbeeld Qlikview. Het feit dat het open source software is, is zeker een voordeel voor dit product. Op deze manier verschijnen er namelijk geregeld updates voor de software, en blijft de prijs lager dan traditionele BI-tools. Je betaalt geen kosten voor licenties en onderhoud. Maar wel voor training en support. Het is een zeer gebruiksvriendelijke en intuïtief systeem, maar de wizards maken het soms onnodig moeilijk. Anderzijds gebeurt alles grafisch of via SQL-code, waar QlikView zijn eigen scriptingsmethodes heeft. De dashboards van QlikView zijn echter veel uitgebreider. De meningen over welke de beste tool is, zijn binnen ons team verdeeld. Ze vullen elkaar perfect aan in elkaars voor- en nadelen. Een combinatie van de twee zou de perfecte BI-tool kunnen vormen.
Bronnen http://www.pentaho.com/ http://blogs.forrester.com/boris_evelson/10-08-10results_forrester_wave%E2%84%A2_open_source_business_intelligence_bi_q3_2010 http://sherlockinformatics.com/wordpress/business-intelligence-technology/pentaho-receivesattention-from-gartner http://www.enixe.nl/Upload/Productvergelijk/enixe-it-solutions-BI-Platforms-2009.pdf
Demo’s Als je meer wil zien van hoe Pentaho werkt en welke mogelijkheden er zijn, vindt je hieronder twee links naar demo's. Eentje gaat over rapportering, de andere gaat over dashboarding. Video - Reporting with Pentaho http://www.youtube.com/watch?v=FGdyPLjLjIk Video - Pentaho Dashboard Demonstration http://www.youtube.com/watch?v=Yu_8duRM4PA
Pagina | 11
Presentatie
Inhoud • • • • •
Voorstelling Pentaho Achtergrondinformatie Mogelijkheden Vergelijking met QlikView Conclusie
Pagina | 12
Voorstelling Pentaho • Open source BI-tool • Bestaat sinds 2004 • bestaat uit 5 componenten: – Analysis Services – Reporting – Data Mining – Data Integration – Dashboard
Voorstelling VoorstellingPentaho Pentaho • Analysis Services Data verkennen & analyseren
Pagina | 13
Voorstelling Pentaho • Reporting Eenvoudig overzicht van je informatie
Voorstelling Pentaho • Data Mining Patronen en indicaties van toekomstige trends
Pagina | 14
Voorstelling Pentaho • Data Integration Baseert zich op metadata bij het ETL proces
Voorstelling Pentaho • Dashboards Duidelijk en interactief zicht over de informatie
Pagina | 15
Achtergrondinformatie • Interface • Gebruiksvriendelijkheid (2 consoles)
Achtergrondinformatie • Talen • Kostprijs
Pagina | 16
Mogelijkheden • Ad hoc rapport Eenvoudige rapporten
• Analyzer rapport
Mogelijkheden Snel omzetten naar grafiek:
• Export-functies (.pdf , Excel, CSV)
Pagina | 17
Mogelijkheden • Export-functies (.pdf , Excel, CSV) • Uitgebreid rapport • Dashboards
Vergelijking met QlikView
Pagina | 18
Conclusie Voordelen: • Krachtig & gebruiksvriendelijk • Hoeft niet onder te doen voor andere BI-tools • Geen kosten voor licenties & onderhoud Nadelen: • Wizards maken het soms lastig werken
Conclusie Voordelen: • Krachtig & gebruiksvriendelijk • Hoeft niet onder te doen voor andere BI-tools • Geen kosten voor licenties & onderhoud Nadelen: • Wizards maken het soms lastig werken
Pagina | 19
Bedankt voor uw aandacht! Zijn er nog vragen?
Pagina | 20