s s e n i Bus e c n e g i l l e t n I e n i z a g a M
Big Data zvýší potenciál obchodní nabídky až desetinásobně
Nesmělé seznamování firem s Big Daty končí, nastal čas pro velké projekty
Slovak Telecom – externí datová monetizace v praxi
červen 2016
Business Intelligence
červen 2016
obsah čísla
Magazine Nastal čas pro…Big Data
4
Big Data zvýší potenciál obchodní nabídky až desetinásobně
5
Jak banka úspěšně oslovila rodiče a dovolenkáře
7
Externí datová monetizace v praxi společnosti Slovak Telekom
9
Nesmělé seznamování firem s Big Daty končí, nastal čas pro velké projekty
11
Oracle Big Data Discovery “The Visual Face of Big Data”
14
Časopis pro CIO, CFO a profesionály v oblasti Business Intelligence. Redakce: Alice Zápotocká
[email protected] Barbora Nykodýmová Grafické zpracování - UNIFER alfa a.s. Adastra, s.r.o. Karolinská 654/2 186 00 Praha 8 Tel.: +420 271 733 303 www.adastra.cz
2
úvodní slovo
Milé čtenářky, milí čtenáři, opět se setkáváme s dalším vydáním časopisu Business Intelligence Magazine, které tentokrát vychází v nejdelší dny v roce. Aktuální číslo věnujeme celé tématu Big Data a mne nesmírně těší, že tomu tak je. Dovolte mi to osvětlit krátkým příběhem. Jsou tomu již téměř tři roky, kdy se u nás v Karlíně v pátém patře, kde Adastra sídlí, začala rodit stejnojmenná kompetence. Její vznik nebyl náhlý ani neuvážený, nýbrž byl odpovědí na narůstající potřeby a požadavky přicházející z trhu, které jsme zaznamenávali. Tak jsme ve chvíli, kdy se o Big Datech v našich krajinách vědělo ještě pramálo, postupně začali pronikat do netušených možností jejich využití a dodnes poodhalujeme jejich skrytý potenciál hovořící ve prospěch rozmanitých příležitostí v různých oblastech podnikání.
ni s našimi nástroji a kompetencí. Stejně tak jako nastává posun na trhu, také u nás v Adastře jsme se jali fenomén Big Data řádně uchopit i po formální stránce. V aktuálním čísle Business Intelligence Magazine se tudíž můžete blíže seznámit a přečíst si článek i rozhovor s Big Data Competency Leaderem Adastry, Jakubem Augustínem. Ten stál v Adastře u zrodu této kompetence a od samého počátku ji pomáhal společně s rozrůstajícím se týmem formovat do stávající podoby. Všem jim patří zasloužený dík a mne nyní nezbývá než vaši pozornost svěřit právě týmu naší kompetence Big Data, který vás následujícími řádky magazínu provede. Příjemné počtení. Alice Zápotocká marketingová ředitelka Adastra, s.r.o.
Nyní se nacházíme ve zlomovém období, v dobrém, kterého si všímáme my i naši klienti. Trh uzrál a po řadě drobných projektů a studií, které problematiku Big Dat zatím jen „oťukávaly“ a představovaly možnosti jejich využití, nastává konečně čas přejít k velkým projektům s velkými daty a významným dopadem do stávajícího fungování firemních procesů. Jsme rádi, že můžeme být u toho plně připraveni a být nápomoc-
3
Nastal čas pro…
Big Data
Na začátku roku proběhl v Národní technické knihovně již druhý ročník konference Primetime for…Big Data, na které jsme ani letos nemohli chybět a opakovaně jsme se zapojili do programu. Za Adastru mezi řečníky vystoupil Jakub Augustín, profesionál v dané problematice a zároveň Big Data Competency Leader. Jeho přednášku s titulem „Big Data – Pojďme konečně sklidit i vysoko visící ovoce!“ si přišlo do sálu poslechnout více než 200 účastníků setkání z řad IT profesionálů, finančních i vedoucích pracovníků. Jakub se zaměřil na problematiku Big Dat s orientací na využití jejich potenciálu pro marketingové a prodejní činnosti. Neopomněl také uvést konkrétní příklady z praxe, kde díky datům firmy i oddělení dospěly lepších výsledků, a vybídl publikum k započetí systematické práce s daty. Rok 2015 byl podle něj zlomový a s daty se postupně začíná pracovat obdobně jako při sběru jablek. Rozdíl je v tom, že se nezačíná od koruny, ale od spodu, tedy nejprve s analýzou jednodušších informací, kterých mají firmy velké množství, a až poté postupně s velkými daty „visícími výše na stromě“. Závěrem tedy nezbývá než dodat slovy Jakuba:
„Big Data není jen buzzword – nebojte se do nich pustit!“
4
Autor: redakce Foto: Blue Events
Big Data zvýší potenciál obchodní nabídky až desetinásobně
Jistě sami nemáte rádi reklamní nabídky, které hltí vaši emailovou schránku, nebo vám je nabízí prodejci po telefonu a které vůbec neřeší vaše aktuální potřeby, případně jim zkrátka chybí potřebný apel k akci. A teď z obchodního hlediska vaší firmy: Jaký z toho máte pocit, když tušíte, že vaše obchodní snaha ve výsledku může přinést jen mizivou vidinu úspěchu? Pomohou vám tzv. velká data (Big Data), jejichž analýzou dokážete rozlišit i nepatrné rozdíly v chování zákazníků, a lépe tak personalizovat vaše sdělení. Dříve řešení za sta miliony, dnes za desetinu Ačkoliv postupy pro moderní práci s daty jsou již delší dobu připraveny a existují i efektivnější a cenově dostupnější platformy, v českém prostředí zatím není práce firem s velkými daty příliš rozšířenou činností. Je to až paradoxem, uvědomíme-li si fakt, že v minulosti náklady na uložení a zpracování dat mnohdy takřka převyšovaly jejich vlastní hodnotu a přínos v praxi a samotné hardware i software řešení stálo bezmála i sto milionů korun. Dnes
můžete získat srovnatelné řešení za pouhou desetinu nákladů. Finance, telekomunikace i online prodej - ti všichni už si s Big Daty pohrávají
technologickou infrastrukturou, případně firmy pracující s množstvím informací o klientech. Data třetích stran dovolí nahlédnout hlouběji do křišťálové koule
Vezměme si například bankovní sektor. Velké banky denně generují miliardy údajů! Informace o platbách, pokynech z internetového bankovnictví, zůstatcích na účtech, údaje o dalších produktech využívaných klienty či záznamy z call center. Celou řadu dat musí tyto instituce navíc uchovávat ze zákona i několik let. Proč by ale měla zůstat ležet ladem? Banky si samy postupem času uvědomily, že z nich mohou mnohé vytěžit a zároveň díky nim lépe cílit a prodávat své další produkty. Efektivní, nemyslíte? Navíc se mění i požadavky managementu – zpětný reporting už sám o sobě nefrčí, prioritou je spíše vidět do budoucna a umět lépe předvídat potenciální situace.
Data dnes už neznají hranice. Trendem je jejich propojování s údaji třetích stran – informacemi z živnostenských registrů, obchodního rejstříku, sociálních sítí či telekomunikačních operátorů. Vezmeme-li si opět zmiňovaný příklad bankovního sektoru, banka díky takové datové synergii dokáže například zjistit, kdo s kým obchoduje a kdo komu platí. Najednou je pro ni poměrně snadné se dovtípit, že je-li firma XY v insolvenci, budou její dodavatelé velmi pravděpodobně v blízké době řešit výpadky ve svých finančních tocích. A jaká bude reakce banky? Přispěchá v tu chvíli s vhodnou nabídkou úvěru, aby obchodní výsledky mohly nadále růst.
Přínos velkých dat však nemusí náležet jen velkým firmám. Užitečnost v nich naleznou i středně velké společnosti s rozsáhlou výrobní či
Přesné zacílení kampaní musí stát na pevném základu. Díky kvalitní analýze získaných dat může narůst úspěšnost obchodních nabídek
Rychlost zpracování dat je klíčová
5
až desetinásobně, což jistě stojí za úvahu. Výzvou je ale na druhé straně také rychlost zpracování údajů. Podívejme se na koloběh: miliony bankovních údajů, které proudí datovými toky sem a tam, jsou zpracovány v průběhu jednoho až tří dnů do čitelné a hodnotitelné podoby. Tu si z nich vezme část marketingové oddělení, tu call centrum pro obchod. Tři měsíce práce uplynou a snažení je u konce. Výsledek? V mnoha případech pouhých pár procent do plusu. Během té tahanice o data a jejich zpracování měl však mezitím klient, kterému jsme šili nabídku na míru, mnoho času se rozhodnout úplně jinak, třeba pro konkurenční řešení. Naše práce tak přijde vniveč. Technologie současnosti umožňují tyto nekonečné termíny zkrátit a nabídnout tak poradcům a obchodníkům informace takřka v reálném čase. Utopie? Nikoliv. Velké společnosti typu bank se takto už pomalu učí tomuto novému obchodnímu trendu budoucnosti: umění vnímat drobné nuance v chování zákazníka, reagovat a obratem je proměnit v obchodní příležitost. Velká data = velké sousto pro food marketing? Obchodní řetězce a supermarkety jsou jednou z dalších oblastí, které mohou těžit z přínosů práce s Big Daty. Dokáží totiž vygenerovat velké množství užitečných informací například z dat na účtenkách. Díky jejich analýze pak mohou nabídnout ve vhodnou dobu dobře zacílené akce a slevy na své zboží. Opět si uveďme jeden příklad: zlevníte chléb. Díky analýze dat zjistíte, že velká část zákazníků si k němu ale koupí také máslo nebo šunku. Ve výsledku si už snadno vykalkulujete, že je tedy zbytečné zlevňovat zároveň také máslo či šunku – připravili byste se zbytečně o plnou marži.
6
Data ale nepomáhají řídit jen akce a slevy. Jejich využití je účelné také v spořádání potravin v regálech supermarketů. Zboží, které se kupuje nejčastěji pospolu, chytrý obchodník umístí naopak nejdále od sebe a přinutí tím zákazníka přejít alespoň přes část prodejny. Přeci si neodnese pouze kostku másla, šunku a pecen chleba v poloprázdném košíku, že? Investice do zpracování dat se zkrátka vyplatí – náklady klesají a výnosy rostou. To přeci chceme všichni, nebo ne? Třeba si říkáte: „To mi může dojít i selským rozumem.“ Možná, ale má to i svá úskalí. Bude-li například pršet, lidé si koupí (logicky) více deštníků. Ano, avšak předpokladem (závěrem datové analýzy) je, že bude pršet minimálně dva dny v kuse. Pak teprve prodej vzroste a má smysl umístit deštníky třeba vedle pokladen. Podobné závěry vám nabídne pouze systém, který pracuje s miliony dat o zaúčtovaných položkách a zároveň o údajích například právě v tomto případě o počasí.
kat nové klienty, stát se jim skutečným partnerem a poskytovat službu se skutečně vysokou přidanou hodnotou. Investice do systémů pro zpracování velkých dat má tedy velmi vysokou návratnost. Produktové portfolio je možné efektivněji řídit a poskytovat přidanou hodnotu v okamžiku, kdy ji potenciální zákazník skutečně chce využít. Zkrátka řešení k nezaplacení, které vám pomůže pracovat s vhodnými daty ve správný čas. Souhlasíte? Autor Jakub Augustín Big Data Competency Leader, Adastra
Příklad z praxe na závěr Potenciál práce s velkými daty a jejich využití si dobře uvědomuje i jedna z největších bank na českém trhu – ČSOB. Její projekt HledaSeObchod.cz nabízí zájemcům možnost označit lokaci, kde postrádají určité obchody nebo služby. Systém je jednoduchý, umístíte špendlík na mapu a podle počtu hlasů lze poté sledovat odezvu a vhodnost podniku pro danou lokalitu. Zapojíme-li informace třetích stran a vše pak necháme přechroupat funkčním datovým systémem, jednoduše pak vygenerujeme ty nejvhodnější možnosti. Systém zhodnotí občanskou vybavenost, konkurenci v okolí, hustotu obyvatel i pohyb lidí (tzv. heat mapy) a konkrétní projekty pak je možné nabídnout menším podnikatelům v okolí. Banka tímto může zís-
V Adastře působí od roku 2011, kdy nastoupil na pozici konzultanta v divizi banking. Zhruba od roku 2013 postupně začal budovat novou Big Data kompetenci, jíž je v současnosti lídrem. Má rozsáhlé zkušenosti s datově orientovanými projekty pro významné klienty z bankovního sektoru v oblastech Data Warehousing, Master Data Management, datová migrace a Data Governance. V rámci kompletního redesignu datového skladu působil také jako konzultant u klienta v Rusku.
Jak banka úspěšně oslovila rodiče a dovolenkáře
případová studie
Vědět, jaké má zákazník potřeby, bylo vždy požadovaným cílem většiny firem nejen v bankovnictví. Chtějí získat více informací a pokud možno nahradit plošné kampaně za lépe cílené marketingové akce na menší skupiny klientů s podobnými potřebami. Současné možnosti marketingu dovolují využít tzv. „event driven marketing“, kde impulsem pro oslovení zákazníka je uskutečnění či naopak neuskutečnění konkrétní události. Pokud totiž víme, v jaké životní situaci se zákazník nachází a vhodně kampaň a nástroje načasujeme, můžeme si tím výrazně napomoci při prodeji našich výrobků a služeb. V úvodu jsme popsali koncept, který ve své podstatě není ničím neznámým. Odborná sféra o něm ví už nějakou dobu a dokonce se i někde na základě strukturovaných dat realizuje. Co je tedy nového? Postupně se do popředí dostává využití nestrukturovaných dat spojené s rozvojem v oblasti Big Dat. Technologie už nejsou jen finančně dostupné (celé řešení pořídíte i do milionu korun), ale napomáhají také komplexnímu zpracování dat. Textová analýza v českém jazyce nebo nástroje pro převod řeči už tedy nejsou utopií. Jen pro upřesnění. Jedním ze základních cílů textové analytiky je vyhledávání konkrétních informací v daném textu a jejich převod do strukturované podoby. V oblasti bankovnictví tedy vyhledáváme informace například v popisech transakcí z internetového bankovnictví, poznámek bankéřů při jednání s klienty na pobočkách, emailů či automaticky převedených hovorů z call center. V blízké budoucnosti se možná dočkáme i možnosti převádět informace z hlasových záznamů přímo do formulářů. Alespoň už se na tom pracuje.
7
Jak banka oslovila rodiče a dovolenkáře? Nedávno jsme realizovali zakázku pro jednu tuzemskou banku. Naším cílem bylo nalézt nové a dosud nevytěžené informace o klientech a promítnout je do využití konkrétních bankovních produktů na míru. Zpracovávali celkem tři typy údajů: zápisky osobních bankéřů, popisky příkazů v internetovém bankovnictví a identifikátory transakcí na platebních kartách.
Měsíčně tisíce nových klientů Celá realizace převodu dat z nestrukturované do strukturované podoby a identifikace cílových skupin proběhla během jediného měsíce. Systém je však schopen pravidelně identifikovat tisíce takových klientů každý měsíc a u event driven marketingu je právě správné načasování naprosto klíčové pro úspěch kampaně.
Identifikované cílové skupiny byly celkem dvě. První, menší, byli rodiče dětí, kteří se během září ocitli ve finanční tísni. K jejich vytipování posloužila analýza klíčových slov, neboť banka, u níž už klient nemá sjednán konkrétní produkt pro děti, o existenci jejich potomků netuší. Druhou skupinu pak tvořili dovolenkáři, tedy lidé, kteří si zaplatili zájezd, letenku nebo si koupili cestovní pojištění. Těmto klientům byla nabídnuta kreditní karta pro neplánované výdaje jako finanční rezerva.
Textová analytika je tedy schopna identifikovat sice relativně malý počet případů, zato kontinuálně dle zadaných intervalů, což se při desetinásobné míře konverze jistě vyplatí. Navíc je možné uvedené řešení relativně snadno modifikovat a rozšířit i na jiné oblasti než jsou marketingové aktivity. Potenciál mají například pro oblast risku nebo vymáhání a významně mohou napomoci také při zadávání úloh call centru.
Výsledek? Celková konverze činila ve finále 6 – 7 %, což pro srovnání znamenalo dvojnásobný nárůst oproti kombinaci klasického direct mailu a volání z call centra. Přitom odhadovaný prodejní potenciál u poloviny této skupiny (získané klasickým modelem) byl cca 5 promile. Banka tedy dokázala zvýšit úspěšnost prodeje více než desetinásobně. Autor Dagmar Bínová Big Data Science Leader, Adastra Dagmar Bínová se práci s daty věnuje celou svou profesní kariéru, z čehož již více než 9 let pod hlavičkou Adastry. Její specializací je v posledních letech zejména pokročilá analýza velkých dat a jejich využití. Zaměřuje se také na realizaci business úloh a tvorbu data miningových modelů pro marketing a CRM a také risk management v bankovnictví a telekomunikacích. Vedle svých pracovních aktivit se věnuje lektorování a přednáší na odborná témata.
8
Externí datová monetizace v praxi společnosti Slovak Telekom Práce s Big Daty v nejrůznějších společnostech velmi často probíhá v typickém sledu – identifikace zajímavých dat, uskladnění ve vhodných technologiích, následné využití na interní (většinou kampaňové) účely. Po vybudování dostatečné „confidence“ při interních využitích začínají společnosti uvažovat, jak velkou potenciální hodnotu přeměnit na reálnou monetární hodnotu, teda monetizovat externě. Zpočátku toto probíhá formou na míru šitých analýz pro jednotlivé velké zájemce – velké korporace či stát. Vrcholem této pomyslné pyramidy datové monetizace je pak široce dostupné řešení, které umožní datům vyprávět svůj příběh širokému spektru firem či institucí.
se Market Locator. Market Locator odemkl potenciální hodnotu Big Dat ve Slovak Telekomu tím, že umožnil analytikům různých společností opřít se o „hard-data“ o výskytu a profilu obyvatelstva, například při plánovaní nové pobočkové sítě.
Market Locator ve Slovak Telekomu
Výsledné řešení Market Locator je symbiózou analytiky na jedné straně a schopnosti reagovat na tento insight prostřednictvím multi-kanálového cíleného marketingu.
V Adastra Partnering jsme spolu se Slovak Telekomem (člen Deutsche Telekom) tohoto pomyslného vrcholu pyramidy dosáhli a jmenuje
Na druhé straně umožňuje Market Locator cílený marketing, na jaký jsme si už zvykli v online světě – tedy možnost doručit marketingový obsah nejen správné osobě ale i na správném místě. Slovak Telekom tak dnes nabízí nad svými daty self-service službu vypovídající o fyzickém světě to, co Google Analytics nebo Google Adwords vypovídají v tom online světě.
případová studie
B2B zákazníkům telekomunikačního operátora umožňuje jednak analytiku oblastí na heat-mapách, jakož i cílení kampaní na základě množství atributů, kterými jsou socio-demografické, atributy týkající se mobilního hardware a využívaných služeb, cestovních návyků, zodpovědnosti při placení a mnoho jiných. Řešení bylo navíc postaveno tak, aby podporovalo různé komunikační kanály, ať už SMS, email, přikládané letáky k fakturám (přílože) nebo také digitální billboardy. Cesta k úspěchu Dopracovat se k úspěšné monetizační strategii svého datového bohatství znamená nevyhnutelnost práce v oblasti agregace a anonymizace dat. S klientskými daty je nutné velmi obezřetně pracovat nejen z legislativního hlediska ale i z PR pohledu vnímání zákazníků. Rozsáhlá část iniciálního projektu
9
Market Locator na Slovensku byla zaměřená právě na soulad s národními a mezinárodními právními a etickými normami. Kromě čistě právního hlediska jsme se zaměřili také na PR stránku a postavili naši datově-monetizační strategii v telco světě na jasném „public good“. Výsledky a příležitosti Kromě profitability už v prvním roce a neustále rostoucímu výnosu (který u menších společností přispívá až 50 % celkového telco wallet) se podařilo ukázat multi-operátorské schopnosti řešení. Aktuálně je
na slovenském trhu rozpracované připojení do Market Locator také Orange a O2, díky čemuž budou uživatelé mít možnost z jediného řešení oslovit téměř celou populaci krajiny. Dalším krokem je vytvoření globálního řešení, které smaže hranice států z pohledu porozumění výskytu obyvatelstva a cíleného marketingu. Pokročilé diskuze probíhají v Čechách, Maďarsku, Polsku, Černé Hoře, Bulharsku, Rumunsku a Kanadě. Pro telco s cca 2 miliony zákazníky je toto příležitost dosáhnout bottom-line impact okolo 2 milionů euro ročně v krátkém čase.
Be Next – hledáme partnery Market Locator má globální ambice a neustále hledáme telco partnery ve světě. Nakolik řešení poskytujeme na revenue share bázi, není tato spolupráce zatížená obrovskými CAPEX a jelikož se jedná o existující řešení, je k dispozici i komplexní marketingový a prodejní balík. Typicky se díky těmto zkušenostem dá kompletní product launch dosáhnout za méně než 5 měsíců. Více o Market Locatoru si přečtěte na www.marketlocator.sk.
O Adastra Partnering Adastra Partnering je součástí skupiny Adastra od roku 2014 společně s dalšími společnostmi: Adastra, Ataccama, Reporters a Adastra Business Consulting. Pod křídly Adastry se Adastra Partnering soustředí primárně na unikátní softwarová řešení, vývoj a dodávku SaaS (Software as a Service) řešení a partnerskou spolupráci s telekomunikačními operátory. V rámci svých stávajících služeb poskytuje komplexní poradenství v oblasti správy a optimalizace telekomunikačních nákladů (klíčový produkt Callinspector), end-to-end renegociaci telco kontraktů a také řadu produktových řešení jako právě zmiňovaný Market Locator pro cílený mobilní marketing. www.adastra-partnering.com www.marketlocator.sk
10
Nesmělé seznamování firem s Big Daty končí, nastal čas pro velké projekty
Rozhovor s novým Adastra leaderem pro Big Data Competency, Jakubem Augustínem
Není tomu ani tak dávno, kdy se v Adastře začala rodit nová kompetence zaměřená na Big Data. Po řadě dílčích projektů nyní trh uzrál a firmy se postupně chystají uchopit velká data komplexně a maximalizovat jejich přínos pro vlastní byznys. Jak tuto výzvu vnímá Jakub Augustín, nový Big Data Competency Leader, a nač by se trh i firmy měly v následujících měsících připravit? Po čtyřech letech působení v Adastře jste se nyní stal novým Big Data Competency Leaderem. Je pro vás tato pozice něčím nová? Co jí předcházelo? Zase tak úplně nové to pro mě není. Zhruba dva roky nazpět, kdy jsem byl ještě konzultantem banking divize, zasáhla i nás, podobně jako řadu dalších firem, recese. Práce bylo méně a bylo jasné, že se musí něco začít dít. Právě v té době se ale v Adastře rozhodlo, a to dodnes oceňuji, že místo, aby se snižovaly stavy, začneme dělat nové věci a vstoupíme na nové trhy. Tak jsem vlastně dostal příležitost ještě jako konzultant pracovat na projektu v Rusku… V Rusku? To mohla být zajímavá příležitost. Sám bych si Rusko jako pracovní destinaci asi nevybral, jak se ale později ukázalo, byla to skvělá zkušenost. Měli jsme u klienta pracovat na projektu týkajícího se datových skladů, což je jedna z klíčových kompetencí Adastry. Zatímco ale většina českých bank už datové sklady v té době měla, ruský trh je v tomto za námi. Dostal jsem tak příležitost pracovat na komplexním projektu od samotného začátku. Pamatuji si každopádně vtipnou situaci, kdy jsme prve ke klientovi přijeli realizovat audit datového skladu a záhy vyšlo najevo, že vlastně žádný datový sklad zatím nemají… Ve výsledku ale projekt dopadl dobře a klient byl spokojený. Mně samotnému přinesl mnoho nového a navíc mě utvrdil v tom, že odbornost profesionálů z Adastry je opravdu na světové úrovni. Pak jste se vrátil a začal se věnovat Big Datům? Po mém návratu do Čech ještě stále na trhu doznívala recese. Big Data byla v té době úplnou novinkou. Ještě zhruba dva roky nazpět byla něčím, co na českém trhu nebylo etablované, každopádně to byla zajímavá oblast s potenciálem. Tak jsem
11
se jí vedle své stávající práce začal věnovat. Ze začátku to byla spíše „one man show“, pak ale přibývali noví lidé a v Adastře vznikla samostatná Big Data kompetence s vlastními projekty. Moje pozice se tedy vyvíjela postupně. Jaké jsou vaše stávající vize a cíle v této nové pozici? Beru to jako velký závazek i výzvu. Abychom si my mohli hrát s Big Daty, ostatní kolegové se musí i nadále starat o projekty, které byly a jsou pro Adastru stěžejní. Musíme dokázat, že Big Data nejsou pouze marketingový „buzzword“, ale že se za nimi skrývá skutečný byznys. Navíc nyní přesně nastává ta doba, kdy se Big Data začnou naplno používat v praxi. Doposud o nich všichni hovořili, představovaly se menší projekty a studie, ale zatím do toho firmy nešly naplno. Aktuálně už máme u několika našich klientů fázi představování za sebou a postupně se rozjíždějí vlastní velké projekty implementující Big Data technologie Opravte mě, jestli se mýlím, ale pro řadu firem velká data zase nemohou být takovou novinkou. Jejich systémy protéká obrovské množství informací, s nimiž musí pracovat. Odkdy se vůbec začalo hovořit o Big Datech jako pojmu a jeho potenciálu? Big Data jsou poměrně nešťastný název. To že má někdo mnoho dat ještě totiž neznamená, že čelí problematice zvané Big Data. Například banka má pro své internetové bankovnictví datový sklad, který se postupně plní a v určitých periodách se data zpracovávají. My v rámci Big Dat ale pracujeme s takovými datovými zdroji, které banka sama nedokáže řádně uchopit a vytěžit, protože jsou nejen objemná, ale také se rychle vytvářejí nebo jsou nestrukturovaná. Uvedu ještě příklad týkající se analýz nákupního koše. Známe je nějakých deset let, ale doposud je nikdo pořádně nedělal kvůli vysokým nákladům. Díky novým dostupnějším technologiím je to ale konečně možné. Navíc jsme také schopni posouvat reakční dobu (například u nabídky produktů) z měsíců či dní na reálný čas a rychle tak reagovat na aktuální životní události a potřeby klientů – například narození dítěte či rekonstrukce bytu. Tomu se říká event driven marketing. Postupně tak budou pojmy jako textová analytika, prediktivní modelování nebo geoanalýza v souvislosti s Big Daty stále běžnějšími metodami, což je i náš cíl. Big Data jsou tedy výzvou sama o sobě. Ve kterých konkrétních oblastech vnímáte jejich největší potenciál? Marketing je určitě jednou z klíčových oblastí. Chtěli bychom ho ale posunout více z prodeje produktů směrem k poskytování služeb, za čímž se skrývá právě reakce na životní události v reálném čase, ať už potřebné
12
informace zjistíme z textu, hlasových dat či aktivity na Facebooku. S tím pak souvisí také lepší možnosti mikrosegmentace. Další oblastí využití je pak například risk management. Vedle toho stojí samotné technologické řešení. Vidím to u našich klientů, kteří mají dat opravdu více než mnoho. Například segment telca s přechodem na 4G síť generuje stále objemnější množství informací, a o to více pak nastávají technologické výzvy, jak tato data vůbec zpracovávat. V samotných technologiích je ukrytý velký potenciál, jen jej technologicky uchopit. Vraťme se k vám. Můžete přiblížit některý z vašich aktuálních projektů? Například nedávno jsme dokončili projekt textové analytiky, na jehož základě jsme na zmiňovaném konceptu event driven marketingu postavili úplně nový marketing pro jednu z největších tuzemských bank. Dodnes firmy běžně praktikuji „kobercové nálety“, kdy rozešlou tisíce nabídek klientům s dotazem, jestli náhodou nechtějí kreditku. Náš projekt se cíleně zaměřil na konkrétní mikrosegmenty, mimo jiné lidí, kteří se právě chystají na dovolenou, což dokážeme z dat vyčíst, a cíleně jim nabídnout vhodné produkty. Podařilo se nám tak zvýšit odezvu na kampaň několikanásobně, což je skvělé. Předtím jsme třeba dělali ještě takovou zajímavou věc, kdy jsme z webových log predikovali pohlaví a věk uživatelů, kteří na ně klikají. To je možné? K tomu jsou přeci potřeba nějaká další vstupní data. Jde to. Máme-li vzorek uživatelů, kteří o sobě například uvedli, že jsou ženy ve věku 30 let (třeba 2 %) a zbytek o sobě neuvedl nic, jsme schopni podle určitých vzorců odvodit, o koho by se ve druhém případě mělo jednat. Ve výsledku jsme se tak dostali až k 80 % identifikovaných uživatelů, které jsme dokázali s vysokou pravděpodobností zařadit podle toho, kam klikali.
A co třeba analýza vizuálních dat. To také s Big Daty zvládnete? Analýzy vizuálních dat jsou zatím jednou z nejtěžších oblastí, které se realizují. Například zvuková data jsou pro analýzu mnohem jednodušší. Každopádně funguje to obdobně jako u těch webových log. Dělá se to přes strojové učení, kdy stroj porovná přes určité vzorce podobnost znaků a zařadí obrázek do určité kategorie. Nedokáže však rozpoznat konkrétní subjekt, nýbrž jeho vlastnosti. Například zná-li souhrn znaků, které nadefinujeme jako kočka, pak dokáže vlastnosti obrazů porovnat a označit podobající se. Oblastí, na které se dá zaměřit, je bezpočet a je potřeba si vybrat, kterým směrem se vydat. Vstoupili jsme do nového roku, jaké trendy v Big Datech budou letos stěžejní? Rok 2016 bude ve znamení toho, že klienti vůbec začnou používat samotné Big Data technologie. Tyto změny budou muset nastat jako první, aby se mohly rozvíjet vlastní projekty a zkrátila se i reakční doba. Firmy pravděpodobně zatím také nebudou chtít využívat data externích stran, ale začnou samy u sebe. Bankovnictví se budeme posouvat více k event driven marketingu. Mobilizují se více elektronické kanály, které podle mého názoru postupně sníží práci pobočkám,
kde o sobě klient zanechává obrovské množství informací, ale pracovníci je nejsou v takové míře schopni zpracovávat. Zákazník už tak nebude muset nutně přijít na pobočku a i tak mu banka bude schopna nabídnout výhodný produkt na dálku. Firmy čeká ještě hodně práce. Myslíte si, že to bude zpočátku chaos? Bude to bohužel dost velký chaos. Navíc s technologiemi se mění také styl fungování. Doposud, když už se klient rozhodl pro nějakou technologii, nebylo možné ji poté zaměnit, protože investice byla příliš veliká. Nové technologie jsou ale tzv. open source a umožňují vybírat z více řešení. Nemyslím si ale, že ten zmatek ale bude trvat dlouho. Směr je totiž poměrně jasný, což je dobré. Jak a kde v práci s Big Daty tedy vůbec začít? Vždy klientům říkáme: „Vyberte si oblasti, které vás trápí, a my vám v krátkém čase zpracujeme byznys výstupy. Nemá význam začít technologiemi, pokud neznáte účel celé práce. Nechte si vytvořit několik návrhů, které vás v zásadě nic nestojí (výhoda open source) a rozhodněte se.“ To je cesta, kterou bych obecně doporučil každému, kdo chce Big Data ve svém podnikání začít řešit komplexně.
Autor Jakub Augustín Big Data Competency Leader, Adastra V Adastře působí od roku 2011, kdy nastoupil na pozici konzultanta v divizi banking. Zhruba od roku 2013 postupně začal budovat novou Big Data kompetenci, jíž je v současnosti lídrem. Má rozsáhlé zkušenosti s datově orientovanými projekty pro významné klienty z bankovního sektoru v oblastech Data Warehousing, Master Data Management, datová migrace a Data Governance. V rámci kompletního redesignu datového skladu působil také jako konzultant u klienta v Rusku.
13
Oracle Big Data Discovery
“The Visual Face of Big Data” Firma Oracle nabízí celou řadu nástrojů pro Big Data platformu. Tyto nástroje a technologie mají za cíl usnadnit, zrychlit a zefektivnit nakládání s daty na této platformě a usnadnit tak práci všem – od architektů, přes IT specialisty až po analytiky. V dnešní době již platforma Big Data jednoznačně prokázala, že skrývá nemalý potenciál, jak ukládat, zpracovávat a monetizovat data. Efektivní vytěžování informací z těchto dat je ale u většiny organizací doménou IT specialistů a datových vědců, kteří musejí mnohdy kombinovat své znalosti z oblasti programování, strojového učení a pokročilé analytiky a statistky. Nedostatek uživatelsky přívětivých nástrojů tak znesnadňuje běžným analytikům a uživatelům efektivní využití dat uložených na platformě Big Data. Oracle Big Data Discovery Firma Oracle proto do svého portfolia zařadila nástroj Oracle Big Data Discovery, který zcela zásadním způsobem rozšiřuje možnosti využití dat a informací na Big Data platformě. Jedná se o jedinečný nástroj, který jen v několika málo krocích umožňuje uživateli nalézt potřebná data, upravit je, zanalyzovat a sdílet výsledek své práce s ostatními uživateli. Snadné a přehledné prostředí Oracle Big Data Discovery otevírá zcela nové možnosti využití informačního potenciálu Big Data platformy všem uživatelům v organizaci. Oracle Big Data Discovery se stává nedílnou součástí ucelené Big Data architektury u mnoha zákazníků. Rychlá práce s daty, snadné nalézání nových informací a vztahů v datech a možnost aktivně zapojit do analytických úloh větší množství uživatelů dělá z nástroje Big Data Discovery vyhledávaný nástroj, jež výrazně urychluje návratnost investic do Big Data platformy.
14
Interaktivní katalog dat usnadňuje orientaci a umožňuje snadné vyhledání relevantních datových zdrojů. Ke každému datovému zdroji jsou informace o počtu záznamů, počtu a typech atributů, komentáře, poslední aktualizaci a mnoho dalších.
Podrobná statistika o všech atributech dané datové sady – počty hodnot, unikátních hodnot, chybějících hodnot, kvantily, střední hodnoty apod. Rychlé grafy umožňují analyzovat vztahy mezi proměnnými, rozložení hodnot, filtrovat data, …
Data nemusejí být vždy čistá a připravená pro podrobnou analýzu. Proto máte možnost data transformovat, slučovat, měnit datové typy, agregovat, počítat, vytvářet nové odvozené atributy apod.
Jednotlivé datové zdroje lze propojit a analyzovat. K dispozici máte celou řadu interaktivních grafů, map, tabulek a jiných vizualizací. Dále můžete data filtrovat, prohledávat, třídit, sestavovat vlastní dashboardy.
Samozřejmostí je možnost sdílet výsledky své práce s ostatními kolegy, ať už se jedná o sdílení samotných upravených dat, reportů a dashboadů, snímků jednotlivých obrazovek nebo záložek definujících aktuální nastavení filtrů v rámci analýzy.
15
UNDERSTANDING DATA