České Success Stories 2014 Reálný přínos analytiky na praktických příkladech v českém prostředí. SAS CI Roadshow 2014 24. 9. 2014 Praha Pavel Šiška
Kdo jsme Center of Excellence pro střední a východní Evropu Podstatná část - Customer Analytics (analýza klientských dat) Finanční sektor – Retail Banking Growth Engine
Technologie – vlastní laboratoř (HW, Storage), spolupráce se SASem Projekty v ČR i v zahraničí
SOFTWARE! © 2014 Deloitte Česká republika
2
Obsah
Digitální marketing
Analýza nestrukturovaných dat
© 2014 Deloitte Česká republika
3
Digitální marketing
© 2014 Deloitte Czech Republic
4
Analýza nestrukturovaných dat Proof of Concept Zákazník: Finanční sektor Cíl: Využití dat o chování klienta na webu pro identifikaci nabídky zajímavé pro klienta i pro banku… Obohacení stávajících modelů založených na transakčních datech. Fokus na internetové bankovnictví. Identifikace cca 3000 sekvencí kroků v rámci internetového bankovnictví...
© 2014 Deloitte Czech Republic
5
Výsledky Identifikovali jsme a napočítali 31 spouštěcích událostí (triggers), 294 prediktorů a 2962 sekvencí kroků v rámci internetového bankovnictví. Kombinace modelů přinesla výrazně lepší výsledky, než jakých by dosáhnul každý model zvlášť. Jenom během pilotní kampaně vydělala banka o cca X mil CZK* víc, než pokud by kampaň vedla sama na celém portfoliu (vyjádřeno v Lifetime Value). Konečné výsledky - Conversion Rate 8,00% 6,90%
7,00% 6,00% 5,00% 4,00%
3,60% 3,17%
2,81%
3,00% 2,18%
2,00%
1,55%
2,13%
1,34%
1,00%
Champion Challenger
0,00% Osobní půjčka
Konsolidace
Kontokorent
Kreditní karta
* Částka je vypočítaná jako skutečný zisk, tedy zisk z kontraktů, které byly uzavřeny navíc oproti situaci, kdy by celou kampaň vedla banka sama. © 2014 Deloitte Czech Republic
6
Náš přístup Deloitte obohatil existující propenzitní modely o analýzu typických sekvencí kroků v internetovém bankovnictví, které vedou k nákupu nového produktu. Pilotní kampaň se uskutečnila na čtyřech vybraných produktech, které byly nabídnuty klientům prostřednictvím zprávy v internetovém bankovnictví. Kampaň proběhla jako tzv. Champion/Challenger – Deloitte a banka si rozdělili portfolio v poměru 20:80.
Typické sekvence kroků eBanking login Účty a transakce
Spoření
Přehled karet
Půjčky
Karty
Nezaúčtované transakce
Přehled transakcí
…
…
…
Hypotéky Doplňkové služby
Investování Zablokování karty
Propenzitní modely
…
…
Hledali jsme typické sekvence kroků v rámci internetového bankovnictví, které vedou k nákupu produktu.
Událostně řízené kampaně ANALYTICKÁ PRAVIDLA
OBCHODNÍ PRAVIDLA
Client information database
Trigery jsou předem definované události, které když nastanou, nárazově zvyšují pravděpodobnost, že si klient koupí nějaký produkt. © 2014 Deloitte Czech Republic
Propenzitní modely kalkulují s jakou pravděpodobností si klient koupí produkt, který mu banka aktivně nabízí. Výkonnost modelu byla zvýšena vstupy z ostatních dvou modelů.
7
Digitálni marketing – shrnutí Vybrané poznatky Vyžití dat z internetu vylepšuje výkon stávajících modelů Nutnost mít čerstvá data. Neaktuální výrazně snižují sílu prediktivních modelů. Nutno exekuovat kampaně hned – PtB rychle klesá už během dní (zvláště sekvence stránek zastarává u konkrétního klienta velmi rychle)
Potenciál pro další rozvoj a zlepšení Implemetace real-time analytiky a nabídek (nebo aspoň near-real time) – infrastrukturální projekt (pořízení dat, scoring, exekuce kampaně) Data z dalších kanálů jako je například mobilní bankovnictví Sledování aktivity klienta přes cookies i neidentifikovaného na webu banky (na jiných webech je právní problém, ale je to možné).
© 2014 Deloitte Czech Republic
8
Analýza nestrukturovaných dat
© 2014 Deloitte Czech Republic
9
Analýza nestrukturovaných dat Proof of Concept Zákazník: Finanční sektor Cíl: Prokázat reálnou využitelnost nestrukturovaných dat především v oblasti
- propenzitního modelování a - retence
Analyzovaly se poznamly v CRM… © 2014 Deloitte Czech Republic
10
Výsledky Propensity to Buy
Churn
Očekávaný zisk X mil. EUR (lifetime value)
Náklady obětované příležitosti cca X mil. EUR Gini: 0,764
Prediktivní síla modelu: CZK m PTB Target
Gini
Hodnocení modelu
Overall
0,29
0 – 0,30
Financing
0,46
0,45 – 0,60
80 70 60 50
Opportunity costs
40
Investments
0,61
0,60 – 1,00
Everyday banking
0,53
0,45 – 0,60
Campaign costs
30 20 10
Technical products
0,46
0,45 – 0,60
0 1
Other
© 2014 Deloitte Česká republika
0,32
0,30 – 0,45
2
3
4
5
6
7
8
9
10
Decily
11
Výsledky Předmět konverzace Téma konverzace Stížnost Finanční plán
Žádost klienta
Bankovní nabídka
Bez tématu
2% 18%
Životní styl Diskutované produkty Kreditní karta Hypotéka
2% 3%
Spoření a investice
7%
Debetní karty
7%
Spotřebitelské půjčky
7%
22%
31% Pojištění
27%
Účty a balíčky Jiné
Téma
© 2014 Deloitte Česká republika
18%
53% 3%
Kategorie produktu
Affluent Entrepreneur Risk averse Loyal Conservative Prestige Influential Interacting Cost sensitive Married Single Has grown up kid We Has small kid Girlfriend Has a newborn baby Renting a flat Dissatisfied Undecided Has car On welfare Building a house
12,7% 11,1% 8,9% 7,1% 2,3% 1,7% 1,2% 0,6% 0,4% 14,3% 6,3% 5,6% 4,2% 1,1% 0,9% 0,8% 6,3% 3,8% 1,8% 1,2% 0,9% 0,3%
Behavioral Family Situational
12
Náš přístup Příprava dat Tokenizace
Vyloučení „výplňových“ slov
Analýza Lematizace
Term Document Matrix
Tokenizace
Vyloučení „výplňových“ slov
• Všechna slova byla porovnána s českým slovníkem a ta, která nebyla nalezena, byla klasifikována.
• „Výplňová“ slova jsou slova s omezeným významem
• Zaznamenání speciálních symbolů jako: !!!,???, :-), :-( • Zaznamenání ostatních anomálií: VŠECHNA VELKÁ PÍSMENA … • Překlad zkratek (zaznamenali jsme více než 1000 zkratek)
© 2014 Deloitte Česká republika
• Tyto slova jsou vyloučena z analýzy, protože nemají význam pro účel analýzy. • „Výplňová“ slova jsou většinou funkční slova jako spojky, předložky atd., například: „ta”, „kdo”, „což”, „tedy”, „Vám”, „na”.
Klasifikace
Lematizace • V další fázi jsou slova převedena na základní gramatický tvar (lemma). • V rámci tohoto procesu jsou také tvary v množném čísle převedeny do jednoduchého a všechna slova jsou přepsána do prvního pádu.
13
Náš přístup Příprava dat Tokenizace
Vyloučení „výplňových“ slov
Term Document Matrix • Frekvence každého slova v každé poznámce je spočítána a uložena do Term Document Matrix. • Term Document Matrix je matice, kde jednou dimenzí jsou různé poznámky a druhou různá lemmata (slova), která se v poznámkách vyskytují. • Tyto data slouží k trénování klasifikačních modelů.
© 2014 Deloitte Česká republika
Analýza Lematizace
Term Document Matrix
Klasifikace
Klasifikace • Klasifikace nestrukturovaného textu představuje „big data“ problém. Term Document Matrix byla proto zredukována na 1300 nejčastěji se vyskytujících lemmat (slov). I tak matice o rozměrech 2,7 mil. x 1300 zabrala cca 28 GB RAM. • Klasifikační modely byly původně fitovány v R a LIBSVM, ale později kvůli lepšímu výkonu v SASu.
14
Analýza nestrukturovaných dat – shrnutí Vybrané poznatky Nestrukturovaná data vylepšují existující analytické modely a pomáhají odhalit další důležité skutečnosti Vytěžení nestrukturovaných dat není extrémně náročná úloha (finančně, časově, technologicky) Více než technologie rozhoduje schopnost stavět modely pro danou industrii a konkrétní úkol
Potenciál pro další rozvoj a zlepšení Hledání dalších oblastí – například ochota klientů sdělovat informace o konkurenci a produktech, které využívají jinde Využití pro analýzu cenové elasticity – jaká sleva je třeba (nebo není sleva potřeba) Vyžít data i z dalších datových zdrojů Jít do většího detailu například u uvěrových produktů
© 2014 Deloitte Česká republika
15
Děkuji za pozornost!
© 2014 Deloitte Česká republika
16
Kontakty PAVEL ŠIŠKA Partner | Consulting Deloitte Advisory s.r.o. Nile House, Karolinská 654/2, 186 00, Praha 8, Czech Republic Tel/Direct: +420 246 042 300 | Mobile: +420 737 264 273
[email protected] | www.deloitte.cz
FLAVIO PALACI Partner | Applied Analytics Deloitte Advisory s.r.o. Nile House, Karolinská 654/2, 186 00, Praha 8, Czech Republic Tel/Direct: +420 246 042 543 | Mobile: +420 730 595 648
[email protected] | www.deloitte.cz
FILIP TROJAN Manager | Applied Analytics Deloitte Advisory s.r.o. Nile House, Karolinská 654/2, 186 00, Praha 8, Czech Republic Tel/Direct: +420 246 042 797 | Mobile: +420 733 598 521
[email protected] | www.deloitte.cz
© 2014 Deloitte Česká republika
17
Deloitte označuje jednu či více společností Deloitte Touche Tohmatsu Limited, britské privátní společnosti s ručením omezeným zárukou („DTTL“), jejích členských firem a jejich spřízněných subjektů. Společnost DTTL a každá z jejích členských firem představuje samostatný a nezávislý právní subjekt. Společnost DTTL (rovněž označovaná jako „Deloitte Global“) služby klientům neposkytuje. Podrobný popis právní struktury společnosti Deloitte Touche Tohmatsu Limited a jejích členských firem je uveden na adrese www.deloitte.com/cz/onas. Společnost Deloitte poskytuje služby v oblasti auditu, daní, poradenství a finančního a právního poradenství klientům v celé řadě odvětví veřejného a soukromého sektoru. Díky globálně propojené síti členských firem ve více než 150 zemích a teritoriích má společnost Deloitte světové možnosti a poskytuje svým klientům vysoce kvalitní služby v oblastech, ve kterých klienti řeší své nejkomplexnější podnikatelské výzvy. Přibližně 200 000 odborníků usiluje o to, aby se společnost Deloitte stala standardem nejvyšší kvality. Společnost Deloitte ve střední Evropě je regionální organizací subjektů sdružených ve společnosti Deloitte Central Europe Holdings Limited, která je členskou firmou sdružení Deloitte Touche Tohmatsu Limited ve střední Evropě. Odborné služby poskytují dceřiné a přidružené podniky společnosti Deloitte Central Europe Holdings Limited, které jsou samostatnými a nezávislými právními subjekty. Dceřiné a přidružené podniky společnosti Deloitte Central Europe Holdings Limited patří ve středoevropském regionu k předním firmám poskytujícím služby prostřednictvím více než 3 900 zaměstnanců ze 34 pracovišť v 17 zemích. © 2014 Deloitte Česká republika