BA_EM Electronic Marketing Pavel Kotyza @VŠFS
Agenda Efektivní data mining jako zdroj relevantních
dat o potřebách zákazníků
Co je data mining? Je absolutní Je předem neznámý Je užitečný
Co jsou data?
Tradiční využití data-miningu
Tradiční využití data-miningu
Tradiční využití data-miningu
Tradiční využití data-miningu
Tradiční využití data-miningu
Otázka Uveďte příklad data miningu?
Můj příklad
Co je data mining? Data mining je činnost automatického prohledávání
velkých dat pro hledání vzorců podobností (patterns) a trendů, které jsou za hranicí jednoduché analýzy. Data mining využívá pokročilé matematické algoritmy
pro segmentaci data a Tradiční využití data-miningu a vyhodnocování budoucích událostí Data mining je také znám jako:
Knowledge Discovery (KD) v datech (KDD).
Klíčové vlastnosti data miningu Automatické objevování obvyklostí Predikce předpokládaných výsledků Tvorba akčních plánů Zaměření na velké objemy dat a databází
Video
http://www.youtube.com/watch?v=BjznLJcgSFI
Proč jej využívat
Data mining vám odpoví na otázky, které nelze
zodpovědět pomocí jednoduchých dotazů a reporty
Video example
http://www.ted.com/playlists/56/making_sense_of_too_much_data.html
Typy Data Miningu
Automatic Discovery Data miningu se dosahuje pomocí stavby modelů.
Model využívá algoritmy, které se aplikují na sadu hrubých dat. Výsledků automatizovaných závěrů je dosaženo pomocí zpracování jednotlivých modelů. Modely data-miningu mohou být použity pro
získávání výstupů z nových dat, která ještě nikdy nevyla zpracována. Proces aplikace takového modelu se jmenuje skóring.
Predikce - předpovědi Mnoho forem data-miningu jsou prediktivní Např. Model může předikovat příjem lidí s vysokoškolským
vzděláním
Predikce jsou spojeny s pravděpodobností. Možnosti takové
predikce jsou také známy jako jistoty (confidence).
Jak jistá je tato předpověď?
Některé formy prediktivního data miningu vytvářejí pravidla, která
jsou podmínkou daných závěrů.
Např. Pravidlo může specifikovat, že člověk s Bc. Vzděláním z
určitého regionu má vyšší příjem než regionální průměr. Pravidla mají asociovanou podporu v tvrdých datech.
Jaké procento populace splňuje dané pravidlo?
Seskupování - Grouping Jiná forma data miningu identifikuje logické a
seskupení dat. Např. Model může identifikovat segment populace,
který má určitý příjem v daném rozsahu, a nemá body za špatné řízení a kupuje si mobil každý rok.
Akční informace - Actionable Information Data mining nám přináší informace vhodná pro akci
na základě analýzy velkých dat. Např. Developer může plánovat stavby na základě
příjmových skupin žijících v dané lokalitě. Leasingovka může použít model, který identifikuje
zákaznické segmenty pro zaslání nabídky na drah, luxusní vozy.
Proč je to dnes tak důležité? Data jsou všude kolem nás Sociální sítě Vyhledávání a porovnávání zboží Cílení reklamy Přesycení informacemi
Social Insight & Osobní využití Ceny pronájmů Blogy a zpravodajství Informace o filmech v kině Móda Ceny produktů Vyhledávání na porno stránkách
The krása vizualizace dat
http://www.ted.com/talks/david_mccandless_the_beauty_of_data_visualization.html
Data Mining Process Definice problému
Sběr dat a příprava
•Data Access •Data Sampling •Data Transformation
Stavba modelu & hodnocení
•Create Model •Test Model •Evaluate & Interpret Model
Aplikace znalostí
•Model Apply •Custom Reports •External Applicazions
Definice problému
Definice problému
Definice problému
Sběr dat a příprava Přístup k datum Data Sampling Převod dat
Stavba modelu & hodnocení modelu Vytvoření Modelu Otestování Modelu Vyhodnocení & Interpretace Model
Aplikace znalostí Aplikace modelu Reporty na míru Pro externí aplikace
Jak lze předpovídat vaše chování?
http://www.youtube.com/watch?v=DaWcL3oOd-E
Závěr! Jsou tu ve škole/práci nějací
kokoti? Řešení problému:
D-Fenz Kravatový test –
Extremní příklad data miningu