IBM® SPSS® Modeler Professional 16 IBM SPSS Software Business Analytics
IBM SPSS Modeler Professional Včasné rozhodnutí díky přesným informacím
Metodami data miningu získáte detailní přehled o svém současném stavu i jasnější pohled na budoucnost. Vaše společnost může s IBM SPSS Modeler Professional provádět sofistikovaný data mining a využívat stále rostoucí a komplexnější data k hlubšímu pochopení Vašich klientů nebo zaměstnanců. Ucelený program obsahuje nástroje pro porozumění datům, jejich přípravu a modelování. Můžete tak provádět včasná a přesná obchodní rozhodnutí. Společnosti řeší pomocí nástrojů data miningu rozsáhlou škálu úloh, mohou jimi například být získávání nových zákazníků, posilování jejich loajality, retence zákazníků či detekce podvodného chování. Ve veřejném sektoru se IBM SPSS Modeler používá pro předpověď budoucího vývoje, prevenci kriminality a prevenci poškození veřejného majetku, při řízení akademických institucí a obecně v situacích, kdy je třeba provádět rozhodnutí.
Hlavní přínosy snadný přístup k datům
v datových skladech, databázích, Hadoop distribucích či samotných souborech příprava a modelování
v intuitivním grafickém rozhraní rychlé odvození a ověření modelů
pokročilými statistickými a modelovacími metodami efektivní nasazení predikčních
a analytických modelů přístup k základním i komplexním
analytickým metodám v rámci jediné platformy
IBM SPSS Software Business Analytics
Zjednodušení dataminingového procesu IBM SPSS Modeler Professional je populární u analytiků, ale i u ostatních uživatelů. S automatizovanou přípravou dat a modelováním může i uživatel bez analytických zkušeností a příslušné specializace rychle vytvořit přesné modely. Profesionální a zkušení analytici využijí k přípravě dat a modelování vizuálního programování ve formě proudů. V intuitivním grafickém rozhraní IBM SPSS Modeler je vizualizován každý krok dataminingového procesu. Odborníci a specialisté mohou na těchto proudech spolupracovat a rychle tak přidat své znalosti a zkušenosti z obchodních procesů do celého projektu. Konstrukce proudů ve formě vizuálního programování umožňuje lépe se zaměřit na samotnou úlohu než na technické psaní programovacího kódu.
Výhody pro organizace IBM SPSS Modeler Professional využijí všechny typy organizací, které provádějí hloubkové analýzy, a mohou tak dosáhnout větších úspěchů. Podnikatelé mohou přilákat nové zákazníky, posílit jejich loajalitu a zabránit jejich odchodu. Dále mohou detekovat podvodné chování a snížit riziko podnikání. Ve veřejném sektoru lze předpovídat ukazatele, vyhodnotit efektivitu sociálních programů a reagovat na bezpečností rizika.
Intuitivní tvorba modelů formou vizuálního programování v IBM SPSS Modeler
IBM® SPSS® Modeler Professional 16
Vzdělávací instituce mohou sledovat výsledky svých studentů, dosáhnout vyšší efektivity ve vzdělávání a použít jej pro samotnou výuku nebo akademické projekty. V průmyslových odvětvích lze vhodně plánovat údržbu a zabránit tak havarijním stavům.
Jednoduchý přístup a integrace dat V přehledném vizuálním rozhraní můžete snadno přistoupit k databázím, tabulkám a souborům. Mezi podporované formáty patří například standardní formáty IBM SPSS Statistics, IBM SPSS Data Collection, Cognos Business Intelligence, SAS a Microsoft Excel. Po kombinaci s IBM SPSS Modeler Professional Server již není potřeba přesouvat data z velkých databází, jelikož modelování a analýza probíhá přímo v databázi, což snižuje celkovou časovou náročnost dataminingových projektů. Dále IBM SPSS Modeler umožňuje pomocí SQL Pushbacku podstatně zrychlit transformace a přípravu dat v databázi převedením posloupnosti příkazů do SQL bez nutnosti, aby uživatel sám tyto SQL dotazy psal. V případě, že databáze sama podporuje modelovací algoritmy, je možné s nimi jednoduše v uživatelsky příjemném prostředí IBM SPSS Modeler vytvářet nové modely a používat je pro další skórování. Jsou podporovány algoritmy v IBM InfoSphere, Microsoft SQL Server, Oracle a IBM Netezza. IBM SPSS Scoring Adapters skórují data přímo v databázi, což umožňuje ještě rychlejší rozhodování, včasné rozhodování a tedy ve výsledku rychlejší návratnost investice.
IBM SPSS Software Business Analytics
IBM® SPSS® Modeler Professional 16
Rozsáhlá nabídka modelovacích technik
Příprava a datové manipulace
IBM SPSS Modeler disponuje širokou škálou pokročilých datamininigových modelovacích nástrojů pro řešení úloh, na které může analytik narazit.
Příprava dat je časově nejnáročnějším krokem každého analytického projektu. IBM SPSS Modeler poskytuje pestrou škálu nástrojů pro manipulace jak s jednotlivými záznamy, tak s proměnnými a vlastnostmi záznamů. Mezi základní datové manipulace patří:
Klasifikační a regresní algoritmy. Vytvoříte předpovědi budoucího chování na základě historických dat pomocí modelovacích technik, jako jsou klasifikační stromy, neuronové sítě, logistická regrese, podpůrné vektory, Coxova regrese, zobecněné smíšené lineární modely (GLMM) a další. Využijete automatické modelování jak pro kategorizované, tak pro spojité cílové proměnné. Segmentační algoritmy. Seskupíte zákazníky a naleznete neobvyklé vzory pomocí automatického seskupování, detekce anomálií a neuronových sítí. Automatické seskupování současně vyzkouší více segmentačních algoritmů a Vy vyberete vhodnou seskupovací metodu. Asociační algoritmy. Objevíte typické kombinace jevů a vztahy v posloupnostech událostí (např. nákupů) pomocí algoritmů Apriori, CARMA a sekvenčních asociací. Časové řady. Vytvoříte předpovědi pro jednu nebo více časových řad pomocí statistických modelovacích technik. Rozšíření jazykem R. Modeler umožňuje používat transformace, modely a výstupy v jazyce R. Kolegům, kteří nechtějí přímo psát zdrojový kód, vytvoříte vlastní, standardně ovládaný uzel využívající nástroje jazyka R. Monte Carlo simulace. Vzhledem k přirozené variabilitě, popřípadě nepřesnostem v datech, použijete metody Monte Carlo pro zpřesnění modelů a výběry scénářů.
Práce se záznamy. Vyberete příslušné záznamy, se kterými chcete pracovat. Naleznete opakované případy v datech a připojíte nové záznamy. Agregací vytvoříte nové proměnné s agregovanými (shrnujícími) hodnotami například pro RFM analýzu. Data dále snadno setřídíte nebo navýšíte pomocí uzlu pro vážení. Pomocí uzlu Space Time Boxes taktéž seskupíte události blízké v čase a prostoru. Práce s proměnnými. Snadno upravíte metadata a vlastnosti proměnných v datové matici. Odfiltrujete nepotřebné a odvodíte nové proměnné. Proměnné restrukturalizujete a optimálně kategorizujete. Za účelem modelování také záznamy rozdělíte na trénovací a testovací množinu.
Automatické modelování Nástroj pro automatické modelování je určen pro rychlé nalezení přesného modelu bez potřeby analytických zkušeností. Využijí jej ale i zkušení analytici při hledání vhodného modelu a při sestavování složitých proudů. Automatické modelování poskytuje nástroj pro snadné porovnání výsledků různých modelů s různým nastavením parametrů. Výstupem je seznam modelů, které dosahují nejlepších výsledků.
Metodologický přístup V každé části dataminingového procesu umožňuje IBM SPSS Modeler postupovat podle obecně přijatého dataminingového standardu CRISP-DM (Cross-Industry Standard Process). To znamená, že uživatelé místo soustředění na tvorbu vlastní metodologie, mohou věnovat svůj drahocenný čas na řešení daného úkolu.
IBM® SPSS® Modeler Professional 16
IBM SPSS Software Business Analytics
Projekty lze v IBM SPSS Modeler efektivně organizovat v projektovém manažeru CRISP-DM.
Specifikace Pochopení dat široká škála interaktivních grafů pavučinový graf pro analýzu vztahů v datech interaktivní výběr dat z grafu pro vizualizaci nebo modelování přístup k procedurám a grafům z programu IBM SPSS Statistics přímo v programu Modeler
Příprava dat přístup k datům z IBM SPSS Collaboration and Deployment Services Repository, Cognos Business
Metodologie CRISP-DM umožňuje data minerům postupovat v projektech efektivně a dosáhnout požadovaných výsledků.
Nasazení do praxe Díky otevřené a škálovatelné architektuře programu IBM SPSS Modeler jej lze efektivně nasadit do stávající IT infrastruktury. Integruje se přímo s Vašimi existujícími systémy, jak pro sběr dat, tak pro rozhodování. Navíc využívá modelování a skórování v databázi, SQL pushback, multithreading a serverové klastry. Tím umožňuje nejenom efektivně a rychle získat výsledky, ale i redukovat celkové náklady. V rámci architektury klient/server umožňuje IBM SPSS Modeler Server pracovat více analytikům najednou a pomocí modelování a skórování přímo v databázi efektivně zpracovávat velký objem dat. IBM SPSS Modeler Server navíc rozšiřuje způsob aplikace výsledků a snadno předává výsledky manažerům pro rychlé rozhodování.
Intelligence, Cognos TM1, IBM DB2®, Oracle®, Microsoft SQLServer™, IBM Informix®, IBM Netezza, mySQL (Oracle), Hadoop Distributed File System, datovým zdrojům Teradata, stejně tak jako k databázím zDB2 a IBM Classic Federation Server Support import textových souborů pevné délky nebo s oddělovači, import datových souborů IBM SPSS Statistics, SAS, IBM SPSS Data Collecton nebo XML paleta nástrojů pro čištění dat od odebrání či nahrazení chybných údajů až po automatické vkládání chybějících hodnot a zmírnění vlivu odlehlých pozorování a extrémních hodnot automatická příprava pro ověření kvality dat a jejich modelování automatické ověření kvality dat a jejich příprava k modelování výběr proměnných, přejmenování, odvození nových proměnných, kategorizace, nahrazení hodnot a změna pořadí proměnných výběr případů, náhodné výběry, spojení dat a textových řetězců, třídění, agregace a vážení
IBM® SPSS® Modeler Professional 16
IBM SPSS Software Business Analytics
restrukturalizace dat, rozdělení a testovací množinu a transpozice
na tréninkovou
funkce pro práci s textovými řetězci: tvorba řetězců, nahrazování znaků, vyhledávání, ořezávání a odebírání mezer RFM skórování, agregace transakčních dat pro kompletní RFM analýzu export dat do databází, IBM Cognos Business Intelligence, IBM SPSS Statistics, IBM SPSS Data Collection, textových dokumentů, Excel, SAS, XML.
Kohonenovy sítě, metody K-Means a Two Step, diskriminační analýza a metoda podpůrných vektorů (SVM) – seskupovací a segmentační algoritmy faktorová analýza, analýza hlavních komponent – algoritmy pro redukci dimenzionality lineární regrese, zobecněná lineární regrese (GLM) a zobecněné lineární smíšené modely (GLMM) – odhady parametrů v lineárních modelech logistická regrese - modelování kategorizovaných proměnných
Modelování a ověření modelů
SLRM – bayesovský model s postupným učením
pokročilé dataminingové algoritmy pro získání informací z Vašich dat
analýza časových řad – automatické generování a odhady parametrů časových řad
automatická klasifikace a seskupování pro rychlé nalezení vhodných modelů
neuronové sítě – vícevrstvá síť se zpětnou propagací, síť s radiální bazickou funkcí
interaktivní prohlížeč modelů a přehledné statistické výstupy
podpůrné vektory (SVM) – pokročilý algoritmus vhodný pro rozsáhlé datové soubory
vizualizace analytických výsledků na geografických mapách
bayesovské sítě – modely založené na podmíněné pravděpodobnosti
grafické zobrazení relativní důležitosti prediktorů pro závislou proměnnou
Coxova regrese – odhad času do konkrétní události
kombinace několika modelů (metamodelování), nebo analýza jednoho modelu pomocí druhého
detekce anomálií – nalezne neobvyklé záznamy pomocí seskupovacích algoritmů KNN – klasifikace metodou nejbližších sousedů
Component-Level Extension Framework (CLEF) pro tvorbu vlastních aplikací
Apriori – oblíbený asociační algoritmus s pokročilými funkcemi pro vyhodnocení výsledků
přístup k nástrojům jazyka R
CARMA – asociační vícenásobných důsledků
propojení s IBM SPSS Statistics simulování dat metodou Monte Carlo
Modelovací algoritmy C&C&RT, C5.0, CHAID & QUEST – rozhodovací a klasifikační stromy s možností interaktivního růstu Decision List – interaktivní algoritmus pro vytváření pravidel
algoritmus
s možností
equence – nalezení asociací v záznamech uspořádaných podle času modelovací algoritmy v databázi IBM InfoSphere*: Apriori, seskupování, rozhodovací stromy, logistická regrese, naivní bayesovské klasifikátory, regresní modely, hledání asociací v sekvencích a časové řady
IBM® SPSS® Modeler Professional 16
IBM SPSS Software Business Analytics
modelovací algoritmy v databázi IBM Netezza*: bayesovské sítě, naivní bayesovské klasifikátory, rozhodovací a regresní stromy, hierarchické seskupování, seskupování metodou K-Means, zobecněné lineární modely, metoda hlavních komponent a časové řady modelovací algoritmy v databázi IBM Netezza*: bayesovské sítě, naivní bayesovské klasifikátory, rozhodovací a regresní stromy, hierarchické seskupování, seskupování metodou K-Means, zobecněné lineární modely, metoda hlavních komponent a časové řady modelovací algoritmy pro databázi Microsoft SQL Server*: Apriori, seskupování, rozhodovací stromy, lineární regrese, naivní bayesovské klasifikátory, neuronové sítě, sekvenční seskupování a časové řady modelovací algoritmy pro databázi Oracle*: adaptivní bayesovské sítě, naivní bayesovské klasifikátory, Apriori, umělá inteligence (AI), rozhodovací stromy, zobecněný lineární model (GLM), metoda K-Means, minimální popisná vzdálenost (MDL), faktorizace pozitivně semidefinitních matic, O-Cluster (ortogonální seskupování), podpůrné vektory (SVM)
Modeler Server (volitelný) přístup k modelovacím nástrojům přímo v databázích paralelní spuštění proudů a modelů bezpečný přenos citlivých dat mezi klientem a serverem pomocí kódování Secure Sockets Layer (SSL)
IBM Business Analytics IBM Business Analytics software poskytuje akční vhled, který manažeři potřebují k dosažení lepších obchodních výsledků. IBM nabízí komplexní jednotné portfolio složené z nástrojů pro business intelligence, prediktivní analýzy, finančních výpočty a strategický management a kontrolu rizik . Pomocí IBM software dokážou společnosti odhalit trendy, vzory chování a odchylky od nich, porovnat scénáře „Co by bylo, kdyby...“, predikovat potenciální hrozby a příležitosti, identifikovat a řídit klíčová obchodní rizika a plány, rozvrhnout a odhadovat zdroje. Díky těmto analytickým možnostem dokáží naši zákazníci po celém světě lépe pochopit, předvídat a vytvářet obchodní výsledky.
*vyžaduje IBM SPSS Modeler Professional Server
Aplikace export modelů pomocí SQL nebo PMML (standardní XML formát pro prediktivní modely) využívá IBM SPSS Collaboration and Deployment Services pro správu analytických procesů, automatizaci a zavedení do praxe
Copyright © 2014, ACREA CR, spol. s r.o.
Společnost ACREA CR, spol. s r.o. je distributorem softwaru IBM SPSS a poskytovatelem analytických a statistických služeb a kurzů v České a Slovenské republice.
ACREA CR, spol. s r.o. Krakovská 7, Praha 1, 110 00
(t) +420 234 721 400 (e)
[email protected] (w) www.acrea.cz