10. HÉT: ADATTÁRHÁZAK ÉS ÜZLETI INTELLIGENCIA Dr. Danyi Pál Egyetemi docens, BME
2015-16 I. FÉLÉV
DR. DANYI PÁL - INFORMÁCIÓMENEDZSMENT
1
MIS RENDSZEREK: ALKALMAZÁS-TECHNOLÓGIA-ADAT MIS rendszerek: DSS, EIS, AI, BI, BA, ACRM, riportolás
Technológiák: AI, BI, BA
Adatbázis technológiák: (Relációs) adatbázis rendszerek (DBMS), adattárház (DW), adatpiac 2015-16 I. FÉLÉV
DR. DANYI PÁL - INFORMÁCIÓMENEDZSMENT
2
AZ ADATTÁRHÁZAK DW (Data Warehouse), adatraktár: egy szervezet összes információs adatának összesített rendszere, ahol adatok téma-orientált, integrált, időfüggő, nem felejtő adatbázisa, ami támogatja a menedzsment döntéshozatali folyamatait. Olyan felépítésű, hogy segítse az üzleti intelligencia funkciók minél eredményesebb megvalósítását.
Nem feltétel a redundancia-mentesség Feladatok:
Adatok gyűjtése különböző forrásokból Másolatok készítése Adatok tisztítása Adatok tárolása Kategorizálás
OLTP → DW → OLAP 2015-16 I. FÉLÉV
DR. DANYI PÁL - INFORMÁCIÓMENEDZSMENT
3
ADATTÁRHÁZAK ÉS ADATPIACOK CÉLJA
Az adattárházak (adatraktárak) és adatpiacok segítenek megoldani azokat a problémákat, amikor hiányzó vagy inkonzisztens adatai vannak a szervezetnek. Segítenek továbbá szabványosítani az adatformátumokat a tranzakciós adatok és a külső féltől vásárolt adatok között is. Ezek az eszközök kifejezetten adatelemzések és adatbányászat számára készítenek elő, tárolnak és menedzselnek adatot.
Fig 9-15 Components of a Data Warehouse
OLTP
DW
OLAP
Forrás: http://www.slideshare.net/mgraham213/business-intelligence-systems 2015-16 I. FÉLÉV
DR. DANYI PÁL - INFORMÁCIÓMENEDZSMENT
4
ADATTÁRHÁZAK ÉS ADATPIACOK KÖZÖTTI KÜLÖNBSÉG
Az adattárházak (DW) tranzakciós (működési) adatokat és vásárolt adatokat tárolnak. A DW megtisztítja és feldolgozza az adatokat, ha szükséges. Az egész szervezetet szolgálja. Az adatpiac kisebb, mint a DW, és egy üzleti szervezet vagy egy szűkebb területre vonatkozik. Funkcionalitásában megegyezik a DW-zal.
Fig 9-18 Data Mart Examples Forrás: http://www.slideshare.net/mgraham213/business-intelligence-systems DR. DANYI PÁL - INFORMÁCIÓMENEDZSMENT
2015-16 I. FÉLÉV
5
RAW DATA This figure shows raw data before any reporting operations are used.
2015-16 I.Forrás: FÉLÉV http://www.slideshare.net/mgraham213/business-intelligence-systems DR. DANYI PÁL - INFORMÁCIÓMENEDZSMENT
6
The figure on the left shows the raw sales data sorted by customer names. The figure on the right shows data that’s been sorted and grouped.
Sales Data Sorted by Customer Name
Sales Data, Sorted by Customer Name & Grouped by Number of Orders & Purchase Amount
2015-16 I.Forrás: FÉLÉV http://www.slideshare.net/mgraham213/business-intelligence-systems DR. DANYI PÁL - INFORMÁCIÓMENEDZSMENT
7
This figure shows even better information that’s been filtered and formatted according to specific criteria.
Fig 9-5 Sales Data Filtered to Show Repeat Customers 2015-16 I.Forrás: FÉLÉV http://www.slideshare.net/mgraham213/business-intelligence-systems DR. DANYI PÁL - INFORMÁCIÓMENEDZSMENT
8
RFM Analysis allows you to analyze and rank customers according to purchasing patterns as this figure shows. – R = how recently a customer purchased your products – F = how frequently a customer purchases your products – M = how much money a customer typically spends on your products
The lower the score, the better the customer.
Forrás: http://www.slideshare.net/mgraham213/business-intelligence-systems 2015-16 I. FÉLÉV
DR. DANYI PÁL - INFORMÁCIÓMENEDZSMENT
9
MIS RENDSZEREK: ALKALMAZÁS-TECHNOLÓGIA-ADAT MIS rendszerek: DSS, EIS, AI, BI, BA, ACRM, riportolás
Technológiák: AI, BI, BA
Adatbázis technológiák: (Relációs) adatbázis rendszerek (DBMS), adattárház (DW), adatpiac 2015-16 I. FÉLÉV
DR. DANYI PÁL - INFORMÁCIÓMENEDZSMENT
10
EGYES RENDSZEREK FUNKCIÓT ÉS TECHNOLÓGIÁT IS JELENTENEK AI rendszerek
BI rendszerek
Big Data
Funkció szerint
Fordító, képfelismerő, arcfelismerő alkalmazás, humán robot, kiterjesztett valóság, szakértői rendszer, stb.
Kereső rendszerek, OLAP, üzleti elemzés
Big data szolgáltatások, Nagy elemzések, Gyors adatfeldolgozás
Technológia szerint
Neuronhálók, Evolúciós (genetikai) algoritmusok, Fuzzy rendszerek, Logikai programozás
Riportolás Adatbányászat, Tudás menedzsment
NoSQL, Hadoop és MapReduce, Storm
2015-16 I. FÉLÉV
DR. DANYI PÁL - INFORMÁCIÓMENEDZSMENT
11
ÜZLETI INTELLIGENCIA (BI) ESZKÖZÖK ÉS TECHNOLÓGIÁK Az üzleti intelligencia (BI) rendszer egy olyan információrendszer, ami üzleti intelligencia (BI) eszközöket alkalmaz, hogy létrehozzon és szolgáltasson információt. A BI eszközök olyan számítógépes programok, amelyek bizonyos BI technikákat alkalmaznak. A technikákat 3 féleképpen kategorizáljuk: Riportoló eszközök: adatot olvasnak be, feldolgozzák azokat, és olyan strukturált riportokba formázzák az adatokat, amelyeket a felhasználó látni kíván. Elsősorban értékelésre használják. Adatbányász eszközök: statisztikai algoritmusokat használva dolgozzák fel az adatokat, mintákat és kapcsolatokat keresnek és előrejelzést tesznek az eredmények alapján. Tudásmenedzselő eszközök: munkatársi tudást (folyamatleírásokat, kapcsolatokat, összefüggéseket, “okosságokat”) tárolnak, és elérhetővé teszik az érdeklődők számára. Itt az adatok forrása az emberi tudás. 2015-16 I. FÉLÉV
DR. DANYI PÁL - INFORMÁCIÓMENEDZSMENT
12
ÜZLETI INTELLIGENCIA (BI) FUNKCIÓK Információkeresés – lekérdezéseken keresztül Riportolás: teljesítménymérés, mutatószámok (KPI-k)
Online analitikus feldolgozások (OLAP) Üzleti elemzés (analitika): magyarázó és előrejelző modellezés főleg statisztikai alapokon Figyelmeztető (“alert”) eszköz
2015-16 I. FÉLÉV
DR. DANYI PÁL - INFORMÁCIÓMENEDZSMENT
13
OLAP FUNKCIÓK ÉS AZ OLAP ADATKOCKA-MODELL Aggregáció: dimenziók mentén összegzés Lefúrás: az aggregáció ellentéte, pl. havi bontás (DRILL DOWN) Forgatás: dimenzió felcserélése (más nézet) Szelekció: egy dimenzióban értékre szűrés Szeletelés: egy dimenzió lekötése, részkocka kivágása
2015-16 I. FÉLÉV
DR. DANYI PÁL - INFORMÁCIÓMENEDZSMENT
14
OLAP VS OLTP OLTP (On-line Transaction Processing)
Napi üzletmenet működése
Repülőgépes helyfoglaló rendszerek
OLAP (On-line Analytical Processing)
Féléves, éves trendek alapján előre jelezni
Döntéshozatal Jellemzők Felhasználó Időszerűség Gyakoriság Rekordszám Teljesítmény Kívánt adatok Művelet
2015-16 I. FÉLÉV
OLTP Adminisztrátorok Aktuális állapot Folyamatos ~ 10 Gyors Meghatározott Adatmódosítás
OLAP Menedzserek Korábbi állapot Alkalomszerű ~ 100-1000 Lassabb Bizonytalan Adatlekérdezés DR. DANYI PÁL - INFORMÁCIÓMENEDZSMENT
15
•
Dimensions which are characteristics of a measure. In the figure below a dimension is Product Family.
Fig 9-7 OLAP Product Family by Store Type Forrás: http://www.slideshare.net/mgraham213/business-intelligence-systems 2015-16 I. Félév Dr. Danyi Pál - Információmenedzsment
16
• A presentation like what you saw in the prior slide is often called a OLAP cube or a cube. • Know that an OLAP cube and a OLAP report are the same thing
• Users can alter the format of a report • Its possible to Drill down into the available data
Forrás: http://www.slideshare.net/mgraham213/business-intelligence-systems 2015-16 I. Félév Dr. Danyi Pál - Információmenedzsment
17
Drilled down by store location and store type
Forrás: http://www.slideshare.net/mgraham213/business-intelligence-systems 2015-16 I. Félév Dr. Danyi Pál - Információmenedzsment
18
Further drilled down to just stores in California
Forrás: http://www.slideshare.net/mgraham213/business-intelligence-systems 2015-16 I. Félév Dr. Danyi Pál - Információmenedzsment
19
ADATBÁNYÁSZAT (DATA MINING) Definíció Előre nem sejthető minták, törvényszerűségek, összefüggések keresése nagy adatbázisokban (“TUDÁS” feltárás) Módszerek Asszociációk Tej és kenyér; Skoda és Philips. Minek van értelme?
Szekvenciák keresése Benzin és hús; alkohol és bébiétel?
Csoportok keresése Szakácskönyvek: 20-40 év közötti nők
Feltétel Adat – forrás adat (kiválasztás) – tisztított adat – transzformált adat – minták (adatbányászat) – értékelés - tudás
2015-16 I. FÉLÉV
DR. DANYI PÁL - INFORMÁCIÓMENEDZSMENT
20
ADATBÁNYÁSZATI TECHNIKÁK – 1. Klaszteranalízis Nem jellemző egyedek elhagyása Korreláló változók elhagyása (életkor születési idő helyett) Változók összevonása (1 főre eső árbevétel)
“Ultra kommunikatívak” fogadott hívások [perc]
“Nem kommunikálók” 2015-16 I. FÉLÉV
indított hívások [perc]
DR. DANYI PÁL - INFORMÁCIÓMENEDZSMENT
21
ADATBÁNYÁSZATI TECHNIKÁK – 2. Döntési fa eljárás Regressziós eljárás Neurális hálók
Példa: 35 év feletti, jól kereső, régi ügyfél
nem vásárolt
teljes minta <35
életkor
vásárolt
>35
<200000
>200000
jövedelem <16 hónap
>24 hónap
mióta ügyfél? 2015-16 I. FÉLÉV
DR. DANYI PÁL - INFORMÁCIÓMENEDZSMENT
22
ADATBÁNYÁSZATI TECHNIKÁK – 3. Mesterséges intelligencia technikák, pl. gépi tanulás technikák: Neurális hálók
Big Data technikák? (A technikák, módszerek keverednek, ahogy újabb és újabb problémák, igények merülnek fel.)
2015-16 I. FÉLÉV
DR. DANYI PÁL - INFORMÁCIÓMENEDZSMENT
23
BI RENDSZEREK SPECIÁLIS FAJTÁI Analitikus ügyfélkapcsolat rendszer – CRM „Nem termékhez vevőt, hanem vevőhöz terméket” Adatbányászati alkalmazásai: Ügyfél szegmentáció és ügyfélmegtartás
BI
ACRM CRM
Kockázatmenedzsment Csalások felderítése és megakadályozása Direkt marketing
Keresztértékesítés
Vállalati teljesítménymenedzsment – EPM (Enterprise Performance Mgmt) Olyan rendszer, mely a vállalati teljesítmény mérésére használt mutatók alakulását követi nyomon. Pl.: Eladások egy időszakban Befektetett tőke megtérülése – ROI Befektetés megtérülési ideje
2015-16 I. FÉLÉV
DR. DANYI PÁL - INFORMÁCIÓMENEDZSMENT
24
Köszönöm a figyelmet!
2015-16 I. FÉLÉV
DR. DANYI PÁL - INFORMÁCIÓMENEDZSMENT
25