Ujj Tamás* VALÓS IDEJŐ ADATTÁRHÁZAK
Az adatbázisok alkalmazási területeit vizsgálva, sokunknak olyan alkalmazási területek jutnak az eszébe, mint egy könyvtári rendszer, jegynyilvántartás, számlák kezelése, termelési adatok, raktár nyilvántartása. Ha megpróbáljuk ezen alkalmazások közös jellemzıit megkeresni, akkor azt vehetjük észre, hogy e rendszerekben az adatbázis a vizsgált rendszer adminisztrálására szolgál, vagyis az adatbázisban a vizsgált rendszer aktuális állapota található. Egy raktári nyilvántartó rendszerben az adatbázis a raktár aktuális feltöltöttségét mutatja, megadva, hogy mely termékekbıl, mennyi és hol helyezkedik el. A klasszikus alkalmazási területekre tehát az jellemzı, hogy az adatbázisban a rendszer aktuális állapota tárolódik, az alkalmazások fı feladatai a valóságban bekövetkezı események leképezése, adminisztrálása az adatbázisban és az aktuális állapotra vonatkozó lekérdezések megválaszolása. Egy kölcsönzıi feladat tervezésénél már rögtön az elején fel szokott merülni az a kérdés, hogy egy kölcsönzés egyed mint jelentsen, egy létezı, élı kölcsönzést vagy egy valamikor megtörtént kölcsönzést. Vagyis el kell dönteni. hogy az adatbázis csak az aktuális állapot nyilvántartására, vagy a korábbi állapotok megırzésére is vonatkozzon. Ez utóbbi esetnek is van értelme és célja, hiszen a múltbeli állapotok hasznos információkat adhatnak a felhasználó számára a jövıbeni folyamatok megtervezéséhez. A letárolt, archív adatok azonban nemcsak az egyszerő visszaolvasásra használhatók föl. Már az információs rendszerek kialakulásának korai szakaszában rájöttek, hogy a letárolt adatokból a jelen helyzetben is hasznosítható információk nyerhetık ki. Egy raktári nyilvántartó rendszer esetében annak az ismerete, hogy milyen fajta árukból fogyott leginkább segítségül lehet abban, hogy a beszerzéseknél mely területekre koncentráljanak. A kiszállítások volumene pedig a várható forgalomban, a beruházások méretezésében adhat támpontot. A hagyományos, aktuális állapot lekérdezésére vonatkozó alkalmazások mellett kialakultak az információs rendszerek új elemei, melyek a múltbeli események elemzése alapján a jövıben várható folyamatok megtervezését segítik. Az így kialakuló alkalmazásokat szokás döntéstámogató rendszereknek (DSS, Decision Support System) is nevezni. A DSS rendszerek nemcsak a alkalmazott mőveleti lépésekben, a felhasznált adatmennyiségben különböznek a hagyományos alkalmazásoktól, hanem a felhasználók körében is. Míg a hagyományos alkalmazásokat az operatív tevékenységben résztvevı dolgozók használják, addig a DSS rendszerek a vállalat vezetıi számára készültek. A DSS rendszereket elsısorban a vállalat mőködését befolyásoló stratégiai kérdések megoldásánál szokták alkalmazni. A DSS rendszerek legfontosabb jellemzıi az alábbi pontokban foglalhatók össze:
*
BGF Pénzügyi és Számviteli Fıiskolai Kar, Zalaegerszegi Intézet, Informatika tanszék, fıiskolai tanársegéd.
95
K Ü L K E R E S K E D E L M I F İ I S K O L AI F Ü Z E T E K , 1 7 . • • •
•
•
•
A DSS mőködési algoritmusában az egyszerő adatolvasás és adatírások helyett az adatok analitikus, statisztikus elemzése dominál. Vagyis a DSS rendszernek a normál adatkezelı utasítások mellett rendelkeznie kell adatelemzı komponensekkel is. Az egyik legfontosabb cél az adatok mögött húzódó trendek felderítése, vagyis az események változási irányát, a változás jellegét kell meghatározni. A DSS rendszerek csak olvasassák a letárolt adatokat, s nem tartalmaznak adatmódosítási elemeket. A döntéshozáshoz csak a meglévı információkat kell felderíteni. A rendszer a döntés meghozatalát segíti, magát a döntést, a vele járó változtatásokkal már nem a DSS rendszer fogja meghozni. A megfelelı minıségő, megbízható elırejelzéshez kellı adatmennyiség szükséges. csekély múltbeli adatokból nem lehet pontos elemzést, trend számítást végezni. Emiatt a DSS rendszerek igénylik a nagy adatmennyiséget. A múltbeli állapotok megırzése miatt a DSS rendszerek nagyobb adatmennyiséget tárolnak, mint az aktuális állapot adminisztrálását végzı rendszerek. A DSS rendszerekben nagyobb szerepe jut az idıbeliségnek, vagyis annak, hogy egy adatelem, mely idıpontbeli aktuális állapotnak felel meg. A hagyományos rendszerekben az idınek nem volt ilyen nagy szerepe, hiszen, minden adat az éppen aktuális idıpontra vonatkozott. Most viszont szükségszerő minden adatelemet egy idıértékkel is összekapcsolni, ha idıbeli trendek figyelését is megkívánjuk a rendszertıl A DSS rendszereknek egy felhasználóbarát, emberközeli kezelı felülettel kell rendelkezniük, hogy a számítástechnikában kevésbé járatos személyek is alkalmazni tudják. A kezelı felület egy másik jellegzetessége, hogy a lekérdezések terén viszont megfelelı rugalmasságot kell mutatnia, hiszen a döntések meghozatalánál az a jó, ha problémát sok oldalról, többféle megközelítésben meg lehet vizsgálni, s ehhez a tárolt adatokból többféle szempont szerinti lekérdezésekre is szükség lehet. A DSS-nek tehát egy emberközeli és rugalmas lekérdezı felületet kell tartalmaznia.
Az újfajta mőveleti igényrendszer az adatkezelés felé is kihatással van. A DSS rendszerek ugyanis egy olyan adatbázis-kezelı rendszert igényelnek, melyben kevésbé fontosak a párhuzamos módosítások vezérlése, viszont hatékony és rugalmas adatlekérdezés, adatelemzési lehetıségeket kell biztosítania. Tehát a DSS-t támogató DBMS rendszereknek a DSS specifikus mőveletekre optimalizáltan kell mőködni. Ehhez • gyorsabban kell megvalósítania a nagytömegő adatok közötti kapcsolatok kezelését; • analitikus mőveleteket kell tartalmaznia; • fel kell készülni a hosszabb, a nagyobb adatmennyiséget érintı lekérdezési tranzakciók kezelésére. Mivel a klasszikus DBMS mőködési elvek egészen más tevékenységekre fektetik a hangsúlyt, ezért elnevezésben is meg szokták egymástól különböztetni az adatkezelés e két megvalósulási formátumát. A hagyományos adatkezelést nevezik OLTP (On Line Transaction Processing), azaz on-line tranzakció orientált rendszernek, míg a másik módszer az OLAP (On Line Analitical Processing), azaz on-line analitikus elemzés orientált adatkezelés. Az OLTP rendszerekben a mőködés szokványos módja a több konkurensen futó tranzakció. Ezek a tranzakciók rendszerint adatmódosítási mőveleteket tartalmaznak. Egy helyfoglalási rendszer esetén egy tranzakció magába foglalja az egy ügyfélhez kapcsolódó tevékenységeket: üres helyek lekérdezése, hely lefoglalása, visszaigazolás kinyomtatása. A rendszer egyidejőleg több tranzakciót futtathat, több száz bejelentkezett felhasználó lehet egyidejőleg. Ugyan sok tranzakció él egy idıpillanatban, de e tranzakciók rendszerint rövid életőek. Például a helyfoglalás is csak pár percet vesz igénybe. Ezalatt a rövid futásidı alatt a tranzakció viszonylag kevés elemet érintı lekérdezéseket és módosításokat hajt végre. Az OLAP rendszereknél viszont lényegesen kevesebb a párhuzamosan futó lekérdezési mőveletsor, viszont ezek igazán jól megtermett lekérdezések is lehetnek, melyek idıben is lényegesen hosszabb idıt igényelnek. Az OLAP rendszereknél nem ritka a több órás, a napos futási idejő lekérdezések sem, hiszen mögöttük hatalmas adatmennyiség áll. 96
UJJ T.: VALÓS IDEJŐ ADATTÁRHÁZAK Az OLAP és az OLTP között lényeges különbséget fedezhetünk fel a kezelt adatok jellegében is. Az OLTP rendszereknél az adatok a vizsgált terület aktuális állapotát tartalmazták. A módosítások és a konzisztens állapot megırzésének megkönnyítése végett az adatbázisban egy homogén modell szerint tárolódik az aktuális állapot. Vagyis a mőködési rendszer zömével egyetlen adatforrásra épít. Ennek számos elınye van a fejlesztés munka és karbantartási tevékenységek vonatkozásában. Az OLAP rendszerek fı célja azonban nem egy konzisztens, aktuális kép minél hatékonyabb biztosítása, hanem az hogy minél több információt nyerjünk ki a rendszerbıl. Ennek egyik biztosítéka az, ha minél szélesebb információ forrást bevonunk az értékelésbe. Mivel a vállalati források formátumukban igen lényegesen eltérhetnek egymástól (adatok egy része pl. UNIX alatti munkaállomásokon RDBMS-ben, míg másik része PC-s xBAse rendszerben, harmadik része PC-s táblázatkezelıkben tárolódik) szükség van a heterogén adatok egységes kezelésére, a heterogén adatok összedolgozására. Az 1. táblázat tartalmazza az OLTP, illetve OLAP legfontosabb jellemzıit. 1. táblázat Az OLTP és az OLAP legfontosabb jellemzıi OLTP • • • • • • •
kisebb adatmennyiség módosítások aktuális állapot a DB-ben rövid, gyakoribb tranzakciók kevés elemet érintı tranzakciók. nagy konkurencia homogén adatforrás
OLAP • • • • • • •
nagyobb adatmennyiség csak olvasás archívumok ritkább, hosszabb tranzakciók több elemet érintı tranzakciók. kisebb konkurencia heterogén adatforrás
Az OLAP rendszerekkel kapcsolatosan az egyik legfontosabb kérdés az, hogy hogyan lehet minél hatékonyabban biztosítani a komplex lekérdezések végrehajtását. Itt a lekérdezés biztosítása nemcsak a mővelet optimalizálását jelenti, hanem annak eldöntését, hogy milyen kiegészítı információkra van szükség a hatékony kezelés megoldásához. Mivel az eddig ismertetett DBMS struktúrák a klasszikus, OLTP orientált adatkezeléshez lettek illesztve, az OLAP igényeket csak körülményesen, nehezebben lehet vele megvalósítani. Vagyis a klasszikus DBMS rendszerekkel ellentétben az OLAP rendszerek fejlesztésénél szinte minden OLTP specifikus tulajdonságot a fejlesztınek kell megvalósítania az alkalmazásban. A felmerült hatékonysági problémák megoldására elindult a fejlesztés a hagyományos DBMSek olyan irányú átalakítására, hogy a kapott a rendszer alkalmas legyen az OLAP igények kielégítésére. A cél tehát egy, az OLAP igényekhez igazított DBMS rendszer kidolgozása. E kutatások eredményeként létrejött adatbázis kezelı rendszer az adattárház elnevezést kapta, melyet a DW (data warehouse) rövidítéssel is jelölhetünk. Az adattárházak szülıatyjának INMON-t szokták tekinteni, aki hasonló szerepet játszott a DW kialakulásában, mint CODD a relációs modell megszületésében. Az adattárházak fogalmának kialakulása az 1970-es évek vége körüli idıszakra tehetı. Erre az idıszakra már megjelentek az elsı nagy információs rendszerek, melyek elsıdlegese a napi mőködési rendszer igényeit szolgálták ki. Az ezen rendszerekre felépített DSS alkalmazások két súlyos hiányossággal rendelkeztek: • lassú mőveleti sebesség és • szétdarabolt adatszigetekbıl áll fenn a rendszer. Ez utóbbi annak köszönhetı, hogy a mőködési rendszernél minden nagyobb területnek megvolt a saját adatbázisa. A DSS rendszernek ezen adatbázisokból kellett összeszednie az elemzésre kerülı adatokat. 97
K Ü L K E R E S K E D E L M I F İ I S K O L AI F Ü Z E T E K , 1 7 . E hiányosságok leküzdésére megjelent egy új DSS orientált adatkezelı rendszer, az adattárház. A hagyományos mőködési rendszereket a hagyományos RDBMS rendszerek, míg a DSS alapú funkciókat pedig az adattárház vette át. INMON megfogalmazása, definíciója alapján az adattárház rendszerek témaorientált, integrált, idıben változó adatrendszernek tekinthetık, melynek elsıdleges célja a stratégiai döntések támogatása. • Subjectoriented (tárgyorientált, tematikus, témaorientáltnak) Hagyományosan az alkalmazásainkat annak funkcióit, feladatait szem elıtt tartva tervezzük, azok köré építjük. Az adattárház tárgy-orientáltságát, tematikus felépítését ehhez képest olyan értelemben szokás használni, miszerint most adott tárgyterületek köré, a meglévı és kapcsolódó adatokat szem elıtt tartva tervezünk. A hagyományos rendszerek megvalósítanak sok feladatot, a számlázás folyamatát, a beszerzést, a karbantartást és így tovább. Minden ilyen alkalmazás támogatott valamilyen saját adathalmazzal. Az adattárház építésénél azonban szeretnénk a meglévı adatokat például a vevı szerint csoportosítva, összegyőjtve kezelni, vagy más hasonló tárgyterület köré csoportosítva látni. Az adattárházban minden adatunkat ezek köré a tárgyterületek köré csoportosítjuk, győjtjük. • Integrated (integrált) Az elızı pontban említett tárgyorientált, adatvezérelt tervezéshez szorosan kapcsolódik az integráltság fogalma a következı értelemben: az adattárház az említett tárgyterületekhez kapcsolódó adatokat az érintett adatforrásokból szabványosított formára alakítva egy helyre győjti és egységbe rendezve kezeli. • Nonvolatile (nem illékony, vagyis tartós) Jelenti ez azt, hogy az adattárházban jelen lévı adatok alapvetıen változatlanok. Ha a forrásrendszer adatai változnának, az adattárház a változást követi, de úgy, hogy a bentlévı adatot megfelelı idıbélyeggel (érvényességi idıvel) látja el, majd felveszi az új állapotot is, megfelelı idıbélyeggel. A bekerült adatok tehát tartósan meg is maradnak. • Time variant (idıfüggı) A forrásrendszereink adatai nagyrészt egy adott idıre vonatkoznak, a jelen pillanatra, tehát, az adott érvényes állapotokat tárolják. Ehhez képest a megcélzott elemzések leginkább történeti adatokon és adatok idısorain használatosak. Az adattárház ennek megfelelıen az adatokat idıfüggıen, az adatokat idıpontok és idıintervallumok szerint tárolják és kezelik, a forrásrendszerek változását nyomon követve. Például, képzeljünk el egy raktárkészlet nyilvántartást. Ennek adatai ha megjelennek az adattárházban, ott nyomon követhetık és elemezhetık a raktárkészlet változásai. Az adattárházak nagy segítséget jelentenek a stratégiai döntések meghozatalában. Gyakran azonban nem mindegy, hogy ezek a döntések mikor születnek. A gyorsaságnak is döntı szerepe lehet a konkurenciával folytatott versenyben. A téves döntések lehetséges következményeivel minden vezetı tisztában van. Jelentıs kár keletkezhet akkor is ha késve születik meg az adott döntés. Egy vállalat csak akkor tud versenyképes maradni, ha a jó döntéseket idıben hozza meg. Ezeket a gyors döntési mechanizmusokat támogatják a valós idejő adattárházak. A modern szervezetek sikerének egyik kulcskérdése, milyen hatékonyan és gyorsasággal képesek összegyőjteni, majd pedig ténylegesen fel is használni a rendelkezésükre álló információt. A versenyképesség és versenyelınyök megırzésének egyik alapfeltétele, hogy a megfelelı pillanatban a lehetı legjobb döntések szülessenek meg. A valósidejő adattárházak pedig pontosan ebben a folyamatban játszhatnak meghatározó szerepet. Éppen ezért ezeket a megoldásokat az utóbbi idıben folyamatosan növekvı szakmai és piaci érdeklıdés övezi. A taktikai és operatív döntéstámogatás területeinek megnyitásával a valósidejő adattárházak felhasználási lehetıségei óriási mértékben kiszélesednek. A rendszerek jelentısen hozzájárulhatnak többek között az ügyfélkapcsolat-menedzsment, a kockázatmenedzsment, valamint a beszállítói lánc optimalizálásának, az üzleti aktivitás monitorozásának sikereihez. 98
UJJ T.: VALÓS IDEJŐ ADATTÁRHÁZAK A hagyományos adattárházak elterjedésével nem állt meg a fejlıdés. A gyors döntések támogatására kifejlesztett rendszerekkel szemben a következı elvárások fogalmazódtak meg. • továbbra is lássák el a hagyományos adattárház feladatait; • tegyék lehetıvé a friss adatok azonnali betöltését; • legyen lehetıség a friss adatok azonnali analízisére. A hagyományos rendszerek nem minden esetben felelnek meg ezen elvárásoknak. Problémát jelent az adatok nagy mennyisége valamint a periodikus frissítések közti állapotok megırzése. Ha a frissítések naponta történnek, akkor ezen idıpontok közti változások felülíródhatnak az újabb változások révén. Mit is jelent tulajdonképpen az hogy egy adattárház valós idıben hozzáférhetı adatokkal dolgozik? Minden rendszer válaszidejének kell hogy legyen felsı korlátja, vagyis ha a forrásrendszerben valamilyen változás következik be, akkor annak bizonyos idın belül meg kell jelennie a célrendszerben. Az optimális az lenne, ha ez a változás azonnal jelentkezne a kimeneten. Ez technikailag ugyan megvalósítható, de a gyakorlatban felesleges, ugyanis a költségek túl magasak az elérhetı üzleti haszonhoz képest. A másik megközelítés a beállítható késleltetés elınyeit használja ki. Ebben az esetben olyan késleltetéssel lehet az információhoz jutni, ahogy az üzletmenet megköveteli. Ha másodperces késleltetés szükséges, akkor az lesz beállítva, ha elég a negyed óra is akkor negyed óra múlva fog rendelkezésre állni az adat. Ez a módszer költséghatékonyabb, mert a vállalati információszükséglethez igazítható. Általában igaz, hogy az információ késleltetési ideje és a költségek között fordított arányosság áll fenn, vagyis a késleltetési idı csökkentésével a költségek növekedni fognak. AZ ADATKEZELÉS FOLYAMATA A hagyományos adattárházak periodikus frissítésének köszönhetıen a forrás és a célrendszerek közötti területen hosszabb ideig várakoznak a betöltésre váró adatok. Ez azonban a valós idejő követelményeknek nem felelt meg, ezért egy új áttöltési modellt kellett kifejleszteni.
1. ábra Valós idejő áttöltési modell A folyamat elsı lépése az adatok kinyerése, mégpedig a változásadatoké. A rendszer terheltségének csökkentése érdekében nem a teljes forrásadatbázist töltjük át az adattárházba, hanem csak azt ami megváltozott. Tehát csak a változásra vonatkozó információk kerülnek áttöltésre. Ezen információk tartalma: mi változott, mikor változott, hogyan változott. • •
A változásokat kétféle módon tudjuk követni: Lekérdezéses módszerrel: egy monitorozó folyamat állandóan figyeli a rendszert, amelynek a feladata a változások észlelése. Ebben az esetben állandó a rendszer erıforrás-igénye, amely a terheltség növekedését eredményezi. Eseményvezérelt módszerrel: a forrásrendszer változásai egy-egy eseménynek felelnek meg, amelyek kiváltják a folyamatokat, és ezáltal a változások nyomon követhetık. A tárolás, transzformáció és áttöltés így hatékonyabb módon oldható meg. Elınye, hogy az események bekövetkezésekor foglal csak erıforrást, csökkentve ezáltal a rendszer terheltségét. 99
K Ü L K E R E S K E D E L M I F İ I S K O L AI F Ü Z E T E K , 1 7 . A változásadatok kinyerése során néhány követelménynek meg kell felelni a rendszer megbízható mőködésének szempontjából. Változásadat nem veszhet el és a forrásrendszerbe bekövetkezett sorrendje nem módosulhat További feltétel, hogy változásadatokat csak sikeresen lezárt tranzakciók eredményeképpen kapjunk. Szükséges még, hogy a változásokat elıidézı mőveletekrıl is rendelkezzünk megfelelı információval. ADATOK ÁTALAKÍTÁSA ÉS BETÖLTÉSE Az adatok transzformálása elengedhetetlen lépés, hiszen a forrásadatbázis struktúrája legtöbbször eltér a céladatbázis sémájától. Az átalakítás folyamatosan rekordokon vagy rekordcsoportokon hajtható végre. Arra azonban mindenképpen figyelni kell, hogy a folyamatosság ellenére a rendszer teljesítménye ne csökkenjen a kritikus szint alá. Az úgynevezett csepegtetés (flow) az a folyamat, melynek során az adatok a forrásadatbázisból eljutnak a célba és bejárják a célrendszer különbözı pontjait. Az adatok átmeneti tárolókon keresztül folyamatosan áramolva jutnak el a céladatbázisba, így az itt töltött idı elenyészı melynek következtében az adatfolyamban lévı adatok mennyisége kicsi. A hagyományos adattárházak mőködése két teljesen elkülönülı szakaszból áll. Éjszakai offline idıszakban a betöltések, a nappali online üzemmódban a kizárólag a lekérdezések zajlanak. A valós idejő adattárházak esetében a betöltések és a lekérdezések egyszerre zajlanak, ezért a rendszer tervezése során megoldandó feladat a változásadatok elkülönítése a többi adattól. A valós idejő követelmények kielégítése céljából célszerő alacsony szinten tartani az adatok redundanciáját. Ezzel szemben a lekérdezési idı csökkentésére a redundáns adatstruktúrák a legmegfelelıbbek. Komoly tervezési feladatot jelent ennek a két egymásnak teljesen ellentmondó követelmény kielégítése. Az egyszerre kinyert és továbbított adatok valamint a rendszer terheltsége közti viszonyt vizsgálva érdekes következtetésre juthatunk. Ha kismérető adathalmazt mozgatunk egyszerre az nagyobb mőveletgyakoriságot eredményez és ezáltal nı a rendszer terheltsége. Ha azonban nagyobb adatcsoportokat mozgatunk az kisebb gyakorisághoz vezet, csökkentve ezzel a rendszer terheltségét, ugyanakkor nagyobb a valószínősége annak, hogy a az adatok frissességére vonatkozó követelményeknek nem tudunk kellı mértékben megfelelni. Ez a tény is komoly fejtörést okoz a rendszerek tervezıinek. EGY KONKRÉT ALKALMAZÁSI PÉLDA A HP felépített egy mintarendszert, amely bankkártya-csalások igen gyors és adaptív észlelésére alkalmas. Ennek elsıdleges mozgatórugója az volt, hogy számos intézkedés ellenére a bankkártya-csalásokkal okozott károk értéke még mindig nı, különösen az online vásárlások esetén. A legtöbb csalást úgy követik el, hogy egy kártya adatait megszerzik, és akkor használják fel azokat, amikor a kártya tulajdonosa nincs is jelen. Ebbıl kiindulva a csalások felismerésének egyik hatékony módja az, hogy megismerjük minden egyes kártyatulajdonosunk kártyahasználati szokásait és a mindenkori kártyatranzakció adatait összehasonlítjuk a tulajdonos korábbi „viselkedésével”. Az ilyen analízishez számos forrásból van szükség adatokra: kellenek a kártya és az ügyfél részletes adatai, egyes számlainformációk és végül a régebbi tranzakciók részletes adatai is annak érdekében, hogy a felderítés biztonságát javítani lehessen. Egy valós idejő felderítés megvalósításához azonnal hozzá kell jutni a kártyatranzakció valamennyi adatához, amint a tranzakció megérkezik a bankba. RÉGI ÉS ÚJ ADAT EGY HELYEN A hatékony csalásfelderítés megvalósításához tehát olyan adatokra van szükség, amelyek általában a bank különbözı rendszerei között elosztva találhatók meg. Leggyakrabban még a korábbi kártyatranzakciók adatai sem találhatók meg a tranzakciós rendszerekben, noha az
100
UJJ T.: VALÓS IDEJŐ ADATTÁRHÁZAK elemzéshez igen nagy szükség lenne rájuk. Emiatt a jelenleg elterjedt rendszerek nem is használják a historikus tranzakciós adatokat, szabály alapúak, és csak az egyes tranzakciók adatainak elemzésén alapulnak. Egy „valós idejő” analitikus rendszer használata elegánsan oldja meg az érintett problémákat, hiszen mind a historikus, mind a legfrissebb adatok ugyanabban a rendszerben hozzáférhetık. Ennek a megközelítésnek számos elınye van: • csökken a tranzakciós rendszer többletterhelése; • csökken a csalásfelderítési folyamat és az egész rendszer komplexitása; • hatékonyabb osztályozási technikákat lehet használni; amelyek lehetıvé teszik mind a már korábban felismert, mind pedig az újabb típusú csalások automatikus kiszőrését. KÉSLELTETÉS NÉLKÜL A HP csalásfelderítı rendszerében a változásadat-kinyerı, adattisztító és adatintegrációs mechanizmusok megırzik az adatok konzisztenciáját, miközben az eredı késleltetést az üzlet által igényelt akár másodperces - szinten tartják. Annak érdekében, hogy minden új tranzakció esetében azonnal felismerhetı legyen az eltérés az ügyfél szokásaitól, az eseményvezérelt adaptív osztályozó és klaszterezı algoritmust a legfrissebb tranzakciós adatokkal táplálják. Az alkalmazott technológia ugyanakkor azt is garantálja, hogy párhuzamosan azt a tudásbázist is frissítsék, amely az egyes kártyatulajdonosokat jellemzi. A felismert csalásokhoz tartozó tranzakciók adatai természetesen azonnal meg is jelenítıdnek a valós idejő prezentációs motor segítségével, hogy az emberi beavatkozás is lehetıvé váljon. A kísérleti rendszerben a teljes késleltetés eközben kevesebb, mint két másodperc. A valós idejő adattárházak az életben maradáshoz szükséges azonnali reagálás képességét biztosítják valamennyi vállalat számára, miközben a hagyományos elemzéseket-döntéstámogatást is. Az ilyen típusú rendszerek természetesen nemcsak a banki életben, hanem a szállítmányozásban és raktározásban, az információbiztonságban, a honvédelemben, de az üzleti világ szinte bármely területén is hasznosnak bizonyulhatnak. Végül a 2. táblázatban összefoglaltam a hagyományos és valós idejő adattárházak fıbb jellemzıit. 2. táblázat Hagyományos és valós idejő adattárházak fıbb jellemzıi Hagyományos
Valós idejő
Alkalmazási terület
Stratégiai döntéstámogatás
Stratégiai, taktikai és üzemeltetési döntéstámogatás
Adatok késleltetése
Egy vagy több nap
Felhasználói igények szerint egy-két másodperc is lehet
Adatkonzisztencia
Statisztikai
Nagyon magas
Felhasználói kör
Felsı és középszintő vezetık
Vállalati döntéshozók
Hardverkövetelmények
Hasonló
101