A nagy adathalmazokkal kapcsolatos kormányzati feladatok
vezetői tájékoztató anyag a „big datá”-ról
1 Összefoglalás Hatalmas gazdasági, foglalkoztatási, életminőség-javítási potenciál rejlik az egyre nagyobb mennyiségben keletkező elektronikus adatokban – különösen a gyorsan növekvő méretű adathalmazokban. Az Európai Bizottság legutóbb közleményben hívta fel a tagországok figyelmét, hogy ne menjenek el lehunyt szemmel a „big data” mellett. (Angol terminológiában így nevezik a különösen nagy adathalmazokat.) Az igen nagy méretű adathalmazok már nem dolgozhatók fel hagyományos módszerekkel, ezért – de más okok miatt is – nagy kihívást jelent a kormányzatok számára a hasznosításuk. Ráadásul önmagukban nem is kezelhetők e kihívások, mivel ez a szakterület több más területtel is szoros kapcsolatban van. Az alábbi tájékoztató felvázolja a nagy adathalmazokban rejlő lehetőségeket, felsorolja a legfontosabb problémákat, kapcsolódó területeket, és megnevezi a legsürgősebb teendőket. Ez utóbbiak közül elsőként javaslatot tesz egy mélyebb helyzetelemzést, problémafeltárást, valamint egy részletesebb tevékenységi tervet tartalmazó fehér könyv elkészítésére, egyúttal felvetve, hogy akár sor kerülhetne egy olyan, átfogó kormányzati adatpolitikai stratégia kidolgozására is, amelynek részét képezhetné a nagy adathalmazok problematikája.
2 Bevezetés Minden percben 1,7 billiárd (1,7 x 1015) bájt mennyiségű adat keletkezik világszerte, ráadásul az adatforgalom és az adatszolgáltatás volumene évente 40%-kal nő, ami hétszer gyorsabb, mint az információs és kommunikációs piac teljes növekedése. Különösen figyelemreméltó, hogy ennek a gigantikus mennyiségű adatnak köszönhetően jelentős előrelépést
sikerült
elérni
több
területen,
pl.
az
egészségügyi
diagnosztika,
a
szélerőműparkok helyszínének kiválasztása, a közlekedési torlódások megelőzése, a terméshozamok előrejelzése, a személyre szabott orvoslás és az élelmiszer-logisztika terén. A nagy adathalmazok technológiája és a kapcsolódó szolgáltatások globális piacának értéke 2015-re el fogja érni a 16,9 milliárd USA dollárt, és várhatóan sok százezer ehhez kapcsolódó munkahely fog létesülni világszerte. A döntéseiket az adatokból nyert
ismereteik
alapján
meghozó
vállalkozások
5-6%-kal
képesek
növelni
termelékenységüket, a kormányok pedig lényegesen jobb minőségű döntéseket hozhatnak, ha hatásvizsgálataikhoz felhasználják a kormányzatban keletkezett óriási
-2-
adatvagyont.1 Az okos mobileszközök térnyerésével óriási lehetőségek nyílnak meg a valósidejű és a meghatározott földrajzi helyekhez, különösen a felhasználók aktuális tartózkodási helyéhez kapcsolódó információk hasznosítása révén mind a magánemberek, mind a vállalkozások számára. A
különlegesen
nagy
adathalmazokkal,
melyek
mérete
néhány
terabájttól
akár
petabájtokig is terjedhet, két okból is külön kell foglalkozni: egyrészt nemcsak mennyiségileg több információ nyerhető belőlük, mint a kisebb adatbázisokból, nyilvántartásokból, hanem teljesen más, a döntések előkészítéséhez sokkal jobban használható információk is, másrészt speciális technikákat igényel az ilyen adathalmazok kezelése, egymással kombinált felhasználása és a speciális információk kinyerése.
3 Problémák és tennivalók Annak érdekében, hogy az EU tagállamainak kormányai, a polgárok és a vállalkozások minél nagyobb mértékben ki tudják aknázni az adatokban rejlő lehetőségeket, az Európai Bizottság már több közleményben is felhívta a tagállamok figyelmét a nagy adathalmazokban rejlő lehetőségekre és az elhárítandó akadályokra. A legutóbbi, 2014. július 2-án közzétett bizottsági közlemény megállapításait a magyar helyzetre vetítve az alábbiakban fogalmazhatjuk meg, hogy hazánkban mi hátráltatja a technológiának a kormányzati szférában való térnyerését: 1. nincs a témával foglalkozó, kormányzati szintű stratégia, elemzés, koncepció; 2. nincs kellő ismertsége a témának az állami döntéshozók és a potenciális felhasználók szintjén, így nincs kifejezett – akár anyagi források elkülönítését is vállaló – döntéshozói elkötelezettség sem a témában rejlő lehetőségek kiaknázása mellett; 3. széttagolt és bonyolult a jogi szabályozás; 4. hiányzik a kellő infrastruktúra, és nem elegendők a finanszírozási lehetőségek; 5. nincs elég adatszakértő, illetve megfelelő felkészültségű egyéb szakember; 6. nincs sem országon belüli, sem más országokkal való együttműködés a témában.
1
A 2014. július 2-án közzétett Európai Bizottsági sajtóközlemény:„A Bizottság felhívja a tagállamok figyelmét, hogy ne menjenek el lehunyt szemmel a „big data” mellett” European Commission - IP/14/769, 02/07/2014
-3-
Ugyancsak a bizottsági közlemény nyomán az alábbi kormányzati teendők látszanak a legfontosabbaknak a problémák kezelésére: 1. egy könnyen érthető, széles körben megvitatandó stratégiai előkészítő anyag elkészítése; 2. a hazai és nemzetközi adatszabványok feltérképezése, a hiányosságok azonosítása; 3. a vonatkozó szabályozás felülvizsgálata, a gyűjtött adatokhoz fűződő tulajdonjogok és az adatszolgáltatással kapcsolatos felelősségek megfelelő szabályozása; 4. együttműködési formák keresése a köz-, a vállalati, a civil és az akadémiai szféra adattulajdonosai, szolgáltatói, kutatói és felhasználói között hazánkban és külföldön egyaránt; 5. bekapcsolódás a Horizont 2020 kutatási és innovációs program keretében létrehozandó nyíltadat-inkubátor létrehozásába, ami megkönnyíti a kkv-k számára ellátási láncaik kiépítését és a felhőalapú számítástechnika nagyobb fokú kihasználását; 6. szuper-számítástechnikai kiválósági központok („centers of excellence”) fejlesztése a képzett adatszakértők számának növelése érdekében. Mindehhez
hozzátehetjük
még,
hogy
a
nagy
adathalmazokkal
kapcsolatban
a
kormányzatnak további sokrétű szerepe van, amit célszerű már a stratégiaalkotás fázisában megfelelően kezelni: az ország versenyképessége növelése érdekében a megfelelő jogszabályi és innovációs környezet megteremtésével ösztönöznie, támogatnia kell a nagy adathalmazokhoz kapcsolódó „ipar” fejlődését; példát
kell
mutatnia
felhasználójaként
a
(jobb
nagy
adathalmazokhoz
minőségű
kapcsolódó
döntés-előkészítés,
személyre
termékek szabott
szolgáltatások nyújtása stb.); „alap- és üzemanyagot” kell biztosítania a nagy adathalmazokhoz kapcsolódó fejlesztések és szolgáltatások számára a közadatok minél nagyobb hányadának nyilvánossá tétele által. Nagyon fontos annak tudatosítása, hogy korunkban az adatok – beleértve a nagy adathalmazokat is – a munkaerőhöz, a természeti kincsekhez hasonlóan termelőerővé válnak, ráadásul olyan termelőerővé, amely a használata során nem kopik el, újra és újra hasznosul, ha megfelelő környezetbe helyezzük. -4-
4
Kapcsolódó területek
Az alábbiakban felsorolunk néhány kapcsolódó területet, amit a készítendő stratégiának feltétlenül figyelembe kell még vennie, mivel a nagy adathalmazok problematikáját általában nem lehet önállóan tárgyalni. A. Nyílt adatok, közadatok újrahasznosíthatósága, döntés-előkészítéshez szükséges adatok A világban keletkező, rohamosan növekvő mennyiségű elektronikus adatok különböző halmazokba rendezhetők. Az egyes halmazok kapcsolatát az alábbi ábra szemlélteti:2
Az egyes adatféleségek közötti összefüggések
Az ábrából látható, hogy világon fellelhető valamennyi adatnak csak egy része alkot nagy adathalmazokat („big data”), vagyis különlegesen nagy volumenű, gyorsan keletkező, digitálisan rögzített adategyütteseket. Vannak és továbbra is lesznek más 2
Forrás: Big data: The next frontier for innovation, competition, and productivity - McKinsey Global Institute, 2011
-5-
jellegű és felhasználású adatok is, pl. papíralapú információk, hagyományos formában rögzített kép és hanganyagok stb. A nyílt adatok („open data”) jelentős része nagy adathalmaz, de a hagyományos adatok egy része is megfelelhet a nyílt adatállományokkal szemben támasztott követelményeknek,
miszerint
a
kormányzatok,
intézmények,
vállalatok
és
magánszemélyek az általuk birtokolt adatokat mások rendelkezésére bocsájtják, úgy, hogy azok újrahasznosítása a felhasználók széles köre számára megengedett. A nyílt adatok gépi felhasználásra, automatikus feldolgozásra alkalmas formában kerülnek nyilvánosságra,
ingyen,
esetleg
elhanyagolható
nagyságú
díjazás
ellenében
használhatóak, felhasználásukat, átalakításukat és szétosztásukat jogszabályok nem, vagy csak csekély mértékben korlátozzák. A nyílt adatok halmazának a nyílt kormányzati adatok („open government data”) egy speciális és igen fontos részét képezik. A nyílt kormányzati adatok lényege abban áll, hogy a közpénzen gyűjtött adatokat újrahasznosítás céljából a kormányzatok a társadalom rendelkezésére bocsássák, ezáltal felpezsdítsék a vállalkozói kedvet, és serkentsék a gazdasági növekedést. Fontos hangsúlyozni, hogy a nyílt adat nem azonos a kormányzati munka átláthatóságát, a közpénzek elköltését nyomon követő adatoknak az információ szabadsága jegyében történő nyilvánosságra hozatalával, bár a két halmaznak vannak közös részei. A „MyData” halmaz azokat az adatokat, információkat tartalmazza, amelyeket természetes és jogi személyekről gyűjtenek az állami intézmények, pénzügyi és közüzemi szolgáltatók, különféle termékeket és szolgáltatásokat értékesítő cégek, és megosztják azokkal, akikről gyűjtötték ezeket. Pl. az egészségügyi intézmények hozzáférhetővé vizsgálataikra
teszik
a
vonatkozó
pácienseik
számára
információkat,
vagy
a
betegségeikre,
a
bankunk
kezelésükre,
lehetővé
teszi
a
számlaforgalmunk ellenőrzését, a mobilszolgáltatónktól hívásinformációkat kérhetünk stb. A nagy adathalmazok jelentős része a közszférában keletkezik (téradatok, statisztikai, egészségügyi, meteorológiai, környezetvédelmi adatok stb.), és többségük közérdekű adatnak vagy közérdekből nyilvános adatnak minősül. Ezen adatok nagy hányada a -6-
közadatok újrahasznosítására vonatkozó európai uniós irányelv3 (az ún. PSI-irányelv) és az azt átültető magyar szabályozás4 hatálya alá is tartozik. A nagy adathalmazok problematikájának ezért egyik központi kérdése azok elérhetősége, hozzáférésük költsége. Általános elvárás például, hogy a tagállamok gondoskodjanak a közadatok további felhasználhatóságáról, továbbá, hogy minden ilyen adathalmazt a jövőben a további felhasználhatóságuk figyelembevételével készítsenek el. A közadatok ügyének jelentőségét az EU stratégái is felismerték, ezért a Digitális Menetrend I.
pillérjének 3.
intézkedése a közadatok újrahasznosításának
fontosságáról szól. 2011 decemberében a Bizottság egy, a nyílt adatokra vonatkozó csomagtervet5 fogadott el, aminek sarkalatos pontját képezi, hogy aktualizálni kell a közszféra
birtokában
lévő
információvagyon
újrahasznosítására
vonatkozó
PSI
irányelvet. Ez 2013 júniusában történt meg, ekkor adta ki a Parlament és a Tanács a PSI irányelv módosításáról szóló iránylevét.6 Az ebben foglaltakat a tagállamoknak legkésőbb 2015. június 30-ig kell beilleszteniük a nemzeti jogszabályaikba. Az új PSIirányelv legfontosabb kitétele, hogy alapesetben minden közadat újrahasznosítható, külön kell meghatározni azon adatok körét, amelyekre nem vonatkozik ez a szabály. Megjegyezzük még, hogy a nagy adathalmazok jelentős részére a központi államigazgatási szerveknek döntéseik előkészítéséhez is szükségük van, ezért ezekre az
adathalmazokra
vonatkozik
a
döntés-előkészítéshez
szükséges
adatok
hozzáférhetőségének biztosításáról szóló szabályozás is.7
3
Az Európai Parlament és a Tanács 2003/98/EK Irányelve (2003. november 17.) a közszféra információinak további felhasználásáról
4
2012. évi LXIII. törvény a közadatok újrahasznosításáról
5
COM(2011) 882 A Bizottság közleménye az Európai Parlamentnek, a Tanácsnak, a Gazdasági és Szociális
Bizottságnak és a Régiók Bizottságának. Nyílt adatok– az innováció, a növekedés és az átlátható kormányzás mozgatórugói 6
Az Európai Parlament és a Tanács 2013/37/EU Irányelve (2013. június 26.) a közszféra információinak további felhasználásáról szóló 2003/98/EK irányelv módosításáról
7
2007. évi CI. törvény a döntéselőkészítéshez szükséges adatok hozzáférhetőségének biztosításáról 335/2007. (XII. 13.) Korm. rendelet a döntéselőkészítéshez szükséges adatok hozzáférhetőségének biztosításáról szóló 2007. évi CI. törvény végrehajtásáról
-7-
B. Nemzeti adatvagyon, nyilvántartások minősége, együttműködő-képessége A nagy adathalmazok többsége része a nemzeti adatvagyonnak. Egy részük egyúttal olyan nyilvántartás is, amelynek minősége javításra szorul, és amelyek harmonizálását, együttműködő-képességét meg kell teremteni használhatóságuk érdekében. Az előző EU-s költségvetési ciklusban több közfeladatot ellátó szerv nyilvántartásának és információs
rendszerének
fejlesztése
valósult
meg
az
EKOP-ból
történő
finanszírozással (pl. a KSH elektronikus adatgyűjtési rendszerének fejlesztése és kiszélesítése, a központi szabálysértési nyilvántartás megvalósítása, az integrált nemzeti ingatlankataszter
létrehozása,
Központi Illetményszámfejtési Rendszer
kifejlesztése).
C. Adatvédelem Sok nagy adathalmaz tartalmaz személyes adatokat is. Az ilyen jellegű adathalmazok feldolgozása, felhasználása jelentős adatvédelmi aggályokat vethet fel, amelyek megfelelő kezelése akár közbizalmi kérdésként is tekinthető. A meglévő nemzetközi példák (legjobb gyakorlatok) esetében ezért központi kérdés az anonimizálás köre, módja, feltételei. A hazai stratégiaalkotásnál emiatt kiemelten vizsgálandó az adatok felhasználhatósága, az anonimizálás köre és módja, a külföldön az anonimizálásra már létező műszaki megoldások hazai alkalmazhatósága, továbbá az anonimizálással kapcsolatos közbizalom megszerzésének módszertana.
D. Felhőtechnika, szuper-számítástehnika Méretüknél fogva a nagy adathalmazokban rejlő lehetőségek a felhőalapú technika és esetenként a szuper-számítástehnika alkalmazásával aknázhatók ki leginkább. Ilyen technikát a nagy nemzetközi cégek már régóta alkalmaznak. Az Európai Unióban úgynevezett kiválósági központokat javasolnak létrehozni ezeken a területeken a nagy hozzáadott értékű feladatok elvégzésére. A kiválósági központokban lehetőség nyílik az emberi és technológiai (számítógépes) erőforrások minél jobb kihasználására, a felhasználók által igényelt alkalmazások fejlesztésére. A szuper-számítástehnikán kívül fontos szerepet kap az adatok menedzselése, tárolása, összekapcsolása és a biztonság. A Horizont 2020 Tudományos Kiválóság fejezetében (Centres of Excellence for computing applications, EINFRA-5-2015) 2015-ös határidővel kiírásra kerülő pályázat ezt a témát hirdette meg. Magyarországon szóba jöhet a szuper-8-
számítástehnikával foglalkozó NIIFI és MTA SZTAKI, továbbá a kiválósági központként működő EIT ICT Labs társult tagjaként az ELTE-BME szerepe is fontos lehet.
E. Adatbiztonság, kiberbiztonság A nagy adathalmazok felhasználásához szorosan kapcsolódó adatbiztonság és kiberbiztonság területén nagy hiány mutatkozik a szükséges infrastruktúra és szakértelem tekintetében, amely elengedhetetlen a nagyméretű és bonyolult adatok lehetőségeinek kiaknázásához. A stratégiaalkotás során az adatok tulajdonjogának új értelmezését
lehetővé
tevő
szabályrendszer
megalkotása
mellett
az
olyan
adatszolgáltatásért viselt felelősségeket is újra kell gondolni, amelynek során a dolgok internetéből (IoT), valamint a gép-gép (M2M) kommunikációból származó adatok jelennek meg.
5 Finanszírozási lehetőségek A stratégiai előkészítő anyag elkészítése, az adatszabványok feltérképezése, a nyíltadatinkubátor létrehozásába történő bekapcsolódás, szuper-számítástechnikai kiválósági központok fejlesztése finanszírozásának vizsgálatakor első körben az operatív programok keretében
történő
projektnevesítés
és
elszámolhatóság
kérdése
vizsgálandó.
A
szakminisztériumok tájékoztatása alapján nem jelent problémát, hogy jelenleg egyik operatív program sem nevesíti a feladatot, ugyanis pl. a GINOP szerteágazó informatikai és kutatásfejlesztési, innovációs prioritásai és intézkedései lehetőséget biztosítanak arra, hogy a nagy adathalmazok kérdésköre szerepelhessen egyes projektekben. A Horizont 2020 program keretében egyértelmű lehetőség mutatkozik a finanszírozásra, itt az állami szerepvállalás mikéntje lehet kérdéses, mivel direkt EU-s pályázatokról van szó és a jelentkezők az állami szektoron kívülről is indulhatnak. Az állami szerepvállalás a potenciális
pályázók
azonosítása
és
ösztönzése
lehet,
illetve
egy
többszereplős
konzorciumban képzelhető el közigazgatási szerv belépése. Az Európai Hálózatfinanszírozási Eszköz (CEF) 2014-es munkatervéhez jelenleg két pályázati csatorna van nyitva, de ezek nem a nagy adathalmazok témakörére fókuszálnak. Egyeztetés alatt van a tagállamokkal a CEF 2015-ös munkaterve, aminek része lehet a nagy adathalmazok kérdésköre is.
-9-
Megvizsgálandó továbbá, hogy a Kutatási és Technológiai Innovációs Alap forrásai igénybe vehetők-e ilyen célokra.
6 Javasolt első lépés Javasoljuk, hogy első lépésként készüljön a szakterületre vonatkozóan egy fehér könyv, amely megfelel a kormányzati stratégiai irányításról szóló 38/2012. (III. 12.) Korm. rendelet 34. §-ában foglalt követelményeknek. A dokumentum javasolt tartalma: 1) A szakterület bemutatása - elemzések, trendek - kapcsolódó szakterületek 2) Hazai és nemzetközi helyzetelemzés - hazai adatvagyon áttekintése - nagy hazai adattárház-projektek (NAV, OEP stb.), kutatási eredmények (MTA SZTAKI, ELTE, BME, NIIFI stb.), Big Data Public Private Forum, sikeres nemzetközi projektek, legjobb gyakorlatok - az EU páneurópai törekvései, finanszírozási lehetőségek - az EU tagállamai és más országok eredményei, hazai hasznosításra alkalmas jó gyakorlatai - szabályozás, szabványosítás 3) Kormányzati lépéseket igénylő kihívások - vonatkozó kormányzati stratégia elkészítése - hazai és nemzetközi (köztük uniós) együttműködések kialakítása - szabályozás felülvizsgálata - szabványosítás - kiválósági központok fejlesztésének ösztönzése 4) A javasolt beavatkozások területei - szabályozási szint - közpolitikai szint - finanszírozási szint
- 10 -
A javasolt fehér könyv az elkészítésére vonatkozó vezetői döntés megszületése után, a szükséges erőforrások megléte esetén és az érintett szervek (az európai uniós források felhasználásáért, a kutatás-fejlesztésért és technológiai innovációért, az informatikáért, az e-közigazgatásért felelős minisztériumok) érdemi együttműködése mellett 4-6 hónap alatt elkészíthető. (Hasonló jellegű, más témájú dokumentum megírása az előző EU-s költségvetési ciklusban az ÁROP források terhére valósult meg – pl.: Zöld könyv az infokommunikációs szektor 2014-2020 közötti fejlesztési irányairól.) Javasoljuk továbbá, hogy a fehér könyvön túl készüljön egy átfogóbb stratégiai tervdokumentum a teljes kormányzati adatpolitikáról, amely a nagy adathalmazok felhasználásán túl kiterjedne a nyílt adatokra, a közadatok újrahasznosítására, a nemzeti adatvagyonra és a nyilvántartások kérdéseire is, különös tekintettel a módosított PSIirányelv hazai jogrendszerbe történő beillesztésére. Egy ilyen dokumentum elkészítése természetesen már lényegesen összetettebb feladat lenne.
- 11 -
I. melléklet: A témában figyelembe vehető szabályozások, stratégiák, intézkedési tervek Konkrétan a témára vonatkozó szabályozásra nincs példa: valószínűleg ilyenre nincs is szükség. Amint azonban a korábbiakban már szerepelt, a nagy adathalmazok kérdésköre szorosan
kapcsolódik
más
témákhoz
(nyílt
adatok,
közadatok
újrahasznosítása,
adatvédelem, szellemi tulajdonjogok, adatbiztonság, kiberbiztonság stb.), amelyeknek kiterjedt szabályozásuk van világszerte, így hazánkban is, sőt számos területen uniós szabályozás is van érvényben. Mindezen jogforrásoknak még csak a felsorolása is meghaladja ezen anyag kereteit, de az uniós és a hazai szabályozás fontosabb elemei már szerepeltek a korábbi fejezetek lábjegyzeteiben. Koncepcionális, stratégiai szinten elsősorban az „Úton a prosperáló adatközpontú gazdaság felé” című bizottsági
közleményt
érdemes
megemlíteni8.
Ez
a
téma
fontosságának, az európai helyzetnek, a problémáknak bemutatásán, kitörési pontok keresésén túl egy nagyon általános, elsősorban a Bizottságot érintő feladattervet vázol fel a közösségépítés és a keretfeltételek kialakítása terén. Egy ennél szélesebb tematikájú anyag is készül az Európai Unióban: az Európai adat értéklánc stratégia, amelynek még csak tervezete ismert Ez célul tűzné ki egy koherens európai adat ökoszisztéma kiépítését, az adatokkal kapcsolatos kutatások és innováció ösztönzését és az adatokban rejlő értékek felszínre hozásához szükséges keretfeltételek megteremtését. A szakterület országos stratégiai szintű kezelésére Ausztráliában láthatunk példát.9 Az anyag olyan központi feladatok kijelöléséig jut el, mint útmutató készítése kormányzati intézmények és szakemberek számára, akadályok beazonosítása, ismeretek növelése, adatregiszter létrehozása, műszaki fejlődés monitorozása. Más országok, pl. UK, Franciaország, Ausztria esetében inkább az jellemző, hogy nincs külön stratégiájuk erre a területre, hanem országos adatstratégiájukban kap jelentős szerepel a nagy adathalmazok használata10. 8
Úton a prosperáló adatközpontú gazdaság felé, A Bizottság közleménye az Európai Parlamentnek, a
Tanácsnak, az Európai Gazdasági És Szociális Bizottságnak és a Régiók Bizottságának, Brüsszel, 2014.7.2. COM(2014) 442 final 9
The Australian Public Service Big Data Strategy, 2013
10
Pl.: Seizing the data opportunity. A strategy for UK data capability, 2013
- 12 -
Megemlíthető még az is, hogy a Horizont 2020 uniós keretprogram ICT-15-2014 akciójában is szerepel a nyílt adatok mellett a nagy adathalmazokkal kapcsolatos kutatás, az ICT-16-2015 akció pedig kimondottan a nagy adathalmazokról fog szólni. Az ICT-152014-re 88 javaslat érkezett, amiből 9-et fogadtak el. Célszerű lesz figyelemmel kísérni ezeknek a projekteknek az előrehaladását is, mert hasznos információkkal szolgálhatnak a téma fejlődésével kapcsolatosan.
- 13 -
II. melléklet: Nagy adathalmazokat elemző termékek A piacon számos olyan eszközt kínálnak, amely alkalmas nagy adathalmazok kezelésére, elemzésére. A jelen dokumentum keretei összehasonlító vizsgálatot nem tesznek lehetővé, ezért csak egy példálózó felsorolásra szorítkozhatunk:
1010data eszközei
Actian termékei
Cloudera Enterprise
EMC Big Data termékei (pl. Big Data Explorer)
FICO Big Data eszközei
HP HAVEn
Hortonworks Data Platform (HDP)
IBM Watson Foundation
InfiniDB eszközei
Infobright termékei
Kognitio szoftvere
MapR terméke
Microsoft Azure HDInsight
Oracle Big Data termékei (Big Data Appliance, Big Data SQL, Exadata Database Machine, Big Data Connectors stb.)
Pivotal Big Data eszközei
SAP HANA
Software AG Big Data eszközei
TERADATA termékei
- 14 -