„BIG DATA” ELEMZÉSEK LEHETŐSÉGEI A KÖRNYEZETVÉDELMI MODELLEZÉSBEN
Dr. Torma A. 2015.11.13.
Tartalom
1.
A „Big Data” fogalma
2.
Pár érdekes adat a „Big Data” világából
3.
„Big Data” felhasználás klasszikus területei
4.
„Big Data” elemzésekben rejlő hasznok és kihívások
5.
Pár érdekesebb technika „Big Data” elemzésekhez
6.
Felhasználhatóság és rizikók a környezetvédelem területén
7.
Továbbvezető kutatási kérdések
2015/11/13
Dr. TORMA A. >> Széchenyi István Egyetem
2
1. A „Big Data” fogalma (1) » » »
»
»
> tera-; petabyte technológiai szint függő típusfüggő
» »
alacsony értéksűrűség (low value density)
strukturális heterogenitás (5%) magas változatosság
» »
keletkezés és feldolgozás is „real time” analízisek
»
jelentős eltérések
források komplexitása
2015/11/13
Dr. TORMA A. >> Széchenyi István Egyetem
3
1. A „Big Data” fogalma (2)
„big data” kifejezés gyakorisága dokumentumokban Forrás: ProQuest Research Library 2015/11/13
Dr. TORMA A. >> Széchenyi István Egyetem
4
2. Pár érdekes adat a „Big Data” világából napi szinten 2,5 exabyte bővülés – 2 évente duplázódó adatmennyiség 2011-ben: 1,8 zettabyte adatmennyiség (1021) 60 mrd. tablet = 250 terabyte adatfeldolgozás = 1-2 millió könyv elolvasása egy szempillantás alatt
óránként 20 terabyte adat a turbina működéséről
95% strukturálatlan adathalmaz 2015/11/13
havonta ~100 mrd. keresés a Google-ön Dr. TORMA A. >> Széchenyi István Egyetem
5
3. „Big Data” felhasználás klasszikus területei (1)
Közgazdaságtudomány
Egészségügy
»
» »
»
vásárlói szokások feltérképezése preferenciaválasztások
Politika »
Kutatás – fejlesztés » » »
autonóm közlekedés (önvezető jármű) DNS szekvenálás klímamodellezés (NCCS)
Társadalomtudományok »
választási kampányok (pl. Obama újraválasztása)
Ipari folyamatok » »
folyamatelemzés veszteségfeltárás
szociológiai / szociográfiai elemzések
2015/11/13
»
Katasztrófavédelem » »
folyamatelemzés előrejelzések
Mezőgazdaság » »
Dr. TORMA A. >> Széchenyi István Egyetem
járványok elemzése életmód és egészségi állapot feltérképezése drogprevenció
terméshozam előrejelzések precíziós mezőgazdaság
6
3. „Big Data” felhasználás klasszikus területei (2)
CERN – Nagy Hadronütköztető » » » »
2015/11/13
150 millió szenzor 40 millió adat másodpercenként az adatok mindössze 0,001% kerül elemzésre > 200 petabyte évente ha minden adatot elemeznének: 150 mill. petabyte / év > 200-szor annyi, mint a világ többi része
Dr. TORMA A. >> Széchenyi István Egyetem
7
3. „Big Data” felhasználás klasszikus területei (3)
Vestas – „Big Data” a megfelelő elhelyezés érdekében » » »
2015/11/13
2,8 petabyte adat 178 elemzett paraméter 27x27 km-es raszter helyett 3x3 km-es raszter
Dr. TORMA A. >> Széchenyi István Egyetem
8
4. „Big Data” elemzésekben rejlő hasznok és kihívások (1)
Transzparencia, adatok elérhetősége
Lehetőség a modellezésre / szimulációra
Automatikus algoritmusok alkalmazása a szubjektív döntéshozatal helyett
Adat „policy” (adatbiztonság, jogi kérdések) Szervezeti kultúra és képességek
Adatok újrahasználhatósága
Alkalmas technológia és technikák Adatok hozzáférhetősége
Innováció serkentése Erőforrások hatékonyabb felhasználása
Szegmentálás Komplex rendszerek elemzése > fenntarthatósági döntések
2015/11/13
Finanszírozás
Sztenderdek Gazdasági szektor struktúrája, versenyhelyzete
Dr. TORMA A. >> Széchenyi István Egyetem
9
4. „Big Data” elemzésekben rejlő hasznok és kihívások (2)
Egyes szektorok lehetséges hasznai a „big data” elemzésekből Forrás: McKinsey Global Institute 2015/11/13
Dr. TORMA A. >> Széchenyi István Egyetem
10
5. Pár érdekesebb technika „Big Data” elemzésekhez
citizen science/ PPSR
crowdsourcing data mining
Internet of Things
Big Data elemzés
neural networks
time series analysis
2015/11/13
social media
smart…
business intelligence
Industry 4.0
Dr. TORMA A. >> Széchenyi István Egyetem
11
6. Felhasználhatóság és rizikók a környezetvédelem területén
technológiák optimálása és változtatása komplex rendszerek elemzése veszteségfeltárás és veszteségcsökkentés előrejelzések, szimulációk globális összefüggések modellezése
2015/11/13
nagy volumenű dolgok elemzése vs. mikroszintű folyamatok
többszörös összevetés problémája
big data – pig data dilemma (minőség)
nagy számok törvénye > helytelen trendek
múltbéli predikciók rögzülése
személyiségi jogok
Dr. TORMA A. >> Széchenyi István Egyetem
12
7. Továbbvezető kutatási kérdések
adatmennyiség és modellezési képesség összefüggései költség – haszon mérleg break even pont kérdése adatminőség garantálásának kérdése social media alapú big data elemzések idősorokon alapuló előrejelzés lehetősége
2015/11/13
Dr. TORMA A. >> Széchenyi István Egyetem
13
KÖSZÖNÖM A MEGTISZTELŐ FIGYELMET!
Dr. TORMA A. [
[email protected]]