Alkalmazott Informatikai Intézeti Tanszék
MŰSZAKI INFORMATIKA
A Wolfram Alpha tudásgép
https://www.wolframalpha.com/
Dr.Dudás László
0.
Alkalmazott Informatikai Intézeti Tanszék
MŰSZAKI INFORMATIKA
Dr.Dudás László
Témakörök Bevezetés Történeti háttér – az idevezető út Technológia – a négy komponens Technológia – Érdekes tények
Konklúzió
Forrás: Pedro Gaspar: SIGC 2010/2011 Wolfram Alpha . An introduction to the underlying technology
1.
Alkalmazott Informatikai Intézeti Tanszék
MŰSZAKI INFORMATIKA
Dr.Dudás László
Bevezetés
Nem egy – alapvetően szintaktikai - keresőprogram, mint pl. a Google, vagy a Bing
Nem olyan statikus ismerethalmaz, mint a Wikipédia, vagy az Encyclopédia
Valós idejű számítási válaszadó rendszer
Forrás: Pedro Gaspar: SIGC 2010/2011 Wolfram Alpha . An introduction to the underlying technology
2.
Alkalmazott Informatikai Intézeti Tanszék
MŰSZAKI INFORMATIKA
Dr.Dudás László
Bevezetés
Cél: „A Wolfram Alpha hosszútávú célja minden rendszerezett tudás azonnali számíthatóságának és elérhetőségének biztosítása mindenki számára.”
Rendszerezett tudás: - Tárgyszerű adatok - Modellek - Módszerek - Algoritmusok - Képletek Forrás: Pedro Gaspar: SIGC 2010/2011 Wolfram Alpha . An introduction to the underlying technology
3.
Alkalmazott Informatikai Intézeti Tanszék
MŰSZAKI INFORMATIKA
Dr.Dudás László
Bevezetés
Már kidolgozott területek: - Matematika - Statisztika és adatelemzés - Fizika - Kémia - Anyagok - Műszaki tudományok - Csillagászat - Földtudományok - Élettudományok - Számítástudomány - Egységek és mértékek - Dátumok és időpontok - Időjárás - Helyszínek és geográfia - Emberek és történelem - Kultúra és média - Zene
- Szavak és nyelvészet - Sport és játékok - Színek - Pénz és üzlet - Szocio-ökonómiai adatok - Egészség és gyógyászat - Étel és táplálkozás - Oktatás - Szervezetek - Szállítás - Technológiák - Web- és komputerrendszerek
Forrás: Pedro Gaspar: SIGC 2010/2011 Wolfram Alpha . An introduction to the underlying technology
4.
Alkalmazott Informatikai Intézeti Tanszék
MŰSZAKI INFORMATIKA
Dr.Dudás László
Történeti háttér – az idevezető út
A névadó és projektvezető: Stephen Wolfram Öt éves munka betetőződése és 25 éves megelőző fejlesztésé Stephen a Wolfram Research céget 1987-ben indította, elsősorban a Mathematica szoftverre összpontosítva A szoftver a Mathematicán alapul és 2009-ben 7 millió programsorból állt. CPU-k ezrein fut 4 helyszínre szétosztva (2009).
Forrás: Pedro Gaspar: SIGC 2010/2011 Wolfram Alpha . An introduction to the underlying technology
5.
Alkalmazott Informatikai Intézeti Tanszék
MŰSZAKI INFORMATIKA
Dr.Dudás László
Történeti háttér – az idevezető út
2002-ben Stephen publikálta az „A New Kind of Science” c. könyvét Ingyenes elérés a weben! A könyvben lefektetett elveken alapuló terméket 2004-ben kezdték fejleszteni Wolfram Alpha néven A Wolfram Alpha hivatalosan 2009-ben jelent meg a közönség számára.
https://www.wolframscience.com/nksonline/toc.html Forrás: Pedro Gaspar: SIGC 2010/2011 Wolfram Alpha . An introduction to the underlying technology
6.
Alkalmazott Informatikai Intézeti Tanszék
MŰSZAKI INFORMATIKA
Dr.Dudás László
Történeti háttér – számítható tudás
A Rendszerezett Adatok és a Kiszámítható Tudás története Krisztus előtt 20 000-re nyúlik vissza az aritmetika feltalálásával. Lásd: http://www.wolframdatasummit.org/2010/timeline.html
Tudományos könyvek, enciklopédiák, népszámlálások, térképek már az Ősi Mezopotámia óta gyűjtik az adatokat.
Forrás: Pedro Gaspar: SIGC 2010/2011 Wolfram Alpha . An introduction to the underlying technology
7.
Alkalmazott Informatikai Intézeti Tanszék
MŰSZAKI INFORMATIKA
Dr.Dudás László
Technológia – a négy komponens
Hogyan épül fel és működik a Wolfram Alpha? A felépítés négy modulon alapszik
Forrás: Pedro Gaspar: SIGC 2010/2011 Wolfram Alpha . An introduction to the underlying technology
8.
Alkalmazott Informatikai Intézeti Tanszék
MŰSZAKI INFORMATIKA
Dr.Dudás László
1. modul - Adatgyűjtés
Területek szakértői segítik a teamet a legjobb adatok megtalálásában és ellenőrzésében. Külső, szervezeten kívülről jövő adatfelajlánlás szintén lehetséges, de az összes ilyen adatot szigorúan ellenőrzik. Az adatok gyakorlatilag 100%-a nem az Internetről származik. Az adatgyűjtés és ellenőrzés a munka kb. 5%-a.
Forrás: Pedro Gaspar: SIGC 2010/2011 Wolfram Alpha . An introduction to the underlying technology
9.
Alkalmazott Informatikai Intézeti Tanszék
MŰSZAKI INFORMATIKA
Dr.Dudás László
1. modul - Adatgyűjtés
Forrás: Pedro Gaspar: SIGC 2010/2011 Wolfram Alpha . An introduction to the underlying technology
10.
Alkalmazott Informatikai Intézeti Tanszék
MŰSZAKI INFORMATIKA
Dr.Dudás László
11.
2. modul – Formalizálás
A gyűjtött adatok szervezése, hogy feldolgozhatóvá váljon. Az adat jelöléseinek, egységeinek, és a többi adathoz való kapcsolődásának meghatározása Az adatok algoritmikus kódolása, hogy amikor szükség van rájuk, rendelkezésre álljanak – kiszámítható adatok. Az algoritmusok, modellek és egyenletek kódolása a Mathematica program nyelvén, mely egyben a Wolfram Alpha programozási nyelve is.
Forrás: Pedro Gaspar: SIGC 2010/2011 Wolfram Alpha . An introduction to the underlying technology
Alkalmazott Informatikai Intézeti Tanszék
MŰSZAKI INFORMATIKA
Dr.Dudás László
2. modul – Formalizálás..
A Mathematica nyelvén tetszőleges strukturált kifejezések reprezentálhatók. Eredményként a kód tömörebb, mint pl. a Java, vagy Python nyelveknél. A Mathematica hatalmas függvény- és algoritmuskészlettel bír, melyen új, akár összetettebb algoritmusok is implementálhatók.
Az új függvényekkel még könnyebb az új algoritmusok implementálása.
Forrás: Pedro Gaspar: SIGC 2010/2011 Wolfram Alpha . An introduction to the underlying technology
12.
Alkalmazott Informatikai Intézeti Tanszék
MŰSZAKI INFORMATIKA
Dr.Dudás László
2. modul – Formalizálás..
Példa egy formalizálásra
Forrás: Pedro Gaspar: SIGC 2010/2011 Wolfram Alpha . An introduction to the underlying technology
13.
Alkalmazott Informatikai Intézeti Tanszék
MŰSZAKI INFORMATIKA
Dr.Dudás László
2. modul – Formalizálás..
Példa egy másik formalizálásra
Forrás: Pedro Gaspar: SIGC 2010/2011 Wolfram Alpha . An introduction to the underlying technology
14.
Alkalmazott Informatikai Intézeti Tanszék
MŰSZAKI INFORMATIKA
Dr.Dudás László
3. modul – Természetes nyelv feldolgozás (NLP)
A rendszer és a felhasználók közti interakció legkényelmesebb eszköze a természetes emberi nyelv. A probléma abban van, hogy a rendszer csak kis szövegrészletekkel találkozik az input során, és ezeknek kell egyértelmű jelentést tulajdonítania. Nagyobb szövegmennyiséggel éppen könnyebb lenne a feladat. Az implementált megoldások általában jó eredménnyel működnek.
Forrás: Pedro Gaspar: SIGC 2010/2011 Wolfram Alpha . An introduction to the underlying technology http://www.strath.ac.uk/research/subjects/speechlanguagetherapy/
15.
Alkalmazott Informatikai Intézeti Tanszék
MŰSZAKI INFORMATIKA
Dr.Dudás László
3. modul – Természetes nyelv feldolgozás (NLP)
Példa: szöveges kérdés
Forrás: Pedro Gaspar: SIGC 2010/2011 Wolfram Alpha . An introduction to the underlying technology http://www.strath.ac.uk/research/subjects/speechlanguagetherapy/
16.
Alkalmazott Informatikai Intézeti Tanszék
MŰSZAKI INFORMATIKA
Dr.Dudás László
3. modul – Természetes nyelv feldolgozás (NLP)
2. Példa
Forrás: Pedro Gaspar: SIGC 2010/2011 Wolfram Alpha . An introduction to the underlying technology http://www.strath.ac.uk/research/subjects/speechlanguagetherapy/
17.
Alkalmazott Informatikai Intézeti Tanszék
MŰSZAKI INFORMATIKA
Dr.Dudás László
3. modul – Természetes nyelv feldolgozás (NLP)
3. Példa
Forrás: Pedro Gaspar: SIGC 2010/2011 Wolfram Alpha . An introduction to the underlying technology http://www.strath.ac.uk/research/subjects/speechlanguagetherapy/
18.
Alkalmazott Informatikai Intézeti Tanszék
MŰSZAKI INFORMATIKA
Dr.Dudás László
3. modul – Természetes nyelv feldolgozás (NLP)
4. Példa
Forrás: Pedro Gaspar: SIGC 2010/2011 Wolfram Alpha . An introduction to the underlying technology http://www.strath.ac.uk/research/subjects/speechlanguagetherapy/
19.
Alkalmazott Informatikai Intézeti Tanszék
MŰSZAKI INFORMATIKA
Dr.Dudás László
4. modul – Vizualizálás
A Wolfram Alfa egyik vonzó tulajdonsága az eredmények vizuális megjelenítése. A Mathematicának több eszköze is van erre a kihívásra, hogy az igényes „számítási esztétikának” megfeleljen. Egy adott specifikus szimbolikus reprezentálás esetére ez automatizálja, mi és hogyan legyen prezentálva.
Forrás: Pedro Gaspar: SIGC 2010/2011 Wolfram Alpha . An introduction to the underlying technology http://www.strath.ac.uk/research/subjects/speechlanguagetherapy/
20.
Alkalmazott Informatikai Intézeti Tanszék
MŰSZAKI INFORMATIKA
Dr.Dudás László
4. modul – Vizualizálás
1. Példa
Forrás: Pedro Gaspar: SIGC 2010/2011 Wolfram Alpha . An introduction to the underlying technology http://www.strath.ac.uk/research/subjects/speechlanguagetherapy/
21.
Alkalmazott Informatikai Intézeti Tanszék
MŰSZAKI INFORMATIKA
Dr.Dudás László
4. modul – Vizualizálás
2. Példa
Forrás: Pedro Gaspar: SIGC 2010/2011 Wolfram Alpha . An introduction to the underlying technology http://www.strath.ac.uk/research/subjects/speechlanguagetherapy/
22.
Alkalmazott Informatikai Intézeti Tanszék
MŰSZAKI INFORMATIKA
Dr.Dudás László
4. modul – Vizualizálás
3. Példa
Forrás: Pedro Gaspar: SIGC 2010/2011 Wolfram Alpha . An introduction to the underlying technology http://www.strath.ac.uk/research/subjects/speechlanguagetherapy/
23.
Alkalmazott Informatikai Intézeti Tanszék
MŰSZAKI INFORMATIKA
Dr.Dudás László
4. modul – Vizualizálás
3. Példa (ellenőrizve)
Forrás: Pedro Gaspar: SIGC 2010/2011 Wolfram Alpha . An introduction to the underlying technology http://www.strath.ac.uk/research/subjects/speechlanguagetherapy/
23.
Alkalmazott Informatikai Intézeti Tanszék
MŰSZAKI INFORMATIKA
Dr.Dudás László
4. modul – Vizualizálás
4. Példa
Forrás: Pedro Gaspar: SIGC 2010/2011 Wolfram Alpha . An introduction to the underlying technology http://www.strath.ac.uk/research/subjects/speechlanguagetherapy/
24.
Alkalmazott Informatikai Intézeti Tanszék
MŰSZAKI INFORMATIKA
Dr.Dudás László
4. modul – Vizualizálás
5. Példa
Forrás: Pedro Gaspar: SIGC 2010/2011 Wolfram Alpha . An introduction to the underlying technology http://www.strath.ac.uk/research/subjects/speechlanguagetherapy/
25.
Alkalmazott Informatikai Intézeti Tanszék
MŰSZAKI INFORMATIKA
Dr.Dudás László
4. modul – Vizualizálás
6. Példa
Forrás: Pedro Gaspar: SIGC 2010/2011 Wolfram Alpha . An introduction to the underlying technology http://www.strath.ac.uk/research/subjects/speechlanguagetherapy/
26.
Alkalmazott Informatikai Intézeti Tanszék
MŰSZAKI INFORMATIKA
Dr.Dudás László
4. modul – Vizualizálás
7. Példa
Forrás: Pedro Gaspar: SIGC 2010/2011 Wolfram Alpha . An introduction to the underlying technology http://www.strath.ac.uk/research/subjects/speechlanguagetherapy/
27.
Alkalmazott Informatikai Intézeti Tanszék
MŰSZAKI INFORMATIKA
Dr.Dudás László
4. modul – Vizualizálás
8. Példa
Forrás: Pedro Gaspar: SIGC 2010/2011 Wolfram Alpha . An introduction to the underlying technology http://www.strath.ac.uk/research/subjects/speechlanguagetherapy/
28.
Alkalmazott Informatikai Intézeti Tanszék
MŰSZAKI INFORMATIKA
Dr.Dudás László
Technológia – Érdekes tények
Több mint 10 trillió adat. Több mint 50 000 algoritmus és modellfajta. Több mint 1 000 felhasználói nyelv. Több mint 8 millió sornyi szimbolikus Mathematica kód. Szuperszámítógépek clusterein fut, beleértve a világ 44. legnagyobb gépét, az R Smarr-t is. Sok száz terabájtnyi tároló.
Forrás: Pedro Gaspar: SIGC 2010/2011 Wolfram Alpha . An introduction to the underlying technology http://www.strath.ac.uk/research/subjects/speechlanguagetherapy/
29.
Alkalmazott Informatikai Intézeti Tanszék
MŰSZAKI INFORMATIKA
Dr.Dudás László
Amikor nem tud valamit
Forrás: Pedro Gaspar: SIGC 2010/2011 Wolfram Alpha . An introduction to the underlying technology http://www.strath.ac.uk/research/subjects/speechlanguagetherapy/
30.
Alkalmazott Informatikai Intézeti Tanszék
MŰSZAKI INFORMATIKA
Dr.Dudás László
Konklúzió
Az adatreprezentálás és a dolgok halmazára vonatkozó lekérdezések leképezésének lényege hogy ezek számításra is képesek. A lekérdezéseknél a válasz megadásához egy belső, előre strukturált adatbázist alkalmaz.
A számítás, feldolgozás egy halom adatot hoz fel a Google keresőgépeihez viszonyítva. Kevés, vagy semmi információ nincs arról, hogyan dolgozik a rendszer belül.
Forrás: Pedro Gaspar: SIGC 2010/2011 Wolfram Alpha . An introduction to the underlying technology http://www.strath.ac.uk/research/subjects/speechlanguagetherapy/
31.
Alkalmazott Informatikai Intézeti Tanszék
MŰSZAKI INFORMATIKA
Dr.Dudás László
Források, hivatkozások
Wolfram Alpha weboldal: http://www.wolframalpha.com/ Wolfram Alpha blog: http://blog.wolframalpha.com/ A Wolfram Alpha készítésének története: http://www.stephenwolfram.com/publications/making-wolframalpha/ Vélemények: Wolfram alpha: hogy működik? http://www.computerweekly.com/opinion/Opinion-WolframAlpha-How-does-it-work; http://www.techradar.com/news/internet/how-the-hell-doeswolfram-alpha-work--599561 A Wolfram Alpha architektúrája: http://highscalability.com/wolfram-alpha-architecture Wolfram Data Summit konferencia: http://www.wolframdatasummit.org/2010/ Wolfram Alpha a youtubon: https://www.youtube.com/user/WolframAlpha
31.