Úvod do machine learningu Marek Modrý Ondra Pluskal
[email protected] [email protected]
Co je strojové učení?
learn o t y t i l i b a ters the u p l, 1959 m e o u c m s a e S v i r g u t ". Arth dy tha d u e t s m f o m a d l r e g i o "F citly pr i l p x e g n i e “A branch of a without b rtificial in telligence in w arn from le o t hich a id a s is m a r g o r p r e c t o mputer genera class of "A compu e m o s o tes rules t t c e p s e r h it w E u e c n derlying or ba experien e P if its r u s a e sed on raw m e c n a m r o f r e p , d d P n a ta that has bee tasks T a sured by a e m s n fed into a , T in s k s a t t a e c it n .” a perform nce E." ie r e p x e h it Collins English w s improve Dictionary 7 9 9 1 , ll e h c it M Tom M.
Co je strojové učení?
learn o t y t i l i b a ters the u p l, 1959 m e o u c m s a e S v i r g u t ". Arth dy tha d u e t s m f o m a d l r e g i o "F citly pr i l p x e g n i e “A branch of a without b rtificial in telligence in w arn from le o t hich a id a s is m a r g o r p r e c t o mputer genera class of "A compu e m o s o tes rules t t c e p s e r h it w E u e c n derlying or ba experien e P if its r u s a e sed on raw m e c n a m r o f r e p , d d P n a ta that has bee tasks T a sured by a e m s n fed into a , T in s k s a t t a e c it n .” a perform nce E." ie r e p x e h it Collins English w s improve Dictionary 7 9 9 1 , ll e h c it M Tom M.
DNES NE
Co je strojové učení?
Co je strojové učení?
Co je strojové učení?
Aplikace strojového učení
Řazení timeline na Facebooku
Doporučování matchů na seznámení
Analýza informací z obrázků
Source: http://www.theverge.com/2016/3/15/11213518/alphago-deepmind-go-match-5-result
AlphaGo
Source: http://www.theverge.com/2016/3/15/11213518/alphago-deepmind-go-match-5-result
Generování textů
Source: http://www.theverge.com/2016/3/15/11213518/alphago-deepmind-go-match-5-result
Demo: https://www.jukedeck.com/make/tracks/browse
Generování hudby
Source: http://www.theverge.com/2016/3/15/11213518/alphago-deepmind-go-match-5-result
● Doporučování zboží ● Analýza sentimentu ● Question-Answering ● Větný rozbor ● Strojový překlad ● ...
Vytváření playlistů
Od základů
Bez matematiky Prakticky Letem světem
Tři zásadní způsoby učení
DĚTSKÝ PŘÍKLAD
Sáhnu do ohně Pálí Do ohně už sahat nebudu
Jak funguje člověk? Posilované učení
DĚTSKÝ PŘÍKLAD
Zpracovávání množství příkladů Extrakce znalosti (pravidla, funkce, …)
Jak funguje člověk? učení s učitelem
DĚTSKÝ PŘÍKLAD
Jak funguje člověk? učení bez učitele
REALITA Př. Uživatelské chování ● Možné rozdělit do shluků ● Vlastnosti shluků lze analyzovat později
Shluková analýza
Jak funguje člověk? učení bez učitele
Učení s učitelem
KLASIFIKACE
Příklad:
Bude zákazník splácet hypotéku?
Zákazníci
Jan Novák
Petr Loukota
HYP OTÉ BUD KA? SPLÁ OU CET ?
Štěpán Jiskra
Bez dodatečných informací nezmůžeme nic
Věk:
51 let
Region:
Kralupy n. Vltavou
Příjem:
27 000 Kč
Stav:
svobodný
Zaměstnání: účetní Jan Novák
Věk:
51 let
Region:
Kralupy n. Vltavou
Příjem:
27 000 Kč
Stav:
svobodný
FEATURES
Zaměstnání: účetní Jan Novák
Téměř vše ve strojovém učení je potřeba reprezentovat čísly (fixním počtem). Vytvoříme si číselnou (vektorovou) reprezentaci osoby.
Věk:
51 let
Region:
Kralupy n. Vltavou
Příjem:
27 000 Kč
Stav:
svobodný
FEATURES
Zaměstnání: účetní Jan Novák ANO/NE 51
0|0|0|1|0
1-of-N reprezentace
27000
0
2
ordinální kategorizace
Otázka: Splácel? Data z minulosti
Učení z příkladů Učení s učitelem
Z dostupných dat z minulosti se naučit pravidla, která nám pomůžou rozhodnout se u nových zákazníků
ANO
...
...
...
...
...
...
NE
...
...
...
...
...
...
ANO
...
...
...
...
...
...
ANO
...
...
...
...
...
...
NE
...
...
...
...
...
...
NE
...
...
...
...
...
...
NE
...
...
...
...
...
...
ANO
...
...
...
...
...
...
ANO
...
...
...
...
...
...
Feature 1
Jeden zákazník
Neplatiči Platiči
Lze najít hranici/pravidlo/funkci oddělující neplatiče a platiče? Feature 2
Jak na to?
Feature 1
Neplatiči Platiči
???
Feature 2
Jednoduchý model
Feature 1
Neplatiči Platiči
Feature 2
Složitější model
Feature 1
Neplatiči Platiči
Feature 2
Jiný algoritmus (jiný model)
Feature 1
Neplatiči Platiči
Feature 2
Nové / jiné featury
(Vždy) můžeme jít do extrému
Jak nejít do extrému, nepřeučovat se, evaluovat
Ve škole nám učitel předkládá různé informace a my se je snažíme pochopit. Naši znalost ověřuje na testových otázkách, které jsme předtím nikdy neviděli.
Jak nejít do extrému, nepřeučovat se, evaluovat UČÍCÍ SADA DAT
TESTOVACÍ SADA DAT
Trenovací chyba
Testovací chyba
Učení s učitelem
Shrnutí
Data
Model
Výstup
Rozhodnutí
Zjednodušené schéma modelu
Data Učení modelu
Model
Preprocessing
Trenovací Testovací
Zjednodušené schéma procesu učení s učitelem
Data Učení modelu
Model
Preprocessing
Trenovací
Kontrola průběhu učení
Testovací
Zjednodušené schéma procesu učení s učitelem
Data Učení modelu
Model
Preprocessing
Trenovací
Kontrola průběhu učení
Testovací
Evaluace
Kvalita
Zjednodušené schéma procesu učení s učitelem
Praktická ukázka
Omezení strojového učení ● ● ● ● ● ● ●
Výpočetní síla Nedostatek kvalitních dat Často není jasné, jak reprezentovat informaci Lidské chyby v “anotacích” + všudypřítomný šum Doménová specificita řešení Často nutnost expertních znalostí (Neznalost vlastností jednotlivých algoritmů)
Kde se naučit a vyzkoušet více?
… mnoho a mnoho dalších zdrojů
Kde najít data, s kterými si můžu hrát ● ● ● ● ● ●
Kaggle.com UCI repository Data.gov http://opendata.praha.eu/dataset http://linked.opendata.cz/en/dataset … spousta soutěží v různých oborech
Děkuji. Prostor pro vaše dotazy