Už bylo: Učení bez učitele (unsupervised learning) Kompetitivní modely

Hybridn´ı modely

Uˇcen´ı bez uˇcitele Uˇ z bylo: Uˇ cen´ı bez uˇ citele (unsupervised learning) Kompetitivn´ı modely Klastrován´ı Kohonenovy mapy LVQ (Uˇcen´ı vektorové kvantizace) Zb´ yv´ a: Hybridn´ı modely (kombinace uˇ cen´ı bez uˇ citele a s uˇ citelem S´ıtˇe se vstˇr´ıcným ˇs´ıˇren´ım (Counterpropagation) RBF-s´ıtˇe ART (Adaptive Resonance Theory)

1 / 32

Hybridn´ı modely Counter-propagation

S´ıtˇe se vstˇr´ıcným ˇs´ıˇren´ım (Counter-propagation) (Hecht-Nielsen, 1987)

Architektura Tˇri vrstvy neuron˚ u: Vstupn´ı vrstva Kohonenovská (klastrovac´ı) vrstva Grossbergovská vrstva

Uˇcen´ı s uˇcitelem Rozpoznáván´ı

obr´ azek pˇrevzat z I.Mr´ azov´ a, Neuronov´ e s´ıtˇ e 2 / 32

Hybridn´ı modely Counter-propagation Architektura

S´ıtˇe se vstˇr´ıcným ˇs´ıˇren´ım (Counter-propagation) Terminologie Vstupn´ı vrstva ... n neuron˚ u Kohonenovská vrstva ... mˇr´ıˇzka s K neurony Grossbergovská vrstva ... m neuron˚ u S´ıt’ zobraz´ı vstupn´ı vektor ~x ∈ R n na výstupn´ı vektor ~y ∈ R m zi ... výstupy (aktivity) neuron˚ u v Kohonenovské vrstvˇe yl ... výstupy (aktivity) neuron˚ u v Grossbergovské vrstvˇe wji ... váhy hran mezi vstupn´ı a Kohonenovskou vrstvou vil ... váhy hran mezi Kohonenovskou a Grossbergovskou vrstvou 3 / 32

Hybridn´ı modely Counter-propagation Vybavov´ an´ı

S´ıtˇe se vstˇr´ıcným ˇs´ıˇren´ım (Counter-propagation) Reˇ zim vybavov´ an´ı zobrazen´ı f : R n → R m : Vstupn´ı vektor ~x vybud´ı jeden neuron v Kohonenovské vrstvˇe (v´ıtˇezný).. k-tý Grossbergovská (výstupn´ı) vrstva: Provád´ı standardn´ı skalárn´ı souˇcin: yl =

K X

vil zi = vkl

i=1

Grossbergova (výstupn´ı) hvˇezda

→ výstup s´ıtˇe: ~y = v~k

Grossbergovská vrstva provád´ı výbˇer jednoho vektoru z K vektor˚ u (∼ váhy hran od k-tého neuronu v Kohonenovˇe mˇr´ıˇzce) 4 / 32

Hybridn´ı modely Counter-propagation Algoritmus uˇ cen´ı

S´ıtˇe se vstˇr´ıcným ˇs´ıˇren´ım (Counter-propagation) Algoritmus 1 2

3

Inicializace: Zvol´ıme náhodné hodnoty synaptických vah Pˇredloˇz´ıme nový trénovac´ı vzor ve tvaru (~x , ~t) = (vstup, poˇzadovaný výstup). ~ i pro kaˇzdý neuron i v Spoˇc´ıtáme vzdálenosti di mezi ~x a w Kohonenovské vrstvˇe. Pouˇzijeme napˇr. Euklidovskou metriku: sX di = (xj − wji )2 j

4

Vyber neuron k s minimáln´ı vzdálenost´ı dk jako ,,v´ıtˇeze” k = argmini di 5 / 32


S´ıtˇe se vstˇr´ıcným ˇs´ıˇren´ım (Counter-propagation) Algoritmus - pokraˇ cov´ an´ı 5

Aktualizujeme váhy wji mezi vstupn´ım neuronem j a neurony i Kohonenovské vrstvy, které se nacházej´ı v okol´ı v´ıtˇezného neuronu k tak, aby lépe odpov´ıdaly pˇredloˇzenému vzoru: ~ i (t + 1) = w ~ i (t) = α(t)Λ(i, k)(t)(~x − w ~ i (t)), w Λ(i, k) ... funkce okol´ı 0 < α(t) < 1 ... parametr uˇcen´ı pro váhy mezi vstupn´ı a Kohonenovskou vrstvou, klesá v ˇcase. t pˇredstavuje souˇcasný a (t + 1) následuj´ıc´ı krok uˇcen´ı.

6 / 32


S´ıtˇe se vstˇr´ıcným ˇs´ıˇren´ım (Counter-propagation) Algoritmus - dokonˇ cen´ı 6

Aktualizujte váhy vkl mezi ,,v´ıtˇezným” neuronem k z Kohonenovské vrstvy a neurony l Grossbergovské vrstvy tak, aby výstupn´ı vektor lépe odpov´ıdal poˇzadované odezvˇe: vkl (t + 1) = (1 − γ)vkl (t) + γzk tl , 0 < γ < 1 ... parametr uˇcen´ı pro váhy mezi Kohonenovskou a Grossbergovskou vrstvou, zk ... oznaˇcuje aktivitu ,,v´ıtˇezného” neuronu Kohonenovské vrstvy. tl ... oznaˇcuje poˇzadovanou aktivitu neuronu l Grossbergovské vrstvy

7

Pokraˇcujeme krokem (2) 7 / 32

Hybridn´ı modely Counter-propagation Aplikace

S´ıtˇe se vstˇr´ıcným ˇs´ıˇren´ım (Counter-propagation) Pˇr´ıklady pouˇ zit´ı Heteroasociativn´ı pamˇet’ Komprese dat napˇr. pˇrenos obraz˚ u, videa

Podobnˇe jako BP-s´ıt’ efektivnˇejˇs´ı výpoˇcet, rychlejˇs´ı adaptace niˇzˇs´ı pˇresnost

P˚ uvodn´ı vyuˇzit´ı: reprezentace zobrazen´ı f a f −1 zároveˇ n:

8 / 32

Hybridn´ı modely RBF-s´ıtˇ e Architektura

RBF-s´ıtˇe (S´ıtˇe s lokáln´ımi jednotkami) Radial basis functions (Moody, Darken, 1989) Hybridn´ı architektura Uˇcen´ı s uˇcitelem Rozd´ıl od counter-propagation: Gaussovské jednotky v Kohonenovské vrstvˇe

9 / 32


RBF-s´ıtˇe (S´ıtˇe s lokáln´ımi jednotkami) Neurony v Kohonenovsk´ e vrstvˇ e Lokáln´ı výpoˇcetn´ı jednotky (RBF-jednotky) Neuron spoˇcte sv˚ uj vnitˇrn´ı potenciál ξ a výstup y podle: − − k→ x −→ wk ξ= h Gaussovská (radiáln´ı) pˇrenosová funkce: ξ2

z = f (ξ) = e − α = e −

− − k→ x −→ w k2 αh2

~x ∈ R n ... vstupn´ı vektor ~ ∈ R n ... váhový vektor neuronu w h ... konstanta (pro daný neuron) ... ˇs´ıˇrka okol´ı α ... konstanta

10 / 32


RBF-s´ıtˇe (S´ıtˇe s lokáln´ımi jednotkami) Celkov´ a funkce s´ıtˇ e f : R n → R m: fl (x1 , ..., xn ) =

K X i=1

vil zi =

K X

vil e

−

− − k→ x −→ w i k2 αh2 i

i=1

~vl ∈ R K ... váhový vektor ze skrytých neuron˚ u do výstupn´ıho neuronu l Výstupn´ı neurony jsou lineárn´ı jednotky

11 / 32

Hybridn´ı modely RBF-s´ıtˇ e Algoritmus uˇ cen´ı

RBF-s´ıtˇe (S´ıtˇe s lokáln´ımi jednotkami)

Algoritmus uˇ cen´ı Vstup: trénovac´ı mnoˇzina s N vzory ve tvaru (~xp , ~dp ) = (vstup, poˇzadovaný výstup). V´ ystup: parametry s´ıtˇe - váhy hran a parametry neuron˚ u Algoritmus uˇ cen´ı m´ a tˇri f´ aze: 1

Spoˇc´ıtáme stˇredy centroid˚ u (RBF-jednotek) ... váhy wji ze vstupn´ı do Kohonenovské vrstvy

2

Spoˇc´ıtáme ˇs´ıˇrky okol´ı centroid˚ u hi a dalˇs´ı parametry

3

Spoˇc´ıtáme váhy do výstupn´ı vrstvy ... vil

12 / 32



Algoritmus uˇ cen´ı - m´ a tˇri f´ aze 1 Spoˇ c´ıtáme stˇredy centroid˚ u ... váhy wji ze vstupn´ı do Kohonenovské vrstvy samoorganizace (uˇcen´ı bez uˇcitele) viz. counter-propagation 2

Spoˇc´ıtáme ˇs´ıˇrky okol´ı centroid˚ u hi a dalˇs´ı parametry napˇr. podle vzdálenosti nejbliˇzˇs´ıch soused˚ u (nen´ı tˇreba znova pˇredkládat trénovac´ı vzory)

3

Spoˇc´ıtáme váhy do výstupn´ı vrstvy ... vil napˇr. pomoc´ı algoritmu zpˇetného ˇs´ıˇren´ı (uˇcen´ı s uˇcitelem)

13 / 32


RBF-s´ıtˇe (S´ıtˇe s lokáln´ımi jednotkami) Algoritmus uˇ cen´ı - v´ ypoˇ cet vah do v´ ystupn´ı vrstvy... vil Pomoc´ı algoritmu zpˇetného ˇs´ıˇren´ı (uˇcen´ı s uˇcitelem) N trénovac´ıch vzor˚ u ve tvaru (~xp , ~dp ) = (vstup, poˇzadovaný výstup) Chybová funkce: → −

→ −

2

N m K N m K k x p− w i k − 1 XX X 1 XX X αh2 i E= ( vil zi −dp )2 = ( vil e −dp )2 2 2 p=1 l=1 i=1

p=1 l=1 i=1

Adaptaˇcn´ı pravidlo pro jeden trénovac´ı vzor ∆vil

− ∂E ∼ − ∼ γe ∂vil

= γzi (dp −

K X

− − k→ x p −→ w i k2 αh2 i

(dp −

K X

vil e

−

− − k→ x p −→ w i k2 αh2 i

)

i=1

vil zi )

i=1 14 / 32

Hybridn´ı modely RBF-s´ıtˇ e Anal´ yza modelu


Anal´ yza modelu Univerzáln´ı aproximátor (narozd´ıl od BP-s´ıt´ı staˇc´ı jedna skrytá vrstva) ... ale potˇrebný poˇcet lokáln´ıch jednotek roste exponencielnˇe Alternativa BP-s´ıt´ı, pro nˇekteré typy problém˚ u se hod´ı lépe, pro nˇekteré h˚ uˇre neˇz BP-s´ıtˇe Rychlé uˇcen´ı (aˇz o dva ˇrády rychlejˇs´ı neˇz BP-s´ıtˇe) Neum´ı si poradit s irelevantn´ımi vstupy. Obt´ıˇznˇe se hledá uˇc´ıc´ı algoritmus

15 / 32

Hybridn´ı modely RBF-s´ıtˇ e Implementace v Matlabu

RBF - Jak je to v Matlabu newrbe ... vytvoˇren´ı modelu poˇcet výpoˇcetn´ıch jednotek je roven poˇctu trénovac´ıch vzor˚ u net = newrbe(P,T,SC) P ... vstupn´ı vzory T ... výstupn´ı vzory SC ... ˇs´ıˇrka okol´ı

newrb ... vytvoˇren´ı modelu pˇridává výpoˇcetn´ı jednotky, dokud MSE nen´ı menˇs´ı neˇz daná mez (EG) net = newrb(P,T,EG,SC) P ... vstupn´ı vzory T ... výstupn´ı vzory EG ... poˇzadovaná MSE SC ... ˇs´ıˇrka okol´ı

sim ... rozpoznáván´ı Y = sim(net,P). 16 / 32

Hybridn´ı modely ART-s´ıtˇ e

ART-s´ıtˇe (Adaptive resonance theory) (Grossberg, Carpenter, 1986) ´ Uloha Hybridn´ı architektura - ˇcásteˇcnˇe modulárn´ı Uˇcen´ı bez uˇcitele Online uˇcen´ı Pouˇ zit´ı Shlukován´ı - plasticita a stabilita Rozpoznáván´ı znak˚ u, ˇreˇcových segment˚ u apod.

ρ ... parametr bdˇelosti 17 / 32

Hybridn´ı modely ART-s´ıtˇ e Architektura

ART-s´ıtˇe (Adaptive resonance theory)

Architektura ART-1 Dvouvrstvá rekurentn´ı s´ıt’ Porovnávac´ı (vstupn´ı) vrstva ... n neuron˚ u Rozpoznávac´ı (výstupn´ı) vrstva ... m neuron˚ u

ART-1 ... binárn´ı vstupy ART-2 ... reálné vstupy

18 / 32


ART-s´ıtˇe (Adaptive resonance theory) Vazby mezi neurony: ve výstupn´ı vrstvˇe ... lateráln´ı inhibice ze vstupn´ı do výstupn´ı vrstvy (váhy wij , i = 1, ..., n, j = 1, ..., m,) z výstupn´ıch neuron˚ u ke vstupn´ım (váhy tij , i = 1, ..., n, j = 1, ..., m,) ... pro porovnán´ı skuteˇcné podobnosti s pˇredloˇzeným vzorem (zaloˇzena na skalárn´ım souˇcinu) ˇ ıd´ıc´ı signály ... G1, G2, Reset R´

19 / 32



Test bdˇ elosti práh bdˇelosti ρ ... urˇcuje, jak bl´ızko mus´ı být pˇredloˇzený vzor k uloˇzenému, aby mohly patˇrit do stejné kategorie Mechanismus vypnut´ı (zablokován´ı) neuronu s maximáln´ı odezvou → stabilita × plasticita s´ıtˇe → s´ıt’ má velké problémy i pˇri jen trochu zaˇsumnˇených vzorech (pˇr´ıliˇs nar˚ ustá poˇcet uloˇzených vzor˚ u)

20 / 32

Hybridn´ı modely ART-s´ıtˇ e Algoritmus uˇ cen´ı


Algoritmus uˇ cen´ı – m´ a 5 f´ az´ı: 1

inicializaˇcn´ı - nastaven´ı poˇcáteˇcn´ıho stavu s´ıtˇe

2

rozpoznávac´ı - dopˇredný výpoˇcet - naleznu v´ıtˇezný neuron v rozpoznávac´ı vrstvˇe

3

porovnávac´ı - zpˇetný výpoˇcet - provedu test bdˇelosti

4

vyhledávac´ı - hledám jiný v´ıtˇezný neuron

5

adaptaˇcn´ı - adaptace vah u v´ıtˇezného neuronu

21 / 32


ART-s´ıtˇe (Adaptive resonance theory) Algoritmus uˇ cen´ı – inicializaˇ cn´ı f´ aze 1

Poˇ c´ ateˇ cn´ı inicializace vah: tij (0) = 1,

i = 1, ..., n

,

1 , 1+n j = 1, ..., m,

0≤

ρ

≤1

wij (0) =

wij (t) ... váha mezi vstupn´ım neuronem i a výstupn´ım neuronem j v ˇcase t tij (t) ... váha mezi výstupn´ım neuronem j a vstupn´ım neuronem i v ˇcase t (vzor specifikovaný výstupn´ım neuronem j) ρ ... práh bdˇelosti 22 / 32


ART-s´ıtˇe (Adaptive resonance theory) Algoritmus uˇ cen´ı – inicializaˇ cn´ı a rozpozn´ avac´ı f´ aze 2

Pˇredloˇz nový vstupn´ı vzor: ~x (t) = {x1 , ..., xn }

3

Spoˇcti odezvu (aktivitu) neuron˚ u ve výstupn´ı (rozpoznávac´ı) vrstvˇe: n X yj (t) = wij (t)xi , j = 1, ..., m i=1

yj (t) ... aktivita výstupn´ıho neuronu j v ˇcase t 4

Vyber neuron k, který nejlépe odpov´ıdá pˇredloˇzenému vzoru (napˇr. pomoc´ı lateráln´ı interakce): k = argmax{yj }

23 / 32


ART-s´ıtˇe (Adaptive resonance theory) Algoritmus uˇ cen´ı – porovn´ avac´ı a vyhled´ avac´ı f´ aze 5 Test bdˇ elosti: Výpoˇcet bdˇelosti µ v´ıtˇezného neuronu k podle: µ kT .~x k

kT .~x k , k~x k n n X X = tik (t)xi , k~x k = xi ,

=

i=1

i=1

Pokud plat´ı µ > ρ, pokraˇcuj krokem 7, jinak pokraˇcuj krokem 6. 6

Zmraz (zablokuj) neuron k s nejvˇ etˇs´ı odezvou: Nastav výstup neuronu k doˇcasnˇe na nulu. Opakuj krok 3 (neuron k se ne´ uˇcastn´ı maximalizace). 24 / 32



Algoritmus uˇ cen´ı – adaptaˇ cn´ı f´ aze 7

Pokud nebyl nalezen vhodný neuron, pˇridej do s´ıtˇe nový neuron jako ,,v´ıtˇezný”.

8

Adaptace vah u ,,v´ıtˇ ezn´ eho” neuronu k: tik (t + 1) = tik (t)xi , tik (t)xi P wik (t + 1) = 0.5 + nl=1 tlk (t)xl

9

Odblokuj vˇsechny zmraˇzené neurony a opakuj krok 2.

25 / 32

Hybridn´ı modely ART-s´ıtˇ e Anal´ yza modelu

ART-s´ıtˇe (Adaptive resonance theory) Anal´ yza modelu Hlavn´ı výhody: Stabilita a plasticita s´ıtˇe S´ıt’ sama urˇc´ı správný poˇcet neuron˚ u Velká citlivost na poˇcáteˇcn´ı volbu parametr˚ u: práh bdˇelosti poˇrad´ı pˇredkládán´ı vzor˚ u

Velká citlivost na ˇsum v datech Pˇr´ıklady aplikac´ı Shlukován´ı Rozpoznáván´ı znak˚ u, ˇreˇcových segment˚ u apod.

26 / 32

Hybridn´ı modely Konstrukˇ cn´ı algoritmy Kask´ adov´ a korelace

Kaskádová korelace

(Fahlman, Labiere, 1990) robustn´ı rostouc´ı architektura BP-s´ıtˇe

Princip Systém zaˇc´ıná proces uˇcen´ı s pˇr´ımým propojen´ım vstup˚ u na výstup Postupnˇe jsou pˇridávány dalˇs´ı skryté neurony Vstupy kaˇzdého nového neuronu jsou propojeny se vˇsemi p˚ uvodn´ımi vstupy i se vˇsemi dˇr´ıve vytvoˇrenými neurony

27 / 32



28 / 32


Kaskádová korelace Algoritmus uˇ cen´ı Minimalizace MSE na výstupu s´ıtˇe Uˇ cen´ı prob´ıh´ a ve dvou f´ az´ıch: Prvn´ı f´ aze: Adaptace s´ıtˇe pomoc´ı algoritmu Quickprop pokud je MSE na výstupu dostateˇcnˇe n´ızká, KONEC jinak pˇridáme nový neuron

Druh´ a f´ aze: Pˇridán´ı nového neuronu nový neuron je adaptován tak, aby maximalizoval korelaci mezi svým výstupem a chybou na výstupu s´ıtˇe → pˇridávaný neuron se ,,nauˇc´ı” nˇejaký pˇr´ıznak, který vysoce koreluje s aktuáln´ı (zbývaj´ıc´ı) chybou Váhy do novˇe pˇridaného neuronu jsou zmrazeny a v dalˇs´ıch fáz´ıch se douˇcuj´ı jen váhy na výstup 29 / 32


Kaskádová korelace Algoritmus uˇ cen´ı C´ılem uˇcen´ı skrytých neuron˚ u je maximalizace S: S =|

p X (Vi − V )(Ei − E )| i=1

p ... poˇcet trénovac´ıch vzor˚ u Vi ... výstup pˇridávaného neuronu pro i-tý vzor V ... pr˚ umˇerný výstup pˇridávaného neuronu Ei ... MSE pro i-tý vzor E ... pr˚ umˇerná chyba

30 / 32


Kaskádová korelace Algoritmus uˇ cen´ı C´ılem uˇcen´ı skrytých neuron˚ u je maximalizace S: p X S =| (Vi − V )(Ei − E )| i=1 p

X ∂S = σ(Ei − E )fi 0 Iik ∂wk i=1

σ ... znaménko korelace mezi výstupem a pˇridávaným neuronem fi 0 ... derivace pˇrenosové funkce pro i-tý vzor Iik ... k-tý vstup pˇridávanho neuronu pro i-tý vzor 31 / 32



Anal´ yza algoritmu Snadné rozˇs´ıˇren´ı na v´ıce výstup˚ u S´ıt’ sama urˇc´ı správný poˇcet neuron˚ u ... uˇzivatel ho nemus´ı specifikovat Rychlé uˇcen´ı ... v kaˇzdém kroku se adaptuje jen jeden neuron, váhy do stávaj´ıc´ıch neuron˚ u uˇz se neadaptuj´ı → stabilita Nebezpeˇc´ı pˇreuˇcen´ı ... saturace neuron˚ u Vytváˇrej´ı se zbyteˇcnˇe hluboké s´ıtˇe

32 / 32

Už bylo: Učení bez učitele (unsupervised learning) Kompetitivní modely

Recommend Documents