Hybridn´ı modely
Uˇcen´ı bez uˇcitele Uˇ z bylo: Uˇ cen´ı bez uˇ citele (unsupervised learning) Kompetitivn´ı modely Klastrov´an´ı Kohonenovy mapy LVQ (Uˇcen´ı vektorov´e kvantizace) Zb´ yv´ a: Hybridn´ı modely (kombinace uˇ cen´ı bez uˇ citele a s uˇ citelem S´ıtˇe se vstˇr´ıcn´ym ˇs´ıˇren´ım (Counterpropagation) RBF-s´ıtˇe ART (Adaptive Resonance Theory)
1 / 32
Hybridn´ı modely Counter-propagation
S´ıtˇe se vstˇr´ıcn´ym ˇs´ıˇren´ım (Counter-propagation) (Hecht-Nielsen, 1987)
Architektura Tˇri vrstvy neuron˚ u: Vstupn´ı vrstva Kohonenovsk´a (klastrovac´ı) vrstva Grossbergovsk´a vrstva
Uˇcen´ı s uˇcitelem Rozpozn´av´an´ı
obr´ azek pˇrevzat z I.Mr´ azov´ a, Neuronov´ e s´ıtˇ e 2 / 32
Hybridn´ı modely Counter-propagation Architektura
S´ıtˇe se vstˇr´ıcn´ym ˇs´ıˇren´ım (Counter-propagation) Terminologie Vstupn´ı vrstva ... n neuron˚ u Kohonenovsk´a vrstva ... mˇr´ıˇzka s K neurony Grossbergovsk´a vrstva ... m neuron˚ u S´ıt’ zobraz´ı vstupn´ı vektor ~x ∈ R n na v´ystupn´ı vektor ~y ∈ R m zi ... v´ystupy (aktivity) neuron˚ u v Kohonenovsk´e vrstvˇe yl ... v´ystupy (aktivity) neuron˚ u v Grossbergovsk´e vrstvˇe wji ... v´ahy hran mezi vstupn´ı a Kohonenovskou vrstvou vil ... v´ahy hran mezi Kohonenovskou a Grossbergovskou vrstvou 3 / 32
Hybridn´ı modely Counter-propagation Vybavov´ an´ı
S´ıtˇe se vstˇr´ıcn´ym ˇs´ıˇren´ım (Counter-propagation) Reˇ zim vybavov´ an´ı zobrazen´ı f : R n → R m : Vstupn´ı vektor ~x vybud´ı jeden neuron v Kohonenovsk´e vrstvˇe (v´ıtˇezn´y).. k-t´y Grossbergovsk´a (v´ystupn´ı) vrstva: Prov´ad´ı standardn´ı skal´arn´ı souˇcin: yl =
K X
vil zi = vkl
i=1
Grossbergova (v´ystupn´ı) hvˇezda
→ v´ystup s´ıtˇe: ~y = v~k
Grossbergovsk´a vrstva prov´ad´ı v´ybˇer jednoho vektoru z K vektor˚ u (∼ v´ahy hran od k-t´eho neuronu v Kohonenovˇe mˇr´ıˇzce) 4 / 32
Hybridn´ı modely Counter-propagation Algoritmus uˇ cen´ı
S´ıtˇe se vstˇr´ıcn´ym ˇs´ıˇren´ım (Counter-propagation) Algoritmus 1 2
3
Inicializace: Zvol´ıme n´ahodn´e hodnoty synaptick´ych vah Pˇredloˇz´ıme nov´y tr´enovac´ı vzor ve tvaru (~x , ~t) = (vstup, poˇzadovan´y v´ystup). ~ i pro kaˇzd´y neuron i v Spoˇc´ıt´ame vzd´alenosti di mezi ~x a w Kohonenovsk´e vrstvˇe. Pouˇzijeme napˇr. Euklidovskou metriku: sX di = (xj − wji )2 j
4
Vyber neuron k s minim´aln´ı vzd´alenost´ı dk jako ,,v´ıtˇeze” k = argmini di 5 / 32
Hybridn´ı modely Counter-propagation Algoritmus uˇ cen´ı
S´ıtˇe se vstˇr´ıcn´ym ˇs´ıˇren´ım (Counter-propagation) Algoritmus - pokraˇ cov´ an´ı 5
Aktualizujeme v´ahy wji mezi vstupn´ım neuronem j a neurony i Kohonenovsk´e vrstvy, kter´e se nach´azej´ı v okol´ı v´ıtˇezn´eho neuronu k tak, aby l´epe odpov´ıdaly pˇredloˇzen´emu vzoru: ~ i (t + 1) = w ~ i (t) = α(t)Λ(i, k)(t)(~x − w ~ i (t)), w Λ(i, k) ... funkce okol´ı 0 < α(t) < 1 ... parametr uˇcen´ı pro v´ahy mezi vstupn´ı a Kohonenovskou vrstvou, kles´a v ˇcase. t pˇredstavuje souˇcasn´y a (t + 1) n´asleduj´ıc´ı krok uˇcen´ı.
6 / 32
Hybridn´ı modely Counter-propagation Algoritmus uˇ cen´ı
S´ıtˇe se vstˇr´ıcn´ym ˇs´ıˇren´ım (Counter-propagation) Algoritmus - dokonˇ cen´ı 6
Aktualizujte v´ahy vkl mezi ,,v´ıtˇezn´ym” neuronem k z Kohonenovsk´e vrstvy a neurony l Grossbergovsk´e vrstvy tak, aby v´ystupn´ı vektor l´epe odpov´ıdal poˇzadovan´e odezvˇe: vkl (t + 1) = (1 − γ)vkl (t) + γzk tl , 0 < γ < 1 ... parametr uˇcen´ı pro v´ahy mezi Kohonenovskou a Grossbergovskou vrstvou, zk ... oznaˇcuje aktivitu ,,v´ıtˇezn´eho” neuronu Kohonenovsk´e vrstvy. tl ... oznaˇcuje poˇzadovanou aktivitu neuronu l Grossbergovsk´e vrstvy
7
Pokraˇcujeme krokem (2) 7 / 32
Hybridn´ı modely Counter-propagation Aplikace
S´ıtˇe se vstˇr´ıcn´ym ˇs´ıˇren´ım (Counter-propagation) Pˇr´ıklady pouˇ zit´ı Heteroasociativn´ı pamˇet’ Komprese dat napˇr. pˇrenos obraz˚ u, videa
Podobnˇe jako BP-s´ıt’ efektivnˇejˇs´ı v´ypoˇcet, rychlejˇs´ı adaptace niˇzˇs´ı pˇresnost
P˚ uvodn´ı vyuˇzit´ı: reprezentace zobrazen´ı f a f −1 z´aroveˇ n:
8 / 32
Hybridn´ı modely RBF-s´ıtˇ e Architektura
RBF-s´ıtˇe (S´ıtˇe s lok´aln´ımi jednotkami) Radial basis functions (Moody, Darken, 1989) Hybridn´ı architektura Uˇcen´ı s uˇcitelem Rozd´ıl od counter-propagation: Gaussovsk´e jednotky v Kohonenovsk´e vrstvˇe
9 / 32
Hybridn´ı modely RBF-s´ıtˇ e Architektura
RBF-s´ıtˇe (S´ıtˇe s lok´aln´ımi jednotkami) Neurony v Kohonenovsk´ e vrstvˇ e Lok´aln´ı v´ypoˇcetn´ı jednotky (RBF-jednotky) Neuron spoˇcte sv˚ uj vnitˇrn´ı potenci´al ξ a v´ystup y podle: − − k→ x −→ wk ξ= h Gaussovsk´a (radi´aln´ı) pˇrenosov´a funkce: ξ2
z = f (ξ) = e − α = e −
− − k→ x −→ w k2 αh2
~x ∈ R n ... vstupn´ı vektor ~ ∈ R n ... v´ahov´y vektor neuronu w h ... konstanta (pro dan´y neuron) ... ˇs´ıˇrka okol´ı α ... konstanta
10 / 32
Hybridn´ı modely RBF-s´ıtˇ e Architektura
RBF-s´ıtˇe (S´ıtˇe s lok´aln´ımi jednotkami) Celkov´ a funkce s´ıtˇ e f : R n → R m: fl (x1 , ..., xn ) =
K X i=1
vil zi =
K X
vil e
−
− − k→ x −→ w i k2 αh2 i
i=1
~vl ∈ R K ... v´ahov´y vektor ze skryt´ych neuron˚ u do v´ystupn´ıho neuronu l V´ystupn´ı neurony jsou line´arn´ı jednotky
11 / 32
Hybridn´ı modely RBF-s´ıtˇ e Algoritmus uˇ cen´ı
RBF-s´ıtˇe (S´ıtˇe s lok´aln´ımi jednotkami)
Algoritmus uˇ cen´ı Vstup: tr´enovac´ı mnoˇzina s N vzory ve tvaru (~xp , ~dp ) = (vstup, poˇzadovan´y v´ystup). V´ ystup: parametry s´ıtˇe - v´ahy hran a parametry neuron˚ u Algoritmus uˇ cen´ı m´ a tˇri f´ aze: 1
Spoˇc´ıt´ame stˇredy centroid˚ u (RBF-jednotek) ... v´ahy wji ze vstupn´ı do Kohonenovsk´e vrstvy
2
Spoˇc´ıt´ame ˇs´ıˇrky okol´ı centroid˚ u hi a dalˇs´ı parametry
3
Spoˇc´ıt´ame v´ahy do v´ystupn´ı vrstvy ... vil
12 / 32
Hybridn´ı modely RBF-s´ıtˇ e Algoritmus uˇ cen´ı
RBF-s´ıtˇe (S´ıtˇe s lok´aln´ımi jednotkami)
Algoritmus uˇ cen´ı - m´ a tˇri f´ aze 1 Spoˇ c´ıt´ame stˇredy centroid˚ u ... v´ahy wji ze vstupn´ı do Kohonenovsk´e vrstvy samoorganizace (uˇcen´ı bez uˇcitele) viz. counter-propagation 2
Spoˇc´ıt´ame ˇs´ıˇrky okol´ı centroid˚ u hi a dalˇs´ı parametry napˇr. podle vzd´alenosti nejbliˇzˇs´ıch soused˚ u (nen´ı tˇreba znova pˇredkl´adat tr´enovac´ı vzory)
3
Spoˇc´ıt´ame v´ahy do v´ystupn´ı vrstvy ... vil napˇr. pomoc´ı algoritmu zpˇetn´eho ˇs´ıˇren´ı (uˇcen´ı s uˇcitelem)
13 / 32
Hybridn´ı modely RBF-s´ıtˇ e Algoritmus uˇ cen´ı
RBF-s´ıtˇe (S´ıtˇe s lok´aln´ımi jednotkami) Algoritmus uˇ cen´ı - v´ ypoˇ cet vah do v´ ystupn´ı vrstvy... vil Pomoc´ı algoritmu zpˇetn´eho ˇs´ıˇren´ı (uˇcen´ı s uˇcitelem) N tr´enovac´ıch vzor˚ u ve tvaru (~xp , ~dp ) = (vstup, poˇzadovan´y v´ystup) Chybov´a funkce: → −
→ −
2
N m K N m K k x p− w i k − 1 XX X 1 XX X αh2 i E= ( vil zi −dp )2 = ( vil e −dp )2 2 2 p=1 l=1 i=1
p=1 l=1 i=1
Adaptaˇcn´ı pravidlo pro jeden tr´enovac´ı vzor ∆vil
− ∂E ∼ − ∼ γe ∂vil
= γzi (dp −
K X
− − k→ x p −→ w i k2 αh2 i
(dp −
K X
vil e
−
− − k→ x p −→ w i k2 αh2 i
)
i=1
vil zi )
i=1 14 / 32
Hybridn´ı modely RBF-s´ıtˇ e Anal´ yza modelu
RBF-s´ıtˇe (S´ıtˇe s lok´aln´ımi jednotkami)
Anal´ yza modelu Univerz´aln´ı aproxim´ator (narozd´ıl od BP-s´ıt´ı staˇc´ı jedna skryt´a vrstva) ... ale potˇrebn´y poˇcet lok´aln´ıch jednotek roste exponencielnˇe Alternativa BP-s´ıt´ı, pro nˇekter´e typy probl´em˚ u se hod´ı l´epe, pro nˇekter´e h˚ uˇre neˇz BP-s´ıtˇe Rychl´e uˇcen´ı (aˇz o dva ˇr´ady rychlejˇs´ı neˇz BP-s´ıtˇe) Neum´ı si poradit s irelevantn´ımi vstupy. Obt´ıˇznˇe se hled´a uˇc´ıc´ı algoritmus
15 / 32
Hybridn´ı modely RBF-s´ıtˇ e Implementace v Matlabu
RBF - Jak je to v Matlabu newrbe ... vytvoˇren´ı modelu poˇcet v´ypoˇcetn´ıch jednotek je roven poˇctu tr´enovac´ıch vzor˚ u net = newrbe(P,T,SC) P ... vstupn´ı vzory T ... v´ystupn´ı vzory SC ... ˇs´ıˇrka okol´ı
newrb ... vytvoˇren´ı modelu pˇrid´av´a v´ypoˇcetn´ı jednotky, dokud MSE nen´ı menˇs´ı neˇz dan´a mez (EG) net = newrb(P,T,EG,SC) P ... vstupn´ı vzory T ... v´ystupn´ı vzory EG ... poˇzadovan´a MSE SC ... ˇs´ıˇrka okol´ı
sim ... rozpozn´av´an´ı Y = sim(net,P). 16 / 32
Hybridn´ı modely ART-s´ıtˇ e
ART-s´ıtˇe (Adaptive resonance theory) (Grossberg, Carpenter, 1986) ´ Uloha Hybridn´ı architektura - ˇc´asteˇcnˇe modul´arn´ı Uˇcen´ı bez uˇcitele Online uˇcen´ı Pouˇ zit´ı Shlukov´an´ı - plasticita a stabilita Rozpozn´av´an´ı znak˚ u, ˇreˇcov´ych segment˚ u apod.
ρ ... parametr bdˇelosti 17 / 32
Hybridn´ı modely ART-s´ıtˇ e Architektura
ART-s´ıtˇe (Adaptive resonance theory)
Architektura ART-1 Dvouvrstv´a rekurentn´ı s´ıt’ Porovn´avac´ı (vstupn´ı) vrstva ... n neuron˚ u Rozpozn´avac´ı (v´ystupn´ı) vrstva ... m neuron˚ u
ART-1 ... bin´arn´ı vstupy ART-2 ... re´aln´e vstupy
18 / 32
Hybridn´ı modely ART-s´ıtˇ e Architektura
ART-s´ıtˇe (Adaptive resonance theory) Vazby mezi neurony: ve v´ystupn´ı vrstvˇe ... later´aln´ı inhibice ze vstupn´ı do v´ystupn´ı vrstvy (v´ahy wij , i = 1, ..., n, j = 1, ..., m,) z v´ystupn´ıch neuron˚ u ke vstupn´ım (v´ahy tij , i = 1, ..., n, j = 1, ..., m,) ... pro porovn´an´ı skuteˇcn´e podobnosti s pˇredloˇzen´ym vzorem (zaloˇzena na skal´arn´ım souˇcinu) ˇ ıd´ıc´ı sign´aly ... G1, G2, Reset R´
19 / 32
Hybridn´ı modely ART-s´ıtˇ e Architektura
ART-s´ıtˇe (Adaptive resonance theory)
Test bdˇ elosti pr´ah bdˇelosti ρ ... urˇcuje, jak bl´ızko mus´ı b´yt pˇredloˇzen´y vzor k uloˇzen´emu, aby mohly patˇrit do stejn´e kategorie Mechanismus vypnut´ı (zablokov´an´ı) neuronu s maxim´aln´ı odezvou → stabilita × plasticita s´ıtˇe → s´ıt’ m´a velk´e probl´emy i pˇri jen trochu zaˇsumnˇen´ych vzorech (pˇr´ıliˇs nar˚ ust´a poˇcet uloˇzen´ych vzor˚ u)
20 / 32
Hybridn´ı modely ART-s´ıtˇ e Algoritmus uˇ cen´ı
ART-s´ıtˇe (Adaptive resonance theory)
Algoritmus uˇ cen´ı – m´ a 5 f´ az´ı: 1
inicializaˇcn´ı - nastaven´ı poˇc´ateˇcn´ıho stavu s´ıtˇe
2
rozpozn´avac´ı - dopˇredn´y v´ypoˇcet - naleznu v´ıtˇezn´y neuron v rozpozn´avac´ı vrstvˇe
3
porovn´avac´ı - zpˇetn´y v´ypoˇcet - provedu test bdˇelosti
4
vyhled´avac´ı - hled´am jin´y v´ıtˇezn´y neuron
5
adaptaˇcn´ı - adaptace vah u v´ıtˇezn´eho neuronu
21 / 32
Hybridn´ı modely ART-s´ıtˇ e Algoritmus uˇ cen´ı
ART-s´ıtˇe (Adaptive resonance theory) Algoritmus uˇ cen´ı – inicializaˇ cn´ı f´ aze 1
Poˇ c´ ateˇ cn´ı inicializace vah: tij (0) = 1,
i = 1, ..., n
,
1 , 1+n j = 1, ..., m,
0≤
ρ
≤1
wij (0) =
wij (t) ... v´aha mezi vstupn´ım neuronem i a v´ystupn´ım neuronem j v ˇcase t tij (t) ... v´aha mezi v´ystupn´ım neuronem j a vstupn´ım neuronem i v ˇcase t (vzor specifikovan´y v´ystupn´ım neuronem j) ρ ... pr´ah bdˇelosti 22 / 32
Hybridn´ı modely ART-s´ıtˇ e Algoritmus uˇ cen´ı
ART-s´ıtˇe (Adaptive resonance theory) Algoritmus uˇ cen´ı – inicializaˇ cn´ı a rozpozn´ avac´ı f´ aze 2
Pˇredloˇz nov´y vstupn´ı vzor: ~x (t) = {x1 , ..., xn }
3
Spoˇcti odezvu (aktivitu) neuron˚ u ve v´ystupn´ı (rozpozn´avac´ı) vrstvˇe: n X yj (t) = wij (t)xi , j = 1, ..., m i=1
yj (t) ... aktivita v´ystupn´ıho neuronu j v ˇcase t 4
Vyber neuron k, kter´y nejl´epe odpov´ıd´a pˇredloˇzen´emu vzoru (napˇr. pomoc´ı later´aln´ı interakce): k = argmax{yj }
23 / 32
Hybridn´ı modely ART-s´ıtˇ e Algoritmus uˇ cen´ı
ART-s´ıtˇe (Adaptive resonance theory) Algoritmus uˇ cen´ı – porovn´ avac´ı a vyhled´ avac´ı f´ aze 5 Test bdˇ elosti: V´ypoˇcet bdˇelosti µ v´ıtˇezn´eho neuronu k podle: µ kT .~x k
kT .~x k , k~x k n n X X = tik (t)xi , k~x k = xi ,
=
i=1
i=1
Pokud plat´ı µ > ρ, pokraˇcuj krokem 7, jinak pokraˇcuj krokem 6. 6
Zmraz (zablokuj) neuron k s nejvˇ etˇs´ı odezvou: Nastav v´ystup neuronu k doˇcasnˇe na nulu. Opakuj krok 3 (neuron k se ne´ uˇcastn´ı maximalizace). 24 / 32
Hybridn´ı modely ART-s´ıtˇ e Algoritmus uˇ cen´ı
ART-s´ıtˇe (Adaptive resonance theory)
Algoritmus uˇ cen´ı – adaptaˇ cn´ı f´ aze 7
Pokud nebyl nalezen vhodn´y neuron, pˇridej do s´ıtˇe nov´y neuron jako ,,v´ıtˇezn´y”.
8
Adaptace vah u ,,v´ıtˇ ezn´ eho” neuronu k: tik (t + 1) = tik (t)xi , tik (t)xi P wik (t + 1) = 0.5 + nl=1 tlk (t)xl
9
Odblokuj vˇsechny zmraˇzen´e neurony a opakuj krok 2.
25 / 32
Hybridn´ı modely ART-s´ıtˇ e Anal´ yza modelu
ART-s´ıtˇe (Adaptive resonance theory) Anal´ yza modelu Hlavn´ı v´yhody: Stabilita a plasticita s´ıtˇe S´ıt’ sama urˇc´ı spr´avn´y poˇcet neuron˚ u Velk´a citlivost na poˇc´ateˇcn´ı volbu parametr˚ u: pr´ah bdˇelosti poˇrad´ı pˇredkl´ad´an´ı vzor˚ u
Velk´a citlivost na ˇsum v datech Pˇr´ıklady aplikac´ı Shlukov´an´ı Rozpozn´av´an´ı znak˚ u, ˇreˇcov´ych segment˚ u apod.
26 / 32
Hybridn´ı modely Konstrukˇ cn´ı algoritmy Kask´ adov´ a korelace
Kask´adov´a korelace
(Fahlman, Labiere, 1990) robustn´ı rostouc´ı architektura BP-s´ıtˇe
Princip Syst´em zaˇc´ın´a proces uˇcen´ı s pˇr´ım´ym propojen´ım vstup˚ u na v´ystup Postupnˇe jsou pˇrid´av´any dalˇs´ı skryt´e neurony Vstupy kaˇzd´eho nov´eho neuronu jsou propojeny se vˇsemi p˚ uvodn´ımi vstupy i se vˇsemi dˇr´ıve vytvoˇren´ymi neurony
27 / 32
Hybridn´ı modely Konstrukˇ cn´ı algoritmy Kask´ adov´ a korelace
Kask´adov´a korelace
28 / 32
Hybridn´ı modely Konstrukˇ cn´ı algoritmy Kask´ adov´ a korelace
Kask´adov´a korelace Algoritmus uˇ cen´ı Minimalizace MSE na v´ystupu s´ıtˇe Uˇ cen´ı prob´ıh´ a ve dvou f´ az´ıch: Prvn´ı f´ aze: Adaptace s´ıtˇe pomoc´ı algoritmu Quickprop pokud je MSE na v´ystupu dostateˇcnˇe n´ızk´a, KONEC jinak pˇrid´ame nov´y neuron
Druh´ a f´ aze: Pˇrid´an´ı nov´eho neuronu nov´y neuron je adaptov´an tak, aby maximalizoval korelaci mezi sv´ym v´ystupem a chybou na v´ystupu s´ıtˇe → pˇrid´avan´y neuron se ,,nauˇc´ı” nˇejak´y pˇr´ıznak, kter´y vysoce koreluje s aktu´aln´ı (zb´yvaj´ıc´ı) chybou V´ahy do novˇe pˇridan´eho neuronu jsou zmrazeny a v dalˇs´ıch f´az´ıch se douˇcuj´ı jen v´ahy na v´ystup 29 / 32
Hybridn´ı modely Konstrukˇ cn´ı algoritmy Kask´ adov´ a korelace
Kask´adov´a korelace Algoritmus uˇ cen´ı C´ılem uˇcen´ı skryt´ych neuron˚ u je maximalizace S: S =|
p X (Vi − V )(Ei − E )| i=1
p ... poˇcet tr´enovac´ıch vzor˚ u Vi ... v´ystup pˇrid´avan´eho neuronu pro i-t´y vzor V ... pr˚ umˇern´y v´ystup pˇrid´avan´eho neuronu Ei ... MSE pro i-t´y vzor E ... pr˚ umˇern´a chyba
30 / 32
Hybridn´ı modely Konstrukˇ cn´ı algoritmy Kask´ adov´ a korelace
Kask´adov´a korelace Algoritmus uˇ cen´ı C´ılem uˇcen´ı skryt´ych neuron˚ u je maximalizace S: p X S =| (Vi − V )(Ei − E )| i=1 p
X ∂S = σ(Ei − E )fi 0 Iik ∂wk i=1
σ ... znam´enko korelace mezi v´ystupem a pˇrid´avan´ym neuronem fi 0 ... derivace pˇrenosov´e funkce pro i-t´y vzor Iik ... k-t´y vstup pˇrid´avanho neuronu pro i-t´y vzor 31 / 32
Hybridn´ı modely Konstrukˇ cn´ı algoritmy Kask´ adov´ a korelace
Kask´adov´a korelace
Anal´ yza algoritmu Snadn´e rozˇs´ıˇren´ı na v´ıce v´ystup˚ u S´ıt’ sama urˇc´ı spr´avn´y poˇcet neuron˚ u ... uˇzivatel ho nemus´ı specifikovat Rychl´e uˇcen´ı ... v kaˇzd´em kroku se adaptuje jen jeden neuron, v´ahy do st´avaj´ıc´ıch neuron˚ u uˇz se neadaptuj´ı → stabilita Nebezpeˇc´ı pˇreuˇcen´ı ... saturace neuron˚ u Vytv´aˇrej´ı se zbyteˇcnˇe hlubok´e s´ıtˇe
32 / 32