Orzó László
Az agyi információfeldolgozás néhány kezdeti lépésének modellje.
Doktori Disszertáció (1999)
Magyar Tudományos Akadémia Számítástechnikai és Automatizálási Kutatóintézete Analogikai és Neurális Kutatólaboratórium MTA SOTE EKSZ Konzulens: Dr Lábos Elemér
-2-
Bevezetés
1
Bevezetés _________________________________________________________________ 5
2
Hibaterjedés vizsgálatán alapuló összekapcsoltsági becslés mesterséges idegelemek között.8
3
2.1
A feladat megfogalmazása _____________________________________________________ 8
2.2
A Belső reprezentáció tulajdonságai _____________________________________________ 9
2.3
A belső reprezentáció egy leegyszerűsített modellje _______________________________ 10
2.4
Becslés az összekapcsoltságra _________________________________________________ 10
2.5
A szinaptikus súlyok eloszlása _________________________________________________ 14
2.6
Gyakorlatilag is hasznosítható asszociatív idegsejt hálózatok megvalósítása ___________ 15
2.7
Megbeszélés ________________________________________________________________ 16
Dinamikus receptív mező modellezés a látórendszerben. __________________________ 18
Zajszűrés térben és időben. ____________________________________________________ 18 3.1
Biológiai háttér _____________________________________________________________ 19
3.2
Receptív mező definíciók _____________________________________________________ 19
3.2.1 3.2.2 3.2.3 3.3
Morfológiai meghatározottsága________________________________________ 19 Mérési módszerek __________________________________________________ 19 Receptív mezők matematikai leírása____________________________________ 20
Modell vizsgálatok __________________________________________________________ 21
3.3.1 Retinális sejtek receptív mező vizsgálatai________________________________ 3.3.1.1 A retina szerkezete ________________________________________________ 3.3.1.2 Csapok _________________________________________________________ 3.3.1.3 Horizontális sejt __________________________________________________ 3.3.1.4 Bipoláris sejtek___________________________________________________ 3.3.1.5 Ganglion sejtek __________________________________________________ 3.3.2 A talamusz-köztiagy sejtek receptív mezeje ______________________________ 3.3.2.1 ’Lagged’ sejtek___________________________________________________ 3.3.3 Egyszerű receptíve mezejű kérgi idegsejtek, irányérzékenység _______________ 3.3.3.1 Orientáció szenzitivitás ____________________________________________ 3.3.3.2 Szimmetriák _____________________________________________________ 3.3.3.3 A Mozgásirányérzékenység modellje __________________________________ 3.3.4 Komplex sejtek receptív mezeje _______________________________________ 3.4
24 25 26 26 28 30 32 32 33 33 34 35 36
Zajszűrés a látórendszeren belül _______________________________________________ 36
3.4.1 3.4.2 3.4.3 3.4.4 3.4.5 3.4.6 3.4.7
Jeltovábbítás a retinától a kéregig ______________________________________ Térbeli receptív mező tulajdonságok ___________________________________ A receptív mező dinamikájának a hatása ________________________________ Zajszűrés becslése __________________________________________________ A template értékek meghatározása _____________________________________ JPEG kompresszióra való alkalmazás___________________________________ MPEG mozgó kép kompresszió _______________________________________
37 37 40 43 44 48 51
3.5 A receptív mezők valódi dinamikus kiterjedése mesterséges ’scotoma’ vizsgálatok, Receptív mező kölcsönhatások ______________________________________________________ 51 3.6
Konklúziók ________________________________________________________________ 52
-34
Bevezetés
Csebisev módszer alkalmazása a dekonvolúciós CNN algoritmusok gyorsítására ______ 53 4.1
Konvergencia gyorsítása dekonvolúciónál _______________________________________ 53
4.2
Előzmények ________________________________________________________________ 53
4.3
Lineáris algebrai módszerek __________________________________________________ 54
4.4
Példák_____________________________________________________________________ 55
4.4.1 4.4.2 4.5
Rosszul meghatározott mátrix esete ____________________________________ 55 Nem invertálható konvolúció esete _____________________________________ 58
Konklúziók ________________________________________________________________ 61
5 A vizuális thalamo-kortikális rendszer tulajdonsághoz kötött szinkronizációjának a CNN modellje____________________________________________________________________ 62 5.1
Biológiai háttér _____________________________________________________________ 62
5.2
A kortiko-thalamikus szinkronizáció modellje ___________________________________ 63
5.3
A modell struktúrája ________________________________________________________ 64
5.4
A szimuláció kísérleti eredményei ______________________________________________ 74
5.4.1 5.4.2 5.4.3 5.4.4 5.5
6
1. Kísérlet 2. Kísérlet 3. Kísérlet 4. Kísérlet
________________________________________________________ ________________________________________________________ ________________________________________________________ ________________________________________________________
76 77 78 79
Az eredmények vizsgálata és megvitatása _______________________________________ 81
A szinaptikus jel áttevődésének dinamikája és a Neurális Kód _____________________ 83 6.1
A probléma felvetése_________________________________________________________ 83
6.2
Biológiai alapok_____________________________________________________________ 84
6.3
Az alkalmazott modell _______________________________________________________ 85
6.4
A szinaptikus erősségek dinamikus újraszerveződése______________________________ 85
6.5
Az idegsejtek tüzelési frekvencia adaptációjának a modellezése._____________________ 87
6.6
A modellezett kérgi piramis sejtek input-output tulajdonságai ______________________ 88
6.7
Konklúziók és megbeszélés ___________________________________________________ 92
7
Köszönetnyilvánítás _______________________________________________________ 94
8
A doktori disszertáció tézisei ________________________________________________ 95
9
8.1
Bevezetés __________________________________________________________________ 95
8.2
Vizsgálatok módszerei _______________________________________________________ 96
8.3
Új tudományos eredmények tézisszerű összefoglalása _____________________________ 97
8.4
Gyakorlati alkalmazások _____________________________________________________ 99
8.5
A tézisfüzetben hivatkozott irodalom ___________________________________________ 99
Publikációk _____________________________________________________________ 101
10 Idézett irodalom _________________________________________________________ 104
-4-
Bevezetés
A dolgozatban használt rövidítések jegyzéke ANN CNN dLGN
(Artificial Neural Networks) (Cellular Neural Network) (dorsal Lateral Geniculate Nucleus)
EPSP EPSC FIF fMRI
(Excitatory Postsynaptic Potential) (Excitatory Postsynaptic Current) (Finite Impulse Response Filter) (functional Magnetic Resonance Imaging)
IIF IPSP IPSC ISI
(Infinite Impulse Response Filter) (Inhibitory Postsynaptic Potential) (Inhibitory Postsynaptic Current) (Inter Spike Intervall)
JPEG LTD LTP
(Long Term Depression) (Long Term Potentiation)
MPEG MOC
(Maximum Overlap and Compare)
NNAM
(Neural Network Associative Memory)
PET
(Positron Emission Tomography)
PPF
(Paired Pulse Facilitation)
PPD
(Paired Pulse Depression)
RF RMSE UPG
(Receptive Field) (Root Mean Square Error) (Universal Pattern Generator)
Mesterséges neurális hálózatok Celluláris neurális hálózat Hátsó oldalsó térdestest. A thalamusz elsődleges látó magja. Serkentő posztszinaptikus potenciál Serkentő posztszinaptikus áram Véges imulzusválaszú szűrő. Mag mágneses resonancián alapuló, funkcionális agyi működéseket megjenítő eljárás. Végtelen imulzusválaszú szűrő. Gátló posztszinaptikus potenciál Gátló posztszinaptikus áram Az egymást követő akciós potenciálok közötti idő Veszteséges állókép kompresszáló eljárás A szinapszis hosszú távú megerősödése A szinapszis hosszú távú erősség csökkenése Veszteséges mozgókép kompresszáló eljárás Nem neurális hálozat alapú asszociatív memória. Amelyben el vannak tárolva a mintázatok és később az előhívás során ki van választva a legnagyobb átfedést mutató Neurális hálózat alapú asszociatív memória modell. A mintázatok a szinaptikus súlyok mátrixában vannak eltárolva. Pozitron emissziós tomográfián alapuló agyműködéseket megjelenítő eljárás. Egymást követő akciós potenciálok növelik a kiváltott EPSC-k amplitúdóját Egymást követő akciós potenciálok csökkentik a kiváltott EPSC-k amplitúdóját Receptíve mező Négyzetes középhiba Unniverzális minta generátor. Egyszerű algoritmus akciós potenciál szerű viselkedés gyors szimulálására.
-5-
Bevezetés
1 Bevezetés Sok igen fontos területe van az idegtudománynak. Ezek közül számomra a legérdekesebb azok amelyek azt firtatják, vajon miért alakultak ki pont azok a típusú struktúrák és fiziológiai folyamatok az evolúció során, amelyeket ténylegesen megtalálhatunk? Magamévá tettem azt a sokak által vallott nézetet mely szerint ezek a mérhető folyamatok, és a megfigyelhető struktúrák bizonyos szempontok szerint igen hatékonnyá, közel optimálissá váltak az évmilliókig tartó kiválogatódás során. Fontos lenne pontosan meghatározni, vagy legalább megbecsülni, melyek ezek a fent említett lényeges szempontok, perem és kezdeti feltételek. Természetesen tudom azt is, hogy sok, a véletlent és a kezdeti feltételeket tükröző változatosságot is tartalmaznak a biológiai rendszerek, de munkahipotézisnek feltétlenül elfogadhatónak tartom a fentieket. Az utóbbi években egyre pontosabb mérési adatok halmozódtak fel arról, hogy a külvilágot milyen módon reprezentálja az idegrendszer. Arra nézve is történtek kísérletek, hogy megmagyarázzák, miért alakulnak ki pont ilyen típusú belső ábrázolások. Ebben a dolgozatban megpróbáltam megvizsgálni, milyen tulajdonságok szerint lehetnek ezek megközelítően optimálisak és még milyen, de már nem feltétlenül az optimalitást érintő további szempontokat kell még figyelembe venni. Először azt vizsgáltam meg (a második fejezetben), hogy hogyan lehet egy asszociatív memóriát igen sok minta tárolására használni és ehhez milyen előfeldolgozás, preprocesszálás szükséges. Feltételezve azt hogy az agykéregben igen sok mintázatot kell asszociatívan tárolni, a kapacitás akkor használható ki hatékonyan ha ritka mintázatok kerülnek a tárba. A bemenő mintázatok általában nem ilyenek, ezért érdemes azokat egy ilyen belső alakra hozni, transzformálni. Ez az átalakítás sok fajta módon megvalósulhat. Teljesítenie kell ennek a “ritkító transzformációnak” viszont néhány speciális, a feladat sajátosságaiból fakadó feltételt is. Az egyik legfontosabb ezek közül az hogy a bemeneten esetleg előforduló hiba ne nőjön túl gyorsan a transzformáció során, mert akkor még az asszociatív memória sem lesz képes azt a későbbiekben kijavítani. Ha egy egyszerű mesterséges idegsejt modellt használunk, akkor ezekből a feltételekből egyszerűen jósolható a feladatot végrehajtó neuronhálózat néhány alapvető tulajdonsága: például az összekapcsoltsága. Ezek a meggondolások viszont csak egyszerű, de matematikailag is viszonylag jól kezelhető objektumokon, idegsejt modelleken teljesülnek. Mi a helyzet akkor, ha a valódi idegsejtek a tulajdonságait vizsgáljuk? Ez esetben is feltételezhető, hogy a bemeneti képek eloszlásának lehetőleg legjobban megfelelő struktúrák alakulnak ki a fenti transzformáció létrehozására. Ezért a dolgozat következő részében, a harmadik fejezetben megpróbáltam megvizsgálni milyenek a biológiailag valóban kialakuló receptív mezők tér-időbeli szerkezetei és a megelőző fejezetben vizsgált hiba terjedést, illetve annak a későbbi szűrését ezek hogyan befolyásolják. A saját korábbi retina méréseimhez, valamint a retináról és a primer látókéregről elérhető irodalmi adatokhoz fenomenológikus modelleket illesztettem, amellyel jól reprodukálhatóak voltak a mért dinamikus receptív mező struktúrák. A saját és mások vizsgálataiból úgy tűnik, tényleg a bemeneti és az additív hibák minimalizálása és a belső reprezentáció ritkaságának a biztosítása az a két alapvető feltétel amelyeket az idegrendszernek ez a perifériás része próbál megvalósítani. Ha egy, a gyakorlatban is hatékonyan használható asszociatív memória megépítése a célom akkor ezt érdemes a biológiai rendszerektől eltanult módszerek felhasználásával elkészíteni. Tehát hasznos lehet egy alkalmas belső reprezentációs alakra hozni
-6-
Bevezetés
a bemenő mintákat, amelyek egyszerre felelnek meg a bementi mintázatoknak és az alkalmazandó asszociatív neuronhálózat által támasztott feltételeknek is. Mivel ezeket a dinamikus receptív mezőket és az általuk generált belső reprezentációkat végül is valamilyen praktikus alkalmazás megvalósításának az eszközeiként képzelem el, ezért érdemes őket egy lehetőleg igen gyors eljárással megvalósítani, létrehozni. A Celluláris Neurális hálózatok (CNN) hatékony eszköznek tűnnek az ilyen feladatok igen gyors, akár valós idejű megvalósítására is. Párhuzamos működésük és analóg dinamikájuk rendkívüli sebességet biztosít a számukra, míg lokálisan csatolt szerkezetük nagy mértékben hasonlatossá is teszi őket az idegrendszer ezen részének a struktúrájához. Ezért a vizsgálataimnak egy jelentős részét a CNN szimulátorok felhasználásával végeztem. A számítások felgyorsítása érdekében alkalmaztam egy lineáris algebrai mátrix inverziós eljárást a CNN-el történő dekonvolúciókra. Az itt elért eredményeimet a negyedik fejezetben fejtem ki. Egy másik nem kevésbé fontos területe az idegtudománynak annak a megértését célozza meg, hogy milyen módon vannak (asszociatívan) tárolva a fenti módon előfeldolgozott minták az idegsejthálózatokban. Felmerült annak a kérdése is, hogy vajon hogyan kommunikálnak az idegsejtek egymással. Az alapvető idegélettani működésekről egyre több adat áll rendelkezésre, de maradtak még teljességében meg nem értett folyamatok is. Így elsősorban a kérgi, azon belül is a magasabb kérgi területeken nehéz pontosan leírni milyen a sejtek közötti kommunikáció, illetve melyik az idegsejtek működését leíró paraméter hordoz lényeges információt a sejtek közötti jelcserében. Sok egyre bonyolultabb, sajátos receptív mezővel rendelkező, de ugyanakkor egyre szélesebb térbeli- és ingertartományból aktiválható idegsejt van. Felmerült a kérdés vajon a sejtek válaszainak az időbeli struktúrája hordoz-e további információt a kiváltó ingerekkel kapcsolatban. A válasz minden bizonnyal az hogy igen, a kérdés inkább ennek a pontos mibenléte. Az utóbbi időben sok jel mutatott arra, hogy az agykéregben az egy tárgyat, objektumot jellemző jelek összekapcsolásában a kérgi sejtek aktivitásának a szinkronizációja jelentős szerepet játszhat. A kísérleti adatok egy része azt mutatta, hogy a magas (40-70Hz) frekvenciájú oszcillációk kitüntetett szerepet kapnak egy ilyen szinkronizáció kialakulásában. Abban az irányban is szóltak érvek melyek szerint elsősorban az agykérgen belül alakul ki ez a szinkronizáció. Mások kísérleti adatokat is szolgáltattak arra vonatkozóan, hogy más, kéregalatti központok is részt vesznek ezekben a folyamatokban. Az ötödik fejezetben bemutatok egy modellt, amely megpróbálja a jól ismert kortiko-thalamikus kapcsolatok segítségével magyarázni a szinkronizáció kialakulását. A modell eredményeiből úgy látszik, hogy jogos annak a hangsúlyozása, hogy a kérgi szinkronizáció kialakulásában a kortiko-thalamikus rendszernek is komoly szerepe lehet. Mivel sok idegélettani adat szól amellett, hogy a fenti pontosságú processzálásra nem minden esetben képesek az idegsejtek, illetve kialakulásukhoz esetleg túl hosszú időre van szükség, ezért a hatodik fejezetben azt vizsgáltam meg vajon a legújabban megismert fiziológiai tények tükrében, hogyan adódnak át a jelek a kérgi idegsejtek között. Arra voltam kíváncsi, hogy egy az előzőeknél kisebb pontosságot igénylő, sztochasztikus, a véletlent is magában foglaló átviteli folyamatok hogyan befolyásolják a kommunikációt. Az eredmények azt mutatják, hogy ha a modellbe beépítjük a kérgi idegsejtek egy jellemző tulajdonságát az akciós potenciálfrekvencia adaptációt, valamint az legújabban megismert tényeket a szinaptikus átvitellel kapcsolatban, akkor a szimulált idegsejtek nem megfelelően adják tovább a tüzelési frekvenciájukkal kapcsolatos információkat. Találtam viszont egy másik paramétert, amely bár kevésbé pontos processzálást igényel mint az akciós potenciálok pontos egymáshoz képest való időzítése, mégis úgy viselkedik az elemi tanulási folyamatoknak tekintett LTP és LTD hatására
-7-
Bevezetés
mint amit több mesterséges neuronhálózat modell is feltételez, és valamilyen módon mégis tükrözi a sejteknek az időbeli működését is.
-8-
2 Hibaterjedés vizsgálatán alapuló mesterséges idegelemek között.
Hibaterjedés
összekapcsoltság
becslés
(Egy optimalizáló stratégia mintázatok asszociatív tárolásához idegsejt hálózatokban) Ahhoz hogy optimálisan tudjuk használni egy idegsejt hálózaton alapuló asszociatív memóriát arra van szükség, hogy tetszőleges bemenő mintázatokból megfelelő belső reprezentációs alakokat hozzunk létre. Ha ez a belső mintázat nem csak nagyobb (az őt reprezentáló vektor dimenziója nagyobb), hanem ritkább is mint a bemenő mintázat, akkor az ilyen mintákból eltárolható elemek száma óriási lehet1. Ennek a belső reprezentációnak, mindazonáltal teljesítenie kell néhány az információ megőrzésével kapcsolatos megkötést is. Modellezve a belső reprezentáció kialakulásának folyamatát, következtetéseket vonhatunk le az ezt kialakító, köztes idegi hálózat kapcsoltságára is. A zaj, vagy hiba terjedésének a vizsgálatával a modellezett McCulloch-Pitts idegsejteken megmutattukIV, hogy az összekapcsoltságnak, a konvergenciának e szempont alapján a lehető legkisebbnek kell lennie. További feltételezéseket téve az inputra és így a hibákra az is kimutatható, hogy az idegelemek lokális kapcsoltsága csökkenti bizonyos fajta hibák kiterjedését. Ezek a meggondolások rávilágíthatnak a topografikusan (retinotópia, szomatotópia stb.) rendezett kapcsolatmintázatoknak az általános megjelenésére különböző állatok idegrendszerében. Megmutattuk, hogy ez a fajta előfeldolgozás akár gyakorlati szempontból is használható mesterséges asszociatív neuronhálózatok szerkesztésétI is lehetővé teszi. 2.1 A feladat megfogalmazása Az emberi agynak óriási a memória tároló képessége. Hogy tud még akár egy ilyen nagy idegsejt hálózat is ilyen irdatlan mennyiségű mintázatot eltárolni? A válasz talán az eltárolandó tárgyak megfelelő belső reprezentációjában rejlik. Egy ilyen alkalmasan választott belső ábrázolásnak azonban teljesítenie kell néhány feltételt. Ezeknek a feltételeknek a megfogalmazására, egy mesterséges idegsejt hálózat modellen vizsgáltuk a lehetséges leképezés működését, viselkedését és a tulajdonságait. Ahhoz hogy egy a gyakorlatban is használható asszociatív neuronhálózat modellt készítsünk arra van szükség, hogy az eltárolandó minták száma nagyon nagy legyen. Máskülönben hasznosabb lenne, ha az eltárolandó mintákat egyenként raktároznánk el. Ez esetben visszahíváskor mindegyikkel össze kell hasonlítani az előhívandó mintát és ki kell választani a legnagyobb átfedést mutatót. Sajnos az idegsejt hálózatok információ tároló kapacitása korlátozott2. Valóságos, gyakorlati problémák esetén nem is a hálózat információ tároló kapacitása az igazi probléma, ami sok milliónyi idegsejtből álló hálózat esetén igen nagy lehet, hanem az eltárolható független bemenő mintázatoknak a viszonylag kicsiny száma. Általában nem sűrű minták tárolására van szükség, egyszerre sok milliónyi aktív idegsejttel. Elégségesnek látszik ha csak egy jóval kisebb aktív idegsejt populációval kódoljuk a mintázatokat3, 4,, azaz ritka mintázatokat használunk. Ha ilyen ritka mintázataink vannak akkor az idegsejt alapú asszociatív hálózatokban sokkal több minta elraktározható5, sőt akár divergálhat is a számuk, ha a normalizált minta vektorok átfedése egyhez tart1. Még lokális tanulási szabályokat is ismertek, amelyek segítségével igen gyorsan eltárolhatók az ilyen mintázatok6. Sajnos a természetben található mintázatok általában nem ilyen ’ritka’ szerkezetűek, hanem inkább speciális, többnyire ultrametrikus, hierarchikus, fa szerkezetű eloszlást követnek7. Ahhoz hogy javítsunk a idegsejt alapú asszociatív hálózatok teljesítményén a bemenő mintákat egy
-9-
Hibaterjedés
megfelelően nagy és ritka belső reprezentációs formára kell kódolni8. A következő ábrán vázolom a reprezentáció generálásának sémáját. W11 W12 . . W1k
W21 W22 . . W2k
. . . . .
. . . . .
X1
X2
. . . XN
WA11 WA21 . . WAN1
WA12 WA22 . . WAN2
. . . . .
. . . . .
WN1 WN2 . . WNk
. . . . .
I1 I2 . . Ik
Bemenő minták
Belső Reprezentáció (N>>k és X ritka)
WA1N WA2N . . WANN
Neurális Asszociatív Memória 1. Ábra
2.2 A Belső reprezentáció tulajdonságai Milyen feltételeknek kell eleget tennie ennek a reprezentációnak? • Először is dekódolhatónak kell lenni. Azaz elég nagynak, bőnek kell lennie ahhoz, hogy mindegyik bemenő mintázatot azonosítani lehessen a reprezentációja alapján. Amennyiben ez nem teljesül, akkor létezik két olyan bemenő minta amelyeknek egyforma a belső ábrázolása. Ezeket a későbbi feldolgozás során már nem lehet majd egymástól semmilyen módszerrel megkülönböztetni. Mindazonáltal, egy ilyen leképezése, ’projekciója’ a bemenő mintázatoknak a reprezentációkra lehet hasznos is, hiszen segíthet találni egy invariáns (elhelyezkedés, méret, elforgatás invariáns) belső ábrázolást. • Hasznos lenne, ha a reprezentáció kódolása hasonló idegsejt (modell) elemekkel történne mint az asszociatív hálózaté. Az egyszerűség kedvéért itt mi elhagyjuk a visszacsatoló tagokat (már ha vannak ilyenek, például a kortiko-thalamikus visszacsatolás stb.) és csak az előrecsatolt idegsejt kapcsolatokat vizsgáljuk. Az asszociatív idegsejt hálózatok kapacitása elsősorban a belső összekapcsoltságtól függ. Mindazonáltal eléggé ritka mintázatok előhívása esetén a neuronok állapotát kezdetben elsősorban a bemenő jelek fogják meghatározni. A visszacsatolás, ha egyáltalán van ilyen az adott neuronhálózat modellben, csak a későbbiekben változtathatja meg az idegsejtek állapotát, mivel a megfelelően (‘optimálisan’) tárolt ritka mintázatok kölcsönhatása kicsiny (közel merőlegesek egymásra a minták egy állandó faktor kivételével). Magyarán, a korábban előhívott mintázat, a hálózat pillanatnyi állapota, csak kicsiny mértékben zavarja az újabb minta előhívását.
- 10 -
• •
•
Hibaterjedés
Az idegsejteknek lehetőleg függetleneknek kell lenniük egymástól, azért hogy garantálni tudjanak egy jól elosztott reprezentációt. Tehát ne lehessen egy neuron csoportot egy neuronnal helyettesíteni. Ez nem adna semmi alapvetően újat a modellhez. A bemenettől való függőségüknek (szinaptikus súlyok) előre meghatározottnak kell lennie (egy korai kritikus időszak után), és bárminemű elkerülhetetlen plasztikus változásnak igen lassan kell bekövetkeznie azért, hogy az asszociatív hálózat bemenetét stabilnak lehessen tekinteni. Végül, de nem utolsó sorban a belső reprezentáció generálásának robusztusnak kell lennie. Azaz, a bemeneten megjelenő kicsiny hibáknak nem szabad nagyon megváltoztatniuk a belső ábrázolást, mert különben a neuronhálózat asszociatív tulajdonságai megszűnnének.
2.3 A belső reprezentáció egy leegyszerűsített modellje McCulloch-Pitts idegsejt modellek felhasználásával elkészítettük a belső reprezentáció generálásának egy egyszerűsített modelljét. Minden a belső reprezentációban résztvevő idegsejtet előre megszabott véletlen (súlyú) szinaptikus kapcsolatokkal kötöttünk össze a bemenetekkel. Megfelelő méretű küszöb használatával (azt mindenhol ugyanakkorának választva) elérhető, hogy az idegsejteknek csak egy kis töredéke válik aktívvá egy bemenő mintázat hatására, így a reprezentáció megfelelően ritka lesz. Ha az így kódolt, belső reprezentációban résztvevő neuronok száma megfelelően nagy, akkor igen sok mintázatot tárolhatunk egy ilyen méretű asszociatív neuronhálózatban. Az előző szakasz utolsó feltételéből kiindulva viszont behatárolhatjuk a reprezentációt generáló hálózat összekapcsoltságát. 2.4 Becslés az összekapcsoltságra Próbáljuk meg statisztikai módszerekkel vizsgálni a hiba terjedését egy modell idegsejten! Az egyszerűség kedvéért továbbra is McCulloch-Pitts mesterséges idegsejt modellt használunk.
Y = 1 ha W X ≥ Θ egyébként Y = 0 ahol W a szinaptikus súlyvektor (W úgy normalizált hogy ha s = ( W X), akkor σ (s) = 1) i X = Bemenő mintázat (X = ±1, egyenlő valószínűséggel) i Θ = A Küszöb Y = A neuron kimeneti értéke
(1)
N = X dimenziója
ε = X azon része amely az inverzére változik Legyen a bemeneti mintázat véletlenszerű bináris vektor, komponensenként egyenletes eloszlással. Az általánosság megsértése nélkül feltételezhetjük, hogy a szinaptikus súlyok egyenletes eloszlásúak és úgy vannak normalizálva, hogy az inputtal való szorzatuk szórása egységnyi. Azaz a küszöb és a súlyozott bemenet is gyök N-el normalizált. Ezeket a bemeneti és súlyvektorokat előre megadottaknak tekintjük. Ekkor megbecsülhető a kimenet változása a bemeneti jelek egy részének a megváltozására, különböző küszöbértékek esetén, feltéve hogy a vektorok hossza (N>>1) nagy. Így a központi határeloszlás tételből következik, hogy annak a
- 11 -
Hibaterjedés
valószínűsége hogy egy adott mintavektor és a szinaptikus súlyvektor skaláris szorzata nagyobb mint egy küszöb (Θ) az a következőképpen adható meg:
P(s > Θ ) =
− s2 1 ∞ ) ds = exp( ò 2 2π Θ
∞∞ (s − y) 2 y2 = − − ) dyds ) exp( exp( ò ò 2ε 2(1 − ε ) 2π ε (1 − ε ) Θ−∞ 1
(2)
Tehát a belső reprezentációban résztvevő sejteknek ilyen aránya válik aktívvá egy bemenő mintázatra. Ez Θ megfelelő megadásával tetszőlegesen kicsire állítható be. Ha a bemenetnek csak ε részét változtatjuk ellentétes előjelűre akkor annak a feltételes valószínűsége, hogy az output még mindig 1 a következő:
∞ ∞ y2 (y− s) 2 p(ε , Θ ) = ) exp( − ) dy) ds ò ( ò exp( − 2(1 − ε ) 2ε 2π ε (1 − ε ) Θ Θ+s 2 1
(3)
Ez megfelel annak, amikor a bemeneti vektornak ε része valamilyen hiba folytán saját ellentétére változik (bemenő hiba). Itt az érdekel bennünket vajon mennyi marad azon sejtek száma amely azonos a hibátlan illetve a hibás bemenetre kapott reprezentációkban, azaz mekkora közöttük a különbség (kimenő hiba). Így megbecsülhetjük a hiba növekedését, ami ha nagy, leronthatja az asszociatív hálózat teljesítményét, sőt akár meg is akadályozhatja a működését. A fenti egyenlet megadható a következő alakban is: ∞ 1 ∞ s2 z2 ) dzds p( ε , Θ ) = exp( − ò exp( − ) ò 2π Θ 2 Θ +(2ε −1)s 2 2 ε (1−ε )
(4)
Itt feltételeztük, hogy a súlyvektor komponensei egyforma eloszlást követnek. Így látható, hogy a kimeneten kapott hiba csak a bemeneten adott hibától és a küszöb megválasztásától függ, de független a hálózat méretétől. A 2. ábrán vázoljuk a kimeneti hiba valószínűségének függését a bemenő hibától különböző küszöbértékek esetén. Jól látható hogy a hiba igen gyorsan nő, mind a küszöb (Θ) mind a bemenő hiba (ε) emelkedésével. Hogy viselkedik ez a függvény a minket érdeklő kis bemenő hiba és viszonylag magas küszöbérték esetén? Csak azok az idegsejtek változtathatják meg az értéküket amelyek amúgy is a küszöb körüli értékű aktivációt kapnak a bemenettől. A fellépő változást természetesen normalizálni kell a teljes aktivitás figyelembevételével. Így a hiba valószínűsége ha (ε<<1 és 0< Θ): p(ε , Θ ) ≈ s(ε ) exp( − Θ 2 / 2) / 2π ⋅ erf( Θ ) ≈ Θ ε
(5)
- 12 -
Hibaterjedés
Látható hogy nagy hígítás, ritka belső reprezentáció generálása, azaz magas küszöb esetén és kis bemenő hibánál a kimeneten a hiba sokkal gyorsabban fog nőni mint a bemenő hiba. Ha a hiba eléri az ½ értéket akkor pedig: p(ε , Θ) = (erf(Θ))2
(6)
Ahol erf a hibaintegrált jelzi. Ez pontosan annyi mint amekkora átfedést, korrelációt mutatnának a hálózat által generált belső reprezentációk két teljesen független bemeneti mintára. Amennyiben a hiba tovább nő, akkor a kimeneti hiba valószínűsége is tovább emelkedik. Megjegyzendő a hiba növekedésének egyfajta “furcsa” viselkedése a feladat szempontjából közömbös, tehát a minket itt nem érdeklő, nulla küszöbérték körül (Θ≈0)) (2. Ábra), amikor is a hiba lassabban nő a kimeneten mint a bemeneten. Ugyanaz a fajta becslés amelyet a kis bemeneti hiba esetén tettünk korábban, igazolja ezt a furcsa eredményt. Tegyük fel hogy nem minden bemeneti elem van hozzákapcsolva minden reprezentációs idegelemhez. Legyen ezen ténylegesen létező kapcsolatok száma m (N>m>>1)! Ebben az esetben azon neuronoknak a száma amelyeket a bemenő hiba megváltoztat és amelyekhez tartozó szinaptikus súly nem nulla binomiális eloszlást követ. Ennek az eloszlásnak az átlaga mε és (mε (1 − m / N )) a szórása. Így ha az (m>>1), akkor p(m,ε,Θ) megközelíti p(ε,Θ)-t minden Θ-re. Mivel p(ε,Θ) legalábbis az adott tartományban egy konvex függvény, ezért az integrálása egy adott bemeneti hiba intervallumra csökkenteni fogja a kimeneti hibát, összehasonlítva azt a teljesen összekötött hálózatéval.
2. Ábra A McCulloch-Pitts idegsejten a kimeneti hiba valószínűsége a sejt küszöbének (Θ) és a bemenet hibájának (ε) a függvényében.
- 13 -
Hibaterjedés
3. Ábra A kimeneti hiba valószínűségének az aránya a teljesen kapcsolt és a minimálisan összekötött neuron esetén az alkalmazott küszöb (Θ) és a bemeneti hiba (ε) függvényében. A különböző küszöb (Θ) értékekhez azt a minimális kapcsoltságot használtuk amely még generálni tudja a megfelelő hígítást: k = -log2(erf(Θ))
Ezekből az eredményekből levonhatjuk azt a következtetést, hogy pontosan olyan összekapcsoltság biztosítja a legkisebb hibanövekedést a kimeneten amelynél a nem nulla értékű kapcsolatok száma a minimális, de még generálni tudja a hálózat kimenetén a megfelelő hígítást, tehát még biztosítja reprezentáció ritkaságát. Ezen megfontolások alapján legyen az idegsejt válasza 1 akkor és csak akkor, ha az összes a bemeneti mintázathoz kötött kapcsolata pozitívan befolyásolja a kimenetét. Egyébként legyen az értéke -1 (vagy nulla az idegsejt állapot definíciójától függően). Azaz legyen: Xi = sign(Wi). Ebben az esetben már nem lesznek érdekesek a szinaptikus súlyok pontos értékei, hanem csak az előjelük és méretüket akár egységnyinek is választhatjuk (‘clipped’ modell10). Ezzel az eljárással mindig biztosítható a maximális küszöb kiválasztása. A minimális összekötöttség amely 1/2k hígításhoz (azaz ahhoz, hogy a nem nulla elemek száma 1/2k legyen) még feltétlenül szükséges k (=m). Ebben az esetben a hiba a kimeneten a következőképpen transzformálódik 1-(1-ε)k amennyiben a bemeneti hiba ε. Látható hogy kis hibára (ε) a kimeneti hiba minimális kapcsoltság esetén p(ε)≅kε szerint változik, ami még mindig jelentős hibanövekedést jelenthet a hálózat paramétereitől függően. Összehasonlíthatjuk ezt a módszert a teljesen összekapcsolt rendszerrel. A 3. ábrán látható, hogy a kis bemeneti hibára a minimális kapcsoltság sokkal jobb hibaterjedést eredményez, bár ez az előny a hiba növekedésével csökken pusztán azért mert a hiba mindkét esetben az egységnyi értékhez tart. Amennyiben a bemeneti jelek már eleve hígak, ritka mintázatokból állnak akkor a kapcsoltságra némileg más becslést kell tennünk. Ilyen körülmények között előnyösebb ha az
- 14 -
Hibaterjedés
idegsejtek aktivitását (X) úgymint a súlyvektorokat (W) is a {0,1} értékekkel jellemezzük. Ekkor a kimenet ritkaságát ak-nak vehetjük, ahol a megfelel a bemeneti neuronok átlagos aktivitásának. Amennyiben értelemszerűen a kisebb mint 0.5 akkor k értékét akár kisebbnek is választhatjuk megtartva ugyan azt a hígítást, a ritkaságot. A fentiekből látható, hogy hasznos lehet több rétegét használni a fenti típusú modell idegsejteknek, mert ezzel esetleg csökkenthető a szükséges összes kapcsolatok száma. Ha a bemenő minták nem függetlenek, hanem korrelált az aktivitásuk, akkor az további megkötést jelent a kapcsoltságra vonatkozóan. A többszörös bemeneti kapcsoltság (k>0 de lehetőleg kicsi) nem csak azért szükséges, hogy a megfelelően ritka reprezentációt le lehessen gyártani, hanem azért is, hogy a reprezentációs elemek válasza egymástól lehetőleg független legyen a különböző bemenő minták esetén. Azaz a reprezentációs idegsejtnek csak a bemenő mintázatoknak egy kis töredéke esetén szabad aktivizálódnia. Így a konvergencia a belső reprezentációs egységekre lehet sokkal nagyobb mint a minimális lenne megfelelően megválasztott küszöbbel, ha ez biztosítja a megfelelő kimeneti aktivitás eloszlást és a hiba minimális növekedését, terjedését. A becsléseinkből levonható az a következtetés, hogy kis számú független bemeneti szinapszisnak kell meghatároznia egy asszociatív idegsejt hálózat kezdeti értékeit. Ellenkező esetben egészen kis hiba a bemeneten teljesen megváltozott kezdeti értéket generál és innen már a hálózat asszociatív tulajdonságai sem tudják kinyerni, visszakapni a megfelelő információkat. Ilyen minimális mértékben kapcsolt hálózat esetében a rendszer dinamikája is könnyebben tárgyalható és akár egzakt (nem csak statisztikai) következtetések is levonhatóak9, 10. Az asszociatív hálón belül is végesnek (kicsinek) érdemes tehát választani a kapcsoltságot. Ha a hálózat aktivitás mintázata távol van az eltárolt mintáktól, akkor az lassabban fog változni, összehasonlítva a teljesen kapcsolt esettel. Azt jelenti ez a tulajdonság, hogy az ilyen hálózatok simább vonzási tartomány szerkezettel rendelkeznek. Ha a bemenő minták átlagos aktivitása változik meg, akkor az is elvárható, hogy a belső reprezentációs elemek aktivitása erre kevéssé legyen érzékeny. Ilyen szempontból is a minimálisan csatolt hálózatok az optimálisak. 2.5
A szinaptikus súlyok eloszlása Minden bemeneti minta eloszláshoz lehet találni egy megfelelő szinaptikus súlyeloszlást, amely biztosíthatja a bemenet alkalmas, optimális leképezését11, 12. Itt mutatunk egy példát ami azt bizonyítja, hogy ha a bemenő hibának van valamilyen belső szerkezete, ismert (vagy akár ismeretlen) eloszlása akkor van olyansúly eloszlás ami a hibaterjedést minimalizálja. Tegyük fel tehát, hogy a bemeneti hibák nem függetlenek, hanem van valamilyen lokális korreláció közöttük. Ez gyakran előfordul, hiszen például természetes képek esetén maguk a szomszédos pixel értékek is így viselkednek. Ha a kapcsoltság a reprezentációt generáló hálózatban nem csupán minimális hanem megfelelő mértékben lokális is akkor akár az is elérhető hogy a kimeneti hiba akár csökkenjen is a bemenetihez képest. Tegyük fel tehát hogy a bemeneten a hiba εN és egy bizonyos területre lokalizált. Ha a belső reprezentációban résztvevő idegsejtek szinaptikus súlyainak a konvergencia sugara, lokális kiterjedése l akkor p(ε)-ra a következő becslés tehető:
- 15 -
Hibaterjedés
ε p(ε ) ≈ a(1 − (1 − ) k ) a ahol (ε N + 2l ) a= N
(7)
εN lokalizált hiba Input
k db. nem nulla súly van egy l szélességű sávban minden neuronon
Belső Reprezentáció
l N
4. Ábra
Látható hogy a konvergencia mértéke behatárolja a kimeneti hibát. Ez jelentősen csökkentheti a belső reprezentáción megjelenő hibák méretét. Ha Nε>>l akkor p(ε)~ε. Léteznek igen jó algoritmusok amelyek a bemenő minták topografikus elrendeződéséhez vezetnek13. Ezek a tények és az előny, amely a bemenő huzalozás minimalizálásából származik igazolni látszanak az optimális voltát és a szinte univerzális előfordulását a különböző élőlények idegrendszerében ennek a fajta kapcsolatrendszer szerkezetnek. Ha bármilyen más információ áll rendelkezésre a bemenő mintázat elemeiről, például a közöttük lévő korrelációkról, akkor várhatóan a hibaterjedést minimalizálni lehet egy alkalmas, megfelelő leképezéssel. 2.6
Gyakorlatilag is hasznosítható asszociatív idegsejt hálózatok megvalósítása Hogy összehasonlíthassuk a fenti módszert (NNAM) egy már korábban említett, egyszerű, de igen hatékony maximális átfedést kereső algoritmussal (MOC) becsléseket végeztünk a memória és idő felhasználásra a két különböző modellen. Legyen m a bemenő mintázatok mérete, N és a a belső reprezentáció mérete és az előre meghatározott átlagos aktivitása, ritkasága. Ekkor az eltárolható minták száma a neuronhálózat modellben (NNAM) p=αcN/(a log(1/a)). A képletből megállapítható, hogy ha a tart a nullához, akkor p minden határon túl nőhet. (Ismeretes, hogy a minták átfedő jellege miatt a hálózat információ tároló kapacitása ebben az esetben nem nő,
- 16 -
Hibaterjedés
hanem némiképp, de nem túl jelentősen, csökken is.) Ha a kicsi akkor αc = 0.5-nek vehető (’clipped model’10). A memória amely szükséges a fenti minták tárolásához (levágott szinaptikus súlyok esetén (|Wij| = 1)) ~ pm az MOC modell esetén, illetve ~N2+mN az NNAM esetében. Az információtartalom becslésén alapuló meggondolásokból, amelyek szerint biztosítani kell az egyértelmű dekódolhatóságot, illetve a hűséges reprezentációt, kapunk még egy megkötést az aktivitás lehetséges értékeire: m
>m (l) a két modell (NNAM és MOC) memória igénye szinte megegyezik. Ugyanakkor, a NNAM modell esetében jelentősen csökkenthető a memória igény ha csak a reprezentáció aktív idegsejtjeinek a szinaptikus súlyait töltjük be a memóriába. Ekkor ugyan csökken a hálózat kapacitása, de még inkább csökkenhet a memória igénye. Ez a módszer biztosíthatja a NNAM modellek jobb teljesítményét még soros processzálás esetén is. Párhuzamos feldolgozás esetén a minta vektorok előhívása a NNAM modell esetén néhány ciklusidőnyi. Ez sokkal jobb mint amit a MOC algoritmus nyújthat ahol ez O(log(p)). Természetesen a különbség csak nagy p értékeknél szignifikáns! Sajnos a NNAM modellekben elérhető vonzási tartományok jelentősen kisebbek mint azok amelyek a MOC módszer alkalmazása esetén1 kaphatóak. Mindazonáltal ha feltételezünk egy további hibaszűrést a belső reprezentáció előállítása során, megfelelően beállított szinaptikus súlyvektorokkal amelyek megfelelnek a bemeneti minták eloszlásának (illetve a hibák eloszlásának), akkor ez a különbség csökkenhet, illetve talán még az ellentétére is változhat. 2.7
Megbeszélés A külső világból érkező információkat az agykéregbe, minden valószínűség szerint a receptor idegsejtek tüzelési mintázata közvetíti. Bármi nemű műveleteket is végezzen a további lépésekben az idegrendszer, az elkerülhetetlen, hogy ennek a kialakult aktivitás mintázatnak egy hűséges robusztus belső reprezentációnak kell lennie. Tehát kis zajok, hibák esetén a belső reprezentációnak valamilyen mérték szerint közel kell lennie a hiba nélkülihez. Igen nehéz összehasonlítani a nehezen megszerzett, kísérletileg kimért adatokat a meglévő, biológiailag létező kapcsolatok számáról az elméleti becslésekkel. Még csak az sem bizonyított egyértelműen vajon milyen szerepet játszik az idegsejtek időbeli aktivitás mintázata az agyi információfeldolgozásban. Vannak azonban érdekes eredmények amelyek azt mutatják, hogy például az idegsejtek egy csoportjának szinkron aktivizálódása szerepet játszhat bennük15. Az ilyen folyamatok más fajta és talán teljesen eltérő feltételeket kívánhatnak meg a hálózattól. Az idegsejtek válasza általában nem olyan mint a McCulloch-Pitts idegsejt modelleké, hanem inkább a sejtek tüzelési frekvenciája mutatja mennyire hatásos az inger. Kevés adat található az irodalomban arról, hogy milyen az idegsejtek átlagos aktivitása a különböző agyi területeken. Általában csak valamilyen közvetett módszerrel lehet ezekre következtetni (PET, FMRI). További probléma az, hogy jelentős átfedés van a bemeneti sejtek (például a thalamusz sejtek) receptív mezői között, így a belső reprezentációt korrelált bementek határozzák meg. Még a kérgi idegsejtek aktivitása között is ki lehet néha mutatni jelentős korreláltságot16. Az átfedések mértékéről azonban kevés megbízható adat áll rendelkezésünkre. Mindezen hiányosságok
- 17 -
Hibaterjedés
ellenére a feltételezéseinket megpróbálhatjuk vizsgálni egy speciális esetben a thalamo-kortikális rendszeren. Megmutatták, hogy a kérgi tüskés csillagsejtek (‘spiny stellate’) bementének csak 5-6%-ért felelős a thalamusz17, 18. Ez körülbelül 100 szinapszist jelenthet. Egy thalamikus axon általában négy szinapszist létesít egy kérgi sejttel. Az így becsült konvergencia mértéke tehát ~25 körül van. Ismert továbbá, hogy az átlagos aktivitás értéke az idegrendszerben általában csökken ahogy az egyre magasabb rendű központok felé haladunk. Sajnos igen kevés pontos numerikus adat elérhető. Tegyük fel tehát hogy a thalamikus illetve a kérgi átlag aktivitás 0.1, illetve 0.001. Ez megfelel annak, hogy egy adott pillanatban a thalamikus idegsejteknek csak a tíz százaléka, illetve a kérgi neuronok egy ezreléke mutat magas frekvenciájú tüzelést (úgynevezett ’burst’ aktivitást). (Megjegyzendő, hogy itt feltételezést kellett tennünk az agyban használatos neurális kódra! Ezek valamivel bővebb tárgyalása megtalálható a későbbi fejezetekben!) A idegi hálózatok huzalozására az agyban sokszor jellemző, hogy kevéssé érzékeny a részeinek részleges elvesztésére, sérülésére illetve a transzmisszióval együtt járó hibákra. Ezek a feltételek akkor teljesíthetőek, ha megfelelő számú másolattal rendelkezik azokból a szükséges kapcsolatokból, amelyek az idegsejtet több, korrelált aktivitást mutató sejthez kötik. Megbecsülhetjük az idegsejt aktivitásnak függetlenségét azzal, ha megmondjuk mennyi információt szállít egy sejt. Tegyük fel, hogy egy thalamikus sejt által szállított jeleknek csak egytizede független, amit a szomszédos sejtek nagyban átfedő receptív mezeje okoz. Ezekből a feltételezésekből kiszámítható optimális konvergencia szintén 30 ami jól közelíti az empirikus értéket. Egyik régóta megoldatlan feladata az elméleti idegtudománynak megtalálni a külvilág jeleinek, azaz inputoknak az optimális belső reprezentációját. Ennek a belső képnek invariánsnak kell lennie a bemenet különböző transzformációival szemben, például eltolás, forgatás, méret, és ezeken kívül függetlennek, elosztottnak és ritkának is kell lennie. Az agyon belül ezek a funkciók, több egymással néha párhuzamosan zajló, de egyben többnyire hierarchikus lépésben valósulnak meg. További elméleti munka szükséges, hogy olyan algoritmust találjunk ami megtalálja az optimális, vagy közel optimális leképezést, amely minimalizálja a hibaterjedést, tetszőleges bemenő mintázat, illetve hiba eloszlás esetén. Sokat segíthet a biológiailag meglévő feldolgozási lépések vizsgálata. Különösen fontos lehet olyan esetben ahol több egymás utáni lépés is előfordul. Valószínűleg ezeknek egyszerű, lokális, iteratív algoritmusoknak kell lenniük, amelyet egyszerű elemekkel, idegsejtekkel is meg lehet valósítani. Ezen a módon talán felhasználhatóvá válik a hálózat kezdetben meglévő kapcsolatrendszere a tárolókapacitás növelésére.
- 18 -
Dinamikus Receptív Mezők
3 Dinamikus receptív mező modellezés a látórendszerben. Zajszűrés térben és időben. Egyre több adat áll rendelkezésre arról, hogy milyen módon dolgozza fel a látórendszer a beérkező tér-időbeli vizuális információkat. Jó kvalitatív képünk van arról, hogy milyen a látórendszer különböző szintjén lévő sejteknek az átviteli tulajdonsága, dinamikus receptív mező (Receptive field; RF) struktúrája19. A mérések szerint jogos annak a feltételezése, hogy az elsődleges látókéreg (V1) komplex sejtjeiig a feldolgozást egy meglehetősen széles ingerlési tartományban viszonylag jó közelítéssel lineárisnak lehet tekinteni20. Így lehetőségünk volt egyszerű Celluláris Neurális Hálózat (CNN)21 modellekkel reprodukálni a mért receptív mezők lineáris16),17), IX, illetve akár az ismert nemlineáris22 tér-időbeli viselkedését is18), XI . A látórendszer információ feldolgozó apparátusának igen robusztusnak kell lennie, azaz érzéketlennek kell lennie a jelek pontatlan továbbításából illetve más forrásokból eredő zajokkal szemben. Ezenkívül feltehetően igen hatékony adatkompressziót is alkalmaz azért, hogy optimálisan ki tudja használni a rendelkezésére álló, amúgy igen jelentősnek számító erőforrásokat. Amennyiben fel tudjuk használni a látórendszerben alkalmazott jelkódoló mechanizmusokat a beérkező vizuális információ optimális reprezentációjára, akkor feltehetően javíthatunk a visszaállított képek minőségén még abban az esetben is, ha a terjedés során hibák kerülnek a rendszerbe. Meglepő tulajdonsága a látórendszer sejtjeinek, elsősorban az X sejteknek, a válaszuk viszonylagos lassúsága. Vizuális ingerre az X sejtek például 200-300 milliszekundum hosszú válasszal reagál, amely így akár ki is töltheti a teljes két szemmozgás közötti időtartamot. Megfigyelhető a sejtek dinamikájából adódóan a kép megfelelő sebességgel változó részeinek egyfajta kiemelése. Feltételezésünk az volt hogy ez a fajta működés szerepet játszik abban, hogy a jel továbbítása során a rendszerbe bekerülő zajokat a látórendszer minél jobban tudja elosztani, így a későbbiekben szűrni is23. Ezzel az előfeldolgozással lehetőség nyílik arra hogy kihasználjuk a korrelációt a válasz időben egymást követő értékei között a hozzákeveredő, feltételezhetően térben és időben korrelálatlan zaj szűrésére. Ha alkalmazunk egy a legegyszerűbb receptív mező dinamikát invertáló algoritmust, akkor megbecsülhetjük mekkora zajszűrést tesz ez a fajta előfeldolgozás lehetővé. Így akár 30 százalékkal is csökkenteni tudtuk a hozzáadott fehér zaj esetén a gyök négyzetes középhibát, még akkor is ha korlátozzuk az inverziót tisztán az időbeli komponensre. Ha egy központ-környéki antagonisztikus receptív mezővel reprezentáljuk a beérkező képi információt, akkor ennek a műveletnek az inverziójával tovább csökkenthető a zaj hatása. Megfelelő paraméterválasztással ha csak térbeli előfeldolgozást és szűrést alkalmaztunk akkor 20%-al sikerült az átlagos középhibát csökkenteni. Lineáris vizsgálatok már korábban is történtek és segítségükkel meg lehetett becsülni a retina előfeldolgozásának a zajszűrésben betötltött szerepét24, de a nemlineáris lépések, amelyek több szinten is jelen vannak, az ilyen, általában a Fourier térben történő számításokat lehetetlenné teszik. A különböző CNN szimulátorokkal25, 26 lehetőség adódott egyszerűsített dinamikus receptív mező modellek esetén kiszámítani a transzformációk inverzét (többek között dekonvolúciós eljárás alkalmazásával) amellyel már becsülhetővé vált bizonyos egyszerű nemlinearitások esetén is a hibaszűrő képesség16), 17), 18), XI. Azt találtuk, hogy invertálható nemlineáris függvények alkalmazásávalXI bizonyos esetekben valamennyire csökkenthető volt a nemlínearitásból adódó és néhány kép esetében valóban tapasztalható szaturáció hatása, ami
- 19 -
Dinamikus Receptív Mezők
később feltétlenül rekonstrukciós hibákhoz vezetne, de ekkor a modellek igen érzékenyek voltak arra hogy a hiba a nemlineáris függvény alkalmazása előtt vagy után került-e a rendszerbe. Megvizsgáltuk vajon a veszteséges képtömörítő eljárások hatásfoka javítható-e a fenti eljárásokkal. Azt találtukXI, hogy a JPEG algoritmusnál elérhető 5-7% javulás azonban az MPEG algoritmusnak a speciális, időben korrelált hiba eloszlása nem teszi lehetővé a fent említett időbeli előfeldolgozás, illetve az azt követő átlagolás hatékony alkalmazását. 3.1
Biológiai háttér Az utóbbi években sok tanulmány jelent meg amelyek a látórendszer idegsejtjeinek a viselkedését már nem egy statikus receptív mezővel írják le hanem egy egyszerű, vagy bonyolultabb tér-időbeli struktúrával19, 20. Ahhoz hogy megérthessük milyen előfeldolgozásokat végez a látórendszer érdemes ezeket behatóan megvizsgálni, illetve modellezni. A továbbiakban vázolni fogom milyen fajta mérési eredmények születtek és ezek mennyiben változtatták meg a klasszikus receptív mező fogalmat, illetve ennek a fajta szerveződésnek milyen további előnyei lehetnek az információ feldolgozás szempontjából. A klasszikus időben változatlan receptív mező fogalmát legújabban további mérések is kétségessé tették. Ezek már valóban a sejt megelőző ingerlésétől27, illetve a vele egy időben aktivált sejtektől függően változtatják meg a RF struktúrát, illetve a sejtek kontrasztérzékenységét28. 3.2
Receptív mező definíciók A receptív mező klasszikus definíciója szerint: Egy sejt receptív mezeje a látórendszerben az a terület a retinán amelyen belül fényinger a sejt tüzelési mintázatát serkenti vagy gátolja, azaz annak tulajdonságait megváltoztatja. Mivel az idegsejtek válasza nem statikus, hanem időben változó ezért szükségesnek látszott egy általánosabb definíció amely ténylegesen összeköti az inger tulajdonságait a sejt kiváltott válaszaival. A következőkben vázoljuk milyen módon lehet ezt megtenni. 3.2.1 Morfológiai meghatározottsága Az idegsejtek kapcsolatait a látórendszeren belül morfológiai módszerekkel egyre pontosabban le lehet írni29. Ezek az információk azonban csak részben tudják megmagyarázni a mért RF méreteket, hiszen már a retinán belül is a kiváltott jelek jelentős mértékben terjedhetnek horizontális irányban, akár a morfológiai kapcsolatokat meghaladó mértékben is30. Ezen esetben például inkább beszélhetünk az idegsejtek egy hálózatáról, syntíciumáról mint különálló idegsejtekről. Ennek a hálózatnak az összekapcsoltsága jelentősen függ a fényadaptációs viszonyoktól is31. Az idegsejtek fiziológiai tulajdonságainak az ismerete nélkül (például membrán ellenállások stb.) a morfológiai adatok igen nehezen értelmezhetőek, esetleg akár félrevezetők is lehetnek32. Tehát a morfológiailag feltérképezett kapcsolatrendszer csak egy keretet, vázat biztosít a működést leírni kívánó modellek számára. 3.2.2 Mérési módszerek A látórendszeri sejteket RF mérésekkel definiálják. A különböző mérési módszerek által kapott RF-k néha hasonló tulajdonságokat írnak le. A klasszikusan alkalmazott mérési módszernél statikus, időben nem változó ingerekkel vizsgálták azt vajon az adott helyen való ingerlés válaszra készteti-e az idegsejtet, illetve a más helyen való ingerlés válaszát befolyásolja, gátolja, vagy serkenti-e. Így azonban csak természetben előforduló ingerek egy szűk csoportjára
- 20 -
Dinamikus Receptív Mezők
tudták megjósolni a sejt válaszait. Ahhoz hogy pontosabb, időben is változó ingerekre adott válaszokat kapjanak, fel kellett térképezni az egész látó teret (legalábbis azt a részét a látótérnek, ahol még mérhető válaszváltozás észlelhető) felvillanó, rövid és viszonylag kisméretű ingerekkel. Ezt az eljárást ’Response Plane’ technikának nevezik. Hátránya az, hogy bár igen pontos RF leírást tesz lehetővé, a mérés végrehajtása igen időigényes, hiszen a felvillanó ingerek után megfelelően hosszú ideig mérni kell a választ, hogy minden válasz tranziens lecsengjen és így nem sok inger, illetve mérés ismétlésre van lehetőség. A mért eredmények ezért általában elég zajosak maradnak. Kifejlesztettek egy másik módszert is amelyet a műszaki tudományokban zajanalízisnek neveznek. Ekkor ingerként a felvillanó jeleknek egy álvéletlen sorozatát használják és az ingerlés közben folyamatosan mért válaszokból, a kiváltott akciós potenciál sorozatból, ismerve az inger pontos tér-időbeli struktúráját, fordított korrelációs módszerrel meghatározható a rendszer átviteli függvénye. A fent említett átviteli függvény természetesen csak a válasz lineáris tulajdonságait írja le pontosan. A nemlineáris tagok figyelembevételéhez a magasabb rendű korrelációkat is számítani kell, amelyek természetesen a mért adatok korlátozott mennyisége miatt igen zajosak is lehetnek. A lineáris tag viszont úgy tűnik a látórendszeri sejtek egy igen jelentős osztálya esetén jól jellemzi a sejtek választulajdonságait az alkalmazott ingerek egy viszonylag széles tartományára és megfelel a sejt úgynevezett dinamikus receptív mezejének19. A dinamikus név itt akár némileg félrevezető lehet, hiszen nem a receptív mező időben való átstrukturálódásáról van szó (lásd 3.5.), hanem tisztán annak tér-időbeli szerkezetéről. A lineáris modelltől való eltéréseket is megvizsgálták és azt találták hogy a kérgi szimpla sejtekig egy egyszerű szaturációs nemlinearitás jól jellemzi a rendszert. A linearitásnak ez a foka azért is meglepő tulajdonság, mert már a retinában igen sok, bizonyítottan nemlineáris folyamat zajlik. Vannak azonban sejtek amelyek nem viselkednek, még megközelítőleg sem lineáris módon (például a látórendszerbeli komplex sejtek33). Ebben az esetben is alkalmazható részben a fenti eljárás, de a mért eredmények értelmezéséhez további adatok és mérések szükségesek (lásd 3.3.4), illetve ha nem áll rendelkezésre további információ a rendszerről akkor az így mért adatokat a magasabb rendű korrelációk kiszámítására is fel lehet használni. 3.2.3 Receptív mezők matematikai leírása Megállapították19 tehát, hogy a látórendszerbeli sejtek egy jelentős részénél első közelítésben elegendő a lineáris tagok kiszámítása. Ahhoz hogy a sejt válaszát kiszámíthassuk tetszőleges ingerre elegendő, ha ismerjük a sejt impulzus ingerre adott válaszát, azaz az átviteli függvényét. Ennek az ismeretében már egyszerű konvolúcióval megkaphatjuk a tetszőleges ingerre adott választ is. A természetben előforduló struktúrák miatt célszerű a modellekben a térbeli komponenseket általában diszkrétnek választani, az időbeli összetevőt pedig az esetek többségében folytonosnak mint a CNN architektúrák többségénél is34. Így tehát az idegsejteket a továbbiakban egy-egy tér-időbeli operátorral jellemzünk: Tehát egy sejt impulzus válaszát (h(i, j, t)-vel jelöljük) meghatározza a válasza a következő típusú ingerre:
u(k, l, t)=δk, i⋅δl, j⋅δ(t)
(8)
- 21 -
Dinamikus Receptív Mezők
ahol δk, i δl, j⋅ Kronecker delta függvények azaz értékük akkor nem nulla (hanem egy) ha az indexeik megegyeznek és δ(t) egy Dirac-delta ‘függvény’, aminek az értéke csak a nulla időpillanatban nem zéró. Esetünkben az impulzus inger reprezentálható egy fényes (vagy sötét) pontszerű fényfelvillanással. A sejt válaszát tetszőleges ingerre (u(k,l,t)) a fentiek szerint kifejezhetjük a következő módon: t f(k, l, t) = ò å u(k − k', l − l', t − t ' ) ⋅ h(k', l', t ' ) ⋅ dt' 0 k',l'
(9)
A dinamikus receptív mezőt a látótér azon része definiálja tehát ahol: ∃ t: h(k, l, t) ≠ 0
( 10 )
Amennyiben a tér-időbeli receptív mező felbontható egy tisztán térbeli és egy tisztán időbeli függvény szorzatára akkor azt térben és időben szeparálhatónak nevezzük. h ( k , l , t ) = I ( k , l ) ⋅ J (t )
( 11 )
3.3
Modell vizsgálatok Ahhoz hogy megértsük a receptíve mezők szerveződését a látórendszerben, illetve azt hogy miért pont ilyen struktúrák alakulnak ki, érdemes lépésről lépésre megvizsgálni a jelfeldolgozás során a mért receptív mezők tulajdonságait és ezen hierarchia ismeretében modellezni azokat. A továbbiakban először a retinán belül vizsgáljuk a mért RF tulajdonságok kialakulását, majd a thalamuszban illetve az elsődleges látókéregben tesszük ugyanezt. A modell vizsgálatokban mindig csak kvalitatív egyezésre törekedtünk a kísérleti adatokkal. Tettük ezt azért, mert a mért adatokról csak egy ilyen mélységű képünk volt a valódi folyamatokról és valószínűleg az egyedi sejtek közötti különbségek is nagyok lehetnek, ezért nem látszik fontosnak a modellt túl pontosan igazítani a mért egyedi válaszokhoz35. Bár a retinán belüli folyamatokról pontosabb adatokkal is rendelkezünk36 egy pontos és viszonylag hűséges modell37, 38, 39 nagyon lelassította volna a hierarchiában magasabb szinten álló idegsejtek RF modelljeinek működését. A későbbi vizsgálatok során felhasználtuk a tovább egyszerűsített modellek invertálhatóságát amely egy bonyolult, bár fiziológiailag hűségesebb szimuláció esetén kivitelezhetetlen volna. A modelleket Celluláris Neurális hálózat (CNN)25, 26 szimulátorok segítségével végeztük. Ennek az eszköznek a struktúrája nagyban hasonlít a látórendszerben megtalálható szerveződésekhez (diszkrét térbeli szerkezet, analóg dinamika, lokális összekapcsoltság, ismétlődő homogén kapcsolaterősségek stb.). A CNN dinamikáját a következő egyenletek írják le: r r x c,d = − x c,d + å å { A(i , j ) y c +i ,d + j + B (i , j )u c +i ,d + j } + I i =−r j =−r y c,d = f ( x c,d ( t )) =
1 2
(1 + x (t ) − 1 − x (t ) ) c, d c, d
( 12 )
- 22 -
Dinamikus Receptív Mezők
Itt u, x, I és y változók megfelelnek a CNN sejtek inputjának, az állapotának, az eltolási áramnak és a kimenetének. A c és a d indexek azonosítják az egyenletben a hálózat különböző sejtjeit. Az r paraméter határozza meg a szomszédságot amelyen belül a sejtek össze vannak kapcsolva. Minden sejt csak az így meghatározott közvetlen szomszédaival van kapcsolatban és a kapcsolat erősségeket az A és B úgynevezett ‘templatek’, azaz konvolúciós magok értékei határozzák meg. Ezen tulajdonságoknak köszönhetően viszonylag egyszerű a modellek megszerkesztése és a CNN40 a megfelelő ingerekre generálja a válasz aktivitás mintázatot, még nagy idegsejt szám esetén is. Megelőzően is számos sikeres vizsgálat folyt CNN felhasználásával a látórendszerbeli jelenségek modellezésére41, II, illetve a feldolgozás szimulálására42. A CNN modellekben tehát elegendő, ha a lokális kapcsolat mintázatokat adjuk meg43. A modellt tehát jellemezni fogjuk a lokális kapcsolaterősségekkel, templatekkel és a szimulátor további paramétereivel: az időállandóval és időlépéssel amely a válasz időbeli skálázásához, illetve az esetlegesen alkalmazott késleltetések pontos meghatározásához szükségesek. Elkészítettem a retinális sejtjek egy egyszerű receptív mező modelljét. Ez a modell fenomenológikus, azaz nem törekedett az összes fiziológiai folyamat pontos implementálására, hanem a mért RF szerkezetének a szimulálása volt a cél, a lehető legegyszerűbben, de a retina struktúráját, összekapcsoltságát és alapvető fiziológiai viselkedését is figyelembe véve. A modell szerkezetét a 5. ábra vázolja. Ebben a modellben a térbeli és időbeli RF sajátságok együtt jelennek meg. A felhasznált templatek pontos étékét (a ( 13) és a ( 14) egyenletek), illetve a kapcsolatok fiziológiai megalapozottságát később, a modell eredményeinek és a retina szerkezetének, fiziológiájának az ismertetése során fogom részletezni.
- 23 -
Dinamikus Receptív Mezők Input B1
Csapok rétege (1) A12; A21 Horizontális sejt réteg (2) A13; A22 Bipoláris sejtek rétege (3) A34; A44 Amakrín sejtek (4)
A35; A45 Ganglion sejtek rétege (5)
5. Ábra A retinális sejtek RF modeljének a szerkezete. A felhasznált template értékeket a ( 13) és a ( 14 ) egyenletek tartalmazzák. A piros szín a serkentő, míg a kék a gátló kapcsolatokat jelöli. A visszacsatolások szürkével vannak jelezve (a csapon nem jelöltem az alkalmazott visszacsatolást ).
A később alkalmaztam egy tovább egyszerűsített modellt amely már egy ganglion sejt RF modellből kiindulva építi fel a thalamusz illetve a látókéreg sejtjeinek a RF modelljét. A felhasznált modellel megpróbáltam egyszerűen szimulálni a sejtek RF-jének időbeli és térbeli viselkedését. A felhasznált modell szerkezetét a 6. ábra vázolja. Ez a modell már nem törekszik arra, hogy a retinán belüli kapcsolatok szerkezetét és az ottani fiziológiai folyamatokat kövesse, és kizárólag egy gyors és egyszerű bemenetet akart biztosítani a thalamikus és a kérgi sejtek modellezéséhez.
- 24 -
Dinamikus Receptív Mezők
B1 A12; A11 A RF dinamikájának a modellje. ((15)-(18))
A13; A22
Ganglion sejt RF modell
A34; A33; A24
A RF térbeli szerkezetének a modellje. (19)
A45(Surround); A45(Center)
A56; A66
A57; A67
Lagged sejt RF modellje. (20)
Kérgi sejtek RF modellje. (21), illetve (22); (23); (24);
6. Ábra Az retinán túli területek egyszerúsített RF modelljének a vázlata. A serkentő kapcsolatokat piros, a gátlókat pedig kék szín jelzi. Az ábrán szürkével van jelölve a feedback. A felhasznált template értékeket a (15)-(24) egyenletek tartalmazzák.
A felhasznált template értékeket a thalamusz és a kéreg egyszerű sejtjeinek a jellemzése során részletezem. A fejezetben használtam még egy tovább egyszerűsített ganglion sejt RF modellt a látórendszer zajszűrő képességének a jellemzésére. Ebben a RF térbeli és az időbeli viselkedése már teljesen szétválasztható. A modellt a 3.4 fejezetben írom le részletesen. 3.3.1 Retinális sejtek receptív mező vizsgálatai A retinális folyamatok alapvetően meghatározzák milyenek lesznek a látórendszer magasabb szintjein kialakuló RF-k. Érdekes módon a retinán belül igen sok jól láthatóan nemlineáris folyamat zajlik, mégis a retina kimenetét jelentő ganglion sejtek válaszai (fajtól függően Béta, vagy X sejtek) már egy széles tartományban jól jellemezhetőek a dinamikus receptív mezőikkel. A retina külső rétegeiben a feldolgozás analóg módon zajlik, míg a belső retinában már a kialakuló akciós potenciálok is részt vesznek az információ feldolgozásban36. Itt csak egy leegyszerűsített modelljét adjuk a retina információfeldolgozásának, amelyből jelentős részeket elhanyagoltunk (például a szélesen elterülő amakrin sejtek hatását is49) és az itt kapott modell végül is csak azt akarja megmutatni hogy a ganglion sejteken mérhető RF tulajdonságokat egy szabályozott, hierarchikusan rendezett hálózat hozza létre amelynek struktúráját túlnyomórészt az alább modellezett elemi folyamatok határozzák meg.
- 25 -
Dinamikus Receptív Mezők
3.3.1.1 A retina szerkezete A gerincesek retinája tíz morfológiailag megkülönböztetett rétegből áll. A tényleges információ feldolgozás viszont csak a külső és a belső plexiform rétegben zajlik. Az alábbi ábrán vázoljuk a macska retinájának a szerkezetét.
7. Ábra A macska retinájának vázlatos szerkezete49 (a fény alulról érkezik és a legfelül található receptor sejteket ingerli).
Az egyes sejtek szerepét és funkcionális jellemzőit a későbbiekben a modellek ismertetése során részletezem. Ebben a munkában nem feladatom a retina működésének minden részletre kiterjedő vizsgálata. Itt csak a legfontosabb, a jelek további feldolgozását is érintő jelenségeket vettem figyelembe.
- 26 -
Dinamikus Receptív Mezők
3.3.1.2 Csapok A csapok a retina fényérzékeny sejtjei amelyek elsősorban világosban válaszolnak a fényingerekre, szemben a pálcikákkal amelyek viszont sötétben és félhomályban aktívak. Kapcsolatrendszerükre jellemző az, hogy egymással viszonylag gyengén kapcsoltak (Azonban komoly különbségek vannak a különböző fajok között. Például teknősbékánál az azonos hullámhosszra érzékeny csapok erősen csatoltak.) A horizontális sejtektől a csapok visszacsatolt (‘feedback’) gátlást kapnak. Bár a csapok a fény átlagos intenzitásához különböző, a kalcium iont több koncentrációs szinten is felhasználó módon alkalmazkodnak, adaptálódnak, viszont a gyors megvilágítás változásokhoz, illetve a szín érzékeléshez a fenti visszacsatoló kapcsolatokat elsőrendűen fontosaknak tartják44, 45. A csapon mérhető változások elsősorban a fényválaszból erednek, hiszen a csap végződése viszonylag távol esik a sejttesttől ahol a méréseket általában végzik, illetve feltételeznek egy kalcium ion közvetítette jelátvitelt moduláló folyamatot is amely még kevésbé mérhető egyszerű elektrofiziológiai eljárásokkal49. Tehát a csapok RF-je egyszerűen megkapható az ingerből egy kis mértékű elmosással amely megfelel a csapok közötti gyenge összekapcsoltságnak, illetve a szem optikai tulajdonságai okozta kép romlásnak. A számunkra a továbbiakban igazán érdekes a csapok kimenetén, a bipoláris sejtek bementén mérhető (modellezhető) RF lesz. Ez előáll a csap fényválaszából, illetve a horizontális sejteknek erre az ingerre adott negatív válaszából. Itt eltekintünk attól a ténytől, hogy a csapok válasza fényingerre hiperpolarizáció, illetve a horizontális sejtek visszacsatolt gátló hatása így depolarizáció29 hiszen a modellbe a pontos fiziológiai folyamatokat nem akarjuk másolni, hanem csak a kialakuló receptív mező struktúrát akarjuk reprodukálni. A modellben elhanyagoljuk azt a tényt is, hogy a neurotranszmitterek ioncsatornákat nyitnak közvetlen, vagy közvetett módon és ezek a sejt pillanatnyi feszültségétől függő áramot generálnak, és ezen keresztül okoznak depolarizációt, illetve hiperpolarizációt. 3.3.1.3 Horizontális sejt A horizontális sejtek a külső ’plexiform’ rétegben ténylegesen horizontálisan elnyúló nyúlványrendszerrel rendelkező sejtek29. Az egyes sejtek rés kapcsolatokkal, ’Gap-Junction’-kel vannak egymással összekötve, és igazából egy hálózatot, synticiumot alkotnak amelyen az itt még analóg jel a sejt nyúlványrendszerén túl is terjedhet. Ezen aktív rés kapcsolatok számát a lokális dopamin szint is befolyásolja31 és így jelentős szerepe lehet a sötét/fény adaptációval járó folyamatokban. Válaszukat a válasz nagyon nagy térbeli kiterjedése, illetve a viszonylag lassú időbeli lezajlása jellemzi. A csapokat, illetve a horizontális sejtek RF-it a következő lineáris CNN template-tel modelleztem: B1 = [0.6] A11 = [0.4] 0.248 0 ù é 0 A22 = ê0.248 0.01 0.248ú ú ê êë 0 0.248 0 úû
A21 = [0.25]
( 13 )
A12 = [− 0.04]
Itt az A template megfelel a horizontális sejtek synticiumon belüli kapcsolaterősségeinek, azaz arra jellemző hogyan terjed a horizontális sejtek hálózatán belül a jel, illetve, milyen azoknak az
- 27 -
Dinamikus Receptív Mezők
időbeli lefutása. Az alkalmazott CNN elemek, cellák tehát nem felelnek meg az egyes horizontális sejteknek hanem inkább a hálózat egy-egy pontjának viselkedését jellemzik46. A többi template viszont a csapok és a horizontális sejtek közötti kapcsolatok illetve a beérkező jelek erősségét jellemzik. Látható, hogy a visszacsatolás miatt csak egységesen kezelhető a hálózat ezen része. A kapott modell ‘horizontális sejt’ válaszait a 8. ábra mutatja. A
B
C
8. Ábra Az első képen (A) a horizontális sejt tér-időbeli impulzus válasza látható. Mivel ez viszonylag kicsiny aktivitásra vezet, ezért megvizsgáltuk a válaszát egy nagyobb négyzet alakú ingerre is (B). A fehér szín jellemzi a horizontális sejt válaszának méretét. Az utolsó képen pedig ugyanennek a sejtválasznak az axonometrikus képét láthatjuk egy, az ingert követő későbbi időpontban (C).
Amennyiben az eddig végzett művelet inverzét is meg akarjuk kapni, amely ahhoz szükséges, hogy meghatározhassuk vajon milyen hatása van a zaj eloszlására ennek a fajta RF struktúrának (lásd 3.4), akkor ahhoz is a CNN-t alkalmazhatjuk. Még a CNN alkalmazása esetén is azonban lassú lehet az algoritmus, amit egy speciális módszerrel gyorsíthatunk fel (lásd a 4. fejezetet). Itt kell felhívni a figyelmet arra, hogy ha nem az eredeti kép visszanyerése a cél, hanem ahhoz egy igen közeli, akkor egy sokkal egyszerűbb már akár biológiailag is könnyen megvalósítható kapcsolatrendszer is elegendő. Természetesen itt az inverz kiszámítása csak a
- 28 -
Dinamikus Receptív Mezők
dinamikus RF zajszűrő hatásának a becslését szolgálja és ennek a további vizuális információfeldolgozás szempontjából valószínűleg nincs, nem is lehet jelentősége. 3.3.1.4 Bipoláris sejtek A Bipoláris sejtek RF-jét a csap és pálcika terminálokon kialakuló jelek határozzák meg36. Volt egy olyan elképzelés is régebben, hogy létezik egy direkt horizontális sejt - bipoláris sejt kapcsolat, de ennek kimutatása mindeddig nem sikerült és az ’Be’ bipoláris sejtek speciális viselkedése miatt ez valószínűtlen is. Vannak ’ON’ (’Be’) és ’OFF’ (’Ki’) bipoláris sejtek is amelyek központi fény, illetve a sötét ingerre reagálnak tónusos depolarizációval. B
A
D
C
E
9. Ábra Az első képen (A) egy szimulált ’Be’ Bipoláris sejt tér-időbeli receptív mezeje, vagyis az impulzus válasza látható. A tulajdonságainak a jobb ábrázolhatósága kedvéért itt is megmutatjuk a sejt válaszát egy nagyobb, négyzet alakú ingerre (B). A fehér szín jellemzi a gátlás, míg a sötét az aktiválódás mértékét. Az utolsó képen pedig ugyanennek a sejtválasznak az axonometrikus képét láthatjuk három különböző, egymást követő időpontban (C, D, E).
- 29 -
Dinamikus Receptív Mezők
A ’Be’ bipoláris sejt a máig ismert egyetlen sejt az idegrendszerben amelyik glutamát transzmitter hatására hiperpolarizációval válaszol47. Ezen tulajdonságát egy speciális metabotróp glutamát receptornak köszönheti48. A RF-ikre jellemző a központ környéki antagonizmus. Időben azonban ez a tulajdonság megszűnik és átveszi a helyét egy a horizontális sejtek lassú válaszából származó gátlás. Ebben az egyszerű modellben feltételeztem, hogy a bipoláris sejt egyszerűen követi a csapok inger válaszát. Megjegyzendő itt, hogy a horizontális sejteknél néha található egy az ingert követő ’rebound’ aktiválódást, de ekkor az alkalmazott inger általában igen elnyújtott volt időben és valószínűleg valamilyen nemlinearitás és a csapoknál jelentkező adaptációs folyamat is hozzájárulhatott a jelenséghez. Amennyiben elsősorban a csapok aktívak akkor ez a ’rebound’ hatás kifejezettebb, hiszen hiányzik a pálcikáknak megfelelő időben elnyújtottabb bemenet a horizontális sejtekről (’rod aftereffect’). Ekkor a horizontális sejt bár késleltetve, lelassítva, de követi a csapon kialakuló változásokat. A ganglion sejteknél mért RF viszont nem a fentebb említett térben és időben speciális szerkezetű, nem szeparálható viselkedést mutatják, hanem inkább jellemezhetőek egy egyszerű térbeli központ környéki antagonizmussal amelyet egy időbeli, előjelét váltó függvény modulál (lásd 3.3.1.5; 3.3.2). Hogyan lehet ilyen térben és időben nem szeparálható RF-kből egy viszonylag jól szeparálható struktúrát előállítani? Sikerült megoldani a feladatot annak a ténynek a figyelembevételével, hogy a bipoláris sejtek végződéséhez ’feedback’ gátlás érkezik a különböző amakrin sejtektől49. Ezek a sejtek igen változatosak és a belső plexiform rétegben ágazódnak el. Igen sok fajtájuk van, de legegyszerűbben úgy osztályozhatjuk őket, mint szélesen elterülő, valamint lokális, kis méretű sejtek36. Ingerület átvivő anyag tartalom szempontjából sajnos ennél sokkal bonyolultabb a kép. Ilyen szempontból még a fenti egyszerű csoportosítás esetén is vannak eltérések a különböző állat osztályok között (GABA, illetve Glicin transzmitter). Szerepük igen sokféle lehet, a fény adaptációtól, a csap és pálcika útvonalak összekapcsolásán keresztül a mozgás érzékelésig sok minden előfordul. Tehát ennek a bonyolult amakrin sejt rendszernek itt csak egy elemét a lokális, kicsiny amakrin sejteket vesszük figyelembe amelyek GABA–t termelnek és GABAB receptorokon keresztül egy elnyújtott, lassú gátlást okoznak a bipoláris sejtek terminálján36. Az alkalmazott templatek a következők voltak: A24 = [0.025] A44 = [0.987]
A25 = [2]
A45 = [− 1.2]
( 14 )
Ezzel az eljárással sikerült a mért (lásd később) ganglion RF mezőkhöz hasonló struktúrájú modell RF előállítani.
- 30 -
Dinamikus Receptív Mezők
B
A
C
D
E
10. Ábra Az első képen (A) egy szimulált ganglion sejt tér-időbeli impulzus válasza látható. A (B) ábrán ugyanennek a sejtnek a válasza látható egy nagyobb, négyzet alakú ingerre. A fehér szín jellemzi a gátlás, míg a sötét az aktiválódás mértékét. Az utolsó képen pedig ugyanennek a sejtválasznak az axonometrikus képét láthatjuk három különböző, egymást követő időpontban (C, D, E). Megfigyelhető, hogy nem lehet a válasz térbeli és időbeli komponensét tökéletesen szétválasztani.
Látható, és ebből a fajta előállításból következik is, hogy a RF térbeli és időbeli részei még ebben a legegyszerűbb esetben sem választhatóak szét tökéletesen. 3.3.1.5 Ganglion sejtek Fentebb megmutattuk tehát, hogy a bipoláris sejt terminálon már kialakulhat egy a ganglion sejt RF-jéhez hasonló struktúra. A továbbiakban az egyszerűség kedvéért egy ennél áttekinthetőbb RF modellt fogunk alkalmazni. Tesszük ezt azért mert a horizontális sejteken való jel diffúziója olyan kis sejtenkénti
- 31 -
Dinamikus Receptív Mezők
feszültségváltozásra vezet, hogy azt a nagy amplitúdókkal együtt nehezen lehetne ábrázolni. Tehát a RF, az impulzus válasz időbeli részét a következő CNN modellel számítjuk: A11= [0.7]
B = [1]
( 15 )
A12 = [0.5]
A22 = [0.3]
( 16 )
A13 = [-0.15] A33 = [0.9]
( 17 )
A24 = [1]
( 18 )
A34 = [0.7]
A kapott RF időbeli lefutását az alábbi ábra mutatja: Rétegek együtt 1 Réteg1 Réteg2 Réteg3 Réteg4
0.8
Amplitudó
0.6
0.4
0.2
0
-0.2 0
5
10
15 Ido
20
25
30
11. Ábra A receptív mező modell dinamikát generáló rétegeinek a kimenetei impulzus ingerre. Az inputból az első réteg egy lassabb, lecsengő választ készít amely meghajtja a különböző időállandóval integráló serkentő, második és gátló, harmadik réteget. A negyedik réteg ezen serkentő és gátló rétegek összegével szimulálja a dinamikára jellemző ’ON-OFF’ típusú választ.
A RF térbeli részét pedig egy egyszerű központ környéki antagonizmussal modelleztük:
é 2 2 2ù A 45(Center) = ê2 3 2ú ê ú ë 2 2 2û
é− 1 ê− 1 ê− 1 ê A 45(Surround) = ê − 1 ê− 1 ê− 1 ê ë− 1
−1 −1 −1 − 1.2 − 1.2 − 1.2 − 1.2 − 1.2 − 1.2 − 1.2 − 1.2 − 1.2 − 1.2 − 1.2 − 1.2 − 1.2 − 1.2 − 1.2 −1 −1 −1
−1 − 1 − 1ù − 1.2 − 1.2 − 1ú ú − 1.2 − 1.2 − 1 ú − 1.2 − 1.2 − 1ú − 1.2 − 1.2 − 1ú − 1.2 − 1.2 − 1ú ú −1 − 1 − 1û
( 19 )
Itt a template paramétereit a kizárólag válasz megfelelő ábrázolhatósága indokolta, de hasonló eredményekre jutnánk a paraméterek egy igen széles tartományában.
- 32 -
Dinamikus Receptív Mezők
Az így kapott modell ganglion sejt RF viszonylag jól egyezik a mért RF tulajdonságaival. Idő
A
B
X
12. Ábra A mért19 (A) és a szimulált (B) ganglion sejt dinamikus receptív mezői. Ezen tértől és időtől függő operátorral konvolválva a térben és időben változó ingereket kiszámíthatjuk a sejt mindenkori válaszát. Hasonlóak a thalamikus ‘Relay’ sejtek, illetve az egyszerű kérgi sejtek impulzusválaszai is (Ez itt természetesen ez csak egy, a preferált orientációra merőleges irányra igaz!). A zöld szín jellemzi a fényre kapott választ, a serkentést. A piros szín pedig a sötét ingerre adott választ, vagyis a gátlást mutatja. 3.3.2 A talamusz-köztiagy sejtek receptív mezeje A látórendszerben a kéreg felé továbbított vizuális információ egy lényeges állomása a thalamusz, azon belül is a hátsó oldalsó térdes test, a dLGN. A thalamikus principális, vagy más néven továbbító, ’relay’ sejtek receptív mezeje általában nagyon hasonlít a retinális ganglion sejteken kimutatott RF-khöz. A fő különbség a központ és a környéki válasz amplitúdójának nagyobb mértékű egyezésében, illetve abban áll, hogy vannak úgynevezett ’lagged’ sejtek is a thalamuszban50.
3.3.2.1 ’Lagged’ sejtek Ezekre a sejtekre az a jellemző, hogy a válaszuk jelentősen lassabb mint ami a ganglion sejteket jellemzi, illetve az, hogy általában a válasz második szakaszában nagyobb a kiváltott aktivitás amplitúdójának abszolút értéke szemben a többi thalamikus relay sejttel. Megjegyzendő, hogy ez a fajta viselkedés nem az állat állapotától, éberségi szintjétől függ, mint ahogy ezt várnánk ismerve az ezeket követő jelentős fiziológiai változásokat, hiszen kimutatták egy időben mindkét fajta thalamikus sejt működését50. A RF-jének a kialakulása modellezhető egy a (3.3.1.4) fejezetben már tárgyalt mechanizmussal, esetünkben mi a következő CNN modellt alkalmaztuk: A56 = [0.7]
A66 = [0.4 ]
A kapott ’lagged’ thalamikus RF hasonlít a mért RF szerkezetéhez.
( 20 )
- 33 -
Idő
A
Dinamikus Receptív Mezők
B
X 13. Ábra Összehasonlíthatjuk a mért19 (A) és a modellezett (B) ‘lagged’ sejt dinamikus receptív mezejét (lásd 12. Ábra). A modellt a ganglion sejtek válaszának megfelelő visszacsatolása segítségével lehetett lelassítani. A ‘lagged’ sejt impulzus válaszának időbeli lefutása sokkal lassabb (az időskálát nem mutatjuk), mint a mért ganglion sejteké.
3.3.3 Egyszerű receptíve mezejű kérgi idegsejtek, irányérzékenység Mindeddig sikerült a bonyolultabb RF struktúrákat az egyszerűbbekből előállítani. Vajon mi a helyzet a kérgi úgynevezett ’szimpla’ sejtek esetén, illetve később a ’komplex’ sejteknél? A kérgi idegsejtek RF-jére az jellemző, hogy egy bizonyos irányban elnyújtott ingerre reagálnak jobban, de erre az irányra merőlegesen megtartják a ’központ-környéki’ antagonisztikus RF szerkezetet51. A mért sejtek egy része már nem mutat azonban tükör szimmetriát, hanem inkább egy egymás mellett fekvő serkentő és gátló terület jellemzi, vagy egy ennél még bonyolultabb struktúra52, 53 ami időben is meghatározott módon változik. Vannak ugyanakkor olyan még mindig egyszerűnek nevezett idegsejtek is az elsődleges látókéregben, amelyek egy meghatározott irányban, megfelelő sebességgel mozgó ingerre reagálnak, más ingerekre a válaszuk jóval kisebb, vagy esetleg nem mérhető54. Mindezen sejtek RF-nek el lehet készíteni a CNN modelljét.
3.3.3.1 Orientáció szenzitivitás Ahhoz hogy egy sejt egy bizonyos irányban elnyújtott RF-vel rendelkezzen a klasszikus elképzelések szerint55 megfelelő konvergenciára van szükség a thalamikus sejtekről a kérgi sejtekig. Bár az orientáció szenzitivitás ilyen módon való kialakulását sokan kétségbe vonták56, 57 , bár valószínűleg vannak jelentős kérgen belüli moduláló hatások58, 59, 60, úgy tűnik valóban a fenti konvergencia biztosítja a jelenség oroszlánrészét61. Bár a konvergencia pontos morfológiai kimutatása még várat magára (Szimmetrikus thalamikus végződés elágazódás a kéregben), a kialakuló válasz időbeli viselkedése arra enged következtetni, hogy valóban a thalamikus input határozza meg elsősorban a kialakuló orientációs érzékenység irányát62, 63. Egy ilyen konvergencia segítségével elérhető az orientáció szenzitivitás. A továbbiakban mutatott RF adatok erre az orientációra merőlegesen mért térbeli tulajdonságokat ábrázolnak. A modellben alkalmazott CNN template a következő volt:
- 34 é− 1 ê− 1 ê ê− 1 ê = ê− 1 A 45( CS ) ê− 1 ê ê− 1 ê− 1 ë
−1
.8 1.8 .8
Dinamikus Receptív Mezők −1
− 1.2 .8 1.8 .8 − 1.2 − 1.2 .8 1.8 .8 − 1.2 − 1.2 .8 1.8 .8 − 1.2 − 1.2 .8 1.8 .8 − 1.2 − 1.2 .8 1.8 .8 − 1.2 − 1 .8 1.8 .8 − 1
− 1ù − 1ú ú − 1ú ú − 1ú − 1ú ú − 1ú − 1úû
( 21 )
Itt a konvergenciát egyszerűen beépíthettük a RF térbeli részét kialakító template-be. Az így kapott szimpla sejt RF-je igen hasonlít a thalamikus, vagy a retinális ganglion sejt esetében mutatott RF-höz az orientációra merőleges irányban
3.3.3.2 Szimmetriák A kérgen belül mért sejtek egy része nem mutat szimmetrikus RF szerkezetet. Hogyan alakulhat ki alapvetően szimmetrikus bementi RF-ből egy ilyen aszimmetrikus? A válasz megint csak a konvergencia. Ha megfelelő súlyozással és eltolással összeadjuk a ’be’ illetve a ’ki’ útvonalról érkező RF-eket akkor eredőként már egy megfelelő szerkezetű RF-t kapunk. Idő
A
B
X 14. Ábra Összehasonlíthatjuk a mért (A) és a modellezett (B) tér-időben szeparálható, de nem szimmetrikus kérgi egyszerű sejt receptív mezejét. A modell két thalamikus, vagy egyszerű kérgi sejt impulzusválaszának összegződésével volt elérhető.
Ahol az alkalmazott CNN template a következő volt:
é 0 0 0ù ê ú A 57 = ê 0 − 1 1ú êë 0 0 0úû
( 22 )
- 35 -
Dinamikus Receptív Mezők
3.3.3.3 A Mozgásirányérzékenység modellje A kérgi egyszerű sejtek egy részének a tér-időbeli RF struktúrája teszi lehetővé a mozgásirány érzékenységet64. Itt két hasonló mozgásirányérzékeny sejt RF-jét mutatjuk be. A mozgás irányérzékeléséhez is konvergenciát kell alkalmazni, de ekkor már két lehetőség között kell választani. Az egyik elképzelés szerint a megfelelő ’lagged’ sejt RF-jét és egy egyszerű thalamikus sejt RF-jét kell összegezni a megfelelő irány érzékeny RF előállítása céljából: Idő B A
X 15. Ábra A mért (A) és a modellezett (B) tér-időben nem szeparálható receptív mezejű kérgi sejtek impulzus válasza. A modell egy egyszerű és egy ‘lagged’ sejt impulzusválaszának az összegével volt megkapható.
Ahol az alkalmazott CNN template:
é 0 0 0ù ú ê A 57 = ê 0 1 0ú êë 0 0 0úû
é0 0 0ù A 67(lagged) = êê0 0 1úú ëê0 0 0úû
( 23 )
A másik módszer szerint megfelelő késleltetéssel kapcsoljuk össze az egyszerű RF elemeket.
Idő
A
B
X 16. Ábra Az ábrákon egy mért (A) és a modellezett (B) tér-időben nem szeparálható receptív mezejű kérgi egyszerű sejt impulzusválasza látható. Ebben az esetben a modellt két egyszerű sejt (3.1.4 illetve az 12. Ábra.) impulzusválaszának a megfelelő késleltetés utáni (d = 15) összegzésével lehetett megkapni.
- 36 -
Dinamikus Receptív Mezők
Az ekkor használt paraméterek, illetve a template a következők voltak:
é 0 0 0ù ê ú A 57 = ê 0 1 0ú êë 0 0 0úû
é0 0 0 ù ê ú A 57(delayed 15) = ê0 0 − 1ú êë0 0 0 úû
( 24 )
Láthatjuk, hogy ha az inger megfelelő sebességgel érkezik, a megfelelő irányból akkor viszonylag nagy aktivitást vált ki, míg más irányba haladva egyszerre érinti a dinamikus RF serkentő és gátló részeit így jóval kisebb aktivitásra vezet. Azt hogy melyik mechanizmus valósul meg a természetben azt ezekből az adatokból igen nehéz eldönteni. Elképzelhető, hog ymind a két folyamat résztvesz a mozgásirányérzékenység kialalkításában. Itt jegyezzük meg, hogy a mozgás irány érzékeléshez szükséges volt egy időben lelassított válasz (például a ’lagged’ sejt válasza). Amennyiben ez a tulajdonság univerzálisnak tekinthető, akkor a retinában található irány szelektív sejtek RF-jének kialakulásában is egy hasonló folyamat vehet részt, amely viszont jelen van mint utaltunk is rá korábban (3.3.1.4). 3.3.4 Komplex sejtek receptív mezeje Az elsődleges látókéreg ’komplex’ sejtjeire az jellemző, hogy megfelelő irányba mozgó ingerekre jelentős választ ad. Az inger előjele (sötét, világos) a sejt válasza szempontjából lényegében nem számít. Azaz a mérésekből származó ’fényre’ serkentő (gátló), illetve ’sötétre’ serkentő (gátló) területek átfedik egymást. Ezek a sejtek tehát nemlineáris módon válaszolnak, ezért válaszuk nem jellemezhető jól az így mért adatok alapján33. Mozgásirány érzékeny szimpla sejtek RF-kből azonban felépíthető a komplex sejtek RF-jének a lineáris része egyszerű konvergenciával és egy nemlineáris (negatív tagokat nem tartalmazó, levágó) összegzéssel. Vannak arra nézve adatok, hogy a komplex sejtek nemlineáris viselkedése egy lineáris térbeli összegződést követ33, de mivel a nemlinearitás nagyon változatos lehet, ezért a fenti konvergencia csak egy lehetséges megvalósítása a mért komplex RF struktúrának (Például arra is vannak adatok, hogy a komplex sejtek már a szimpla sejteket megelőzően is válaszolnak35, és akkor is van irányérzékenység amikor irányérzékeny szimpla sejteket nem is lehetett találni (pl. majomnál) 33). 3.4
Zajszűrés a látórendszeren belül A fentiekben megvizsgáltuk milyen módon lehetett az elsődleges látókéreg komplex sejtjeiig bezárólag előállítani a különböző sejtek RF szerkezetét felhasználva a korábban már kialakult RF struktúrákat. Felvetődik a kérdés miért pont ezek a struktúrák alakulnak ki és nem másfélék? A kérgen belül kialakuló RF szerkezetek, például az orientáció szenzitivitás, vagy a mozgásirány érzékenységnek hasznosak lehetnek a további információfeldolgozás során. De ezek szerkezete bizonyos érzékelési hibákra, illúziókra is vezethetII, X. Beható vizsgálatok foglalkoztak azzal, miért ilyenek a kéregben kialakuló RF-k65 és nem másmilyen szerkezetűek66. Többen is arra a következtetésre jutottak, hogy a kérgi reprezentációnak nem csak hűségesnek és megfelelően nagynak, de lehetőség szerint megfelelően ’ritkának’ is kell lennie65, 66 (lásd a 8. oldalon). A természetben előforduló képek szerkezete is egyfajta RF mintázat eloszlást preferál67. Mi a
- 37 -
Dinamikus Receptív Mezők
szerepe a ganglion sejtekig kialakuló RF-nek? Ebben a fejezetben megvizsgáljuk vajon nem lehet-e valamilyen pozitív hatása ennek az előfeldolgozásnak az információ továbbítás során a rendszerbe bekerülő zajok megfelelő elosztásában. Amely azt eredményezheti hogy a RF szerkezetének például szerepe lehet egy esetleges későbbi zaj szűrésben23, 24. 3.4.1 Jeltovábbítás a retinától a kéregig Jelentős távolságot kell megtennie a jelnek a receptoroktól a feldolgozás elsődleges központjáig, például emlősöknél az agykéregig. Az út során sok forrásból kerülhet zaj a rendszerbe és a retinán belül igen jelentős mennyiségű zaj keveredhet a hasznos jelekhez (fototranszdukciós zaj). A szinaptikus jelátvitelben is keletkezhetnek hibák (sztochasztikus jelátvitel), sőt az akciós potenciál terjedése során is előfordulhatnak terjedési elégtelenségek. Zaj keveredhet a jelhez például véletlen, spontán transzmitter felszabadulás, vagy bizonyos idegsejtek autoaktivitása miatt is (háttér aktivitás). Mindezen zajokat biztonsággal tekinthetjük egymástól független jelenségeknek amelyek hatása meghatározott amplitúdójú fehér zajjal, esetleg normális eloszlású zajjal modellezhető, helyettesíthető. Ekkor kihasználható az, ha valamit tudunk a továbbítani szánt jel statisztikai tulajdonságairól. A vizsgálat céljából egy az előzőeknél is egyszerűbb RF modellt használtunk. Itt a RF térbeli és időbeli komponense teljes mértékben szétválasztható (mint azt korábban megmutattuk, még a legegyszerűbb esetben sem ez a helyzet 3.3.1.4, de a probléma kezelhetősége érdekében célszerű egy ilyen modellt vizsgálni). A térbeli részt egy véges, esetünkben minimális méretű CNN templatet-tel modelleztük és az időbeli viselkedést is véges és diszkrét módon, leegyszerűsítve szimuláltuk. 3.4.2 Térbeli receptív mező tulajdonságok A természetes képek térbeli Fourier spektruma megközelítőleg 1/|f|-es eloszlást mutat67 (teljesítmény spektruma 1/f2 -es). Ez önhasonló tulajdonságának az egyik következménye. Ha ezt a spektrumot egyenletesebben rendezzük el, akkor a hozzákevert fehér zaj egy jelentős része kiszűrhetővé válik24. Mi itt példaképpen a következő 3*3-as templatet alkalmazzuk, majd a zaj hozzákeverése után kiszámítjuk ennek a műveletnek az inverzét is amely a CNN használata miatt igen egyszerűen megtehető. Ez az eljárás akkor is végrehajtható, ha nemlineáris műveleteket is végzünk míg a klasszikus, a képek frekvenciatér eloszlásán alapuló lineáris szűrőtervezési eljárások ekkor már nem alkalmazhatóak.
é- 0.15 - 0.60 - 0.15ù ê ú B(Center-Suround) = ê- 0.60 3.30 - 0.60ú êë- 0.15 - 0.60 - 0.15úû
I = 0.0025
( 25 )
(A sok értékes áram tag kizárólag a tároláskor történő adatkonverziók (lebegőpontos ábrázolásról nyolcbitesre való áttérés) hibájának a csökkentéséhez kell. Itt kizárólag a kísérlet megismételhetősége miatt közlöm) A template megfelel a ’központ-környéki’ antagonisztikus receptív mezejű ganglion sejt egy egyszerűsített modelljének (végtelen szűrő (IIF) helyett egy véges térbeli szűrőt (FIF) alkalmazunk). A paraméterértékek pontos meghatározottságára még visszatérünk később. (Be kellett állítani a templatek megfelelő skálázásával az optimális dinamikus tartományt és az optimális központ-környéki értékeket is.) Mindazonáltal számolni kell a lokálisan nagy kontraszt
- 38 -
Dinamikus Receptív Mezők
miatt bekövetkező, nem kívánt, de elkerülhetetlen szaturálódással is, amelyet a dinamikus tartomány véges volta okoz. A klasszikus CNN sejtek esetén ezt a következő nemlineáris függvény írja le: 1
-1
1 -1
( 26 )
A szaturáció hatásának elkerüléséhez már egy invertálható nemlineáris modellt kellene alkalmazni (lásd később). Ahhoz hogy megbecsülhessük milyen mértékű zajszűrést tesz ez a korábban vázolt előfeldolgozás lehetővé, ki kell számítanunk a ( 25 ) template inverzét is:
é0 0 0ù ê ú B = 0 0.3030 0ú (Center-Suround) ê êë 0 0 0úû é 0.04545 0.18182 0.04545ù ê ú A = 0.18182 0 0.18182ú (Center-Suround) ê êë 0.04545 0.18182 0.04545úû
I =.0042
( 27 )
Ez az inverze a korábban bemutatott ( 25 ) template-nek. A template értékeket úgy kaphatjuk meg, ha A–t 1-B-nek választjuk. Látszik, hogy ilyen template választása mellett az eredeti kép fix pontja lesz a hálózatnak, ha az előfeldogozott minta szolgáltatja a hálózat bemenetét. Itt a központi és környéki elemek súlyait úgy skáláztam, hogy az eredeti templaten történő esetleges erősítés változtatást az itt használt B template megfelelő beállításával lehessen követni. A template értékek biológiailag elképzelhetetlen és technikailag is nehezen kivitelezhető számábrázolási pontossága kizárólag az inverz lehető legpontosabb meghatározását célozta. Természetesen az inverz viszonylag pontosan megkapható jóval pontatlanabb paraméterértékek esetén is, de az ebből származó hibák lehetetlenné tennék az egyéb rekonstrukciós hibák megbecsülését és akadályoznák az ezekből származó következtetések levonását.
- 39 -
A
Dinamikus Receptív Mezők
B
A1
B1
C C1 17. Ábra Az eredeti teszt képhez (A) véletlen zajt adunk (B), illetve ha ugyanezt a zajt az előfeldolgozott ( 25 ) képhez adjuk hozzá, majd ebből rekonstruáljuk az eredeti képet (C) a transzformáció inverzével ( 27 ). Látható, hogy az észlelhető zaj karaktere megváltozott, de éppen a szem itt kihasznált zajszűrő tulajdonságai miatt nem észlelhető a jelentős négyzetes középhiba csökkenés. Az (A) képen fehér négyzettel kiemelt részletet kinagyítottam mindhárom esetben a jobb összehasonlíthatóság kedvéért (A1; B1; C1;).
Mivel az inverz a megjelenő korrelálatlan zajokat várhatóan szétkeni, elmossa, azaz átlagolja a szomszédos pixelek között, így a mérhető gyök négyzetes középhiba értéke csökkenni fog. Amennyiben nem csináltuk volna meg a megfelelő előfeldolgozást akkor viszont ugyanez az eljárás a kép eredeti pixel értékeit is átlagolná. Esetünkben a dinamikus tartomány újraskálázása miatt ez nem is kivitelezhető. Tehát a ( 25 ) módon előfeldolgozott képhez adjuk hozzá a zajt, ami esetünkben fehér-zaj volt, igen nagy amplitúdóval. Példaként mutatunk (17. Ábra) néhány képet ahol a visszaállított zajjal szennyezett képet az eredetivel hasonlíthatjuk össze, illetve amikor ugyan azzal a zajjal az eredeti képet torzítottuk el. Látható (17. Ábra), hogy a hibák magas frekvenciás részének nagy részét kiszűrte ez az algoritmus, bár azok az alacsony frekvenciákon megmaradtak. A következő 18. ábrán pedig erre a paraméter választásra kapott hiba szűréseket hasonlíthatjuk össze különböző képekre.
- 40 -
Dinamikus Receptív Mezők
Négyzetes Középhiba
(-20.20%) 0.08 0.06 0.04 0.02 0.00 Szűrés és Előfeldolgozás
Minta képek Backgrnd Castle Samburu Amber Portrait Eredeti Zaj
18. Ábra A központ-környéki antagonisztikus receptív mezők hatása a zajszűrésre öt különböző tesztkép esetén.
Látható, hogy jelentős, átlagosan 20%-ot meghaladó gyök négyzetes középhiba szűrést lehetett elérni. Ez a hibaszűrés viszont csak viszonylag nagy hibaértékekre működik mert az előfeldolgozás a kép több pontján is telítésbe mehet, pontosan a nagy kontrasztú részeknél, és így a rekonstrukció maga is hibákkal jár, bár ezt a fenti ábrán viszonylag nehéz észrevenni. Természetesen nem állítjuk hogy ilyen, vagy ehhez hasonló műveleteket valóban végrehajtana a látókéreg, aminek sok értelme nem is lenne hiszen utána kezdhetné a kép tulajdonságok szerinti szétbontását, újrareprezentálását és a feldolgozást az elejétől. Viszont a fenti technikával megmutattuk, hogy bizonyos zajszűrés kivitelezhető és az ilyen módon elosztott információ előnyösebben szállítható, mint az egyébként megtehető volna. A rekonstruált képen a megfigyelő által észlelhető viszonylag nagy hiba annak a következménye, hogy ugyan a gyök négyzetes középhiba csökkent, de a hiba az alacsonyabb térfrekvenciákra tolódott át amelyekre az emberi szem éppen a fenti tulajdonságai miatt érzékenyebb. 3.4.3 A receptív mező dinamikájának a hatása A látórendszer igyekszik még a mozgó képeket is, követő szemmozgások segítségével viszonylag mozdulatlanná alakítani35. Ennek megvan az előnye, hogy a kép statikus, nem változó részein hatékony időbeli átlagolást tud végrehajtani. A gyorsan változó részeket a látórendszernek amúgy is egy, a finom térbeli felbontásra, mintázatokra kevéssé érzékeny része, általában nemlineáris módon viselkedő, az úgynevezett ’Magnocelluláris’ vagy ’Y’ sejtes rendszere dolgozza fel. A korábban vázolt RF modellekből látszik, hogy a látórendszer kiemeli a kép változó részeit. Ezt teszi az általunk korábban vizsgált, jobbára lineáris ’X’, vagy ’Parvocelluláris’ rendszer is. Legyen ez a kiemelés megadva a következő igen leegyszerűsített algoritmussal.
- 41 -
2.0
Dinamikus Receptív Mezők
A RF dinamika egyszerű modellje.
Amplitudó
1.5 1.0 0.5 0.0 -0.5 0
1
2
3
4
5
6
Idő
19. Ábra
Yn= 1.6Xn - 0.3Xn-1 - 0.15Xn-2 - 0.15Xn-3
( 28 )
Mire jó egy ilyen előfeldolgozás? Ez az előfeldolgozás jelentősen nem változtatott az eredeti képen és csak ott vezet szaturációhoz, illetve nemlineáris viselkedéshez, ahol amúgy is nagy a változás és a látórendszer is kevéssé érzékeny a kép ezen részleteire. Amennyiben kiszámítjuk ennek a műveletnek az inverzét akkor észrevehetjük, hogy az megfelel egy alkalmasan választott paraméterezésű időbeli átlagolásnak. 0.7
A RF dinamika Inverze.
0.6
Amplitudó
0.5 0.4 0.3 0.2 0.1 0.0 0
1
2
3
4
5
idő
20. Ábra
Xn = 0.625Yn + 0.1875 Xn-1 + 0.09375Xn-2 + 0.09375Xn-3
( 29 )
Beláthatjuk, hogy egy ilyen időátlagolás a kép nem változó részein javít a jel zaj arányon, míg a kép többi részén csak kevéssé ront rajta, bár valószínűleg ez a degradáció sem vehető észre a látórendszer fentebb említett tulajdonságai miatt. Megvizsgáltuk milyen hatással van különböző mozgó képsorozatok esetén a hozzáadott korrelálatlan zaj szűrésére ezen időbeli átlagolás. Átlagosan 30% gyök átlagos hibanégyzet csökkenés volt elérhető a fenti módszerrel (lásd a 21. Ábrát). Ha az egyszerűsített RF-nek megfelelő előfeldolgozás nélkül alkalmazzuk az időbeli átlagolást akkor viszont a mozgó részeknél egy elmosódást tapasztalhatunk amint az a minta képen (22. Ábra) is jól látható.
- 42 -
Dinamikus Receptív Mezők
Zaj szűrés a RF dinamikájával (-31%) Négyzetes középhiba
0.10 0.08 0.06 Minta képek 0.04
Stefan Table Mobil Akiyo
0.02 0.00
Szűrés + PreP.
Eredeti Zaj
Szűrés PreP. nélkül
21. Ábra A receptív mező dinamikájának a hatása a zajszűrésre négy különböző teszt képszekvenciára. (Minden képsorozat 100 kockából állt, jóval többől mint az a természetben előfordulhat két szemmozgás között és ez így némi zaj felhalmozódáshoz is vezethetett.)
A
B
C
D
22. Ábra Az összehasonlíthatóság kedvéért először a teszt képsorozathoz (A) hozzáadunk egy nagy amplitúdójú véletlen zajt (B). Amennyiben ugyanezt a zajt megfelelő előfeldolgozás után adjuk a rendszerhez, akkor a rekonstruált képen (C) jelentős zajszűrés érhető el. Ha csak a rekonstrukciós algoritmust használjuk akkor viszont az elmozdulás okozta elmosódáshoz vezet (D). Mindegyik kép a szekvencia 75. képkockáját ábrázolja.
- 43 -
Dinamikus Receptív Mezők
Ezt a fajta átlagolást sem kell feltétlenül megtalálni az elsődleges látókérgen belül, bár a sejtek viszonylag lassú válasza, hosszú integrációs ideje erre mutathat. 3.4.4 Zajszűrés becslése Nehéz meghatározni mekkora zajszűrést tesz lehetővé a RF csatolt térbeli és időbeli viselkedése, hiszen többek között ugyanazt a hibát szűrik mindketten. Valószínűleg kölcsönösen kiegészítik egymás hatását. Egy a valóságos RF-khöz jobban hasonlító modell esetén valószínűleg nem is lehetne az inverziót térben és időben egymástól függetlenül végrehajtani, hanem azt csak egy tér-időbeli operátor hajthatja végre amellyel talán akár további zajszűrés is elérhető. Itt mutatunk egy példa képet amely mutatja egy mozgó képsorozat egy elemét a fenti dinamikus RF-vel való előfeldolgozás után.
A
B
23. Ábra A képen látható a teszt képszekvencia egy képkockája (A) és a neki megfelelő előfeldolgozott, a modellezett dinamikus receptív mező hatásának megfelelő kép (B). Jól látható az élek és a változó részek kiemelése.
Elvégezve mind a térbeli, mind az időbeli invertálást is a gyök négyzetes középhibát körülbelül 40%-al lehetett csökkenteni. A fenti zajszűrés azonban csak viszonylag magas zaj amplitúdókra működik megfelelően, mert kicsiny vagy nulla zaj esetén a telítődésekből származó rekonstrukciós hibák meghaladhatják a szűrt zaj mértékét. Amennyiben egy egyszerű szakaszonként lineáris függvénnyel modellezzük a retina kimenete által követett szigmoid-szerű viselkedést akkor elkerülhetjük a szaturáció okozta rekonstrukciós hibák egy jelentős részét. Várhatóan egy ilyen leképezéssel a rekonstrukciós hibák megszüntethetőek, ellenben az inverz leképezés nagy meredeksége miatt csökkenni fog a rendszer átlagos zajszűrő képessége. A szimulációk az mutatták, hogy zérus additív zaj esetén ténylegesen megszűnt (minimálisra csökkent) a rekonstrukciós hiba értéke. A tapasztalataink szerint viszont csak akkor működik jól a rendszer, ha a zajt még a nemlinearitás alkalmazása előtt adjuk hozzá a rendszerhez, tehát ezzel elsősorban a retinán belül keletkező zajokat modellezzük. A 24. Ábrán megpróbáltam vázolni milyen műveleteket végzünk, illetve milyen zajok és hol adódnak a rendszerhez. Ilyenkor a rekonstrukció sokkal sikeresebb és egy ilyen template-tel összességében akár 45%-al volt csökkenthető a hiba.
- 44 -
Retinális Zajok
Dinamikus Receptív Mezők
Extraretinális Zajok
Szaturációs nemlinearitás Ki i i á
Thalamikus és kérgi recpetív mezők, reprezentációk
Input Antagonisztikus Központ-környéki és ‘On-Off’ receptív mező kialakítása
Rekonstrukció a zajszűrés vizsgálatához Rekonstruált Input
24. Ábra
Az általunk használt invertálható, szakaszonként lineáris függvény a következő volt: 1
-3.3
-.9
.9 -1
3.3
( 30 )
A szakaszonként lineáris függvények esetén felvetődött, hogy talán lehetőség lenne a lineáris szakaszokra egyenként elvégezni az analízist, de mivel előre nem jól becsülhető mekkora része esik egy képnek ebbe a tartományba és ezek térben hogyan helyezkednek el, ezért inkább kísérletileg vizsgáltuk a hatását. Érdekes módon ha a hibákat, a zajt később az invertálható nemlineáris függvény alkalmazása után adjuk a rendszerhez, tehát a jeltovábbítás során keletkező hibákat modellezzük, akkor az inverzió során ez igen jelentős mértékben megnő és esetenként nagyobb hibához vezet mint amit az eredeti zaj okozott volna. Itt kipróbáltuk a szakaszonként lineáris függvény helyett egy szigmoid típusú leképezés hatását is, bár ez esetben az inverz előállítása sokkal nehézkesebb. Nem kaptunk viszont ekkor sem a szakaszonként lineáris leképezéstől minőségileg eltérő eredményt, azaz hasonló volt a zaj hatása a rekonstrukcióra. Érdemes volt ezt a fajta tulajdonságot jobban megvizsgálni a template értékek optimális beállításának a szempontjából is. 3.4.5 A template értékek meghatározása Megvizsgáltuk, hogy milyen hatása van a nemlinearitásnak a zajszűrésre különböző méretű zajok esetén. Itt kell megjegyezni, hogy lineáris vizsgálatok már történtek a RF zajszűrő tulajdonságának a meghatározására23, de amennyiben csak egy egészen egyszerű nemlinearitást
- 45 -
Dinamikus Receptív Mezők
vezetünk is be, a lineáris, analitikus módszerek már nem alkalmazhatóak. Alkalmazhatóak viszont ez esetben is a dekonvolúciós algoritmusok, amelyek négyzetes középhiba értelemben optimálisan közelítik az inverzet és így lehetőséget adnak nemlineáris esetben is a zajszűrés becslésére. Az alábbi, 25. ábra mutatja azt hogy a ( 25 ) template alkalmazása esetén, hogyan változik a zajszűrés attól függően hogy alkalmazunk-e ( 30 ) típusú invertálható nemlinearitást, a standard CNN nem invertálható szaturáló nemlinearitását használjuk, illetve a zajt a nemlineáris függvény alkalmazása előtt, vagy után adjuk-e a rendszerhez.
25. Ábra Invertálható nemlineáris leképezés hatása a zajszűrésre. Összehasonlíthatjuk, hogyan változik a rekonstrukciós hiba mértéke a zaj mértékétől függően három különböző esetben. Vagy a CNN eredeti kimeneti nemlinearitását használjuk ( 26 ), vagy azt lecseréljük egy invertálhatóra ( 30 ) és a zajt ezen invertálható nemlinearitás előtt illetve után adjuk a rendszerhez.
Minden esetben amikor valamilyen nemlineáris leképezés segítségével akartuk elkerülni a dinamikus tartomány véges voltából származó rekonstrukciós hibák megjelenését az arra az eredményre vezetett, hogy akár egészen kicsiny hiba esetén is jelentősen romlott a hálózat zajszűrő képessége. Ebből levonható az a következtetés, hogy a látórendszernek nem érdemes a képek tökéletes továbbítására törekednie, hanem inkább a megjelenő zajoknak megfelelő szűrést érdemes használnia. Megvizsgáltuk milyen hatása van a template értékek változtatásának a zajszűrésre. A központi és a környéki elemek abszolútértékének az arányát változtattuk, illetve az abszolút értéküket, azaz az erősítés mértékét hangoltuk. Amennyiben a centrális elem abszolút értéke csökkent a környéki elemek abszolút értékéhez viszonyítva akkor a dekonvolúció sebessége jelentősen csökkenhet (mint majd azt látni fogjuk ezt a Csebisev eljárással lehetett megnövelni (lásd 4. fejezet)). A dinamikus tartományt az erősítés megfelelő beállításával lehetett optimálisra
- 46 -
Dinamikus Receptív Mezők
beállítani. Az erősítés növelésével, természetesen a nemlineáris függvényt is megfelelően kellett beállítani. Így a nemlinearitás előtt hozzáadott hiba megfelelően lefelé skálázódik, azaz csökken. A nemlinearitás után hozzáadott hiba viszont ekkor jelentősen nőhet, hiszen egyre nagyobbra nő az inverzió során. Az 26. ábra azt mutatja milyen viselkedést követ a hibaszűrés különböző központ-környéki típusú templateknél a különböző erősítések esetén kis bemenő, illetve nagyobb bemenő hiba esetén.
26. Ábra A zajszűrés függése az erősítéstől, illetve a központ és környéki elemek abszolút érték különbségétől (CS diff.). A azt jelzi, hogy a zajt az invertálható nemlinearitás hatása után, míg B azt, hogy az előtt adtuk a rendszerhez. Látható, hogy az erősítés növelésével a nemlinearitás előtt hozzáadott zaj értéke csökken, míg egy meghatározott optimumot mutat ha a zajt a nemlinearitás után adjuk a rendszerhez. Ez annak a következménye, hogy ebben az esetben az erősítés emelésével mind a zajszűrés, mind a rekonstrukciós hiba növekszik.
Tehát az alkalmazott template vagy rekonstrukciós hibákhoz vezet a dinamikus tartomány szűk volta miatt, amennyiben a kép nagy kontrasztú részein az alkalmazott nemlinearitás lesz érzékeny az utána hozzáadott hibákra. Vagy pedig kicsiny lesz a hibaszűrés a kép egyéb részein is. Kisebb hiba esetén is hasonlóan viselkedik a rendszer (27. Ábra).
- 47 -
Dinamikus Receptív Mezők
27. Ábra A zajszűrés hatékonyságának a függése az erősítéstől illetve a központ-környéki elemek abszolút érték különbségétől. Inv. jelzi azt amikor invertálható kimeneti nemlinearitást alkalmazunk, szemben az eredendően nem invertálható szaturációval. Természetesen a zajt ekkor ezen nemlinearitások után adtuk a rendszerhez. A bemenő zajt jelző vonal feletti értékek mind a zaj továbberősítését jelentik.
A látórendszer valamilyen módon kezeli ezeket a problémákat, illetve a zaj keletkezési helyéhez és méretéhez optimalizálja a használt retinális hálózatot. Példaképpen itt kell megemlíteni, hogy sötétben, szkotópiás látásnál a horizontális sejtek szétcsatolódnak és többek között ennek a következtében csökken, vagy meg is szűnik a receptív mezők környéki gátló hatása68. Miért alakult ki egy ilyen bonyolult szabályozó rendszer a környéki jelek mértékének a beállítására? Az is ismert tény, hogy a pálcikák erősítése sokkal nagyobb, mint amit a csapok produkálnak és ugyanezért sokkal zajosabbak is. A fenti ábrákból is arra a következtetésre juthatunk, hogyha a retinán belüli zajokat jobban el kell nyomni, mivel ezek nagyobbak, akkor azonos erősítés mellett hasznosabb a kisebb környéki értékű templatek, receptív mezők használata. Ezzel ugyan nő a további, retinán kívüli hibák erősítése, de még így is összességében nyereséges lehet az ilyen fajta átstrukturálódás. Eredményeink azt mutatják, hogy még az invertálható nemlineáris leképezés alkalmazása esetén is jelentős a rekonstrukciós hiba. Azaz a kép nagy kontrasztú részeit eredendően torzítja az előfeldolgozás és így ezen részletek pontos észlelése sem megoldható. A modell paramétereinek a vizsgálata azt jelzi, hogy a zaj túlnyomó része a retinán belül keletkezik és nem a továbbítás során adódik hozzá a jelekhez additív zajként (az ilyen zajokat sokkal nagyobb hatékonysággal szűrte ez az előfeldolgozás). Ez meglepő tekintettel a szinaptikus áttevődés sztochasztikus jellegére és a kérgen belül található zajforrások nagy számára A biológiai
- 48 -
Dinamikus Receptív Mezők
rendszerek is felhasználják a szaturáló szakasz által szállított információkat. Ezt a fiziológiailag mért nemlineáris ganglion sejt input-output viselkedés mellett a mért receptív mezők szerkezete is alátámasztani látszik, mivel a ganglion sejtek viszonylag kiegyensúlyozott központ-környéki antagonizmussal rendelkezik. Ez a struktúra nem lenne hatékony amennyiben a sejtek egy nem invertálható, szaturációs nemlinearitással rendelkeznének. Így a modellünk azt jelzi, hogy a látórendszer valamiképpen számításba veszi a ganglion sejtek válaszát még az erősen szaturálódó tartományban is. Teszi ezt annak ellenére, hogy ez a zajok egy részének a további erősítéséhez vezethet. 3.4.6 JPEG kompresszióra való alkalmazás Megvizsgáltuk vajon milyen hatása van az egyik legáltalánosabban elterjedt, veszteséges kép kompressziós eljárásra egy a fentiekben vázolt előfeldolgozás. Mivel a JPEG esetén mindig statikus képeket kompresszálnak ezért az előzőekben említett időbeli átlagolástól eltekintettünk. (A későbbiekben majd még tárgyaljuk az időbeli szűrésnek az alkalmazási nehézségeit is.) Az alkalmazott eljárást a következő ábra mutatja:
Bemenő kép
A belső reprezentáció szimulációja alkalmas CNN template-tel
JPEG (be)
Transzmisszió
JPEG (ki)
Az előfeldolgozás inverze
Visszaállított kép
28. Ábra A JPEG veszteséges képtömörítő eljárás javítására szolgáló algoritmus vázlata. Az előés utófeldolgozást egy antagonisztikus központ-környéki template-tel illetve annak inverzével valósítottuk meg.
A JPEG algoritmus alkalmazása miatt, itt a nemlinearitás után hozzáadott kis zajra kell optimalizálni a rendszert. Az zajszűrés előző fejezetben tárgyalt tulajdonságai azt mutatják, hogy ebben az esetben érdemes a CNN beépített nemlinearitásait használni, valamint az erősítés és a központ-környéki értékeket is az ott bemutatott, a szimuláció során optimálisnak talált adatok szerint kell beállítani (lásd 27. Ábra). Ezek szerint az optimális értékekre beállított, RF térbeli tulajdonságait szimuláló CNN template a következő volt:
- 49 -
Dinamikus Receptív Mezők
− 0.0166 − 0.0666 − 0.0166 B = − 0.0666 + 1.0000 − 0.0666 − 0.0166 − 0.0666 − 0.0166
A = [0]
I=[0.0048]
( 31 )
A JPEG-el való veszteséges kódolás és dekódolás után visszaállítottuk az eredeti képet. Ahhoz hogy ezt megtehessük a következő CNN templatet alkalmaztuk: 0.0166 0.0666 0.0166 A = 0.0666 0.0000 0.0666 0.0166 0.0666 0.0166
B = [1]
I=[0.0029]
( 32 )
(A felhasznált template elemek nagy pontossága elkerülhetetlen, mert a hibák kerekítésekből származnak és a további kerekítési hibák rontanának az eljárás hatékonyságán.) Először az ’Image Alchemy’ nevű software JPEG algoritmusát alkalmaztuk, de mint később kiderült ennek a programnak az általunk használt verziója (v1.5.1) hibás volt és további zajt vitt be a ’JPEG – portable bitmap’ konverzió során (megjegyzendő, hogy a program későbbi verzióiban ez a hiba már nem észlelhető!). Ezt a hibát az általunk alkalmazott eljárás jelentős 810 százalékos mértékben szűrte. Ebben az esetben a kép javulását akár egy mintaképen is szemléltethetjük (29. Ábra).
29. Ábra Az képeken összehasonlíthatjuk az eredeti kép egy részletét, a program által JPEG-elt és hibásan átalakított kép megfelelő részletét, illetve az általunk javasolt elő- és utófeldolgozás után kapott képrészletet. Szembetűnő a hiba jelentős elmosódása, ami természetesen együtt jár a négyzetes középhiba csökkenésével is.
Amikor észrevettük a hibát akkor áttértünk az ’Independent JPEG Group’ saját software-nek az alkalmazására és egy újabb CNN szimulátor alkalmazására26. Ekkor az alkalmazott módszer a következő, 1. táblázatban ábrázolt hibajavítást tette lehetővé. Itt megvizsgáltam lehetőség van-e arra, hogy először valamilyen dekonvoluciós template-tel végzek egy magas frekvenciás komponens kiemelést és aztán egy egyszerű, átlagoló B template-tel végzem az invertálást. Ez kizárólag a gyakorlati alkalmazás szempontjából tűnik előnyösnek, hiszen ekkor csak a JPEG kódolásakor van szükség komoly számítási teljesítményre és a dekódolás már sokkal egyszerűbben megoldható, akár hagyományos (nem párhuzamos architektúrájú) számítógéppel is. Így az előfeldolgozáshoz a következő template-et találtam optimálisnak.
B = [1]
− 0.025 − 0.100 − 0.025 A = − 0.100 + 0.100 − 0.100 − 0.025 − 0.100 − 0.025
I = [0.00482]
( 33 )
- 50 -
Dinamikus Receptív Mezők
Míg az inverz kiszámításához a következő template-et használtuk.
A = [1]
+ 0.025 + 0.100 + 0.025 B = + 0.100 + 0.900 + 0.100 + 0.025 + 0.100 + 0.025
I = [0.00291]
( 34 )
(All of the compression-decompression was done by Independent Jpeg group’s cjpeg, djpeg software) Gain RMSE Gain RMSE Prepproc. RMSE Preproc. Name of (Size) Original FeedFeedthe of the of FeedJPEG image JPEG forward Forwar original preproc. (in bytes) (in bytes) Forward d Airplane (512*512) 35455 35138 34846 .024384 .022388 8.186 .022750 6.701 Amber (300*200) 8350 8124 8244 .030790 .030607 0.594 .030602 0.611 Baboon (512*512) 70299 69442 69173 .054605 .049654 9.067 .050378 7.741 Background (300*200) 13897 13482 13530 .042419 .040936 3.496 .041306 2.624 Camera (256*256) 11274 11047 11274 .037676 .034309 8.937 .034130 9.412 Castle (300*200) 10476 10212 10373 .031486 .029947 4.887 .029274 7.025 City (300*200) 9680 9572 9600 .036013 .033793 6.164 .033471 7.059 Desert (300*200) 8649 8543 8583 .036954 .032987 10.735 .033290 9.915 Elephant (300*200) 8247 8157 8167 .033445 .033067 1.130 .028988 13.326 Flamingo (300*200) 6151 6146 6109 .023948 .022248 7.099 .022461 6.209 Humbird (300*200) 10499 10468 10470 .034989 .032015 8.500 .031513 9.935 Icecream (300*200) 4373 4371 4355 .017942 .016843 6.125 .016175 9.848 Lena (512*512) 33859 32776 32484 .026663 .025453 4.538 .025769 3.353 Moon (300*200) 8866 8629 8670 .034990 .033353 4.678 .033418 4.493 Palette (256*256) 3330 3306 3294 .083010 .076890 7.373 .08008 3.530 Peppers (512*512) 35176 34005 35156 .031555 .030996 1.771 .030818 2.336 Portrait (300*200) 9124 8856 9020 .032250 .032097 0.474 .032209 0.127 Redline (300*200) 4542 4452 4468 .021410 .020630 3.643 .020190 5.698 Samburu (300*200) 12001 11657 11791 .041461 .040128 3.215 .040209 3.020 Space (300*200) 12115 12089 12017 .037632 .033932 9.832 .034114 9.348 Average 15818.15 15523.6 15581.2 15581.2 0.035681 5.522% 6.116% 1.86% 1.50% 5.522% 6.116%
1. Táblázat
A JPEG algoritmus diszkrét koszinusz transzformációt alkalmaz, majd egy ezt követő osztást (quantization) amelynek az eredményét kerekítik. Ismeretes hogy egy konvolúció ugyanolyan eredményre vezet mint a Fourier térben egy megfelelő polinommal való szorzás. Hogyan lehet az általunk alkalmazott eljárásnak mégis eredménye, hiszen az alkalmazott osztás (kvantálás) megfelelő paraméterezésével hasonló eredményre lehetne jutni! A válasz valószínűleg az, hogy míg a diszkrét koszinusz transzformáció csak 8*8 pixeles blokkokra van elvégezve, addig a konvolúció nem tartja be ezeket a korlátokat, tehát egy sokkal szélesebb térbeli frekvenciatartományban egyenlíti ki a jel értékeit, emeli ki az a magas frekvenciás jeleket. A dekódoláskor a JPEG kompressziónál gyakran jelentkezik blokkosodás, főleg ha a kompresszió igen jelentős. Ezek abból származnak, hogy már az alacsony frekvenciájú, a megfigyelő által is jól észlelhető tartományban is megjelennek a kompresszióból származó hibák. Ezen hibák csökkentésére több eljárás létezik 69, 70, 71, 72, 73, és az általunk javasolt módszer is szűri az ilyen hibákat. Mik a módszer paraméterezésének a határai? A tapasztalataink szerint a fent ( 31 ) alkalmazott template értékek voltak az optimálisak. Amennyiben kisebb a különbség a központ
- 51 -
Dinamikus Receptív Mezők
és a környéki elemek között akkor az inverzió lassabb lenne és a műveletek során felhalmozódó hiba is jelentősen nőne ami lerontaná a rendszer hatékonyságát. Természetesen ezzel a biológiai rendszerekben, ahol az inverz műveletek direkt módon végre se hajtódnak nem kell számolni. Gondot okozhat viszont az hogy bizonyos képek esetén a lokálisan nagy kontraszt telítésbe viheti a sejteket. A látórendszer az ilyen esetek elkerülése érdekében egy nemlineáris átviteli függvényt alkalmazhat (lásd 3.4.), bár ez csak abban az esetben lehet hatékony ha nincs zaj a rendszerben. Mivel a zajt ebben az esetben nem lehet a nemlinearitás előtt a rendszerhez adni, ezért az 26. Ábráról megállapíthatóan legmegfelelőbb, ‘optimális’ template-et kell alkalmazni. Ez a módszer igen érzékeny a kerekítésekre, hiszen a JPEG során pont ezekből származik a zaj. A korábban alkalmazott CNN szimulátor egy nem szimmetrikus kerekítési módszert alkalmazott aminek más alkalmazások esetén hasznosak lehetnek, de itt ez csak további nyereség csökkenéshez vezetett. Az új SIMM-CNN26 szimulátor viszont már szimmetrikussá tehető a nulla pont körül, így jobban is alkalmazható erre a feladatra. Megjegyzendő, hogy a kerekítésekre igen érzékeny a JPEG algoritmus, hiszen a hibái pont ezekből származnak. A JPEG-et pixelenkénti 8 bit mélységű adatokra végezte a software. Ha a CNN belső reprezentációja ennél nagyobb, ami csak valamilyen digitális szimulátornál fordulhat elő, akkor azt erre az értékre kerekíteni kell. Az MPEG algoritmus esetén is különböző kerekítési eljárásokat alkalmaznak attól függően milyen képkockát tömörítenek éppen. Ennek a módszernek az alkalmazására akkor látok lehetőséget amikor valamilyen más képfeldolgozó lépéseket, illetve képtömörítő eljárásokat is a CNN-el valósítanak meg74, 75, 76, 77. 3.4.7 MPEG mozgó kép kompresszió Megpróbáltuk a korábban említett időbeli átlagolást alkalmazni az MPEG(2) veszteséges mozgókép tömörítő eljárás hatásfokának fokozása érdekében. Sajnos az időbeli átlagolás csak az időben korrelálatlan zajokat, hibákat tudja jól szűrni. Az MPEG algoritmus viszont éppen az előző kódolt kép kocka és a soron következő kép kocka különbségét kódolja (eltekintve itt az algoritmus sok fontos részétől, mint a mozgás vektorral való kompenzáció és a képkockák megfelelő sorrendjétől, előre és visszafelé mutató approximációktól stb.). Így a keletkező hiba általában korrelált és ezzel az eljárással nem kiszűrhető. Mivel az MPEG algoritmusok előreláthatólag a továbbiakban is JPEG eljárást fognak alkalmazni a különbségi képek, illetve a referencia képek kódolására, így a JPEG-nél alkalmazott eljárás alkalmazhatónak tűnik. 3.5
A receptív mezők valódi dinamikus kiterjedése mesterséges ’scotoma’ vizsgálatok, Receptív mező kölcsönhatások Megfigyelhetők a látórendszerben tényleges RF struktúraváltozást mutató folyamatok is. Az egyik fajta RF átalakulásra vezető folyamat az, amikor a látótér egy részét kitakarják egy közepesen megvilágított statikus ablakkal egy rövid időre (néhány perc) a környéken lévő területeket viszont folyamatosan stimulálják felvillanó pont ingerekkel. Ez az ingerlés a mért RF méretet 3-4 szeresére növeli meg78,79. Azt gondolják hogy hasonló dolog történik amikor a retinán valódi látótér kiesést, scotomát alkalmaznak például lokális retinális lézióval, irtással és ekkor a retina nem sérült területei átveszik a beidegzését elvesztett kérgi területek irányítását. Ez viszont egy jóval lassabb folyamat amelyhez jóval hosszabb idő szükséges. A morfológiai változásokat az LGN-ben illetve a kéregben ezen esetekben igen behatóan tanulmányozták. A RF expanziójának mechanizmusára sokféle elképzelés született81. Az eredeti elképzelés szerint a szomszédos sejtek közötti kapcsolatok alakulnak át, amit az is alátámasztani látszott, hogy a korreláció az mesterséges scotomával kitágított RF sejtek között megnőtt és ugyanakkor a sejtek
- 52 -
Dinamikus Receptív Mezők
aktivitása tüzelési frekvenciája nem változott lényegesen27. Később mások is elvégezték a kísérleteket és azt találták, hogy a leglényegesebb változást az aktivitás ideiglenes, de jelentős csökkenése okozza80. Ezek szerint a kérgi lokális gátlás csökkenése tehető felelőssé az amúgy is meglévő, bár gyenge kapcsolatok mérhetővé válásában, a RF megnövekedésének kialakulásában81. Egy ilyen mechanizmus meg tudja magyarázni a mért jelenségek jelentős részét. Miért foglalkozunk itt egy ilyen jelenséggel, amely első pillantásra csak nehezebbé teszi annak a megértését, hogy milyen módon vannak reprezentálva a látókéregben a vizuális információk? Azért, mert ez a fajta dinamikus reprezentáció lehetővé tudja tenni, hogy a látórendszerben történő, viszonylag lassú változásokhoz alkalmazkodni tudjon a feldolgozás. Egy ilyen rendszer segítségével az esetleg előforduló ideiglenes, vagy tartós látótér kiesések, valamint megfelelő képpontok közötti statisztikák felhasználásával akár a különböző helyi egyenetlenségek, erősítési különbségek is kiegyenlíthetőek, szűrhetőek lehetnek akár térben változó módon. Egy másik ismert jelenség az, amikor a látórendszert ingerlő jelek befolyásolják egymás hatását. Az egyik legeklatánsabb példa erre, amikor az észlelési küszöbét az egymástól különálló Gábor foltoknak csökkenti ha azok speciális elrendeződést követnek82. (A Gábor foltok olyan ingereknek felelnek meg ahol a fény intenzitáseloszlását a következő függvény −
x2
cos( xσ ) . Az ilyen jelek igen alkalmasak és körülbelül optimálisak a jellemzi: I = e látórendszer ingerlésére, hiszen alakjuk többé-kevésbé megfelel a mért RF adatoknak.) Ezen jelenségek pontos mibenlétéről komoly viták folynak, de valószínűleg nem kizárólag a primer látókérgen belüli kapcsolatok alakítják, hanem a magasabb kérgi területek is részt vesznek a kialakulásukban, tehát az úgynevezett ‘top-down’ mechanizmusok is komoly szerepet játszanak. A kéreg szomszédos területeinek aktivációja a középpontban mért receptív mezők kontraszt érzékenységére is jelentős hatással van. Ezt a kitérőt azért tettük, mert habár a kéregben mérhető RF tulajdonságok zömét, egyszerű módon reprodukálni lehet (’bottom-up’ mechanizmusok), a lokális és a magasabb központok felől érkező kérgi kapcsolatok hatását azonban nem szabad elhanyagolni, mert bizonyos mérések azt mutatják, hogy a feldolgozás már ezen korai stádiumában is igen komoly szerepük van az információfeldolgozásban. 3.6
2σ 2
Konklúziók Megmutattuk tehát, hogy a dinamikus receptív mező struktúrákat viszonylag egyszerű CNN modellek segítségével a látórendszerben található morfológiai struktúrák és fiziológiai ismeretek felhasználásával szimulálni tudjuk. Ezen RF-k tulajdonságainak vizsgálatával megmutattuk, hogy a látórendszeren belül keletkező zajok elnyomásához, szűréséhez alkalmas reprezentációt teremt a retina. Egy egyszerű RF modell térbeli és időbeli viselkedése legalább 30-40% zajszűrést tesz lehetővé. További vizsgálatokat igényel vajon milyen módon lehet a kérgen belüli kapcsolatrendszer okozta dinamikus jelenségeket értelmezni a fenti szempontok szerint.
- 53 -
4 Csebisev módszer alkalmazása algoritmusok gyorsítására
Csebisev módszer
a
dekonvolúciós
CNN
4.1
Konvergencia gyorsítása dekonvolúciónál Eddig is léteztek CNN dekonvolúciós algoritmusok és ezeket gyakran alkalmazták is különböző speciális elmosódásokat eltüntető (deblurring), illetve konvolúció/dekonvolúciós feladatokban. Általában a dekonvolúció sebessége a CNN lapkán igen magas, hála az analóg és párhuzamos megvalósításnak. A tranziens hosszát kτ-nek lehet tekinteni ahol τ a CNN időállandója (tekinthetjük ezentúl az egyszerűség kedvéért egységnyinek) és k pedig általában egy kis szám, tipikus templatekre akár 4-15 is lehet. Vannak azonban olyan template-ek amelyek rosszul meghatározott mátrixot definiálnak, ekkor a tranziens extrém hosszúvá válhat. A lineáris algebrai Csebisev módszerrel fel lehet gyorsítani a létező dekonvolúciós eljárásokat. Szükséges azonban az eredeti algoritmust illeszteni a CNN speciális követelményeihez. Megmutatjuk, hogy a konvergencia sebessége akár három-négyszeresére is nőhet, ha megfelelő módon újraskálázzuk az alkalmazott template értékeket. 4.2
Előzmények A CNN paradigmán belül lehetőség van a B templatek, azaz konvoluciók egy igen széles osztálya esetén a templatek hatásának az invertálására, dekonvolúcióra83. Azaz egy adott templateből, konvolúciós magból és az általa létrehozott képből az eredeti képet vissza lehet állítani. Sokféle gyakorlati alkalmazás lehetősége is felmerült 84, 85, 86, 87, 88 ezekkel kapcsolatban. Az inverzió során a lineáris algebrából jól ismert Jacobi módszert alkalmazták, amely az egyik legrobusztusabb és legegyszerűbb iteratív mátrix inverziós algoritmus. Ennek során fel lehet használni egy megfelelően definiált A templatet, amely a CNN paradigma alapvető része34. Az A templatet ekkor 1-B ként kell megadni83. Itt és a továbbiakban egyes időállandót feltételezünk az egyszerűség kedvéért. Ez digitális esetben nem befolyásolja, analóg esetben is csak kevéssé teszi bonyolultabbá a ténylegesen megvalósuló működés vizsgálatát.
Y = BU X n +1 = AX n + Y where A = 1 − B X =0 0 X∞ =U
ahol
( 35 )
Itt A és B egy egy hipermátrix, amelyek megfelelnek egy A, illetve B templattel való konvolúciónak. U a bemenő képet ábrázoló vektor, Y eredményvektor pedig a B konvolúció hatására a belőle létrejövő kép. Az invertáláshoz az A hipermatrixot használjuk ami a Jacobi módszer esetén 1-B értékre kell beállítani. Az iteráció várhatóan az eredeti mintavektor visszanyerésével végződik. A hiper-mátrixok konvolúciós magja megfelel a CNN szemantika szerinti B illetve A templateknek.
Sokszor előfordulhat az a helyzet, hogy a konvolúció által generált mátrix rosszul meghatározott, vagyis a legnagyobb és legkisebb sajátértékének az aránya igen magas. Ekkor nagyon lassan konvergál a Jacobi módszer. Bármilyen gyakorlati alkalmazás esetén feltétlen szükséges a dekonvolúció sebességének a fokozása.
- 54 4.3
Csebisev módszer
Lineáris algebrai módszerek
Több fajta iteratív mátrix inverziós lineáris algebrai módszer van amivel fel lehet gyorsítani a konvergenciát. Általában ezek a módszerek azt használják ki, hogy ismerjük a mátrix legkisebb (α) és legnagyobb sajátértékét (β)89. Ezt a két paramétert viszont könnyen megkaphatjuk hiszen a mátrixok jelen esetben konvolúcióból származnak90. Így ismert, hogy szimmetrikus template esetén a Fourier transzformáltjuk valós és az eredeti kép Fourier transzformáltjával szorozva visszaadja a konvolúció Fourier transzformáltját, azaz a Fourier transzformáció diagonális alakra hozza a mátrixot amelynek legnagyobb és legkisebb sajátértéke ezen a módon egyszerűen meghatározható. (Általános esetben a sajátértékek abszolút értékét kell kiszámítani.) A gyorsító eljárások többségénél a következő iterációt használják: X n +1 = X n − τ i ( BX n − Y )
( 36 )
Itt a τi egy paraméter, amelynek a megfelelő megadásával érhető el a gyorsabb kovergencia. Az eredeti Jacobi módszer esetén τi-nek 2/β-nál kisebbnek kell lennie a konvergencia biztosítása érdekében. Az eltolásos módszer esetén τi–t 2/(β+α)–nak választják. Ilyen paraméterrel a konvergencia sebessége akár a kétszeresére is gyorsulhat az előző módszerhez képest. További konvergencia sebesség növekedés érhető el ha a fenti paraméter értékét lépésről lépésre változtatjuk. Ezeket a eljárásokat nem stacionárius iterációs módszereknek hívják. Mivel a CNN univerzális gép91, 92 igen gyorsan átprogramozható, igen alkalmas az ilyen feladatok végrehajtására. A leggyorsabb általános konvergencia elérését a Csebisev módszer biztosítja89 (Az eltolásos módszer egyébként a Csebisev eljárás egy speciális esete (amikor j=1, lásd később)!). A Csebisev módszer alkalmazása esetén azt a feltételt szabják az iterációnak, hogy j lépésben a legjobban közelítse meg az inverzet. Ekkor a hibatagokra is fel lehet írni egy hasonló iterációt. Azaz hibatagokra vett iteráció kifejezhető a kezdeti hibának és egy egyre nagyobb fokszámú mátrix-polinomnak a szorzataként. Majd ennek lehet venni a sajátvektorok szerint vett sorfejtését, ami eredményül egy skalár polinomra vezet.
j ξ j = Π ( E − τ i B)ξ 0 i =1 n ξ j = P j ( λn )ξ 0n
( 37 )
A hiba akkor csökken a legjobban ha ez a polinom mindenhol a legjobban megközelíti az azonosan zéró függvényt. Az a polinom amelyik egyenletesen a legjobban közelíti a nulla függvényt a [-1,1] intervallumban a Csebisev polinom. T j ( x ) = cos( j ⋅ arccos( x ))
( 38 )
- 55 -
Csebisev módszer
Megfelelő átalakításokkal az [α,β] intervallum átkonvertálható a [-1,1] intervallumba és meghatározhatóak azok a τi értékek amelyek esetén a átlagos hiba minimálissá válik: X n+1 = (1 −τ i ) X n −τ i ((1 − B) X n − Y )
τi =
2 2i −1 β + α − (β − α ) cos( π) 2j
(i = 1... j)
( 39 )
Az egyenletből ( 39 ) látszik, hogy elegendő, ha csak a szimulátor időlépés paraméterét változtatjuk megfelelően. Természetesen ha nem szimulátort használunk akkor magát a template értékeket kell minden lépésben megváltoztatni, újraskálázni. 4.4
Példák Két példát mutatok itt be a fenti eljárás alkalmazására:
4.4.1 Rosszul meghatározott mátrix esete Az egyik egy rosszul meghatározott mátrix esete. Legyen a konvolúciós mag, vagy template a következő:
− .05 − .2
− .05
B = − .2 1.05 − .2 − .05 − .2 − .05
( 40 )
Az 30. ábra mutatja az eredeti képet (A), illetve a B templattel konvolvált képet (B). Az ezt követő, 31. ábra pedig a Jacobi inverziós algoritmus hatását 10, 20 és 30 iteráció múlva (A,B,C), illetve az eredeti képtől való eltérésüket (D,E,F). A Jacobi inverzió ekkor nagyon lassan konvergál. Harminc iterációs lépés után a négyzetes középhiba gyöke még mindig viszonylag magas: RMSE = 0.085472 A
30. Ábra Mutatja az eredeti (A) és a B template-tel hatására kapott képet (B).
- 56 -
Csebisev módszer
A
B
C
D
E
F
31. Ábra A Jacobi módszerrel történő inverzió 10 (A), 20 (B),Cés 30 (C) lépés után. Az alsó képek mutatják az eredeti képtől való eltéréseket (D,E,F )
Kiszámítva a template kétdimenziós Fourier transzformáltját (32. Ábra) a legnagyobb és legkisebb sajátvektort meghatározhatjuk: β = 1.65; α = 0.05;
32. Ábra A ( 40 ) template térbeli Fourier transzformáltja meghatározza az általa meghatározott hipermátrix legnagyobb és legkisebb sajátértékét.
A 2. Táblázat mutatja az így kapott τi paraméter értékeket j=10-re: τi paraméter értékei csökkenő sorrendben (j = 10; β = 1.65; α = 0.05) 16.7086 7.2889 3.5172 2.0542 1.3796 1.0255 0.8243 0.7064 0.6399 2. Táblázat
0.6097
- 57 -
Csebisev módszer
Sajnos i kis értékeire túlzottan magas τi paraméterértékeket kapunk és ezek a nemlineáris tartományba vihetik a CNN sejteket. A szimuláció során ezért az i indexeket csökkenő sorrendben alkalmaztuk és a lefutásuk után még 5 lépés Jacobi iterációt is futtattunk (τi=1) azért, hogy a helyenként, a nemlineáris viselkedés és a nagy τi értékek miatt megjelenő zajok eliminálódjanak. A templatek lépésről lépésre való letöltése helyett a CNN szimulátor használate esetén elegendő, ha az időlépés paramétert állítjuk megfelelően, mert ez a CNN differenciál egyenletének Euler közelítésével kapott differencia egyenlettel azonos iterációt valósit meg (lásd a ( 39 ) egyenletet). Ekkor a tizenöt iterációs lépés után (33. Ábra) az négyzetes középhibának a gyöke: RMSE = 0.024671 lett. A
B
33. Ábra A Csebisev módszerrel gyorsított inverzió esetén 15 lépés után az invertált kép (A) és annak eltérése az eredetitől (B).
Látható, hogy feleannyi lépésben is sokkal közelebb sikerült kerülni a tökéletes inverzhez. A Csebisev módszer CNN implementációjához feltétlenül szükségesnek látszik elkerülni az extrém magas paraméter értékeket. Ez megtehető, ha rövidebb sorozatát alkalmazzuk a Csebisev módszernek és ezeket többször megismételjük. Ekkor ugyan csökken a várható sebesség növekedés, de ugyanakkor a fenti hibák megjelenése is elkerülhető. A következő, 34. ábrán összehasonlíthatjuk az RMSE alakulását a különböző dekonvolúciós algoritmusok alkalmazása folyamán. Itt megvizsgáltuk milyen a konvergencia sebessége az eredeti (Jacobi) eljárás esetén, az eltolásos módszer használatakor illetve a Csebisev típusú algoritmusok esetén, amelyen belül a négy lépésest (j = 4, β = 1.6495, α = 0.05) és a nyolc lépésest (j = 8, β = 1.6495, α = 0.05) hasonlítottuk össze.
- 58 -
Csebisev módszer
34. Ábra Különböző dekonvolúciós eljárások összehasonlítása. 4.4.2 Nem invertálható konvolúció esete A második példa egy elmosódást eltüntető algoritmus. Ekkor egy szinguláris, nem invertálható mátrixnak és ennek megfelelő konvolúciónak kell a lehető legpontosabb (de természetesen csak megközelítő) inverzét meghatározni. Legyen:
.11 .11 .11 B = .11 .11 .11 .11 .11 .11
( 41 )
Az ilyen B template elmosódást okoz a teszt képen (35. Ábra). A
B
35. Ábra Az eredeti (A) és a template hatására elmosódott kép (B).
- 59 -
Csebisev módszer
Természetesen ha a template-nek megfelelő mátrixnak van zéró sajátértéke akkor nem invertálható tökéletesen a B template, mert van olyan része a képnek, amely pont a nulla sajátértékhez tartozó sajátvektor irányába mutat. Ennek képe nulla lesz az eredeti amplitúdójától függetlenül és így ezt a komponenst nem lehet vissza nyerni később. Mindazonáltal az így kapott hiba természetes képek esetén általában egészen kicsi. Ez az eset gyakran előfordul, például ha van negatív sajátérték is, mert ezek a mátrixok egy véges, diszkrét magvú konvolúcióból származnak amelynek a sajátértékei ezért igen simán változnak. Akkor sem invertálható a B template ha az a nemlineáris tartományba, azaz telítésbe vitte a képet, mert ekkor is információ veszett el ami már nem nyerhető vissza. Abban az esetben amikor a B template nem pozitív definit mátrixot generál akkor Gauss transzformációt kell alkalmazni89, 83 amelynek a segítségével el lehet érni azt, hogy az iterációban használt mátrix pozitív (semi-) definit legyen. Ehhez egy kétlépéses módszert kell alkalmazni a CNN esetében. A megfelelő iteráció ebben az esetben: Zn = B X n − Y X n +1 = X n − B Z
( 42 ) n
A példánkban használt konvolúció esetén a kétdimenziós Fourier transzformáltnak (36. Ábra) van negatív (és így zéró) sajátértéke is: β = 0.99; α = -0.3292;
36. Ábra A ( 41 ) template térbeli Fourier transzformáltja meghatározza az általa generált hipermátrix legkisebb és legnagyobb sajátértékét.
Esetünkben tehát természetesen az inverz tökéletesen nem kapható meg, de egy azt jól megközelítő eljárás megadható. Készítettünk egy összehasonlítást a Gauss transzformációt alkalmazó Jacobi és a Csebisev módszer között. Mindkét esetben 20 lépést iteráltattunk és
- 60 -
Csebisev módszer
vizsgáltuk melyik csökkenti jobban a négyzetes középhiba gyökét. Itt a pontos α helyett, ami esetünkben 0, egy kis véges értéket adtunk meg. Ezzel a módszerrel a legnagyobb értékű τi paramétereket elkerültük. Alkalmaztunk még egy trükköt, nehogy a nemlineáris tartományba kerüljön a rendszer, mert ekkor már nem javítható ki a nem-lineáris viselkedés miatt megjelenő nulla sajátértékhez tartozó komponens. Csökkentettük a bemenő kép amplitúdóját a felére és az iterációk elvégzése után, a végén szoroztunk vissza kettővel. Így nagyobb esély volt arra, hogy a lineáris tartományon belül tartsuk a rendszert. Mivel nem lehet végigfuttatni a megfelelő paraméterekkel az algoritmust ezért várhatóan csökken a hatékonysága az előző példához képest. A használt τi paraméterek a j = 20, β = 0.98, α = 0.1 választása esetén a következők voltak: 9.8662 1.7406
τi paraméter értékei csökkenő sorrendben (j = 20; β = 0.98; α = 0.1) 8.9160 7.4910 6.0665 4.8680 3.9332 3.2248 2.6909 2.2868 1.5559 1.4117 1.2989 1.2110 1.1434 1.0927 1.0565 1.0332
1.9783 1.0218
3. Táblázat
A 37. ábra mutatja az invertált képeket és ezek eltérését az eredetitől a Jacobi (A, B) illetve a Csebisev módszer (C, D) esetén. A négyzetes középhiba gyökének értékei RMSE(Jacobi) = 0.09227 és RMSE(Csebisev) = 0.069312 voltak. A
B
C
D
37. Ábra A kétlépéses módszerrel történő inverzió 20 dupla lépés után a Jacobi (A), illetve a Csebisev módszerrel való gyorsítás (C) után. Az eltéréseket az eredeti képtől a (B) és a (D) mutatja.
Ha egy másik alternatív Csebisev típusú algoritmust használunk ahol a τi paraméterek a (j = 4, β = 0.99, α = 0.05)-ből adódnak és ezeket ismételjük meg ötször akkor a egy még alacsonyabb gyök átlagos hibanégyzet értéket kapunk: RMSE = 0.061326
- 61 -
Csebisev módszer
A 38. ábrán láthatjuk két minta kép esetén egy Csebisev típusú eljárásnak a konvergencia sebességére a hatását, összevetve a Jacobi eljárás sebességével. Kisebb beállított α paraméterértékhez nagyobb τi kezdeti paraméterértékeket kapunk, amelyek telítésbe vihetik a CNN sejtek egy részét. Ez okozhat az első néhány ismétlés esetén akár némi tranziens hibanövekedést (Például az α = 0.05 esetén, bár erre itt nem mutatunk példát) még akkor is, ha később ez a paraméterezés jobb közelítéshez vezet.
38. Ábra Összehasonlíthatjuk a különböző inverziós eljárások konvergenciasebességeit. A Csebisev módszer itt használt paramétereiből (j = 4, β = 0.99, α = 0.1) származnak. Látható, hogy sokkal gyorsabban konvergál mindkét teszt kép esetén (Mandrill és Bohóc), mint a Jacobi módszer. 4.5
Konklúziók Megmutattuk tehát, hogy a CNN dekonvolúciós algoritmus konvergencia sebessége jelentősen fokozható a Chebisev módszer alkalmazásával. Még az elméletileg nem invertálható templatek esetén is található egy az eredetit viszonylag jól közelítő megoldás. Vannak további lineáris algebrai eljárások is amelyek gyors konvergenciát biztosítanak például az iteratív gradiens módszer, vagy legkisebb hibatagok módszere, amelyekhez viszont olyan funkcionálok kiszámítása szükséges amelyek a CNN-el viszonylag nehezen kaphatóak meg (Pl. összegzések az összes képpontokra.).
- 62 -
Thalamo-kortikális szinkronizáció
5 A vizuális thalamo-kortikális rendszer szinkronizációjának a CNN modellje
stimulus-specifikus
Általánosan elfogadott tény az, hogy a thalamikus vizuális központ, corpus geniculatum laterale pars dorsale (dLGN) , vagyis a térdes test hátsó oldalsó része, nem egy egyszerű átkapcsoló állomás a retinális jelek és az elsődleges látókéreg között, hanem aktívan részt vesz azoknak a jeleknek a kiválogatásában amelyek fontosak lehetnek a viselkedési és figyelmi állapottól függően a további kérgi jelfeldolgozásban. Az egyik legerősebb érv ami alátámasztani látszik a thalamusznak ilyen irányú szerepét az az igen jelentős kortiko-thalamikus visszacsatoló rendszer, ami a thalamusz szinaptikus kapcsolatainak a többségét magában foglalja. Mindazonáltal, mindeddig sajnos hiányzik kísérleti tényekkel alátámasztott és elméletileg is megfelelően megalapozott leírása a thalamusz funkcióinak. Elektrofiziológiai vizsgálatok93 arra mutatnak, hogy bizonyos körülmények között a kortiko-thalamikus visszacsatolás szinkronizálni tudja a thalamikus principális sejtek tüzelését akár tulajdonsághoz kötött módon is. Ezek talán az első és igen fontos adatok amelyek megvilágíthatják a thalamusz szerepét az éber állapotban végbemenő információfeldolgozásban. A talált korrelált thalamikus aktivitás azt jelezheti, hogy már a thalamusz szintjén megkezdődik a kiválasztása és összekötése, integrálása az idegi válaszoknak a vizuális ingerekről globálisan meglévő kontúr és összekapcsoltsági információknak megfelelően. Azért, hogy meg tudjuk vizsgálni vajon tényleg van e szerepe a thalamikus szinkronizációnak egy ilyen típusú információfeldolgozásban, elkészítettük egy neuromorf modelljét a kérgi visszacsatolásnak, illetve egy egyszerűsített modelljét a thalamo-kortikálkis rendszernekV, VI. A modell elkészítéséhez felhasználtuk a CNN paradigma által nyújtott lehetőségeket és a rendelkezésre álló szimulátorokat. Sikerült megmutatni a modell segítségével, hogy a jel speciális tulajdonságait közvetítő kortiko-thalamikus visszacsatolás olyan időbeli kódot szolgáltat amellyel a thalamikus principális vagy ’relay’ sejtek tüzelése ténylegesen szinkronizálódott. Ez a szinkronizáltabb thalamikus aktivitás hozzájárulhat a kérgi idegsejt populációk további szinkronizálódásához. Eredményeink megerősíteni látszanak azt az elképzelést, hogy az idegsejt aktivitások szinkronizálódása, amely egy általános integráló mechanizmus lehet a vizuális információfeldolgozás során, több helyen, akár egymással párhuzamosan is megjelenhet a nagy mértékben csatolt thalamo-kortikális rendszerben. 5.1
Biológiai háttér A látókéregnek alapvető tulajdonsága az, hogy a különböző inger szubmodalitások mint az orientációk, a színek, a diszparitás vagy a mozgási információk párhuzamosan, elosztott módon dolgozódnak fel funkcionálisan elkülönült, specializált kérgi területeken. Ez az ismert sajátossága a látórendszernek felveti a kérdést, vajon hogyan lehet ezekből a térben is elkülönült kérgi aktivitásokból az észlelt tárgyaknak egy egységes reprezentációját kialakítani az agyon belül94, 15 (‘binding problem’)? Egy ilyen folyamatnak alapvető szerepe lehet a különböző szegmentációs feladatokban, illetve a tárgy-háttér elválasztásban95, 96, 97, 98. Az egyik felmerült elképzelés egy időbeli kódolást javasol mely szerint az idegsejtek szinkron tüzelése, a szinkron idegi aktivitás játszik szerepet a tárgyak integrálásában az elosztott idegsejt hálózatok, illetve neuron populációk között99, 100. Eszerint azok az idegsejtek amelyek egy tárgynak a különböző tulajdonságaira reagálnak szinkron tüzelnek (“feature linked synchronization”93), szemben azokkal amelyek különböző tárgyak tulajdonságira érzékenyek101. Ezt az elképzelést sok
- 63 -
Thalamo-kortikális szinkronizáció
elektrofiziológiai vizsgálat látszik alátámasztani102, 103. Sikerült szinkron aktivitást kimutatni térben elkülönült sejtcsoportok között104, 105 a látórendszer különböző területein belül106, 107, illetve közöttük is108. Még a két félteke109 idegsejt csoportjai között is találtak szinkronizálódást. Fontos lenne meghatározni a fenti vizuális szinkronizáció generáló mechanizmusát110. Eleinte azt javasolták, hogy az inger függő időbeli korreláció a kizárólag kérgi szinten alakul ki111,112. és nem a thalamusztól érkező közös input kelti106. Bizonyítékok amelyek alátámasztani látszanak a kérgi szinkronizáció kérgen belüli keletkezését azon alapulnak hogy találtak a féltekék között is szinkron működést ami megszűnt amint a Corpus Callosumot átvágták109. További támogatást kapott a fenti elképzelés amikor kancsal macskákon végeztek vizsgálatokat. Azt találták, hogy nem alakul ki szinkron működés olyan sejtcsoportok között amelyek különböző szemekből kapnak inputot, de teljesen normálisan viselkednek, ha azonos szemből meghajtott sejteket vizsgáltak. Mivel ismert volt, hogy a kancsal macskákon113 nem alakul ki megfelelő intrakortikális kapcsolatrendszer azon idegsejtek, illetve idegsejt populációk között amelyek különböző szemektől kapnak beidegzést, így a mért adatokból feltételezhető, hogy a szinkronizációnak kérgi az eredete. Más adatok viszont azt az elképzelést támogatják, hogy a kéreg alatti aktivitásnak114, 110, 123, illetve a kortiko-thalamikus visszacsatolásnak115, 93 is szerepe lehet a kérgi szinkronizáció kialakításában. Ismert, hogy a kérgi visszacsatolás abban a frekvencia tartományban a maximális, amely közel esik a mért kérgi oszcillációk frekvenciájához116. Az utolsó lépés a vizuális információ feldolgozása során ahol még a tárgyak lokálisan, egy helyen reprezentáltak az a thalamusz. A további lépések során ez az egységes, topografikusan rendezett kép szétesik sok különböző tulajdonságok szerint átrendezett térképre, reprezentációra amelyek elemei egymástól jelentős távolságra is lehetnek. Sok tanulmány foglalkozik a thalamusz117, 118 szerepével az információ feldolgozásban. Azt is sikerült bebizonyítani, hogy a kérgi visszacsatolás119 növeli azt az információ mennyiséget amelyet a thalamusz szállít a kéreg felé. Hasonlóképpen megmutatták, hogy milyen jól meghatározott szerepe van a kérgi aktivitásnak a thalamikus sejtek válaszdinamikájára120, 121. Vannak vizsgálatok amelyek hasonló frekvenciájú oszcillációkat mértek a thalamuszban122, sőt még a retinában is123. Az utóbbi időben megjelentek eredmények amelyek azt mutatják, hogy a kérgi visszacsatolás a térdes test hátsó oldalsó magjához (dLGN) szinkronizálni tudja a thalamikus sejtek tüzelését tulajdonsághoz kötött módon93, ahogy azt a kéregnél is kimutatták. A thalmikus ’relay’ sejteknek korrelálttá válik az azonos tárgy által kiváltott tüzelési mintázata, viszont a kéreg hűtése megszünteti ezt a jelenséget. Ezen felfedezések azt mutathatják, hogy a válaszok szétválasztása egyesítése amely a szinkronizáción alapul már a thalamusz szintjén megjelenik. Felvetődik a kérdés, vajon milyen szerepe van a thalamikus szinkronizációnak a vizuális információfeldolgozásban és hogy hogyan befolyásolja a principális sejtek korrelált tüzelése a kérgi célsejtek működését. Azért, hogy elemezhessük a fenti kérdéseket elkészítettük egy modelljét a kortiko-thalamikus rendszernek, amellyel lehetőség nyílik egyfajta mélyebb betekintésre az amúgy végletesen összekapcsolt rendszerbe. 5.2
A kortiko-thalamikus szinkronizáció modellje Kifejlesztettük a kortiko-thalamikus visszacsatolásnak egy modelljét, hogy meghatározhassuk különleges szerepét a kérgi szinkronizációban. A modellben feltételeztük, hogy a perifériás input állítja be a válasz nagyságát a thalamikus átkapcsoló idegsejteken, de a kérgi visszacsatolás határozza meg pontosan a megjelenő időbeli aktivitás mintázatot.
- 64 -
Thalamo-kortikális szinkronizáció
Azért hogy elkerülhessük az intrakortikális kapcsolatokból származó szinkronizáció hatását, ezért ezen kapcsolatokat teljességgel kihagytuk a modellből. Így ez a szimuláció nem tekinthető egy hűséges kérgi szinkronizációs modellnek, hanem annak csak egy egyszerűsített részének, ami csak egy speciális komponensét próbálja analizálni az egyébként bonyolultan összekapcsolt rendszereknek és így ez az eljárás a szinkronizáció egy speciális fajtáját igyekszik szimulálni ahol a bejövő jelben meglévő térbeli közelség, folytonosság kapcsolja össze a különböző, egymástól távoli reprezentációkat és vezethet később a tárgynak az egységes percepciójához. Az irodalomban is többnyire ilyen tulajdonságok alapján történik az aktivitások szinkronitásának az összekapcsolása124, 125. A kérgi oszcillációk eredetére több modell is született. Egy részük a gátló sejtek hatását hangsúlyozza126, 127, míg mások elsősorban az intrakortikális kapcsolatrendszert teszi értük felelőssé111, 112, 128. A modell azt mutatja, hogy egy jól meghatározott speciális esetben a kortiko-thalamikus visszacsatolás egymagában, bármiféle intrakortikális kapcsolat nélkül is, vezethet a tulajdonság függő kérgi szinkronizációhoz. A Celluláris Neurális Hálózatot CNN használtam a modellezés keretének. Mivel lokálisan kapcsolt nagy számú idegsejtet tartalmazó hálózat szimulációja volt a cél, így a CNN szimulátorok25 kitűnően használhatónak bizonyultak. Ezen eszköz felhasználásával viszonylag egyszerű modellezni a küszöb alatti jelenségeket, az akciós potenciálokat ugyanúgy mint a topografikusan rendezett kapcsolatokat, illetve a megfelelő késleltetési időket amelyek megfelelnek a jelek propagálásának, terjedésének a rétegek között. Speciális előnye ennek a fajta keretrendszernek, hogy kizárólag a lokális szabályokat kell megadni és a CNN ezen szabályok szerint tér-független módon végrehajtja azokat pontról pontra és meghatározza a hálózat válaszát, aktivitás mintázatát. A modellbe megpróbáltuk azokat az információkat beépíteni amelyek rendelkezésre álltak a thalamikus és kérgi sejtek fiziológiájáról, morfológiájáról illetve a lokális és a globális kapcsolatrendszeréről. 5.3
A modell struktúrája A modellt viszonylag különálló modulokból építettem fel. Ezek a modulok a CNN-ben már leírt és kipróbált templateket, illetve új ebben a feladatban alkalmazkodó részleteket tartalmaz. A használt modulok az akciós potenciál generálását, a lassabb EPSP, IPSP generálását megvalósító elemeket, illetve az ilyen elemeket összkötő részeket tartalmaznak. A modellben az akciós potenciálok generálására két különböző módszert (modult) is alkalmaztam. Ezzel az eljárással talán sikerült elkerülni egy bizonyos fajtáját az artefaktumoknak Elsőnek az UPG (Universal Pattern Generator) modellt használtam129. Ez egy egyszerű iteratív algoritmus, amelyik akciós potenciál sorozatokhoz hasonló mintázatokat generál intervallum leképezéssel. yn+1 = f(yn ) + xn, ahol yn a sejt aktivitás értéke az n-dik lépésben és xn az input ebben az időpontban. A nemlineáris függvényt, a következő intervallum leképezés ( 43 ) mutatja. yn+1 1
-1
.2
1
yn
( 43 )
- 65 -
Thalamo-kortikális szinkronizáció
Ez az eljárás nagy sebességgel képes akciós potenciálhoz hasonló viselkedést szimulálni. Közeli rokonságot mutat az ‘integrál és tüzel’ modellekkel. Mindazonáltal ez egy nagyon leegyszerűsített képét adja a biológiailag megvalósuló akciós potenciál keletkezésnek. Pontos akciós potenciál generálásra használatos Hodgkin-Huxley modellek esetünkben nehezen megvalósíthatóak lettek volna és így nem is használtuk őket. Kellemes tulajdonsága az UPG-nek az, hogy nagyon érzékeny a kezdeti értékeire. Tehát egy hálózatnyi ilyen sejt kis kezdeti állapot különbséggel indítva, csak akkor generál szinkron működést ha a hálózat elemei között megfelelő kapcsolatok, kölcsönhatás biztosított129.
Membrane potential
Time evolution 39. Ábra A képen látható, hogy kezdeti állapot különbségek hatására az azonos UPG elemek nem mutatnak szinkronizálódást.
Azért hogy ellenőrizzük a kapott eredményeinket az akciós potenciál generáló elemeket kicseréltük egy a fiziológiai folyamatoknak jobban megfelelőre. Ez az úgynevezett neuromorf modell130, amelyben a membrán áramokat feszültség függő vezetőképességekkel és sorosan kötött feszültséggenerátorokkal helyettesítettük131. Ez megfelel az idegsejt membránnal elektromos szempontból ekvivalens hálózat egy egyszerűsített modelljének (40. Ábra).
- 66 -
Thalamo-kortikális szinkronizáció
Citoplazma
Extracelluláris tér
40. Ábra Az idegsejt membrán egyszerűsített elektronikus áramköri modellje.
Ez már jobban megközelíti az idegsejt elektromos tulajdonságait leíró Hodgkin-Huxley modellt, és annak csak a komplex dinamikáját helyettesítették az egyszerűség kedvéért egy késleltetéssel. Három fajta feszültség vezérelt áramot alkalmaztunk (az inputtal együtt négy félét) a nátrium, a kálium illetve a szivárgási áramoknak megfelelően. A feszültség vezérelt ellenállások megadhatóak voltak a modellben lineárisnak (Ohmikusnak), illetve akár nemlineárisnak is. Ezen vezetőképességek különböző megfordulási feszültséggel rendelkeznek és ezeket a paramétereket a hozzájuk csatolt feszültséggenerátorok feszültségének a megfelelő beállításával lehet meghatározni. A szimulációk során felhasznált feszültségfüggő ellenállások paraméterei, illetve a megfordulási feszültségek értékei a következőek voltak: VCC1=[1][a]
REV1=3 VCC2=[.2][b] a
VCC3=[1][c]
b
REV3=-.3
c 8
4
-1
REV2=0
.3 .2
1
-1
1
-1
.4
1
( 44 ) Itt VCC a feszültség vezérelt vezetőképességeket jelöli, amelyek megadásához egy skálafaktort és egy lineáris, vagy nemlineáris függvényt használtunk. REV jelöli az áramok megfelelő megfordulási feszültségét. A VCC3 időkésését egy időegységre állítottuk be.
Ez a módszer is akciós potenciálszerű viselkedést generál, de szükség lenne egy megfelelő átskálázásra ahhoz, hogy össze lehessen hasonlítani őket a biológiailag mérhető akciós potenciálokkal. Ezen eljárással való szimuláció valamivel időigényesebb mint az UPG algoritmus. Így sokkal hosszabb időre volt szükség a szimuláció során amíg kialakult a megfelelő szinkronizáció és természetesen nehezebb volt kialakult egzakt szinkronizáció megállapítása is. A következő modul amit felhasználtunk a kiváltott EPSP-ket és IPSP-ket szimulálta:
- 67 -
Thalamo-kortikális szinkronizáció
Szokványos idegi ingerület áttevődés során az információ úgy adódik át az egyik sejtről a másikra, hogy a preszinaptikus akciós potenciál ingerület átvivő anyagot, neurotranszmittert szabadít fel a szinaptikus végződésből ami elérvén posztszinaptikus sejten lévő receptorokat ott vagy ioncsatornákat nyitnak meg, vagy valamilyen másodlagos hírvivő rendszeren keresztül vezetnek az ioncsatornák kinyílásához, bezáródásához illetve módosult működéséhez. Az ioncsatornák nyitvatartási idejének dinamikája specifikus. A potenciálváltozást amit ezen folyamatok idéznek elő serkentő posztszinaptikus potenciálnak (EPSP), illetve gátló posztszinaptikus potenciálnak nevezik (IPSP). Ezek általában hosszabb ideig tartanak mint az akciós potenciál létrehozását kísérő feszültség változások. Különösen igaz ez akkor ha figyelembe vesszük a posztszinaptikus potenciáloknak az axondombig való passzív terjedése miatti kiszélesedését is. Azért hogy ezeket, a jelek időzítése szempontjából elsődlegesen fontos eseményeket is modellezni tudjuk, újabb rétegeket használtunk. Az ezekhez felhasznált paraméter értékek szintén megtalálhatóak a táblázatban (4. Táblázat b,d,). Mind a thalamusz mind a kéreg szimulált viselkedéséhez felhasználtam mindkét fentebb vázolt modult (lásd 4. Táblázat a,b, és c,d,).. Az akciós potenciálok áttevődésének a megfelelő időzítéséhez késleltetéseket használtunk. Ezek a késleltetések meg akartak felelni az ingerület terjedéséhez szükséges időknek (2-3 milliszekundum). A kortiko-thalamikus visszacsatolás esetén a direkt, és az indirekt (gátló sejteken keresztül történő) visszacsatolásnál nulla (UPG), vagy egészen minimális késleltetési értéket használtunk, alkalmazván ismereteinket ennek a fajta beidegzésnek a speciális morfológiájáról132 (lásd a következő oldalt). A modell alapvető működését a következő 41. ábrán vázolom. Kérgi elemek
Thalamikus elemek
A kérgi visszacsatolás szinkronizálja a thalamikus spike-okat
t1
t2
t1’
t2
Membrán zaj Input Input Membrán zaj 41. Ábra A modell működésének sematikus ábrázolása. A kezdetben az elnyújtott input és a zaj hatására kiváltott aszinkron thalamikus jelek konvergálnak a kérgi idegsejtre amelynek a visszacsatolt hatása már egy jobban szinkronizált thalamikus aktivitáshoz vezethet.
Azért hogy elkerüljük a determinisztikus, modellfüggő megjelenését a szimulált akciós potenciáloknak, zajt adtunk mind a modellezett membrán potenciáljához a kérgi sejtek rétegének, mind a szimulált thalamikus sejtek membrán potenciál értékéhez (lásd 4. Táblázat h,i,).. Ez a zaj megfelelhet a biológiailag mindig jelenlévő szinaptikus zajoknak, illetve a bejövő jelek varianciájából eredő zajnak. Ezen a zaj sokkal gyorsabban változik mint a sejtek
- 68 -
Thalamo-kortikális szinkronizáció
perifériáról jövő inputja, és így jelentősen befolyásolhatja az akciós potenciálok kibocsátásának pontos időzítését. Ezzel a módszerrel elkerülhető volt az, hogy a közös aktiválás, például a bekapcsolás, okozzon szinkronizációt a sejtek között. A modellben nincs is más forrása a deszinkronizációnak, csak ez a zaj. Van a modellben mechanizmus arra hogyan szinkronizálódjon az aktivitás, de az aszinkron viselkedést a kezdeti véletlenszerű aktivitásmintázat okozza ami végső soron a zajból ered. A vizuális kéreg egyszerű sejtjei elsősorban megfelelően orientált hasábszerű ingerekkel aktivizálhatóak. Ez a fajta receptíve mező megfelelően konvergáló thalamo-kortikális133 kapcsolatokkal modellezhető. Ebben a modellben kizárólag függőleges orientációra érzékeny kérgi egyszerű sejteket modelleztük (lásd 4. Táblázat c,). A kérgi visszacsatolás két fő útvonalon éri el a thalamikus relay sejteket. Az egyik fő útvonal a ‘relay’ sejtek sejttesttől távoli dendritjeit idegzi be. Pontos topográfiát követnek ezek a kapcsolatok, habár igen jelentős a konvergencia és a divergencia is. A másik visszacsatolási útvonal a thalamikus gátló sejteket érinti. Ezek a helyi, lokális gátló sejtek viszont az axonjukon illetve a dendritjeiken keresztül a thalamikus ’relay’ sejteket innerválják132. Az inputok ezen speciális elrendezése miatt tettük fel a modellben, hogy az indirekt és direkt kérgi visszacsatolás késleltetési ideje körülbelül egyforma. Kihagytuk a modellből azt az útvonalat amely a retikuláris magon keresztül halad, amelyről egyébként azt tartják134, 135, hogy elsősorban más folyamatokban van komoly szerepe úgymint alvás-ébrenlét, és az éberségi szint szabályozása. Ennek a kapcsolatrendszernek a vázlata látható a 42. ábrán. cortex +
+ relay cell
+ PGN/NRT
+
-
interneuron +
-
+
retinal afferents
42. Ábra A kortiko-thalamikus visszacsatolás egyszerűsített vázlata. A ‘perigeniculate’ mag hatását kihagytuk a modellből.
A gátló interneuronok általában kis tüzelési küszöbbel és lineáris input-output karakterisztikával rendelkeznek. Azaz a gátló sejtet ingerlő akciós potenciálok számával egy széles tartományban arányos a kimenetén mérhető tüzelési frekvencia. Így ezen sejtek CNN modelljébe nem építettük be az akciós potenciálok generálását, hiszen aktivitásuk és így hatásuk is jól jellemezhető a kérgi inputjuknak egy megfelelően lelassított, némiképp késleltetett és megfelelően súlyozott változatával (lásd 4. Táblázat e,f,g,).
- 69 -
Thalamo-kortikális szinkronizáció
A milliszekundumos pontosságú szinkronizációhoz arra van szükség, hogy az aktiválás is nagyon rövid és intenzív legyen, biztosítandó a megfelelő időzítést. Ez kulcsfontosságú a modell működése szempontjából is. Ha csak gyenge posztszinaptikus aktivációk érkeznek a thalamikus ’relay’ sejt dendritjeire akkor az különböző időpontokban fog akciós potenciál kibocsátáshoz vezetni, attól függően mikor éri el az adott sejt az akciós potenciál küszöböt a kezdeti membrán potenciál értékének a függvényében. Amennyiben viszont egy sokkal erősebb kérgi visszacsatolási értékkel számolunk, akkor ez bár szinkronizálja a thalamo-kortikális hálózatot, ugyanakkor a retinális jeltől, külső ingertől függetlenül is vezethet aktiválódáshoz. Egy ilyen erős és hosszú aktiválás akár ’burst’ jellegű kisüléséhez is vezethet a ‘relay’ sejteken. Ilyen viselkedésére a thalamikus rendszernek sok példa van különböző alvási állapotokban135, 136. Amennyiben a konvergáló serkentést és gátlást is használunk (lásd 43. Ábra) akkor elérhető egy tömörebb, gyorsabb aktiválást követő hosszabb gátlás, amely úgy vezethet a sejtek aktivitásának a szinkronizálódásához, hogy elkerüli a fent vázolt negatív következményeket (lásd 44. Ábra).
a, Membrán b, potenciál c, d, idő 43. Ábra A súlyozottan (d) összeadódó konvergens EPSP (b) és IPSP (c), amelyeket azonos akciós potenciál generált (a) megfelelően rövid aktiválást és egy azt követő elnyújtottabb gátlást okoz.
- 70 -
Thalamo-kortikális szinkronizáció
B
A
Akciós potenciál küszöb
Nincs szinkronizáció
Kis
EPSP
Különböző membrán potenciál értékek a különböző sejtekben
Szinkronizació
Nagy EPSP
44. Ábra Amennyiben csak kicsi a különbség a szomszédos idegsejtek membránpotenciálja között akkor egy kicsiny (akár szinkron) EPSP (A) sem okoz szinkron tüzelést, de egy sokkal erősebb EPSP (B) már növeli a szinkron működést a sejtek között. Ugyanakkor ez az erős EPSP aktiválhatja az egyébként nem ingerelt sejteket is. Ahhoz hogy ezt elkerüljük egy erős, de ugyanakkor igen rövid EPSP szükséges. Ez elérhető egy konvergens EPSP és IPSP alkalmazásával. Az ábrán a körök a különböző sejtek membránpotenciáljának változását keretezik. Mindegyik sejt esetén jelölve van az akciós potenciál generálásának a küszöbe illetve a beérkező EPSP előtti membránpotenciál érték.
A szimulációval kapott eredmények azt mutatják hogy a modell nagyon érzékeny a paraméterek pontos megválasztására. A megfelelő sebességű szinkronizáció eléréséhez úgy kell beállítani a tömör serkentés pontos értékét, hogy az ne vezessen nem kívánt működésekhez. Az UPG esetében felvetődött egy további probléma is. Az UPG bemenetének nagyobbnak kell lennie mint az őt generáló leképezésben szereplő küszöbnek, ahhoz hogy a szinkronizáció megvalósulhasson. Mindazonáltal, ha ez az input hosszabb ideig nagyobb mint az UPG-ben definiált küszöb, akkor az további nem kívánt oszcillációkhoz is vezethet137. Ezért a modell paramétereit, különösen a késleltetéseket, rendkívül óvatosan kell beállítani. Igen komoly konvergencia és divergencia mutatható ki132 az agykéreg és a thalamusz között. A kapcsolatok topografikus jellege viszont ennek dacára megőrzött marad. Ha a szomszédos elemek közötti szinkronizáció elérése a célunk, akkor pontosan ilyen kapcsolatokra van szükségünk a modellben is. Ezeket a típusú kapcsolatokat olyan CNN templatekkel lehet elérni amelyeknél a szomszédosság igen nagy. A modell működési sebességének a növeléséhez ezért a modellezendő divergenciát két lépésben valósítottuk meg, kisebb szomszédsági kapcsolatszámokkal. A felhasznált pontos paraméterértékeket a 4. Táblázat (e,g,) tartalmazza.
- 71 -
Thalamo-kortikális szinkronizáció
Kérgi sejtek
Thalamo-kortikális divergencia Kortiko-thalamikus divergencia Thalamikus sejtek
45. Ábra Konvergencia és divergencia vázlata a kortiko-thalamikus rendszerben.
Az összegzett serkentés és gátlás az egy helyre konvergáló területről biztosítja a korrelált aktivitás kiterjedését az egész objektumra. Amennyiben kezdetben csak kicsiny mérvű a korreláció a sejtek aktivitásában akkor ez a típusú visszacsatolás és kapcsolatrendszer biztosítja a növekedését egészen a teljes szinkronizáció eléréséig. Ennek az eléréséhez viszont szüksége van a rendszernek némi időre. Amennyiben két szomszédos idegsejt csak egy rövid ideig aktív, akkor nincs idő a teljes szinkronizáció beállására. Ehhez csak egy hosszabb időtartamú szomszédságot feltételező aktiválás vezethet. A modellben a visszacsatolás konvergenciája, a divergenciája valamint a receptív mezők mérete is limitált. Ezek jócskán alulmúlják a biológiailag releváns méreteket. Ha ebből a szempontból akarjuk magyarázni a modellt, akkor úgy kell tekintenünk minden elemet mint idegsejtek egy helyi csoportját és a sejtválaszokat, mint egy minta választ ebből a sejtcsoportból. A felhasznált paraméter értékek, template értékek amelyeket a modell használt a 4. Táblázatban találhatóak meg.
- 72 -
Réteg
Template
a, b,
Thalamo-kortikális szinkronizáció
Output Input (hova) (honnan) b; Relay sejtek Teszt küszöb alatti minták folyamatai c; Relay sejtek a; g; akciós potenciál generálása Modellezett folyamatok
A=[.2] B=[.5] Anoise=[.1]
VCC1=[1][a]; REV1=3; VCC2=[.2][b]; REV2=0; VCC3=[1][c] REV3=-.3; delay=1; VCC(From a) =[.5] [d] REV=3; A(from g) = .2; delay=10; a
b
d
c
8
1
4 .3 1
.2
-1
c,
.4
-1
0 0 1 0 0 0 0 1 0 0 0 0 1 0 0 [a] 0 0 1 0 0 0 0 1 0 0
A =[.34]; VCC(From b)=
d,
1
-1
-1
1
a .3
Anoise =[.1]
b
8
c
d 1
.3 -1
1
.2
1
-1
e,
-1
.4
1
-1
a A(From d) =
1 1 1 1 1 1 [a] 1 1 1
A(From e) =[.6]
.35 -1
A(From e) = [.2] delay=10; .5
1
A(From f) =[.5]
.15 .15 .15 .15 .15 .15 .15 .15 .15 .15 A(From e)= .15 .15 .15 .15 .15 A(From f)= .15 .15 .15 .15 .15 .15 .15 .15 .15 .15
-.15 -.15 -.15 -.15 -.15 -.15 -.15 -.15 -.15 -.15 -.15 -.15 -.15 -.15 -.15 B=[0] -.15 -.15 -.15 -.15 -.15 -.15 -.15 -.15 -.15 -.15
delay=5;
h, i,
1
VCC1=[1][a]; REV1=3; VCC2=[.2][b]; REV2=0; VCC3=[1][c]; REV3=-.3; delay=1; VCC(From c) =[.8] [d]; REV=3; delay=5; a
g,
.3
-1
4
f,
1
Kérgi sejtek b; küszöb alatti folyamatai
d;
Kérgi sejtek c; akciós potenciál generálása
e;
Kérgi aktivitás d; kiváltotta EPSP
f;g;
Kérgi aktivitás e; kiváltotta IPSP
g;
1
Kortikothalamikus visszacsatolás konvergenciája
e; f;
membrán zajok noise
A=[.2] B=[.7]
4. Táblázat
b;
a; c;
- 73 -
Thalamo-kortikális szinkronizáció
A szükséges műveletek végrehajtásához több réteget is felhasználtunk. Az áttekinthetőség miatt a 46. ábrán vázoljuk a szerkezetét és elrendezését ezeknek a rétegeknek. Akciós potenciál generálás d, A kéreg modelljének 2 rétege
Membrán potenciál c,
Membrán zaj i, Kortiko-thalamikus EPSP e, Interneuron IPSP f, Az EPSP-k és az IPSP-k összege g,
Relay sejtek modelljének 2 rétege
A modellezett kortiko-thalamikus visszacsatolás 3 rétege
Spike generálás b,
Membrán potenciál a,
Membrán zaj h,
Retinális input
46. Ábra A modell rétegeinek összekapcsoltságának vázlata.
- 74 -
Thalamo-kortikális szinkronizáció
5.4
A szimuláció kísérleti eredményei A modell tesztelésére megpróbáltuk szimulálni Engel és csoportjának az elektrofiziológiai módszerekkel mért eredményeit138. Ezek talán azok az eredmények amelyek mindeddig a legjobban mutatják a kérgi szinkronizáció jelenségét. Ebben a kísérletben különböző mozgó ingereket használtak és mérték vajon vezetnek-e szinkronizált kérgi működéshez.
a,
b,
c,
47. Ábra A mérés során különböző ingereket alkalmaztak. Az első kísérletben (a,) az inger egy mozgó fényhasáb volt, amely keresztezte a kérgi (thalamikus) sejtek receptív mezejét. A második mérésnél (b,) két együtt mozgó fényhasáb volt az inger, míg a harmadik kísérletnél (c,) a két fényhasáb inger ellentétes irányban mozog.
Ez a szinkron működés összekötheti egy bizonyos tárgy különböző tulajdonságinak megfelelő elosztott kérgi reprezentációit. Ezen a módon egy tárgy tulajdonságai, részletei, aspektusai újra integrálódhatnak. Hogyan lehet egy tárgyat felismerni zajos környezetben? Lokális tulajdonságok azonossága, illetve ezek térbeli folytonossága kapcsolhatja össze a megfelelő kérgi sejteket. Az első inger amelyet alkalmaztak egy mozgó hasáb volt amely a kérgi idegsejtek egy csoportjának a szinkron aktivitását okozta. Amennyiben egy hosszabb hasáb helyett két rövidebbet mozgattak párhuzamosan a macska szeme előtt, akkor ez az inger kisebb de még jól meghatározott szinkron kérgi választ váltott ki. Azt jelezheti ez a mérés, hogy bár nem voltak folytonosan összekötöttek ezek az ingerek a párhuzamos együttes mozgásuk mégis azt jelzi, hogy talán egy tárgy különböző részletei és ezt a sajátosságot a mérések szerint a kérgi sejtek is észlelni tudták. Amennyiben viszont az inger két ellentétesen mozgó hasáb volt akkor a két mért idegsejt csoport között semmilyen korrelált aktivitás mintázatot nem sikerült kimérni.
- 75 -
Thalamo-kortikális szinkronizáció
b
c,
d Membrán potenciál e,
f,
g Idő 48. Ábra A modell egyes rétegeiből vett minta elemek válaszai a processzálás során. A válaszok megfelelnek egy modellezett thalamikus sejt tüzelés válaszának (b,), a kérgi kiváltott EPSP-nak (c,), a kérgi sejt tüzelésének (d,), illetve a kortiko-thalamikus EPSP-oknak (e,). Az (f,) és (g,) pedig megmutatja a kiváltott kortiko-thalamikus IPSP-t és az összegzett lassú potenciálokat egy azonos pont mentén.
- 76 -
Thalamo-kortikális szinkronizáció
5.4.1 1. Kísérlet Az első kísérletben a fent említett hosszú hasáb volt az inger a modellben. A mozgás sebessége 60 időlépésenként 1 pixel volt. A modell válaszait a ábrán demonstráljuk. Látható, hogy például a W1 és a W2 ablakokban szinte tökéletes szinkronizáció volt elérhető. Az akciós potenciálok pontos időzítése függ a kezdeti feltételektől illetve a hozzáadott zajoktól, de a kialakuló koherencia univerzális volt. A
t2
t1
B
a, b,
c, d,
W1
C
W2
W3
D
a,
Membrán potenciál
b, c, d, t2
t1
t1
t2
Idő
49. Ábra Az inger (A) egy horizontális irányban mozgó függőleges hasáb volt. B, mutatja a kérgi sejtek válaszát egy bizonyos időpillanatban amikor éppen egy szinkron kisülés történik. A fekete elemek felelnek meg az éppen tüzelő neuronoknak. C, mutatja a válaszát négy térben szeparált kérgi sejtnek az UPG modell esetén és D, a neuromorf esetben. A négy sejt megfelel az a, b, c, és d,-nek az A, ábrán.
- 77 -
Thalamo-kortikális szinkronizáció
5.4.2 2. Kísérlet Teszteltük a modellünket abból a szempontból is vajon nem műtermék-e a szinkronizálódás. Amennyiben kihagyjuk a kortiko-thalamikus visszacsatolást a modellből akkor nem kapunk semmiféle szinkron viselkedést. Megmutattuk tehát, hogy a modellben észlelhető szinkronizáció nem a kezdeti feltételek megfelelő megválasztásából, hanem a visszacsatolásból származik. W
Membrán potenciál
Idő
50. Ábra Három egymás mellett fekvő neuron aktivitása amennyiben a kortiko-thalamikus visszacsatolást kikapcsoltuk. Látható, hogy nincs szinkronizáció az elemek között a W ablakban.
- 78 -
Thalamo-kortikális szinkronizáció
5.4.3 3. Kísérlet Amennyiben az inger két nem érintkező, de együttesen mozgó hasáb volt akkor a hosszan tartó egymásmellettiség és a koherens mozgás azt eredményezte, hogy a modell összekötötte és egységes tárgyként kezelte az ingereket. A lokálisan megjelenő koherencia idővel kiterjedt az egész objektumra, illetve annak reprezentációira is és összeköti annak a két térben egyébként szeparált részét is. A 51. ábrán láthatjuk, hogy a W1, W2, illetve például a W3 ablakokban szép szinkron működés tapasztalható. A
B
t2
t1
a, b,
c, d,
W1
C
W2
W3
D
a,
Membrán potenciál
b, c, d, t1
t2
t1
t2
Idő
51. Ábra Az inger két horizontálisan együtt mozgó hasáb volt (A,). B mutat egy pillanatképet a
szimulációból amikor a modellezett kérgi sejtek szinkron tüzelést mutattak. A sötétségi szint jelzi a sejtek depolarizációját. C és D ábrázolja négy különböző sejt időbeli válaszát az UPG, illetve a neuromorf akciós potenciál generáló modell esetén. A sejtek megfelelnek az A kép a, b, c, és d,-vel jelzett pontjainak.
- 79 -
Thalamo-kortikális szinkronizáció
5.4.4 4. Kísérlet
Ha az inger két egymással ellentétes irányban mozgó hasáb akkor azokat aligha tekinthetjük egy tárgy két részének. Így nem meglepő hogy a modell, a fiziológiai méréseknek megfelelően nem produkál szinkron működést. A 52. ábrán látható, hogy az ingerek a modellben nem okoztak szinkronizálódást, illetve azok csak az ingerek szeparált részeire terjedtek ki (W1,W2, illetve W3 és W4). t1
A
t2
B Két pillanata a modellezett kérgi réteg aktivitásának, amikor szinkronizáció fordult elő.
a, b,
c, d,
C
W1
D
W3
a, b, Membrán potenciál c, d, t1
W2
t2 Idő
t1
W4
t2
52. Ábra Az inger két horizontálisan egymással szemben mozgó hasáb volt (A,). Az ábra (B,) mutat két pillanatképet a szimulációból amikor a modellezett kérgi sejtek szubpopulációi szinkron tüzelést mutattak. A sötétségi szint jelzi a sejtek depolarizációját. Ugyan itt (C,) és (D,) ábrázolja négy különböző szimulált kérgi sejt időbeli válaszát az UPG, illetve a neuromorf akciós potenciál generáló modell esetén. A sejtek megfelelnek az inger (A,) a, b, c, és d,-vel jelzett pontjainak.
A lokálisan szinkron működés megőrződik még akkor is, ha van a sejtcsoport szomszédságában ideiglenesen egy aktív idegsejt populáció, de szinkron aktivitásának a fázisa különböző. Ha ez a térbeli szomszédosság hosszabb ideig tart akkor viszont van idő a szomszédos populációk aktivitásának az összerendezésére, a teljes szinkron működés kialakítására.
- 80 -
Thalamo-kortikális szinkronizáció
Azért hogy megmutassuk, hogy a fenti eredmények nem csak speciális kezdeti feltételekre, zajokra igazak, kiszámítottuk két sejtcsoportnak a három különböző ingerlésre kapott keresztkorrelációját. Az ábrán látható keresztkorrelogrammokon megfigyelhetőek fázis kötött oszcillációk az együtt mozgó ingerre, ingerekre, de hiányzik a szinkron működés amikor az inger két ellentétesen mozgó hasáb. Mindazonáltal meg kell jegyezni, hogy ritkán kialakult véletlenszerűen szinkron viselkedés a kezdeti feltételektől, illetve a hozzáadódó zajoktól függően.
Experiment 1.
Experiment 2.
Experiment 3.
A, Modellezett keresztkorrelációk
B, Mért keresztkorrelációk 53. Ábra Az átlagolt kereszt korrelogrammja a szimulált két kérgi sejtcsoportnak a különböző típusú ingerekre (A,) A mindenhol jelenlévő zaj ellenére is látható, hogy a kialakuló oszcilláció amplitúdója csökken amikor nem egy hanem két együtt mozgó hasáb az inger. A jobb összehasonlíthatóság kedvéért itt (B,) a fiziológiailag mért138 kereszt korrelogrammok is láthatóak.
A modell oszcillációjának frekvenciája 40 Hz körül volt, amennyiben a modellezett akciós potenciálok szélességét 1 milliszekundumnak tekintjük. Ez a frekvencia elsősorban a modellezett aktiváló posztszinaptikus potenciálok, illetve a gátló posztszinaptikus potenciálok időállandójától, időzítésétől függött. A modell nagyobb szinkronizációt mutatott mint az élettanilag mért értékek, ahol azt általában csak a keresztkorrelációk mérésével lehet kimutatni.
- 81 -
Thalamo-kortikális szinkronizáció
Az oka ennek az eltérésnek az, hogy a modellbe a meglévő kapcsolat mintázatoknak egy egyszerűsített verzióját építettük be és a biológiai rendszerekben jelenlévő zajoknak is csak egy töredékét tartalmazza. Tisztán látható, hogy a modellezett kérgi és a thalamikus sejtek egység aktivitása között korreláció van. A modellt többször futtatva, többféle kezdeti feltételekkel azt tapasztaltuk, hogy a kialakuló szinkronizáció keletkezésének nincs egy kizárólagos centruma, hanem inkább egy dinamikus működés volt amelynek a során a spontán módon megjelenő kicsiny korrelációk növekedtek jelentős méretű szinkron működéssé. A modell egységeinek szinkron viselkedéséhez alapvető szükséges volt közeli tér-időbeli elrendeződése az aktív elemeknek. Az eredményeink azt látszanak megerősíteni, hogy a szinkronizáció eme formájának kialakításához nem volt szükséges semmilyen kérgi összekapcsoltság, hiszen ez a modellből ki is volt hagyva. A szinkronizáció kialakulása ebben az esetben egy viszonylag lassú folyamat volt, de amikor kialakult akkor utána eléggé stabilnak mutatkozott a külső hatásokkal, perturbációkkal szemben. 5.5
Az eredmények vizsgálata és megvitatása Ebben a szimulációs vizsgálatban demonstráltuk, ahogy azt a korábbi elektrofiziológiai vizsgálatok is mutatták, hogy a kortiko-thalamikus visszacsatolás szinkronizálhatja azon dLGN sejtek aktivitását amelyeket olyan ingerek érnek amelyek egy egységes tárgyhoz tartoznak. Három különböző inger konfigurációt használva nagyon hasonló összefüggéseket találtunk a modellezett thalamikus ‘relay’ sejtek között, mint ami mérhető a modell elsődleges látókéregi sejtjei (Brodman 17) esetén, amelyeket a valóságban akár több milliméter távolság választ el egymástól. Más típusú kérgi szinkron viselkedések szimulációjához viszont szükségesnek látszik a kérgi kapcsolatrendszer, kérgi idegsejt hálózat pontos modellezése is. A szinkronizált thalamikus idegsejt aktivitás a thalamo-kortikális afferenseken keresztül eljut a látókéreghez, elsősorban az elsődleges területekre, de például macskánál a másodlagos területekre is. A modellünkben megvizsgáltuk milyen hatása van ennek a korrelált inputnak a célterület idegsejt populációjának az aktivitására. ‘In vivo’ intracelluláris elvezetésekkel erős, 40Hz körüli frekvenciájú membrán potenciál oszcillációkat találtak macskákon az elsődleges látókéreg területén139. Ezekről feltételezik, hogy keletkezésüket főleg egy ritmikus szinaptikus input szolgáltatja. Sok korábbi elektrofiziológiai vizsgálatnál140 találtak hasonló gamma oszcillációt mutató (30-70Hz) szinkron kérgi tüzelési aktivitást141. A legújabb elektrofiziológiai vizsgálatok arra mutatnak bizonyítékot, hogy az oszcilláló működés hozzájárulhat az egymástól távol eső területek között kialakuló szinkronizációkhoz. Sőt az idegi aktivitás szinkronizációjához, amikor a sejtcsoportok távolsága több mint 2 milliméter, vagy például a sejt populációk különböző féltekén helyezkednek el, akkor az mindig együtt jár oszcilláló idegsejt aktivitással is142. Ezek az eredmények azt is jelezhetik, hogy a szinkronizált thalamo-kortikális, feltételezhetően oszcilláló input kelthet korrelált kérgi aktivitást143. Ez egyetértésben van a modellünk szimulációs eredményeivel, amikor korrelált kérgi működést lehetett kiváltani a kotiko-thalamikus visszacsatolás által szinkronizálódó thalamikus inputra a kérgen belüli kapcsolatok elhagyása esetén is. Az azonos tárgyaknak a thalamikus időzítés kódolt címkézése sok előnnyel járhat a további információfeldolgozás szempontjából. Mivel a divergenciája a retino-thalamikus afferenseknek jóval kisebb mint a thalamo-kortikális kapcsolatoknak, így a tárgyak viszonylag kompakt és topografikusan rendezett reprezentációval rendelkeznek a dLGNben. Ha így van akkor a tárgyak dLGN-beli reprezentációja kitűnő hely a kép-szegmentáció, illetve a kép-háttér elválasztás első feldolgozási lépéseinek a megvalósítására. Természetesen
- 82 -
Thalamo-kortikális szinkronizáció
nem állíthatjuk, hogy a kérgi visszacsatolás által is előállítható, korrelált thalamikus input okozza elsősorban a mért kérgi szinkronizálódásokat. Ez tisztán látszik Sillito és csoportjának eredményeiből93, amikor nem találtak szinkronizálódást a különböző ’relay’ sejt típusok között (X, Y) amelyek eltérő szubmodalitások továbbításában (X alak, szín, forma; Y mozgás) játszanak szerepet. Ez azt jelenti, hogy az idegsejt válaszok összekapcsolása illetve szétválasztása a látórendszer különböző szintjein a képi információfeldolgozás szintjének megfelelő, és csak a felhasznált módszer, a kód, a szinkronizálódás azonos. Egyre nő azon bizonyítékoknak93-155 a száma ami azt mutatja, hogy együtt aktiválódnak azon sejt populációk amelyek részt vesznek egy tárgyhoz tartozó inger feldolgozásában, legyenek azok akár különböző helyen a hierarchikusan rendezett vizuális rendszerben. A korábbi elektrofiziológiai eredmények együtt ezen szimulációval azt mutatják, hogy a kortiko-thalamikus visszacsatoló kör, reciprok kapcsolataival ebből a szempontból is integráns részét képezi az óriási mértékben többszörösen összekötött, sokszintű vizuális rendszernek, amelyen belül a jelek integrálásában a szinkronizált, időben strukturált idegi aktivitás játszhat szerepet. Mindazonáltal további kísérleti eredmények szükségesek annak a bizonyítására vajon tényleg van-e valamilyen szerepe a kérgi szinkron működéseknek144 és a gamma frekvenciás oszcillációknak145 az információfeldolgozásban146, 147. Vannak adatok arra vonatkozóan, hogy ezek a folyamatok tényleg kapcsolódnak az érzékeléshez, részt vesznek a tárgyak percepciójában148, 149, de komoly aggályok is felmerültek azzal kapcsolatban vajon képesek-e a kérgi idegsejtek ilyen pontosságú működésre150, 151, 152, illetve van-e elég idő egy ilyen feldolgozásra. Felvetődött annak a lehetősége is, hogy a valóban megtalálható oszcillációk a kéreg alatti központok aktivitása kelti123, 114, 153, 154, 155 és nincs igazán közvetlen köze a kérgi információfeldolgozáshoz. A szinkronizációnak és a kérgi gamma oszcillációk szerepének a tisztázására ezért további kísérletekre van szükség.
- 83 -
Szinaptikus áttevődés dinamikája
6 A szinaptikus jel áttevődésének dinamikája és a Neurális Kód A legújabb eredmények fényében, amelyek közelebb hozták néhány már korábban is ismert jelenség megértését, új megvilágításba került az a kérdés: ”Vajon az idegsejtek hogyan kommunikálnak egymással?” új megvilágításba került. Ilyen jelenségek például két egymás utáni ingerre kapott szinaptikus válasz gyengülése (’paired pulse depression’, PPD)156, vagy erősödése (’paired pulse facilitation’, PPF)157, illetve az akciós potenciál frekvencia adaptáció. Tehát érdemes újra megvizsgálni melyek az idegsejtek számára valóban jelentéssel bíró jelek az idegrendszerben? Modellezve ezeket a jelenségeket kvalitatív becsléseket tehetünk arra nézve milyenek az idegsejtek input-output tulajdonságai. A modellünkben az idegi aktivitást kísérő két paraméter áttevődését vizsgáltukIII, VII, VIII: az aktivitás kiváltotta posztszinaptikus membrán áramok átlagát és a szórását. A hosszú távú megerősödésnek (Long Term Potentiation, LTP), illetve a gyengülésnek (Long Term Depression, LTD) a szinaptikus átvitel dinamikájára mért hatásai azt mutatják, hogy a posztszinaptikus áramok átlaga így a tüzelési frekvencia áttevődése sem felel meg a szinaptikus súlyok változásainak. Más ismert tények is, mint az agykéregre jellemző alacsony aktivitás és a piramis sejteken gyakran megfigyelhető akciós potenciál frekvencia adaptáció is arra enged következtetni, hogy az egyszerű frekvencia kód teljes általánosságban semmiképp sem felel meg a központi idegrendszer lassabb folyamatainak a modellezésére, mint ahogy azt sokszor feltételezik mesterséges neuronhálózatok esetén (ANN). Ám a másik megvizsgált paraméter a szinaptikus áramok szórása már sokkal jobban megfelel annak a feladatnak amit a frekvencia játszik a tipikus ANN modellekben. A keletkezését és működését is vizsgáltuk ennek az új kódnak 6.1
A probléma felvetése Érdekes és máig megoldatlan kérdése az idegtudománynak , hogy melyik az elsődleges kód az idegrendszerben158, 159. Csaknem bizonyos hogy nem létezik egy univerzális kód, mert az idegrendszerek különböző részei speciális eljárásokat, szabályokat alkalmazhatnak160. Mindazonáltal máig nyitott kérdés milyen kódokat használ az agykéreg161,162. Többféle elmélet van amely az idegi válaszok egyes tulajdonságait hangsúlyozzák ki. Az ANN modellek többségében azt teszik fel, hogy a kérgi sejtek tüzelési frekvenciája szállítja az információt az idegsejtek között163. Kísérleti eredmények is alátámasztani látszanak ezt az elképzelést, hiszen ez a változó ténylegesen és akár megjósolható módon változik megfelelő ingerlés hatására164, 165. Más modellek és kísérletek is azt feltételezik, hogy az idegsejt válaszok pontos időzítésének van szerepe az információk integrálásában az idegrendszeren belül15. Ez a fajta kódolás sokkal hatékonyabb lehet mint a ’robusztus’ frekvencia kód166, 167. Vita tárgya az vajon milyen biológiai megalapozottsága van ezen modelleknek és milyen sebességgel képes az idegrendszer ennek a felhasználására168,169. Felmerültek kétségek abból a szempontból vajon képesek-e az idegsejtek, néhány specializált struktúrától eltekintve170, 171, 172, ilyen óriási időbeli pontosság elérésére173, 174. Vannak azonban a frekvencia kód használatával kapcsolatban is problémák. Az agykéregben az idegsejtek háttéraktivitása viszonylag alacsony175 és az idegi aktivitás variációs koefficiense viszont magas176, 177, 178. A kérgi sejtek mindemellett jelentős tüzelési frekvencia adaptációt is mutatnak. Ezek a tények erősen csökkentik a frekvencia kód hatékonyságát, esetleg ki is zárhatják azt. Sokkal hosszabb időre van szükség az idegsejt aktivitásának megmérésére ha alacsony az aktivitási szint és ugyanakkor ennek nagy a szórása is177. Tovább ront a helyzeten ha ezalatt a hosszabb a méréshez szükséges időszak alatt még adaptálódik is a sejt tüzelési
- 84 -
Szinaptikus áttevődés dinamikája
frekvenciája. Aziránt nem nagyon van kétség, hogy a perifériás idegrendszerben a frekvencia kód lenne hatékonyan használva, de a központi idegrendszerben, főleg annak is a magasabb rendű területein már nem látszik egyértelműnek és általánosnak a szerepe. Vannak arra nézve kísérleti eredmények, hogy a kérgi idegsejtek három tizedes jegyig bezárólag azonos átlagos serkentő posztszinaptikus potenciálokat (EPSP) kapnak 10Hz és 40Hz-es Poisson eloszlású akciós potenciál sorozatokra179. Ugyanakkor jelentős méretű csökkenés tapasztalható a membránpotenciál változékonyságában ahogy az inger frekvenciája nő. Kísérletek mindeddig nem tudtak végső ítéletet hozni az agykéregben előforduló kódról. Ezért itt egy indirekt módszert választottunk, amely felhasználja a legújabb kísérleti eredményeket amelyek meghatározták milyen dinamikus változások követik a szinaptikus átvitelt illetve milyenek a szinaptikus módosulási szabályok vannak180, 181, 182. Az idegi jeltovábbítást ezen adatok fényében vizsgáltuk meg. 6.2
Biológiai alapok Régóta ismert tény az hogy a neurotranszmitter felszabadulás egy véletlent is magába foglaló folyamat183. Megfelelően alacsony gyakoriságú preszinaptikus ingerlésre a posztszinaptikus sejten a kiváltott EPSP-k azonos amplitúdójúak184, de a megjelenésük esetleges, csak valamilyen valószínűséggel adható meg. Meglepő módon az ingerlés kiváltotta szinaptikus módosulások mint az LTP vagy az LTD is, amelyeket a neuronhálózatok és az idegrendszerben a jelenlévő tanulási folyamatok prototípusának tartanak, nem az EPSP-k amplitúdója változik meg, például a kapcsolatok száma nő meg, hanem inkább az átvitel és így az EPSP megjelenésének a valószínűsége185. Van egy másik alapvető és érdekes tulajdonsága az idegi jelátvitelnek: Nagyobb preszinaptikus ingerlési gyakoriságnál, amely még mindig viszonylag alacsony a lehetséges maximális tüzelési frekvenciához képest, az egymást követő posztszinaptikusan kiváltott EPSP-k átlagos amplitúdója jelentős mértékben csökken amíg el nem ér egy statikus szintet182. LTP-re (illetve LTD-re) ennek csak a kezdeti értéke és a csökkenés sebessége változik meg a statikus érték változatlan marad. Ezt a fajta furcsa viselkedést nevezték a szerzők a szinaptikus erősség dinamikus újraelosztásának. Természetesen ha a kiváltott válaszok időben közel vannak egymáshoz akkor hatásuk integrálódik. Ekkor az egyik kiváltott EPSP erősítheti a másik hatását. Ezek mögött a bonyolultnak látszó jelenségek mögött viszonylag „egyszerű” folyamatok húzódnak meg. Például a véletlenszerű traszmitter kibocsátást az okozhatja, hogy a beérkező akciós potenciál csak egy bizonyos mértékű kalcium szint emelkedést okoz a preszinaptikus végződésben186 ami a jelenlévő ingerület átvivő anyag kibocsátásához nem elegendő, illetve nagyobb szinapszis esetén csak a vezikulák, a szinaptikus hólyagocskák egy részének az ürülését eredményezi. A PPD kialakulásában valószínűleg a rendelkezésre álló készletek kimerülése játszik szerepet187. A kísérleti adatok azt látszanak bizonyítani, hogy a kimerülési folyamatok a preszinaptikus oldalra lokalizáltak186, 187, 188. Korábban voltak adatok amelyek azt mutatták, hogy a szinapszis mind a két oldala felelőssé tehető189, 190, 191. A szinaptikus transzmitter kibocsátás binomiális modellje192, így már jól leírja a szinaptikus hatékonyság újraelosztásával jellemzett mért jelenségeket, folyamatokat. A PPF a piramissejtekben általában csak egy bizonyos membránpotenciál érték felett jelenik meg és valószínűleg kötött az NMDA csatornákhoz193. Egy másik típusú PPF gyakran tapasztalható a kérgi interneuronok között156, bár ekkor valószínűleg egy más fajta folyamat játszhat szerepet amikor az egymást követő akciós potenciálok megnövelik a szinaptikus végződésben a kalcium ion koncentrációját és így emelik meg a jeláttevődés valószínűségét.
- 85 -
Szinaptikus áttevődés dinamikája
Bár igen nagy az irodalma a lehetséges tüzelési frekvencia adaptációt okozó folyamatoknak és igen sok részlet ismert194195 itt mi egy egyszerűsített modelljét használtuk. Az egyik mechanizmus az lehet, hogy a kiváltott akciós potenciál hatására, a megfelelő depolarizációra megnő a sejten belüli kalcium koncentráció. Ez a megnövekedett szint segíti a kalcium függő lassú kálium csatornák kinyílását és ez az áram okozza a sejt tüzelésének a hosszabb időszakra vonatkozó gátlását. Az LTP és LTD kialakulását mind térben196, mind időben pontosan behatárolják az előállításában résztvevő fiziológiai folyamatok. Az LTP, illetve az LTD kialakulását is a posztszinaptikusan kiváltott kalcium koncentrációk determinálják, de a küszöb pontos meghatározását a metaplaszticitással197, 198 jellemzett jelenségek írják le, amelyek szerint a szinapszis korábbi működése alapján definiálja a változás irányát. 6.3
Az alkalmazott modell Elkészítettük a fenomenológikus modelljeit az adaptációval, illetve a szinaptikus áttevődés hatékonyságának újraelosztásaként jellemzett folyamatoknak. Az akciós potenciálok keletkezésének részletes folyamatait nem építettük be a modellbe, mivel célunk akciós potenciál sorozatok szinaptikus áttevődésének a vizsgálata volt. Ezekről a folyamatokról, illetve az akciós potenciálok terjedéséről igen sokat tudnak és részletes modellvizsgálatok vannak, amelyekhez akár már meglévő software csomagokat199 is fel lehet használni. Sem az akciós potenciálok pontos alakja és időbeli lefutása, sem az EPSP-k dendritikus terjedése nem elsődlegesen fontos a vizsgált feladat szempontjából és csak további komplikációkat okozna, ha egy speciális sejtre jellemző ioncsatorna paraméterezést használnánk, ezért ezek pontos leírásától eltekintettünk. Így olyan fontos jelenségek vizsgálata is kívül esik a modell lehetőségein mint az idegsejtek börsztös tüzelése, a pacemaker aktivitás, illetve még a gátló idegsejtek hatása sejtek válaszára. Remélhetőleg azért a biológiailag fontos jelenségek egy igen széles körét megmagyarázhatjuk ezen jelenségek modellezése nélkül is.
6.4
A szinaptikus erősségek dinamikus újraszerveződése Vannak igen szépen működő modellek a szinaptikus erősségek dinamikus redisztribúciójára, újraszerveződésére200. Ezek a modellek azonban csak a szinaptikus erősség átlagos értékével számolnak. Mivel mi itt a szórását is ki akarjuk számolni a kiváltott membránáramoknak, ezért a szinaptikus transzmitter felszabadulásnak egy binomiális modelljét alkalmazzuk183. * RS i, n = RS − RS ⋅ a ; i, n i, n i ahol a = 1 PR valószínűaéggel egyébként a = 0; i i * * RS = RS i, n + (1 − RS i, n ) ⋅ x ; i, n + 1 i ISI )) valószínűséggel egyébként x = 0; ahol x = 1 (1 − exp(− i i Trec S = eff, n
NN i =1
* (RS − RS i, n ); i, n
( 45 )
- 86 -
Szinaptikus áttevődés dinamikája
Az RSi változó megfelel az i-edik felszabadulási helynek. Ezen helyek száma a modellben NN. Ha ez a felszabadulási hely aktív, fel van töltve ingerületátvivő anyagot tartalmazó hólyagocskával, akkor egy beérkező akciós potenciálra valamilyen (PR) valószínűséggel fel tud szabadítani egységnyi mennyiségű transzmittert. Az ürítés után, amely egy igen összetett folyamat és nem egy egyszerű exocitózis, hanem egy speciális szinaptikus apparátust feltételez, melyet többek között a szinaptikus végződésben kialakuló kalcium szintek szabályoznak, a felszabadulási hely inaktívvá válik (RSi=0) és az újratöltődése megint valamilyen véges valószínűséggel történik. A paraméterek amelyek az újra aktiválódást jellemzik a Trec és az ISI, megfelelnek az aktiválódás, feltöltődés időállandójának, illetve a beérkező akciós potenciálok között eltelt időnek. Az egy adott pillanatban mérhető átlagos szinaptikus erősség függ az áttevődés valószínűségétől és természetesen az aktív felszabadulási helyek számától201, 202. Az n index a beérkező akciós potenciálokat jelöli. A választott paraméterértékek a megfelelő ábrázoláshoz és a mért kísérleti értékekhez való jó közelítéshez (NN=20) (203NN>10) voltak illesztve. A feltöltődési időállandó paraméterértéke (Trec=.001), azért volt ilyen alacsonyra beállítva, mert kísérletileg is ilyen lassú (vagy még ennél is lassabb) szinaptikus reaktiváció értékeket találták. Ezzel az egyszerű iterációval elérhető, hogy alacsony ingerlési frekvenciánál a szinapszis átlagos erőssége eléri a NN*PR értéket és így a kiváltott posztszinaptikus áramok is a maximális értékükhöz tartanak. Az LTP, illetve az LTD úgy tekinthető mint a Pr valószínűségi paraméter változása (Pr=0.3-0.9). Vannak adatok arra vonatkozóan204 is, hogy ez a valószínűség hőmérséklet függő és fiziológiai körülmények között talán a nagyobb értékek valósulnak meg.
ISI=20
ISI=30
ISI=60
PR=.5
PR=.7
PR=.9
NN=20
54. Ábra Akciós potenciálok sorozata átlagosan egyre kisebb amplitúdójú EPSP-t generál amíg el nem ér egy statikus szintet, amely függ az akciós potenciálok közötti időtől (ISI). A jel áttevődésének valószínűsége (PR) meghatározza a kezdeti amplitúdót és a csökkenés sebességét is a kiváltott EPSP sorozatban. (Az EPSP-k generálásának további részleteit a következő fejezetben tárgyaljuk (6.4) )
A modell több mért eredményt képes reprodukálni: A modellezett EPSP-knek nincsen előre meghatározott méretű amplitúdója, hanem mindig függ a sejt korábbi aktivitásától és a véletlentől
- 87 -
Szinaptikus áttevődés dinamikája
is. Egy sorozata az akciós potenciáloknak kivált egy sorozat EPSP-t. Az egy sorozatban egymást követő EPSP-k átlagosan egyre csökkennek egy bizonyos statikus értékig, ami az ingerlés frekvenciájától függ. A szinaptikus áttevődés valószínűsége, az LTP (LTD) foka, azt befolyásolja milyen sebességű a sorozatingerlésen belül az átlag amplitúdó csökkenés. Ennek a viselkedésnek igen komoly hatással kell lennie a jelátvitelre az idegsejtek között. Azért hogy ezt a hatást tanulmányozhassuk megvizsgáltuk milyenek a kiváltott posztszinaptikus membrán áramok az ingerlő akciós potenciál sorozat paramétereitől függően. Az átviteli valószínűségi paraméter (Pr, LTP - LTD) megváltozására a modell nem mutatott komoly változást a függvény alakjában hanem csak a kimenet amplitúdója változott. Komolyan befolyásolja viszont a függvény tulajdonságait a bementen alkalmazott akciós potenciál intervallum eloszlása. Ennek szerepe lehet a jeltovábbításban is. Szükségünk volt továbbá a kimenet és a bemenet összehasonlíthatóságra is. Így szimuláltuk az idegsejt preszinaptikus áramait (hasonló módon a kimeneti áramokat is) és ennek a segítségével generáltunk egy akciós potenciál sorozatot a megfelelő bemenet biztosításához. Ekkor már összehasonlíthatóak a sejt bemenő membrán áramai és a kimenetén posztszinaptikusan modellezett membrán áramok statisztikai paraméterei. 6.5
Az idegsejtek tüzelési frekvencia adaptációjának a modellezése. Konstruáltunk egy olyan idegsejt modellt amely integrálj és tüzel eljárással generálja az akciós potenciálokat és képes a tüzelési frekvenciájában adaptálódni a bemenő ingerhez. A bement normális eloszlású véletlen változót választottunk. Ez akart a modellben megfelelni a sejthez érkező, ingerlő a szinaptikus erősségekkel súlyozott akciós potenciáloknak. A normális eloszlást a központi határeloszlás tétel igazolja, hiszen a sejtre konvergáló szinapszisok száma igen nagy, és még kis aktivitás esetén is több bemenet egyidejű ingerlése szükséges. Itt feltettük, hogy a bemenetek nem korrelált módon tüzelnek. Ellenkező esetben további feltételezéseket kéne tenni a használt neurális kódról illetve, az annak generálására szolgáló idegsejt hálózatról. A szinaptikus áramok modellezésére a jól ismert alfa függvényt használtuk. A megfelelő lineáris differenciál egyenletek helyett a továbbiakban a következő differencia egyenleteket alkalmaztuk. Erre azért volt szükség mivel abban a pillanatban amikor egy nemlineáris folyamatot is beépítünk a rendszerbe, például akciós potenciál generálás egy bizonyos küszöb felhasználásával, akkor az analitikus tárgyalás szinte lehetetlenné válik.
ITrn+1
= a*ITrn
+Inp
ICu n+1
= b*ICun
+Itrn
( 46 )
AHC n+1 = c*AHCn +AIC Un+1 = d*Un +ICun -AHCn (Ahol: a = 0.9; b = 0.9; c = 0.9995; d = 0.4; AIC = 0.3; Inp := Input: Normális eloszlás (meghatározott átlaggal és szórással);) Itt az ITr változó a sejtet preszinaptikusan elérő összegzett transmitter mennyiséget jellemzi. Az ICu változó pedig az ITr által keltett összes szinaptikus áramnak felel meg. U-val jelöltük a modellezett idegsejt feszültségét, n index pedig az egymást követő időlépéseket jellemzi. A beérkező ingerületátvivő anyagok, transzmitterek ioncsatornákat nyitnak ki, (közvetlen, illetve közvetett úton). Az ezeken a csatornákon átfolyó áramok pedig a sejt feszültségét befolyásolják. Ha ez a feszültség meghalad egy bizonyos küszöbértéket (Θ=5 esetünkben) akkor egy akciós potenciál generálódik és evvel egy időben egy lassú gátló áram AHC is keletkezik amely biztosítja az tüzelési frekvencia adaptációt. A modellben igazából egy további gyors lecsengésű
- 88 -
Szinaptikus áttevődés dinamikája
gátló áramot használtunk a feszültség időleges csökkentésére, azaz ahhoz hogy egy serkentő folyamat ne okozzon állandó tüzelést. (Ez az áram megfelelhet az akciós potenciálok lefolyásában olyan fontos szerepet játszó kálium áramnak). Az AHC időállandója megfelelően lassúra volt állítva a modellben a többi folyamat időállandójához képest. Az amplitúdója is alacsony értékűnek volt véve azért hogy az adaptációs folyamat amelyet modellezett megfelelően lassan menjen végbe. Így képesek voltunk a tüzelési frekvencia adaptációnak egy leegyszerűsített modelljét adni. Ennek a jelenségnek a hatásmechanizmusa különböző lehet az eltérő idegrendszerekben, de ezeknek az összehasonlítása, vagy akár az osztályozása is túlmutat ezen dolgozat keretein. A felhasznált küszöbérték egy lehetőleg alacsony értékre állítottuk be azért, hogy így biztosítva legyen a modellezett idegsejtek magas érzékenységi szintje. Azt feltételeztük, hogy az idegsejtek viselkedését még alacsony aktivitásnál is jelentősen befolyásolják az adaptációval járó folyamatok. Ezek folyamatok megnövelhetik az idegsejt válaszának dinamikus tartományát. Itt a lokálisan kialakuló EPSP-knek az axon-dombig való passzív terjedésekor történő amplitúdó csökkenést a szinaptikus súlyokban, az időbeni szétterjedését pedig az időállandókban vettük figyelembe205. Ahhoz hogy megfelelő kimeneti változókhoz jussunk modelleztük kiváltott akciós potenciál sorozatra a sejt által beidegzett hasonló sejten keletkező posztszinaptikus áramokat. OTrn+1 = a*OTrn
+Samp
OCun+1 = b*OCun
+OTrn
( 47 )
(Az itt használt paraméterek ugyanazok mint ( 46 ) ) Itt az OTR változó megfelel a sejttől posztszinaptikusan felszabaduló transzmitter mennyiségnek. Samp jellemzi az egy akciós potenciálra felszabaduló ingerületátvivő anyag mennyiségét. Végül OCU megfelel a transzmitter által a posztszinaptikus sejten keletkező ionáramoknak. Egy kibocsátott akciós potenciál transzmitter felszabaduláshoz vezet a preszinaptikus sejten. Az éppen abban a pillanatban kibocsátott transzmitter mennyiséget (Samp) a sejt előélete, a korábbi kibocsátás befolyásolja206. A felhasznált paraméter értékek ugyan azok voltak, mint amelyeket a preszinaptikus folyamatoknál használtunk és végül is a mérésekből származó EPSC adatokkal való jó kvalitatív egyezéshez lettek beállítva. 6.6
A modellezett kérgi piramis sejtek input-output tulajdonságai Rendelkezve egy modellel amely szimulálja az akciós potenciál sorozat keletkezését, illetve egy másikkal amely viszont a szinaptikus erősségek redisztribúcióját írja le, elkészíthetjük ezeknek a modelleknek kompozícióját is. Csak az idegi aktivitás két paraméterének az átvitelét vizsgáltuk meg a szimulált idegsejtek között. Az egyik a szinaptikus áramok átlaga a másik pedig a szórása. Amennyiben a központi határeloszlás tétel alkalmazható az idegsejt bemeneteinek a jellemzésére, az ismerten nagymérvű konvergencia miatt ez igaznak tűnik, akkor ez a két paraméter teljes mértékben leírja, hűségesen jellemzi az idegsejt bementének statisztikai tulajdonságait. Azért hogy összehasonlíthassuk a bementi és kimeneti paramétereket, ezért a bemeneti paraméterek által keltett akciós potenciál sorozatra keletkező posztszinaptikus áramok paramétereit is kiszámítottuk. Azért csak a szinaptikus membrán áramokat hasonlítottuk össze, mert az akciós potenciálok még nem jellemzik egyértelműen a szinaptikus áttevődés valódi mértékét, viszont a membrán
- 89 -
Szinaptikus áttevődés dinamikája
potenciálváltozásaiban más áramok is jelentős szerepet kaphatnak, mint például az adaptációban szerepet játszó utó-hiperpolarizációs áramok. Ezen a módon a szimulált idegsejtek jelátviteli tulajdonságai jellemezhetőek. A felhasznált küszöbérték biztosítja, hogy a vizsgált teljes tartományban a modellezett idegsejt aktív marad. Megállapítható, hogy a kimeneten (posztszinaptikusan) mérhető áramok átlaga szinte arányosnak tekinthető bementi áramok átlagával. Elhanyagolhatóan kicsi az átlagos kimeneti áram függése a bemeneti áram szórásától. A kimenti áramok szórása viszont jelentősen függ mind a bemenet átlagától, mind a szórásától. Mivel a kimeneti áram variációs koefficiense elég magas ezért az áram átlagának a pontos meghatározása igen nehéz feladatnak tűnik az idegrendszeren belül177. A szimulált idegsejt aktivitás az alábbi ábrán látható.
55. Ábra Az adaptációnak és a szinaptikus hatékonyság újraeloszlásának a hatása a kiváltott posztszinaptikus potenciálra. Az alsó vonal a preszinaptikus membrán potenciálját mutatja az akciós potenciálokkal, míg a felső pedig a hatására létrejövő posztszinaptikus választ jeleníti meg.
Tisztán megfigyelhető mind a tüzelési frekvencia adaptáció, mind a véletlenszerű transzmitter felszabadulással együtt járó jelenségek is. Megállapítható még a szinaptikus válasz amplitúdójának fokozatos csökkenése a az ingersorozaton belül. Az egymáshoz időben közel eső EPSC-k összegződése is jól látható. A modellezett idegsejt átviteli függvényét az 56. ábrán láthatjuk.
- 90 -
Szinaptikus áttevődés dinamikája
56. Ábra A preszinaptikus modell neuron által kiváltott posztszinaptikus áramok átlaga (A) és szórása (B) a preszinaptikus áramok átlagának és szórásának a függvényében.
Majdnem lineáris kapcsolat állapítható meg a bemeneti és a kimeneti áramok átlaga között. Az átlagos kimeneti áram együtt növekszik az áttevődés valószínűségét jellemző Pr paraméterrel (LTP), mint az várható is volt! A meglepő tulajdonsága az átviteli függvénynek az, hogy nem tapasztalható az átlag átviteli függvény meredekségének az emelkedése a szinaptikus valószínűségének az emelésére (Pr; LTP). Csak egy eltolódás látható minden bemeneti átlagos áramértéknél, pedig a legalacsonyabb szimulált tüzelési frekvencia szint 3Hz volt ami megközelíti (alulról) az átlagos háttéraktivitást207. Ilyen alacsony ingerlési szintnél általában már akár az LTD kialakulásához vezető folyamatok is megkezdődhetnek. Tehát ez azt jelenti, hogy a változás a szinaptikus
- 91 -
Szinaptikus áttevődés dinamikája
áttevődésben az áramok átlagát tekintve nem tekinthető a szinaptikus súlyok megváltozásának, hanem inkább csak egy küszöb szint emelkedésnek felelnek meg. Ezt a furcsa eredményt az alábbi, 57. ábrán vizsgálhatjuk meg részletesebben.
57. Ábra Az átlagolt posztszinaptikus áram a bemenő áram átlagának és az átvitel valószínűségének a függvényében.
Arra a konklúzióra juthatunk, hogy a vizsgált tartományon belül a jel áttevődésének valószínűsége nem eredményezi az átlag átviteli függvényében a gradiens emelkedését, sőt inkább egy fordított folyamat látható, szemben az előzetes elvárásokkal. A másik mért paraméter érték a szórás viszont éppen ellentétes módon viselkedik. A lenti ábrán (58. Ábra) ennek a változónak az átvitelét ábrázoltuk a különböző átviteli valószínűségi értékek (Pr, LTP-LTD) függvényében. A bemeneti átlagos áramértéket itt egy meghatározott köztes értéken tartottuk (Átlag(Inp) = 6).
58. Ábra A posztszinaptikus áramok szórásának a függése a bemeneti áramok szórásától, illetve az átvitel valószínűségétől (Pr).
Látható, hogy ennek a paraméternek a dinamikus változás tartománya együtt nő az átvitel valószínűségével (LTP). Ez a tulajdonság azt jelezheti, hogy e paraméternek az áttevődése hasonló módon zajlik, mint amelyeket a mesterséges neuronhálózat modellekben a szinaptikus
- 92 -
Szinaptikus áttevődés dinamikája
súlyokkal jellemeznek. Tehát az átviteli valószínűség növekedése a membrán szinaptikus áram szórás átvitelének az emelkedéséhez vezet. Metaforikus értelemben tekinthetjük ezt az emelkedést egyfajta „szinaptikus súly” változásnak is. 6.7
Konklúziók és megbeszélés A tüzelési frekvenciának mint neurális kódnak komoly határai vannak (lásd a bevezetést). A mi eredményeink további kétségeket keltenek abban az irányban vajon tényleg használható ez a fajta kódolás a kérgi információfeldolgozásban. Mivel a hosszú távú szinaptikus módosulási folyamatok nem vezetnek e kód szerinti szinaptikus súly növekedéshez, hanem csak valamilyen mértékű küszöbeltolódáshoz. Két lehetséges konzekvencia vonható le: • Az LTP (LTD) folyamatai nem változtatják meg a szinaptikus súlyokat, hanem valamilyen más mechanizmus gondoskodik erről. Ez esetben az LTP nem jó modellje a kérgi tanulásnak! • A tüzelési frekvencia mint neurális kód, csak egy bizonyos időtartományon belül hatékony az agykérgen belül, vagy egészen más a viselkedése, működése mint amit a neuronhálózat modellekben általában feltételeznek róla. A fenti konklúziók nem állják meg a helyüket azokkal az elméletileg felvetett kódokkal szemben ahol az akciós potenciál sorozat finom időbeli szerkezete szállítaná az információt az idegsejtek között. A idegi jelátvitel valószínűségi jellege, illetve az LTP kiváltásának pontos időzítési feltételei viszont 208, 209, 210 ezeknek a kódoknak a plauzibilitását csökkentik. A másik általunk vizsgált paraméter a szinaptikus áramok szórása viszont szintén szállíthat információt a kérgi idegsejtek között és akár egyfajta új neurális kódnak is tekinthető. Az értéke legalább ugyan olyan pontosan meghatározott, mint az átlagos szinaptikus áram. És ahogy fentebb említettük az átvitelének a meredeksége a szinaptikus súlyoknak megfelelő módon változik LTP, illetve LTD hatására. Ahhoz hogy ezt igazán egy neurális kódnak tekinthessük meg kell mutatni a periférián használatos frekvencia kódról erre a kódra való átkódolás lehetséges mechanizmusát, a kódnak a használatát az idegsejtek közötti kommunikációban, illetve erről a kódról a frekvencia kódra való visszakódolás lehetőségét. Mindezekhez természetesen egyszerű folyamatokat kell felhasználni amelyeket akár idegsejtek is meg tudnak valósítani. Eredményeink megerősíteni látszik azt a nézetet hogy az általunk modellezett idegsejtek képesek ezekre a kódolási lépésekre. Hozzávetőlegesen lineáris összefüggés van a bemenő átlagos áram és a kimenő áram szórása között bármely átviteli valószínűségi értéknél. Azaz minél magasabb a bementi áramok átlaga annál alacsonyabb lesz a kimeneten mérhető szórás. Vannak mérési eredmények is amelyek alátámasztani látszanak ezt a fajta konverziós mechanizmust179. További műveletek végezhetőek ezen a kódon ugyanúgy ahogy azokat a mesterséges neuronhálózati modellekben teszik, hiszen hasonló szabályokat alkalmaznak a változók átvitelére. A visszakódolás a szórás kódról a frekvencia kódra több különböző módon is megvalósítható. Például a PPF-el (paired pulse facilitation) jellemzett folyamat meg tud oldani egy ilyen dekódolást. Egy olyan idegsejt amelyiknek igen magas a membrán áramainak a változékonysága és így a tüzelési frekvenciájának a varianciája, sokkal nagyobb átlagos EPSC szintet tud előállítani mint amelyet egy szabályosabban tüzelő idegsejt, ha PPF mutat. Meglepő módon éppen ez a helyzet a kéreg mélyebb rétegeiben lévő piramis sejteknél211. A szórás mérése egyes esetekben sokkal pontosabb is lehet mint az átlagnak a mérése függően a változó aktuális eloszlásától. Ennek a kódnak az érzékenysége különböző fajta zajokra és terjedési bizonytalanságokkal szemben kicsi, hála a speciális meghatározottságának.
- 93 -
Szinaptikus áttevődés dinamikája
Megvizsgálták neuro-modulátorok212, mint például acetilkolin179, 213 hatását is az idegi áttevődés valószínűségére. Azt találták, hogy képesek csökkenteni azt (LTD) és így neuromodulátorokkal meg lehet változtatni az egész idegsejt hálózat dinamikáját. Ahhoz hogy adekvát módon tudjuk szimulálni az agyi folyamatokat többek között arra van szükség, hogy olyan modelleket tudjunk építeni amelyek akár időben távoli események között is asszociációkat tudnak kelteni. Nyilvánvaló, hogy valamilyen aktivitásnak jelen kell maradnia minden előhívási feladat után. Ez a maradék aktivitás segíthet kiépíteni a szükséges asszociációkat a tranziens agyi események között. Ez azonban nem lehet a tüzelési frekvenciában kódolva, hiszen nem tapasztalható hosszú távon (órák) jelentősen megemelkedett idegi aktivitás és ha lenne is ilyen azt lerombolná az adaptáció. Felhasználható viszont a szórás ezen aktivitás kódolására, hiszen ekkor nincs szükség megemelkedett kérgi aktivitásra hosszabb távon. Annak a pontos meghatározásához hogy milyen kódot használ valójában az idegrendszer kísérleti módszerek szükségesek természetesen. Elméleti meggondolások viszont segíthetnek a kísérletek megtervezésében, illetve abban melyek a megmérendő, ellenőrizendő idegsejt paraméterek. Születtek új érdekes elméleti eredmények214, 215, 216, amelyek a szinaptikus áttevődés fenti dinamikus voltát modellezték, illetve próbálták felhasználni újfajta idegi számítási feladatokban.
- 94 C
Köszönetnyilvánítás
D
7 Köszönetnyilvánítás A fenti dolgozat eredményei úgy születhettek meg, hogy 1989-től, az egyetem befejezésétől, 1998-ig a SOTE anatómiai intézetéhez csatoltan, az Akadémia SOTE Egyesített Kutatási Szervezete keretében működő, a Hámori József professzor úr vezette Neurobiológiai kutató laboratóriumban dolgozhattam, témavezetőm Dr. Lábos Elemér irányítása mellett. Köszönet illeti a jelenlegi munkahelyemet is a Számítástechnikai és Automatizálási Kutató Intézetet és azon belül is a Roska Tamás professzor úr vezette Analogikai és Neurális Számítások nevű kutató laboratóriumot, ahol a disszertációmat készítettem és amellyel korábban is szoros munkakapcsolatban álltam. Szeretnék köszönetet mondani az Eötvös Loránd Tudomány Egyetemnek és azon belül is az Ádám György vezetése alatt működő ‘A viselkedés neurobiológiája’ című programban résztvevő oktatóknak, ahol sok friss neurobiológiai ismeretre tehettem szert. Különösen nagy hálával tartozom témavezetőmnek Dr. Lábos Elemérnek az elméleti és gyakorlati neurobiológiába való bevezetésért és azért a sok szakmai és egyéb jó tanácsért, amit az évek során kaptam tőle. Meg kell említenem azt az értékrendet és tudományos kutatói hozzáállást, amelyet remélem sikerült ellesnem tőle. Ez a dolgozat nem jöhetett volna létre a segítsége és támogatása nélkül. Szeretnék köszönetet mondani még Hámori József professzor úrnak, aki lehetővé tette hogy a laboratóriumában dolgozhassak és ott sok neuromorfológiai ismeretre tegyek szert a retina, a thalamusz, valamint az agykéreg tekintetében. Köszönettel tartozom Roska Tamás professzor úrnak, akinek a segítségével megismerkedtem a celluláris neurális hálózatok működésével és felhasználásának lehetőségeivel, mely ismereteket a disszertációban sokszor alkalmaztam is. Itt köszönném meg mind a Neurobiológiai mind az Analogikai labor dolgozóinak a segítségét akik több témában is konkrétan hozzájárultak az eredményekhez, illetve az általam használt programok többségét elkészítették. Hálámat kell még kifejeznem Frank Werblin professzor úrnak, azért mert Berkeleyben a laboratóriumában 1992 évben elmélyedhettem a retina elektrofiziológiájában és megtanulhattam egy receptív mező térképezési és mérési technikát, valamint megismerkedhettem a modern elektrofiziológia mérési módszereivel is.
- 95 -
Doktori Disszertáció Tézisei
8 A doktori disszertáció tézisei 8.1
Bevezetés
A disszertáció első felében az agyba bejutó információ előfeldolgozását vizsgáltam. Speciálisan azt, hogy milyennek kell lennie a belső reprezentációnak ahhoz, hogy azt a későbbiekben jól tudják a magasabb rendű agykérgi központok használni, vagy tárolni. Sok vizsgálat foglalkozik a látórendszerben kimutatható receptív mezők szerkezetével és azok kialakulásával [Atick, 1992], illetve azzal hogy milyen szempontok szerint hatékonyak ezek [Olshausen 1996, 1997]. Lényeges szempont a belső reprezentáció szempontjából, hogy a hiba amely vagy már eredetileg is megvan a beérkező képen és amelyet az asszociatív tárakból való előhívás, illetve a további feldolgozás során kell kijavítani, vagy a jelek percepciója és az ingerület szállítása során kerül be a rendszerbe minimális maradjon. Ne felejtsük el itt, hogy jelentős távolságot kell megtennie a receptorok által felfogott jelnek az agykéregig és az idegi jeltovábbítás igen zajos is lehet. Célom az volt, hogy körülhatároljam milyen mintákat lehet igen nagy számban eltárolni egy ideghálózat alapú asszociatív memóriában, illetve hogyan lehet tetszőleges mintázatokat ilyen alakra hozni valamilyen egyszerű, idegsejtek által is végrehajtható neurális algoritmussal. Ez a feladat gyakorlati alkalmazások szempontjából is fontos lehet. A továbbiakban az élő rendszerekben előforduló előfeldolgozási lépések vizsgálatával akartam pontosabb képet kapni arról, hogy milyen belső ábrázolást használ az idegrendszer. A mérések néha azt sugallják, hogy nem is csinál mást csak egyre kifinomultabb módon ábrázolja, újra reprezentálja a bemenő adatokat… Az egyik legjobban feltérképezett, szó szerint feltérképezett, terület az idegrendszeren belül a látórendszer. Az elsődleges látókéregig egészen pontos, és talán teljes receptív mező leírásokkal rendelkezünk. Ezen tér-időbeli receptív mezők modelljét akartam megadni és elemezni. Ezeknek a kezdeti információ feldolgozási lépések egy része jól modellezhető [DeAngelis, 1994] a celluláris neurális hálózatok (CNN) segítségével is [Roska et. al., 1993]. Ezek olyan nemlineáris, analóg, általában kétdimenziós processzortömbök, amelyek elemei, sejtjei csak lokálisan vannak összekötve és így lehetőség van egy szilícium darabon igen sok sejt megvalósítására, beépítésére. Mivel a szerkezete nagyon hasonlít néhány lokálisan kapcsolt struktúrához (neuromorf) [Werblin, 1997], így például a retinához is, ezért komoly munkák folynak a retinális folyamatok pontos CNN modelljének elkészítésére [Werblin, 1995]. Felmerült egy retina modellen alapuló szemprotézis megépítésének a lehetősége is. Én itt a fiziológiailag hűséges retinális folyamatok CNN modellje helyett a látórendszer különböző sejtjeinek egy fenomenológikus tér-időbeli receptív mező leírását adom meg. Ez sok szempontból túlzott egyszerűsítésnek tűnhet, de mivel csak a zaj terjedésének vizsgálata, illetve a bonyolult receptív mezőknek az egyszerűekből való előállíthatóságának a bizonyítása volt a célom, így ezeket ilyen szempontból elégségesnek tartom. Egy esetleges gyakorlati alkalmazás esetén is célszerű a hálózat viselkedésének lényegét még megőrző, szimpla modellek használata. A disszertáció második felében az agykérgen belüli információ továbbítást, a lehetséges neurális kódot, kódokat vizsgáltam.
- 96 -
Doktori Disszertáció Tézisei
Az irodalomban felvetődött, hogy az agykérgen belül a felismert tárgyak különböző helyeken reprezentált részletei úgy vannak integrálva (‘binding problem’) [Singer, 1993], hogy a reprezentációban résztvevő sejtek tüzelése milliszekundumos pontossággal szinkronizált. Ha ez az elképzelés beigazolódna, akkor az nagy mértékben segítené az agyi információfeldolgozás megértését. Sajnos ezen szinkronizáció kialakulásának magyarázatára is csak modellek vannak és a szerepét egyértelműen tisztázó, perdöntő kísérleti bizonyíték még várat magára. Kevés ismert fiziológiai mechanizmus támasztja alá működését. A kortiko-thalamikus visszacsatolás szerepére vonatkozóan is igen sok elképzelés alakult ki. Közismert, hogy a thalamusz kapcsolatainak nagyobbik részét a kéregtől kapja. Mi lehet ennek a komoly visszacsatolásnak a szerepe? Felvetődött hogy szerepe lehet a fent említett kérgi szinkronizáció kialakításában is [Sillito, 1994]. Ezen adatokból kiindulva készítettem egy kortiko-thalamikus modellt amely a kérgen belüli kapcsolatok szándékos negligálásával is képes volt tulajdonsághoz kötött szinkron működés szimulációjára. Felmerült a modell elkészítése során néhány probléma avval kapcsolatban, hogy a posztszinaptikus kiváltott potenciálok túl lassúak voltak az ilyen pontos szinkronizáció kialakításához. A lokálisan jelenlévő gátló sejtek hatásának a modellbe illesztésével sikerült ezeken úrrá lenni. A CNN segítségével lehetőség van igen sok, topografikus összeköttetéssel rendelkező sejtnek a modellezésére. Mivel a makroszkópikus kapcsolatrendszer ilyen az agykéregben, illetve a kéreg alatti központok között, ezért a CNN paradigma igen alkalmas ennek a szerveződési szintnek a leírására. Évtizedek óta eldöntetlen kérdés az, hogy milyen kódot használ a központi idegrendszer, azon belül is az agykéreg [Gerstner, 1997]. Tanulmányozván a idegi tanulás elemi fiziológiai folyamait [Fazelli, 1996], felvetődött annak a kérdése, hogy ezen folyamatok hogy befolyásolják a jel átvitelét a kérgi idegsejtek között. Megjelentek már ezen a téren vizsgálódások amelyek azt mutatják, hogy e jelenségek akár új komplexebb számításokat is lehetővé tesznek [Maas, 1998]. Megpróbáltam egy olyan idegsejt modellt készíteni, amely mutatja a szinaptikus áttevődés dinamikus átépülését [Markram, 1997] és a tüzelési frekvenciája is adaptálódik. Feltételezve, hogy az idegsejtek kevéssé megbízható elemek, a modell idegsejt aktivitásának a statisztikai jellemzőit vizsgáltam a jelátvitelben. Célunk annak az ellenőrzése volt, vajon a legegyszerűbb feltételezett neurális kód, a frekvencia kód, azaz az idegsejtek átlagos aktivitása megfelelően adódik-e át hosszabb időtartam alatt a fenti folyamatok során. 8.2
Vizsgálatok módszerei
Mivel az itt bemutatott munkák túlnyomó része elméleti jellegű ezért számítógépes modelleket használtam a vizsgálatukhoz. A dinamikus receptív mezők modellezéséhez különböző CNN szimulátorokat használtam [CNN toolkit, 1994; CadetWin, 1997]. Mivel a jel terjedés, illetve zaj szűrés vizsgálata volt az elsőrendű célom, ezért ellenőrizni akartam milyen hatása van a számított sejtaktivitáshoz hozzákevert zajnak. Ehhez invertálni kellett használt eljárásokat, hogy egymással összehasonlítható képekhez jussak. Mivel a receptív mező modellekben téridőbeli mintázatok alakulnak ki, ezért különböző dekonvolúciós eljárásokat kellett alkalmazni. Ezek szerencsére viszonylag könnyen megvalósíthatóak voltak a CNN paradigmán belül. Fontos megjegyezni, hogy eddig is léteztek lineáris becslések a zajszűrésre, de amennyiben
- 97 -
Doktori Disszertáció Tézisei
valamilyen nemlinearitás is fellép ezek a számítások továbbiakban nem alkalmazhatóak, míg az általunk használt dekonvolúciós módszerek továbbra is rendelkezésre állnak. A kortiko-thalamikus rendszer szinkronizációban betöltött szerepét is modellel vizsgáltam. Mivel egy ilyen modell igen sok egyszerűsítés tartalmaz és jelentős fiziológiai folyamatok hiányoznak belőle ezért a kapott eredményeket csak fenntartásokkal az adott modell keretei között lehet értelmezni. Ez a keretrendszer főleg a kapcsolatok lokális, topografikus szerkezetére helyezi a hangsúlyt és a kialakuló tér-időbeli mintázatot ennek a kapcsolatrendszernek tulajdonítja. Mivel a CNN egy ilyen kapcsolatokkal rendelkezik ezért a modellezésben jól használható. Modell idegsejteken elemeztük a kérgi idegsejtek közötti jeltovábbítást, mert megfelelő kísérleti adatok nem álltak rendelkezésre. Mivel a szinaptikus jelátvitel vizsgálata volt az elsődleges célom, szándékosan elhagytam az idegi ingerület terjedés részletes vizsgálatát. További problémákat okozott volna az eredmények értelmezésénél, illetve a változók paraméterezésénél. Természetesen a kapott eredményekkel nagyon óvatosan kell bánni és a továbblépéshez természetesen kísérleti bizonyítékokra van szükség. 8.3
Új tudományos eredmények tézisszerű összefoglalása
(i) • • •
•
( ii ) •
•
•
Feltételezve a hibaterjedés minimális voltát, összekapcsoltsági megfontolások tehetőek a belső reprezentációt kialakító hálózatra. Megvizsgáltam hogy a bemenő mintázatoknak milyen előfeldolgozása hatékony a neurális hálózaton alapuló asszociatív memóriák kapacitásának jobb kihasználásához. Megmutattam, hogy a neurális asszociatív memóriák akkor használhatóak fel hatékonyan, hatékonyabban mint egy egyszerű nem neurális algoritmus, ha az eltárolandó minták száma elegendően magas és ezek a minták megfelelően átfedők. Megmutattam, hogy egy megnövelt méretű, de ritkává tevő kódolás többféleképpen is megvalósítható. Mivel azonban egy asszociatív memóriában való tárolásuk a cél, ezért a kódolás során a bejövő mintázatokban meglévő hiba növekedését csak minimális mértékben szabad megengedni. Megmutattuk, hogy az ilyen kódoláshoz minimálisan összekötött MCP hálózatokat érdemes használni. Megmutattam hogyha az előforduló hibák térben korreláltak (szomszédos pontokban gyakrabban fordulnak elő) akkor jelentős javulás érhető el a kódolás topografikus szervezésével (szerveződésével). Dinamikus receptív mezők szerkezete hozzájárul a látórendszer zajszűrő képességéhez. Megvizsgáltam az úgynevezett dinamikus receptív mezők kialakulását. Sikerült a Celluláris Neurális hálózatok (CNN) segítségével az elsődleges látókéreg egyszerű „Simple” sejtjeiig bezárólag szimulálni a látórendszerben kialakuló tér-időbeli receptív mező mintázatokat. Ezen mintázatok előállíthatóak voltak az egyszerűbb receptív mezők megfelelő „tér-időbeli” konvergenciájával, időben nem változó templatek segítségével. A kiindulásként használt egyszerű (ganglion sejt) receptív mező jól közelíthető volt egy egyszerűsített retina modell segítségével. Megmutattam, hogy már ez az „egyszerű” receptív mező sem bontható fel tisztán térbeli és tisztán időbeli komponensek szorzatára retinális előállításának funkcionális sajátosságai miatt. Megvizsgáltam milyen szerepe van a retina ganglion sejtjein kialakuló tér-időbeli receptív mező mintázatnak az információ pontos továbbításában. Eredményeim azt
- 98 -
•
•
Doktori Disszertáció Tézisei
mutatják, hogy ha szétválasztjuk a receptív mezők térbeli és az időbeli viselkedését, ami természetesen csak egy durva közelítése a valóságnak, akkor mind a két komponens képes arra, hogy a bejövő természetes (mozgó) képi információt úgy alakítsa át hogy az a rátevődő (korrelálatlan) zajra kevésbé legyen érzékeny. Ily módon jelentős akár 20-30% négyzetes középhiba csökkenés is elérhető. Ennek a tulajdonságnak az ellenőrzéséhez felhasználtam a CNN-en ismert rekonstrukciós algoritmusokat amelyek még a nemlineáris esetben is lehetővé teszik a szűrés hatásfokának a becslését. Elemeztem milyen hatása van a szűrésre a különböző fajta nemlinearitásoknak, illetve a különböző receptív mező paramétereknek. Ezeknek a méréseknek az alapján, feltételezések tehetők a látórendszerben megjelenő zajok szerkezetére, illetve arra vajon milyen mértékben torzítja a vizuális rendszer a beérkező képeket az optimális zajszűrő képesség fenntartása érdekében. Sikerült megmutatni hogy a látórendszer által használthoz hasonló előfeldolgozás segítségével a JPEG algoritmust használó képtömörítő eljárás esetén a hiba 5-7 százalékkal csökkenthető. Mozgó képek esetén a receptív mező dinamikáját felhasználva ki lehet szűrni a hozzákevert korrelálatlan zaj egy jelentős részét, de az MPEG algoritmus esetén, mivel ekkor a megjelenő zajok korreláltak, nem alkalmazható az eljárásnak ez a fele.
( iii ) Thalamo-kortikális kapcsolatok szerepe a kérgi szinkronizáció kialakulásában. • Megvizsgáltam, egy neuromorf CNN modell segítségével azt hogy milyen szerepe lehet a kortiko-thalamikus visszacsatolásnak a kérgi szinkronizáció kialakulásában. Sikerült reprodukálni az irodalomban leírt egyik alapjelenséget. • A modellben felhasználtam különböző CNN-re illesztett akciós potenciál generáló modelleket és egyszerű modelljét adtam a szinaptikus áttevődéseknek is. Gátló sejtek modelljének a segítségével sikerült ezekkel a lassabb jelekkel is éles, akár ‘milliszekundumos’ pontosságú szinkronizálódást létrehozni. Megfelelő konvergencia és divergencia beállítása esetén sikerült kialakítani szinkronizációt akkor ha az aktivált, bemenetük által meghajtott sejtek megfelelő ideig egymás szomszédságában voltak. • Ezeket az eredményeket a szimuláció akkor is produkálta amikor a kérgen belüli kapcsolatok szándékosan ki lettek hagyva modellből. Eredményeink azt mutatják, hogy a tulajdonsághoz kötött kérgi szinkronizáció kialakulásában jelentős szerepe lehet a kéreg alatti központoknak is. Mindazonáltal, az irodalomban megjelent adatok nem egyértelműek, vagy ellentmondásosak a kérgi szinkron működés mibenlétét illetően. Nem kellőképpen tisztázottak, hogy milyenek a fiziológiai alapjai és pontosan mikor van szerepe a kérgi reprezentációk közötti kapcsolatok (’binding’) kialakításában A CNN ezen vizsgálatok szerint megfelelő elméleti és gyakorlati keretrendszert nyújtott különböző topografikus szerveződést és nagy sejtszámot feltételező neurobiológiai problémák modellezéséhez. ( iv ) •
Szinaptikus áttevődés dinamikájának hatása az idegsejtek közötti jeltovábbításra. Megvizsgáltam milyen lehet az információátvitel kérgi idegsejtek között. Tekintettel arra, hogy a kérgi idegsejtek viszonylag alacsony háttéraktivitással rendelkeznek, ezért a modell idegsejten a következő mechanizmusok hatását vizsgáltam meg behatóbban: a, Az akcióspotenciál frekvencia adaptáció;
- 99 -
• •
•
Doktori Disszertáció Tézisei
b, Sorozatos ingerlések kiváltotta szinaptikus érzékenyülés (PPF); c, Piramis sejtek esetén inkább tapasztalható szinaptikus érzékenység csökkenés (PPD); d, A szinapszisok hosszú távú megerősödése (LTP); e, Illetve a szinapszisok gyengülése (LTD). A fenti folyamatok pontos fiziológiai mechanizmusáról szerencsére egyre részletesebb információkkal rendelkezünk , melyeknek alapján elkészítettem ezek egyszerű modelljeit. Ezen modellben elemeztem az idegsejt aktivitás két paraméterének az áttevődését. Az egyik a szinaptikus áramok átlaga a másik a szórása. Azt találtam, hogy LTP-re illetve LTD-re a fiziológiailag megfelelő aktivitás tartományban a szinaptikus áramok átlaga, tehát ezen keresztül a sejtek tüzelési frekvenciája, nem megfelelően adódik át hosszabb időszak alatt. A szórás viszont a mesterséges idegsejt modelleknek megfelelő módon transzformálódik. A fenti adatokból kiindulva indokolt annak a feltételezése, hogy a szinaptikus áramok szórása lehet kód az idegrendszerben. (Elsősorban persze a kérgen belül és ott sem feltétlenül a primer területeken.) Vázoltam milyen fiziológiailag elképzelhető működés tudja a perifériás idegrendszerben bizonyíthatóan jelenlévő frekvencia kódot átkonvertálni az itt javasolt ’szórás’ kódra, illetve hogyan lehet erről a kódról visszatérni a frekvencia kódra. Természetesen ezen kód létezésének bizonyítása csak kísérleti lehet, de van néhány ezt alátámasztani látszó adat az irodalomban.
8.4
Gyakorlati alkalmazások A modellek elkészítése során felmerült problémák egy részének megoldásához olyan algoritmusokat használtam amelyek esetleg gyakorlati alkalmazások szempontjából is hasznosak lehetnek. Ilyenek például a receptíve mező dinamikájának, illetve a látórendszeri zajszűrés vizsgálata során alkalmazott dekonvolúciós CNN algoritmusok. Alkalmaztam a Csebisev típusú gyorsító eljárást dekonvolúciós algoritmusok konvergencia sebességének a növelésére. Az eljárás általános esetben is használható és jelentős akár 3-4-szeres sebesség növekedés is elérhető. Ennek a módszernek az alkalmazása hasznos lehet még akkor is ha tudjuk, hogy a CNN chipek amúgy is igen nagy sebességű jelfeldolgozást tesznek lehetővé. Egy másik talán a gyakorlatban is alkalmazható eljárás a képek megfelelő előfeldolgozása. Ezt korábban valószínűleg az eljárás invertálásának a lassúsága akadályozta, de a CNN alkalmazásával megfelelő eszköz került a kezünkbe ennek a műveletnek a gyors végrehajtásához. Megmutattam, hogy a JPEG algoritmus hatékonyságát egy megfelelő előfeldolgozási lépés néhány százalékkal emelni tudja. Amennyiben a képi adatfeldolgozáshoz amúgy is CNN chipet és algoritmusokat használunk akkor ezek az előfeldolgozási lépések hatékonyan megvalósíthatóak.
8.5
A tézisfüzetben hivatkozott irodalom
J.J. Atick, A.N. Redlich (1992) What does the retina know about Natural Scenes? Neural computation Vol. 4. pp. 196-210 [CNN-TOOLKIT] (1994) The Cellular Neural Network Workstation Toolkit, User’s Manual, Version 6.0, Computer and Automation Institute, Hungarian Academy of Sciences, Budapest
- 100 -
Doktori Disszertáció Tézisei
G.C. DeAngelis, I. Ohzawa, R.D. Freeman (1995) Receptive-filed dymanics in the central visual pathways. Trends in Neurosciences (TINS.) Vol. 18(10). pp. 451-458 M.S. Fazeli, G.L. Collingridge (1996) Cortical Plasticity LTP and LTD.BIOS scientific publishers Ltd. Oxford W. Gerstner, A.K. Kreiter, H. Makram, A.V.M. Herz (1997) Neural code: Firing rates and beyond. Proc. Natl. Acad. Sci. USA. Vol. 94. pp.12740-12741 W. Maas, A.M. Zador (1998) Dynamic Stochastic Synapses as computational Units. H. Markram, M. Tsodyks (1996) Redistribution of synaptic efficacy between neocortical pyramidal neurons. Nature Vol. 382. pp. 807-810 B.A. Olshausen, D.J. Field (1997) Sparse coding with an overcomplete basis set: a strategy employed by V1? Vision Res. Vol. 37(23). pp. 3311-25 B.A.Olshausen and D.J. Field (1996) Natural Image Statistics and Efficient Coding. Network Computation in Neural Systems Vol. 7(2). pp. 333-339 T. Roska, J. Hámori, E. Lábos, K. Lotz, L. Orzó, J. Takács, P. Venetianer, Z. Vidnyánszky and Á. Zarándy (1993) The use of CNN models in the subcortical visual pathway -Part II: The Amacrine Cell in the Modified Retina Model, Simple LGN Effects and Motion Related Illusions. IEEE Transactions on Circuits and Systems - 1:FTA Vol. 40(3). pp. 182-195 T. Roska, P. Szolgay, T. Kozek, Á. Zarándy, Cs. Rekeczky, L. Nemes, L. Kék, K.László, I.Szatmári, M.Csapodi (1997) "CADETWIN", CADETWIN, (CADETWIN), Budapest, MTA SZTAKI W. Singer (1993) Synchronization of cortical activity and its putative role in information processing and learning. Ann. Rev. Physiol. Vol. 55. pp. 349-74 H.E. Sillito, G.L. Jones, G.L. Gerstein, D.C. West (1994) Feature linked synchronization of thalamic relay cell firing induced by feedback from the visual cortex. Nature Vol. 369. pp. 479-482 F.S. Werblin, T. Roska and L.O. Chua (1995) The Analogic Cellular Neural Network as a Bionic Eye. International journal of Circuit Theory and Applications, Vol. 23. pp. 541-569 F.S. Werblin (1997) Neuromorphic Modeling of Retinal Function using CNN. Proceedings of International Symposium on Nonlinear Theory and Applications, (NOLTA'97), Vol.1. pp:13, Hawaii
- 101 -
9 Publikációk (1992-1998 Orzó László) Előadások, Poszterek: 1) Orzó L. (1992): Application fixed points of ah neural network to increase the storage capacity, poster presented at the Annual meeting of Hungarian Physiological Society, Visegrád. 2) Lábos E. and Orzó L. (1992): Comparisons error correcting codes and the associative memories in model neural systems, poster presented at the Annual Meeting of Hungarian Physiological Society, Pécs. 3) Lábos E., Holden A.V., Laczkó J. and Orzó L. (1992i): Fuzzy Operators and Cyclic Behavior in Formal Neura: Nets, Conference on Mutual Dynamics, Budapest, May 26-27. 4) Lábos E. and Orzó L. (1992b; poster): Hibajavító kódok (ECC) és asszociatív memória (AM) hasonlósága és különbségei. MÉT 57. Vándorgyűlése, 1992. július 1-4. 5) Lábos E., Holden A.V., Laczkó J., Orzó L. and Lábos Sz. (1992): Fuzzy operators and cyclic behavior in formal neuronal networks. Fuzziness may lead to chaotic dynamics. NAFIPS's 92, Mexico Puerto Vallarta (supported by NATO) Dec. 15-17. 6) Koch A.S., Orzó L. and Tarnai T. (1992): The Origami Theory: A Geometry Based Approach to the Early Stage of Emryonic Development, Mutual Dynamic of Organizational levels in Evolution, MTA KFKI XX/c. 7) Orzó L. and Lábos E. (1996): Összekapcsoltság becslése mesterséges neuronokon történő hibaterjedés vizsgálatával - Optimalizációs stratégia a neuronális asszociatív memória tárolására (Connectivity estimations from error propagation on neural units - an optimization strategy for neural network associative memory storage). Magyar Idegtudományi Társaság III. Konferenciája Balatonfüred, 1996. január 25-27. 8) Orzó L. and Lábos E. (1996):Connectivity estimations from error propagation on neuronal units (An optimization strategy for neural network associative memory storage. Proc. of the 13th European Meeting on Cybernetics and System Research (Ed. Trappl, R.). 1996 April, Vienna. pp. 497-502. 9) L. Orzó, and E.Lábos (1996): On the Soft Threshold Operator Parameters for the Optimal Neural Net Associative Storage. Fiziologia-Physiology Vol.6 No 2(10) -- FT20. p. 89. Timisoara Románia. 10) Lábos E. and Orzó L. (1996): Synchronization(Sy) and Desynchronization(Dsy) Mechanisms in Neural Nets. Fiziologia--Physiology Vol.6 No 2(10) -- MS10. p. 34. Szeged. 11) L. Orzó, and E.Lábos (1996): The Effects of Topographical Projeections on the Error Propagation in MCP Neurons. Fiziologia--Physiology Vol.6 No 2(10) -- MS12. p. 34. Szeged. 12) L. Orzó, and E.Lábos (1996): Error transmission based connectivity estimations on neural units (An optimization strategy for neural network associative memory storage). Cybernetics and Systems ‘96 13) Orzó L., Z. Vidnyánszky, J. Hámori and T. Roska (1996): CNN model of the feature-linked synchronized activities in the visual thalamo-cortical system. CNNA-96. Sevilla
- 102 -
Publikációk
14) Orzó L. and Lábos E. (1997): Adaptation and other dynamical effects on neural signal transfer. A model study. (Adaptív és más dinamikai befolyások az idegi jelátvitelben.) MITT IV. Konferencia, Gödöllő, 1997. január 23-25. 15) Orzó L. (1997): A neuronális jelátvitel dinamikája. MAKOG'97. Ráckeve, január 26-27. 16) Orzó L., Elemér Lábos, Tamás Roska, József Hámori (1998): Modeling visual system neurons’ dynamic receptive field properties and noise filtering. MITT V. Konferencia, Debrecen. 1998 január 21-24. 17) Orzó L. (1998): Dynamic Receptive Field Models: Noise Filtering in the Visual System. V. magyar látás konferencia. Budapest. 1998 aug. 29. 18) Orzó L. (1999): Effects of Nonlinear Interactions on the Visual System’s Noise Filtering Characteristic. MITT VI. Konferencia, Villány. 1999 január 21-24. Publikációk & Bővített Absztraktok: Orzó L. (1992) Increasing storage capacity of neural networks by preprocessing, using convergence and divergence. Acta Biochim. Biophys. Hung. Vol. 26(1-4). pp.127-130 II. Roska T., Hámori J., Lábos E., Lotz K., Orzó L., Takács J., Venetianer P., Vidnyánszky Z. and Zarándy Á. (1993) The use of CNN models in the subcortical visual pathway -Part II: The Amacrine Cell in the Modified Retina Model, Simple LGN Effects and Motion Related Illusions. IEEE Transactions on Circuits and Systems - 1:FTA Vol. 40(3). pp. 182-195 III. Orzó L. (1993) Deviation code is a prospective candidate of the communication between adapting neurons. Neurobiology Vol. 1(3). pp. 223-234 IV. Orzó L. and Lábos E. (1996) Connectivity estimations from error propagation on neuronal units (An optimization stratefgy for neural network associative memory storage. Proc. of the 13th European Meeting on Cybernetics and System Research (Ed. Trappl, R.). 1996 April, Vienna. pp. 497-502 V. Orzó L., Z. Vidnyánszky, J. Hámori and T. Roska (1995) CNN model of the featurelinked synchronized activities in the visual thalamo-cortical system. NIT-6-1995 Internal report. VI. Orzó L., Z. Vidnyánszky, J. Hámori and T. Roska (1996) CNN model of the featurelinked synchronized activities in the visual thalamo-cortical system. Proceedings IEEE CNNA-96. pp. 291-296 VII. Orzó L. and Lábos E. (1997) Adaptation and other dynamic effects on neural signal transfer. In Biological and Artificial Computation: From Neuroscience to Neurotechnology (Eds.) Mira, J.; Moreno-Diaz, R.; Cabestany, J., ISBN: 3-540-63047-3. IWANN’97 Lanzarote Canary Islands, Spain, June 1997. Proceedings pp. 370-379. VIII. Orzó L. and Lábos E. (1998) Dynamics of Synaptic Transmission and Neural Code. Proc. of the 14th European Meeting on Cybernetics and System Research (Ed. Trappl, R.) Vienna ISBN 3 85206 139 3,Vol. 1. pp. 323-29 IX. Orzó L., Károly László, László Négyessy, József Hámori, Tamás Roska (1998): Receptive Field Dynamics of the Central Visual Pathway Neurons : Various Definitions and Measurements as well as CNN models. Proceedings CNNA-98. London. IEEE 98TH8359, pp. 198-203 X. Á. Zarándy, L. Orzó, E. Grawes, F. Werblin (1998) CNN Based Early Vision Models for Color vision and Visual Illusions. IEEE Trans. on Circuits and Systems I: Fundamental Theory and Applications, (CAS-I) Vol. 46 No 2, pp. 229-238
I.
- 103 XI.
Publikációk
L.Orzó (1999): Effects of the ganglion cell response nonlinear mapping on visual system’s noise filtering characteristics. IWANN'99 Accepted.
- 104 -
Idézett irodalom
10 Idézett irodalom 1
E. Gardner (1988) The space of interactions in neural network models. J. Phys. A: Math. Gen. Vol. 21. pp. 257-270
2
G. Palm (1981) On the Storage Capacity of an Associative Memory with Randomly Distributed Storage Elements. Biol. Cybern. Vol. 39. pp.125-127
3
G. Palm (1980) On Associative memory. Biol. Cybern. Vol. 36. pp. 19-31
4
R. Hecht-Nielsen (1986) Combinatorial Hypercompression. Proc. Conf. on NN for Computing II. pp. 455-461
5
D.J. Willshaw, O.P. Buneman, H.C. Longuet-Higgins (1970) Non-Holographic Associative Memory. Nature Vol. 222. pp. 960-962
6
H. Gutfreund (1988) Neural networks with hierarchically correlated patterns. Phys. Rev. A Vol. 37. pp. 570-577
7
N. Parga, M.A. Virasoro (1986) The ultrametric organization of memories in neural network. J. Phys. Vol. 47. pp. 1857-64
8
C. Zetzsche (1990) Sparse coding: The link between the low level vision and associative memory. Parallel Processing in Neural Systems and Computers. edited by Eckmiller, R. Amsterdam, Netherlands,: North-Holland, pp. 273-276
9
B. Derrida, E. Gardner, A. Zippelius, (1987) An exactly solvable asymmetric neural network model. Europhys. Letters Vol. 4. pp. 167-174
10
M.R. Evans (1989) Random Dilution in a neural network for biased patterns. J. Phys. A: Math. Gen. Vol. 22. pp. 2103-2118
11
M.B. Feigelman, L.B. Ioffe (1987) The augmented model of associative memory asymmetric interaction and hierarchy of patterns. Int. J. Mod. Phys. B. Vol. 1. pp. 51-68
12
J. DeWitt (1993) Feature filtering improves associative memory performances. WNN93/FNN93 SPIE, Vol. 2204. pp.303-306
13
T. Kohonen (1982) Self-Organized Formation of Topologically Correct Feature Maps. Biol. Cybern. Vol. 43. pp. 59-69
14
P. Földiák (1990) Forming Sparse Representations by local anti-Hebbian learning. Biol. Cybern. Vol. 64(2). pp. 165-170
15
W. Singer (1993) Synchronization of cortical activity and its putative role in information processing and learning. Ann. Rev. Physiol. Vol. 55. pp. 349-74
16
E. Zohary, M.N. Shadlen, W.T. Newsome (1994) Correlated neuronal discharge rate and its implication for psychophysiological performance. Nature Vol. 370 (6485). pp. 140-143
17
A. Petters, B.R. Payne (1993) Numerical relationships between geniculocortical afferents and pyramidal cell modules in cat primary visual cortex. Cerebral Cortex Vol. 3. pp. 69-78
- 105 -
Idézett irodalom
18
B. Ahmed, J.C. Anderson, R.J. Douglas, K.A.C. Martin, J.C., Nelson (1994) Polyneuronal Innervation of spiny Stellate Neurons in Cat Visual Cortex. The Journal of Comparative neurology Vol. 341. pp. 39-49
19
G.C. DeAngelis, I. Ohzawa, R.D. Freeman (1995) Receptive-filed dymanics in the central visual pathways. Trends in Neurosciences (TINS.) Vol. 18(10). pp. 451-458
20
Daqing Cai, Gregory C. DeAngelis, and Ralph D. Freeman (1997) Spatiotemporal Receptive Field Organization in the Lateral Geniculate Nucleus of Cats and Kittens. J. Neurophysiol. Vol.78. pp. 1045-1061
21
L.O. Chua and T. Roska (1993) The CNN paradigm. IEEE Trans. CAS-I, Vol. 40. pp. 147156
22
H.M. Sakai, K. Naka (1995 ) Response dynamics and receptive-field organization of catfish ganglion cells. J. Gen. Physiol. Vol. 105(6). pp. 795-814
23
J.J. Atick, A.N. Redlich (1992) What does the retina know about Natural Scenes? Neural computation Vol. 4. pp. 196-210
24
Zhaoping Li, J.J. Atick. (1993) Toward a Theory of the Striate Cortex. Neural Computation Vol. 6. pp. 127-146
25
[CNN-TOOLKIT] (1994) The cellular neural Network Workstation Toolkit, User’s Manual, Version 6.0, Computer and Automation Institute, Hungarian Academy of Sciences, Budapest
26
T. Roska, P. Szolgay, T. Kozek, Á. Zarándy, Cs. Rekeczky, L. Nemes, L. Kék, K.László, I.Szatmári, M.Csapodi (1997) "CADETWIN", CADETWIN, (CADETWIN), Budapest, MTA SZTAKI
27
A. Das, C.D. Gilbert (1995) Receptieve field expansion in adult visual cortex is linked to dynamic Changes in strength of Cortical Connections. Journal of Neurophysiology Vol. 74. pp. 779-791
28
I. Kovacs, B. Julesz (1994) Perceptual sensitivity maps within globally defined visual shapes. Nature Vol. 370(6491). pp. 644-646
29
J.E. Dowling, F.S.Werblin (1969) Organization of retina of the mudpuppy, Necturus maculosus. I. Synaptic structure. J Neurophysiol. Vol. 32(3). pp. 315-38
30
J. Ammermuller, W. Mockel, I. Perlman, J. Rohrenbeck (1996) Effects of horizontal cell network architecture on signal spread in the turtle outer retina. Experiments and simulations. Vision Res. Vol. 36(24). pp. 4089-103
31
M. Piccolino,P. Witkovsky, C. Trimarchi (1987) Dopaminergic mechanisms underlying the reduction of electrical coupling between horizontal cells of the turtle retina induced by damphetamine, bicuculline, and veratridine. J Neurosci. Vol. 7(8). pp. 2273-84
32
M. Kamermans, F. Werblin (1992) GABA-mediated positive autofeedback loop controls horizontal cell kinetics in tiger salamander retina. J Neurosci. Vol. 12(7). pp. 2451-63
- 106 -
Idézett irodalom
33
M.S. Livingstone (1998) Mechanism of direction selectivity in macaque V1. Neuron Vol. 20. pp. 509-526
34
L.O. Chua and L. Yang (1988) Cellular Neural Networks: Theory. IEEE Trans. on Circuits and Systems, (CAS), Vol.35. pp. 1257-1272
35
L. Spillman and J. S. Warner (Eds.) (1990) Visual Perception. New York: Academic Press.
36
F.S. Werblin (1991) Synaptic connections, receptive fields, and pattern of activity in the tiger salamander retina. Investigative Opthalmology and Visual Science Vol.32. pp. 459-483
37
J. Teeters, A. Jacobs, F. Werblin (1997) How neural interactions form neural responses in the salamander retina. J Comput Neurosci. Vol. 4(1). pp. 5-27
38
A. Jacobs, F. Werblin (1998) Spatiotemporal patterns at the retinal output. J. Neurophysiol. Vol. 80(1). pp. 447-51
39
Cs. Rekeczky, B. Roska, E. Nemeth, T. Roska, and F. Werblin (1998) "A Spatio-temporal Retina Model in CNN Based on First Order RC Cells, Nearest-neighbor Space-invariant Interactions and Continuous Monotonic Nonlinear Synaptic Characteristics", Memorandum UCB/ERL, (UCB/ERL), Berkeley, University of California at Berkeley
40
T. Roska, L. O. Chua (1993) The CNN Universal Machine: An Analogic Array Computer, IEEE Transactions on Circuits and Systems-II: Analog and Digital Signal Processing, Vol. 40(3). pp. 163-173
41
F. Werblin, A. Jacobs (1994) Using CNN to unravel space-time processing in the vertebrate retina. CNNA-94, pp. 33-40
42
F. Werblin, T. Roska and L.O. Chua (1995) The Analogic Cellular Neural Network as a Bionic Eye. International journal of Circuit Theory and Applications, Vol. 23. pp. 541-569
43
T Roska, J. Vandewalle (eds.) (1993) Cellular Neural Networks. J.Wiley and Sons, Chichester, London, New York
44
S.M. Wu (1991) Input-output relations of the feedback synapse between horizontal cells and cones in the tiger salamander retina. J. Neurophysiol. Vol. 65(5). pp.1197-206
45
S.M. Wu (1992) Feedback connections and operation of the outer plexiform layer of the retina. Curr. Opin. Neurobiol. Vol. 2(4). pp.462-8
46
F.S. Werblin (1997) Neuromorphic Modeling of Retinal Function using CNN. Proceedings of International Symposium on Nonlinear Theory and Applications, (NOLTA'97), Vol.1. pp:1-3, Hawaii
47
M.M. Slaughter, R.F. Miller (1983) An excitatory amino acid antagonist blocks cone input to sign-conserving second-order retinal neurons. Science Vol. 219. pp. 1230-1232
48
S. Nawy, C.E. Jahr (1990) Suppression by glutamate of cGMP activated conductance in retinal bipolar cells. Nature Vol. 346. pp. 269-271
49
HTTP://INSIGHT.MED.EDU/WEBVISION
50
E. Hartveit (1992) Simultaneus recording of lagged and nonlaggad cells in the cat dorsal lateral geniculate nucleus. Exp. Brain Res. Vol. 88. pp. 229-232
- 107 -
Idézett irodalom
51
G.G. Blasdel (1992) Orientation Selectivity, Preference, and Continuity in Monkey Striate Cortex. The Journal of Neuroscience Vol. 12(8). pp. 3139-3161
52
F. Wörgötter, G. Holt (1991) Spatiotemporal mechanism in Receptive Fields of Visual Cortical Simple Cells: A Modell. Journal of Neurophysiology Vol. 65. pp. 494-510
53
M.J. Hawken, A.J. Parker (1987) Spatial properties of neurons in the monkey striate cortex. Proc. R. Soc. Lond. B Vol. 231. pp. 251-288
54
R.C. Reid, R.E. Soodak, R,M. Shapley (1987) Linear mechanism of directioal selectivity in simple cells of cat striate cortex. Proc. Natl. Acad. Sci. USA Vol. 84. pp. 8740-8744
55
D.H. Hubel, T.N. Wiesel (1962) Receptive fields, binocular interaction and functional architecture in the cat's visual cortex. Journal of Physiology Vol. 160. pp. 106-154.
56
D.C. Somers, S.B. Nelson, M. Sur (1995) An emergent model of orientation selectivity in cat visual cortical simple cells. J. Neurosci. Vol. 15(8). pp. 5448-65
57
T.R. Vidyasagar, X. Pei, M. Volgushev (1996) Multiple mechanisms underlying the orientation selectivity of visual cortical neurones. Trends in Neuroscience Vol. 19(7). pp.272-7
58
A.M. Sillito (1975) The contribution of inhibitory mechanisms to the receptive field properties of the neurones in the striate cortex of the cat. Journal of Physiology Vol. 250. pp. 305-329
59
S.P. Sabatini (1996) Recurrent inhibition and clustered connectivity as a basis for Gabor-like receptive fields in the visual cortex. Biological Cybernetics Vol. 74. pp. 189-202
60
B. Ahmed, J.C. Anderson, R.J. Douglas, K.A.C. Martin, J.J.C. Nelson (1994) Polyneuronal Innervation of Spiny Stellate Neurons in Cat Visual Cortex. The Journal of Comparative Neurobiology Vol. 341. pp. 39-49
61
D. Ferster, S. Chung, H. Wheat (1996) Orientation selectivity of thalamic input to simple cells of cat visual cortex. Nature Vol. 380. pp. 249-252
62
R.C. Reid, JM. Alonso (1995) Specificity of monosynaptic connections from thalamus to visual cortex. Nature Vol. 378. pp. 281-284
63
H.E. Jones, A.M. Sillito (1994) Directional asymetries in the length-response profiles of cells in the feline dorsal lateral geniculate nucleus. Journal of Physiology, Vol. 479(3). pp. 475-485
64
R.C. Reid, R.E. Soodak, R,M. Shapley (1991) Directional selectivity and Spatiotemporal Structure of receptive Field of simple Cells in Cat Striate Cortex. Journal of Neurophysiology Vol. 65. pp. 505-529
65
B.A. Olshausen, D.J. Field (1997) Sparse coding with an overcomplete basis set: a strategy employed by V1? Vision Res. Vol. 37(23). pp. 3311-25
66
B.A.Olshausen and D.J. Field (1996) Natural Image Statistics and Efficient Coding. Network Computation in Neural Systems Vol. 7(2). pp. 333-339
67
HTTP://WWW.KLAB.CALTECH.EDU/~PAM/NNSS/BIBLIOSCENES.HTML
- 108 -
Idézett irodalom
68
E. Kaplan, S. Marcus, Y.T. So (1979) Effects of dark adaptation on spatial and temporal properties of receptive fields in cat lateral geniculate nucleus. J. Physiol. (Lond) Vol. 294. pp. 561-80
69
A. J. Ahumada, Rencheng Horng (1995) Smoothing DCT Compression Artifacts. SID Digest Vol. 25, pp. 708-711.
70
Rensheng Horng, A. J. Ahumada (1995) A Fast DCT Block Smoothing Algorithm. Visual Communication and Image Processing Annual Meeting Proceedings, SPIE Vol. 2501 paper 5.
71
A. B. Watson (1993) DCT Quantzation Matrices Visually Optimized for Individual Images. in: Human Vision, Visual processing and Digital Display IV. Bellingham, WA:SPIE. Ed. B.E. Rogowitz.
72
HTTP://VISION.ARC.NASA.GOV/PUBLICATIONS
73
A.B. Watson, R. Borthwick, M. Taylor (1997) Image quality and entropy masking. SPIE Proceedings, Vol. 3016. pp. 1-11
74
A. Stoffels, T. Roska, L.O. Chua (1996) On Object-Oriented Video Coding Using the CNN Universal Machine. IEEE Transactions on Circuits and System-1: Fundamental Theory and Applications Vol. 43(11). pp. 948-952
75
P.L.Venetianer, F. Werblin, T. Roska, L.O. Chua (1995) Analogic CNN Algorithms for Some Image Compression and Restoration Tasks. IEEE Transactions on Circuits and System-1: Fundamental Theory and Applications Vol. 42(5). pp. 278-284
76
M. Tanaka, K.R. Crounse, T. Roska (1994) Parallel Analog Image Coding and Decoding by Using Cellular Neural Networks. IEICE Trans Fundamentals, Vol. E77-A.(8). pp. 13871395
77
P.L. Venetianer and T. Roska (1998) Image Compression by Cellular Neural Networks", IEEE Trans. on Circuits and Systems I: Fundamental Theory and Applications, (CAS-I), Vol. 45(3). pp: 205-215
78
M.W. Pettet, C.D. Gilbert (1992) Dynamic changes in receptive-field size in cat primary visual cortex. Proc. Natl. Acad. Sci. U S A Vol. 89(17). pp. 8366-70
79
C.D. Gilbert (1993) Circuitry, architecture, and functional dynamics of visual cortex. Cerebral Cortex, Vol. 3. pp. 373-386
80
G.C. DeAngelis, A. Anzai, I. Ohzawa, R.D. Freeman (1995) Receptive field structure in the visual cortex: does selective stimulation induce plasticity? Proc. Natl. Acad. Sci. USA Vol. 92(21). pp. 9682-6
81
A.Chapman, L.S. Sone (1996) Turning a blind eye to the cortical receptive fields. Neuron Vol. 16. pp. 9-12
82
J.Saarinen, D.M. Levi, B. Shen (1997) Integration of local pattern elements into a global shape in human vision. Proc. Natl. Acad. Sci. USA. Vol. 94. pp. 8267-8271
- 109 -
Idézett irodalom
83
J.P. Miller, T. Roska, T. Szirányi, K.R. Crounse, L.O. Chua, L. Nemes (1994) Deblurring of Images by Cellular Neural Networks with applications to Microscopy. Proceedings of IEEE Int. Workshop on Cellular Neural Networks and Their Applications, (CNNA'94), pp. 237242
84
L. Czúni, T. Szirányi (1997) Adaptive Deblurring of Multi-Layer Microscopic Images with Single-Layer Cellular Neural Networks. Proceedings of 13 European Conference on Circuit Theory and Design, (ECCTD'97), pp. 673-677, Budapest
85
T. Szirányi, L. Nemes (1995 ) Robustness of Cellular Neural Networks in Image Deconvolution and Texture Segmentation, Research report of the Analogic (Dual) and Neural Computing Systems Laboratory, (DNS-7-1995), Budapest, MTA SZTAKI
86
T. Szirányi, L. Nemes, T. Roska (1995) Cellular Neural Networks for image Deconvolution and Enhancement: A Microscopy Toolkit", Research report of the Analogic (Dual) and Neural Computing Systems Laboratory, (DNS-11-1995), Budapest, MTA SZTAKI
87
T. Szirányi, L. Nemes, and T. Roska (1995) Cellular Neural Networks for image Deconvolution and Enhancement: A Microscopy Toolkit, Proceedings of Int. Workshop…, (IWPIA'4), pp. 113-124, Lyon
88
T. Szirányi (1996) Robustness of Cellular Neural Networks in image deblurring and texture segmentation", Int. J. Circuit Theory and Applications, (CTA), Vol. 24, pp. 381-396
89
G. I. Marcsuk, (1976) "A Gépi Matematika Numerikus Módszerei – Parciális Differenciál egyenletek. " Műszaki könyvkiadó Budapest, 1976
90
K. R. Crounse, L. O. Chua (1995) Methods for Image Processing and Pattern Formation in Cellular Neural Networks. A Tutorial. IEEE Transactions on Circuits and Systems-1: Fundamental Theory and Applications. Vol.42(10), pp.583-601.
91
L. O. Chua and T. Roska (1992) The CNN Universal Machine - Part 1: The architecture", Proceedings of IEEE Int. Workshop on Cellular Neural Networks and Their Applications, (CNNA'92), pp. 1-10., Munich
92
T. Roska and L. O. Chua (1992) The CNN Universal Machine - Part 2: Programmability and applications. Proceedings of IEEE Int. Workshop on Cellular Neural Networks and Their Applications, (CNNA'92), pp.181-190, Munich
93
H.E. Sillito, G.L. Jones, G.L. Gerstein, D.C. West (1994) Feature linked synchronization of thalamic relay cell firing induced by feedback from the visual cortex. Nature Vol. 369. pp. 479-482
94
C. von der Malsburg (1995) Binding in models of perception and brain function. Current Opinion in Neurobiology Vol. 5. pp. 520-526
95
R. Eckhorn, R. Bauer, W. Jordan, M. Brosch, W. Kruse, M. Munk, H.J. Reitboeck (1988) Coherent oscillation: A mechanism of feature linking in the visual cortex? Biol. Cyb. Vol. 60. pp. 121-130
96
C. von der Malsburg, W. Schneider (1986) A neural cocktail-party processor. Biol. Cybern. Vol. 54. pp. 29-40
- 110 -
Idézett irodalom
97
A.K. Engel, P. König, C.M. Gray, W. Singer (1990) Stimulus-Dependent Neuronal Oscillations in Cat Visual Cortex: Inter-Columnar Interaction as Determined by CrossCorrelation Analysis. European Journal of Neuroscience Vol. 2. pp. 588-606
98
C. Koch (1993) Computational approach to cognition: the bottom-up view. Current Opinion in Neurobiology Vol. 3. pp. 203-208
99
W. Singer (1993) Neural representations, assemblies and temporal coherence. Progress in Brain Research Vol. 95. pp. 461-474
100
K. Kirchfeld (1996) The temporal correlation hypothesis. TINS. Vol. 19(10). pp. 415-416
101
M.P. Stryker (1989) Is grandmother an oscillation? Nature Vol. 338. pp. 297-298
102
C. Zohary, M.N. Shadlen, W. T. Newsome (1994) Correlated neuronal discharge rate and its implications for psychphysical performance. Nature Vol. 370. pp 140-143
103
R. Eckhorn, A. Obermueller (1993) Single neurons are differently involved in stimulusspecific oscillations in cat visual cortex. Exp. Brain Res. Vol. 95. pp. 177-182
104
P König, A.K. Engel (1995) Correlated firing in sensory-motor systems. Current Opinion in Neurobiology Vol. 5. pp. 511-519
105
R. Eckhorn, T. Schanze, M. Brosch, W. Salem, R. Bauer (1990) Stimulus specific synchronization in cat visual cortex: Multi microelectrode and correlation studies from several cortical areas.
106
W.A. Freiwald, A.K. Kreiter, W. Singer (1995) Stimulus dependent intercolumnar synchronization of single unit responses in cat area 17. Neuroreport Vol. 6(17). pp. 23482352
107
C.M. Gray, W. Singer (1989) Stimulus specific neuronal oscillation in orientation columns of cat visual cortex. Proc. Natl. Acad. Sci. USA Vol. 86. pp. 1698-1702
108
A Frien, R Eckhorn, R. Bauer, T Woelbernn, H. Kehr (1994) Stimulus-specific fast oscillations at zero phase between visual areas V1 and V2 of awake monkey. NeuroReport Vol. 5. pp.2273-2277
109
A.K. Engel, P. König, A.K. Kreiter, W. Singer (1991) Interhemispheric Synchronization of Oscillatory Neuronal Responses in cat Visual Cortex. Science Vol. 252. pp. 1177-1179
110
G.M. Ghose, R.D. Freeman (1997) Intracortical connections are not required for oscillatory activity in the visual cortex. Vis. Neurosci. Vol. 14(6). pp. 963-979
111
P. König, B. Schillen (1991) Stimulus-dependent Assembly formation of Oscillatory Responses: I Synchronization. Neural Computation Vol. 3. pp. 155-166
112
T.B. Schillen, P. König (1991) Stimulus-dependent Assembly formation of Oscillatory Responses: II Desynchronization. Neural Computation Vol. 3. pp. 155-166
113
P. König, A.K. Engel, S. Löwel, W. Singer (1993) Squint Affects Synchronization of Oscillatory Responses in Cat Visual Cortex. European Journal of Neuroscience Vol. 5. pp. 501-508
- 111 -
Idézett irodalom
114
G.M. Ghose, R.D. Freeman (1992) Oscillatory discharge in the visual system: Does it have a functional role? J. Neurophysiol. Vol. 68. pp. 1558-1574
115
W. Singer (1994) A new job for the thalamus. Nature Vol. 369. pp. 479-482
116
S. Lindström, A. Wróbel (1990) Frequency dependent corticofugal excitation of principal cells in the cat's dorsal lateral geniculate nucleus. Exp. Brain Res. Vol. 79. pp. 313-318
117
C. Koch (1987) The action of the corticofugal pathway on sensory thalamic nuclei: A ypothesis. Neuroscience Vol. 23. pp. 399-406
118
D. Mumford (1991) On the computational architecture of the neocortex. I. The role of the thalamo-cortical loop. Biol. Cybern. Vol. 65. pp. 135-145.
119
J.W. McLurkin, L.M. Optican, B.J. Richmond (1994) Cortical feedback increases visual information transmitted by monkey lateral geniculate neurons Visual Neuroscience Vol. 11. pp. 601-617
120
M. Steriade, D.A. McCormick, T.J. Sejnowski (1993) Thalamocortical oscillations in the sleep and aroused brain. Sience Vol. 262. pp. 679-685
121
K. Funke, U.T. Eysel (1992) EEG-dependent modulation of response dynamics of cat dLGN relay cells and the contribution of corticogeniculate feedback. Brain Research Vol. 573. pp. 217-227
122
M. Steriade, D. Contreras, F. Amzica, I. Timofeev (1996) Synchronization of Fast (30-40 Hz) Spontaneous Oscillations in Intrathalamic and Thalamocortical Networks. The Journal of Neuroscience Vol. 16(8). pp. 2788-2808
123
S. Neuenschwander, W. Singer (1996) Long-range synchronization of the oscillatory light response in the cat retina and the lateral geniculate nucleus. Nature Vol. 379(6567). pp. 728732
124
T.B. Schillen, P. König (1994) Binding by temporal structure in multiple feature domains of an oscillatory neural network. Biol. Cybern. Vol. 70. pp. 397-405
125
R. Eckhorn, P. Dicke, M. Arndt, H. Reitboeck (1992) Flexible linking of Visual Features by Stimulus-related synchronizations of model neurons.
126
S.R. Cobb, E.H. Buhl, K. Halasy, O. Paulsen, P. Somogyi (1995) Synchronization of neuronal activity in hippocampus by individual GABAergic interneurons. Nature Vol. 378. pp.75-78
127
G. Buzsáki, J.J. Chrobak (1995) Temporal structure in spatially organized neuronal ansembles: a role for interneuronal networks. Current Opinion in Neurobiology Vol. 5. pp. 504-510
128
L.F. Abbott (1990) A network of oscillators. J. Physics A: Mathematics and General Vol. 23. pp. 3835-3859
129
T. Tóth, E. Lábos (1988) Interspike interval histograms in a simple network consisting of universal pattern generators. Cybernetics and Systems' 88 (Ed. Trappl. R.) Kluwer Academic Publisher pp. 975-982
- 112 -
Idézett irodalom
130
K. Lotz, Z. Vidnyanszky, T. Roska, J. Vandewalle, J. Hámori, A. Jacobs, F. Werblin (1994) Some cortical spiking neuron models using CNN. Proceedings of third IEEE workshop on CNN (CNNA-94). pp. 41-46
131
A. Jacobs (1993) Techniques for constructing physiologically-motivated neuromorphic models in CNN. Report DNS-7, Comp. Aut. Inst., Hung. Acad. Sci. Budapest
132
G.M. Sheperd (1990) Synaptic organization of the brain. Oxford University Press
133
D. Ferster, S. Lindström (1983) An Intracellular analysis of geniculo-cortical connectivity in area 17 of the cat. Journal of Physiology Vol. 342. pp 181-215
134
G.V. Wallenstein (1994) A model of the electrophysiological properties of nucleus reticularis thalami neurons. Biophysical Journal Vol. 66. pp. 978-988
135
M. Steriade, D. Contreras, F. Amzica (1994) Synchronized sleep oscillations and their paroxismal developments. TINS. Vol. 17(5). pp. 199-208
136
A. Destexhe, D. Contreras, M Steriade (1998) Mechanisms underlying the synchronizing action of corticothalamic feedback through inhibition of thalamic relay cells. J Neurophysiol. Vol. 79(2). pp. 999-1016
137
E. Lábos (1988) Neuronal operations on asynchronous time scale emulated with synchronous models (chaotic interval maps). Cybernetics and Systems’88 (Ed.: R. Trappl) Kluwer Academic Publishers pp. 983-990
138
A.K. Engel, P. König, A.K. Kreiter (1992) Temporal coding in the visual cortex: new vistas on integration in the nervous system. TINS. Vol. 15(6). pp. 218-226
139
B. Jagadeesh, C.M. Gray, D. Ferster (1992) Visually Evoked Oscillations of Membran Potential in Cells of Cat Visual Cortex. Science Vol. 257. pp. 552-554
140
M. Brosch, R. Bauer, R. Eckhorn (1995) Synchronous High-frequency Oscillations in Cat Area 18. European Journal of Neuroscience Vol. 7. pp. 86-95
141
A.K. Kreiter, W. Singer (1996) Stimulus-dependent synchronization of neuronal responses in the visual cortex of the awake macaque monkey. J. Neuroscience Vol. 16(7). pp. 23812396
142
P. König, A.K. Engel, W. Singer (1995) Relation between oscillatory activity and longrange synchronization in cat visual cortex. Proc. Natl. Acad. Sci.USA. Vol. 92(1). pp. 290294
143
J.M. Alonso, WM. Usrey, R.C. Reid (1996) Precisely correlatted firing in cells of the lateral geniculate nucleus. Nature Vol. 383. pp. 815-819
144
A. Aertsen, M. Arndt (1993) Response synchronization in the visual cortex. Current Opinion in Neurobiology Vol. 3. pp. 586-594
145
R. Eckhorn (1994) Oscillatory and non-oscillatory synchronizations in the visual cortex and their possible roles in associations of visual features. Prog. Brain Res. Vol. 102. Pp 405-426
146
R. Eckhorn, A Frien (1995) Neural signals as indicators of spatial and temporal segmentation coding in the visual system.
- 113 -
Idézett irodalom
147
S.L. Bressler, R. Coppola, R. Nakamura (1993) Episodic multiregional cortical coherence at multiple frequencies during visual task performance. Nature Vol. 366. pp. 153-156
148
A.K. Engel, P.R. Roelfsema, P. Fries, M. Brecht, W. Singer (1997 ) Role of the temporal domain for response selection and perceptual binding. Cereb Cortex Vol. 7(6). pp. 571-582
149
M. Joliot, U. Ribary, R.L. Linás (1994) Human oscillatory brain activity near 40 Hz coexists with cognitive temporal binding. Proc. Natl Acad. Sci. USA Vol. 91. pp. 11748-11751
150
A.K. Engel, P. König, P.R. Roelfsema, W. Singer (1995) How precise is Neural Synchronization? Neural Computation Vol. 7. pp. 469-485
151
L.G. Nowak, M.V. Sanchez-Vives, D.A. McCormick (1997) Influence of low and high frequency inputs on spike timing in visual cortical neurons. Cereb Cortex Vol. 7(6). pp. 487501
152
P. König A.K. Engel, W. Singer (1996) Integrator or coincidence detector? The role of the cortical neuron revisited. TINS. Vol. 19(40). pp. 130-137
153
M.H.J. Munk, P.R. Roelfsema, P. König, A.K. Engel, W. Singer (1996) Role of reticular activation in the modulation of intracortical synchronization. Science Vol. 272. pp.271-274
154
F. Amzica, M. Steriade (1996) Progressive Cortical Synchronization of ponto-geniculooccipital potentials during rapid Eye movement sleep. Neuroscience Vol. 72(2). pp. 309-314
155
M. Steriade, F. Amzica, D. Contreras (1996 ) Synchronization of Fast (30-40 Hz) Spontaneous Cortical Rhythms during Brain Activation. The Journal of Neuroscience Vol.16(1). pp. 392-417
156
A.M. Thomson, J. Deuchars, D.C. West (1993.) Large, Deep Layer Pyramid-Pyramid Single Axon EPSPs in Slices of Rat Motor Cortex Display Paired Pulse and Frequency-Dependent Depression, Mediated Presynaptically and Self-Facilitation, Mediated Postsynaptically. Journal of Neurophysiology Vol.70. pp. 2354-2369
157
A.M. Thomson, J. Deuchars, D.C. West (1993) Single axon excitatory postsynaptic potentials in neocortical interneurons exhibit pronounced paired pulse facilitation. Neuroscience Vol. 54(2). pp. 347-360
158
H. Perkel, T.H. Bullock (1968) Neural Coding. Neuroscience Research Program Bulletin Vol. 6. pp. 221-344
159
G. Mitchison, C. Miall (1990) The Enigma of cortical code. TINS. Vol. 13(2). pp. 41-43
160
W. Bialek, F. Rieke, R.R. de Ruyter van Steveninck, D. Warland (1991) Reading a Neural Code. Science Vol. 252. pp. 1854-1857
161
J. Deuchars, D.C. West, D. Ferster, N. Spruston (1995) Cracking the Neural Code. Science Vol. 270. pp. 756-757
162
A. Longtin, A. Bulsara, F. Moss (1991) Time-interval sequences in bistable systems and noise-induced transmission of information by sensory neurons. Physical Review Letters Vol. 67. pp. 656-659
- 114 -
Idézett irodalom
163
W. Gerstner, J.L. van Hemmen (1992) Universality in neural networks: the importance of the 'mean firing rate' . Biol. Cybern. Vol. 67. pp. 195-205
164
B.J. Richmond, L.M. Optican (1990) Temporal Encoding of Two-Dimensional Patterns by Single Units in Primate Primary Visual Cortex II. Information Transmission. J. of Neurobiol. Vol. 64(2). pp. 370-380
165
M.J. Tovée, E.T. Rolls, A. Treves, R.P. Bellis (1993) Information encoding and th responses of single neurons in the primate temporal visual cortex. Journal of Neurophysiology Vol. 70. pp.640-654
166
W.R. Softky (1995) Simple codes versus efficient codes. Current Opinion in Neurobiology Vol. 5. pp. 239-247
167
D.W. Tank, J.J. Hopfield (1987) Neural computation by concentrating information in time. Proc. Natl. Acad. Sci. USA Vol. 84. pp. 1896-1900
168
P. König, A. Engel, W. Singer (1996) Integrator or coincidence detector? The role of the cortical neuron revisited. TINS. Vol. 19(4). pp.130-137
169
A.M. Thomson (1997) More then Just Frequency detectors? Science Vol. 275. pp 179-180
170
W. Bair, C. Koch (1996) Temporal precision of Spike trains in extrastriate cortex of the behaving macaque monkey. Neural Computation Vol. 8. pp. 1185-1202
171
R.R. de Ruyter van Stevenick, G.D. Lewen, S.P. Strong, R. Koberle, W. Bialek. (1997) Reproducibility and variability in neural spike trains. Science Vol. 275. pp. 1805-1808
172
J.M. Alonso, W.M. Usrey, R.C.Reid (1996) Precisely correlated firing in cells of the lateral geniculate nucleus. Nature Vol. 383. pp. 815-819
173
Y.F. Mainen, T.J. Sejnowski (1995) Reliability of spike Timing in Neocortical Neurons. Science 268. pp. 1503-1506
174
M.N. Shadlen, W.T. Newsome (1995) Is there a signal in the noise? Current Opinion in Neurobiology Vol. 5. pp. 248-250
175
M. Abeles, E. Vaadia, H. Bergman. (1990) Firing patterns of single units in the prefrontal cortex and neural network models. Network Vol. 1. pp. 13-25
176
A.F. Dean. (1981) The Variability of Discharge of Simple Cells in Cat Striate Cortex. Exp. Brain Res. Vol. 44. pp. 437-440
177
W. Softky, C. Koch (1993) The Highly Irregular Firing of Cortical Cells Is Inconsistent with Temporal Integration of Random EPSPs. J. of Neurosci. Vol. 13(1). pp. 334-350
178
M.J. Berry, D.K. Warland, M. Meister. (1997) The structure and precision of retinal spike trains. Proc. Natl. Acad. Sci. USA Vol. 94. pp.5411-5416
179
M.V. Tsodyks, H. Markram (1997) The neural code between neocortical pyramidal neurons depends on neurotransmitter release probability. Proc. Natl. Acad. Sci. USA Vol. 94. pp.719-723
- 115 -
Idézett irodalom
180
M. Bear, L.N. Cooper, F.F. Ebner (1987) A Physiological Basis for a Theory of Synapse Modification. Science Vol. 237. pp. 42-48
181
T.J. Sejnowsky (1996) Synapses get smarter. Nature Vol. 382. pp 759-760
182
H. Markram, M. Tsodyks (1996) Redistribution of synaptic efficacy between neocortical pyramidal neurons. Nature Vol. 382. pp. 807-810
183
Y. Burnod, H. Korn (1989) Consequences of stochastic release of neurotransmitters for network computation in the central nervous system. Proc. Natl. Acad. Sci. USA Vol. 86. pp.352-356
184
M. Volgushev, L.L. Voronin, M. Chistiakova, A. Artola, W. Singer (1995) All-or-none Excitatory Postsynaptic Potentials in the Rat Visual Cortex. European Journal of Neuroscience Vol. 7. pp. 1751-1760
185
C.F. Stevens, Y. Wang (1994) Changes in reliability of synaptic function as a mechanism for plasticity. Nature Vol. 371. pp. 704-707
186
A.M. Thomson, D.C. West (1993) Fluctuations in pyramid-pyramid excitatory postsynaptic potentials modified by presynaptic firing pattern and postsynaptic membrane potential using paired intracellular recordings in rat neocortex. Neuroscience Vol. 54(2). pp. 329-346
187
A.B. Ali, A.M. Thomson. (1998) Facilitating pyramid to horizontal oriens alveus interneurone inputs: dual intracellular recordings in slices of rat hippocampus. Journal of Physiology Vol. 507. pp. 185-199
188
A.B. Ali, J.Deuchard, H. Pawelzik, A.M. Thomson. (1998) CA1 pyramidal to basket and bistratified cell EPSPs: dual intracellular recordings in rat hippocampal slices. Journal of Physiology Vol. 507. pp. 201-217
189
D.M. Kullmann, R.A. Nicoll. (1992) Long-term potentiation is associated with increases in quantal content and quantal amplitude. Nature Vol. 357. pp. 240-246
190
K.R. Turringiano, N.S. Leslie, L.C. Desai, S.B. Rutherford, Nelson (1998) Activity dependent scaling of quantal amplitude in neocortical neurons. Nature Vol. 391. pp. 892-896
191
T. Manabe, R.A. Nicoll (1994) Long-term potentiation: evidence against an increase in transmitter release probability in the CA1 region of the hippocampus. Science Vol. 265(5180). pp.1888-1892
192
L.F. Abbott, J.A. Varela, K. Sen, S.B. Nelson (1997) Synaptic depression and cortical gain control. Science Vol. 275. pp. 220-224
193
J. Deuchars, D.C. West, A.M. Thomson (1994) Relationships between morphology and physiology of pyramid-pyramid single axon connections in rat neocortex in vitro. Journal of Physiology Vol. 478. pp.423-435
194
P. Sah (1996) Ca++-activated K+ currents in neurons: types, physiological roles and modulation. Trends in Neuroscience Vol. 19(4). pp 150-154
195
X.J. Wang (1998) Calcium coding and adaptive temporal computation in cortical pyramidal neurons.J Neurophysiol Vol. 79(3). pp 1549-66
- 116 -
Idézett irodalom
196
F. Engert, T. Bonhoeffer (1997) Synapse specificity of long term potentiation breaks down at short distances. Nature Vol. 388. pp. 279-284
197
P. Tompa, P. Friedrich (1998) Synaptic metaplasticity and the local charge effect in postsynaptic densities. TINS. Vol. 21. pp. 97-102
198
W.C. Abraham, W.P. Tate (1997) Metaplasticity: A new vista across the field of synaptic plasticity. Progress in Neurobiology Vol. 52. pp. 303-323
199
I. Aradi, P. Erdi (1996) Multicompartmental modeling of neural circuits in the olfactory bulb. Int J Neural Syst. Vol. 7(4). pp. 519-27
200
L.F. Abbot, J.A Varela, Sen Kamal, S.B. Nelson (1997) Synaptic depression and Cortical gain control. Science Vol. 275. pp. 220-224
201
A.M. Thomson, D.C. West, J. Deuchars (1995) Properties of single axon excitatory postsynaptic potentials elicited in spiny interneurons by action potentials in pyramidal neurons in slices of rat neocortex. Neuroscience Vol. 69(3). pp. 727-738
202
D. Debanne, B.H. Gahwiler, S.M. Thompson (1998) Long-term synaptic plasticity between pairs of individual CA3 pyramidal cells in rat hippocampal slice cultures. Jourrnal of Physiology Vol. 507. pp. 237-247
203
D. Debanne, N.C.Guérineau, B.H. Gahwiller, S.M. Thomson (1994) Physiology and PharmacolFogy of Unitary Synaptic Connections Between Pairs of Cells in Areas CA3 and CA1 of Rat Hippocampal Slice Cultures. Journal of Neurophysilogy Vol. 73. pp. 1282-1294
204
N.R. Hardingham, A.U. Larkman (1997) The reliability of excitatory synaptic transmission in slices of rat visual cortex in vitro is temperature dependent. Journal of Physiology Vol. 507. pp.249-256
205
E.S. Vizi, E. Labos (1991) Non-synaptic interactions at presynaptic level. Prog. Neurobiol. Vol. 37(2). pp.145-63
206
W. Maas, A.M. Zador (1998) Dynamic Stochastic Synapses as computational Units.
207
D. Golomb, D. Kleinfeld, R.C. Reid, R.M. Shapley, B.I. Shraiman (1994) On temporal Codes and the spatiotemporal Response of Neurons in the Lateral Geniculate Nucleus. Journal of Neurophysiology Vol. 72. pp. 2990-3003
208
D.A. Hoffman, J.C. Magee, C.M. Colbert, D.Johnston (1997) K+ channel regulation of signal propagation in dendrites of hippocampal pyramidal neurons. Nature Vol. 387. pp. 869-875
209
R.C. Malenka, B. Lancaster, R.S. Zucker (1992) Temporal limits on the Rise in Postsynaptic Calcium required for induction of long term potentiation. Neuron Vol. 9. pp. 121-128
210
D. Neveu, R.S. Zucker (1996) Postsynaptic levels of [Ca2+]i Needed to Trigger LTD and LTP. Neuron. Vol 16. pp. 619-629
211
H. Markram, J.Lübke, M. Frotscher, A. Roth, B. Sakmann (1997) Physiology and morphology of synaptic connections between thick tufted pyramidal neurons in the developing rat neocortex. Journal of Physiology Vol. 500. pp. 409-440
- 117 -
Idézett irodalom
212
M.S. Fazeli, G.L. Collingridge (1996) Cortical Plasticity LTP and LTD.BIOS scientific publishers Ltd. Oxford.
213
W. Gerstner, A.K. Kreiter, H. Makram, A.V.M. Herz (1997) Neural code: Firing rates and beyond. Proc. Natl. Acad. Sci. USA. Vol. 94. pp.12740-12741
214
W. Maas (1998) On the relevance of time in neural computation and learning.
215
W. Maas (1997) Networks of spiking neurons: The third generation of neural network models.
216
A. Zador (1998) The Impact of Synaptic unreliability on the Information Transmitted by Spiking Neurons. Journal of Neurophysiology (in press)