Artificial Intelligence & Neurocognition - UL - StudyNotes (NL) (2014-2015)

4.1 Parallelle distributieproces benadering
4.2 Hippocampus en neocortex bij geheugen
4.3 Supervised learning: gradient descent and backpropogation
5.1 Neuronale tekeningen van samenkomende celorganisaties
5.2 An attractor neural network (ANN)
5.3 Compositionele connectionistische structuren zoals gepresenteerd in situ gegronde representaties
5.4 Hippocampus en neocortex bij geheugen herkenning

4.1 Parallelle distributieproces benadering

Alles wat we om ons heen zien lijkt bekend. We hebben verwachtingen over de objecten die we zien. Deze objecten kunnen we ook omschrijven en benoemen. Het begrijpen hiervan is een basiselement voor het waarnemen van de wereld. Hoe dit kan is de hoofdvraag in het onderzoek bij semantische cognitie.

Het onderzoek van semantische processen was een centraal punt voor de experimentele en computer onderzoeken aan het begin van de cognitieve revolutie. Tussen 1960-1970 was men overtuigd van een vaste set proposities in de hersenen voor semantische kennis. In de jaren ‘70 besloot men dat dit bij sommige categorieën niet klopte. Toen ontstond de ‘op gelijkheid gebaseerde benadering’. Deze benadering stelde dat semantische informatie wordt gecodeerd op basis van kenmerk gebaseerde representaties. Er kwamen specifieke hypotheses over hoe dit mechanisme zou werken.

Tegenover de ‘op gelijkheid gebaseerde bandering’ stond de ‘theory theory benadering’. Deze benadering suggereert dat semantische kennis is ingebouwd in een systeem van impliciete geloven over causale krachten die zorgen voor de observeerbare kenmerken van een object. Impliciete en informele causale theorieën bepalen welke set van items hoort bij een generalisatie. Hierbij rijzen de vragen: welke kenmerken zijn nodig voor het bepalen van een categorie? Welke eigenschappen zijn makkelijk aan te leren welke niet? De ‘theory theory benadering’ heeft echter nooit een model uitgebracht, maar enkel theorieën omschreven en generalisaties aangeboden.

Dit artikel kijkt verder naar een theorie over de cognitieve mechanismen die gebruikt wordt bij spreidingsactivatie en op gelijkheid gebaseerde theorieën. Er wordt vooral gekeken naar de fenomenen die centraal zijn bij de kritieke reacties op de op gelijkheid gebaseerde theorieën.

Het PDP kader

Het model dat gebruikt wordt is dat van Rumelhart uit figuur 1. Hierbij wordt gekeken naar hoe propositionele informatie werd opgeslagen in een propositioneel hiërarchisch model zoals je in figuur 2 ziet. De input en output lagen komen overeen met de bestanddelen van de proposities. Ieder bolletje is weer gekoppeld aan andere bolletjes in het model.

De items hebben meerdere relaties door het model en moeten uiteindelijk uitkomen bij de juiste attributie. De taak van het model is de juiste attributen in de output aan te geven als die overeenkomt met de input. Het model is een netwerk dat bestaat uit een serie van niet-lineaire units. De units zijn georganiseerd in lagen. Door units te activeren komt er een attributie tot stand. Hiervoor worden bij iedere pijl waarden berekend zodat de juiste unit gaat vuren. Deze waarden worden aangeleerd met behulp van ‘backpropagition’. Eerst wordt er een item getoond aan het netwerk en wordt de juiste activatie voorspeld aan de output units. De geobserveerde output wordt dan vergelijken met het target. Verschillen in de route worden gelabeld als error. De juiste error wordt berekend met een backward pass. In het begin wordt er voor gezorgd dat alle items duidelijk van elkaar verschillen zodat het model goed kan leren. Daarnaast worden er overal evenveel leercategorisaties gemaakt (zie figuur 2). Naderhand kan dan makkelijk worden onderzocht wat het netwerk ‘weet’, door de activatie van de interne units te bekijken.

Dit netwerk is nog te eenvoudig vergeleken bij het menselijk brein. De hoofdfunctie van Rumelharts systeem was de prestatie op een taak te ondersteunen. Dit werd gedaan door de juiste connecties in het netwerk te maken zodat het netwerk uiteindelijk de juiste representatie kon geven bij een input (zowel gesproken als visuele input).

Waarschijnlijk werkt het netwerk als volgt: twee delen van de input representeren een waargenomen object en uit de context van de aanwezige informatie wordt een gehele representatie gevormd. Verschillende input en contexten zorgen voor andere representaties. Zo kan het systeem specifieke output genereren. Dit is ook zoals wij leren. Als we een object zien in een bepaalde context, dan leren we wat er op dat moment gebeurt (bijvoorbeeld een vogel zal wegvliegen als er een kat aankomt). Als er iets anders gebeurt dan verwacht spreek je van ‘discrepantie’. Deze discrepantie wordt gebruik om errorgewichten te berekenen. Er blijft dus een scheiding bestaan tussen wat waargenomen wordt en welke kennis zich in het brein bevindt.

Berekeningen voor dit fenomeen

Vanaf een zeer jonge leeftijd zijn kinderen gevoelig voor visuele gelijkenissen in de wereld. Het aanleren van relaties over semantische gelijkenissen gebeurt na de geboorte. Zodoende is er eerst brede kennis over categorieën en wordt de kennis steeds gedetailleerder. Dit spreekt echter wel het idee tegen dat kinderen eerst voorbeelden leren (zoals auto en hond) en daarna pas de categorieën (zoals voertuig en dier). Voor dit fenomeen zijn twee bewijzen:

Kinderen kunnen al vanaf 3 maanden categoriseren op basisniveau. Als tegenbewijs is echter gevonden dat kinderen in goed gestructureerde studies meer onderscheidingen maken tussen categorieën dan binnen categorieën.
Voor bekende stimuli (zoals honden) leren kinderen eerst basis namen en later pas algemene termen (een hond is een dier).

Deze bevinding is wel robuust, maar wanneer kinderen leren praten kunnen ze de onderscheidingen al maken. Nu wordt gekeken naar hoe kinderen dit leren. Dit werd gedaan door het model van Rumelhart te trainen. De training bestond uit het aanleren van alle basiskenmerken van acht voorwerpen (vier soorten planten en vier dieren). Om goed te zien hoe het leren verging werd er bij de verschillende voorwerpen op andere moment gestopt met leren (dit is weergegeven in figuur 3). In figuur 4 zie je hoe de voorwerpen eerst worden geclusterd en dan per voorwerp worden geleerd. Dit is de vertekening van wat je in figuur 3 kunt zien.

Om te begrijpen hoe het netwerk werkt moet je weten hoe het dingen leert. In het begin van het proces vertonen alle voorwerpen ongeveer dezelfde activatie. Als twee voorwerpen op elkaar lijken dan zijn de activatiepatronen ook meer hetzelfde. De gewichten die dan in eerste instantie worden gevormd voor het aansturen van de juiste units (te vergelijken met neuronen) krijgen dan ongeveer dezelfde gewichten. Twee verschillende voorwerpen kunnen echter ook andere gewichten doorgeven. Zodra je bij twee verschillende objecten naar de output kijkt zie je dat één route meer error bevat. Dit is dan de foute representatie. De grootste verschillen zijn te zien tussen voorwerpen van verschillende categorieën.

Bovenstaande beschrijving geeft goed aan hoe het werkt, maar vertelt niet waarom er eerst overkoepelende structuren worden aangeleerd. Dit komt door verschillende factoren. De voornaamste reden is dat de structuren die bepaalde groepen voorwerpen aansporen erg op elkaar lijken. Het is dan makkelijker eerst de algemene kenmerken te bekijken en daarna pas de individuele kenmerken te beoordelen. Zo is het ook het makkelijkste om de juiste gewichten toe te passen. De individuele kenmerken worden vaak pas opgemerkt nadat een generalisatie niet klopt (niet alle vogels kunnen vliegen). Deze theorie geldt voor de input naar de representatielaag uit het model van figuur 1.

Het is aannemelijk dat generalisaties eerder worden geleerd, omdat als er vanaf het begin al details geleerd worden er veel error aankomt bij de representatie laag. Bij veel error stuurt deze geen informatie meer door en zul je vaak vastlopen in het proces. Dit wordt aangetoond bij de error die wordt teruggestuurd.

In het voorbeeld van de kanarie zijn er drie errors die terugkomen:

de error van het onderscheidt tussen dier en plant (de grootste);
het onderscheid tussen vogel en vis;
het onderscheid tussen kanarie en parkiet.

Dit is te zien in figuur 5. Des te sterker een bepaald kenmerk aanwezig is, des te sneller het wordt geactiveerd en tot een piek komt. De onderscheidingen worden aangeleerd vanaf de meest basale kenmerken. Een voorbeeld van een basaal kenmerk tussen planten en dieren is dat dieren zich kunnen bewegen. Gekeken wordt namelijk naar die kenmerken die het meest voorkomen, omdat het dus makkelijk van algemeen naar specifiek leert dan andersom.

Samenvattend kan dus worden gezegd dat verschillende input niet zorgt voor verschillende output, maar dat de error ervoor zorgt dat de juiste representatie kan worden gekozen.

Categorie samenhang

Samenhang is een term die gebruik wordt om individuen te groeperen. Die groepen kunnen dan weer gebruikt worden voor kennis generalisatie. De ene groep is natuurlijker dan de ander of kenmerkender dan de andere groep. De vraag is echter hoe het semantische systeem weet welke groepen nuttig zijn.

Aangenomen wordt dat groepen worden gevormd als er veel kenmerken overeenkomen. Echter gelijkheid van kenmerken is volgens Murphy en Medin niet sterk genoeg om te gelden als de juiste oplossing. Zij halen twee redenen aan waardoor dit proces te simpel zou zijn:

Er wordt dan geen onderscheid gemaakt tussen welke kenmerken het meest en hoe meetellen. Alle gestreepte dieren zouden dan in dezelfde groep komen. Dit wordt waarschijnlijk berekend op causale relaties tussen meerdere eigenschappen. Hierdoor kan bepaald worden welke eigenschappen vaak bij elkaar horen.
Het kennen van objecten correspondeert niet met egale kenmerken van moeilijkheidsgraad tussen alle objecten. Er wordt vooral gekeken naar het verschil tussen kunnen en hebben.

In figuur 6 staat een trainingsprogramma van hoe dit verschil wordt aangeleerd. Sommige kenmerken zijn bij meerdere objecten aanwezig en sommige kenmerken zijn uniek. Het model moet dan leren hoe dit te onderscheiden. Figuur 7 toont aan hoe dit gaat. Overeenkomstige kenmerken worden bij elkaar gezet. Sommige staan verder bij elkaar vandaan en anderen horen juist bij elkaar. Dit moet je wel zien om te begrijpen. Het netwerk is gevoeliger voor coherente items. Dat zijn samenhangende kenmerken.

Schijncorrelaties

Soms weet je dat iets aanwezig is zonder dat je het ziet. Dit zijn schijncorrelaties. Deze zijn erg belangrijk want ze geven aan dat er een organiserende kracht is bij kinderen die verder gaat dan associatief leren. Je moet dan iets geloven/weten want je ziet het niet. Wellicht kan dit omdat kinderen impliciete theorieën hebben. Ideeën uit een dergelijke theorie kunnen ook automatisch worden toegepast bij een nieuw object. Deze theorie kan er ook voor zorgen dat kinderen niet overeenkomende informatie negeren. Schijncorrelaties worden soms gezien als bewijs voor de rol van impliciet leren van causale theorieën bij conceptuele kennis.

Het eerder besproken model komt met een andere verklaring: schijncorrelaties zijn een bijproduct van de gevoeligheid tot samenhangende covariaties. Bijvoorbeeld: een konijn moet wel voeten hebben, want dat hoort erbij hij heeft toch ook ogen en haren. Om dit te onderzoeken is het vorige model opnieuw getraind met een andere set objecten. Naast de oude objecten zijn er een aantal vierpotige dieren aan toegevoegd. Dit werd gedaan omdat de oude set te makkelijk was om alle onderzoekspunten te kunnen beantwoorden. Er kan nu namelijk specifiek gekeken worden naar zeer kleine verschillen tussen objecten. Verder wordt er dan bekeken of het model juist kan reageren op termen als ‘heeft vleugels’ of ‘kan vliegen’ (de ‘hebben taak’ en de ‘kunnen taak’). Figuur 8 toont de reacties op deze taak. Deze simulatie demonstreert dat de schijncorrelatie kan ontstaan vanuit een domein generale correlatie tussen samenhangende covariaties.

Domeinspecifieke attributie weging

De stelling dat concepten aangeboren worden is afkomstig van het feit dat jonge kinderen al op verschillende manier informatie kunnen toepassen op conceptuele domeinen. Bepaalde groepen hebben een hoofdkenmerk waar kinderen op verder redeneren, bijvoorbeeld kleur bij voedsel en vorm bij speelgoed. Om een object te categoriseren moet men dus weten hoe belangrijk bepaalde kenmerken voor dat object zijn.

Belangrijk is om eerst weten tot welke categorie een object behoort. Om dit te testen is het model uitgebreid met een aantal eigenschappen waarbij van te voren is vastgesteld dat het voor de categorie planten belangrijk is of ze groot/klein zijn en bij dieren dat ze helder of dof zijn. Hier werd gebruik gemaakt van de backpropagation. De data staan in tabel 2. Figuur 9 toont de output van het model. Gebleken werd dat als een kenmerk genoemd werd er bepaald werd of het om planten of dieren ging en de categorieën vervolgens volgens bovenstaande informatie verdeeld werden. Zo lijkt het alsof het model weet wat belangrijk is om op te groeperen. Dit kan dus worden aangeleerd. Door een kenmerk de noemen (bijvoorbeeld helder) worden ook direct de juiste objecten naar voren gehaald (de vissen). Wat we zien is dat domein specifieke beperkingen geen voorbestaande kennis nodig hebben als het gaat om de juiste gewichten toekennen. Deze kennis kan worden aangeleerd.

Inductie en conceptuele verandering

Een belangrijke bron van informatie over concept kennis komt van inductieve projectie. Kinderen reageren op vragen in een systematische manier die overeenkomt met de ontwikkeling. Ze passen hun kennis aan zodra ze geloven dat iets klopt. En gaan zo van het specifieke naar het algemene. Bijvoorbeeld 1 dinosaurus had warm bloed dus hadden ze allemaal warm bloed. Deze inductie verandering is belangrijk bij het onderzoeken van het ontwikkelen van causale theorieën.

Hoe ouder je wordt hoe meer je ook leert en kan toepassen. Kinderen leren ook uit ervaring. Meer specifiekere kenmerken worden aangeleerd door causale relaties wat op iets oudere leeftijd gebeurd.

Hier wordt gekeken naar de inductieve projectie ontwikkeling bij kinderen tussen 4 en 10 jaar oud. De veranderingen die optreden kunnen als volgt worden omschreven.

Patronen van inductieve projectie veranderen over tijd.
Ze kunnen verschillen bij verschillende eigenschappen.
De patronen worden specifieker naarmate men ouder wordt.
Patronen van inductie projectie kunnen zich samensmelten of juist onderscheiden.

De juiste antwoordmogelijkheid wordt dus gegenereerd via een bepaald leerproces. Belangrijk hierbij is de representatielaag waarin objecten altijd een vast activatiepatroon hebben. De context is erg belangrijk voor het juist vaststellen om welk object het gaat en deze wordt gerepresenteerd in de verborgen laag. Deze eindigt ook op de representatielaag. Hierna wordt overigens bepaald welk object de aandacht krijgt. Een nieuw object is altijd afhankelijk van de representatielaag, relatielaag en verborgen laag. Dit komt doordat verschillende contexten ook weer verschillende reacties oproepen. De patronen die zo ontstaan verschillen dan altijd iets en ontwikkelen zich over tijd.

Om te bepalen hoe factoren het inductiegedrag van het model beïnvloeden is een onderzoek gedaan waarbij op 2 punten tijdens de training werd gemeten. Gekeken werd naar hoe een compleet nieuwe eigenschap werd aangeleerd. In de attributielaag werd de eigenschap queem al ingebouwd. Queem is een niet bestaand woord om te onderzoeken hoe eigenschappen worden aangeleerd. Tijdens de training werd echter niets over queem aangeleerd. Wel werden er bepaalde gewichten gekoppeld aan kunnen queem, is queem en hebben queem. Waarbij kunnen queem generaliseert naar algemene planten is naar bomen en hebben naar specifieke planten.

Het model gedroeg zich alsof het ´wist´dat verschillende eigenschappen anders aanwezig zijn bij objecten. Langzaam werden de connecties tussen de lagen aangepast waarmee de eigenschap kon worden aangeleerd. In figuur 11 kun je de activatiepatronen (van de verborgen laag) van de objecten zien na het einde van de training.

Het bleek dat het model vooral leert uit ‘is’, ‘kunnen’ en ‘hebben’ eigenschappen. Vergeleken wordt hoeveel een object van een bepaalde categorie heeft en daar wordt op gelet. Een plant ‘heeft’ bijvoorbeeld veel eigenschappen, maar ‘kan’ minder dan een dier.

Deze patronen van ontwikkeling komen niet alleen voor binnen een PDP raamwerk maar ook meer in het algemeen bij leerprocessen. Belangrijk hierbij is dat geleerd wordt van overeenkomende eigenschappen eerst en gedetailleerde eigenschappen later. De eigenschappen die gezien kunnen worden, worden makkelijker aangeleerd dan dingen die je moet weten. Bijvoorbeeld kleuren tegenover metabolische dingen. Dingen die je ziet worden vaker benoemd en daardoor kan er makkelijker geleerd worden. Vandaar dat veel dingen ook contextafhankelijk zijn. Daarnaast kunnen eigenschappen ook makkelijker logischerwijs aan elkaar worden gekoppeld. Bijvoorbeeld iets wat vleugels en veren heeft kan waarschijnlijk ook vliegen. En zo worden die dingen snel automatisch samen gezien.

Het model biedt dus 2 manieren aan voor het begrijpen van theorieverandering bij een inductiemodel.

Als eerste: kinderen worden ook steeds gevoeliger voor bepaalde situaties en contexten bij het leren. Zodat ze zelf steeds makkelijker inductie kunnen toepassen. En ten tweede: De domein generale representaties die met verwerft na ervaring kunnen in veel verschillende contexten ontstaan. En worden beïnvloedt door de frequentie, toepasbaarheid en context van informatie. Sterke frequentie heeft veel invloed tijdens het leren terwijl een zwakke frequentie alter juist een sterke invloed kan hebben.

4.2 Hippocampus en neocortex bij geheugen

Dit artikel beschrijft een theorie over hoe de neocortex en hippocampus samenwerken bij het geheugen en leerprocessen. Dit wordt bekeken met op biologie gebaseerde neuronale netwerk computersimulaties, namelijk een concensual model. Hierbij liggen de voornaamste contributies bij:

1. computerprincipes gebruiken voor het beschrijven van het werk tussen de neocortex en hippocampus

2. deze principes in een computermodel omschrijven, zodat dit model gebruikt kan worden om onderzoek mee te doen.

Het complementaire leersysteem (CLS)

Het CLS-raamwerk is gebaseerd op logische afscheidingen van samenwerkende onverenigbare computerdoelen. Dit wordt gebruikt als ondersteuning bij het onderzoeken van leerprocessen naar algemene en specifieke dingen. Deze doelen worden benaderd met twee op zichzelf staande geheugensystemen, met ieder zijn eigen specialiteiten. De hippocampus is belangrijk voor snel en automatisch encoderen terwijl de neocortex gespecialiseerd is voor het langzaam ontwikkelen van representaties over generale kenmerken van de omgeving. Daarnaast zorgt de hippocampus voor gescheiden geheugenpatronen, terwijl de neocortex juist overlap zoekt. Daarbij leert de hippocampus snel en de neocortex langzaam.

Het raamwerk dat wordt gebruikt bevat dus ook twee onderdelen: de één voor snel leren en de andere voor gradueel leren. Belangrijk is om te kijken hoe deze hersenstructuren het beste vertaald kunnen worden. Uit onderzoek bleek dat de neuronen die in de hippocampus vuren schaarser zijn dan in de neocortex. In het artikel is een neuraal netwerk geprogrammeerd dat werkt zoals de hippocampus en neocortex. Alle modellen van de hersenen lijken op elkaar, maar zijn specifiek in welk hersengedeelte ze nadoen. Ze lijken op elkaar omdat de meeste hersengebieden gelijknamig werken. Zodoende kan één model een hoop bevindingen weergeven.

Op biologie gebaseerd duo-proces in herkenning en geheugen

Het CLS-model is gebaseerd op de duo-proces theorie. Het belangrijkste kenmerk hierbij is het herkennen van bestuurde items gebaseerd op:

recall (ofwel terugroepen van een herinnering)
gevoel van herkenning

Er wordt in het artikel aangetoond dat het hippocampusmodel ondersteuning geeft voor recall. De neocortex kan juist het gevoel van bekendheid oproepen. Het CLS baseert zijn concept op hippocampus en corticale bijdragen in termen van verschillen tussen hun structuren. Dat maakt het CLS-model ook vrij risicovol, want het zit op de rand van wat wetenschappers goedkeuren.

De cortex kan reageren op een gevoel van bekendheid, omdat de signalen die er komen via een scherp dynamisch proces binnenkomen. Het contrast tussen de actieve en minder actieve neuronen geven een presentatie van de input. Bij de eerste representatie zijn de verborgen neuronen niet goed afgesteld op het inputpatroon en veroorzaken ze zwakke signalen. Door middel van Hebbian-leren worden de juiste units steeds gevoeliger en actiever. Meer actieve neuronen produceren meer inhibitie. Hierdoor zullen de zwakke neuronen worden gestopt. De juiste verbindingen kunnen dan worden gelegd.

Het hippocampus model ondersteunt recall, omdat als stimuli aanwezig zijn geweest de hippocampus specifieke patronen aanlegt. Een representatie is dan makkelijk herkend bij een nieuwe input.

Nu volgen twee representatieve toevoegingen van deze modellen over herkenningsgeheugen, namelijk effecten van lokgelijkheid en tussenkomst en het lijst sterkte effect.

1: Effecten van lokgelijkheid

Manipulaties worden gebruikt om iets hetzelfde te laten lijken. Bij bestudeerde woorden leveren zowel de hippocampus als de neocortex een signaal. Echter als het nieuw getoonde woord veel lijkt op een geleerd woord zal de neocortex niet heel goed zijn in het onderscheiden van deze twee woorden. De hippocampus die de woorden juist geleerd heeft zal wel de patroonverschillen moeten herkennen en voor een goede herinnering moeten zorgen. Echter voorspelt het model wel dat de neocortex juist zal moeten kunnen onderscheiden. Voorspeld wordt dat bestuurde items toch meer bekend moeten voelen dan er veel op lijkende niet bestuurde items (de items zijn in dit onderzoek woorden). Dit is ook aangetoond.

2: Tussenkomst en lijst sterkte effect

Het is van belang bij de hippocampus om tussenkomst van verschillende herinneringen te vermijden. Dit kan echter nooit compleet vermeden worden (Zeker niet in een computer model). Gekeken wordt hierbij naar sterk geleerde items en zwak geleerde items. Gevonden werd dat sterk geleerde items aangetast worden bij het onderscheiden via de hippocampus maar niet bij de neocortex. Het herkennen van verschillen hangt af van het verschil in hoe men moet reageren op de bestudeerde en de erop lijkende items. Tussenkomst vermindert prestaties bij beide herkenningen, maar vermindert de algemene herkenning niet.

De reactie van de hippocampus op Lure items is echter bijna nihil vanwege de verschillende activatiepatronen. Toch vermindert het sterker maken van de tussenkomst de herkenning van geleerde items. Het signaal vermindert en wordt niet versterkt door de tussenkomst van een lure item waardoor er een kleiner verschil is tussen de bestudeerde en lure items. Door het lijst sterkte effect kan er dus een foute herkenning worden gemaakt door de hippocampus.

Patroon afmaken en contextuele angstconditionering

De bovengenoemde modellen worden wijd gebruikt voor het trainen van dieren. Het grote idee achter het model is dat de hippocampus snel en automatisch kan encoderen en een verbindende representatie van een omgeving kan geven als resultaat van het te zijn blootgesteld aan deze omgeving. Dat is de basis voor de betrokkenheid van de hippocampus bij het encoderen van episodisch geheugen bij mensen. Dit is in tegenstelling tot de cortex die langer de tijd nodig heeft om te leren. Bij ratten kan angstconditionering dit demonstreren door het signaal van de hippocampus te activeren met een cue.

Eerst werden de ratten steeds in een donkere emmer verplaatst naar een bepaalde omgeving. Dit zou de cue worden voor het verplaatsen naar die omgeving. Daarna werd de omgeving ineens veranderd en kregen de ratten een schok waardoor zij gestrest raken. De vraag is echter of ze de schok nu associëren met de andere omgeving of de eerder getoonde omgeving: welke omgeving was in gedachten terwijl de ratten in de emmer zaten? Uit neuronale metingen bleek de hippocampus actiever te zijn, wat aangeeft dat de ratten aan de eerder bekende omgeving dachten. Dit is getest door de ratten later via een andere manier (waarop zij wel alles konden zien) naar de twee betreffende omgevingen te brengen. De ratten vertoonden dan inderdaad een stressreactie bij het zien van de eerste, bekende omgeving en niet bij de nieuwe omgeving waar de schok werd toegediend.

Consistent met het CLS-raamwerk kan de cortex nooit hebben geleerd de schok met de nieuwe omgeving te associëren.

Conclusies

Netwerken gebaseerd op het CLS-principe kunnen gebruikt worden om uit te leggen en te voorspelen hoe gescheiden leerprocessen en geheugen plaatsvinden. Toch blijven er meerdere visies ontstaan over de exacte rol van de hippocampus en neocortex.

4.3 Supervised learning: gradient descent and backpropogation

Gradient descent en de deltaregel

Om te weten wat de ‘deltaregel’ inhoudt en wat ‘gradient descent’ betekent, is het handig om een feedforward netwerk voor te stellen met één output (alfa 1, α₁) en twee input knopen (n₁ en n₂) hetgeen geïllustreerd wordt in figuur 1 in het artikel. De gewichten van het netwerk zijn ω₁₁ (het gewicht van n1 tot α₁) en ω₁₂ (het gewicht van n2 tot α₁).

De activatiefunctie van α₁is:

α₁ = ω₁₁n₁ + ω₁₂ n₂

De errorfunctie E van dit netwerk is:

E = 0,5 (d1 - α₁)²

Hierbij is α₁de huidige outputactiviteit van de outputknoop, gegeven bij (1) en d₁ is de gewenste outputactiviteit van de outputknoop.

De input (n₁ en n₂) en de gewenste output d₁ staan vast. Dus de enige manier om E te veranderen is door ω₁₁en/of ω₁₂te veranderen. Het symbool Δ ω₁₁wordt gebruikt om een kleine verandering van het gewicht ω₁₁ aan te geven en het symbool ΔE wordt gebruikt om een verandering in de error E aan te geven (E is dus verminderd wanneer ΔE < 0).

De volgende vergelijking wordt de deltaregel genoemd en laat zien wat Δω zou zijn om de error te reduceren in het netwerk:

Δω₁₂ = ε(d₁ - α₁)n₂

Het gradiënt van de functie laat de richting van een maximale toename zien, dus het tegenovergestelde van het gradiënt laat de richting van een maximale afname zien (‘descent’). Hierdoor wordt deze leermethode het ‘gradient descent’ genoemd.

Backpropogation

Figuur 3 in het artikel laat een drielagig fedforward netwerk zien met input eenheden n_j, verborgen eenheden h_k en output eenheden α_i. De connecties tussen de input eenheden en de verborgen eenheden zijn ω^_kj en de connecties tussen de verborgen eenheden en de output eenheden zijn ω_ik.

Om de connectiegewichten te veranderen tussen de input en de verborgen laag wordt het effect van de error ‘back propagated’ door de connectiegewichten ω_ik tussen de verborgen laag en de outputlaag. Deze ‘backpropagation’ van de error is een consequentie van het feit dat de error geobserveerd wordt op de outputlaag. Het effect van de gewichten in de lagere lagen en de error kunnen alleen worden verminderd wanneer de informatie over de error teruggevoerd wordt naar deze connectiegewichten. De connecties tussen de verborgen lagen en de outputlagen zijn nodig om dit te kunnen doen.

5.1 Neuronale tekeningen van samenkomende celorganisaties

Het brein is opgebouwd uit miljoenen neuronen die samen zorgen voor de beste informatieproces machine. Hoe alle neuronen echter samenwerken blijft onbekend. Veel onderzoek wordt gericht op de neurale code. Dit kun je zien als een 2keuze uit rate coderen en temporeel coderen. Bij rate coderen is de enige variabele die neuronen gebruiken bij onmiddellijk vuren gekarakteriseerd door spike rates. Bij temporeel coderen speelt de timing van de spikes ook mee in de informatiestroom. Dit laatste is wel moeilijker te ontcijferen. De rate code wordt daarom vaker gebruikt. Hierin is nog een onderscheidt tussen de temporele integratiemode en de coincidence detection mode. Waarbij lekkende moderatoren zorgen voor een EPSP. De laatste mode heeft een kortere EPSP. Het direct meten van een EPSP is erg lastig. Het duurt ongeveer 10-30ms in een piramideneuron. De precieze waarde van de EPSP hangt af van de inhibitie en synaptische achtergrond.

Uit later onderzoek lijkt het zo dat de externe stimuli niet de enige zijn. Ook intern zijn er belangrijke stimuli. De term code refereert dan ook naar de primaire functie van een neuronengroep om informatie over te brengen van de juiste stimulus. Aanhoudende activiteit speelt een belangrijke rol bij het klaarmaken van neuronen voor stimulusreacties. Er zou dus gekeken moeten worden naar sensorische stimuli als modulerend in plaats van deterministisch.

Hebbs cel samenkomst hypothese geeft een gedetailleerde beschrijving voor intrinsieke dynamische circuits bij cognitieve functies. Deze visie wordt verder uitgelicht in het artikel.

Hebbs hypothese

Hebbs hypothese is ontstaan vanuit de tijd dat er nog 2 taboes heerste bij de behavioristen. Namelijk introspectie en neuralizing (hypothese op verwachte breinrelaties). De behavioristen keken voornamelijk naar conditionering en reflexen. Wel was er geaccepteerd dat er een interne staat aanwezig was in het brein die gedragingen kon beïnvloeden. De theorie van Hebb brak het 2^e taboe en legde uit hoe de dynamica van corticale circuits zou kunnen werken bij de interne staat en consequenties op het gedrag voorbij stimulus-respons associaties. De hypothese suggereert dat de sleutel voor interne cognitieve processen (ICP) ligt bij de natuur van neuronale circuits.

De theorie is gebaseerd op de volgende stelling (ook wel Hebb’s regel genoemd) synaptische connecties worden sterker bij synchrone activiteit van de presynaptische en postsynaptische neuronen. Bij herhaalde samenwerking van neuronen tijdens gedrag werd gedacht dat dit de formatie van cel samenkomsten zou veroorzaken. Gelijktijdige excitatie staat de cel samenkomst toe zijn activiteit te behouden zonder continue stroom van stimuli. Een ketting van samenkomende neuronen waarbij de neuronen elkaar aansteken heet een phase sequence. Deze staat complexe berekeningen toe. De cel samenkomst kan geactiveerd worden door zowel sensorische stimuli als interne factoren.

Kenmerken

Hierna worden 4 verwachte experimentele kenmerken genoemd van cel samenkomst organisatie. En vervolgens uitgebreid besproken.

Spike kettingen laten een temporele structuur zien die niet bij de stimulus aanwezig is. Als een stimulus een phase sequence veroorzaakt zal de spike ketting zowel de temporele structuur reflecteren als de sensorische stimulus. Neuronen zullen daarom structurele temporele patronen tonen zelfs voor ongestructureerde temporele stimuli.
Spiking is niet strikt gecontroleerd door sensorische input. Het ontstaan van phase sequence is maar gedeeltelijk beïnvloedt door externe stimuli. Daarom zijn spike kettingen variabel zelfs bij meerdere representaties van dezelfde stimulus.
Wanneer spikes vuren zal gecoördineerd worden om een samenkomst organisatie van cellen te onthullen. Belangrijk is het dan om coördinaten te onderscheiden die behoren tot de ICP en tot de sensorische input.
Patronen van samenkomende activiteit zal correleren met ICPs. Als het de prestatie van ICP reflecteert zal deze worden geobserveerd in patronen van populatie coördinaties. Empirische verificatie is hierbij een uitdaging omdat ICP bij definitie niet observeerbaar zijn.

Kenmerk 1: temporele structuur

Spike kettingen kunnen temporele structuren volgen van een stimulus uit een sensorisch systeem, tot in detail. De timing van spikes kan ook gecorreleerd worden met andere stimulus kwaliteiten dan de temporele structuur, zoals visuele patronen. Deze observaties kunnen worden geïnterpreteerd als bewijs voor temporeel coderen waarbij spike patronen communiceren met de stimulus. De presentatie van een stimulus start de phase sequence welke zich uitbreidt over tijd door de dynamica van het corticale netwerk. Als de specifieke phase sequence die is ontstaan afhankelijk is van stimulus parameters zal de temporele structuur van de stimulus onset hiermee gecorreleerd worden. Dit kan worden aangetoond met onderzoek naar geuren. Verschillende geuren veroorzaken verschillende sequences. En zorgen voor een goede onderscheiding van geuren.

De situatie in de hippocampus is anders door de timing van de spikes. In tegenstelling tot de externe stimuli representatie. In al het gedrag gaat de activiteit stromen van moment naar moment. De gelijkenis van dynamica in spatiële (ruimtelijk) en niet- spatiële gedragingen stelt dat een theta fase niet expliciet staat voor ruimte maar een uiting is van een fundamenteel principe dat het proces hiervan ondersteunt.

Kenmerk 2: spike ketting variabiliteit

In perifere receptoren is de sterkte van een stimulus gecodeerd via het aantal keren dat hij vuurt. In een corticale structuur zijn spike kettingen onregelmatiger. Hoe vaak er gevuurd wordt, wordt regelmatig vergeleken met een poisson proces. Hierbij is spiking constant en onafhankelijk van eerdere activiteit. De variabiliteit van spike kettingen correleert met de locatie in de hiërarchie van het proces. Temporele gestructureerde injecties monden uit in spike tijden die gesloten zijn. Wat aangeeft dat neuronen geen fundamenteel stochastische apparaten zijn. Een andere mogelijkheid is dat onregelmatigheid van output komt door onregelmatigheden vanaf de input. Een derde mogelijkheid voor de variatie is dat de spike kettingen de incomplete controle van de sensorische omgeving reflecteren. Doordat er meerdere verklaringen zijn is het logisch dat de variabiliteit per onderzoek verschilt. Het blijft ook altijd onvoorspelbaar.

Kenmerk 3: populatie organisatie

Als onvoorspelbare spike tijden ontstaan van deelname aan een samenkomst in een ICP zal dit synchroon vuren van neuronen reflecteren. Voor iedere neuron zal de spike ketting eerst voorspeld worden door de externe variabele. Dit zal dan ook de beste voorspelling zijn. Betere voorspelling zouden kunnen worden gedaan als een neuron zal vuren zodra de spike ketting gelijktijdig is opgenomen met andere leden van de samenkomstcellen.

Kenmerk 4: relatie tot ICP

Patronen van samenkomst cellen zijn gecorreleerd met de prestatie van ICP. Voorspellingen hierover blijven lastig omdat ICP niet observeerbaar zijn. Bewijs van gepaarde-neuron opname en veldstudies hebben aangegeven dat neuronale synchronie kan correleren met top-down activiteit. Wat aangeeft dat de aanname van kenmerk 4 klopt. Ander bewijs komt van slaapstudies. Alle sensorische input is dan intern en er zijn nog steeds activiteiten te zien.

Conclusie

Observaties die dus vaak zijn geïnterpreteerd als bewijs voor temporeel coderen kunnen afkomstig zijn van cel samenkomsten in ICPs. Rate coderen kan dus nuttiger zijn. Echter zal hiervoor meer en nauwkeuriger onderzoek nodig zijn.

5.2 An attractor neural network (ANN)

Attractor neurale netwerken (ANN)

Een attractor neuraal netwerk (ANN) is een netwerk waarin alle neuronen aan elkaar gerelateerd zijn zoals is weergegeven in figuur 7.1 in het artikel. In de meest simpele vorm van een ANN hebben de neuronen twee mogelijke activatie staten. Deze kunnen worden gerepresenteerd als 0 en 1, of -1 en 1. Elke verdeling van deze staten over de neuronen in het netwerk behelst een activatiepatroon van het netwerk, zoals wordt geïllustreerd door patronen x, y, a en b (zie figuur 7.1b).

Een ANN slaat een patroon op, op de volgende manier: als een deel van het patroon is gepresenteerd in het netwerk zal het netwerk de activatie staten van alle neuronen veranderen zodat zij veranderen met het gehele patroon. De connectiegewichten van het netwerk bepalen dit proces. Dankzij de wederzijdse connectiegewichten dwingen neuronen elkaar om in de activatie staten te zijn die corresponderen met het opgeslagen patroon.

Het interessante aspect van dit proces is dat het ook werkt wanneer meer patronen zijn opgeslagen in het netwerk, zelfs wanneer sommige neuronen in verschillende activatie staten zijn in verschillende patronen. Dankzij de gecombineerde invloed van alle connectiegewichten kan het netwerk nog steeds een patroon behalen wanneer een deel ervan is gepresenteerd in het netwerk.

Er is echter een gelimiteerd aantal patronen dat een ANN op een betrouwbare manier kan opslaan. Dit hangt af van de grootte van het netwerk. Wanneer een netwerk meer neuronen bevat kunnen er meer patronen worden opgeslagen in een ANN.

Voor elk activatiepatroon van een ANN kan men een energiewaarde berekenen die afhankelijk is van het activatiepatroon en de connectiegewichten van het netwerk. Deze energiewaarden bepalen het gedrag van het netwerk. Hoge energiewaarden komen bij activatiepatronen die niet overeenkomen met de patronen die zijn opgeslagen in de connectiegewichten. Echter, lage energiewaarden komen voor wanneer activatiepatronen van het netwerk overeenkomt met ten minste één van de patronen zoals opgeslagen in de connectiegewichten.

Het gedrag (de dynamica) van een basis ANN is zo één dat het gradueel verandert, neuron per neuron, in een activatiepatroon met een lagere energiewaarde, wanneer dit mogelijk is.

Om ‘spurious minima’ te vermijden, kan het gedrag van ANNs worden veranderd. Bij een meer passend ANN is de kans op het reduceren van energie groter dan de kans op het vergroten van energie. Een dergelijke ANN gedraagt zich dan op een ‘stochastische manier’. Stochastische ANNs opereren beter dan ANNs die op een deterministische manier opereren, omdat zij soms ‘spurious’ patronen kunnen vermijden.

Over het algemeen is het aantal patronen dat kan worden opgeslagen in een ANN de functie van de grootte (het aantal neuronen).

5.3 Compositionele connectionistische structuren zoals gepresenteerd in situ gegronde representaties

Introductie

In het artikel wordt de lokalistische/verdeelde dimensie bediscussieerd vanuit het perspectief van de connectionistische (nenurale) architectures die de begrippen ‘grounding’, ‘productivity’ en ‘dynamics’ integreren. ‘Grounding’ refereert naar het feit dat de (conceptuele) representaties van een cognitief systeem worden bepaald op de manier waarop het systeem interacteert met zijn omgeving. ‘Productivity’ refereert naar het vermogen om ongelimiteerde hoeveelheden van (nieuwe) informatie te verwerken en om meerdere vormen van gedrag te genereren die gebaseerd zijn op een gelimiteerde hoeveelheid van reeds opgeslagen informatie. ‘Dynamics’ refereert naar de werkelijke verwerking van informatie en het vermogen om te interacteren met de omgeving. Met name dynamische verwerking van informatie stelt het systeem in staat om in één lijn te staan met de dynamiek van gebeurtenissen die plaatsvinden in de omgeving.

De begrippen grounding, productivity en dynamics kunnen worden gezien als belangrijke kenmerken van cognitie. Echter, volgens de auteurs van het artikel is het de combinatie van deze drie begrippen die ervoor zorgen dat de menselijke cognitie anders is dan de cognitie van dieren of kunstmatige systemen.

Connectionistische (neurale) architectures die grounding en productivity integreren verschillen van cognitieve systemen die symboolmanipulatie gebruiken om compositionele structureren te verwerken of creëren. Symboolmanipulatie hangt af van het vermogen om kopieën te maken van symbolen die nodig zijn voor de cognitie, omdat er slecht een gelimiteerde hoeveelheid informatie is dat fysiek opgeslagen kan worden op een bepaalde locatie (zie figuur 1 in het artikel).

Het ‘symbool token’ is een apparaat in het medium dat bepaalt waar men buiten de lokale regio moet gaan om meer structuur te verkrijgen. Dit proces bestaat uit twee fasen. Eerst wordt de toegang van de nabijgelegen structuur geopend die nodig is. Daarna vindt transport plaats van deze structuur naar de distale locatie op de lokale kant. Hierdoor kan het de verwerking beïnvloeden.

Het ‘symbool token’ is nodig om meer informatie te verkrijgen wanneer dit nodig is voor een bepaald proces. Symbolen kunnen worden gebruikt om informatie te verkrijgen en te transporteren, omdat zij kunnen worden gekopieerd en getransporteerd. Om dezelfde reden kunnen symbolen worden gebruikt om compositionele structureren te creëren.

Een voorbeeld kan bovenstaande illustreren. We gebruiken hierbij de zin: ‘de kat is op de mat’. Een specifiek symbool, bijvoorbeeld 101, representeert ‘kat’. Een ander symbool representeert ‘mat’ (bijvoorbeeld 010) en een ander symbool (bijvoorbeeld 110) representeert de frase ‘is op’. Het woord ‘de’ wordt voor de eenvoud genegeerd. Het is willekeurig welk symbool welk woord representeert.

Omdat symbolen gekopieerd en getransporteerd kunnen worden kunnen zij worden gebruikt om complexe compositionele structureren. Hiervoor is een computationeel architecture voor nodig. Wanneer een symbool token wordt gekopieerd en getransporteerd van een locatie naar een andere verdwijnen alle relaties en associaties op de eerste locatie.

Wanneer een symbool geïnterpreteerd moet worden is niet alle semantische informatie direct beschikbaar en het proces om informatie te verkrijgen kost veel tijd. Impliciete informatie gerelateerd aan concepten kan niet worden getransporteerd naar andere plekken in de architecture.

Gegronde representaties

In menselijke cognitie zijn conceptuele representaties gegrond in ervaringen (percepties, acties, emoties) en (conceptuele) relaties. In het brein bestaat de gegronde representatie van een concept uit een netwerkstructuur dat is verdeeld over de cortex (en andere hersengebieden). Bijvoorbeeld, de structuur van het woord kat bestaat uit een netwerkstructuur die zich op een bepaalde manier ontwikkelt in de tijd. Er zijn verschillende structuren hierbij betrokken, namelijk propositionele structuren, procedurele (actie-)structuren en perceptuele (visuele) structuren. Hoewel deze netwerkstructuren gelokaliseerd zijn in verschillende delen van het brein, kunnen er connecties tussen hen bestaan.

Gegronde representaties kunnen niet worden gekopieerd en getransporteerd. Zij blijven in situ. Dit betekent niet dat representaties over de tijd meer abstract kunnen worden. We kunnen bijvoorbeeld meer leren over een meer abstract concept zoals ‘kat’, gebaseerd op specifieke katten die we hebben ervaren.

Gegronde representaties in compositionele structuren

De vraag is hoe in situ representaties gebruikt kunnen worden om compositionele structuren te representeren. Dit vormt de basis van de productiviteit van de menselijke cognitie. De auteurs van het artikel denken dat er specifieke neurale compositionele architectures zijn (of ‘neurale blackboards’) voor specifieke cognitieve processen. Een voorbeeld is te zien in figuur 2 van het artikel.

Volgens de auteurs is elke compositionele structuur afhankelijk van een specifiek neuraal blackboard. Naast het blackboard zoals geïllustreerd in figuur 2 kunnen andere neurale blackboards bestaan. Het gebruik van verschillende blackboards is een direct gevolg van de gegronde oorsprong van representaties. Aangezien deze representaties altijd in situ blijven, moeten zij gerelateerd worden aan architectures zoals blackboards om compositionele structuren te vormen en om processen uit te voeren.

Gegronde representaties zijn net als symbolen expliciete vormen van representaties. Op deze manier blijven zij gegrond wanneer zij deel uitmaken van een compositionele structuur. Anderzijds verschaffen gegronde in situ representaties zowel lokale als globale informatie. De gegronde representaties zijn een deel van elk specifiek blackboard architecture waarin zij zijn gelegen. Wanneer er bepaalde processen plaatsvinden in het blackboard kunnen de gegronde representaties ook processen induceren in andere blackboards.

Lokalistisch vs. verdeeld

De issue die de lokalistische dimensie van de verdeelde dimensie onderscheidt is niet of representaties lokaal of verdeeld zijn, maar of zij gegrond zijn. In het artikel worden twee verschillende blackboards geïntroduceerd, namelijk een blackboard architecture van compositionele visuele structuren en een blackboard architecture van compositionele propositionele structuren. Deze zijn te zien in respectievelijk figuur 3 en figuur 4 in het artikel.

5.4 Hippocampus en neocortex bij geheugen herkenning

Geheugen kan onderverdeeld worden in functionele categorieën en neurale structuren. Er wordt in dit artikel vooral gekeken naar de invloed in geheugen en leren door de neocortex en hippocampus. Twee vragen voor de rekenmodellen en cognitieve neurowetenschappenlijke benadering worden behandeld. In de rekenmodellen is dit de vraag: hoe wordt herkenning en vertrouwdheid uit elkaar gehaald? De neurowetenschappelijke vraag is: welke rol speelt de hippocampus?

Dual processen

Geheugenherkenning refereert naar het proces van het identificeren van stimuli of situaties die eerder zijn gezien. Herkenning vereist geen herinnering van details, maar kan wel profiteren van specifieke informatie. Theorieën die voorstellen dat herkenning ondersteund wordt door zowel specifieke herkenning als non-specifieke gevoelens van vertrouwdheid worden dual-proces theorieën genoemd. Rekenkundige modellen kijken haast alleen naar gevoelens van vertrouwdheid en bekendheid bij het herkennen van stimuli.

Cognitieve neurowetenschappelijke benaderingen tot geheugenherkenning

Al lang is bekend dat het mediale temporele gebeid (MTLC) een rol speelt bij geheugenherkenning. Veel bewijs komt van studies met amnesiepatiënten. Daarnaast wordt gezegd dat er een declaratief geheugen zit dat herinnering en herkenning ondersteunt. Dit gebied is belangrijk voor declaratief geheugen, omdat het gelokaliseerd op de top van de corticale hiërarchie. Tevens is algemeen geaccepteerd dat de hippocampus noodzakelijk is voor herinnering en speelt de MTLC ook een rol in herkenning.

Er kan nu geconcludeerd worden dat het samenvoegen van deze twee stromingen van belang kan zijn. Het doel is om te kijken of hiervoor een computermodel gebouwd kan worden. Dit wordt wel een duel proces model. Nu worden eerst de belangrijke punten uit het artikel benoemd.

Complementair leersysteem

De hippocampus is gespecialiseerd is het snel memoriseren van specifieke gebeurtenissen, terwijl de neocortex gespecialiseerd is in het langzaam leren van standaard omgevingsentiteiten. Dit zijn centrale beweringen in het complementaire leer systeem (CLS). De twee doelen van het memoriseren van deze twee processen zijn in direct conflict met elkaar volgen het CLS. Mensen hebben dus gescheiden neurale processen hiervoor. De hippocampus stuurt directe patroonspecifieke informatie door die snel geleerd kan worden zonder catastrofe interferentie. De neocortex gebruikt echter overlappende informatie om dingen aan te leren.

Duel proces model van herkenning

Het corticale model voor beoordelingen van bekendheid zijn gebaseerd op de duidelijkheid van de representaties. Competitieve zelfbeheersing zorgt voor duidelijkere representaties van objecten. Het corticale model kan zich geen details herinneren, omdat het langzaam leert en moeite heeft met maken van onderscheid tussen verschillende gebeurtenissen. De hippocampus ondersteunt wel herinnering van voorgaande stimuli. Het heeft geen overlappende opslagplaatsen. Bepaalde patronen in CA3units zorgen voor de juiste snelle herkenning van objecten. Het hippocampusmodel is aangepast tot het herkennen door berekeningen te maken over in hoeverre de stimulus en de geleerde stimulus overeenkomen. Herkenning van een stimulus geeft het leren aan terwijl een mismatch aangeeft dat iets niet geleerd is.

Basis van netwerkeigenschappen

De signalen die in de hippocampus en cortex gemaakt worden verschillen van elkaar doordat ze verschillen van netwerk. In het corticale model lappen de bekendheid beoordelingen en fopbeoordelingen over door de overlappende representaties in de MTLC (stuk van de cortex waar dit optreedt). Als fopstimuli erg lijken op een geleerde stimuli treedt er een fopbeoordeling op. Men zegt dan dat iets herkend wordt terwijl dit niet het geval kan zijn. Het hippocampusmodel is meer diagnostisch. Dat wil zeggen dat het items gedetailleerder leert en zich niet zo snel laat misleiden. Dat komt omdat ieder object zijn eigen representatie heeft en er weinig overlap is. Echter als de overlap tussen twee objecten erg groot is wil het model wel falen.

Het verschil in hoe de modellen werken is het beste te onderzoeken in een Ja/Nee taak. Hierbij moet men aangeven of de stimulus eerder is aangeleerd/gezien. Dan blijkt de hippocampus beter in het onderscheiden van geleerde en niet geleerde items.

Applicaties bij gedragsfenomenen

Het hippocampusmodel heeft een voordeel bij gerelateerde objecten. Dit wordt beperkt als het model een keuze moet maken tussen geleerde items en fop-items (ook wel de reject-to-recall taak genoemd: ofwel als er herkenning tot verwijdering taak waarbij als men een object herkent wat het zeker niet geleerd heeft dit moet verwijderen). Er moet dan een onafhankelijke keuze worden gemaakt tussen twee zeer op elkaar lijkende of op geleerde objecten. Hierbij is er altijd één geleerd en één nep. Zodra het model faalt kan het nog terugvallen op de mismatch waardoor het ‘weet’ dat het dat object niet is. Herkenning tot verwijderen is echter lastig, waardoor het model sneller fouten kan gaan maken dan als het enkel aan hoeft te geven of het iets geleerd heeft (in plaats van wat het geleerd heeft). Gedacht wordt dat patiënten met schade aan de hippocampus slecht presteren op Ja/Nee taken maar op deze taak goed zullen presteren, omdat ze afhankelijker zijn van de MTLC en dus een andere strategie handhaven.

Associatieve herkenning testen

Deze testen kunnen gezien worden als een speciaal geval van de geleerde/fop herkenningstaken. Het voordeel van de hippocampus in herkenningstaken ligt in de patroonscheiding van objecten. Ondanks dat het corticale model slecht is in associatieve herkenningstaken scoort het wel boven kansniveau. Dus het corticale model heeft wel gevoeligheid voor het aanwijzen van geleerde items.

Storingeffecten

Herkenning in de hippocampus en cortex kan worden gemanipuleerd met behulp van storing in een taak. Het lijst-sterkte-paradigma meet hoe een herhaald geleerde set items deelnemers beïnvloedt als ze moeten discrimineren tussen niet sterk geleerde items en fop-items. Het algemene effect van storing is het verminderen van gewichten voor het discrimineren tussen objecten en fopobjecten. Het gewicht van de fopobjecten wordt dan groter waardoor de modellen sneller fouten maken. Zodra dit versterkt wordt bij de hippocampus komen de echte en fop-items in hun representatie dichter bij elkaar te liggen. Dit effect is kleiner bij de cortex, omdat bij de cortex aangeleerde items minder overlap hebben met andere items en nep-items wel meer overlap hebben is dit niet goed uit elkaar te halen met het lijst-sterkte-paradigma.

Gecombineerd model en onafhankelijkheid

In hoeverre de signalen van de cortex en hippocampus overeenkomen verschilt per conditie. In het gecombineerde model waarbij de variabiliteit ligt in hoe goed items geleerd zijn wordt de correlatie van de signalen versterkt. Zodra er storing komt in de modellen worden de correlaties juist kleiner. Dit geeft aan dat herkenning en herinnering onafhankelijk van elkaar kunnen zijn als er maar genoeg storing aanwezig is.

Effect van gedeeltelijke laesies

Gedeeltelijke hippocampus laesies kunnen leiden tot slechtere algemene herkenning dan een complete laesie, omdat ze kunnen leiden tot mislukking in het patronen onderscheiden. Als er een complete laesie is wordt de ruis die dan overblijft compleet genegeerd. Een grotere MTLC laesie leidt wel tot verslechtering van herkenning, omdat ze de herkenning onderscheiding direct beïnvloeden en die herinnering indirect beïnvloeden.

Terminologie

De termen herkenning en herinnering worden veel gebruikt. Herkenning gaat om een gevoel van bekendheid; je denkt iets te herkennen omdat je het gevoel hebt het eerder gezien te hebben. Bij herinnering gaat het om zeker weten dat je iets hebt. Hoewel de termen in het paper strikt uit elkaar gehouden worden betekent dit niet dat ze ook zo behandeld moeten worden. In feite hebben ze wel veel met elkaar te maken. echter om alles niet te ingewikkeld te maken worden ze gescheiden gebruikt. Dit geldt ook voor de cortex en hippocampus. De een heeft een grotere taak in bijv. herkenning maar doet ook aan herinnering. Niets is zo zwart en wit als hier beschreven.

Het corticale model

Het corticale model is opgebouwd uit twee lagen, een inputlaag en een verborgen laag. De basisfunctie van het model is voor de verborgen laag om veelvoorkomende patronen in de inputlaag te encoderen. Dit wordt aangeleerd via de Hebbian leerregel. De inputlaag bevat veel corticale gebieden en maakt gebruik van slots. Een slots is een unit cellen die reageren op bepaalde kenmerken, bijvoorbeeld vormen en kleuren. De lagen zijn aan elkaar verboden via een feedforward netwerk. Iedere verborgen (of MTCL) laag ontvangt informatie van 25% van de input laag.

De connecties tussen deze lagen en voornamelijk tussen de gedeeltes die informatie van elkaar ontvangen worden gemoduleerd met de Hebbian leerregel. Het aantal slots dat reageert wordt gebruikt als modelparameter. Met behulp van inputpatronen kan dus een onderscheid gemaakt worden tussen prototype objecten en hun kenmerken. Prototype kenmerken combineren veelvoorkomende itemkenmerken en contextkenmerken. Om het model te kunnen laten leren is het zo ingesteld dat bekende stimuli weinig activiteit veroorzaken in de MTLC en nieuwe stimuli voor veel activiteit zorgen. Bij weinig activiteit is een beslissing sneller gemaakt. De keuze is kleiner. Door de Hebbian leerregel kunnen nieuwe stimuli dan worden aangeleerd tot ze net zo sterk gerepresenteerd kunnen worden als al bekende stimuli.

De representatie wordt sterker en scherper gemaakt iedere keer als het item getoond wordt. Dit komt overeen met hoe dit bij neuronen in de hersenen gebeurt. Uit testen met het model blijkt dat hoe bekender een object wordt, des te minder cellen geactiveerd zijn. De actieve cellen tonen echter wel steeds meer activiteit. Het is een balans tussen meer en minder actieve cellen, want de hoeveelheid activiteit blijft gelijk. De makkelijkste manier om dus af te lezen of iets herkend wordt is naar act_win cellen te kijken. Hoe minder cellen met hoe meer activiteit geven de mate van bekendheid aan.

Het hippocampus model

Er is een standaard model voor de hippocampus gemaakt waarin algemeen geaccepteerde functies in verwerkt zijn. In het brein is de entorhinale cortex (EC) de verbinding tussen de neocortex en de hippocampus. Hierbij sturen de oppervlakkige lagen van de EC informatie naar de hippocampus en ontvangen de diepe lagen van de EC informatie van de hippocampus. In het model is dit omgezet naar een EC_input laag en EC_output laag. Beide bezitten een gesloten structuur. Het doel van het hippocampusmodel is de input omzetten in correcte output. Hierdoor ontstaat de juiste herkenning in de EC_output.

Dit gebeurt via de volgende stappen. De input patronen worden gepresenteerd door zich één op één vast te zetten aan de EC_input laag. Hiervandaan komen directe verbindingen naar de dendate gyrus en de CA3. In de CA3 worden er gewichten aan de input gekoppeld via Hebbian leerregels. Zo worden connecties versterkt en is er sprake van een feedforward model. Belangrijk om te onthouden is dat de patronen in de dendate gyrus en CA3 schaars zijn.

Er zijn maar weinig units actief per object. Door deze schaarse representaties is de hippocampus zo accuraat in patroon onderscheiding en dus in herkenning. Om het geheel compleet te maken loopt er vanaf de CA3 representatie een connectie terug wat gekoppeld wordt aan het originele input patroon. Dit wordt gedaan door de actieve CA3 units te koppelen aan een regio in CA1. De CA1-representaties zijn definitief. Zodra daar cellen actief zijn wordt er gelijk een verbinding gelegd naar de EC_output en is er een object keuze. Door het aanpassen van gewichten kunnen de patronen in de CA3 dus onbeperkt worden aangepast. Als er een hoge overeenkomst is tussen de EC_input en EC_output dan is het item herkend en aangeleerd. Een mismatch geeft aan dat een item niet is aangeleerd. Dit wordt berekend met een herinnering score, de formule is als volgt: (match-mismatch)*(numslots). Match is het aantal herinnerde kenmerken en mismatch het aantal mismatchen. Hierbij is numslots het aantal gebruikte slots in de EC. Dit model geeft echter niet aan of specifieke kenmerken beter te diagnosticeren zijn dan prototype kenmerken.

Simulatiemethoden

De eerste simulaties waren een directe vergelijking van de twee modellen wanneer zij dezelfde input ontvingen. Zo kan gekeken worden naar model karakteristieken bij het verwerken van de informatie.

Basismethoden

Voor iedere simulatie werd alles gemeten en alle gewichten aangepast naar aanleiding van de simulatie. De netwerkgewichten waren voor de start van de simulaties random ingesteld. Dit was om ervoor te zorgen dat de modellen specifieke receptieve velden zouden ontwikkelen. Deze specificatie is nodig voor computationeel leren. Speciale parameters worden gebruikt om de twee modellen makkelijk te kunnen vergelijken.

Simuleren van testen

Om een Ja/Nee test te simuleren werden na elkaar objecten getoond en de herkenning en herinnering uitkomst gemeten. Deze werden achteraf met elkaar vergeleken. Gekeken werd naar de match-mismacth score en de win_act score zoals eerder beschreven. Bepaalde waarden werden zo ingesteld dat zodra deze overschreden werden items als oud of aangeleerd konden worden bestempeld. Tevens werd goed bijgehouden hoe vaak juist of verkeerd werd gereageerd.

Deel 1: basis netwerk eigenschappen

In deze sectie worden de basiseigenschappen van de modellen besproken in enkele simulaties.

Simulatie 1: Patroononderscheiding

Veel verschillen tussen de modellen komen vanaf het feit dat de hippocampus meer patroononderscheidingen kan maken dan het corticale model. Hier werden simulaties gemeten om te kijken hoeveel overlap er was bij verschillende items. De mate van overlap werd bepaald in het CA3-gebied van het hippocampusmodel en in de verbogen laag van het corticale model. Patroononderscheidingen zijn aanwezig bij de overlap van interne representatie van items. De resultaten tonen dat beide modellen wel wat overlap hebben, maar dat het vermogen van de hippocampus om patronen de onderscheiden veel groter is.

Simulatie 2: Onderliggende verdelingen

Een manier om te zien hoe de modellen bijdragen aan herkenning is om de signaalverdeling die zij gebruiken te plotten, zie figuur 6 in het artikel. De verdeling van de MTLC distributie overlapt sterk en maakt gebruik van een simpele Gaussianverdeling. Bij de hippocampus is geen simpele Gaussianverdeling terug te zien. Het neppunt hierbij bevindt zich boven het nulpunt. Hieruit je kan opmaken dat zij niet zo snel een fout maken als een nepitem getoond wordt. Dit komt omdat de CA3 gebieden niet zo overlappen. De verdeling die je dan ook ziet is bimodaal, omdat er geen non-lineaire afleiders zijn. Om patronen compleet te maken wordt gebruik gemaakt van gewichten. Deze worden door feedback vastgesteld. Dit zie je terug in de CA3 en CA1 gebieden. Als er veel overlap is zie je ook een hogere nepoverlap, omdat er dan meer ruimte is voor fouten. Hoe meer overlap er in de hippocampus is hoe slechter deze wordt in taken. De CA3 gebieden spelen hierin de belangrijkste rol, omdat deze continu aangepast kunnen worden en dingen bij kunnen leren. De resultaten uit deze simulatie richten zich meer po de hippocampus. Daar kwam uit naar voren dat er twee opties zijn. Als er een lage of middelmatige overlap is zijn de herinnering matches hoog diagnostisch en maken ze weinig fouten. Als er middelmatige tot veel overlap is wordt er gebruik gemaakt van een signaal opzoekproces. Er is dan meer kans op reacties.

Simulatie 3: Ja/Nee gerelateerde nep simulaties

De sterkte punten van het hippocampusmodel zijn het meest aanwezig bij ja/nee gerelateerde nepitem taken, waar de nepitems sterk lijken op de bestudeerde items. In deze simulatie wordt getoond hoe het hippocampusmodel beter is dan het corticale model, omdat er betere patroononderscheiding gemaakt kan worden. De resultaten zijn te zien in figuur 9 van het artikel. De herkenningsprestaties van het corticale model worden steeds slechter des te meer de nepitems op de gestudeerde items lijken. Het hippocampusmodel is redelijk robuust tegen deze manipulatie. Dit kan worden verklaard vanuit het corticale model. Dit model maakt gebruik van op elkaar lijkende representaties om dingen in te studeren. Als een nepitem er veel op lijkt is er voldoende overlap van herkenning, wat leidt tot een fout bij het model. Dit gebeurt pas bij het hippocampusmodel op het moment dat er meer dan 60% overlap is. Tot dat aantal is er totaal geen invloed vanaf de nepitems. Er worden pas herinneringsfouten gemaakt vanaf een overlap van 80%. De gedetailleerde patroonscheiding van de hippocampus heeft hier dus voordelen mee. Een ander voordelig punt van de hippocampus is dat het met behulp van een mismatch ook nog nepitems kan verwijderen te zien in figuur 10 van het artikel. De mismatch wordt dan ook getriggerd door nepitems.

Concluderend kun je zeggen dat beide netwerken goed kunnen onderscheiden bij ja/nee taken mits er geen items gebruikt worden die erg lijken op bestudeerde items.

Variabiliteit

Het herkennen van items bevat het opsporen van de aanwezigheid van variabele geheugensignalen tegenover een ruisachtergrond. Er zijn vele soorten variabiliteit die de prestatie op het herkennen kunnen beïnvloeden. De eerste bron van variabiliteit die in dit onderzoek is gebruikt is die van het samennemen van kenmerken. Gekeken werd naar hoe goed neurale units connecties hebben tot andere neurale units in een netwerk. Hierbij worden de gewichten aan de connecties toegekend die kunnen variëren. Deze variaties ontstaan omdat er aan het begin van iedere simulatie random gewichten zijn toebedeeld aan de connecties en deze door middel van leren aangepast moeten worden. De variabiliteit vermindert als het netwerk toeneemt. Er spelen echter ook nog andere vormen van variabiliteit een rol.

Een andere belangrijke variabele is hoe goed stimuli zijn gecodeerd in het geheugen. Dit beïnvloedt de relaties tussen bestudeerde items. Dit is belangrijk bij het gebruik van nepitems. Zij spelen in op deze relaties. Hoe sterker een relatie, hoe minder invloed het nepitem heeft.

Des te vaker men is blootgesteld aan een stimuli is ook een belangrijke variabele. Hoe meer er geleerd is, hoe sterker alle relaties en verbindingen zijn en hoe moeilijker het wordt om met nepitems ruis te veroorzaken. Minder bloostelling zorgt dan ook voor meer overlap. Overlap is ten slotte de laatste genoemde variabele en deze is altijd aanwezig.

Page access

Public

Content is used in bundle

Artificial Intelligence & Neurocognition: Summaries, Study Notes and Practice Exams - UL

This content is related to:

Artificial Intelligence & Neurocognition - UL - TentamenTests (NL)

Summaries and study services for Psychology Bachelor 2/3 at Leiden University - Specialisation courses & Electives - Year 2022/2023

This bundle contains relevent study materials with the second and third year of the Psychology Bachelor programme, in Dutch and English for Leiden University. Do you have your own lecture notes or summaries to share? Make your fellow students happy and upload them to your own WorldSupporter...Read more

Using summaries:

Associate with your Field of Study

Search Summaries or Notes

Start using Summaries

Add a Summary

Go abroad

Check what you can do for the world or your personal development

Live, study, travel or work abroad? Arrange your insurances trough the JoHo Foundation!

Join World Supporter

for free to follow other supporters, see more content and use the tools
for €10,- by becoming a member to see all content

Follow the author: Psychology Supporter

Psychology Supporter

Content is used in

Study guide with lecture notes for Artificial Intelligence at the Leiden University

Content categories

Learn & Study

Goal 4: Quality Education

Universiteit Leiden en studieverenigingen

Psychology & Behavioral Sciences

Main Studies & Fields

Main study and working fields

Access level of this page

Public
WorldSupporters only
JoHo members
Private

Statistics

[totalcount]

Comments, Compliments & Kudos

Add new contribution

Promotions

Op zoek naar een uitdagende job die past bij je studie? Word studentmanager bij JoHo !

Werkzaamheden: o.a.

Het werven, aansturen en contact onderhouden met auteurs, studie-assistenten en het lokale studentennetwerk.
Het helpen bij samenstellen van de studiematerialen
PR & communicatie werkzaamheden

Interesse? Reageer of informeer

Je vertrek voorbereiden of je verzekering afsluiten bij studie, stage of onderzoek in het buitenland

Study or work abroad? check your insurance options with The JoHo Foundation

More contributions of WorldSupporter author: Psychology Supporter