Breaking position-invariant object recognition - Cox, Meier, et. al - 2005 - Artikel
- 1219 reads
Samenvatting van het artikel: Hierarchical models of object recognition in cortex - Riesenhuber & Poggio - 1999
De herkenning van visuele objecten is fundamenteel. Onderzoek gebeurt vaak met een herhaalde cognitieve taak met twee essentiële eisen: invariantie en specificiteit. Cellen uit de inferotemporele cortex (IT, het hoogst gelegen visuele gebied in het ventraal visuele pad) lijken een sleutelrol te spelen bij objectherkenning. De cellen reageren op wat men ziet bij complexe objecten zoals gezichten. Bepaalde neuronen reageren specifiek op bepaalde gezichten en niet op andere gezichten. De vraag blijft: hoe kunnen ze reageren op verschillende gezichten terwijl bij de retina de stimulusaanbieding praktisch hetzelfde is?
Dit is ook terug te zien in de striate cortex bij katten. Zowel simpele als complexe cellen reageren op een gepresenteerde staaf. Zo blijkt dat de kleine simpele cellen smalle receptieve velden hebben die sterk positie-afhankelijk zijn en dat de complexe cellen grote receptieve velden hebben en niet positie-afhankelijk zijn. Hubel en Wiesel hebben een model gemaakt waarin de simpele cellen reageren als buurmancellen. Waarbij cellen die naast elkaar zitten de wereld ook naast elkaar zien. Zo zie je dus vaak een groep cellen bij elkaar vuren. Een rechtstreekse opvolging van dit model leidt tot een higher-order-complex cells-schema.
Cellen in de V4 kunnen hun aandacht controleren en zij kunnen reageren bij een aanpassing in hun receptieve veld. Er is weinig bewijs dat dit mechanisme wordt gebruikt voor het vertalen van invariante objectherkenning. Invariantie van iedere transformatie kan worden opgebouwd door het omzetten van afferente cellen bij verschillende variaties van dezelfde stimulus. Inmiddels is bewijs gevonden dat groepen cellen die reageren op gehele of gedeeltelijk visie worden geleerd via een leerproces. Het zicht invariantie probleem kan dan gepresenteerd worden door een klein aantal neuronen. Dit idee geeft ons twee problemen.
Probleem 1
Bij apen is het bij aanleren van (voor hen) onbekende stimuli (zoals gezichten) mogelijk doordat zij een gedeelte van de invariantie aanleren via 1 aangezicht van het object. Als dit object wordt aangeboden met veel context eromheen kan het worden aangeleerd in combinatie tot deze context. De cellen worden zo invariant bij andere posities.
Probleem 2
Het model geeft wel aan hoe view tuned units (VTU, groepen die vuren bij een bepaald object) worden opgebouwd, maar niet hoe ze ontstaan.
Het model is gebaseerd op een simpele hiërarchische feedforward architectuur. Men gaat er vanuit dat de structuur de invariantie reflecteert en dat kenmerkspecificiteit moet worden opgebouwd uit verschillende mechanismen. Het poolingmechanisme zou voor robuuste kenmerkdetectoren moeten zorgen. Dat houdt in dat het detectie moet toestaan op specifieke kenmerken zonder verward te raken van rommel of context in het receptieve veld.
Er zijn twee alternatieven voor een pooling mechanisme.
Lineaire optelling = SUM.
Hierbij worden gelijke gewichten gewogen. Reacties op een complexe cel zijn invariant zolang de stimulus in het receptieve veld van de cel blijft. Er wordt echter niet gereageerd of er daadwerkelijk een staaf is in het receptieve veld. Het outputsignaal is de som van de afferente cellen en dus is er geen kenmerk specificiteit.
Niet-lineaire maximale operatie = MAX.
Hierbij bepaalt de sterkste afferente cel de postsynaptische respons. Bij MAX wordt de reactie bepaald door het bepalen van de meest actieve afferente cel en wordt dit signaal gezien als de beste match bij een gedeelte van de stimulus. Hierdoor reageert MAX beter.
In beide gevallen is de reactie van een complexe cel invariant tot de staaf op het receptieve veld. Een niet-lineaire MAX functie is een goede manier die het poolen juist omschrijft bij invariantie. Dit is inclusief impliciet scannen van afferente cellen van hetzelfde type. Uit de cellen die reageren wordt dan de sterkste gekozen en deze klopt dan het meest bij de invariantie. Het poolen van combinaties van afferente cellen zorgt voor een gemixt signaal veroorzaakt door verschillende stimuli.
MAX-systemen zijn op sommige punten vergelijkbaar met neurofysiologische data. Bijvoorbeeld als twee stimuli aangeboden worden in het receptieve veld van een IT neuron dan is de reactie van de neuron gedomineerd door de stimulus die afzonderlijk het meeste reactie krijgt. Dit komt overeen met hoe het MAX-model voorspelt als het gaat om afferente neuronen. Een aantal studies geeft ondersteuning voor het MAX-model. Deze studies vinden vaak een hoge niet lineaire tuning van IT cellen. Dit komt overeen met de MAX reactie functie. Een lineair model kan niet zulke sterke veranderingen aandragen bij een kleine verandering in de input.
In sommige gevallen kan rommel ervoor zorgen dat de waarde vanuit de MAX functie verandert. De kwaliteit van de match in de uiteindelijke fase is dan veranderd waardoor de kracht van de VTU-reactie ook anders is. Een uitkomst hiervoor is meer specifieke kenmerken toevoegen. Simulaties hebben aangetoond dat dit model in staat is objecten te herkennen in een context.
Het MAX-model kan goed gebruikt worden om hersenprocessen te omschrijven. Waarschijnlijk zijn MAX reacties afkomstig van corticale microcircuits bij laterale inhibitie tussen neuronen in de corticale laag. Daarnaast is de MAXreactie belangrijk voor objectherkenning.
Join with a free account for more service, or become a member for full access to exclusives and extra support of WorldSupporter >>
There are several ways to navigate the large amount of summaries, study notes en practice exams on JoHo WorldSupporter.
Do you want to share your summaries with JoHo WorldSupporter and its visitors?
Main summaries home pages:
Main study fields:
Business organization and economics, Communication & Marketing, Education & Pedagogic Sciences, International Relations and Politics, IT and Technology, Law & Administration, Medicine & Health Care, Nature & Environmental Sciences, Psychology and behavioral sciences, Science and academic Research, Society & Culture, Tourisme & Sports
Main study fields NL:
JoHo can really use your help! Check out the various student jobs here that match your studies, improve your competencies, strengthen your CV and contribute to a more tolerant world
1055 |
Add new contribution