Hierarchical models of object recognition in cortex - Riesenhuber & Poggio - 1999 - Artikel

Samenvatting van het artikel: Hierarchical models of object recognition in cortex - Riesenhuber & Poggio - 1999

De herkenning van visuele objecten is fundamenteel. Onderzoek gebeurt vaak met een herhaalde cognitieve taak met twee essentiële eisen: invariantie en specificiteit. Cellen uit de inferotemporele cortex (IT, het hoogst gelegen visuele gebied in het ventraal visuele pad) lijken een sleutelrol te spelen bij objectherkenning. De cellen reageren op wat men ziet bij complexe objecten zoals gezichten. Bepaalde neuronen reageren specifiek op bepaalde gezichten en niet op andere gezichten. De vraag blijft: hoe kunnen ze reageren op verschillende gezichten terwijl bij de retina de stimulusaanbieding praktisch hetzelfde is?

Dit is ook terug te zien in de striate cortex bij katten. Zowel simpele als complexe cellen reageren op een gepresenteerde staaf. Zo blijkt dat de kleine simpele cellen smalle receptieve velden hebben die sterk positie-afhankelijk zijn en dat de complexe cellen grote receptieve velden hebben en niet positie-afhankelijk zijn. Hubel en Wiesel hebben een model gemaakt waarin de simpele cellen reageren als buurmancellen. Waarbij cellen die naast elkaar zitten de wereld ook naast elkaar zien. Zo zie je dus vaak een groep cellen bij elkaar vuren. Een rechtstreekse opvolging van dit model leidt tot een higher-order-complex cells-schema.

Cellen in de V4 kunnen hun aandacht controleren en zij kunnen reageren bij een aanpassing in hun receptieve veld. Er is weinig bewijs dat dit mechanisme wordt gebruikt voor het vertalen van invariante objectherkenning. Invariantie van iedere transformatie kan worden opgebouwd door het omzetten van afferente cellen bij verschillende variaties van dezelfde stimulus. Inmiddels is bewijs gevonden dat groepen cellen die reageren op gehele of gedeeltelijk visie worden geleerd via een leerproces. Het zicht invariantie probleem kan dan gepresenteerd worden door een klein aantal neuronen. Dit idee geeft ons twee problemen.

  • Probleem 1

Bij apen is het bij aanleren van (voor hen) onbekende stimuli (zoals gezichten) mogelijk doordat zij een gedeelte van de invariantie aanleren via 1 aangezicht van het object. Als dit object wordt aangeboden met veel context eromheen kan het worden aangeleerd in combinatie tot deze context. De cellen worden zo invariant bij andere posities.

  • Probleem 2

Het model geeft wel aan hoe view tuned units (VTU, groepen die vuren bij een bepaald object) worden opgebouwd, maar niet hoe ze ontstaan.

Resultaten

Het model is gebaseerd op een simpele hiërarchische feedforward architectuur. Men gaat er vanuit dat de structuur de invariantie reflecteert en dat kenmerkspecificiteit moet worden opgebouwd uit verschillende mechanismen. Het poolingmechanisme zou voor robuuste kenmerkdetectoren moeten zorgen. Dat houdt in dat het detectie moet toestaan op specifieke kenmerken zonder verward te raken van rommel of context in het receptieve veld.

Er zijn twee alternatieven voor een pooling mechanisme.

  1. Lineaire optelling = SUM.

Hierbij worden gelijke gewichten gewogen. Reacties op een complexe cel zijn invariant zolang de stimulus in het receptieve veld van de cel blijft. Er wordt echter niet gereageerd of er daadwerkelijk een staaf is in het receptieve veld. Het outputsignaal is de som van de afferente cellen en dus is er geen kenmerk specificiteit.

  1. Niet-lineaire maximale operatie = MAX.

Hierbij bepaalt de sterkste afferente cel de postsynaptische respons. Bij MAX wordt de reactie bepaald door het bepalen van de meest actieve afferente cel en wordt dit signaal gezien als de beste match bij een gedeelte van de stimulus. Hierdoor reageert MAX beter.

In beide gevallen is de reactie van een complexe cel invariant tot de staaf op het receptieve veld. Een niet-lineaire MAX functie is een goede manier die het poolen juist omschrijft bij invariantie. Dit is inclusief impliciet scannen van afferente cellen van hetzelfde type. Uit de cellen die reageren wordt dan de sterkste gekozen en deze klopt dan het meest bij de invariantie. Het poolen van combinaties van afferente cellen zorgt voor een gemixt signaal veroorzaakt door verschillende stimuli.

MAX-systemen zijn op sommige punten vergelijkbaar met neurofysiologische data. Bijvoorbeeld als twee stimuli aangeboden worden in het receptieve veld van een IT neuron dan is de reactie van de neuron gedomineerd door de stimulus die afzonderlijk het meeste reactie krijgt. Dit komt overeen met hoe het MAX-model voorspelt als het gaat om afferente neuronen. Een aantal studies geeft ondersteuning voor het MAX-model. Deze studies vinden vaak een hoge niet lineaire tuning van IT cellen. Dit komt overeen met de MAX reactie functie. Een lineair model kan niet zulke sterke veranderingen aandragen bij een kleine verandering in de input.

In sommige gevallen kan rommel ervoor zorgen dat de waarde vanuit de MAX functie verandert. De kwaliteit van de match in de uiteindelijke fase is dan veranderd waardoor de kracht van de VTU-reactie ook anders is. Een uitkomst hiervoor is meer specifieke kenmerken toevoegen. Simulaties hebben aangetoond dat dit model in staat is objecten te herkennen in een context.

Het MAX-model kan goed gebruikt worden om hersenprocessen te omschrijven. Waarschijnlijk zijn MAX reacties afkomstig van corticale microcircuits bij laterale inhibitie tussen neuronen in de corticale laag. Daarnaast is de MAXreactie belangrijk voor objectherkenning.

Image

Access: 
Public

Image

Join WorldSupporter!
This content is related to:
Breaking position-invariant object recognition - Cox, Meier, et. al - 2005 - Artikel
Untangling invariant object recognition - DiCarlo & Cox - 2007 - Artikel
Search a summary

Image

 

 

Contributions: posts

Help other WorldSupporters with additions, improvements and tips

Add new contribution

CAPTCHA
This question is for testing whether or not you are a human visitor and to prevent automated spam submissions.
Image CAPTCHA
Enter the characters shown in the image.

Image

Spotlight: topics

Check the related and most recent topics and summaries:
Activity abroad, study field of working area:

Image

Check how to use summaries on WorldSupporter.org

Online access to all summaries, study notes en practice exams

How and why use WorldSupporter.org for your summaries and study assistance?

  • For free use of many of the summaries and study aids provided or collected by your fellow students.
  • For free use of many of the lecture and study group notes, exam questions and practice questions.
  • For use of all exclusive summaries and study assistance for those who are member with JoHo WorldSupporter with online access
  • For compiling your own materials and contributions with relevant study help
  • For sharing and finding relevant and interesting summaries, documents, notes, blogs, tips, videos, discussions, activities, recipes, side jobs and more.

Using and finding summaries, notes and practice exams on JoHo WorldSupporter

There are several ways to navigate the large amount of summaries, study notes en practice exams on JoHo WorldSupporter.

  1. Use the summaries home pages for your study or field of study
  2. Use the check and search pages for summaries and study aids by field of study, subject or faculty
  3. Use and follow your (study) organization
    • by using your own student organization as a starting point, and continuing to follow it, easily discover which study materials are relevant to you
    • this option is only available through partner organizations
  4. Check or follow authors or other WorldSupporters
  5. Use the menu above each page to go to the main theme pages for summaries
    • Theme pages can be found for international studies as well as Dutch studies

Do you want to share your summaries with JoHo WorldSupporter and its visitors?

Quicklinks to fields of study for summaries and study assistance

Main summaries home pages:

Main study fields:

Main study fields NL:

Follow the author: Psychology Supporter
Work for WorldSupporter

Image

JoHo can really use your help!  Check out the various student jobs here that match your studies, improve your competencies, strengthen your CV and contribute to a more tolerant world

Working for JoHo as a student in Leyden

Parttime werken voor JoHo

Statistics
1055