Bijlagen bij TentamenTests Artificial Inteligence - UL
- 1437 reads
Wat is het verschil tussen zwakke AI en sterke AI? Wat zijn de aannames en wat betekent dit voor AI?
Wat is het verschil tussen symbolische AI en connectionistische AI?
Wat is de Turing imitation game? Hoe relateert dit zich aan intelligente systemen?
Hoe relateert Searle's Chinese kamer argument zich aan de Turing imitation game? Wat voor conclusie zou Searle trekken over een computer die de test verslaat?
Verklaar de kritiek op symbolische AI. Geef argumenten voor en tegen.
Wat zijn de gelijkenissen tussen connectionistische AI architecturen en het menselijke brein?
Wat betekent content-addressable zijn voor het menselijke geheugen?
Zie bijlage.
Waarom hebben robots sensoren en effectoren nodig? Geef ook definities.
Wat zijn vrijheidsgraden binnen robotica? Geef ook een voorbeeld.
Wat zijn de verschillen tussen gedrag van twee Braintenberg voertuigen, waarvan er één recht en de ander gekruiste excitatorische connecties heeft. Beschrijf dit gedrag ook.
Wat gebeurt er met de twee voertuigen uit vraag 23, als de connecties inhibitorisch zijn in plaats van exciterend?
Wat gebeurt er als er een threshold functie wordt geïmplementeerd.
Hoe kan een voertuig met thresholds reageren op bepaalde sequenties van input waardes?
Hoe kan geheugen in een voertuig worden geïmplementeerd?
Welke twee technieken kan een robot gebruiken om te leren? Leg deze uit.
Verklaar het verschil tussen feedforward en feedback motorische controle systemen. Welke wordt wanneer gebruikt? Wat is een nadeel aan feedforward motorische controle systemen?
Welke drie typen netwerken zijn er? Beschrijf deze.
Wat zijn argumenten voor de suggestie dat object herkenning en classificatie in de hersenen plaatsvindt door middel van feedforward netwerken?
Wat is het receptieve veld van een neuron?
Welke variatie in een receptief veld is er te zien, als het gaat om een receptief veld in een feedforward netwerk in de hersenen, dat visuele informatie verwerkt voor object herkenning en classificatie?
Wat is een topografische of retinotopische representatie?
Wat betekent locatie invariante object herkenning?
Wat betekent schaal invariante object herkenning?
Welke observaties in het Quian Quiroga artikel steunen het idee van invariante object representatie in de hersenen?
Wat is een perceptron?
Kan het volgende probleem worden opgelost door en perceptron en hoe?
Input | Output | U |
X | Y | xANDy |
1 | 1 |
|
1 | 0 |
|
0 | 1 |
|
0 | 0 |
|
Geef een classificatie probleem dat niet kan worden opgelost door een perceptron en geef aan waarom niet.
Wat is een squashing function?
Waarom zijn squashing functions nodig voor feedforward netwerken met verborgen lagen, als het netwerk meer dan een perceptron moet bereiken?
Zie bijlage.
Wat zijn de voordelen die (biologische) feedforward netwerken kunne hebben voor visuele perceptie?
Verklaar wat het betekent om een universele approximator te zijn als feedforward netwerk. Wat zijn de limitaties van deze mogelijkheid?
Wat is catastrophic interference met feedforward netwerken?
Hoe kunnen catastrophic interference met feedforward netwerken worden voorkomen?
Welk probleem vindt er plaats bij verschillende feedforward netwerken bij het verwerken van verschillende vormen van visuele informatie (features)?
Waarom is het cognitief nuttig om invariante object representaties te hebben?
Welk probleem kan ontstaan vanuit invariante object representaties?
Wat is het “what versus where” probleem in visuele perceptie?
Hoe kan het “what versus where” probleem in visuele perceptie opgelost worden?
Het LIP gebied in de pariëtale cortex houdt zich bezig met het verwerken van locatie informatie en ruimtelijke aandacht gerelateerd aan oog bewegingen. Wanneer een object in het receptieve veld van een neuron terecht komt in dit gebied, duurt het 60 ms totdat een neuron geactiveerd wordt. Wanneer de identiteit van een object geselecteerd is door een cue buiten het receptieve veld van een neuron, duurt dit 200 ms. Wat is de oorzaak van deze activatie? Wat verklaard het verschil tussen activatie tijd en cue gerelateerde activatie van neuronen?
Wat is een karakteristiek verschil in structuur tussen feedforward en feedback netwerken in visuele perceptie?
Wat is een karakteristiek verschil in rol of functie tussen feedforward netwerken en feedback netwerken in visuele perceptie?
Wat is disinhibitie?
Wat is een karakteristiek verschil tussen disinhibitie en directe top-down activatie in de interactie tussen feedforward netwerken en feedback netwerken in visuele perceptie?
Waar schijnt het experiment van Motter (1994) licht op, als er gekeken wordt naar de rol van topografische (retinotopische) representaties in de interactie tussen feedforward netwerken en feedback netwerken in visuele perceptie?
Waar kunnen topografische (retinotopische) representaties gevonden worden in de visuele cortex?
Waar schijnt het experiment van Motter (1994) licht op, als er gekeken wordt de interactie tussen feedforward netwerken en feedback netwerken in visuele perceptie en hoe dit zich over tijd ontwikkeld?
Zwakke AI is computer intelligentie die zich focust op een specifieke taak en is gelimiteerd. Met trucjes kan intelligentie nagedaan worden, maar het systeem is niet zelf bewust. Sterke AI gaat om intelligente systemen die zelf kunnen nadenken en dus ook AI kunnen bewijzen. Met de juiste input en output zou een goed geprogrammeerde computer hetzelfde moeten kunnen als the mind. Hierbij wordt aangenomen dat menselijk denken een vorm van berekenen is binnen het systeem dat de mind is.
Symbolische AI bestaat uit intelligent gedrag door het manipuleren van symbolen en wordt ook wel GOFAI genoemd. Er wordt gebruik gemaakt van als-dan regels voor het manipuleren. Een symbool bestaat uit entiteiten, die een fysiek patroon hebben, bestaande uit symbool structuren. Deze structuur bestaat uit verschillende instanties of tokens van symbolen. Deze zijn aan elkaar gerelateerd op een fysieke manier.
Connectionistische AI bestaat uit representaties in de hersenen. Deze worden verspreid en parallel verwerkt in grote artificiële neurale netwerken. Dit is een meer biologische kijk. Hier is er de mogelijkheid tot generalisatie, patroon herkenning en leren.
De Turing imitation game bestaat uit drie mensen. Persoon A en B communiceren, terwijl één van de twee een computer is. Persoon C bekijkt deze communicatie en moet bepalen welke van de twee de computer is. Als dit niet met betrouwbaarheid mogelijk is, kan de computer gezien worden als intelligent. De gedachte hier achter is, dat een computer hiervoor dezelfde kennis nodig heeft als een mens. De onderliggende systemen worden echter buiten beschouwing gehouden, dus hoeft dit intelligentie nog niet aan te tonen. Een goed geprogrammeerd systeem zou deze test zonder intelligent te hoeven zijn, moeten kunnen verslaan.
In het Chinese kamer argument wordt er kritiek gegeven op de test. Hierbij zit iemand in een afgesloten kamer met een boek gevuld met Chinese vragen en antwoorden. Via briefjes onder de deur worden Chinese vragen aan de persoon doorgegeven en hier moet het antwoord op teruggegeven worden. De kritiek hier is, dat er geen begrip van de Chinese taal nodig is, om dit te kunnen doen. Hetzelfde geldt voor op regels gebaseerde manipulatie van symbolen. Dit kan toegepast worden op een computer die de test verslaat. Dat kan namelijk met trucjes, zonder daadwerkelijk begrip, intelligentie of bewustzijn. Bewustzijn vereist een bepaald proces van fysisch-chemische acties, die alleen uitgevoerd kunnen worden door het menselijk brein. Een computer die de Turing test verslaat, is dus nog niet meteen intelligent of bewust.
Ten eerste werkt symbolische AI alleen met als-dan regels en heeft niets met neurofysiologie te maken, als tegenargument. Er is ook geen puur symbolische verklaring voor patroon herkenning. Verder is het onlogisch de echte wereld niet te gebruiken als zijn eigen representatie, omdat deze het meest accuraat is. Representaties moeten kunnen omgaan met ruis tijdens de input. Daarnaast hebben we symbolische AI nergens voor nodig.
Expert systemen kunnen menselijk keuzes maken nadoen en dit zou een argument zijn voor symbolische AI. Een voorbeeld hiervan is MYCIN, die werd gebruikt om behandelingen te diagnosticeren. Deze is accurater dan doktoren.
Connectionistische AI is gebaseerd op het menselijk brein. Er is dus een biologische overeenkomst. De input gaat via dendrieten, output via axonen, veel connecties en parallel berekenen. Dit is namelijk efficiënter dan serie verwerken. Als tweede overeenkomst zijn beide structuren tolerant tegenover schade. In beschadigde netwerken is verwerking nog steeds mogelijk. Als laatste overeenkomst zijn beide structuren in staat om te generaliseren. Deze regels kunnen worden aangemaakt en toegepast op nieuwe input.
Het geheugen is dan terug te halen, gebaseerd op inhoud. Een deel van deze inhoud word dan als cue gebruikt voor het ophalen van gerelateerde informatie. Dit zorgt voor flexibiliteit en robuustheid.
Zie bijlage.
Zie bijlage.
Een feedforward netwerk, een volledig herhalend netwerk en gedeeltelijk herhalende netwerken. Een feedforward netwerk bevat connecties die één richting op gaan, een input laag, een verborgen laag en een output laag. De data gaat hier lineair. In een volledig herhalend netwerk zitten connecties die alle kanten op gaan. Elke neuron is met een ander verbonden. Een gedeeltelijk herhaaldelijk netwerk is een gemixt type netwerk, dat interactie en specifieke circuits bevat. De output geeft feedback aan input neuronen.
Hogere visuele gebieden zijn gevoeliger voor specifieke visuele objecten. Bekende figuren worden snel herkend. Ieder component heeft een specifieke visuele taak, zoals kleur, vorm en positie. Als er sprake is van feedback, zou de verwerking langer duren.
Het receptieve veld is het gedeelte van sensorische ruimte waarin een stimulus het vuren van een neuron kan uitlokken.
Het proces bestaat uit vier stadia die verandering weergeven:
V1: het receptieve veld voor oriëntatie en ruimtelijke grootte. Dit zijn horizontale dunne kolommen. Er zijn hier fase afhankelijke en onafhankelijke cellen. Groepering vindt hier plaats door gebruik te maken van de eerste twee corticale delen.
V2 & V3: het receptieve veld is hier gevoelig voor verticale lijnen en voor contouren die alleen door horizontale lijnen worden gecreëerd. In de volgende drie corticale delen wordt er gelet op simpele vormen.
V4: het receptieve veld is hier gevoelig voor kleuren en complexe vormen. Combinaties worden gemaakt en het object wordt gezien als onderdeel van de rest van de omgeving.
IT: deze bestaat uit de Posterior Inferior Temporal cortex en de Anterior Inferior Temporal cortex. Dit laatste gebied is gevoelig voor gezichten. Het receptieve veld is hier gevoelig voor vorm en kleur. Het receptieve veld is hier maximaal, maar specifieke informatie is hierdoor verloren gegaan.
Er zijn kleine receptieve velden (V1 Hubel en Wiesel). Deze zijn topografisch gerepresenteerd. Ook zijn er grotere receptieve velden (AIT Tanaka). Deze zijn niet topografisch gerepresenteerd. De locatie is invariant en scale invariant.
Specifieke gebieden van het visuele veld zullen specifieke gebieden van visuele gebieden in de hersenen activeren. Gebieden die dicht bij elkaar liggen in het visuele veld zullen op visuele gebieden projecteren die ook dicht bij elkaar liggen.
Dit houdt in dat object herkenning gebaseerd is op structurele informatie, zoals individuele delen. Zo kan herkenning plaatsvinden onafhankelijk van het perspectief van een object. Individuele delen kunnen namelijk geroteerd worden om bij elk perspectief te passen.
Dit houd in dat object herkenning gebaseerd is op structurele informatie, zoals individuele delen. Het maakt dan niet uit wat de schaal van een object is. Bij kleine beelden, moet het netvlies wel genoeg informatie krijgen voor een correcte identificatie.
Er is hier getest met 40 nieuwe beelden van hetzelfde individu en de meeste neuron units reageren uniek op een bepaald individu. Dit laat invariante representatie zien. Er werd ook gevonden, dat bepaalde neuronen op meerdere individuen reageren die aan elkaar gerelateerd zijn.
Een perceptron is een neuraal netwerk waar neuronen van verschillende lagen allemaal een connectie met elkaar hebben. De eerste laag bestaat uit input neuronen, dan is er een verborgen laag en als laatst een output laag.
Het probleem kan opgelost worden door een perceptron. Er is maar één waarde groter dan 0, dus de perceptron zal alleen vuren als er één bepaalde conditie is. Theta is hier de threshold.
Input | Output | U |
| Dus input | Benodigd |
X | Y | xANDy |
|
|
|
1 | 1 | 1 | W1X + W2Y > theta | W1 + W2 > theta | W1 + W2 > theta |
1 | 0 | 0 | W1X + W2Y < theta | W1 < theta | 0 < W1 < theta |
0 | 1 | 0 | W1X + W2Y < theta | W2 < theta | 0 < W2 < theta |
0 | 0 | 0 | W1X + W2Y < theta | 0 < theta |
|
De input ruimte van EXOR is niet lineair te scheiden en kan dus niet opgelost worden door een perceptron. Hier is een niveau van drie lagen nodig, in plaats van twee.
Input | Output | U |
X | Y | xEXORy |
1 | 1 | 0 |
1 | 0 | 1 |
0 | 1 | 1 |
0 | 0 | 0 |
Een squashing function maakt van een groot getal een kleiner getal en andersom. Het gesquashde getal zal tussen 0 en 1 liggen en dus go/no go aangeven.
Als je voor elke neuron in de verborgen laag simpelweg Σni=1wini doet, dan kom je op antwoorden ver boven de 1 uit, terwijl 1 voor de maximale activiteit van een neuron staat. Een squashing function maakt hier een getal tussen 0 en 1 van. Een verborgen laag die alleen met de formule werkt, is overbodig, gezien dezelfde functie ook bereikt kan worden door het gewicht tussen input en output aan te passen. Om nuttig te zijn, is er een threshold functie nodig. Mogelijke combinaties van activaties worden dan terug gebracht naar twee of drie mogelijke outputs. Denk aan de XOR approximatie, die werk alleen als we een verborgen laag hebben die de aantal mogelijke activaties: 4 (11, 10, 01, 00) terugbrengt tot 3 (10, 01, 00).
Het doel van een neuraal netwerk is dat een object correct wordt geïdentificeerd, ongeacht de grootte en de positie op het netvlies. Door deze verschillen worden ook andere neuronen geactiveerd. Ondanks dit verschil wil je dat het systeem tot dezelfde conclusie komt.
Je wilt dat alle activiteit die een bepaald object veroorzaakt kunnen onderscheiden van de activiteit veroorzaakt door een ander object. Bij een bepaalde activatietoestand weet het systeem dan: het is object A. Helaas zie je een object nooit twee keer op dezelfde manier. Het systeem moet dus een methode vinden om de representatieruimtes zo in te delen dat iedere activiteit binnenin een bepaald gebied kan worden toegeschreven aan een bepaald object. Deze gebieden zitten in elkaar gevouwen, manifolds. Het netwerk moet deze dus eerst uit elkaar zien te trekken zodat een duidelijke classificatielijn getrokken kan worden. Juist dat uit elkaar trekken is een probleem.
Het netwerk maakt gebruik van een ontvouwtechniek. In het beginstadium is alles nog in elkaar gekreukeld en in het eindstadium minder. De beginlagen zoals V1 hebben maar een klein deel van het receptieve veld en beginnen met het ontkreukelen. Op basis van de output hiervan gaan verdere lagen verder.
Ja, want nieuwe dingen moet je blijven leren.
Een state space is een ruimte met de verzameling van alle mogelijke activiteiten uitgezet op de verschillende dimensies van neuronen. Objecten liggen hierin opgeslagen als een verzameling van activiteiten, een zogeheten manifold. Deze manifold zorgt voor een herkenning van dat object. Objecten raken elkaar niet, want dan zouden er punten zijn waarop een waarneming zou zorgen voor het classificeren van twee objecten.
Alle objecten hebben hun eigen gewichtswaarden in de dimensies van de state space. In de state space heb je zo verschillende subspaces die ieder één object representeren. Wanneer dezelfde gewichtswaarden worden geactiveerd, wordt het bijbehorende object ook geactiveerd.
Door de verschillende gewichtswaarden het het feedforward netwerk ontstaan er manifolds die je van elkaar kunt onderscheiden in de state space. Deze manifolds overlappen elkaar niet en worden dus apart geactiveerd. Ieder punt van activatie activeert dus één object.
Het netwerk heeft een unieke subspace voor dit object dat los staat van andere objecten. Het heeft dus geleerd bepaalde unieke kenmerken van een object te onderscheiden die het uniek maken ten opzichte van andere objecten.
Bij deze receptieve velden wordt óf het midden (center) óf het omliggende (surround) geïnhibeerd of geëxciteerd.
On center off surround: excitatie zit aan de binnen kant en inhibitie hier omheen.
Off center on surround: de inhibitie zit in het midden en excitatie hier omheen.
Dit zijn ganglion cellen in het netvlies (LGN).
On center off surround: excitatie ligt in het midden en aan beide kanten zit inhibitie.
Off center on surround: inhibitie ligt in het midden en aan beide kanten zit excitatie.
Dit zijn oriëntatie kolommen in V1.
Retinale ganglioncellen zijn oriëntatie invariant, in dezelfde mate als dat oriëntatie gevoelige neuronen in de V1 juist invariant voor kleur zijn.
Dit filter beschrijft de receptieve velden in de V1, de oriëntatiekolommen.
γ = aspect ratio. Dit leidt tot selectiviteit in de oriëntatie. Als deze groter wordt krijgt y minder gewicht en wordt de oriëntatie selectiever
σ = effectieve wijdte. Dit leidt tot spatiële selectiviteit van de receptieve velden.
λ = wavelength cosine, leidt tot on-off selectiviteit. Als deze kort is, krijg je veel center-surrounds.
φ = phase cosine. Deze bepaalt welke van de twee optreedt, on-off of off-on. Bij 0 krijg je on-off.
Θ = geeft de hoek van de oriëntatie weer op de xy-assen.
De S laag bestaat uit simpele units die gepooled worden. De reactie van een simpele unit is te berekenen met de onderstaande formule. Binnen een regio delen cellen dezelfde oriëntatie. Deze units gaan over vorm.
De C laag bestaat uit complexe units die gepooled worden (max operatie). De reactie is te berekenen met de onderstaande formule. Hier worden bevindingen van S units gecombineerd en doorgestuurd naar de volgende laag. Deze units gaan over kleur.
Zowel S-units als C-units zijn gevoelig voor bepaalde kenmerken van de afbeelding, zoals bijvoorbeeld de richting. Je hebt de algemene formule waarbij Xi=Wi. Je wilt dat de gewichten van de units overeenkomen met de echte stimuli. In het begin is dit nog niet zo. Door te leren worden de gewichten stap voor stap bijgesteld totdat ze gelijk zijn aan Xi. Dan is er sprake van object invariantie.
Unsupervised learning werkt sequentieel. Daarmee bedoeld men dat het leren laag per laag gaat., van S2 naar S3 enzovoort.
Dit brengt een binding probleem met zich mee. Het is namelijk niet duidelijk hoe verschillende beelden tot één beeld verbonden moeten worden. Een verkeerde classificatie van een gefragmenteerd beeld kan verminderd worden door redundant informatie. Dan is er dense coverage met receptieve velden.
Verschillende voordelen zijn:
Ze categoriseren snel
Ze werken parallel voor vorm, kleur en locatie
Het kan vrijwel elke functie met een aangegeven gewenste nauwkeurigheid benaderen
Verscheidene leertechnieken kunnen worden gebruikt om de gewichten in het netwerk te bepalen.
Feedforward netwerken implementeren functies. Universele approximator houdt in, dat voor elke functie binnen een klasse een feedforward netwerk gevonden kan worden, dat een functie schat waarin elk gewenst level van accuraatheid bereikt kan worden. Volgens Hornik et al. werkt dit alleen voor eindige intervallen van het veld van input. Dit is een beperking.
Dit fenomeen vindt plaats wanneer feedforward netwerken nieuwe informatie aan proberen te leren. Als dit geprobeerd wordt, wordt de mogelijkheid om vooraf geleerde informatie te produceren, geëlimineerd. De representaties overlappen elkaar dan teveel waardoor gewichten veranderen en eerdere kennis verloren gaat.
Dit is te vermijden door de functie domein te splitten. Dan zijn er namelijk twee netwerken. Elk netwerk doet dan iets anders. Zo hebben de netwerken geen invloed op elkaar.
Dit kan ontstaan vanuit het binding probleem. Netwerken meting dan iets anders en de eenheid verdwijnt.
Door invariante object representaties is één prototype genoeg om een object te herkennen vanuit verschillende perspectieven. Zonder deze representaties zijn er veel verschillende beelden nodig voor herkenning.
Als er meerdere objecten zijn, weet je niet welke kenmerken bij welk object horen.
Dit probleem kan beschreven worden als het relateren of combineren van locatie invariante identiteit aan locatie informatie.
Er moet een karakteristiek van een object als hint gegeven worden. Zo vindt er top-down activatie plaats. Dit zorgt voor een interactie van stimulus activatie in netvlies gebieden.
De activatie komt tot stand door een cue die top-down feedback geeft. Dit komt terecht bij het stimulus gedreven retinotopisch gebied waardoor andere eigenschappen van de stimulus geactiveerd worden. Het tijdsverschil komt omdat een cue buiten het receptieve veld later aankomt.
Feedforward verwerking gaat via V1, V2, V3, V4, PIT en AIT (samengevoegd IT). Feedback heeft dezelfde structuur, maar de connecties werken beide kanten op. Activatie in het feedback systeem vloeit van AIT naar V2. De feedback structuur ligt bovenop de feedforward structuur.
Feedforward is betrokken bij de identificatie van objecten. Het gaat om supervised learning. Het feedback netwerk bij top-down selectie gaat op basis van Hebbian learning: neurons that fire together, wire together.
Feedforward netwerken zijn er voor object identificatie en feedback voor het binden van object informatie en locatie informatie.
Inhibitorische neuronen worden geïnhibeerd door andere inhibitorische neuronen.
Feedback activatie van het disinhibite circuit heeft een connectie met matchende excitatorische neuronen en dit zorgt voor het versterken van activiteit in deze neuronen. Dit gebeurd alleen, wanneer neuronen feedforward activatie ontvangen. Directe activatie zorgt ervoor dat alle signalen in de retinotope gebieden relateert aan het object, geactiveerd worden. Bij disinhibitie wordt alles behalve de belangrijke info geïnhibeerd. Als de stimulus wegvalt is er geen activiteit meer.
Informatie over locatie van een geïdentificeerd object kan gehaald worden uit de interactie in retinotopische gebieden van het ventrale systeem. Dit is de interactie tussen feedforward en feedback netwerken. Hier geeft het feedforward netwerk informatie over een array en feedback over de identiteit van een object. Dit maakt het dorsale pad vrij om actie te bepalen om bijvoorbeeld naar een object te wijzen of het object te pakken.
Een simpele representatie bevindt zich in de V1, terwijl complexere representaties zich bevinden in de V2, V3, V4 en V6:
PIT: het eerste gebied in de ventrale stroom, waar de locatie van een target kan worden geselecteerd
V4: het tweede gebied. Deze is ook betrokken bij de generatie van saccades.
V2: geeft informatie over de locatie door aan de dorsale stroom
Cellen die overeenkomen met de kleur van een cue verhogen de activiteit terwijl niet overeenkomstige cellen in activiteit worden afgezwakt.
Deze oefenvragen zijn gebaseerd op de colleges uit voorgaande studiejaren.
JoHo can really use your help! Check out the various student jobs here that match your studies, improve your competencies, strengthen your CV and contribute to a more tolerant world
Waag jij binnenkort de sprong naar het buitenland? Verzeker jezelf van een goede ervaring met de JoHo Special ISIS verzekering
There are several ways to navigate the large amount of summaries, study notes en practice exams on JoHo WorldSupporter.
Do you want to share your summaries with JoHo WorldSupporter and its visitors?
Field of study
Add new contribution