
Samenvatting Conducting research in psychology 3e druk, met oefenmateriaal
Samenvatting bij hoofdstuk 1 t/m 9 van Pelham & Blanton, de hoofdstukken 10 t/m 20 ontbreken
- Hoofdstuk 1 Inleiding en geschiedenis
- Hoofdstuk 2 De doelen en procedures van wetenschap
- Hoofdstuk 3 Meetschalen, betrouwbaarheid en validiteit
- Hoofdstuk 4 Psychologische metingen
- Hoofdstuk 5 Bedreigingen voor de Validiteit
- Hoofdstuk 6 Niet-experimenteel onderzoek
- Hoofdstuk 7 Experimenteel onderzoek
- Hoofdstuk 8 Quasi-experimenteel onderzoek
- Hoofdstuk 9 Onderzoeksontwerpen
- Begrippenlijst
- Hoofdstuk 1
- Hoofdstuk 2
- Hoofdstuk 3
- Hoofdstuk 4
- Hoofdstuk 5
- Hoofdstuk 6
- Hoofdstuk 7
- Hoofdstuk 8
- Hoofdstuk 9
- Hoofdstuk 10
- Hoofdstuk 11
- Hoofdstuk 12
- Oefenvragen en antwoorden per hoofdstuk
Hoofdstuk 1 Inleiding en geschiedenis
Inleiding
Aan het einde van de zestiende eeuw wedde Sir Walter Raleigh met een hoveling dat hij het gewicht van rook kon meten. De manier waarop hij dit deed was door de overblijvende as te wegen. Hij beweerde dat dit het gewicht van rook was en won de weddenschap.
Dit verhaal klopt waarschijnlijk niet en aan het eind van de achttiende eeuw toonde Antoine Lavoisier met behulp van zeer nauwkeurige experimenten dat hetgeen dat opgebrand is wel blijft bestaan, maar ergens anders heengaat. Dit laatste verhaal is niet compleet maar wel wetenschappelijk. Het illustreert ook dat dingen die onmeetbaar lijken, soms toch echt meetbaar zijn. Bovendien toont het aan dat je een hoop creativiteit en geluk nodig hebt om erachter te komen hoe je bepaalde dingen moet meten. In de psychologie meten we dingen die nog moeilijker vindbaar zijn dan rook en die alleen indirect te observeren zijn.
Het doel van deze cursus is om vertrouwd te raken met de aard van de wetenschappelijke methode en over psychologie te denken als een terrein dat even wetenschappelijk is als natuurkunde of scheikunde.
Bijvoorbeeld: sommige beschrijvingen van de persoonlijkheden van mensen zijn zo algemeen dat ze van toepassing kunnen zijn op iedereen. Dit wordt ook wel een Barnum beschrijving genoemd en geldt als niet-wetenschappelijk. Meneer Barnum wist dat mensen beweringen die gelden voor mensen in het algemeen verwarren met beweringen die alleen voor henzelf gelden.
Vier belangrijke wetenschappelijke aannames
Spaarzaamheid (parsimony)
Dit wordt ook wel Occam’s Razor genoemd. Als men moet kiezen tussen twee concurrerende gelijkwaardige theorieën over een bepaald fenomeen, dan zou men de voorkeur moeten geven aan de meest simpele, ofwel spaarzame theorie. Een goede wetenschappelijke theorie is er één die iedereen zou moeten kunnen begrijpen.
Wat ook getuigt van het begrip spaarzaamheid is het verklaren van hetzelfde gedrag bij mensen en dieren (bijvoorbeeld een chimpansee) met dezelfde theorie in plaats van met twee geheel verschillende theorieën.
Empiricisme
Het maken van systematische observaties om erachter te komen hoe de wereld in elkaar zit.
Testbaarheid
Waarschijnlijk de meest belangrijke aanname is dat wetenschappelijke theorieën testbaar moeten zijn. De meeste technieken die gebruikt worden om theorieën te testen, zijn empirische technieken.
Testbaarheid is gerelateerd aan het door Karl Popper geïntroduceerde begrip falsificeerbaarheid; de mogelijkheid om aan te kunnen tonen dat een theorie niet klopt. Popper was een logisch-positivist. Deze stroming houdt voor dat wetenschap en filosofie alleen gebaseerd kunnen worden op dingen die alleen met absolute zekerheid te observeren zijn. Ook wordt geloofd dat de beste manier om theorieën te testen is om te proberen aan te tonen dat ze niet kloppen. Volgens Popper is iemand pas puur wetenschappelijk bezig als diegene openstaat voor kritiek en revisie. Procedures en methodes zijn volgens hem niet de belangrijkste voorwaarden.
Veel psychologische fenomenen zijn echter niet direct observeerbaar, maar operationele definities (Tolman en Hull) zorgen ervoor dat dit probleem opgelost wordt. Operationele definities verbinden onobserveerbare fenomenen aan dingen die wel te observeren zijn, zoals bijvoorbeeld het meten van honger in termen van uren dat er geen voedsel is ingenomen.
Determinisme
Dit is het idee dat alle dingen die gebeuren betekenisvolle, systematische oorzaken hebben. Voorbeelden van het bewijs dat mensen de voorkeur hebben om te denken op deterministische wijze zijn:
Illusionaire correlaties: men denkt dat er een relatie is tussen twee elementen, terwijl deze er niet is. Dit gebeurt omdat mensen de neiging hebben ergens snel een causaal verband in te zien. Zo ontstaan bijvoorbeeld stereotiepe beelden.
Het gebruik van basisstandaarden (base-rates) vooral als deze geformuleerd zijn in causale termen.
Het gevolg van determinisme is het idee dat wetenschap gebaseerd is op theorieën, want een theorie is een bewering over een causaal verband tussen twee of meer variabelen. Deze theorieën zouden niet erg nuttig zijn zonder enige vorm van determinisme, want dan zouden systematische causale relaties niet bestaan. In het oog van de spaarzaamheid is een van de belangrijkste doelen van een theorie het organiseren en simplificeren van talloze observaties.
Geschiedenis van kennis
Metafysische verklaringen
De eerste verklaringen voor menselijk gedrag zijn metafysisch, dat wil zeggen: bovennatuurlijk. Ze kenmerken zich doordat ze zich niet houden aan wat moderne wetenschappers beschouwen als gevestigde natuurkundige wetten. Ze schrijven gedrag of ervaringen toe aan niet-lichamelijke krachten zoals geesten en goden. Deze verklaringen voor menselijk gedrag zijn verbannen door wetenschappers omdat
ze andere aannames over hoe de wereld werkt hebben
ze een andere manier hebben om te beslissen wat te geloven
Vormen van metafysische verklaringen zijn:
Mythologie en religie: Goden spelen een belangrijke rol in menselijk gedrag.
Astrologie: Gaat ervan uit dat menselijk gedrag wordt bepaald door de activiteit van hemellichamen. Deze vorm is eigenlijk vrij wetenschappelijk, want om iemands karakter te bepalen zijn zeer nauwkeurige gegevens van die persoon noodzakelijk.
Animisme: Dit is het geloof dat natuurlijke fenomenen levend zijn en menselijk gedrag beïnvloeden. Bijvoorbeeld het (al dan niet letterlijk) bezitten van een gedeelte van een dier, geeft een mens ook de eigenschap die dit (gedeelte van het) dier met zich meebrengt.
Fysiologie
Fysiologie is de studie van de onderlinge relaties en functies van verschillende delen van het lichaam en de hersenen. Bijna alles wat we weten over de fysiologie is ontdekt door het gebruik van de wetenschappelijke methode. Een groot gedeelte van de psychologie is gegroeid uit de filosofie en uit de fysiologie en natuurkundige wetenschappen.
Filosofie
Een van de eerste systemen die de concurrentie met de metafysica aanging. Filosofie is zoals dat nu wordt gezien de studie van gedrag, de aard van realiteit en kennis door gebruik te maken van intuïtie, empirische observaties en logica. Vroeger was het echter minder wetenschappelijk en bouwden de filosofen hun redenaties op minder wetenschappelijke manieren van denken, zoals bijvoorbeeld op wat er in de bijbel staat.
De focus op logica was al vroeg te vinden in het domein van de oude filosofen, het duurde echter even voordat men ook overtuigd was van het nut van de focus op empirische observaties. Dit drong pas echt tot de filosofen door in het midden van de negentiende eeuw.
Experimentele psychologie
Veel historici menen dat de psychologie pas een wetenschap werd toen psychologen experimenten uit begonnen te voeren. De meeste mensen zien de Duitser Wundt als eerste psycholoog die hier mee begon. Sinds 120 jaar is psychologie zeer wetenschappelijk en experimenteel van aard.
Geloofsystemen en verschillende manieren van ‘weten’
Er zijn verschillende manieren om tot kennis te komen en dus te weten: logica, intuïties, observatie en autoriteit. Al deze begrippen spelen een rol in de verschillende geloofsystemen: religie, wetenschap, filosofie en regering. Ieder geloofssysteem legt echter een andere nadruk op elk van de manieren om tot kennis te komen.
Religie en regering hechten de meeste waarde aan autoriteit, daarna aan intuïtie, vervolgens aan logica en als laatste aan observatie.
De filosofie hecht de meeste waarde aan logica, daarna aan observatie, vervolgens aan intuïtie en de minste waarde wordt gehecht aan autoriteit.
De wetenschap hecht de meeste waarde aan observatie, dan aan logica, vervolgens aan intuïtie en als laatste aan autoriteit.
De reden dat wetenschap en filosofie met betrekking tot de observatie en logica van elkaar verschillen, kan verklaard worden doordat de filosofen waarschijnlijk geleerd hebben dat je niet alles geloven kunt wat je ziet. Voor de wetenschappers geldt dat logica onbetwistbaar is en soms ook ondoordringbaar, daarom hechten zij de meeste waarde aan observatie.
Tot slot moet opgemerkt worden dat:
Echte genialiteit vaak bestaat uit het vinden van een balans tussen de verschillende manieren om de wereld te begrijpen. Men moet zich niet beperken tot slechts één manier om uit te vinden hoe de wereld in elkaar zit.
Er is geen garantie dat, gemeten over alle mogelijke situaties, één manier van weten de beste is en superieur ten opzichte van de andere manieren.
Hoofdstuk 2 De doelen en procedures van wetenschap
Observatie
Empiricisme: Het baseren van kennis op observaties is een van de belangrijkste begrippen die wetenschap van niet-wetenschap onderscheiden. Er zijn twee manieren om van wetenschappelijke observaties tot een conclusie te komen: inductie en deductie.
Inductie
In de zeventiende eeuw geloofde Francis Bacon dat inductie het meest geschikt was. Inductie is het redeneren van specifieke situaties naar algemene principes. Door middel van een oneindig aantal observaties kan een algemene conclusie getrokken worden en zo ontstaat er een theorie. Deze kan dan weer getest worden door middel van het doen van nieuwe observaties en zo wordt de theorie eventueel herzien of aangepast. Als de theorie zo precies geworden is en er zoveel ondersteuning voor is, kan het een wet worden.
In de achttiende eeuw kwam er kritiek op de methode van inductie. Deze kritiek kwam van David Hume. Hij bracht het probleem van inductie aan het licht. Dit houdt in dat het nooit zeker is hoeveel observaties er gemaakt moeten worden om er zeker van te zijn dat een theorie of wet waar is. Het kan altijd zijn dat de volgende observatie het tegendeel van de theorie bewijst.
Deductie
Om het probleem van inductie op te lossen wordt naast inductie ook deductie toegepast. Dit is het redeneren van een algemeen principe naar een specifieke situatie. Dus een theorie wordt gebruikt om hypothesen af te leiden die dan getest worden tegen observaties. Vooral Karl Popper was hier voorstander van. Je kunt in het algemeen namelijk wel een theorie falsificeren, maar nooit bewijzen.
De reden dat toch veel wetenschappers doorgaan met proberen te bewijzen dat theorieën waar zijn, is omdat ten eerste de opvattingen van Hume en Popper misschien wat overschat zijn. Je kunt namelijk soms toch zeggen dat iets waar is, maar dan onder specifieke situaties. Ten tweede kan er een hoop geleerd worden van fouten, dus door een theorie te falsificeren. Want dan is tenminste bekend wat niet waar is.
Tot slot moet opgemerkt worden dat wetenschappers niet zo snel hun theorie los laten als men zou verwachten. Zij leveren dikwijls hevig protest op de kritieken die op hun theorieën afgevuurd worden. Dit is ook niet altijd onterecht.
Hypothesen, wetten en theorieën
Hypothese: Een voorspelling over specifieke gebeurtenissen die afgeleid is van één of meerdere theorieën. Door het voortdurend testen van hypothesen kan een wetenschapper erachter komen of een specifieke theorie waar is. Als er heel veel bewijs voor een theorie gevonden is, kan een wetenschapper deze gegevens integreren en een wet voorstellen. Dit is in de psychologie echter nog niet voorgekomen.
Wet: Een universele bewering van de aard van dingen die het mogelijk maakt om betrouwbare voorspellingen te doen over de toekomst. Het primaire doel van wetenschap in het algemeen is om natuurwetten vast te stellen waarmee voorspellingen kunnen worden gedaan. Veel niet-psychologen vinden het echter onmogelijk om menselijk gedrag op een wetenschappelijke manier te bestuderen.
Veel van de critici geven aan dat niemand precies kan voorspellen wat iemand anders zal gaan doen. Hierin hebben deze critici gelijk, maar het gaat de psychologie ook niet om het voorspellen van specifiek gedrag van één persoon, maar om het voorspellen van het gedrag van grote groepen mensen. Dus ook psychologen zoeken wetten, namelijk die het gedrag van mensen kunnen bepalen. En hoewel sommige voorspellingen niet perfect zijn, zou een psycholoog voorspellingen moeten kunnen doen die ongetrainde mensen op dit gebied niet zouden kunnen doen.
Theorie: Een algemene bewering over de relatie tussen twee of meer variabelen. Deze moeten deterministisch, empirisch, spaarzaam en testbaar zijn. Ze moeten ook duidelijk aangeven op welke situaties de theorie van toepassing is. Een groot deel van de psychologie concentreert zich voornamelijk op het ontwikkelen van theorieën in plaats van het ontwikkelen van wetten.
Het verschil tussen wetten en theorieën is dat wetten universeler zijn. Theorieën hebben grensvoorwaarden en zijn dus niet op alle situaties toepasbaar. Omdat theorieën grensvoorwaarden hebben, kan het zijn dat meerdere theorieën over hetzelfde onderwerp waar zijn. Ook kan het zo zijn dat twee correcte theorieën elkaar opheffen. Bijvoorbeeld het kijken naar veel geweld op tv leidt tot agressiviteit en het drinken van veel alcohol ook. Als iemand veel geweld op tv ziet en geen alcohol drinkt, hoeft deze persoon niet agressief te worden, maar dat wil niet zeggen dat de eerste theorie niet klopt.
Soms kan iemand zeggen dat een theorie niet klopt omdat er een geval bekend is waarin niet het door de theorie voorspelde gedrag wordt vertoond. Dit is voor een psycholoog alleen maar een aanwijzing dat een theorie niet hetzelfde is als een wet. Daarnaast geloven sommige mensen niet in natuurwetten, maar wel dat menselijk gedrag geproduceerd kan worden door verschillende oorzaken, ook wel equifinaliteit genoemd.
Het toetsen van hypothesen
Falsificatie
Onderzoekers proberen bewijs te vinden tegen de theorie of hypothese. Het komt echter niet vaak voor dat iemand zijn eigen theorie probeert te falsificeren, maar onderzoek wordt gedaan onder een strikt aantal regels en daardoor is het meestal niet mogelijk weg te komen met bevooroordeelde benaderingen van het toetsen van hypothesen. Bovendien worden theorieën vaak door meerdere onderzoekers getoetst, ook door onderzoekers die een tegengestelde mening hebben. Zij proberen dan meestal ook echt een theorie te falsificeren.
Validatie
Onderzoekers proberen bewijs te verzamelen dat een theorie of hypothese ondersteunt. Het is ruw gezegd het wetenschappelijke equivalent van positieve test bias (zie hieronder). Deze methode kan het best gebruikt worden als een onderzoeker een nieuwe hypothese of theorie heeft en wil aantonen dat deze klopt in om het even welke situatie. Daarna kan begonnen worden met het vaststellen van de grensvoorwaarden.
Positieve test bias is de neiging van mensen in het algemeen te proberen een hypothese te bevestigen in plaats van te ontkennen. Een voorbeeldstudie waarin dit wordt aangetoond is de kaartentest van Wason (1971). De test bestaat uit vier kaarten met op de voorkant respectievelijk een E, een K, een 4 en een 7. De hypothese is dat elke kaart die een klinker heeft op de andere kant een even nummer moet bevatten. De vraag is welke kaart er om moet worden gedraaid om deze hypothese te testen. Veel mensen draaien de E of de 4 om en proberen dus de hypothese te bevestigen. Maar eigenlijk zou de 7 omgedraaid moeten worden om te kijken of de hypothese ontkend kan worden. Een voorbeeld van positieve test bias in de sociale psychologie is gedragsbevestiging. Dit is de neiging om bij een persoon gedragingen uit te lokken die consistent zijn met de initiële verwachtingen van die persoon. Snyder, Tanke en Berscheid toonden in 1977 aan dat mannen die dachten dat ze met een extraverte vrouw aan de telefoon praatten, zich zo gingen gedragen dat de vrouw aan de andere kant van de lijn zich echt extravert gedroeg als reactie op het gedrag van de man.
Kwalificatie
Onderzoekers proberen de grenswaarden te vinden waartussen een theorie of hypothese zowel waar als niet waar is. Vaak kan dit leiden tot de integratie van twee tegenstrijdige theorieën door te specificeren onder welke omstandigheden beide theorieën gelden. Kwalificatie combineert kenmerken van zowel validatie als falsificatie en is daardoor waarschijnlijk de beste manier om wetten vast te stellen.
Wel moet opgemerkt worden dat onderzoekers altijd op de een of andere manier proberen een theorie te valideren, welke benadering van het testen van hypothesen ze ook uitvoeren.
Het is ook niet zo makkelijk om bewijs voor een theorie te krijgen als je bedenkt dat een heleboel onderzoekers die het niet met de theorie eens zijn deze proberen te falsificeren. Door dit te doen proberen ze weer hun eigen (tegengestelde) theorie te bevestigen. Met kwalificatie wordt geprobeerd op zijn minst een gedeelte van de twee samen te bevestigen.
Een belangrijk model voor psychologisch onderzoek
Het experimentele paradigma is de ideale volgorde van procedures die geldt als het model voor psychologisch onderzoek. Het is ontwikkeld in de jaren twintig door R. A. Fischer. Belangrijke begrippen zijn:
Paradigma: Aantal aannames en onderzoeksmethoden die een wetenschappelijke onderzoekstraditie vormen.
Proefneming (experimentation): Onderzoekers manipuleren één of meer variabelen om het effect op andere variabelen te meten.
Experiment: Verwijst naar een specifieke studie waarin de onderzoeker gebruik heeft gemaakt van proefneming. Iets wordt een studie als een onderzoeker een onafhankelijke variabele heeft gemanipuleerd.
Drie belangrijke technieken in het experimentele paradigma zijn statistisch toetsen, manipulatie en willekeurigheid.
Statistisch toetsen
Geeft een aantal regels en procedures voor het maken van een inferentie van het onderzoek naar de gehele populatie. Onderzoekers beginnen bij het aannemen van de nulhypothese die stelt dat de eigen bevindingen niet waar zijn. Het tegenovergestelde van de nulhypothese is de alternatieve hypothese, die beweert dat elk verschil tussen de controlegroep en de experimentele groep ook écht is. Dit is dus de bewering dat de beweringen van de onderzoekers wel waar zijn. Met een statistische toets wil een onderzoeker uitvinden of het resultaat van het onderzoek significant groter is dan verkregen zou kunnen worden puur bij toeval alleen. Het alfaniveau is de standaard tegen welke de nulhypothese verworpen kan worden. Meestal wordt een waarde van 0,05 aangehouden, wat inhoudt dat de nulhypothese verworpen kan worden als de bevindingen van het onderzoek slechts in 5% van de gevallen bij toeval voor zouden komen.
Manipulatie
Dit is het systematisch variëren van de onafhankelijke variabele om het effect op de afhankelijke variabele te meten. Dit betekent normaalgesproken dat een experiment op zijn minst twee groepen deelnemers heeft; de experimentele groep (die de onderzochte behandeling krijgt) en de controlegroep (die de behandeling niet krijgt).
Het enige verschil tussen de twee groepen moet het wel of niet krijgen van behandeling zijn, zodat geconcludeerd kan worden dat bepaalde verschillen tussen de twee groepen na het experiment veroorzaakt zijn door de manipulatie.
Het is niet altijd noodzakelijk een controlegroep te hebben, bijvoorbeeld in het geval van het gehoorzaamheidsexperiment van Millgram waarin proefpersonen van de proefleider in oplopende sterkte shocks toe moesten dienen aan personen als deze een fout zouden maken in de door hun geleerde woordjes. Millgrams controle was dat hij aan ervaren psychologen gevraagd had het percentage te schatten van mensen die tot het meest extreme niveau door zouden gaan. (Zoals we weten, werd dit percentage behoorlijk onderschat, dus heeft Millgram later toch nog enkele variaties van zijn experiment gemaakt mét een controlegroep.)
Problemen met manipulatie zijn dat er altijd een inferentie gemaakt moet worden.
Het is nooit zeker of de conclusies van het experiment zijn te generaliseren naar de gehele populatie.
Men kan er niet zeker van zijn dat de controlegroep dezelfde samenstelling heeft als de experimentele groep.
Willekeurigheid (randomnisation)
Om het eerste probleem op te lossen moet men gebruik maken van willekeurige selectie (random sampling). Eerst wordt bepaald van welke populatie een inferentie moet worden gemaakt (bijvoorbeeld mannen, kinderen van vijf jaar, kunstenaars, etc.) en daarna wordt uit die populatie het aantal deelnemers zo gekozen dat iedereen hierop exact dezelfde kans heeft. Zo kan ervoor gezorgd worden dat de deelnemers een goede afspiegeling zijn van de totale populatie van interesse. Hoe groter de groep, hoe meer de kans dat de steekproef op de populatie lijkt.
Om het tweede probleem op te lossen moet men gebruik maken van willekeurige toewijzing (random assignment). Alle deelnemers aan het onderzoek hebben een gelijke kans om aan een van de onderzoeksgroepen toegewezen te kunnen worden. Bij een klein aantal deelnemers kan dit bijvoorbeeld door nummers uit een doos te trekken of een muntje op te gooien.
Het verschil tussen willekeurige selectie en willekeurige toewijzing is dat ze hetzelfde doen, maar op een ander niveau in het onderzoek.
Hoofdstuk 3 Meetschalen, betrouwbaarheid en validiteit
Soorten meetschalen
Interval schalen
We spreken van intervalschalen als het verschil tussen twee uitkomsten een eenduidige betekenis heeft. Deze schalen kunnen soms negatieve waarden aannemen, maar kennen geen natuurlijk nulpunt. Een voorbeeld is de temperatuur. Je kunt niet zeggen dat 20C twee keer zo warm is als 10C, maar het verschil tussen 1C en 2C is wel even groot als het verschil tussen 21C en 22C. Ook veel psychologische schalen zijn intervalschalen.
Ratio schalen
Als er wel sprake is van een natuurlijk nulpunt, spreken we van een ratioschaal, wat inhoudt dat er nooit sprake is van negatieve waarden. Een voorbeeld is gewicht of lengte. Je kunt dus wel zeggen dat iemand die 80 kilo weegt twee keer zo zwaar is als iemand van 40 kilo.
Nominale/categorische schalen
De variabele meet een kenmerk dat niet op een voor de hand liggende manier in een getal kan worden weergegeven. Aan de waarden kan wel een codenummer worden gegeven, maar deze kennen geen logische volgorde; ze kunnen willekeurig toegeschreven worden. Een voorbeeld van een nominale variabele is geslacht.
Ordinale schalen
Wanneer er wel sprake is van een logische volgorde spreekt men van ordinale schalen. Er zit een zekere hiërarchie in de volgorde. Hoewel deze schalen enige informatie bieden over de relatieve waarde of positie van dingen, geven ze geen enkele informatie over de absolute verschillen tussen deze dingen. Een voorbeeld is classificatie van restaurants op basis van het aantal michelinsterren.
Conversie en verdraaiing
Het is vaak wel mogelijk een meting van een hoger niveau te converteren naar een lager niveau, maar andersom is dit niet het geval. Als er een keuze is, is het vaak beter om ratio en interval schalen te gebruiken. Het is vaak ook zo dat de range van opties die in een vragenlijst wordt aangeboden in hoge mate beïnvloedt wat de deelnemers invullen. Ze geven extremere antwoorden als er ook extremere antwoordmogelijkheden zijn.
Validiteit en betrouwbaarheid worden beïnvloed door de meetschaal die de onderzoeker gebruikt om de afhankelijke variabele te beoordelen. Hoe ingewikkelder de schaal, hoe meer onderzoek naar de validiteit en betrouwbaarheid nodig is.
Betrouwbaarheid
Dit is de mate van consistentie van een onderzoek, dat wil zeggen dat bij herhaling dezelfde uitkomsten verwacht mogen worden. De beste manier om betrouwbaarheid te verkrijgen is door zoveel mogelijk observatoren zoveel mogelijk observaties op zoveel mogelijk gelegenheden te laten maken, dit wordt de meer is beter regel genoemd.
Verschillende vormen van betrouwbaarheid zijn:
Interne consistentie
De mate waarin verschillende items in een multiple-item meting zich op dezelfde manier gedragen, dus met elkaar correleren. Een voorwaarde is dat er meer dan één item gaat over de variabele die gemeten wordt, anders kan er geen correlatie berekend worden. Een andere voorwaarde is dat de woorden die in de test gebruikt worden door iedereen op dezelfde manier begrepen worden. Mocht er duidelijk een item zijn dat door veel mensen niet goed begrepen is, dan wordt dit item normaalgesproken uit de beoordeling gelaten, omdat het de betrouwbaarheid onterecht in een negatieve manier zal beïnvloeden. Interne consistentie is te meten met Cronbach’s Alfa.
Test-hertest betrouwbaarheid
Wordt ook wel temporele consistentie genoemd. Dit is de mate waarin de uitkomsten van een meting of item op tijdstip één positief correleren met de uitkomsten op tijdstip twee. Dit wordt ook vaak toegepast bij vragenlijsten.
Interbeoordelaar betrouwbaarheid
Dit is de mate waarin verschillende beoordelaars het onafhankelijk van elkaar eens zijn over een bepaalde observatie. Bij turnen wordt dit bijvoorbeeld gebruikt. De onafhankelijkheid is belangrijk, want als er overleg wordt gepleegd, kunnen de beoordelaars elkaar beïnvloeden en wordt de betrouwbaarheid onterecht hoger.
Onderzoekers zijn vooral geïnteresseerd in deze vorm van betrouwbaarheid als er gedrag wordt bestudeerd dat niet op een eenvoudige manier te beoordelen is (zoals het aantal keer dat iemand op een knop drukt). Het gaat vaak om situaties waarin deelnemers niet de capaciteit of motivatie hebben zichzelf te beoordelen, zoals bij het aangeven van de mate van nervositeit voor het maken van een tentamen.
Validiteit
Hieronder wordt algemeen verstaan de relatieve nauwkeurigheid en juistheid van de bewering die onderzocht wordt, dus de mate waarin gemeten wordt wat ook echt gemeten moet worden. Dit kan in heel brede zin toegepast worden zoals de validiteit van een heel onderzoek, maar het kan ook toegepast worden op één onderzoeksvariabele.
Verschillende vormen van validiteit zijn onder andere:
Externe validiteit
Als een studie extern valide is, dan zijn de bevindingen van het onderzoek een nauwkeurige beschrijving van wat er in de echte wereld gebeurt. Dus de bevindingen zijn te generaliseren naar andere mensen, culturen, sociale omgevingen, tijdstippen en geestelijke toestanden. Het is echter heel moeilijk een studie te doen die oneindig generaliseerbaar is. Dit heeft alles te maken met grensvoorwaarden. Als een studie hele nauwe grensvoorwaarden heeft, dan is dit een teken van lage externe validiteit.
Over het algemeen houden onderzoekers zich het meest bezig met:
Generaliseerbaarheid naar andere mensen, dus dat de studie ook met een andere steekproef gedaan zou kunnen worden en dan hetzelfde resultaat zouden behouden. Dit is vooral van belang wanneer het om een grote populatie gaat. Er wordt op universiteiten veel onderzoek gedaan met studenten en een belangrijk punt van kritiek is dan ook of deze studenten wel een goede afspiegeling zijn van de totale populatie.
Generaliseerbaarheid naar andere situaties, met name of studies wel een goede afspiegeling zijn van wat er in de echte wereld gebeurt.
Studies die een hoge externe validiteit hebben zijn passieve observatiestudies, vooral wanneer ze uitgevoerd worden met veel verschillende groepen in levensechte situaties. Nadeel is dat deze studies niet altijd een hoge interne validiteit hebben.
Interne validiteit
Als een studie intern valide is, kan er met redelijke zekerheid gezegd worden dat alle geobserveerde veranderingen in de afhankelijke variabele de oorzaak zijn van de manipulaties in de onafhankelijke variabele. Interne validiteit zegt iets over causaliteit.
John Stuart Mill zegt dat aan drie vereisten moet worden voldaan om te kunnen beweren dat er sprake is van causaliteit.
Uitschakelen van confounds, hoewel dit erg moeilijk kan zijn. Een voorbeeld van een confound is het derde variabele probleem, dit is het geval wanneer een derde variabele ervoor zorgt dat zowel de afhankelijke als de onafhankelijke variabele verandert. Zo covariëren deze twee variabelen en lijkt het onterecht alsof er een causaal verband bestaat.
Covariatie: er moet op zijn minst een verband bestaan tussen de variabelen om aan te tonen dat er sprake is van een causale relatie. Met covariatie is nog niet te zeggen welke kant de causaliteit opgaat. Daarom het derde punt.
Temporele Sequentie: verandering van de onafhankelijke variabele moet voorafgaan aan die van de afhankelijke variabele. In een onderzoek waarin vele variabelen worden gemeten is het echter niet altijd duidelijk te zien wat nu welke verandering veroorzaakt heeft.
Een oplossing hiervoor is het meten van de variabelen op verschillende tijdstippen (bijvoorbeeld in longitudinale studies). Alleen nu is het nog steeds niet zeker of er niet andere factoren zijn geweest die invloed hebben gehad op de verandering, dus is het eerste punt ook belangrijk:
Vooral laboratoriumstudies hebben een hoge interne validiteit. Dit komt omdat ze:
individuele verschillen controleren
de onderzoeker in staat stellen zich te houden aan de hierboven beschreven vereisten.
Helaas hebben laboratoriumstudies niet altijd een hele hoge externe validiteit.
Concept validiteit
Dit is de mate waarin het gehele onderzoek past in de bredere theorie waarvan de onderzoekshypothese is afgeleid. De hypothese moet op een logische manier af te leiden zijn van de theorie, maar het moet niet zo zijn dat de hypothese ook opgesteld zou kunnen worden los van de theorie.
Construct validiteit
Dit is de mate waarin de onafhankelijke en de afhankelijke variabelen van het onderzoek ook echt datgene meten wat de onderzoeker beoogt te meten. Het is een directe reflectie van de kwaliteit van de operationele definities. Als je bijvoorbeeld de mate van honger wilt meten is de variabele ‘aantal uren dat iemand niet gegeten heeft’ een betere operationalisatie dan ‘het aantal minuten dat iemand in de supermarkt heeft gelopen’.
De kunst is om het construct zo optimaal mogelijk te vertalen in meetbare variabelen. Dit wordt moeilijker naarmate een onderzoeker met abstracte of onobserveerbare begrippen te maken heeft, zoals emotie en cognitie.
De overeenkomst tussen construct en concept validiteit is dat ze allebei te maken hebben met hoe goed hetgeen de onderzoeker heeft gemeten past bij wat gemeten moest worden. Het verschil tussen construct en concept validiteit is dat het laatste veel breder is. Construct validiteit speelt op het niveau van de manipulatie en metingen in een specifieke studie en concept validiteit heeft te maken met de gehele onderzoekshypothese en soms zelfs met onderzoeksprogramma’s.
Over het algemeen geldt dat hoe betrouwbaarder een meting is, hoe meer valide. Betrouwbaarheid is een noodzakelijke voorwaarde voor validiteit, maar niet een voldoende voorwaarde. Ook geldt dat een groot aantal metingen niet alleen de betrouwbaarheid verhoogt, maar ook de validiteit.
Hoofdstuk 4 Psychologische metingen
In de psychologie gaat het meestal over niet direct observeerbare, interne, toestanden van mensen. Om van psychologie een wetenschap te maken is het dan nodig om deze toestanden te vertalen in dingen waarmee gerekend kan worden.
Er zijn twee hindernissen die een onderzoeker tegenkomt bij het zelf-rapportage onderzoek:
De deelnemers aan het onderzoek moeten de vragen hetzelfde interpreteren als de onderzoeker dat heeft gedaan.
Deelnemers moeten hun interne toestand kunnen vertalen naar een waarde op de responsschaal.
Er is gesteld dat elke deelnemer dezelfde twee stappen maakt wanneer ze een vraag in het onderzoek beantwoorden. Deelnemers gaan eerst door een oordeelfase (judgment phase) en vervolgens door een response translation fase.
De judgement fase
In deze fase van het beantwoorden van een zelf-rapportage vraag, bepalen de deelnemers welke vraag wordt gesteld en vormen ze een eerste reactie. Onderzoekers moeten niet alleen bepalen welke vraag ze beantwoord willen zien, maar ook welk proces ondergaan moet worden door de deelnemers wanneer deze een antwoord proberen te zoeken.
Bij het opstellen van een vragenlijst voor deelnemers in een onderzoek, moeten de hypothesen zo vertaald worden dat ze meetbaar zijn. Ook moeten de deelnemers de vraagstelling net zo interpreteren als de onderzoekers dat doen. Een manier om te testen of dit is gelukt, is het uitvoeren van een pilot studie. Een pilot studie is een soort oefenonderzoek, waarmee onderzoekers hun meetschalen of manipulaties kunnen verscherpen voor het uiteindelijke, echte onderzoek.
In marketing onderzoek wordt vaak gebruik gemaakt van focus groepen. Dit is een representatieve steekproef van deelnemers uit de groep die meedoet aan het onderzoek. In deze groepen wordt gesproken over de ervaringen van de deelnemers in het onderzoek, zodat de onderzoeker hier een beeld krijgt van.
Er wordt onderscheid gemaakt tussen open vragen en gestructureerde vragen. Bij open vragen kan een deelnemer op elke manier reageren. Hij mag zelf zijn woorden kiezen en het antwoord kan alle kanten op. Bij de gestructureerde vragen worden deelnemers gedwongen te antwoorden op een vaste schaal.
Deze laatste vorm wordt vaker gebruikt, maar vooral bij pilot onderzoeken kan het handig zijn de open vragen te gebruiken om zo de gestructureerde vragen te verfijnen.
Bij open vragen krijgen de onderzoekers een rijk en gevarieerd beeld van de deelnemer, iets waar vaak meerdere gestructureerde vragen voor nodig zijn. Bij gestructureerde vragen is het beeld veel beperkter, maar hier komen getallen naar voren waarmee gerekend kan worden.
Bij het opstellen van vragen in een zelf-rapportage vragenlijst, moet rekening worden gehouden met de volgende punten:
Hou het simpel. Vermijd complexe vraagstellingen en zorg dat de woorden in de vraag worden begrepen door alle deelnemers.
Informeel taalgebruik. Hoewel er in duidelijke termen en grammaticaal correcte taal moet worden geschreven, is het ook belangrijk om relatief informeel te schrijven. Vaktermen moeten worden vermeden. Als vuistregel kan gelden dat de vragen begrepen moeten worden door mensen met een lager niveau dan de te testen doelgroep.
Vermijd (dubbele) ontkenningen. Het gebruik van het woord ‘niet’ in een vraag kan voor veel verwarring zorgen. Een bevestigende manier van vragen stellen is duidelijker en overzichtelijker.
Vermijd dubbelzinnige vragen en vraag een ding tegelijk. Het moet duidelijk zijn over welk item het gaat in een vraag.
Vermijd vragen waarin een keuze afgedwongen wordt. In deze vragen wordt een deelnemer gevraagd te kiezen tussen twee of meer opties. Vaak zegt een antwoord op dit soort vragen niets.
Vermijd vragen die iedereen of niemand zal onderschrijven. Dit soort vragen leiden tot vloereffecten en plafondeffecten. Bij een vloereffect antwoorden alle deelnemers aan de lage kant van een puntenschaal en bij een plafondeffect zal iedereen aan de hoge kant antwoorden. Beide zijn voorbeelden van het beperken van de spreidingsbreedte.
Vraag voorzichtig naar gevoelige dingen. Deelnemers zullen niet altijd graag hun mening ergens over geven. De kans bestaat dat ze sociaalwenselijke antwoorden gaan geven. Het is hier belangrijk dat duidelijk wordt gemaakt wat met de vraag wordt bedoeld.
Zorg ervoor dat de vragen relevant zijn voor iedere deelnemer.
Maak meerdere vragen om hetzelfde construct te meten. Ook kunnen vragen op subtiel verschillende manieren worden gesteld. Een voorbeeld is om dezelfde vraag een keer op een positieve manier en een keer op een negatieve manier te stellen.
Geef een context. Mensen evalueren bijna alles in vergelijking met iets anders. Onderzoekers kunnen bij een vragenlijst instructies geven en daarmee een context creëren waartegen de vragen moeten worden bekeken.
Denk na over de volgorde van vragen. Stel eerst algemene vragen om de deelnemers op hun gemak te stellen en daarna pas gevoelige vragen. Wees ook voorzichtig met de manier waarop gevoelige vragen worden gesteld.
Garandeer anonimiteit. Wanneer deelnemers beseffen dat de gegevens anoniem en vertrouwelijk zullen worden behandeld, verhoogd dit de kans op eerlijke antwoorden.
De response translation fase
Bij het ontwerpen van een numerieke meetschaal moet er rekening worden gehouden met de volgende punten:
Hoeveel getallen er gebruikt worden. De schaal moet niet te smal, maar ook niet te breed zijn; er moet een balans worden gevonden. Op een goede schaal kunnen de deelnemers elke mening die ze hebben aankruisen, maar teveel keuzemogelijkheden leidt tot verwarring. Er is gebleken dat de meest effectieve schalen tussen de drie en tien opties hebben.
Geef de getallen betekenis. Wanneer enkel getallen worden gebruikt, kan dit voor verwarring zorgen. Het is duidelijker om bijvoorbeeld bij het getal 1 ‘helemaal niet’ en bij het getal 10 ‘absoluut wel’ te zetten. Verder maakt het nog verschil welke woorden worden gebruikt. Zo wordt ‘heel veel’ vaak minder sterkt ingeschat als bijvoorbeeld ‘compleet’ terwijl beide bij het getal 10 staan. De gemiddelde response zal dus waarschijnlijk lager uitvallen wanneer ‘compleet’ wordt gebruikt. Ten slotte is het belangrijk woorden te gebruiken die dezelfde intervallen hebben bij elk lager of hoger getal. De psychologische afstand tussen 1 en 3 moet dan net zo groot zijn als die tussen 4 en 6.
Kies het beste getallensysteem. Er wordt onderscheid gemaakt tussen unipolaire en bipolaire schalen. Unipolaire schalen beginnen bij een laag getal en werken dan omhoog naar een maximum, gekozen getal. Deze schalen worden verreweg het meeste gebruikt. Bipolaire schalen gaan vanuit het nulpunt beide kanten op, zowel positief als negatief.
De EGWA (empirically grounded, well anchored) response schaal wordt aangeraden. Het is een simpele en directe schaal die in veel verschillende onderzoekssituaties gebruikt kan worden.
Bij het maken van vragenlijsten moeten de volgende drie punten worden gevolgd:
Bedenk heel goed wat precies gemeten moet worden.
Maak veel vragen waaruit later een selectie wordt gemaakt.
Maak een analyse van de schaal en vind de beste items. Dit kan met bijvoorbeeld een factoranalyse.
Naast de EGWA zijn er nog een aantal alternatieve methoden:
De Semantic Differential. De psycholoog Charles Osgood heeft vragenlijsten gemaakt waarin bijvoeglijke naamwoorden, onderverdeeld in drie categorieën, gebruikt kunnen worden om scores toe te kennen aan bepaalde vragen.
Thurstone en Guttman Scales. Bij de Thurstone schaal (houding t.a.v. oorlog) worden uitspraken gedaan, ieder met een eigen score, waaruit een keuze gemaakt kan worden. In plaats van een score toekennen aan een uitspraak, wordt hier de uitspraak gekozen. Bij de Guttman schaal (houding t.a.v. abortus) worden steeds extremere uitspraken gedaan waar iemand bevestigend of ontkennend op moet antwoorden.
Hoofdstuk 5 Bedreigingen voor de Validiteit
Het verstrijken van de tijd verandert mensen
Regressie richting het gemiddelde
Dit houdt in dat mensen die op een voortest erg hoog of laag scoren de neiging hebben bij de natest een score te hebben die meer gemiddeld is. Op deze manier kan het lijken dat iemand beter of slechter is in iets dan hij werkelijk is, terwijl de eerste extreme score gewoon een uitzondering was.
Belangrijk is om rekening te houden met het verschil tussen de ware score, een stabiele score van iemands karaktereigenschap waarin geluk en pech constant gehouden is en de geobserveerde score, die niet alleen door de ware score, maar ook door error beïnvloed wordt en dus eerder aan verandering onderhevig is dan de ware score. Ook hier is de oplossing om een controlegroep in te stellen die tussen de twee tests niet de behandeling van interesse krijgt.
Ontwikkeling en geschiedenis
Vormen een bedreiging voor de interne validiteit, vooral als er gebruik wordt gemaakt van voortest – natest onderzoek zonder controlegroep. Ontwikkeling verwijst naar veranderingen die meer specifiek zijn voor één persoon of leeftijdsgroep naarmate deze ouder wordt. Geschiedenis verwijst naar de algemene veranderingen in de tijd in een grote groep mensen, zoals een cultuur of natie.
Mensen verschillen van elkaar
Non-respons bias
De respondenten zelf zijn de oorzaak van de bias, bijvoorbeeld in het geval van een thuisgestuurde enquête kunnen respondenten zelf kiezen of ze mee willen doen. De mensen die geïnteresseerd zijn in het onderwerp, zullen eerder geneigd zijn de enquête terug te sturen dan de mensen die niets om het onderwerp geven. Ook hiermee wordt de externe validiteit bedreigd.
Individuele verschillen
De onderzoeksmethode die het meest gevoelig is voor deze bedreiging is het pseudo-experiment. Hierbij wordt er geen variabele gemanipuleerd. Er is ook geen controlegroep om te kijken of de persoon toevallig uitzonderlijk goed of slecht is in de uit te voeren taak, dus er kan nooit met zekerheid gezegd worden of de individuele verschillen of de onafhankelijke variabele de verandering in de afhankelijke variabele heeft veroorzaakt. Op deze manier vormen individuele verschillen een bedreiging voor de interne validiteit.
Selectie bias
Dit is het geval als er een proef wordt genomen van een niet representatieve steekproef, doordat bijvoorbeeld geen gebruik is gemaakt van willekeurigheid. Het gebruik van alleen studenten voor een onderzoek is een vorm van selectie bias. Zo kan er niet gegeneraliseerd worden en wordt de externe validiteit bedreigd.
Het bestuderen van mensen, verandert mensen
Heisenberg, Hooke and Hawthorne
Het probleem dat Hooke en Heisenberg tegenkwamen in hun onderzoeken naar mieren en elektroden komt neer op het feit dat mensen het niet altijd leuk vinden om bestudeerd te worden. Onderzoekers op de Hawthorne fabriek waren geïnteresseerd in de invloed van licht op de productiviteit van de arbeiders. Wat bleek was dat de arbeiders meer produceerden als gevolg van elke verandering die doorgevoerd werd, zowel bijvoorbeeld bij meer en bij minder licht. Dit kan verklaard worden door het feit dat de arbeiders wisten dat ze bestudeerd werden. Het Hawthorne effect houdt dan ook in dat de productiviteit toeneemt als mensen weten dat ze bestudeerd worden.
Uitval (attrition)
Participanten maken het onderzoek niet af en stoppen vroegtijdig. Het kan de interne en externe validiteit beïnvloeden en is vooral een risico voor studies die een hele lange tijd duren. Bij homogene uitval is de uitval gelijk verdeeld over alle experimentele condities. De interne validiteit wordt niet bedreigd, maar wel de externe, want de mensen die blijven hebben een bepaalde eigenschap, zoals motivatie om het onderzoek te doen, die misschien niet representatief is voor de populatie. Heterogene uitval komt voor wanneer de uitval niet gelijk verdeeld is over de experimentele condities. Dit vormt een bedreiging voor de interne validiteit, want de verdiensten van de willekeurigheid worden tenietgedaan.
Om uitval te voorkomen is het belangrijk goed te communiceren naar de participanten toe en de studie te presenteren met autoriteit en enthousiasme. Als het onderzoek saai is, kan het soms goed zijn hiervoor te waarschuwen. Ook het inlassen van pauzes of het aanbieden van een vergoeding kan helpen. Vooral in studies waarin de controlegroep de aversieve taak niet hoeft te doen kan het handig zijn ze de taak te laten doen na hun gedeelte van de studie. Er zullen dan vast mensen uitvallen en zo kunnen de twee groepen toch homogeen gemaakt worden.
Deelnemersreactie bias
Dit komt voor wanneer de deelnemers zich realiseren dat ze bestudeerd worden en zich op een andere manier gaan gedragen dan ze normaalgesproken zouden doen.
Het beïnvloedt de interne validiteit en het kan op drie manieren gebeuren:
Deelnemersverwachtingen: deelnemers doen bewust of onbewust wat ze denken dat de onderzoeker van hun verwacht. Dit kan alleen maar gebeuren als een experiment eigenschappen heeft die op een bepaalde manier duidelijk maken wat de verwachtingen zijn, ook wel vraag karakteristieken genoemd. Bijvoorbeeld aanwijzingen die geassocieerd kunnen worden met agressiviteit, zoals wapens, lokken ook meer agressief gedrag uit.
Deelnemersverzet: mensen doen het tegenovergestelde van wat ze denken dat verwacht wordt om de hypothese van de onderzoeker te ontkrachten. Een reden hiervoor kan zijn dat de meeste mensen een basisgevoel van onafhankelijkheid en autonomie hebben.
Vrees voor evaluatie: mensen doen alles om maar goed op de onderzoeker over te komen.
Om deelnemersreactie bias te voorkomen kan de onderzoeker
- In de coverstory, de beschrijving van de aard en het doel van het onderzoek, een valse verwachting door laten schemeren.
- Anonimiteit en privacy garanderen.
- De deelnemers te observeren zonder dat ze het in de gaten hebben (unobtrusive observation).
- Gebruik maken van indirecte metingen over attitudes en meningen van mensen, een vorm van unobtrusive observation.
- Gebruik maken van een bogus pipeline, een nepleugendetector, zodat de deelnemers denken dat hun gedachten gelezen kunnen worden. Hierdoor zijn ze eerder geneigd de waarheid te spreken.
Testeffecten
Dit bedreigt ook de interne validiteit en komt ook vooral voor in voortest - natest onderzoeken en verwijst naar de neiging van mensen beter te scoren op de natest in vergelijking met de voortest omdat het maken van de voortest invloed heeft op het maken van de natest. Vaak is de deelnemer meer geoefend bij de natest.
Bij psychologische testen is er vaak sprake van attitude polarisatie, wat in houdt dat deelnemers in de tussentijd na hebben kunnen denken over hun antwoorden en daar dan extremer in gaan worden om meer sociaal wenselijk over te komen.
Om testeffecten te voorkomen kan er een controlegroep ingesteld worden die alleen een voortest krijgt, zodat de testeffecten gescheiden kunnen worden van de experimentele behandeling. Ook kan de onderzoeker de voortest helemaal weglaten of een hele lange wachtperiode tussen de twee testen laten en een alternatieve versie van de test gebruiken.
Confounds en verwachtingen veranderen mensen
Confounds
Dit is een brede term die verwijst naar elk probleem in de onderzoeksopzet waarbij een extra variabele systematisch varieert met de onafhankelijke variabele. Het is een fout in de onderzoeksopzet, want de onderzoeker is vergeten met deze variabele rekening te houden. Het vormt een bedreiging voor de interne validiteit. Veel correlationele studies hebben last van confounds, ook zeer nauwkeurig opgezette onderzoeken, omdat ze niet altijd goed te achterhalen zijn.
Om confounds uit het onderzoek te verwijderen kan de onderzoeker
Echte experimenten uitvoeren. Ook al is het geen garantie, de willekeurige toewijzing in combinatie met de mogelijkheid specifieke onafhankelijke variabelen te manipuleren zorgt ervoor dat de kans op confounds kleiner wordt.
Heel voorzichtig en nauwkeurig te werk gaat, door zich goed in te lezen en er goed over na te denken.
Elke potentiële confound variabele te meten met de variabelen van interesse, om te kijken of er een correlatie bestaat. Als dit niet het geval is, is er geen gevaar.
Het zou duidelijk moeten zijn dat eigenlijk alle bovengenoemde bedreigingen voor de validiteit confounds zijn. Ze hebben allemaal gemeen dat ze iets zijn wat de onafhankelijke variabele beïnvloedt, waar de onderzoeker geen rekening mee heeft gehouden.
Artifacts
Een artifact verwijst naar een variabele die constant wordt gehouden in een onderzoek, of een serie onderzoeken, en zorgt voor een begrensde context waarin het effect gevonden kan worden. Het vormt een bedreiging voor de externe validiteit. Als een artifact een rol speelt, betekent dit dat de onafhankelijke variabele alleen wordt geassocieerd met de afhankelijke variabele onder de specifieke, misschien zelfs ongewone omstandigheden, waaronder is gekozen het onderzoek te doen.
Het lijkt misschien zo dat confounds en artifacts bijna geen verschil hebben, maar in feite zijn ze precies het tegenovergestelde. Een confound is een variabele die constant gehouden had moeten worden, maar per ongeluk varieerde in het onderzoek, en daarmee de interne validiteit aantast. Een artifact is een variabele die systematisch gevarieerd had moeten worden, maar per ongeluk constant is gehouden.
Verwachtingen van de onderzoeker (experimenter bias)
Dit komt voor wanneer de verwachtingen van de onderzoeker hem ongewild bevooroordelen in de experimentele observaties. Het gaat om dingen die niks te maken hebben met de experimentele manipulatie. Het kan twee vormen aannemen.
De onderzoeker maakt bevooroordeelde observaties, omdat ze onterecht zien wat ze verwachten te zien, omdat dat hun hypothese ondersteunt.
De onderzoeker behandelt zijn deelnemers op een manier waarop de verwachtingen met betrekking tot het gedrag van de deelnemer waargemaakt worden. Dus een persoon die verwacht wordt goed te zijn in een bepaalde taak, wordt meer aangemoedigd dan iemand die slecht zou zijn.
De manier om onderzoeker bias te voorkomen is door gebruik te maken van de dubbelblind procedure. In dit geval weten de onderzoeker en de deelnemer niet in welke onderzoeksconditie de deelnemer is geplaatst.
Als de dubbelblind procedure niet mogelijk is, kan de onderzoeksleider zijn onderzoekers ook op het verkeerde been zetten, door te zeggen dat uitkomst X verwacht wordt, terwijl dit eigenlijk uitkomst Y is. Daarmee wordt onderzoeksbias geriskeerd, maar omdat de onderzoeker zich keert tegen de hypothese, is dit geen probleem.
Hoofdstuk 6 Niet-experimenteel onderzoek
Onderzoek met één variabele
Dit soort onderzoeken heeft als doel het beschrijven van één specifieke eigenschap van een grote groep mensen. Ze zijn vaak meer beschrijvend dan theoretisch en omdat deze studies zich concentreren op één vraag, kan er vaak geen conclusie gegeven worden met betrekking tot causaliteit.
Het beschrijven van populaties
Het doel is om een duidelijk beeld te krijgen van een specifieke groep mensen, ofwel populatie. Een census is een verzameling data die verkregen is door alle mensen van de betreffende populatie te ondervragen. Dit is vaak tijdrovend en erg kostbaar. Daarom wordt er ook vaak gebruik gemaakt van populatieonderzoeken. Deze maken gebruik van willekeurige selectie om een goede steekproef van een populatie te krijgen om schattingen te kunnen maken. Vaak wordt hierbij gebruik gemaakt van cluster steekproeven, waarin mensen uit een populatie al in groepen geplaatst zijn. Als de populatie uit alle studenten van een land bestaat, is een cluster bijvoorbeeld een lijst van alle universiteiten, waaruit een willekeurig aantal gekozen wordt, waaruit weer een aantal studenten willekeurig geselecteerd worden. Helaas is deze methode ook niet waterdicht en bestaat er een kans op fouten. De steekproeffout of foutmarge geeft de waarschijnlijke discrepantie aan tussen de resultaten verkregen uit de steekproef en de resultaten die verkregen zouden zijn als gebruik was gemaakt van de gehele populatie. Populatieonderzoeken worden ook gebruikt in onderzoek naar publieke meningen en in epidemiologisch onderzoek.
Onderzoek naar publieke meningen
Hierbij wordt onderzoek gedaan naar attitudes en voorkeuren van specifieke populaties. Een vorm van zulk soort onderzoek is marketing onderzoek, dat als doel heeft om de houding en voorkeur van consumenten ten opzichte van een bepaald product of bepaalde dienst te achterhalen.
Een reden dat dit soort onderzoeken zin hebben is het feit dat mensen over het algemeen in de valkuil van regressie naar het gemiddelde trappen en daarbij een valse consensus hebben. Dit laatste houdt in dat mensen de attitudes van andere mensen overschatten wanneer deze lijken op hun eigen attitudes. Iemand die rookt zal het percentage rokers hoger schatten dan het werkelijk is. Iemand die niet rookt zal het lager schatten. Daar komt nog bij dat mensen een overdreven groot vertrouwen hebben in hun eigen oordeel. Een bedrijf dat een product in de markt wil zetten doet er daarom goed aan niet op intuïtie af te gaan, maar een goed onderzoek te doen naar de publieke mening.
Epidemiologisch Onderzoek
Dit zijn beschrijvende studies die zich primair focussen op de prevalentie en incidentie van psychologische aandoeningen binnen een populatie. Een probleem met deze studies kan zijn dat er een grote kans is op non-respons bias, want mensen die een mentale ziekte hebben lijken hier het meest vatbaar voor te zijn.
Beperkingen van populatieonderzoeken
Het vereist een goede beschouwing van verscheidene complexe steekproefconsequenties, waardoor deze vorm van onderzoek vaak toch duurder en tijdrovender is dan het lijkt.
Mensen worden sceptischer met betrekking tot populatieonderzoeken. Vooral telefonische enquêtes kunnen niet echt geliefd genoemd worden.
De onderzoeksdeelnemers kunnen dermate verschillend zijn met betrekking tot taal, cultuur en opleidingsniveau, dat het moeilijk is de vragen zo te maken dat iedereen ze begrijpt. Vaak worden de onderzoeken daarom kort en bondig gehouden, waardoor er relatief weinig informatie verkregen kan worden.
De onderzoeksomgeving is vaak het huis van de deelnemer. De onderzoeker kan bijvoorbeeld bij een telefonische enquête niet zien wat de deelnemer aan het doen is tijdens het afnemen van de vragenlijst.
Gemakssteekproeven
Soms hoeven onderzoekers zich terecht geen zorgen te maken over de representativiteit van de steekproef is. Dit is het geval wanneer een bepaald menselijk gedrag zo gestoord of interessant is, dat het voor zou komen in elke steekproef. Dit is vaak het geval in studies omtrent oordeel- en besluitvorming. Als blijkt dat bijvoorbeeld 85% van de mensen een bepaald oordeel heeft, is dat van zichzelf al informatief, ongeacht of de steekproef representatief was.
Onderzoek met meerdere variabelen
Als onderzoekers een beschrijving hebben gemaakt van een variabele, zijn ze vaak ook geïnteresseerd in het begrijpen van de oorzaak. Hiervoor wordt vaak gebruik gemaakt van correlationele methoden. Dit houdt in het verzamelen van observaties en het testen van hypothesen met betrekking tot associaties tussen verschillende variabelen. Het gevaar van deze methoden is de kans op omgekeerde causaliteit en confounds.
Omgekeerde causaliteit
Dit is het geval wanneer variabele X invloed kan hebben op variabele Y, maar het omgekeerde net zo goed waar kan zijn. Om dit probleem tegen te gaan, gebruiken onderzoekers vaak longitudinale of prospectieve onderzoeksontwerpen, waarbij dezelfde mensen op verschillende tijdstippen bestudeerd worden. Dit is echter ook geen 100% garantie dat omgekeerde causaliteit uitgesloten is. Hiervoor is het vaak het beste om echte experimenten uit te voeren.
Confounds
Er zijn drie vormen van confounds: persoon, omgeving en operationele confounds.
Persoon confounds: Deze vorm komt voor wanneer mensen hoog of laag op een bepaalde variabele scoren ook hoog of laag scoren op een bepaalde individueel verschil variabele die samenhangt met de afhankelijke variabele. Deze vorm is een bedreiging voor de interne validiteit.
Omgeving confounds: Deze zijn equivalent aan procedurele confounds in experimenteel onderzoek en hetzelfde als persoon confounds, behalve dat ze niet verwijzen naar individuele verschillen, maar te maken hebben met de omgeving of situatie. Ook dit is een bedreiging voor de interne validiteit.
Operationele confounds: Deze komen voor wanneer een bepaald onderzoek dat een bepaald construct wil meten, tegelijk ook iets anders meet waar de onderzoeker zich niet van bewust is. Wanneer dit ‘iets anders’ iets is dat niks te maken heeft met de afhankelijke variabele en veel te maken heeft met wat de onderzoeker wenste te voorspellen, is er sprake van een operationele confound. Manieren om van een operationele confound af te komen zijn
De meting herzien om de confound eruit te halen
De confound apart meten om te kijken hoeveel invloed hij heeft
Redenen dat onderzoekers correlationeel onderzoek uitvoeren in plaats van experimenten doen zijn:
Sommige dingen kunnen vanwege ethische redenen of efficientie niet in het laboratorium onderzocht worden.
De goede externe validiteit van correlationele studies kan vaak de problemen met de interne validiteit compenseren.
Er zijn correlationele studies die relatief immuun zijn voor confounds en omgekeerde causaliteit.
Vormen van correlationeel onderzoek
Archief onderzoek: hierbij wordt gebruik gemaakt van bestaande publieke gegevens om een theorie of een hypothese te testen. Het wordt toegepast als een variabele moeilijk te manipuleren is, er ethiek in het spel is of als een onderzoek een hoge externe validiteit moet hebben. De hoge externe validiteit is meteen een van de grootste voordelen, maar een nadeel is dat er veel moeite moet worden gedaan om de interne validiteit zo hoog mogelijk te houden. Een ander nadeel kan zijn dat mensen die de publieke gegevens verzamelen, dit vaak niet doen met wetenschappelijk onderzoek in hun achterhoofd. Sommigen houden gegevens achter of vervormen ze, zodat ze vertekend raken.
Observatie onderzoek: onderzoekers registreren het gedrag van mensen in de eigen natuurlijk omgeving. Het verschil met archief onderzoek is dat de onderzoeker zelf de gegevens verzamelt. Zo heeft de onderzoeker controle over wat hij observeert en ook op welke manier hij dat doet.
De beste manier van observatie onderzoek is onopvallende observatie. Dit houdt in dat de onderzoekers niet interfereren in het natuurlijk gedrag van mensen en dat die mensen zich niet realiseren dat ze bestudeerd worden. Deze studies hebben een hoge externe validiteit, maar van de interne validiteit valt nog wat te zeggen.
Onderzoek met vragenlijsten en interviews
Hierin wordt de mensen, logischerwijze, gewoon gevraagd wat de onderzoekers willen weten over hun gedrag, gevoelens en gedachten. Interviews zijn mondelinge vraag en antwoord gesprekken, terwijl vragenlijsten zelfreportages zijn. Onderzoekers verwachten dat mensen die op een variabele hoog of laag scoren, op een andere variabele hoog of laag scoren. Deze variabelen zouden dan gerelateerd moeten zijn aan elkaar, waarbij wel het gevaar van confounds in de gaten moet worden gehouden, vooral persoon confounds.
Het belangrijkste waarover een onderzoeker moet beslissen is of hij open vragen stelt, waarin de deelnemer vrij is om te antwoorden wat hij maar wil, of gesloten vragen, waarin er een beperkt aantal opties is aangegeven. Dit is minder informatief, maar makkelijker te analyseren. Vaak wordt hierbij gebruik gemaakt van Likert schalen waarbij de deelnemers op een lineaire schaal aan moeten geven in hoeverre zij zich met een bepaalde vraag kunnen identificeren.
Casestudies
Dit zijn studies die een analyse van de ervaringen van één persoon of groep betreffen. Ze worden vooral gehouden wanneer er uitzonderlijk gedrag vertoond wordt dat niet snel in een laboratorium nagebootst kan worden, of bij veel mensen gevonden kan worden. De studies hebben als doel algemene psychologische principes aan het licht te brengen.
Phineas Cage
Dit is een van de bekendste casestudies in de geschiedenis van de psychologie. 150 jaar geleden kreeg Phineas Cage tijdens zijn werk een ijzeren staaf door zijn hoofd die een stuk van zijn hersenen meenam. Hij overleefde het ongeluk en er leek niks met hem aan de hand te zijn. Hij bleek echter niet meer de sociale en gedisciplineerde man te zijn die hij was, maar een sociale en emotionele ramp.
Deze gebeurtenis overtuigde de meeste wetenschappers ervan dat schade aan een specifiek hersendeel geassocieerd is met specifieke vormen van psychologische aandoeningen. Dit wordt nog steeds onderzocht en keer op keer bevestigd.
Peter Tripp
Dit was een disk jockey die besloten had honderd uur achter elkaar niet te slapen. Tot zo’n vijftig uur zonder slaap waren de symptomen herkenbaar, zoals erg slaperig zijn en niet zo goed meer kunnen denken. Na honderd uur begon Tripp echter last te krijgen van hallucinaties en na 170 uur kon hij het contact met de realiteit amper behouden. Wetenschappers hadden de neiging te concluderen dat extreme slaapdeprivatie niet te tolereren is, maar een ander persoon, Randy Gardner bleef wakker gedurende elf dagen en vertoonde nauwelijks zulke problemen als Peter Tripp. Blijkbaar zit dit onderwerp wat ingewikkelder in elkaar dan men dacht.
Stephen D.
Soms hebben mensen ongewone ervaringen die normale ervaringen in een ongewoon daglicht plaatsen. Stephen D. was een patiënt van neuroloog Oliver Sacks. Hij was verslaafd aan amfetaminen en op een nacht droomde hij dat hij een hond was. De volgende morgen toen hij wakker werd bleek dat hij echt kon ruiken als een hond. Dit beïnvloedde zijn leven op een uitzonderlijke manier. Gelukkig duurde het maar drie weken en waarschijnlijk was het te wijten aan de amfetaminen.
K.C.
Casestudies kunnen ook gebruikt worden om een bepaalde hypothese te toetsen. Klein et al. suggereerden dat autobiografisch geheugen en informatie over karaktertrekken apart in het geheugen gerepresenteerd zijn. Zij testten de hypothese en kwamen inderdaad tot de conclusie dat mensen die zich geen enkele gebeurtenis kunnen herinneren met betrekking tot de karaktereigenschap in kwestie, bijvoorbeeld introversie, toch in staat waren te kunnen vertellen hoe introvert ze zijn. Tulving was onder de indruk en deed een case studie hierover met K.C.
K.C. is iemand die op zijn dertigste door een ongeluk zijn autobiografisch geheugen kwijt was geraakt. Ondanks dat hij zich niets kon herinneren van wat hij allemaal had, kon hij toch precies vertellen wat voor persoon hij was. Zijn antwoorden op een vragenlijst over karaktereigenschappen met betrekking tot na het ongeluk kwamen in 73% overeen met de antwoorden van zijn moeder.
Sarah
Sarah werd psychisch, fysiek en seksueel misbruikt door haar vader en stiefvader en haar moeder deed niets om Sarah te beschermen. In eerste instantie leek het dan ook verkeerd te gaan met haar. Echter, uiteindelijk mat ze zich een normale en gezonde leefstijl aan. Met het zusje van Sarah liep het anders af; zij werd depressief en psychotisch. Dit toont aan dat het moeilijk is te onderzoeken hoe zoiets als zelfconcept zich kan ontwikkelen.
Wat maakt een casestudie wetenschappelijk?
Het verschil tussen een informele en een wetenschappelijke vorm van beschrijvingen van ervaringen van mensen is dat de wetenschappelijke vorm gericht is op het verklaren van het gebeurde in het licht van een bepaalde theorie of principes. Een casestudie is pas wetenschappelijk als het als doel heeft een theorie met betrekking tot menselijk gedrag te verfijnen. Volgens Popper is iets pas wetenschappelijk als een theorie openstaat voor falsificatie. Het zijn dan vaak ook de conclusies van een casestudie die tot discussie moeten kunnen leiden.
Nadelen van casestudies
Ze hebben over het algemeen een lage externe validiteit.
Ze lenen zichzelf niet altijd voor het opstellen van operationele definities of het maken van statistische analyses.
Een deel van het gebrek aan respect voor casestudies is te danken aan Sigmund Freud, die niet echt bekend staat vanwege zijn wetenschappelijke methoden.
Hoofdstuk 7 Experimenteel onderzoek
Experimenten worden over het algemeen in het laboratorium uitgevoerd, omdat het dan mogelijk is te opereren onder de ceterus paribus conditie; het manipuleren van slechts één aspect en het constant houden van al het andere. Experimenten hebben ook een hoge interne validiteit, wat noodzakelijk is om een causale relatie aan te tonen tussen een onafhankelijke en een afhankelijke variabele.
Geschiedenis van experimentele onderzoeksontwerpen
Om beschouwd te worden als experiment, moet een studie op zijn minst gebruik maken van een manipulatie. Als de manipulatie leidt tot verandering in de afhankelijke variabele, kan er vrijwel zeker worden gezegd dat dit door de onafhankelijke variabele veroorzaakt is. Vaak worden de grensvoorwaarden van een theorie aangepast al naar gelang de uitkomst van een experiment. Het is niet duidelijk, maar Galileo Galilei lijkt manipulatie uitgevonden te hebben.
In de natuurkunde of scheikunde is het makkelijk twee identieke condities te creëren, maar in de psychologie heeft men te maken met mensen, dus individuele verschillen. Vroeger probeerde men iedere persoon uit de controlegroep met iemand uit de experimentele groep op alle behalve de onafhankelijke variabele te matchen. Maar dit was moeilijk voor elkaar te krijgen en het werkte ook niet goed. Er kon altijd een andere variabele zijn die over het hoofd is gezien.
De oplossing is willekeurige selectie, maar dit wordt pas sinds enkele jaren toegepast in de psychologie. Hierbij heeft elke persoon een even grote kans om aan een van de experimentele condities toegewezen te worden. Hoewel deze methode niet perfect is, heeft het normaalgesproken als gevolg dat de mensen in de groep heel verschillend kunnen zijn, maar de groepen als geheel identiek zijn.
Om de imperfectie van willekeurige selectie op te vangen voeren onderzoekers statistische toetsen uit. Dit helpt te bepalen of de verschillen tussen de experimentele condities groter zijn dan alleen bij toeval verwacht zouden.
Onnatuurlijkheid en realisme
Een belangrijk punt van kritiek is dat experimenten niet reflecteren wat er in de wereld gebeurt. Ze zijn niet altijd even realistisch, want ze zijn onnatuurlijk en gebruiken vaak gemakssteekproeven. Er zijn dus grote problemen wat de externe validiteit betreft.
Er zijn twee oplossingen: mondain realisme en experimenteel realisme
Mondain realisme
Aronson en Carlsmith zeggen dat een manier om een laboratoriumexperiment realistischer te laten zijn, is door ze fysiek meer te laten lijken op de echte wereld. Het ziet er dus hetzelfde uit. De volgende manier achten zij echter beter.
Experimenteel realisme
Dit is de mate waarin een onderzoek psychologisch relevant is voor de participanten, dus het voelt hetzelfde als de echte wereld. Het wordt ook wel psychologisch realisme genoemd. Als de participanten zich zo zouden voelen als de onderzoeker wil, gedragen ze zich ook op een natuurlijke en spontane manier.
Drie voorbeelden van studies met een hoog experimenteel realisme
Het onderzoek naar conformiteit van Asch (1955 en 1956). Hij liet mensen naar zijn lab komen en hun oordelen over de lengtes van lijnstukken. De eerste vijf participanten gaven onjuiste antwoorden op makkelijke vragen. De zesde persoon (de proefpersoon) kwam in een dilemma terecht; confirmeren aan de groep of op het eigen oordeel vertrouwen. Het bleek dat 75% van de proefpersonen op minstens één van de vragen zich aan de groep confirmeerde.
De studie naar competitie en prestatie van Triplett (1898). Hij geloofde dat de aanwezigheid van een concurrent normaalgesproken iemands prestaties bevordert. De studie bleek een hoog experimenteel realisme te hebben omdat aangetoond werd dat niet iedereen beter ging presteren in de aanwezigheid van een concurrent. Dit blijkt ook echt zo te zijn in alledaagse situaties.
Studies met een hoge experimentele realiteit. Dit zijn studies met sociaal dilemma als onderwerp. Hierin wordt aangetoond dat mensen niet samenwerken, ondanks dat het hen dan meer op kan leveren.
Is er een recept voor experimenteel realisme?
Men moet er wel zeker van zijn dat de participanten zich ook echt voelen zoals onderzoeker wenst. De manier om dit voor elkaar te krijgen hangt samen met de construct validiteit, dit houdt in dat het onderzoek voortbrengt wat de onderzoeker bedoelde en dat deze ook heeft gedaan wat hij daarvoor zou moeten doen. Het is echter moeilijk te zeggen hoe men kan weten wanneer een onderzoek hoge experimentele realiteit heeft. Een methode is de manipulatie check. Dit is een meting om te kijken of de manipulatie bij de deelnemers ook echt de psychologische staat teweegbrengt die de onderzoeker wenst. Dit kan door de deelnemers of een groep mensen die niet deelneemt aan het onderzoek ernaar te vragen.
Bij een hoog niveau van experimenteel realisme hoort een zeker niveau van deceptie. Dit betekent dat de deelnemers niet altijd de ware reden van het onderzoek wordt verteld, omdat ze dan bevooroordeeld kunnen raken en zich niet meer natuurlijk gaan gedragen. Dit is ethisch gezien niet altijd verantwoord en het komt ook steeds minder vaak voor. Dit houdt wel in dat vaker mondain realisme wordt nagestreefd.
Sterke punten van experimenten
Minimalisatie van ruis
Het verschil tussen een confound en ruis is dat de invloed van ruis op de afhankelijke variabele onder elke conditie gelijk blijft. Ruis varieert niet op een systematische manier met de onafhankelijke variabele zoals een confound wel doet. Het zorgt echter wel voor zoveel verandering in de afhankelijke variabele dat niet gezegd kan worden dat dit veroorzaakt is door de onafhankelijke variabele.
Onderzoekers kunnen het onzichtbare observeren
Vooral experimenten in het laboratorium staan onderzoekers toe dingen te observeren die ze anders niet hadden kunnen observeren. Voorbeelden van technieken die dit mogelijk maken zijn MRI, impliciete geheugentesten en het meten van elektrische activiteit in bepaalde lichaamsdelen.
Eliminatie van confounds
Confounds zijn variabelen die systematisch met de onafhankelijke variabele veranderen en de afhankelijke variabele beïnvloeden zoals van de onafhankelijke variabelen verwacht zou worden. Er zijn drie soorten confounds.
Persoon confounds ontstaan wanneer individuele verschillen covariëren met een experimentele behandelingsconditie en dit gerelateerd is aan de afhankelijke variabele. Willekeurige selectie lost het probleem van individuele verschillen op, maar het geeft geen garantie dat er geen andere confounds meer zijn.
In een studie naar helpgedrag van mensen vonden Isen en Levin (1972) dat studenten die gratis koekjes hadden gekregen behulpzamer waren dan studenten die geen koekjes hadden gekregen. Hoewel deze studie niet waterdicht was lag dat niet aan individuele verschillen, want er was willekeurige selectie toegepast. In een recentere studie (1996) vonden Bargh et al. dat het activeren van associaties over oudere mensen veroorzaakte dat deelnemers zich meer gingen gedragen als oudere mensen. Ook dit lag niet aan individuele verschillen, want weer was willekeurige selectie toegepast.
Operationele confounds treden op als er een fout is gemaakt in de operationele definities van een construct. Ze vormen geen bedreiging voor de interne validiteit, maar wel voor de construct validiteit.
Het kan namelijk zijn dat hetgeen de onderzoeker aan wilde tonen niks te maken heeft met de resultaten van het onderzoek. Zo kon het toenemen van de behulpzaamheid in de studie van Isen en Levin (1972) ook te maken hebben met imitatiegedrag.
Procedurele confounds hebben te maken met de omgeving en beïnvloeden de interne validiteit. Ze worden zo genoemd, omdat een experiment niet gedaan wordt in een natuurlijke omgeving, maar een geplande procedure is. Een voorbeeld is dat de onderzoekers in twee experimentele condities verschillen in geslacht of etniciteit niet gecontroleerd heeft. De onderzoeker kan deze problemen voorkomen door er voor te zorgen dat alleen de onafhankelijke variabele tussen de experimentele condities verschilt.
Experimenten in het laboratorium lenen zich beter voor het minimaliseren van confounds dan veldexperimenten. In het lab kan meer controle uitgeoefend worden. Mensen worden in de echte wereld eerder blootgesteld aan dingen die ze leuk vinden. Dus de frequentie waarmee mensen blootgesteld worden aan dingen is gerelateerd aan hoe leuk ze die dingen vinden. In het lab kan de onderzoeker mensen ook vaker blootstellen aan dingen die ze niet leuk vinden.
Experimenten geven informatie over interacties
De vorige twee voordelen hadden te maken met het idee dat experimenten het mogelijk maken variabelen te isoleren. Maar een lab experiment geeft ook de mogelijkheid om variabelen te mixen met elkaar. Dit zou als resultaat kunnen hebben dat het effect van een onafhankelijke variabele op de afhankelijke variabele verandert bij andere niveaus van een andere onafhankelijke variabele. Op deze manier kan de onderzoeker erachter komen of de invloed van de som van de individuele variabelen invloed anders is dan wanneer de onafhankelijke variabelen gecombineerd zijn.
Interacties zijn belangrijk, want ze geven de grensvoorwaarden van een theorie aan. Kwalificatie is het onderzoeken van de grenswaarden waartussen een theorie zowel waar als niet waar is en dit heeft te maken met het analyseren van interacties.
Interne en externe validiteit
De overgang tussen interne en externe validiteit is niet scherp. Er zijn veel niet-experimentele studies met een hoge interne validiteit en ook veel.laboratoriumstudies die een hoge externe validiteit hebben Als een niet-experimenteel en een experimenteel onderzoek elkaar tegenspreken, wordt vaak het voordeel van de twijfel gegeven aan de laboratoriumstudie, omdat deze wel een hoge interne validiteit zou hebben. De volgende voorbeelden spreken dit echter tegen.
Voorbeelden van natuurlijke observatie studies met een hoge interne validiteit
Het ‘sadder but wiser’ effect van Alloy en Abrahamson in 1979. In een laboratoriumstudie werd gevonden dat depressieve mensen de wereld realistischer zagen dan niet-depressieve mensen. Deze conclusie klopte niet helemaal. Dunning en Story toonden in 1991 in een niet-experimentele studie aan dat depressieve mensen helemaal niet nauwkeuriger waren in hun voorspellingen en zelfs te optimistisch waren in vergelijking met niet-depressieve mensen. Hiermee wilden zij maar aantonen dat een laboratoriumstudie niet altijd een hoge interne validiteit heeft.
Het aantonen van het verband tussen agressie en temperatuur. In het lab werd gevonden dat mensen alleen agressiever werden bij een hogere temperatuur als daarvoor positieve evaluaties werden gegeven van de persoon waartegen ze agressief zouden kunnen worden. In een veldexperiment is echter aangetoond dat er een lineair verband bestaat tussen temperatuur en agressiviteit. Er kan vrijwel zeker gezegd worden dat er een causaal verband bestaat, want het kan niet zo zijn dat de temperatuur de agressiviteit veroorzaakt. Bovendien weten de mensen in een lab dat ze worden bestudeerd en kunnen ze zich daardoor anders gaan gedragen. Het is ook relatief gemakkelijk om een simpel objectief meetbaar begrip als temperatuur te scheiden van confounds.
Toch zijn er genoeg voordelen van experimentele studies op correlationele of passieve observatiestudies.
Enige uitzondering daargelaten, zijn experimentele studies over het algemeen het meest geschikt om informatie over causaliteit te geven.
Laboratoriumexperimenten kunnen belangrijke verklaringen geven voor psychologische mechanismen die het resultaten zijn van een veldonderzoek.
Een veldstudie geeft geen garantie voor enige vorm van validiteit.
Hoofdstuk 8 Quasi-experimenteel onderzoek
Waarom quasi-experimenten
In een quasi-experiment hebben onderzoekers maar gedeeltelijk controle over de onafhankelijke variabelen. Dit betekent in principe dat deelnemers op een andere manier dan willekeurig aan de experimentele condities worden toegewezen. Zo kan het zijn dat de interne validiteit van quasi-experimenten in het geding komt, waardoor persoon confounds een rol kunnen gaan spelen terwijl dit anders niet het geval was geweest.
Redenen dat vaak toch gekozen wordt voor een quasi-experiment zijn:
Het is niet altijd mogelijk om willekeurige selectie toe te passen, zoals bij geslacht. En als het wel mogelijk is, is het om ethische redenen vaak niet gepast.
Soms is de uitvoering van een waar experiment te duur.
Onderzoekers willen de interne en de externe validiteit maximaliseren.
Omdat quasi-experimenten vaker mogelijk zijn dan ware experimenten wil dat nog niet zeggen dat ze de perfecte vorm van onderzoek zijn. Dit is absoluut niet waar; het zijn meer hybride ontwerpen die wenselijke kenmerken van verschillende methoden combineren.
Vormen van quasi-experimenten
Natuurlijke experimenten
Hierbij worden alle variabelen van interesse gemeten en vindt er geen willekeurige selectie plaats, zodat de onderzoeker geen controle kan uitoefenen over het experiment. Er vindt een natuurlijke manipulatie plaats zoals bij een natuurramp waarin sommige mensen wel getroffen worden en hun buren niet. Deze natuurlijke selectie is echter niet altijd helemaal willekeurig, want sommige gebieden worden bijvoorbeeld eerder getroffen door natuurrampen dan andere.
Ook de vraag of het omdoen van de autogordel veiligheid in het verkeer bevordert, kan met een natuurlijk experiment onderzocht worden. Een land waar deze regel wel geldt, kan vergeleken worden met een land waar het niet geldt. Hier kan echter een derde variabele in het spel zijn, zoals het verschil in maximumsnelheid..
Er zijn twee manieren om controle te verkrijgen over een onafhankelijke variabele:
De onderzoeker doet net alsof de derde variabele een experimentele manipulatie is. Het is echter erg veel werk om al de derde variabelen zo te behandelen.
De onderzoeker meet elke confound die bestaat tussen de mensen die in de twee condities zitten. Zo kan er statistische controle over verkregen worden.
Het onderscheid tussen natuurlijke experimenten en niet-experimentele correlationele onderzoeken is niet altijd duidelijk. Alleen zolang de niveaus van een natuurlijk voorkomende variabele willekeurig bepaald zijn, kan een natuurlijk experiment als een quasi-experiment beschouwd worden. Het moeilijke is om te bepalen hoe willekeurig de natuurlijke manipulaties moeten zijn. Het wordt nog gecompliceerder wanneer groepen die in het begin niet equivalent zijn statistisch equivalent gemaakt worden.
Soms kunnen archiefstudies als natuurlijke experimenten worden beschouwd. Bij een archiefstudie wordt gebruik gemaakt van bestaande publieke gegevens om een hypothese te testen. Een voorbeeld is een studie van Baumeister en Steinhilber in 1981. Zij beweerden dat teams na een aantal thuiswedstrijden slechter gaan presteren vanwege de druk van het publiek. Met behulp van archiefgegevens telden zij het aantal gewonnen thuiswedstrijden van ploegen in de Amerikaanse baseball World Series in het begin en aan het eind van de series. Of een ploeg het seizoen thuis speelt wordt in deze competitie op een natuurlijke willekeurige manier bepaald, dus kan het experiment betiteld worden als natuurlijk. De hypothese werd bevestigd.
Persoon-per-behandeling
Hierin wordt tenminste één onafhankelijke variabele gemeten en ten minste één andere onafhankelijke variabele gemanipuleerd. Deze onderzoeken worden vaak gedaan in het laboratorium en ook wordt er willekeurige selectie toegepast. Het enige minder goede is dat er ook een variabele gemeten wordt. Onderzoekers die deze methode toepassen verwachten dat verschillende personen verschillend reageren op verschillende behandelingen (vandaar de naam).
Onderzoekers meten de deelnemers van tevoren op een individueel verschil variabele. Daarna worden diegenen aan de hoge en aan de lage kant van de score ingedeeld in extreme groepen. Zo lijken de mensen in dezelfde groep wat betreft de gemeten variabele op elkaar en verschillen ze van de andere groep. Een manier om dit te doen is de mediaan split, maar deze heeft als nadeel dat de personen die rond de 50% zitten erg op elkaar lijken, terwijl ze in verschillende groepen zitten.
Het probleem van het gebruik van extreme groepen is dat er nooit geleerd wordt over het gedrag van mensen die zich in het midden van de verdeling bevinden. Een voordeel is dat er met extreme groepen een grotere testgevoeligheid bestaat, want als er al effecten zijn dan kunnen ze het best gevonden worden met extreme groepen. Hierdoor kan er ook met een kleinere groep deelnemers worden gewerkt.
Twee voorbeelden van een persoon-per-behandeling studie:
De studie van Swann et al. uit 1988. Zij stelden dat attitudes van zelfverzekerde mensen te veranderen zijn. Dit wilden ze aantonen met vrouwelijke studenten die traditionele denkbeelden met betrekking tot rolverdeling hadden. Sommigen waren zich van deze houding bewust en anderen niet.
De individuele verschil variabele was zelfverzekerdheid en deze werd gemeten in een voortest. Daarna werden de vrouwen willekeurig aan een van de experimentele condities toegewezen. De ene groep moest reageren op liberale beweringen. De andere op conservatieve beweringen. De effecten hingen af van de mate van zelfverzekerdheid. Zelfverzekerde vrouwen in de liberale conditie veranderden hun attitude niet, terwijl ze in de conservatieve conditie liberaler werden. Voor niet-zelfverzekerde vrouwen was het precies andersom.
De studie van Swann et al. uit 1989 over de zelfbekrachtigingstheorie. De theorie voorspelt dat mensen zich het liefst associëren met mensen die hen zien zoals ze zichzelf zien. Er werd inderdaad gevonden dat personen die zichzelf atletisch vonden het liefst omgingen met mensen die positieve feedback hierover gaven. Maar de onderzoekers konden er niet zeker van zijn dat een persoon confound in het spel was geweest, aangezien ze geen controlegroep hadden. Ook moest er rekening gehouden worden met operationele confounds, want het kan altijd zijn dat de meting van zelfverzekerdheid een andere variabele zoals leeftijd meet.
Natuurlijke groepen met experimentele behandeling
Dit is ruwweg het tegenovergestelde van een persoon-per-behandeling studie. Er is sprake van groepen die al op een natuurlijke wijze gevormd zijn maar niet uit elkaar te halen zijn. De twee groepen zijn eerder gelijk aan elkaar dan dat ze van elkaar verschillen. In plaats van beide groepen aan alle niveaus van een experimentele conditie bloot te stellen, wordt elke groep bovendien maar aan één conditie blootgesteld. Een voorbeeld is dat in een bedrijf één groep werknemers wel een andere ziektekostenverzekering krijgt en een andere gelijke groep niet. Er kan dan bestudeerd worden wat het effect is op het gebruik van een bepaald medicijn.
Natuur per behandeling quasi-experiment
Dit onderzoeksontwerp komt zelden voor en wordt gebruikt wanneer een bepaalde natuurlijke manipulatie van tevoren te voorspellen is en gecontroleerd kan worden. Een voorbeeld is aan mensen die wel of niet voor een crematorium staan (natuurlijke manipulatie) te vragen wat ze vinden van een persoon de wel of niet de Amerikaanse manier van leven bekritiseert (experimentele manipulatie). Mensen blijken grotere kritiek te hebben op mensen die geen voorstander zijn als ze wel voor een crematorium stonden.
Vergelijkbaarheid en Patched-up ontwerpen
De grootste beperking van quasi-experimentele studies is de rol van vergelijkbaarheid. In een quasi-experiment is het vaak moeilijk een controlegroep te vinden die op alle gebieden behalve de onafhankelijke variabele hetzelfde is als de experimentele groep. Willekeurige evenementen komen voor, maar het is vaak moeilijk te bepalen welk soort controlegroep gebruikt moet worden. In dit soort experimenten geldt de ceterus paribus conditie dus niet, want al het andere buiten de variabelen van interesse is niet gelijk.
Deze beperking is een belangrijke reden voor de ontwikkeling van het patched-up ontwerp. Hierbij voegen onderzoekers telkens nieuwe controlegroepen aan het quasi-experimenteel ontwerp toe om het effect van het experiment te meten en/of om de invloed van confounds te testen.
Voorbeeld 1
De hypothese is dat studiegidsen ervoor zorgen dat studenten betere cijfers halen op hun examen doordat ze effectiever kunnen studeren. Toevoegingen (patches) zijn:
Eén-groep ontwerp: (Pseudo-experiment) Alle participanten zitten in één groep die de quasi-experimentele behandeling, in dit geval de studiegids, ontvangt. Er is geen controle groep, maar die is wel nodig om een vergelijking te maken.
Eén-groep voortest-natest ontwerp: In dit geval wordt de studiegids pas geïntroduceerd nadat er een examen is afgelegd en worden de cijfers van voor en na de introductie vergeleken. Dit is wel al een verbetering, maar er kunnen nog steeds alternatieve verklaringen zijn.
Natest met niet-equivalente groepen ontwerp: De cijfers van de klas met de studiegids wordt vergeleken met een vergelijkbare klas zonder studiegids (bijvoorbeeld de klas die de leraar vorig jaar had). Maar het kan echter ook zo zijn dat deze klas op een ander tijdstip les kreeg dan die van dit jaar.
Voortest-natest met niet-equivalente groepen ontwerp: om dit probleem op te lossen kan de onderzoeker nagaan of de twee klassen hetzelfde waren aan het begin van de cursus (matchen), om dan na het eerste tentamen aan de huidige klas de studiegids aan te bieden en de cijfers op beide tentamens te vergelijken. Op het eerste tentamen zouden de twee klassen gelijke cijfers moeten halen en op het tweede tentamen zou de klas met de studiegids hogere cijfers moeten halen. Het kan echter zijn dat meer bewijs nodig is van het feit dat de twee klassen aan het begin van de cursus aan elkaar gelijk waren.
Tijd-series ontwerp: onderzoekers kijken naar gegevens op langere termijn om equivalentie aan te tonen. In dit geval kan er gekeken worden naar wekelijkse overhoringen die voor de invoering van de studiegids gegeven zijn. Hoewel er nu al met veel confounds rekening gehouden is, kan het toch zijn dat de studiegids om andere redenen dan de onderzoeker denkt tot betere cijfers heeft geleid.
Interne analyse: wordt toegepast als onderzoekers het precieze mechanisme achter een resultaat willen vaststellen. Groepen worden onderverdeeld in subgroepen om ze te testen op verschillen die consistent zijn met de theorie van interesse of met concurrerende theorieën. In dit geval is een alternatieve verklaring dat studiegidsen gelden als een soort booster en niet als een hulpmiddel om effectiever te studeren. In het eerste geval wordt de studiegids niet gebruikt, in het tweede geval wel. Hier moet dus het verschil zitten en de huidige klas wordt onderverdeeld op het wel of niet echt gebruiken van de gids.
Voorbeeld 2
De hypothese is dat mensen belangrijke levensbeslissingen nemen op basis van het naamletter effect. Dit verwijst naar de bevinding dat mensen eerder de voorkeur geven aan letters die in hun eigen naam voorkomen dan aan letters die niet in hun naam voorkomen. Belangrijke levensbeslissingen van mensen zouden deze voorkeuren ook moeten reflecteren. Er werd onderzocht of er meer mensen in een bepaalde stad wonen waarvan de naam lijkt op hun eigen naam (bijv. Philip in Philadelphia) dan mensen met een andere naam. Dit leek te kloppen, maar er kon natuurlijk ook sprake zijn van andere verklaringen. Dus werden er controlegroepen toegevoegd met betrekking tot onder andere leeftijd, etniciteit, geboortedatum en verhuizingen. Ook werd er een studie gedaan om te kijken of er ook zulke voorkeuren gelden voor beroepen waarvan de naam op iemands eigen naam lijkt. De hypothese werd steeds bevestigd.
Het is nu helaas nog steeds niet zo dat de hypothesen met zekerheid bevestigd kunnen worden, maar het zal duidelijk zijn dat als een hypothese meer toevoegingen overleeft, een onderzoeker steeds zekerder van de bevestiging kan zijn. Het is echter niet altijd mogelijk alle toevoegingen uit te voeren die gewenst zijn.
Experimenten of quasi-experiment?
Ondanks dat onderzoekers in een quasi-experiment zorgvuldig alle mogelijke confounds nagaan, komt het toch nog regelmatig voor dat confounds de reden zijn voor een verkeerde interpretatie van de resultaten. Er is dus nogal eens wat mis met de interne validiteit. Maar als dat niet zo is, hebben quasi-experimenten het voordeel over het algemeen een betere externe validiteit te hebben dan ware experimenten. Dit komt omdat ze zich concentreren op reële situaties. Daarbij kunnen ze sommige hypothesen testen die niet in het lab getest kunnen worden. Maar in principe verschillen quasi-experimenten en echte experimenten niet zoveel van elkaar in de dingen die ze willen aantonen. Meestal wordt een quasi-experiment uitgevoerd om te kijken of de bevindingen van een echt experiment te generaliseren zijn.
Hoofdstuk 9 Onderzoeksontwerpen
Factorontwerpen
Dit zijn onderzoeksontwerpen met meerdere onafhankelijke variabelen die compleet gekruist zijn. Dit betekent dat elk niveau van elke onafhankelijke variabele gecombineerd wordt met elk niveau van elke andere onafhankelijke variabele.
Kenmerken
Het label dat een onderzoeker geeft aan een factorontwerp specificeert het aantal onafhankelijke variabelen en het aantal niveaus per onafhankelijke variabele. Dus een 2 x 3 ontwerp heeft twee onafhankelijke variabelen (want er zijn twee getallen) waarvan de eerste twee niveaus en de tweede drie niveaus heeft. Een 2 x 3 x 2 ontwerp heeft dus drie onafhankelijke variabelen met twee, drie en twee niveaus. Simpele labels worden het meest gebruikt.
Het aantal onafhankelijke variabelen geeft ook aan welke statistische analyse toegepast moet worden om de data te analyseren. Bij twee onafhankelijke variabelen moet een 2-wegs variantieanalyse (anova) worden toegepast, bij drie een 3-wegs anova, enzovoorts.
Het aantal cellen, dus unieke combinaties, kan verkregen worden door de getallen met elkaar te vermenigvuldigen, dus 2 x 3 x 2 = 12 cellen.
Redenen voor de voorkeur van simpele labels
Bij een groot aantal cellen wordt het onderzoek veel te groot.
Onderzoekers proberen vaak aan te tonen dat een theorie alleen waar is onder bepaalde condities (kwalificatie). De manier hiervoor is een interactie aan te tonen, dus dat het effect van een onafhankelijke op een afhankelijke variabele afhangt van een tweede onafhankelijke variabele.
Veel onderzoek wordt gedaan om voorspellingen van maar een of twee theorieën tegelijk te toetsen. De meeste theorieën bestaan uit een of twee kernprincipes en daarom bestaan de voorspellingen vaak uit maar een of twee variabelen.
Veel theorieën bestaan uit de ‘als A dan B voorwaarde’ en dit is vaak terug te brengen op één onafhankelijke variabele en dus één manipulatie. Er is dan nog maar één andere manipulatie nodig om de eerste te kwalificeren.
Voordelen van factorstudies
Volgens Fisher zijn er een aantal voordelen die factorstudies hebben in vergelijking met studies met één onafhankelijke variabele (zie hieronder).
Efficiëntie, want er kan naar het effect van meerdere onafhankelijke variabelen tegelijk worden gekeken.
Veelomvattender, want ze bieden de mogelijkheid een interactie aan te tonen.
Generaliseerbaarheid van het hoofdeffect bij meerdere niveaus van de onafhankelijke variabele, dus betere externe validiteit.
Hoofdeffecten en interacties
Hoofdeffecten
Dit zijn de effecten van de onafhankelijke variabelen in factorstudies. Ze verwijzen naar het overall effect van een onafhankelijke variabele, gemiddeld genomen over alle niveaus van de andere onafhankelijke varabele(n). Er wordt gekeken naar één variabele tegelijk. Dus bij een studie naar de effecten van geslacht en frustratie op agressie kan het hoofdeffect van geslacht zijn dat (als de manipulatie van frustratie buiten beschouwing gelaten wordt) mannen agressiever gedrag vertonen dan vrouwen. Het hoofdeffect van frustratie kan zijn dat, gemiddeld genomen over mannen en vrouwen, hogere frustratie vaker lijdt tot agressie.
Een voorbeeld is de 2 x 2 studie van Greenwald et al. uit 1991 om de effecten van geheugenverwachtingen te testen. Deelnemers kregen een bandje met subliminale inhoud met betrekking tot het verbeteren van geheugen of verbeteren van zelfrespect (eerste manipulatie). De labels van sommige bandjes waren omgewisseld, zodat ze niet de juiste inhoud weergaven (tweede manipulatie). Slechts de labelwisseling (verwachtingen) toonde een hoofdeffect, wat inhield dat de inhoud geen effect had op de verwachting van geheugenverbetering.
Er zitten twee voordelen aan het gebruik van een 2 x 2 ontwerp in deze studie
Met dezelfde steekproef konden twee hypothesen getoetst worden.
Er werd aangetoond dat er een verwachtingseffect was ongeacht of de deelnemers in een situatie waren die deze effecten gerechtvaardigd hadden.
Interacties
Interacties kunnen alleen aangetoond worden met factorstudies. Er is sprake van interactie als het effect van een onafhankelijke variabele op een afhankelijke variabele afhangt van het niveau van een tweede onafhankelijke variabele. Een interactie gaat altijd over twee variabelen. Dit betekent dat in het geval van tweewegs interacties het in principe mogelijk is naar dezelfde interactie te kijken vanuit twee gezichtspunten.
Er zijn twee vormen van tweewegs interacties:
Ordinale / gespreide interactie: als er een effect is bij één niveau van de tweede onafhankelijke variabele en dit effect zwak of nihil is bij een ander niveau.
Disordinaal / overgekruiste interactie: als er geen hoofdeffecten zijn en de effecten van elke onafhankelijke variabele tegenovergesteld zijn op verschillende niveaus van de tweede onafhankelijke variabele.
Dus het kan lijken alsof een studie een overgekruiste interactie heeft aangetoond, maar als er dan ook hoofdeffecten zijn, is het toch een gespreide interactie.
De resultaten van een factorstudie kunnen grafisch worden weergegeven in een staafdiagram. Dit kan echter misleidend zijn, aangezien het soms lijkt alsof er een overgekruiste interactie is, terwijl die er niet is. Een overgekruiste interactie is wel goed te zien in een lijndiagram. Als de resultaten van een factorstudie weergegeven worden in een lijndiagram, kan een interactie herkend worden aan niet-parallelle lijnen. Bij een overgekruiste interactie kruisen de lijnen elkaar in de buurt van het midden van de grafiek. Omdat de grafische weergave soms misleidend kan zijn, voeren onderzoekers vaak statistische toetsen uit. Ze gebruiken dan vooral de simpele hoofdeffecten test om te zien welke specifieke vergelijkingen van gemiddelden significant zijn in hun factorstudie. Vaak zijn dit gewone t-toetsen.
Een voorbeeld van interactie is de studie naar causale attributie van Gilbert et al. uit 1988. Er werd met behulp van een 2 x 2 factorontwerp bekeken wanneer mensen bij het beoordelen van de persoonlijkheden van anderen de sociale context in ogenschouw nemen. Deelnemers moesten een vrouw beoordelen die zich angstig gedroeg. De eerste onafhankelijke variabele was het onderwerp waarover de vrouw praatte (leuk of angstuitlokkend onderwerp). De tweede onafhankelijke variabele was het niveau van cognitieve lading; één groep moest naast het beoordelen van de persoonlijkheid ook nog een geheugentaak uitvoeren. De onafhankelijke variabelen werden volledig gekruist. Het resultaat was dat de groep met een lage cognitieve lading wel de situatie in ogenschouw nam in het beoordelen van de persoonlijkheid van de vrouw, terwijl de groep met de geheugentaak dat niet deed. Dus de interactie is dat het effect van het onderwerp waar de vrouw over praatte op de beoordelingen van de deelnemers afhing van het niveau van cognitieve lading.
Het verschil tussen hoofdeffecten en interacties
Interacties zijn niet hetzelfde als hoofdeffecten. Bij hoofdeffecten wordt er maar naar één onafhankelijke variabele tegelijk gekeken. Het effect van deze variabele hangt niet af van de andere onafhankelijke variabele. Een voorbeeld is een studie naar de invloed van de hoeveelheid zonlicht en water op de groei van een plant. De twee onafhankelijke variabelen worden weer gekruist. De studie had drie resultaten:
Geen hoofdeffect voor water. De hoeveelheid zonlicht buiten beschouwing latend, groeiden de plantjes even hard bij weinig of veel water.
Een hoofdeffect voor zonlicht. De hoeveelheid water buiten beschouwing latend, groeiden de plantjes bij veel zonlicht twee keer zo hard als bij weinig zonlicht.
Een interactie van zonlicht en water, want het effect van water op de groei van de plantjes bleek sterk af te hangen van de hoeveelheid zonlicht. Plantjes met weinig zon groeiden beter met weinig water dan met veel water en plantjes met veel zon groeiden beter met veel water dan met weinig water.
Als deze interactie niet in ogenschouw was genomen zou de conclusie zijn dat water geen rol speelt in de groei van plantjes, want er was immers geen hoofdeffect! Bovendien was het begrip van de rol van zonlicht ook niet volledig, want bij het hoofdeffect wordt alleen naar de gemiddelde groei gekeken.
Ontwerpen met één onafhankelijke variabele (one-way)
Twee-groepen ontwerp
Dit is de meest simpele vorm. Er is één onafhankelijke variabele die slechts twee niveaus heeft. Meestal wordt er een experimentele groep vergeleken met een controlegroep, of er worden zogenaamde extreme groepen vergeleken.
Multiple-groepen ontwerp
Hier is er ook sprake van één onafhankelijke variabelen, maar deze kan meer dan twee niveaus aannemen. Deze onderzoeken kosten meer middelen en tijd, maar een onderzoeker kan wel informatie verkrijgen die met een twee-groepen ontwerp achterwege was gebleven. Dit kan door bijvoorbeeld niet alleen de extreme groepen te vergelijken, maar ook de middenmoot bij het onderzoek te betrekken, of door meerdere doseringen van een medicijn te vergelijken met een placebo.
Een voordeel van deze ontwerpen is dat ze simpel zijn en veel werk verzet hebben voor de psychologie. Een nadeel is dat er maar naar één onafhankelijke variabele gekeken wordt. Veel menselijk gedrag is namelijk het resultaat van meerdere variabelen die elkaar beïnvloeden.
Within-subject en Between-subject ontwerpen
Naast de twee soorten van experimentele ontwerpen die hierboven besproken worden, zijn er ook twee benaderingen van hoe je een experiment kunt uitvoeren. In een between-subject ontwerp wordt elke deelnemer maar aan één experimentele conditie blootgesteld en worden de twee condities vergeleken. In een within-subject of herhaalde meting ontwerp wordt elke deelnemer op verschillende tijdstippen aan meerdere, soms alle condities blootgesteld en met zichzelf vergeleken.
Nadelen van within-subjects ontwerpen
Transparantie: Het kan zijn dat de deelnemers achter de onderzoekshypothese kunnen komen en zich daar naar gaan gedragen (zie hoofdstuk 4).
Gevolg (sequence) effecten komen voor wanneer de antwoorden van de deelnemers beïnvloed worden door het verstrijken van de tijd.
Mensen kunnen verveeld of moe raken naarmate het onderzoek langer duurt. Het geven van pauzes en het ontwerpen van kortere taken lost dit probleem niet helemaal op.
Overdrachtseffecten komen voor wanneer de antwoorden bij een taak de antwoorden bij een andere taak beïnvloeden. Er zijn drie vormen:
Interferentie effecten komen voor wanneer het doen van een eerste test de tweede test moeilijker maakt. Het is het tegenovergestelde van oefeneffecten.
Oefeneffecten komen voor wanneer deelnemers bewust of onbewust iets leren van eerdere taken, waardoor de tweede taak makkelijker wordt. Oefeneffecten zijn gerelateerd aan testeffecten, het verschil is dat oefeneffecten ook voorkomen als de tweede taak niet hetzelfde is als de eerste. Bij testeffecten zijn de eerste en tweede test hetzelfde.
Volgorde (order) effecten komen voor wanneer een vraag een andere betekenis krijgt als deze volgt op verschillende initiële vragen. Studenten werd gevraagd naar hun tevredenheid over het leven. Deze vraag werd anders beantwoord wanneer eerst gevraagd werd naar hun dating frequentie. Bij meer afspraakjes waren ze positiever dan bij minder afspraakjes. Wanneer deze vragen in omgekeerde volgorde werden gesteld, had het antwoord van de eerste vraag geen effect op het antwoord op de tweede vraag.
Oplossingen
Between-subject ontwerp: Dit is vaak een beter ontwerp om te gebruiken als bovenstaande nadelen een te groot probleem worden. Wanneer het niet mogelijk is een bepaalde conditie te veranderen nadat hij gecreëerd is, zijn within-subject ontwerpen ook niet mogelijk. Het is bijvoorbeeld moeilijk iemand eerst heel treurig en dan enkele seconden later heel vrolijk te maken.
Structurele debriefing: Als een between-subject analyse op de eerste twee condities van een within-subject ontwerp niet kan uitsluiten of een deelnemer iets van de onderzoekshypothese wist (als de resultaten van de twee ontwerpen te weinig op elkaar lijken), wordt er een structurele debriefing gehouden. Dit is een interview dat na het onderzoek wordt afgenomen om te bepalen wat de deelnemers dachten dat de onderzoeker te weten wilde komen. Zo kan er gecontroleerd worden voor het probleem van transparantie.
Counterbalancing: Dit is een manier om gevolg en overdrachtseffecten te controleren. Het zorgt er dus niet (altijd) voor dat deze effecten uitgewist worden! De onderzoeker varieert de volgorde waarin de deelnemers aan de verschillende condities worden blootgesteld. Er zijn verschillende mogelijkheden:
Complete counterbalancing: hierbij worden alle mogelijke volgordes gebruikt en willekeurig aan deelnemers toegewezen. Dit werkt het beste bij twee of drie condities. Het totaal aantal volgordes is te berekenen door de faculteit te berekenen van het aantal condities. Bij twee condities is dat 2! Dus 2 volgordes, die worden aangegeven met de letters die aan de condities gegeven zijn, in dit geval bijvoorbeeld AB en BA.
Omgekeerde counterbalancing: dit is een vorm van incomplete counterbalancing die wordt toegepast als complete counterbalancing onpraktisch gaat worden. Er wordt een bepaalde volgorde gemaakt die dan ook in omgekeerde volgorde gebruikt wordt. Dit levert twee verschillende volgordes op en garandeert dat de gemiddelde seriepositie hetzelfde blijft voor alle condities. Bij vijf condities is dit de derde positie. Echter, de frequentie van hoe vaak de condities op de eerste of laatste plek komen is niet hetzelfde voor alle condities.
Gedeeltelijke counterbalancing: dit is een tweede vorm van incomplete counterbalancering en de meeste vormen lossen het probleem van omgekeerde counterbalancing op. De vorm die het meeste voorkomt houdt in dat er willekeurig een aantal volgordes gekozen wordt uit het totaal van mogelijke volgordes. Het kan echter zijn dat bepaalde condities toch vaker in bepaalde gedeeltes van de studie voorkomen. Een andere methode is daarom het Latijns vierkant waarmee een vast aantal volgordes te genereren is en er gecontroleerd kan worden voor volgorde. Het is een matrix waarin een conditie één keer per rij en één keer per kolom voorkomt.
Gemixt Model ontwerpen: dit zijn ontwerpen waarbij tenminste één onafhankelijke variabele wordt gemanipuleerd op een between-subject basis en tenminste één andere onafhankelijke op een within-subject basis. Zo worden de voordelen van beide ontwerpen gecombineerd.
Voordelen van within-subject ten opzichte van between-subject ontwerpen
Er zijn minder deelnemers nodig. dit is zeker handig in het geval van een factorstudie met veel condities. Bij een between-subject ontwerp is er voor elke conditie een andere groep deelnemers nodig, terwijl bij een within-subject ontwerp dezelfde deelnemers voor elke conditie kunnen worden gebruikt. Bovendien zijn er sowieso minder deelnemers nodig, omdat er niet gecompenseerd hoeft te worden voor individuele verschillen.
Eliminatie van persoon confounds, omdat dezelfde personen aan alle condities blootgesteld worden.
Within-subject studies zijn krachtiger dan between-subject studies.
De reden dat er bij een within-subject ontwerp niet met één of twee proefpersonen volstaan kan worden, is dat de externe validiteit in gevaar zou kunnen komen. Dus de onderzoeker wil weten of de resultaten te generaliseren zijn naar andere personen. Bovendien is een steekproef met één persoon statistisch niet significant.
Begrippenlijst
Hoofdstuk 1
Barnum beschrijving | Beschrijving van de persoonlijkheid van mensen die zo algemeen zijn dat ze op iedereen van toepassing kunnen zijn. Is niet wetenschappelijk. |
Spaarzaamheid (parsimony) | Als men moet kiezen tussen twee concurrerende gelijkwaardige theorieën over een bepaald fenomeen, dan zou men de voorkeur moeten geven aan de meest simpele, oftewel spaarzame theorie. |
Empirisme | Maken van systematische observaties om erachter komen hoe de wereld in elkaar zit. |
Testbaarheid | Wetenschappelijke theorieën moeten testbaar zijn. |
Falsificeerbaarheid | De mogelijkheid om aan te kunnen tonen dat een theorie niet klopt. |
Logisch-positivist | Deze stroming houdt voor dat wetenschap en filosofie alleen gebaseerd kunnen worden op dingen die alleen met absolute zekerheid te observeren zijn. |
Operationele definities | Verbinden niet observeerbare fenomenen aan dingen die wel te observeren zijn, zoals honger in termen van uren dat er geen voedsel is ingenomen. |
Determinisme | Het idee dat alle dingen die gebeuren betekenisvolle, systematische oorzaken hebben. |
Illusionaire correlaties | Men denkt dat er een relatie is tussen twee elementen, terwijl deze er niet is |
Theorie | Een bewering over een causaal verband tussen twee of meer variabelen. |
Metafysische verklaringen | Boven natuurlijk. Krachten worden toegeschreven aan niet lichamelijke krachten, zoals geesten en goden |
Mythologie en religie | Goden spelen een belangrijke rol in menselijk gedrag |
Astrologie | Gaat ervan uit dat menselijk gedrag wordt bepaald door de activiteit van hemellichamen |
Animisme | Het geloof dat natuurlijke fenomenen levend zijn en menselijk gedrag beïnvloeden. |
Fysiologie | De studie van de onderlinge relaties en functies van verschillende delen van het lichaam en de hersenen |
Filosofie | De studie van gedrag, de aard van realiteit en kennis door gebruik te maken van intuïtie, empirische observaties en logica. |
Hoofdstuk 2
Inductie | Het redeneren van specifieke situaties naar algemene principes |
Probleem van inductie | Het is nooit zeker hoeveel observaties er gemaakt moeten worden om zeker te zijn dat een theorie of wet waar is. |
Deductie | Redeneren van een algemeen principe naar een specifieke situatie |
Hypothese | Een voorspelling over specifieke gebeurtenissen die afgeleid is van één of meerdere theorieën. |
Wet | Een universele bewering van de aard van dingen die het mogelijk maakt om betrouwbare voorspellingen te doen over de toekomst. |
Theorie | Een algemene bewering over de relatie tussen twee of meer variabelen. |
Validatie | Bewijs verzamelen dat een theorie of hypothese ondersteunt. Controleren op juistheid |
Positieve test bias | De neiging van mensen om een hypothese te bevestigen in plaats van te ontkennen. |
Gedagsbevestiging | De neiging om bij een persoon gedragingen uit te lokken die consistent zijn met de initiële verwachtingen van die persoon. |
Kwalificatie | Proberen de grenswaarden te vinden waartussen ene theorie of hypothese, zowel waar als niet waar is. |
Experimentele paradigma | De ideale volgorde van procedures die geldt als het model voor psychologisch onderzoek. |
Paradigma | Aantal aannames en onderzoeksmethoden die een wetenschappelijke onderzoekstraditie vormen |
Proefneming (experimentation) | Onderzoekers manipuleren één of meer variabelen om het effect op andere variabelen te meten. |
Experiment | Verwijst naar een specifieke studie waarin de onderzoeker gebruik heeft gemaakt van proefneming. |
Statische toetsen | Geeft een aantal regels en procedures voor het maken van een inferentie van het onderzoek naar de gehele populatie |
Nulhypothese | Stelt dat de eigen bevinden niet waar zijn. |
Alternatieve hypothese | De bewering dat de beweringen van de onderzoekers wel waar zijn. |
Alfaniveau | De standaard tegen welke de nulhypothese verworpen kan worden. |
Random sampling (willekeurige selectie) | Zorgen dat de deelnemers een goede reflectie zijn van de totale populatie van interesse |
Random assignment (willekeurige toewijzing) | Alle deelnemers hebben een gelijke kans om aan een van de onderzoeksgroepen toegewezen te worden. |
Hoofdstuk 3
Judgement fase | Fase van het beantwoorden van een zelf-rapportage vraag. |
Pilot studie | Soort oefenonderzoek, waarmee onderzoekers hun meetschapen of manipulaties kunnen verscherpen voor het uiteindelijke onderzoek. |
Hoofdstuk 4
Interval schalen | Gelijke intervallen, zoals temperatuur |
Ratio schalen | Met een duidelijk nulpunt en verhoudingen, zoals gewicht |
Nominale schalen | Meten van een kenmerk dat niet met een getal kan worden weergegeven en er zit geen logische volgorde in, zoals geslacht. |
Ordinale schalen | Als er wel sprake is van een logische volgorde, maar geen informatie over de absolute verschillen, zoals restaurant met Michelin sterren |
Betrouwbaarheid | De mate van consistentie van een onderzoek, dat wil zeggen dat bij herhaling dezelfde uitkomsten verwacht kunnen worden. |
Interne consistentie | Mate waarin verschillende items bij een meting zich op dezelfde manier gedragen, dus met elkaar correleren. |
Test-hertest betrouwbaarheid | De mate waarin de uitkomsten van een meting of items op tijdstip één positief correleren met de uitkomst op tijdstip twee. |
Inter-beoordelaar betrouwbaarheid | De mate waarin verschillende beoordelaars het onafhankelijk van elkaar eens zijn over een bepaalde observatie. |
Validiteit | De mate waarin gemeten wordt wat ook echt gemeten moet worden. |
Externe validiteit | De mate waarin de onderzoeksresultaten generaliseerbaar zijn naar andere situaties dan die in het onderzoek. |
Passieve observatiestudies | Studies die een hoge externe validiteit hebben |
Interne validiteit | De mate waarin het redeneren binnen het onderzoek correct is uitgevoerd. Belangrijk hierbij is dat het geldig is voor de onderzochte groep. |
Concept validiteit | Mate waarin de hypothese gelinkt is aan de bredere theorie die getest wordt. |
Construct validiteit | Mate waarin de onafhankelijke en de afhankelijke variabelen van het onderzoek ook echt datgene meten wat de onderzoeker beoogt te meten. |
Hoofdstuk 5
Regressie richting het gemiddelde | Dit houdt in dat mensen die op een voortest erg hoog of laag scoren de neiging hebben bij de na-test een score te hebben die meer gemiddeld is. |
Ontwikkeling | Verwijst naar veranderingen die meer specifiek zijn voor één persoon of leeftijdsgroep naarmate deze ouder wordt. |
Geschiedenis | Verwijst naar de algemene verandering in de tijd in een grote groep mensen, zoals cultuur of natie |
Non-response bias | De respondenten zelf zijn de oorzaak van de bias, ze kiezen zelf of ze mee doen. In dit geval dus niet |
Psuedo-experiment | Hierbij wordt er geen variabele gemanipuleerd en er is ook geen controle groep. |
Selectie bias | Dit is het geval als er een proef wordt genomen van een niet representatieve steekproef. |
Hawthorne effect | Productiviteit van mensen neemt toe als ze weten dat ze worden bestudeerd. |
Homogene uitval | Uitval is gelijk verdeeld over alle experimentele condities. |
Heterogene uitval | Uitval is niet gelijk verdeeld over de experimentele condities |
Deelnemers verwachting | Deelnemers doen bewust of onbewust wat ze denken dat de onderzoeker van hen verwacht. |
Deelnemersverzet | Mensen doen het tegenovergestelde van wat ze denken dat verwacht wordt om de hypothese te ontkrachten |
Vrees voor evaluatie | Mensen doen alles om maar goed op de onderzoeker over te komen |
Unobtrusive observation | Deelnemers observeren zonder dat ze het doorhebben. |
Bogus pipeline | Een nepleugendetector |
Attitude polarisatie | Houdt in dat deelnemers in de tussentijd na hebben kunnen denken over hun antwoorden en daar dan extremer in gaan worden om meer sociaal wenselijk over te komen |
Confound | Brede term die verwijst naar elk probleem in de onderzoeksopzet waarbij een extra variabele systematisch varieert met de onafhankelijke variabelen. Een fout in de opzet |
Artefacten | Verwijst naar een variabele die constant wordt gehouden in een onderzoek en zorgt voor een begrensde context waarin het effect gevonden kan worden. |
Experimenter bias | Wanneer de verwachtingen van de onderzoeker hem ongewild bevooroordelen in de experimentele observaties. |
Dubbelblind procedure | Onderzoeker en deelnemer weten niet in welke onderzoek conditie de deelnemer is geplaatst. |
Hoofdstuk 6
Factorontwerpen | Onderzoek ontwerpen met meerdere onafhankelijke variabelen die compleet gekruist zijn. Dit betekent dat elk niveau van elke onafhankelijke variabele combineert wordt met elk niveau van elke andere onafhankelijke variabele. |
Label | Specificeert het aantal onafhankelijke variabelen en het aantal niveaus per onafhankelijke variabelen |
Hoofdeffecten | Effecten van de onafhankelijke variabelen in factorstudies. |
Interactie | Als het effect van een onafhankelijke variabele op een afhankelijke variabele afhangt van het niveau van een tweede onafhankelijke variabele. |
Ordinale/gespreide interactie | Als er een effect is bij één niveau van de tweede onafhankelijke variabele en dit effect zwak of nihil is bij een ander niveau. |
Disordinaal/ overgekruiste interactie | Als er geen hoofdeffecten zijn op verschillende niveaus van de tweede onafhankelijke variabele. |
Twee-groepen ontwerp | Er is één onafhankelijke variabele die slechts twee niveaus heeft. |
Multiple-groepen ontwerp | Eén onafhankelijke variabele, die meer dan twee niveaus kan aannemen. |
Between-subject ontwerp | Elke deelnemer wordt maar aan één experimentele conditie blootgesteld. |
Within-subject of herhaalde meting ontwerp | Elke deelnemer wordt op verschillende tijdstippen aan meerdere, soms alle condities blootgesteld en met zichzelf vergeleken. |
Transparantie | Het kan zijn dat deelnemers achter de hypothese komen en zich daarnaar gaan gedragen. |
Gevolg (sequence) effecten | Komen voor wanner de antwoorden van de deelnemers beïnvloed worden door het verstrijken van de tijd. |
Overdrachtseffecten | Wanneer de antwoorden bij een taak de antwoorden bij een andere taak beïnvloeden. |
Interferentie effecten | Wanneer het doen van een eerste test de tweede test moeilijker maakt |
Oefeneffecten | Komen voor wanneer deelnemers bewust of onbewust iets leren van eerdere take, waardoor de tweede taak makkelijker wordt. |
Volgorde (order) effecten | Komen voor wanneer ene vraag een andere betekenis krijgt als deze volgt op verschillende initiële vragen. |
Structurele debriefing | Een interview dat na het onderzoek wordt afgenomen om te bepalen wat de deelnemers dachten dat de onderzoeker wilde weten. |
Counterbalancing | Een manier om gevolg en overdrachtseffecten te controleren |
Complete counterbalancing | Hierbij worden alle mogelijke volgordes gebruikt en willekeurig aan deelnemers toegewezen. |
Omgekeerde counterbalancing | Een vorm van incomplete counterbalancing die wordt toegepast als complete counterbalancing onpraktisch gaat worden. Er wordt een bepaalde volgorde gemaakt die dan ook in omgekeerde volgorde gebruikt gaat worden. |
Gedeeltelijke counterbalancing | Tweede vorm van incomplete counterbalancing. De vorm die het meeste voorkomt houdt in dat er willekeurig een aantal volgordes gekozen worden uit het totaal van mogelijke volgordes |
Gemixt model ontwerpen | Dit zijn ontwerpen waarbij tenminste één onafhankelijke variabele wordt gemanipuleerd op een between-subject basis en tenminste één ander onafhankelijke op een within-subject basis. |
Hoofdstuk 7
Ceterus paribus conditie | Het manipuleren van slechts één aspect en het constant houden van al het andere |
Experimenteel realisme | Mate waarin een onderzoek psychologisch relevant is voor de participanten, dus het voelt hetzelfde als de echte wereld. |
Manipulatie check | Meting om te kijken of de manipulatie bij de deelnemers ook echt de psychologische staat teweegbrengt die de onderzoeker wenst. |
Deceptie | Dit betekent dat de deelnemers niet altijd de ware reden van het onderzoek wordt verteld, omdat ze dan bevooroordeeld zijn. |
Confound | Variabelen die systematisch met de onafhankelijke variabelen veranderen en de afhankelijke variabele beïnvloeden zoals van de onafhankelijke variabelen verwacht zou worden. |
Persoon confound | Ontstaan wanneer individuele verschillen covariëren met een experimentele behandelingsconditie en dit gerelateerd is aan de afhankelijke variabele. |
Operationele confound | Treden op als er een fout is gemaakt in de operationele definities van een construct. |
Hoofdstuk 8
Quasi – experiment | Onderzoekers hebben maar gedeeltelijk controle over onafhankelijke variabelen |
Natuurlijke experimenten | Alle variabelen van interesse worden gemeten en er vindt geen willekeurige selectie plaats, zodat de onderzoeker geen controle kan uitoefenen over het experiment. |
Archiefstudies | Er wordt gebruik gemaakt van bestaande publieke gegevens om een hypothese te testen |
Persoon-per-behandeling | Hierin wordt tenminste één onafhankelijke variabele gemeten en ten minste één andere onafhankelijke variabele gemanipuleerd. |
Natuurlijke groepen met experimentele behandeling | Er is sprake van groepen die al op een natuurlijk wijze gevormd zijn, maar niet uit elkaar te halen zijn. |
Natuur per behandeling quasi-experiment | Wordt gebruikt wanneer een bepaalde natuurlijke manipulatie van tevoren te voorspellen is en gecontroleerd kan worden. |
Patched-up ontwerp | Hierbij voegen onderzoekers telkens nieuwe controlegroepen aan het quasi-experimenteel ontwerp toe om het effect van het experiment te meten en om de invloed van confound te testen. |
Hoofdstuk 9
Census | Een verzameling data die verkregen is door alle mensen van de betreffende populatie te ondervragen. |
Populatieonderzoeken | Deze maken gebruik van willekeurige selectie om een goede steekproef van een populatie te krijgen om schattingen te kunnen maken. |
Cluster steekproeven | Mensen uit een populatie zijn al in groepen geplaats. Bijvoorbeeld lijsten van universiteiten |
Steekproeffout of steekproefmarge | Geeft de waarschijnlijke discrepantie aan tussen de resultaten verkregen uit de steekproef en de resultaten die verkregen zouden zijn als gebruik was gemaakt van de gehele populatie |
Marketing onderzoek | Onderzoek naar attitudes en voorkeuren van specifieke populaties |
Valse consensus | Mensen overschatten de attitudes van andere mensen wanneer deze lijken op de eigen attitudes |
Epidemiologisch onderzoek | Dit zijn beschrijvende studies die zich primair focussen op de prevalentie en incidentie van psychologische aandoeningen binnen een populatie. |
Correlationele methoden | Het verzamelen van observaties en het testen van hypothesen met betrekking tot associaties tussen verschillende variabelen. |
Omgekeerde causaliteit | Wanneer variabele X invloed kan hebben op variabele Y, maar het omgekeerde net zo goed waar kan zijn. |
Longitudinale of prospectieve onderzoek ontwerpen | Dezelfde mensen worden op verschillende tijdstippen bestudeerd. |
Persoon confound | Wanneer mensen hoog of laag op een bepaalde variabele, scoren ze ook hoog of laag op een bepaalde individueel verschil variabele die samenhangt met de afhankelijke variabele. |
Omgeving confound | Deze zijn equivalent aan procedurele confound in experimenteel onderzoek en hetzelfde als persoons confound, behalve dat ze niet verwijzen naar individuele verschillen, maar te maken hebben met de omgeving of situatie. |
Operationele confound | Wanneer een bepaald onderzoek een bepaald construct wil meten, tegelijk ook iets anders meet waar de onderzoeker zich niet van bewust is. |
Archief onderzoek | Hierbij wordt gebruik gemaakt van bestaande publieke gegevens om een theorie of een hypothese te testen |
Observatie onderzoek | Onderzoekers registreren het gedrag van mensen in de eigen natuurlijke omgeving. |
Onopvallende observatie | Dit houdt in dat de onderzoekers niet interfereren in het natuurlijk gedrag van mensen en dat die mensen zich niet realiseren dat ze bestudeerd worden. |
Casestudies | Studies die een analyse van de ervaringen van één persoon of groep betreffen. |
Hoofdstuk 10
Statistiek | Een aantal mathematische procedures om observaties samen te vatten en te interpreteren |
Beschrijvende statistiek | Wordt gebruikt om een serie observaties te beschrijven of samen te vatten |
Inferentiële statistiek | Wordt gebruikt om een serie observaties te interpreteren of om inferenties te maken. |
Spreiding | Hoe observaties onderling kunnen verschillen |
Spreidingsbreedte | Het verschil tussen de hoogste en de laagste waarde. |
Standaard deviatie | Hoe ver een score gemiddeld gezien afligt van het gemiddelde |
Centrale tendentie | Geven aan welke getalswaarde als gemiddelde of midden van een serie van observaties moet worden aangemerkt |
Normale verdeling | Een verdeling in de vorm van een symmetrisch gebogen curve waarbij de meeste scores zich rond het gemiddelde bevinden. |
Vierkante verdeling | Hierin komen de scores allemaal even vaak voor |
Bimodale verdeling | Komt voor wanneer in een serie scores twee verschillende pieken zijn. |
Kanstheorie | De wiskundige regels en procedures die gebruikt worden om kans gebeurtenissen te voorspellen en te begrijpen. |
Kans | Het aantal gekwalificeerde uitkomsten gedeeld door het totaal aantal mogelijke uitkomsten |
Type I fout | Het onjuist verwerpen van de nulhypothese terwijl die correct was. |
Type II fout | De nulhypothese wordt aangenomen terwijl er wel een effect is geobserveerd. |
Effect grootte | Dit is de omvang van het effect waarin de onderzoekers geïnteresseerd zijn. |
Meta-analyse | Verwijst naar het gebruik van statische technieken om een groep studies te evalueren en samen te vatten. |
Determinatie coëfficiënt | Wordt gebruikt om te kijken hoe sterk twee variabelen gerelateerd zijn. |
Hoofdstuk 11
Deductie | Het redeneren van een algemene theorie naar een specifieke |
Verklaren van uitzonderingen | Het doel van de onderzoeker is niet om erachter komen wat er waar is, maar wanneer en voor wie een psychologisch principe geldt. |
Hypothetico- deductieve methode | Onderzoeker begint met een aantal basisprincipes of observaties uit een bestaand theoretisch netwerk |
Toepassen van een functionele analyse | Onderzoekers buigen zich over basisdingen die een organisme moet doen om succesvol te zijn in het beheersen van hun omgeving. |
Inductie | Het redeneren van specifiek naar algemeen |
Analyse van een vuistregel | Het analyseren van dingen die experts op een bepaald gebied doen om een bepaald resultaat te verkrijgen, zoals hoe obers hun bestellingen onthouden |
Case studies | Observaties van één specifieke groep of persoon |
Bescherming tegen fysiek en psychologisch letsel | Onderzoekers mogen de deelnemers niet bewust in gevaarlijke of risicovolle situaties brengen |
Informed consent | De deelnemers moeten van tevoren geïnformeerd worden over potentiële risico’s en hun toestemming geven voor deelname aan het onderzoek. |
Debriefing | In het geval van deceptie moet de onderzoeker na het onderzoek de deelnemer hiervan op de hoogte stellen en de reden ervan uitleggen. |
Vrijheid van dwang | Deelnemers mogen niet gedwongen worden dingen te doen tijdens het onderzoek die ze niet willen |
De risico voordeel regel | Tijdens het onderzoek mogen deelnemers geen groter risico lopen dan in hun normale dagelijks leven. |
Replicatie | Een follow-up experiment dat het idee erachter een eerste experiment test op een andere manier om te kijken of er een zelfde resultaat gevonden wordt. |
Hoofdstuk 12
De zandloper benadering | Structuur van een paper loopt in de vorm van een zandloper, dus van algemeen naar specifiek naar algemeen. |
Oefenvragen en antwoorden per hoofdstuk
Hoofdstuk 1
1. Het idee dat alle dingen die gebeuren betekenisvolle, systematische oorzaken hebben, is
a. Empirisme
b. Determinisme
c. Spaarzaamheid
2. Fysiologie is:
a. De studie van gedrag, de aard van realiteit en kennis door gebruik te maken van intuïtie, empirische observaties en logica.
b. De studie van gedrag door relaties tussen mensen te bekijken.
c. De studie van de onderlinge relaties en functies van verschillende delen van het lichaam en de hersenen
3. Welke is geen belangrijke wetenschappelijke aannamen?
a. Spaarzaamheid
b. Tijd
c. Testbaarheid
4. Wat is spaarzaamheid?
a. Als men moet kiezen tussen twee concurrerende gelijkwaardige theorieën over een bepaald fenomeen, dan zou men de voorkeur moeten geven aan de meest simpele, oftewel spaarzame theorie.
b. Maken van systematische observaties om erachter komen hoe de wereld in elkaar zit.
c. Een bewering over een causaal verband tussen twee of meer variabelen.
5. Welke rijtje hoort bij metafysische verklaringen?
a. Mythologie, astrologie, animisme
b. Mythologie, filosofie, astrologie
c. Mythologie, filosofie, fysiologie
Antwoorden:
1. b
2. c
3. b
4. a
5. a
Hoofdstuk 2
1. Inductie is:
a. Het redeneren van specifieke situaties naar algemene principes
b. Redeneren van een algemeen principe naar een specifieke situatie
c. Een universele bewering van de aard van dingen die het mogelijk maakt om betrouwbare voorspellingen te doen over de toekomst.
2. Wat is een theorie?
a. Een universele bewering van de aard van dingen die het mogelijk maakt om betrouwbare voorspellingen te doen over de toekomst.
b. Een voorspelling over specifieke gebeurtenissen die afgeleid is van één of meerdere theorieën.
c. Een algemene bewering over de relatie tussen twee of meer variabelen.
3. Wat is het verschil tussen willekeurige selectie en willekeurige toewijzing?
a. Ze doen hetzelfde in het onderzoek, maar op een ander niveau in het onderzoek.
b. Het aantal mensen dat gekozen wordt.
c. Het moment waarop de mensen gekozen worden.
4. Wat is een positieve test bias?
a. De neiging om bij een persoon gedragingen uit te lokken die consistent zijn met de initiële verwachtingen van die persoon.
b. De neiging van mensen om een hypothese te bevestigen in plaats van te ontkennen.
c. De neiging om de uitslag van testen positiever te zien dat ze zijn.
5. Tegen welke standaard kan de nulhypothese verworpen worden?
a. Statische toets
b. Kwalificatie
c. Alfaniveau
6. Aantal aannames en onderzoeksmethoden die een wetenschappelijke onderzoekstraditie vormen
a. Paradigma
b. Experimenteel paradigma
c. Validatie
Antwoorden:
1. a
2. c
3. a
4. b
5. c
6. a
Hoofdstuk 3
Bij dit hoofdstuk zijn er geen stampvragen.
Hoofdstuk 4
1. Wat zijn ordinale schalen?
a. Als er wel sprake is van een logische volgorde, maar geen informatie over de absolute verschillen
b. Meten van een kenmerk dat niet met een getal kan worden weergegeven en er zit geen logische volgorde in
c. Met een duidelijk nulpunt en verhoudingen
2. Wat is een voorbeeld van een nominale schaal?
a. middelbare school niveaus. VMBO, HAVO, VWO
b. provincies van Nederland
c. aantal meters.
3. Welke hoort niet in het rijtje thuis?
a. Ordinale schaal
b. nominale schaal
c. Constructieve schaal
4. Mate waarin de hypothese gelinkt is aan de bredere theorie die getest wordt.
a. Construct validiteit
b. Concept validiteit
c. Externe validiteit
5. Welk rijtje is juist.
a. betrouwbaarheid, test-hertest betrouwbaarheid, inter-beoordelaar betrouwbaarheid
b. betrouwbaarheid, conceptuele betrouwbaarheid, inter-beoordelaar betrouwbaarheid
c. betrouwbaarheid, construct betrouwbaarheid, inter-beoordelaar betrouwbaarheid.
6. Wat is externe validiteit?
a. De mate waarin de onderzoeksresultaten generaliseerbaar zijn naar andere situaties dan die in het onderzoek.
b. Mate waarin de hypothese gelinkt is aan de bredere theorie die getest wordt.
c. De mate waarin gemeten wordt wat ook echt gemeten moet worden.
7. Wat is de overeenkomst tussen construct en concept validiteit?
a. Dat ze beide ordinale schalen meten
b. Dat ze beide kijken hoe goed hetgeen de onderzoeker heeft gemeten past bij wat er gemeten moest worden.
c. Dat ze beide kijken hoe het onderzoek aangepast zou kunnen worden naar de algemene theorie.
8. De mate waarin de uitkomsten van een meting of items op tijdstip één positief correleren met de uitkomst op tijdstip twee.
a. Test-hertest betrouwbaarheid
b. Inter-beoordelaar betrouwbaarheid
c. externe validiteit
Antwoorden:
1. a
2. b
3. c
4. b
5. a
6. a
7. c
8. a
Hoofdstuk 5
1. Heterogenen uitval is niet gelijk verdeeld over de experimentele condities.
a. waar
b. niet waar
2. Wat is geen bias?
a. Experimenter bias
b. Selectie bias
c. Keuze bias
3. De respondenten zelf zijn de oorzaak van de bias, ze kiezen zelf of ze mee doen.
a. Selectie bias
b. non-response bias
c. experimenter bias
4. Welke manier gebruik je om de experimenter bias te voorkomen?
a. dubbelblind procedure
b. heterogene uitval
c. homogene uitval
5. Wat is deelnemers verzet?
a. Deelnemers doen bewust of onbewust wat ze denken dat de onderzoeker van hen verwacht.
b. Mensen doen het tegenovergestelde van wat ze denken dat verwacht wordt om de hypothese te ontkrachten
c. Deelnemers weigeren mee te doen aan het onderzoek.
6. Wanneer heb je last van attitude polarisatie?
a. Als er meerdere mensen tegelijk geïnterviewd worden.
b. Als tijd is tussen de verschillende vragen
c. Als er mensen geobserveerd worden terwijl ze het door hebben.
7. Wat is een Psuedo-experiment?
a. Dit houdt in dat mensen die op een voortest erg hoog of laag scoren de neiging hebben bij de na-test een score te hebben die meer gemiddeld is.
b. Hierbij wordt er geen variabele gemanipuleerd en er is ook geen controle groep.
c. Deelnemers observeren zonder dat ze het doorhebben
Antwoorden:
1. a
2. c
3. b
4. a
5. b
6. b
7. b
Hoofdstuk 6
1. Elke deelnemer wordt op verschillende tijdstippen aan meerdere, soms alle condities blootgesteld en met zichzelf vergeleken.
a. Within-subject of herhaalde meting ontwerp
b. Between-subject ontwerp
c. Gemixt model ontwerp
2. Wat is een twee groepen ontwerp?
a. Één onafhankelijke variabele, die meer dan twee niveaus kan aannemen.
b. Er is één onafhankelijke variabele die slechts twee niveaus heeft.
c. Er zijn twee onafhankelijke variabelen die elk slechts één niveau kan aannemen.
3. Welke is geen vorm van incomplete counterbalancing?
a. Gedeeltelijke counterbalancing
b. Omgekeerde counterbalancing
c. counterbalancing
4. Waarom pas je structurele debriefing toe?
a. Om te checken of het onderzoek juist geformuleerd is.
b. Om te bepalen wat de deelnemers dachten dat er werd gemeten
c. Om te bepalen of de deelnemers de vragen juist ingevuld hebben.
5. Wat zijn interferentie effecten?
a. Komen voor wanneer deelnemers bewust of onbewust iets leren van eerdere take, waardoor de tweede taak makkelijker wordt.
b. Wanneer de antwoorden bij een taak de antwoorden bij een andere taak beïnvloeden.
c. Wanneer het doen van een eerste test de tweede test moeilijker maakt
6. Welke rijtje is juist?
a. Overdrachtseffecten, oefeneffecten, afhankelijke effecten
b. Overdrachtseffecten, volgorde effecten, oefeneffecten
c. Overdrachtseffecten, afhankelijke effecten, volgorde effecten
7. Ordinale/spreiding interactie is als er een effect is bij één niveau van de tweede onafhankelijke variabele en dit effect zwak of nihil is bij een ander niveau.
a. juist
b. onjuist
Antwoorden:
1. a
2. b
3. c
4. b
5. c
6. b
7. a
Hoofdstuk 7
1. Wat is experimenteel realisme?
a. Mate waarin een onderzoek psychologisch relevant is voor de participanten, dus het lijkt hetzelfde als de echt wereld.
b. Mate waarin een onderzoek psychologisch relevant is voor de participanten, dus het ziet er hetzelfde uit als in de echte wereld.
c. Mate waarin een onderzoek psychologisch relevant is voor de participanten, dus het voelt hetzelfde als de echte wereld.
2. Wat zijn persoons confound?
a. Variabelen die systematisch met de onafhankelijke variabelen veranderen en de afhankelijke variabele beïnvloeden zoals van de onafhankelijke variabelen verwacht zou worden.
b. Ontstaan wanneer individuele verschillen covariëren met een experimentele behandelingsconditie en dit gerelateerd is aan de afhankelijke variabele.
c. Treden op als er een fout is gemaakt in de operationele definities van een construct.
3. Wat is deceptie?
a. Dit betekent dat de deelnemers niet altijd de ware reden van het onderzoek wordt verteld, omdat ze dan bevooroordeeld zijn.
b. Dit betekent dat deelnemers andere vragen krijgen dan ze verwachten te krijgen.
c. Dit betekent dat deelnemers niet allemaal geobserveerd zullen worden.
4. Wat is geen vorm van confound?
a. Operationele confound
b. Persoon confound
c. Cultuur confound
Antwoorden:
1. c
2. b
3. c
4. c
Hoofdstuk 8
1. Hoe zijn quasi-experimenten en natuurlijke experimenten verbonden?
a. Niet
b. Quasi-experimenten zijn een vorm van natuurlijke experimenten
c. Natuurlijke experimenten zijn een vorm van quasi experimenten.
2. Wat zijn persoon-per-behandeling experimenten?
a. Hierin wordt tenminste één onafhankelijke variabele gemeten en ten minste één andere onafhankelijke variabele gemanipuleerd.
b. Er is sprake van groepen die al op een natuurlijk wijze gevormd zijn, maar niet uit elkaar te halen zijn.
c. Wordt gebruikt wanneer een bepaalde natuurlijke manipulatie van tevoren te voorspellen is en gecontroleerd kan worden.
3. Archief studies maken gebruik van al publieke gegevens.
a. waar
b. niet waar
Antwoorden
1. c
2. a
3. a
Hoofdstuk 9
1. Wat is geen soort confound?
a. Persoon confound
b. Structuur confound
c. Omgeving counfound
2. Wat is een valse consensus?
a. Mensen die zichzelf overschatten in bepaalde situaties
b. Mensen die situaties overschatten
c. Mensen overschatten de attitudes van andere mensen wanneer deze lijken op de eigen attitudes
3. Wat zijn operationele confound?
a. Wanneer een bepaald onderzoek een bepaald construct wil meten, tegelijk ook iets anders meet waar de onderzoeker zich niet van bewust is.
b. Wanneer mensen hoog of laag op een bepaalde variabele, scoren ze ook hoog of laag op een bepaalde individueel verschil variabele die samenhangt met de afhankelijke variabele.
c. Studies die een analyse van de ervaringen van één persoon of groep betreffen.
4. Onderzoekers interfereren niet in het natuurlijk gedrag van mensen en dat die mensen zich niet realiseren dat ze bestudeerd worden.
a. Observatieonderzoek
b. Ongemengd observatie onderzoek
c. Onopvallende observatie
5. Wat zijn clustersteekproeven?
a. Mensen uit een populatie zijn al in groepen geplaats.
b. Mensen worden uit verschillende culturele groepen gekozen.
c. Geeft de waarschijnlijke discrepantie aan tussen de resultaten verkregen uit de steekproef en de resultaten die verkregen zouden zijn als gebruik was gemaakt van de gehele populatie
Antwoorden
1. b
2. c
3. a
4. c.
5. a
Hoofdstuk 10
1. Wat is een vierkante verdeling?
a. Komt voor wanneer in een serie scores twee verschillende pieken zijn.
b. Een verdeling in de vorm van een symmetrisch gebogen curve waarbij de meeste scores zich rond het gemiddelde bevinden.
c. Hierin komen de scores allemaal even vaak voor
2. Een type I fout is dat de nulhypothese wordt aangenomen terwijl er wel een effect is geobserveerd.
a. Juist
b. Onjuist
3. Inferentiele statistiek:
a. Wordt gebruikt om een serie observaties te interpreteren of om inferenties te maken.
b. Wordt gebruikt om een serie observaties te beschrijven of samen te vatten
c. Verwijst naar het gebruik van statische technieken om een groep studies te evalueren en samen te vatten.
4. Een verdeling in de vorm van een symmetrisch gebogen curve waarbij de meeste scores zich rond het gemiddelde bevinden.
a. Bimodale verdeling
b. Vierkante verdeling
c. Centrale tendentie
5. Wat is effect grootte?
a. Het verschil tussen de hoogste en de laagste waarde
b. Dit is de omvang van het effect waarin de onderzoekers geïnteresseerd zijn.
c. Het verschil tussen het eerste effect en het tweede.
6. Wat is kanstheorie?
a. Een aantal mathematische procedures om observaties samen te vatten en te interpreteren
b. De wiskundige regels en procedures die gebruikt worden om kans gebeurtenissen te voorspellen en te begrijpen.
c. Het aantal gekwalificeerde uitkomsten gedeeld door het totaal aantal mogelijke uitkomsten
Antwoorden
1. c
2. b
3. a
4. a
5. b
6. b
Hoofdstuk 11
1. Deductie is het redeneren van een algemene theorie naar een specifieke?
a. Juist
b. Onjuist
2. Tijdens het onderzoek mogen deelnemers geen groter risico lopen dan in hun normale dagelijks leven.
a. De risico voordeel regel
b. Informed consent
c. Bescherming tegen fysiek en psychologisch letsel regel
3. Wanneer voer je een replicatie uit?
a. Na het vormen van de hypothese
b. Na het eerste experiment
c. Na het zoeken van de bijbehorende theorie.
4. Wat is de hypothetico-deductieve methode?
a. Onderzoeker begint met een aantal basisprincipes of observaties uit een bestaand theoretisch netwerk
b. Onderzoeker eindigt met het vernieuwen van de hypotheses.
c. Onderzoekers buigen zich over basisdingen die een organisme moet doen om succesvol te zijn in het beheersen van hun omgeving.
Antwoorden
1. a
2. a
3. b
4. a
Hoofdstuk 12
Bij dit hoofdstuk zijn geen stampvragen.
Join with a free account for more service, or become a member for full access to exclusives and extra support of WorldSupporter >>

Contributions: posts
Spotlight: topics
Online access to all summaries, study notes en practice exams
- Check out: Register with JoHo WorldSupporter: starting page (EN)
- Check out: Aanmelden bij JoHo WorldSupporter - startpagina (NL)
How and why use WorldSupporter.org for your summaries and study assistance?
- For free use of many of the summaries and study aids provided or collected by your fellow students.
- For free use of many of the lecture and study group notes, exam questions and practice questions.
- For use of all exclusive summaries and study assistance for those who are member with JoHo WorldSupporter with online access
- For compiling your own materials and contributions with relevant study help
- For sharing and finding relevant and interesting summaries, documents, notes, blogs, tips, videos, discussions, activities, recipes, side jobs and more.
Using and finding summaries, notes and practice exams on JoHo WorldSupporter
There are several ways to navigate the large amount of summaries, study notes en practice exams on JoHo WorldSupporter.
- Use the summaries home pages for your study or field of study
- Use the check and search pages for summaries and study aids by field of study, subject or faculty
- Use and follow your (study) organization
- by using your own student organization as a starting point, and continuing to follow it, easily discover which study materials are relevant to you
- this option is only available through partner organizations
- Check or follow authors or other WorldSupporters
- Use the menu above each page to go to the main theme pages for summaries
- Theme pages can be found for international studies as well as Dutch studies
Do you want to share your summaries with JoHo WorldSupporter and its visitors?
- Check out: Why and how to add a WorldSupporter contributions
- JoHo members: JoHo WorldSupporter members can share content directly and have access to all content: Join JoHo and become a JoHo member
- Non-members: When you are not a member you do not have full access, but if you want to share your own content with others you can fill out the contact form
Quicklinks to fields of study for summaries and study assistance
Main summaries home pages:
- Business organization and economics - Communication and marketing -International relations and international organizations - IT, logistics and technology - Law and administration - Leisure, sports and tourism - Medicine and healthcare - Pedagogy and educational science - Psychology and behavioral sciences - Society, culture and arts - Statistics and research
- Summaries: the best textbooks summarized per field of study
- Summaries: the best scientific articles summarized per field of study
- Summaries: the best definitions, descriptions and lists of terms per field of study
- Exams: home page for exams, exam tips and study tips
Main study fields:
Business organization and economics, Communication & Marketing, Education & Pedagogic Sciences, International Relations and Politics, IT and Technology, Law & Administration, Medicine & Health Care, Nature & Environmental Sciences, Psychology and behavioral sciences, Science and academic Research, Society & Culture, Tourisme & Sports
Main study fields NL:
- Studies: Bedrijfskunde en economie, communicatie en marketing, geneeskunde en gezondheidszorg, internationale studies en betrekkingen, IT, Logistiek en technologie, maatschappij, cultuur en sociale studies, pedagogiek en onderwijskunde, rechten en bestuurskunde, statistiek, onderzoeksmethoden en SPSS
- Studie instellingen: Maatschappij: ISW in Utrecht - Pedagogiek: Groningen, Leiden , Utrecht - Psychologie: Amsterdam, Leiden, Nijmegen, Twente, Utrecht - Recht: Arresten en jurisprudentie, Groningen, Leiden
JoHo can really use your help! Check out the various student jobs here that match your studies, improve your competencies, strengthen your CV and contribute to a more tolerant world
1539 |
Add new contribution