Begrippenlijst Mastering Modern Psychological Testing: Theory & Methods, H 1 tm 18

Deze samenvatting is geschreven in collegejaar 2012-2013.

Begrippenlijsten hoofdstuk 1 t/m 18 van Mastering Modern Psychological Testing

Hoofdstuk 1

Introductie op psychologisch testen

Francis Galton

De grondlegger van de mentale tests en measurement. Hij was de eerste die op grootschalig niveau fysieke, sensorische en motorische data van individuen verzamelde.

Binet-Simon schaal

De eerste Binet-Simon schaal werd in 1905 gepubliceerd en was de eerste intelligentietest die een goede voorspeller was van academisch succes.

Test

Een procedure waarin het gedrag van een individu wordt waargenomen, geëvalueerd en beoordeeld door middel van het gebruik van gestandaardiseerde procedures. Omdat een test maar een gedeelte van het gedrag weergeeft, is het belangrijk dat de test representatief is voor het gehele gedrag.

Measurement

Een set van regels waarmee cijfers worden toegewezen aan objecten, trekken, attributies of gedragingen. Letterlijk: meting.

Assessment

Iedere systematische procedure voor het verzamelen van informatie die gebruikt kan worden om inferenties te maken over de kenmerken van mensen of objecten.

Betrouwbaarheid

De stabiliteit, consistentie en relatieve accuraatheid van testscores of de mate waarin testscores vrij zijn van meetfouten.

Validiteit

De nauwkeurigheid van de interpretatie van de testscores.

Maximale prestatie tests

Deze tests zijn ontworpen om het maximale te meten van iemands kennis en vaardigheden.

Prestatietest

Meet de kennis van een persoon in een specifiek domein waarin hij of zij instructies heeft gekregen.

Aptitudetest

Meet cognitieve bekwaamheden en vaardigheden die zijn ontstaan door levenservaringen.

Speedtest

Een speedtest bevat items die relatief gemakkelijk zijn en moet binnen een bepaalde tijd afgelegd worden. De prestatie op een speedtest laat alleen verschillen in de snelheid van een prestatie zijn.

Powertest

De prestaties op een powertest geven de moeilijkheid van de items weer die de testdeelnemer goed beantwoord heeft. Tijd is hierbij niet van belang.

Typische respons tests

Deze tests zijn ontworpen om het typische gedrag en de kenmerken van de testdeelnemer te meten. Deze test meten zaken als persoonlijkheid en gedrag.

Objectieve persoonlijkheidstests

Deze tests gebruiken items die niet beïnvloed worden door de subjectiviteit van de persoon die de test beoordeelt.

Projectieve persoonlijkheidstests

Hierbij wordt een ambigue stimulus aan de testdeelnemer getoond. Deze stimulus kan een bijna onbeperkt bereik van resultaten opleveren. Het beoordelen van de tests gaat vaak gepaard met subjectiviteit.

Normgerichte score

Hierbij worden de prestaties van iemand op een test vergeleken met de prestaties van anderen. Deze scores worden dus relatief geïnterpreteerd.

Criteriumgerichte score

Hierbij wordt de prestatie van iemand op test vergeleken met een specifiek niveau van prestaties. Deze scores worden dus vergeleken met een absolute standaard.

Construct

Trekken of kenmerken waarvoor een test is ontworpen om die te meten.

Error

In alle measurement vindt error plaats, omdat het meetproces niet perfect is.

 

Hoofdstuk 2

Basisstatistieken van het meten

Measurement

Een set van regels waarmee cijfers worden toegewezen aan objecten, trekken, attributies of gedragingen. Letterlijk: meting.

Nominale schaal

Classificeert mensen of objecten in categorieën, klassen of groepen. Deze categorieën zijn niet geordend en niet onderling verwisselbaar. De simpelste schaal.

Ordinale schaal

Rangschikt mensen of objecten op basis van de hoeveelheid van een kenmerk zij vertonen of bezitten. De intervallen tussen categorieën hoeven niet gelijk te zijn.

Interval schaal

Rangschikt mensen en objecten zoals een ordinale schaal, maar hierbij is de afstand tussen 2 categorieën gelijk. Een interval schaal heeft geen absoluut nulpunt.

Ratio schaal

Heeft de eigenschappen van een interval schaal, maar heeft ook een absoluut nulpunt. Dit nulpunt geeft aan dat het kenmerk dat gemeten wordt ook compleet afwezig kan zijn. Hierdoor kan de afstand tussen 2 scores ook geïnterpreteerd worden.

Distributie of verdeling

Een set van scores.

Central tendency

Een manier om verdelingen te beschrijven. Centraal wil zeggen dat de scores vaak gecentreerd zijn rondom een centraal punt.

Scheve verdeling

Wanneer de scores niet symmetrisch verdeeld zijn. Bij een positieve scheve verdeling zijn er relatief veel lage scores en relatief weinig hoge scores. Bij een negatieve scheve verdeling is dit precies andersom.

Gemiddelde

Het rekenkundige midden van een verdeling. Hiervoor wordt de som van de scores gedeeld door het aantal scores. Kan gebruikt worden bij interval en ratio schaal. Nadeel: wordt beïnvloed door extreme scores.

Mediaan

De (potentiele) score die de verdeling opdeelt in twee helften. Bij een even aantal scores wordt het gemiddelde genomen van de middelste 2 scores. Kan gebruikt worden bij ordinale, interval en ratio schaal en is niet gevoelig voor extreme scores.

Modus

De score die in een verdeling het meest voorkomt. Kan bij alle meetschalen gebruikt worden. Heeft teveel nadelen.

Variabiliteit

Een andere manier om verdelingen te beschrijven. Maakt duidelijk hoe de scores verdeeld zijn.

Bereik

De afstand tussen de laagste en de hoogste score in een verdeling.

Standaardafwijking

Een maat van de gemiddelde afstand tussen een score en het gemiddelde van de verdeling. Hoe groter de standaardafwijking, hoe meer de scores verschillen van het gemiddelde en hoe meer variabiliteit.

Variantie

Is een belangrijk theoretisch concept in de statistiek. Wordt nauwelijks gebruikt voor het interpreteren van individuele scores, omdat de gekwadrateerde meeteenheid lastig te interpreteren is.

Correlatiecoëfficiënt

Een kwantitatieve meting van de lineaire relatie tussen twee variabelen. Het is een getal tussen -1.0 en +1.0 en wordt weergegeven door de Pearson coëfficiënt r.

Coëfficiënt of determination

De hoeveelheid variantie die gedeeld wordt door twee variabelen. Ofwel: de hoeveelheid variantie van een variabele die verklaard kan worden door de relatie met de andere variabele. Wordt weergegeven door r2.

Spreidingsdiagram

Een grafiek die de relatie tussen twee variabelen weergeeft.

Pearson product-moment correlatie

Deze correlatiemaat kan gebruikt worden als variabelen op een interval of ratio schaal gemeten worden.

Spearman coëfficiënt

Wordt gebruikt wanneer de variabelen gemeten worden op een ordinale schaal.

Dichotome variabele

Een variabele die slechts uit twee waarden bestaat, zoals goed/fout.

Homogene steekproef

Een steekproef met een kleine variabiliteit.

Heterogene steekproef

Een steekproef met een grote variabiliteit, heeft een hogere correlatie dan een homogene steekproef.

Lineaire regressie

Een wiskundige procedure die je de mogelijkheid geeft om de waarden van een variabele te voorspellen aan de hand van informatie van een andere variabele.

Standaard schattingsfout

Geeft de gemiddelde schattingsfout tussen de regressielijn en de data weer.

 

Hoofdstuk 3

De betekenis van testscores

Ruwe score

Het aantal items van een participant dat op een bepaalde manier gescoord of gecodeerd is, zoals goed/fout, enz.

Normgerichte score

Hierbij worden de prestaties van iemand op een test vergeleken met de prestaties van anderen. Deze scores worden dus relatief geïnterpreteerd.

Criteriumgerichte score

Hierbij wordt de prestatie van iemand op test vergeleken met een specifiek niveau van prestaties. Deze scores worden dus vergeleken met een absolute standaard.

Normatieve data

Moet actueel zijn en de steekproeven moeten groot genoeg zijn om stabiele statistische informatie te produceren.

Standaardscores

Transformaties van ruwe scores in een gewenste schaal met van tevoren vastgesteld gemiddelde en standaardafwijking.

Lineaire transformaties

Standaardscores die berekend worden met lineaire transformaties behouden een directe relatie met de ruwe scores, de verdeling behoudt ook zijn oorspronkelijke vorm.

z-scores

De simpelste standaardscores, geven aan hoe ver boven of onder het gemiddelde van de verdeling een ruwe score is gelegen. Deze afstand wordt weergegeven door standaardafwijkingen.

T-scores

Hebben een gemiddelde van 50 en een standaardafwijking van 10. Alle scores zijn positief en hebben geen decimalen.

IQ-scores

Hebben een gemiddelde van 100 en een standaardafwijking van 15. Ook deze scores hebben geen negatieve waarden en geen decimalen.

CEEB scores

Hebben een gemiddelde van 500 en een standaardafwijking van 100. Worden gebruikt voor onder andere de Scholastic Assessment Test (SAT).

Genormaliseerde standaardscores

Standaardscores die gebaseerd zijn op onderliggende verdelingen die oorspronkelijk niet normaal verdeeld zijn, maar die zijn getransformeerd in normaalverdelingen. Hierdoor wordt de vorm van de verdeling veranderd.

Stanine scores

Stanine scores verdelen de verdeling in negen delen. Ze zijn niet erg precies. Stanines hebben een gemiddelde van 5 en een standaardafwijking van 2.

Wechsler geschaalde scores

Hebben een gemiddelde van 10 en standaardafwijking van 3. Deze scores is ontworpen zodat de subschalen van de Wechsler schaal vergeleken kunnen worden.

Normal curve equivalent (NCE)

Hebben een gemiddelde van 50 en een standaardafwijking van 21.06. Worden gebruikt om percentielen te benaderen en worden vooral gebruikt voor testen op educatief gebied.

Percentiel rank

Een van de populairste en gemakkelijkst te begrijpen manier om testscores te interpreteren en te rapporteren. Percentiel ranks geven het percentage individuen weer dat onder een bepaald punt in de verdeling scoort. Een percentiel rank van 80 wil dus zeggen dat 80% hieronder scoorde. Percentielen zijn niet overal op de verdeling even groot.

Graadequivalenten

Normgerichte scores die het academische niveau weergeven van een persoon (cijfer). Ze zijn heel populair, maar moeten heel voorzichtig geïnterpreteerd worden.

Mastery testing

Een criteriumgerichte score waarbij wordt bepaald of een persoon een bepaald niveau van kennis of bekwaamheid heeft behaald, vaak aan de hand van een geslaagd/gezakt systeem. Vb.: een rijexamen.

Item respons theorie (IRT)

Een moderne testtheorie die de testontwikkeling sterk beïnvloed heeft. Hiermee kunnen scores van latente kenmerken berekend worden die niet op een criteriumgerichte of normgerichte manier beoordeeld kunnen worden. Zie H7.

Latent kenmerk

Een eigenschap of kenmerk waarvan wordt aangenomen dat ze bestaan, maar die niet rechtstreeks gemeten kunnen worden, zoals intelligentie.

 

Hoofdstuk 4

Betrouwbaarheid

Betrouwbaarheid

De consistentie en stabiliteit van de assessment resultaten. Betrouwbaarheid is een kenmerk van de scores op een test, niet van de test zelf. Kan ook gedefinieerd worden als het gedeelte testscorevariantie dat het gevolg is van verschillen in de ware scores. De betrouwbaarheid kan het gemakkelijkst vergroot worden door het aantal items van een test te vergroten.

Meetfout

In elke vorm van meten is wel een meetfout aanwezig. Meetfouten beperken de generaliseerbaarheid van testscores en verminderen het vertrouwen in testresultaten.

Klassieke testtheorie (CTT)

Volgens deze theorie bestaat elke score uit twee onderdelen: de ware score (T) en de errorscore (E).

Content sampling error

Is meestal de grootste bron van error in testscores. Wordt bepaald door of er een goede steekproef wordt getrokken uit het domein.

Time sampling error

Deze vorm van error geeft de willekeurige verschillen in prestaties van de ene naar de andere situatie weer en beperkt de generaliseerbaarheid van testscores.

Test-hertestbetrouwbaarheid

Dezelfde groep personen krijgen dezelfde test op verschillende tijdstippen. Vooral gevoelig voor time sampling error, geeft de stabiliteit van scores over tijd weer. Een nadeel is het carryover effect van het ene meetmoment naar het andere meetmoment.

Paralleltestbetrouwbaarheid

Hierbij worden bij eenzelfde groep gelijktijdig of op verschillende tijdstippen twee tests afgenomen met een parallelle moeilijkheidsgraad. Wanneer de tests gelijktijdig afgenomen worden, zijn ze vooral gevoelig voor content sampling error, anders ook voor time sampling error.

Split-half betrouwbaarheid

De betrouwbaarheid wordt hier berekend met 1 testafname en is daarom vooral gevoelig voor content sampling error. De relatie tussen testitems wordt bekeken. Na afname wordt de test in 2 delen gesplitst en worden de scores van de ene helft gecorreleerd met de scores op de andere helft. Hiervoor wordt de Spearman-Brown formule gebruikt.

Kuder-Richardson formule 20

Wordt gebruikt bij dichotome variabelen.

Coëfficiënt alfa

Werd ontwikkeld door Cronbach en wordt veel gebruikt voor het berekenen van interne consequentheid.

Tussenbeoordelaarsbetrouwbaarheid

Als het scoren van een test afhankelijk is van subjectieve beoordeling, is het belangrijk om de mate van overeenstemming tussen beoordelaars te beoordelen.

Samengestelde scores

De betrouwbaarheid van samengestelde scores is groter dan de betrouwbaarheid van de afzonderlijke metingen.

Verschilscores

De betrouwbaarheid van verschilscores is kleiner dan de betrouwbaarheid van de afzonderlijke metingen. Als de originele metingen een hoge betrouwbaarheid hebben en een lage onderlinge correlatie, is de verschilscore vaak hoger.

Correctie voor attenuatie

Wanneer scores gecorreleerd worden, kunnen statistici corrigeren voor de onbetrouwbaarheid van de scores.

Standaardschattingsfout (SEM)

Wordt gebruikt bij het interpreteren van testscores van individuen. De SEM is de standaardafwijking van de verdeling van de errorscores.

Betrouwbaarheidsinterval

Geeft het bereik van scores weer waarbinnen de ware score van een persoon met een vooraf vastgestelde betrouwbaarheid valt. Om dit te berekenen wordt vaak de SEM gebruikt. Helpt ons herinneren dat scores voorzichtig geïnterpreteerd moeten worden.

Generaliseerbaarheidstheorie

Een uitbreiding van de CCT, geeft behalve error als gevolg van domein sampling nog veel meer vormen van error weer. Het voordeel is dat wetenschappers onderzoeken kunnen ontwerpen die onthullen hoeveel variantie geassocieerd wordt met de verschillende bronnen van error.

Test informatie functie (TIF)

Geeft de betrouwbaarheid van metingen op verschillende punten van de verdeling weer en wordt verkregen door de IRT.

 

Hoofdstuk 5

Validiteit

Validiteit

De nauwkeurigheid van de interpretatie van testscores. Valide interpretaties zorgen voor betere beslissingen. Validiteit is een doel dat constant in beweging is. Betrouwbaarheid is een noodzakelijke, maar onvoldoende voorwaarde voor validiteit.

Construct onder representatie

Ontstaat wanneer een test belangrijke aspecten van een bepaald construct niet meet. De test meet minder dan hij zou moeten meten.

Constructirrelevante spreiding

Ontstaat wanneer een test kenmerken of vaardigheden meet die niet gerelateerd zijn aan het construct van de test. De test meet meer dan hij zou moeten meten.

Inhoudsvaliditeit

Mate waarin het inhoudsdomein wordt gerepresenteerd door de items van de test. Hierbij hoeft de test niet worden afgenomen, de test wordt beoordeeld door professionals.

Criteriumvaliditeit

Of een test een kenmerk in het heden, verleden of de toekomst kan voorspellen. Onderzoekt de relaties tussen de test en externe variabelen. Hierbij wordt vaak gebruik gemaakt van correlaties of regressieanalyse.

Constructvaliditeit

De mate waarin testscores samenhangen met variabelen die het construct zoals verwacht beïnvloedt en met variabelen die zoals verwacht van invloed zijn op het construct.

Bewijs gebaseerd op testinhoud

Voor het beoordelen van de validiteit wordt hierbij gekeken naar de inhoud (thema’s, items etc.) van de test gekeken.

Itemrelevantie

Experts beoordelen of elk item afzonderlijk belangrijk is voor het testen van het construct in een specifiek domein.

Inhoudsrelevantie

Hierbij wordt door de experts gekeken in welke mate de items het specifieke domein weergeven/representeren.

Face validiteit

Is geen technische vorm van validiteit, maar verwijst naar of een test lijkt te meten wat het hoort te meten. Hierbij gaat het alleen om de verschijning van de test. Bij een goede face validiteit zijn participanten gemotiveerder.

Testcriteriumbewijs

Hierbij wordt de prestatie van een participant vergeleken met een criterium.

Voorspellend onderzoek

Hierbij wordt eerst de test afgenomen, dan is er een tijdsinterval en dan wordt het criterium gemeten.

Concurrent onderzoek

Hierbij vindt het meten van het criterium tegelijkertijd plaats met het afnemen van de test. Er is dus geen tijdsinterval.

Validiteitscoëfficiënt

Bij het meten van de validiteit wordt een validiteitscoëfficiënt verkregen. Er is geen algemene regel voor hoe groot de coëfficiënt moet zijn, dit verschilt namelijk per meting.

Standaardschattingsfout

De hoeveelheid voorspellingserror die het gevolg is van de niet perfecte validiteit van de interpretatie van een testscore.

Beslissingstheoriemodellen

Helpen de testgebruiker bij het bepalen van hoe veel informatie een voorspellingstest kan geven als er classificatiebeslissingen moeten worden genomen.

Convergent validiteitsbewijs

Wordt verkregen wanneer een test wordt gecorreleerd met bestaande tests die hetzelfde of een gelijkend construct meten.

Divergent validiteitsbewijs

Wordt verkregen wanneer een test wordt gecorreleerd met bestaande tests die een niet-gelijkend construct meten.

Multitrek-multimethode matrix

Een validiteitstechniek die convergente en divergente strategieën combineert.

Factoranalyse

Een manier om de aanwezigheid van en structuur van latente constructen in een set variabelen te evalueren, door nieuwe variabelen te genereren die lager in aantal zijn dan de oorspronkelijke variabelen.

Bevestigende factoranalyse

De onderzoeker verwacht een bepaalde factorstructuur en onderzoekt de data om te kijken of die aan zijn verwachtingen voldoen.

Validiteitsargument

Het integreren van verschillende validiteitsbewijzen in een samenhangend verslag.

 

 

 

 

Hoofdstuk 6

Itemontwikkeling

Objectieve items

Bij dergelijke items zijn onderzoekers samen tot de beslissing gekomen wat het correcte antwoord op een item is. Vb.: meerkeuze.

Subjectieve items

Hierbij is er minder overeenstemming tussen verschillende onderzoekers. Vb.: de beoordeling op een mondeling examen.

Geselecteerd responsitem

Een item waarbij een testdeelnemer een antwoord moet kiezen uit de beschikbare alternatieven. Vb.: goed-fout vragen of meerkeuzevragen. Hierbij kan een testdeelnemer in korte tijd veel vragen beantwoorden. De vragen zijn wel moeilijk te maken.

Geconstrueerd responsitem

Wanneer een testdeelnemer zelf een antwoord kan samenstellen. Deze items kunnen makkelijker ontwikkeld worden, maar de afname duurt langer en de scoring is subjectiever.

Meerkeuzetests

Zijn de populairste geselecteerde responsitems, omdat ze op veel verschillende gebieden gebruikt kunnen worden en zowel simpele als complexe onderwerpen kunnen behandelen.

Goed-fout items

Ook een vorm van geselecteerde responsitems. Zijn ook heel populair, maar gevoeliger voor gokken dan meerkeuzetests.

Matchende items

Een andere vorm van geselecteerde responsitems. De testdeelnemer moet bepaalde stellingen combineren met een antwoord. Om gokken te voorkomen is het beter om meer antwoorden te geven dan er nodig zijn.

Essay item

Een testitem dat aan de testdeelnemer een vraag stelt of een probleem voorlegt waar de testdeelnemer een open antwoord op moet geven.

Beperkte respons items

Hierbij moet de testdeelnemer iets beschrijven of definiëren. Deze items zijn vaak heel gestructureerd.

Uitgebreide respons items

Hierbij heeft de testdeelnemer meer vrijheid om de vraag te interpreteren.

Likert items

De populairste vorm om gedrag te beoordelen. Bij deze beoordelingsschaal moet een testdeelnemer aangeven in hoeverre hij/zij overeenstemt met de vooronderstelling.

 

 

 

 

Hoofdstuk 7

Itemanalyse

Itemanalyse

Bij itemanalyse wordt er gekeken naar de kwaliteit van afzonderlijke items, niet naar de totale test. De kwaliteit en de kwantiteit van de items bepalen de betrouwbaarheid en de validiteit van een test. Itemanalyse kan gebruikt worden om minder geschikte items te verwijderen en andere items te verbeteren.

Itemmoeilijkheid

Het percentage testdeelnemers dat het item goed beantwoord heeft. Wordt weergegeven als p.

Optimaal itemmoeilijkheidsniveau

Het optimale itemmoeilijkheidsniveau is 0.50, wat wil zeggen dat 50% het item goed beantwoord heeft en 50% het foute antwoord gaf. Dit gaat echter niet altijd op.

Percent endorsement statistic

Geeft het percentage testdeelnemers weer dat op een bepaalde manier op een item geantwoord heeft.

Itemdiscriminatie

Verwijst naar hoe goed een item onderscheid kan maken tussen testdeelnemers die verschillen op het construct dat gemeten wordt.

Discriminatie index

Wordt weergeven door D, geeft het verschil in prestatie tussen twee groepen. Een item met een D-waarde van boven de 0.30 is acceptabel, items met een D-waarde lager dan 0.30 moeten herzien of verwijderd worden.

Itemdiscriminatie in mastery testing

Hiervoor zijn verschillende mogelijkheden. De test kan worden afgenomen bij een groep die instructies heeft gehad en een groep die geen instructies heeft gehad. Ook kan de test 2 keer worden afgenomen, voor de instructie en na de instructie.

Item-totaal correlatie

Itemdiscriminatie kan ook onderzocht worden door de prestaties op een item te correleren met de totale testscore.

Afleideranalyse

Geeft de mogelijkheid om te onderzoeken hoeveel testdeelnemers in de top- en de bodemgroepen iedere optie op een meerkeuze item gekozen hebben.

Afleider

Een afleider is een alternatief antwoord op een meerkeuze item dat de testdeelnemer afleidt van het goede antwoord. De selectie van afleiders heeft invloed op de itemmoeilijkheid en de itemdiscriminatie.

Kwalitatieve itemanalyse

Testontwikkelaars kunnen kwalitatieve itemanalyse gebruiken om hun testen te verbeteren. Ze kunnen bijvoorbeeld een paar dagen afstand nemen van de test en daarna de test herzien. Ook kan een collega de test beoordelen.

Item respons theorie (IRT)

De IRT stelt dat antwoorden op een item gegrond zijn op latente kenmerken. Centraal binnen de IRT is een wiskundig model dat beschrijft hoe testdeelnemers van verschillende vaardighedenniveaus zullen reageren op individuele testitems.

Item karakteristieke curve (ICC)

Een grafiek die informatie geeft over de itemmoeilijkheid en de itemdiscriminatie. Op de horizontale as staat de vaardigheid, op de verticale as de waarschijnlijkheid van een goed antwoord.

Rasch model

Het simpelste IRT model, ook wel één-parameter model genoemd. Stelt dat alle items dezelfde discriminatie hebben en alleen door de moeilijkheidsgraad verschillen.

Twee-parameter model

Dit model stelt dat items op zowel discriminatie als itemmoeilijkheid van elkaar verschillen. Dit is een betere weergave van testontwikkeling.

Drie-parameter model

Stelt dat een testdeelnemer zelfs zonder de geschikte vaardigheden het item goed kan beantwoorden, door toeval. Dit gebeurt vaak bij meerkeuze items.

Invariantie van itemparameters

Parameters van de IRT zijn steekproef-onafhankelijk. Dat wil zeggen dat je hetzelfde resultaat zou moeten krijgen wanneer je verschillende steekproeven gebruikt.

 

Hoofdstuk 8

Prestatietests

Prestatietest

Ontworpen om de kennis of vaardigheden van een student te meten in een domein waarin hij/zij instructies ontvangen heeft.

Groepsafname prestatietests

Worden afgenomen bij meer dan 1 participant per keer. Het belangrijkste voordeel is dat ze een efficiënte manier zijn om informatie te verzamelen over de prestaties van studenten. Het kost minder tijd, de testcondities zijn hetzelfde en de beoordelingen zijn objectiever. Nadeel is dat er geen persoonlijke interactie is en een lage flexibiliteit.

Testvoorbereidingsmanieren

Manieren die gebruikt worden om instructies te geven aan studenten over hoe zij een test moeten maken. Goede methoden zijn het aanleren van algemene testvaardigheden en het gebruiken van meerdere instructiemethoden.

Teaching to the test

De brede definitie hiervan is: iedere instructie die bedoeld is om beter te presteren op een gestandaardiseerde prestatietest. Vaak wordt het echter gezien als verkeerde voorbereidingsmethoden.

Individuele prestatietests

Worden vaak gebruikt bij participanten met speciale behoeftes. Deze tests geven vaak een grondigere beoordeling van de vaardigheden van een persoon.

 

Hoofdstuk 9

Het meten van intelligentie

Aptitudetest

Ontworpen om de cognitieve vaardigheden en kennis te meten die zijn ontstaan door levenservaringen. Vb.: Intelligentietests.

Intelligentie

De meeste definities noemen vaardigheden zoals probleem oplossen, abstract redeneren en het vermogen om kennis te vergaren.

Binet-Simon schaal

Werd ontwikkeld in 1905. De nadruk lag op verbale items, waarmee begrip, redenering en korte-termijn geheugen werd gemeten.

Stanford-Binet Intelligentie Schaal

De herziene versie van de Binet-Simon schaal die tegenwoordig nog steeds wordt gebruikt. In deze schaal wordt intelligentie op ordinaal niveau gemeten.

Scholastic Assessment Test (SAT)

Deze test geeft objectieve criteria voor het toelaten van studenten tot scholen.

Wechsler schaal

Een intelligentietest die zowel verbale als non-verbale vaardigheden meet op interval niveau.

Discrepantie tussen aptitude en prestatie

Het analyseren van de discrepantie tussen aptitude en prestatie wordt op scholen en klinische settingen vaak gebruikt om leerstoornissen te ontdekken. Hierbij worden de prestaties van een persoon op een prestatietest vergeleken met de prestaties op een aptitude test.

Response to intervention

Een manier om leerproblemen te meten. Nadat de studenten een algemene instructie hebben gehad van hun leraar over hun test, wordt hun voortgang gevolgd. Studenten die niet reageren hierop krijgen andere taken. Dan wordt weer hun voortgang gevolgd. Degenen die hierop weer niet reageren komen in aanmerking voor speciaal onderwijs.

Milde mentale retardatie

Een IQ van tussen de 55 en 70, deze vorm van retardatie wordt vaak pas ontdekt als het kind naar school gaat.

Zware mentale retardatie

Een kind met een IQ van 55 of lager, dit wordt vaak al gediagnosticeerd voor de leeftijd van 5 jaar.

College Admission Test

Zijn speciaal ontworpen om academische prestaties van een persoon te voorspellen. Een voorbeeld is de SAT.

Wechsler Intelligentie Schaal voor Kinderen – 4e editie (WISC-IV)

De populairste individuele intelligentietest die gebruikt wordt op school en klinische settings. Het neemt 2 tot 3 uur in beslag op de WISC-IV af te nemen. De test is geschikt voor kinderen van 6 tot 16. Uiteindelijk geeft de test 4 indexscores: Verbal Comprehension Index, Perceptual Reasoning Index, Working Memory Index en Processing Speed Index.

Stanford-Binet Intelligentie Schaal – 5e editie

De SB5 wordt ook vaak gebruikt voor het meten van intelligentie. De SB5 kan gebruikt worden voor de leeftijd van 2 tot 85. Een voordeel is de Expanded IQ schaal, waarmee IQ’s hoger dan 160 berekend kunnen worden. De 5 indexen zijn: Fluid Reasoning, Knowledge, Quantitative Reasoning, Visual-Spatial Processing en Working Memory.

Woodcock-Johnson III Tests of Cognitive Abilities (WJ III COG)

De WJ III COG kan worden afgenomen bij de leeftijd van 2 tot 90 jaar. Gebaseerd op de vloeiende en gekristalliseerde intelligentie theorie van Cattell, Horn en Carroll.

Reynolds Intellectual Assessment Scales (RIAS)

Een vrij nieuwe test die gebruikt kan worden bij participanten van 3 tot 94 jaar. Het grote voordeel is dat de RIAS een betrouwbare, valide meting geeft van intellectuele vaardigheden op verbaal en non-verbaal gebied in een tijdsbestek van 20 tot 25 minuten.

 

Hoofdstuk 10

Het meten van persoonlijkheid

Persoonlijkheid

Werd door Gray gedefinieerd als het relatief consistente patroon van gedachten, gevoelens en gedrag dat een persoon als een uniek individu karakteriseert.

Respons-sets en dissimilatie

Testresponses die de ware kenmerken van een persoon verkeerd weergeven. Bij een respons-set antwoordt een persoon onbewust negatief of positief op vragen. Bij dissimilatie doet een persoon zich met opzet anders voor dan hij is.

Validiteitsschalen

Hebben verschillende vormen, maar zij zijn allemaal ontworpen om personen op te sporen die niet nauwkeurig geantwoord hebben.

Persoonlijkheidskenmerk

Een stabiel, intern kenmerk dat zich uit doordat een persoon de neiging heeft om zich op een bepaalde manier te gedragen.

Persoonlijkheidstoestand

Tijdelijke emotionele staat die varieert over tijd.

Objectieve zelfrapportage metingen

Hierbij beoordeelt een persoon geselecteerde respons items om zijn kenmerken met betrekking tot gedachten, gevoelens en gedrag weer te geven.

Projectieve technieken

Een persoon krijgt een ongestructureerde of ambigue stimulus aangeboden en moet daarop reageren. Er is een bijna oneindige reeks antwoorden mogelijk.

Apperceptie tests

Bij deze techniek krijgt de testdeelnemer een plaatje te zien waarbij hij of zij een verhaal moet bedenken. Ook hiervoor is maar weinig empirische ondersteuning.

Thematic Apperception Test (TAT)

De populairste apperceptie test.

Rorschach inktvlektest

Een test waarbij onduidelijke/ambigue inktvlekken geïnterpreteerd moeten worden.

 

Hoofdstuk 11

Gedragsdiagnostiek

Gedragsdiagnostiek

Centraal staat wat een persoon doet. Er wordt gekeken naar de typische respons van een persoon in een bepaalde situatie. Het karakter, de attributies van een persoon etc. staan centraal.

Gedragsinterview

Hierin focust de clinicus zich op de antecedenten en de consequenties van het gedrag, op de pogingen die zijn ondernomen om het gedrag te veranderen en wordt er gekeken naar hoe het gedrag bekrachtigd wordt.

Gedragsbeoordelingsschaal

Wordt vooral gebruikt bij kinderen en adolescenten. Hierbij wordt een persoon (door een ouder of leerkracht) beoordeeld op verschillende domeinen. Kan toekomstig gedrag en leerproblemen voorspellen, gedragsveranderingen opsporen en voorspellen welke interventies zullen werken.

Behavioral Assessment System for Children – Tweede editie (BASC-2)

Kan gebruikt worden voor de leeftijd van 2 tot 21 jaar. Bestaat uit een Teacher Rating Scale (TRS), een Parent Rating Scale (PRS), zelfrapportage, een klassikaal observatiesysteem, een Parenting Relationschap Questionnaire en een gestructureerde ontwikkelingsstoornis.

Teacher Rating Scale (TRS)

Meet het schoolgerelateerde gedrag van een kind. Meet zowel positief als negatief gedrag en bevat validiteitsschalen.

Parent Rating Scale (PRS)

Geeft het gedrag van het kind thuis en in de samenleving weer. Heeft dezelfde kenmerken als de TRS. De TRS en de PRS zijn de meest gebruikte gedragsbeoordelingsschalen.

Achenbach System of Empirically Based Assessment (ASEBA)

Bestaat uit de Child Behavior Checklist (CBCL), de Teacher Report Form (TRF), zelfrapportage en een direct observatiesysteem. Er is een vorm van de CBCL voor kinderen van 2 en 3 jaar en een vorm voor kinderen van 4 tot 18 jaar. De TRF kan gebruikt worden voor kinderen van 5-18 jaar.

Omnibus beoordelingsschalen

Meten een groot bereik aan symptomen en gedragingen die geassocieerd worden met verschillende emotionele- en gedragsstoornissen. Een ideale omnibus beoordelingsschaal meet zowel internaliserende als externaliserende stoornissen.

Enkel-domein beoordelingsschalen

Geven een grondigere meting van een specifieke stoornis of het domein waarop ze zijn gericht.

Childhood Autism Rating Scale (CARS)

Bestaat uit 15 items en kan gebruikt worden om autisme te meten bij kinderen vanaf 2 jaar.

BASC Monitor for ADHD

Bestaat uit 2 schalen van 45 items, één voor ouders en één voor leerkrachten. Kan gebruikt worden voor kinderen van 4 tot 18 jaar. Het doel is de behandeling van ADHD makkelijker te maken.

Pediatric Behavior Rating Scale (PBRS)

Bestaat uit 2 schalen, één met 95 items voor leerkrachten en één met 102 items voor ouders. Kan gebruikt worden voor kinderen van 3 tot 18 jaar en is bedoeld om de vroege symptomen van een bipolaire stoornis te identificeren en onderscheid te maken van andere stoornissen.

Beoordelingsschalen voor adaptief gedrag

Er zijn speciale enkel-domein beoordelingsschalen voor adaptief gedrag. Adaptief gedrag bestaat uit conceptuele vaardigheden, praktische vaardigheden en sociale vaardigheden. Het meten van adaptief gedrag is vooral belangrijk bij personen met een ontwikkelings- en intellectuele afwijkingen.

Directe observatie

De oudste methode van gedragsdiagnostiek, wordt nog steeds gebruikt. Een persoon wordt in zijn natuurlijke omgeving (bijv. school) geobserveerd. De persoon weet niet altijd dat hij geobserveerd wordt. Lastig is dat observatie zorgt voor gedragsverandering en dat de beoordeling van de observator afhangt.

Student Observation System (SOS)

Het meest gebruikte en populairste systeem voor directe observatie. Het is een onderdeel van de BASC-2, meet 14 gedragsdomeinen en wordt vooral voor educatie doelen gebruikt.

Continue prestatietests (CPT’s)

Een speciaal type van gedragsdiagnostiek die oorspronkelijk ontwikkeld zijn om oplettendheid, aandacht en executieve controle te meten. Wordt afgenomen met een computer. De testdeelnemer moet op specifieke stimuli reageren en andere stimuli negeren.

Psychofysiologische diagnostiek

Een type gedragsdiagnostiek waarbij fysieke veranderingen in het lichaam tijdens een bepaalde gebeurtenis worden gemeten. Vb.: de leugendetector.

 

 

 

 

Hoofdstuk 12

Beroepentest

Industrieel organisatorische (I-O) psychologie

Werd al rond 1900 gebruikt om vaardigheden te meten die nodig waren voor het uitvoeren van een bepaalde baan. Vooral de Eerste Wereldoorlog had een grote invloed op de groei van de I-O psychologie.

Personeelsselectie tests

Zijn bedoeld om mensen in te huren die succesvol zullen zijn in hun werk. Het doel is om voor organisaties geld te besparen door de juiste personen in te huren.

Cognitieve vaardigheidstests

Cognitieve vaardigheden zijn een goede voorspeller van werkprestaties. Deze tests geven een beoordeling van onder andere redeneren, verbale en wiskundige vermogens, perceptie en probleemoplossen.

Sollicitatiegesprek

Eén van de meest gebruikte methoden om sollicitanten te beoordelen. Er wordt een gestructureerde of een ongestructureerde benadering gebruikt. De betrouwbaarheid en validiteit van een sollicitatiegesprek is nog onduidelijk.

Ongestructureerde benadering

Hierbij past de interviewer de vragen aan de sollicitant aan of op de inhoud van het gesprek zelf. De resultaten hierop zijn subjectief.

Gestructureerde benadering

De vragen worden voorafgaand aan het gesprek opgesteld. Alle sollicitanten krijgen dezelfde vragen.

Persoonlijkheidstests

Worden ook gebruikt om geschikte personen voor een baan te selecteren. Meestal wordt hierbij gebruik gemaakt van zelfrapportage. Persoonlijkheidstests blijken een goede voorspeller te zijn van werkprestatie.

Hogan Personality Inventory –Revised (HPI-R)

Een niet-klinische persoonlijkheidstest die veel in werkomgevingen wordt gebruikt. Is gebaseerd op het vijf-factorenmodel. Bestaat uit 206 juist-onjuist items. Er worden 7 zaken gemeten: Aanpassing, Ambitie, Sociale vaardigheid, Interpersoonlijke sensitiviteit, Voorzichtigheid, Creativiteit en Leerbenadering.

Integriteitstests

Zelfrapportage tests die meten of iemand geneigd is om wel of niet eerlijk te zijn.

Open integriteitstests

Bestaan uit vragen met betrekking tot algemene overtuigingen en attitudes ten opzichte van diefstal en overtredingen.

Persoonlijkheidsgeoriënteerde integriteitstests

Focussen zich vooral op persoonlijkheidskenmerken die gerelateerd kunnen zijn aan diefstal, zoals nauwkeurigheid en het zoeken van sensatie.

Assessment center

Een samenstelling van taken of oefeningen die ontworpen zijn om verschillende werkomgevingen te simuleren. Vb.: rollenspel.

Work sample tests

Ook wel prestatie gebaseerde tests of simulaties geheten. Bij work sample tests moeten sollicitanten taken uitvoeren die gerelateerd zijn aan de baan waarop ze solliciteren. Deze tests worden gezien als de meest effectieve methode om toekomstige werkprestaties te voorspellen en hebben een hoge face validiteit.

Biografische data

Persoonlijke ervaringen en achtergrond van de persoon die solliciteert. Kan verzameld worden d.m.v. gestructureerde interviews of zelfrapportage.

Baananalyse

Het proces waarbij een baan gedefinieerd wordt. Er moet een duidelijk beeld bestaan van de kennis, vaardigheden en bekwaamheid die nodig zijn om de baan succesvol uit te voeren.

Criteriumprobleem

De moeilijkheid om prestatiecriteria te conceptualiseren en te meten die multidimensionaal en afhankelijk van bepaalde organisaties of situaties zijn.

Prestatiebeoordelingen

De 4 belangrijkste bronnen voor prestatiebeoordelingen zijn: een supervisor, een gelijke (collega), een ondergeschikte en iemand zelf. Vaak wordt de beoordeling van een supervisor/baas gebruikt, omdat die verantwoordelijk is voor zijn werknemers.

Relatieve beoordelingsmethoden

Het vergelijken van de prestaties van de beoordeelde met de prestaties van andere personen die hetzelfde werk uitvoeren.

Absolute beoordelingsmethoden

Het vergelijken van het gedrag van een werknemer met een vastgestelde standaard.

Strong Interest Inventory – Revised Edition (SII-R)

Een van de bekendste carrièretests. Kan gebruikt worden voor middelbare scholieren en volwassenen.

Career Decision-Making System – Revised (CDM-R)

Meet interesses. Na het invullen van de test krijgen de testdeelnemers een aantal beroepen die overeenkomen met hun interesses.

Self-Directed Search (SDS)

Een interessetest die kan worden afgenomen door een coach of die men zelf kan invullen. Geeft een beschrijving van de congruentie tussen iemands persoonlijkheidstype en verschillende beroepssectoren.

 

 

 

 

Hoofdstuk 13

Neuropsychologische diagnostiek

Klinische neuropsychologie

De toepassing van de kennis die verkregen wordt door het bestuderen van de relatie tussen hersenen en gedrag op patiëntenzorg.

Neuropsychologische diagnostiek

Het toepassen van een aantal gestandaardiseerde procedures om de relatie tussen hersenfuncties en getoond gedrag te meten.

Neuropsychologische tests

De belangrijkste basis hiervoor is de aanname dat gedrag een organische basis heeft en dat de prestaties op gedragsmetingen dus gebruikt kunnen worden om het functioneren van de hersenen te beoordelen.

Halstead-Reitan Neuropsychologische testbatterij (HRNB)

Meet de belangrijkste correlaties tussen gedrag en de hersenen. De HRNB heeft de meeste empirische steun en wordt ook het meest gebruikt in klinische setting. De HRNB bestaat uit 6 categorieën: input, aandacht, concentratie en geheugen, verbale vermogens, ruimtelijke vermogens, abstract redeneren en logische analyse en output.

Luria-Nebraska Neuropsychologische Batterij voor volwassenen (LNNB)

Is ontwerpen om cognitieve gebreken te diagnosticeren en geeft ook informatie over problemen in het centrale zenuwstelsel. De LNNB wordt na de HRNB het meest gebruikt. De test kan bij kinderen vanaf 12 jaar afgenomen worden.

Boston Process Approach (BPA)

De BPA is een flexibele batterij die bestaat uit ontwikkelings- en psychologische testen. Hierdoor de neuropsycholoog de assessment kan toepassen op het probleem en de geteste. Een nadeel is dat er nog niet zoveel onderzoek is gedaan naar de BPA.

Geheugendiagnostiek

Geheugenproblemen komen in bijna alle cognitieve stoornissen voor, daarom neemt geheugendiagnostiek een belangrijke plaats in, hoewel een recent fenomeen is.

Wide Range Assessment of Memory and Learning (WRAML)

Werd in 1990 ontwikkeld voor kinderen tussen 5 en 17 jaar oud. De 9 subtesten kunnen samengevoegd worden tot de drie schalen: Verbaal geheugen, Visueel geheugen en Leren.

Test of Memory and Learning 2 (TOMAL-2)

Werd in 2007 ontwikkeld en kan zowel kinderen en adolescenten als volwassenen testen. De TOMAL-2 is de uitvoerigste geheugentest en kan het beste gebruikt worden bij het meten van geheugenfuncties.

Referral

Ook wel verwijzing, hiermee begint het onderzoek naar hersenbeschadigingen, leervaardigheden, psychiatrische stoornissen, etc. Deze verwijzingen komen van verschillende bronnen, zoals neurologen en psychiaters of scholen.

Klinisch interview

In het klinische interview verkrijgt de neuropsycholoog informatie over verschillende onderdelen van het leven van de patiënt. Het stelt de neuropsycholoog in staat om cognitieve schade, behouden functies en prognoses te beoordelen.

Testselectie

De selectie van de tests wordt bepaald door het doel en de bedoeling van de assessment.

Normatieve benadering

Bij de normatieve benadering vergelijken neuropsychologen de huidige prestaties van een patiënt met een normatieve standaard. Ruwe scores worden daarom vaak omgezet in z-scores of T-scores.

Idiografische benadering

Bij de idiografische benadering gebruikt de neuropsycholoog eerdere scores of schattingen van de premorbide vaardigheden om de huidige scores mee te vergelijken.

Premorbide vaardigheden

De cognitieve staat van een persoon voorafgaand aan het letsel of de ziekte.

Demografische schatting

Een methode om premorbide vaardigheden te schatten op basis van de demografische gegevens van een patiënt. Hierbij is een grote mate van error aanwezig.

Pathogonomische tekens

Een bepaald teken dat duidt op hersenbeschadiging of disfunctioneren. Een voorbeeld is een architect die geen goede kopie van een complex figuur meer kan tekenen.

 

 

 

 

Hoofdstuk 14

Forensische toepassingen van psychologische diagnostiek

Forensische psychologie

De toepassing van psychologie op het begrijpen van de wet en de toepassen van psychologische principes op rechtsvervolgingen.

Getuige-deskundige (expert witness)

Een persoon die de nodige kennis en expertise bezit om de rechter of de jury te assisteren bij het begrijpen van bepaalde belangrijke zaken voor de rechtszaak begint.

Getuige

Een persoon met persoonlijke kennis van feiten van een zaak.

Trier of fact

De entiteit die bij een rechtszaak de uiteindelijke beslissing neemt (vaak een rechter of de jury).

Forensische diagnostiek

Het doel is het verkrijgen van objectieve data en onbevooroordeelde meningen en het assisteren van de rechtbank bij het voorbereiden van de zaak. Deelname aan forensische diagnostiek is vaak niet vrijwillig.

Ontoerekeningsvatbaarheid

Een van de bekendste en de meest controversiële forensische gebieden waarin psychologische tests worden toegepast. Het komt er op neer dat de rechter beslist dat de aangeklaagde een mentale stoornis heeft waardoor hij niet wist dat zijn criminele gedrag verkeerd was.

Competentie om terecht te staan

Een van de meest voorkomende situaties waarin een psycholoog een rechter assisteert. De psycholoog moet dan bepalen of de aangeklaagde een mentale ziekte heeft en het proces daarom niet bij kan wonen omdat hij/zij het niet begrijpt.

Jeugdrechtbank

Als een jongere een daad begaat die bij een volwassene als misdaad wordt gezien, gaat hij/zij naar de jeugdrechtbank. Psychologische tests worden bij deze jongeren veel toegepast.

Verzachtende omstandigheden

Als de levensomstandigheden van de aangeklaagde dusdanig zijn dat zijn of haar morele waarden verminderd waren toen hij of zij het misdrijf beging.

Burgerzaken

In burgerzaken worden psychologische testen nog vaker gebruikt dan in criminele zaken. Deze testen worden dan vaak ook in klinische setting afgenomen.

Rechtszaak over persoonlijke schade

Een poging om de schade te herstellen die een persoon geleden heeft door een verantwoordelijke partij.

Voogdijzaken

De rechtbank wijst de voogdij toe aan de partij die het meest in het belang is van de kinderen. Hierbij kan ook gebruik gemaakt worden van psychologische tests.

Observatie door de derde partij

Soms zijn advocaten aanwezig als hun cliënt een psychologische test ondergaat, om de rechten van hun cliënt te beschermen. Dit kan de testresultaten beïnvloeden door verminderde prestatie door afleiding.

Simulatie

Het verkeerd presenteren van een verwonding of een beperking, als de beklaagde zich anders voordoet dan hij is.

Toelaatbaarheid van getuigenis

Bepaalt of de getuigenis van een expert logisch en betrouwbaar is. Het hierbij om de methode die de expert gebruikt heeft, of die valide en geloofwaardig is.

 

Hoofdstuk 15

Het probleem van bias in psychologische diagnostiek

Culturele test bias hypothese (CTBH)

Stelt dat verschillen in gemiddelde testscores tussen etnische groepen of de verschillende seksen het gevolg zijn van beperkingen van de test of het meetproces en niet de echte verschillen tussen groepen op het construct dat gemeten wordt.

Bias

In termen van tests en meten is bias iets systematisch dat het meten van een construct of het voorspellen aan de hand van testscores verstoort.

Onderscheidende validiteit

Tests meten constructen beter en maken meer valide voorspellingen van de groepen op wie de tests hoofdzakelijk zijn gebaseerd dan van andere (minderheids)groepen.

Culturele lading

De mate van culturele specificiteit die aanwezig is in een test of in items van een test.

Mean difference definitie van test bias

Sommige onderzoekers stellen dat verschillen tussen gemiddelden van verschillende groepen direct aangeven dat de test een vorm van bias heeft. Dit wordt echter door de meeste onderzoekers verworpen.

Egalitaire denkfout

Jensen stelde dat alle menselijke populaties in feite identiek zijn op alle mentale kenmerken en vaardigheden. Verschillen geven aan dat de test een bias heeft. Onderzoek heeft echter aangetoond dat dit niet zo is, omdat er te veel voorbeelden zijn van vaardigheden waarop mensen wel verschillen.

Inhoudsbias

De inhoud van een test kan ook een bias hebben. Dit komt echter niet zo veel voor en er kunnen geen algemene kenmerken vastgesteld worden door onderzoekers van items die een bias hebben.

 

 

 

 

Hoofdstuk 16

Aangepaste diagnostiek

Aangepaste diagnostiek

Het aanpassen van standaard diagnostische procedures, zodat de invloed van kenmerken van de testdeelnemer die niet relevant zijn voor het construct dat gemeten wordt, geminimaliseerd wordt. Het doel is dat iedere testdeelnemer de meest valide test heeft.

Standaard diagnostische procedures

Zijn niet geschikt voor een cliënt met een beperking wanneer de test vereist dat de testdeelnemer een vaardigheid gebruikt die beïnvloed wordt door de beperking en die niet relevant is voor het gemeten construct.

Wijzigingen van presentatievorm

Het wijzigen van het medium of de vorm die gebruikt wordt om de aanwijzingen, items of taken over te brengen aan de testdeelnemer. Vb.: het gebruik van braille bij iemand met verminderd zicht.

Wijzigingen van responsvorm

Zorgen ervoor dat testdeelnemers kunnen reageren op de test met hun voorkeursmanier van communiceren. Vb.: iemand antwoordt mondeling, omdat hij door een lichamelijke handicap niet kan schrijven.

Wijzigingen van tijd

De meest voorkomende aanpassing, waarbij de testdeelnemer meer tijd krijgt om de test af te leggen, er meer pauzes zijn of de test op verschillende dagen wordt afgenomen.

Wijziging van omstandigheden

Zorgt ervoor dat testdeelnemers zich in een omgeving bevinden die ervoor zorgt dat zij het best presteren. Vb.: aanpassen van licht.

Aangepaste apparaten

Apparaten die kunnen helpen bij de testafname bij mensen met een beperking.

Parallelle assessment

Het vervangen van de normale test door een test die speciaal ontwikkeld is voor mensen met een beperking. Het grootste nadeel is dat het soms moeilijk is om een even goede parallelle test te vinden.

Diagnostiek van mensen met een andere moedertaal

Wanneer er mensen getest worden die een andere moedertaal (dan het Engels) hebben, moet men er extra op letten dat de kennis en vaardigheden van de testdeelnemers getest worden en niet hun taalvaardigheid. 

Markering

Sommige psychologen gebruiken markeringen om aan te geven dat een resultaat voorkomt uit een testafname die niet gestandaardiseerd is. Voorstanders vinden dat dat benadrukt moet worden dat het niet gestandaardiseerd is. Tegenstanders stellen dat het zorgt voor stigmatisering.

 

 

 

 

Hoofdstuk 17

Wettelijke en ethische zaken

Fundamenteel recht testdeelnemers

Dat zij geëvalueerd worden aan de hand van testen die hoge professionele standaarden hebben en valide zijn voor de beoogde doelen.

Table of specifications (TOS)

In de TOS worden de inhoud en de vorm van de test gedefinieerd en direct gerelateerd aan het construct dat gemeten wordt.

Mental Measurements Yearbook (MMY)

Geeft beschrijvende informatie over de test. Ook is er informatie beschikbaar over validiteit, betrouwbaarheid en rapportage van gegevens.

Tests in Print (TIP)

Geeft informatie over bijna iedere test die gepubliceerd is. Aan de hand van de TIP kan de test gekozen die het geschiktst is om het construct te meten.

Informed consent

Meestal zijn psychologen ethisch en wettelijk verplicht om informed consent te verkrijgen voordat ze een test afnemen. Dit wil zeggen dat de testdeelnemers informatie krijgen over de kenmerken, interpretatie en het gebruik van de test.

Verwachtingseffecten

Testresultaten kunnen beïnvloed worden door de verwachtingen van degene die de test gaat beoordelen. Dit moet zoveel mogelijk vermeden worden.

Vertrouwelijkheid

De psycholoog (of een andere deskundige) is ervoor verantwoordelijk dat de testresultaten vertrouwelijk zijn en blijven. Alleen met toestemming van de geteste mogen de resultaten bekend gemaakt worden. Een uitzondering is een rechterlijk bevel.

Statistische benadering

Hierbij wordt de interpretatie van testresultaten gebaseerd op empirisch geteste relaties.

Klinische/impressionistische benadering

Hierbij gebruikt de clinicus persoonlijke oordelen en subjectieve processen om test informatie te beoordelen en beslissingen te nemen. Uit onderzoek is gebleken dat dit niet de juiste manier is.

 

 

 

 

Hoofdstuk 18

Het ontwikkelen van een psychologische test

Test conceptualisatie

De eerste fase waarin zoveel mogelijk informatie over het doel en het gebruik van de test verzameld wordt. Ook wordt verklaard waarom het maken van de test nodig is.

Conceptuele definitie

Verklaart het construct op een theoretisch en abstract niveau, met woorden die heel interpretatief zijn.

Operationele definitie

Legt specifiek en direct uit hoe de test het construct zal gaan meten.

F-schalen

Een dissimilatieschaal die meet of iemand zich slechter voordoet dan hij is.

L-schalen

Een dissimilatieschaal die bepaalt hoe sociaal wenselijk testdeelnemers antwoorden.

Inconsistentie schalen

Een dissimilatieschaal die kijkt naar inconsistente antwoorden op items. Als een participant inconsistent antwoordt op items die hetzelfde beogen te meten, worden de testresultaten als onbetrouwbaar gezien.

Symptom validity tests (SVTs)

Tests die ontworpen zijn om heel moeilijk te lijken, maar die in feite erg gemakkelijk zijn.

Specificatie van teststructuur en testvorm

De tweede fase waarin ten eerste het leeftijdsbereik bepaald wordt, daarna het testformaat, vervolgens de teststructuur, het itemformaat en dan de uiteindelijke items.

Standaardisatie en psychometrisch onderzoek

De derde fase waarin de standaardisatie van de test wordt beschreven. Ook wordt beschreven hoe de validiteit en de betrouwbaarheid getest zullen worden.

Het uitvoeren van de test

De vierde fase waarin het testplan daadwerkelijk wordt uitgevoerd. Eerst worden de inhoud en de structuur van de test geëvalueerd en aan de hand daarvan wordt een testhandleiding gemaakt.

 

Access: 
Public

Image

Work for WorldSupporter

Image

JoHo can really use your help!  Check out the various student jobs here that match your studies, improve your competencies, strengthen your CV and contribute to a more tolerant world

Working for JoHo as a student in Leyden

Parttime werken voor JoHo

Comments, Compliments & Kudos:

Add new contribution

CAPTCHA
This question is for testing whether or not you are a human visitor and to prevent automated spam submissions.
Image CAPTCHA
Enter the characters shown in the image.
Promotions
oneworld magazine
Check how to use summaries on WorldSupporter.org

Online access to all summaries, study notes en practice exams

How and why would you use WorldSupporter.org for your summaries and study assistance?

  • For free use of many of the summaries and study aids provided or collected by your fellow students.
  • For free use of many of the lecture and study group notes, exam questions and practice questions.
  • For use of all exclusive summaries and study assistance for those who are member with JoHo WorldSupporter with online access
  • For compiling your own materials and contributions with relevant study help
  • For sharing and finding relevant and interesting summaries, documents, notes, blogs, tips, videos, discussions, activities, recipes, side jobs and more.

Using and finding summaries, study notes en practice exams on JoHo WorldSupporter

There are several ways to navigate the large amount of summaries, study notes en practice exams on JoHo WorldSupporter.

  1. Use the menu above every page to go to one of the main starting pages
    • Starting pages: for some fields of study and some university curricula editors have created (start) magazines where customised selections of summaries are put together to smoothen navigation. When you have found a magazine of your likings, add that page to your favorites so you can easily go to that starting point directly from your profile during future visits. Below you will find some start magazines per field of study
  2. Use the topics and taxonomy terms
    • The topics and taxonomy of the study and working fields gives you insight in the amount of summaries that are tagged by authors on specific subjects. This type of navigation can help find summaries that you could have missed when just using the search tools. Tags are organised per field of study and per study institution. Note: not all content is tagged thoroughly, so when this approach doesn't give the results you were looking for, please check the search tool as back up
  3. Check or follow your (study) organizations:
    • by checking or using your study organizations you are likely to discover all relevant study materials.
    • this option is only available trough partner organizations
  4. Check or follow authors or other WorldSupporters
    • by following individual users, authors  you are likely to discover more relevant study materials.
  5. Use the Search tools
    • 'Quick & Easy'- not very elegant but the fastest way to find a specific summary of a book or study assistance with a specific course or subject.
    • The search tool is also available at the bottom of most pages

Do you want to share your summaries with JoHo WorldSupporter and its visitors?

Quicklinks to fields of study for summaries and study assistance

Field of study

Access level of this page
  • Public
  • WorldSupporters only
  • JoHo members
  • Private
Statistics
708