Je vertrek voorbereiden of je verzekering afsluiten bij studie, stage of onderzoek in het buitenland
Study or work abroad? check your insurance options with The JoHo Foundation
Galton was de grondlegger van mentale tests en hij was de eerste die op grootschalig niveau systematisch individuele verschillen in fysieke, sensorische en motorische data verzamelde en met elkaar vergeleek. Cattell en Galton ontwikkelden de eerste gestandaardiseerde vragenlijsten die werden gebruikt om persoonlijkheid te meten. De Binet-Simon scale meet intelligentie aan de hand van beredenering, begrip en het korte termijn geheugen van een persoon. Woodworth ontwikkelde de Personal Data Sheet, wat de eerste formele persoonlijkheidstest is. Wechslers intelligentietest meet zowel verbale als non-verbale intelligentie.
Een measurement is een meting, waarbij er aan een aantal regels wordt gehouden om zo kenmerken, gedrag en attributen van personen te becijferen. Assessment is het op een systematische manier verzamelen van informatie om karakteristieken van mensen of objecten te kunnen begrijpen, waarbij meerdere scores en tests worden gebruikt.
Maximale prestatie tests worden gebruikt om het maximale kunnen van een persoon te meten (vb. intelligentietest). Indeling maximale prestatie tests zijn prestatietest of bekwaamheidstest, objectieve test of subjectieve test, speed tests of power tests. Typische respons tests meten het typische gedrag van de onderzochte en worden meestal gebruikt om de persoonlijkheid te meten. Verschillende vormen van typische respons tests zijn objectieve persoonlijkheidstests en projectieve persoonlijkheidstests. Bij een gestandaardiseerde test zijn de testcondities zoveel mogelijk hetzelfde voor alle personen en bij een niet-gestandaardiseerde test is het minder formeel. Bij Computerized Adaptive Testing (CAT) selecteert de computer items met een bepaalde moeilijkheidsgraad voor de participant (geselecteerd op basis van de prestatie van de participant op eerdere items).
Correlatie beschrijft de relatie tussen twee variabelen. Een correlatie coëfficiënt is de kwantitatieve manier waarop de lineaire relatie tussen twee variabelen kan worden beschreven en wordt aangegeven door de Pearson coëfficiënt r. Bij het interpreteren van r wordt gekeken naar het teken en de grootte.
Een spreidingsdiagram geeft de relatie tussen twee variabelen visueel weer. Bij een curvilineaire relatie tussen twee variabelen neemt de relatie eerst positief toe tot het toppunt, waarna de relatie afneemt. Lineaire regressie is een statistische techniek waarbij waarden van de ene variabele worden voorspeld aan de hand van de andere variabele.
De standaard schattingsfout geeft de gemiddelde schattingsfout tussen de regressielijn en de data aan.
Om interpretatie mogelijk te maken, moeten ruwe scores getransformeerd worden in afgeleide scores. Afgeleide scores worden meestal onderverdeeld in normgerichte scores en criteriumgerichte scores. Bij normgerichte score interpretaties wordt de score van een participant vergeleken met de scores van andere participanten en bij criteriumgerichte score interpretaties wordt de score van een participant vergeleken met een absolute standaard.
Een gestandaardiseerde steekproef moet representatief, actueel en groot genoeg zijn.
Standaard scores (ook wel geschaalde scores genoemd) zijn scores naar een gewenste schaal met een vooraf vastgesteld gemiddelde en standaarddeviatie. De meest gebruikte vormen van standaard scores zijn de z-scores, de t-scores, IQ en andere prestatietests en de CEEB scores. Genormaliseerde standaardscores zijn standaard scores die gebaseerd zijn op verdelingen die eigenlijk niet normaal verdeeld waren, maar die zijn getransformeerd tot normale verdelingen (non-lineaire transformatie). De meest gebruikte vormen van genormaliseerde standaardscores zijn stanine scores, Wechsler geschaalde score, normal curve equivalent, percentiel rank en graad equivalent.
Door non-lineaire transformaties wordt de vorm van de verdeling veranderd.
Bij criteriumgerichte interpretaties wordt de prestatie van een participant vergeleken met een absolute waarde of criterium groep (vb. mastery testing en standaardgebaseerde interpretatie). Maximale prestatie tests meten aanleg en bekwaamheid, terwijl typische respons tests interesses en gedrag meten. De item respons theorie (IRT) maakt het berekenen van scores mogelijk die niet door middel van een criteriumgerichte of normgerichte manier kunnen worden geïnterpreteerd.
Een kwalitatieve beschrijving van een testscore helpt de hulpverlener in het communiceren van de resultaten in schriftelijke rapporten en andere communicatiemiddelen.
De klassieke testtheorie (CTT), ook wel de true score theory genoemd, helpt willekeurige meetfouten te begrijpen en de betrouwbaarheid van testscores te berekenen.
De twee meetfouten die de meeste meetfouten in testen verklaren zijn content sampling en time sampling. Bij een test-hertest krijgt eenzelfde groep individuen dezelfde test op twee verschillende tijden. Bij interne consequentheid (internal consistency) betrouwbaarheid wordt betrouwbaarheid berekend na één testafname.
Bij de afwisselende-vorm (alternate forms) betrouwbaarheid worden twee tests afgenomen met een inhoud en moeilijkheidsgraad die parallel aan elkaar lopen. Om bij afwisselende-vorm de betrouwbaarheid vast te stellen kun je de afwisselende-vorm gebaseerd op gelijktijdige afname gebruiken of de afwisselende-vorm betrouwbaarheid gebaseerd op verlate afname.
Een aantal factoren die van invloed zijn op de keuze van een geschikt betrouwbaarheidscoëfficiënt zijn constructen, tijd die beschikbaar is voor de meting, doel van testscores, methode waarmee betrouwbaarheid berekend is en vaste regels. De Kuder-Richardson formule 20 (KR20) en de coëfficiënt alpha meten ook de betrouwbaarheid aan de hand van één testafname.
Om de tussen-beoordelaar betrouwbaarheid te bepalen, wordt de correlatie tussen de scores berekend die verschillende beoordelaars hebben gegeven.
De standaard meetfout (SEM) is een bruikbaardere statistiek die wordt gebruikt bij het interpreteren van testscores van individuen. Bij item respons theorie (IRT) wordt informatie over betrouwbaarheid van testscores als een test informatie functie (TIF) gegeven. Een TIF geeft de betrouwbaarheid van metingen op verschillende punten van de verdeling weer. Een speed test reflecteert de snelheid waarmee een participant een test aflegt.
Een betrouwbaarheidsinterval geeft een bereik van scores weer waarbinnen de ware score van een individu met grote waarschijnlijkheid valt.
Reynolds (1998) zei dat validiteit refereert naar de gepastheid of accuraatheid van de interpretatie van testscores. Volgens o.a. Messick (1994) zijn er twee grote bedreigingen voor validiteit, namelijk construct onderrepresentatie en construct-irrelevantie spreiding.
Verschillende types validiteit zijn content validiteit, criteriumgerichte validiteit en construct validiteit. Externe factoren die kunnen bijdragen aan een verminderde validiteit van de interpretatie van testscores zijn karakteristieken van de participant, verkeerde testafnames en scoringsprocedures of als de participant al instructie en coaching heeft gehad.
Er zijn vijf categorieën van validiteitsbewijs, namelijk 1) bewijs gebaseerd op testinhoud, 2) bewijs gebaseerd op relaties tot andere variabelen, 3) bewijs gebaseerd op de interne structuur, 4) bewijs gebaseerd op respons processen en 5) bewijs gebaseerd op gevolgen van de test.
Bij bewijs gebaseerd op testinhoud kijken experts naar de item relevantie en de inhoud relevantie van de test. Voor bewijs gebaseerd op relaties tot andere variabelen zijn verschillende toepassingen, zoals testcriterium bewijs, convergent en discriminant validiteitsbewijs en contrasterende groepsstudies. Bij testcriterium bewijs kan gebruik worden gemaakt van een voorspellend onderzoek of een concurrent onderzoek.
Gezichtsvaliditeit is de mate waarin een test lijkt te meten wat het hoort te meten en is hiermee geen technische vorm van validiteit.
Convergent validiteitsbewijs wordt verkregen wanneer twee tests met dezelfde constructen worden gecorreleerd en divergent (discriminant) validiteitsbewijs wordt verkregen wanneer twee tests met tegenovergestelde constructen worden gecorreleerd.
Factor analyse is een benadering om validiteitsbewijs op basis van de interne structuur van een test te bepalen. Bevestigende factor analyse houdt in dat de onderzoeker een factor structuur verwacht, waarna hij de data onderzoekt om te kijken of zijn verwachtingen voldoen aan de eigenlijke data set.
Itemanalyse kijkt naar de kwaliteit van afzonderlijke items in een test, dus niet naar de totale test.
Item moeilijkheid is het percentage van de participanten die het correcte antwoord geven op een item in de test. Dit kan alleen worden toegepast op maximale prestatie tests juist/onjuist.
De percent endorsement statistic geeft het percentage participanten aan dat op een bepaalde manier op een item heeft geantwoord.
Een gestandaardiseerde test is een test die is afgenomen, gescoord en geïnterpreteerd op een vastgestelde manier.
Een prestatietest is een test die de kennis of vaardigheden van een participant binnen een vooraf bepaald construct meet. Groepsafname prestatietests kunnen worden afgenomen bij meer dan één participant per keer. Veel staten hebben hun eigen prestatietests ontwikkeld, met vooral criteriumgerichte interpretaties van testscores. Individuele prestatietests worden vaak gebruikt bij participanten met speciale behoeftes, zoals een student met een mogelijke vorm van dyslexie.
Commerciële gestandaardiseerde prestatietests zijn tests die ontwikkeld zijn voor scholen door het hele land en die kunnen worden gekocht door instituties. Voorbeelden van commerciële gestandaardiseerde prestatietests zijn de CTB McGraw-Hill (CAT/5, TerraNova CTBS en CAT/6), de Pearson assessments (Stanford 10 en MAT8) en de Riverside publishing (ITBS en ITED).
Als test voorbereidingsmanieren testscores toe laten nemen zonder dat het prestatieniveau toeneemt, dan wordt de validiteit minder.
Een docent moet bij het ontwikkelen van een test letten op het specificeren van doelen, kiezen tussen normgerichte of criteriumgerichte interpretatie en weten welke item formaat hij gaat handhaven.
Begaafdheidstests laten de cumulatieve impact van levenservaringen op vaardigheden zien. Begaafdheidsscores laten zien hoe goed een persoon op een specifiek moment in de tijd scoort op een bepaalde vaardigheid. Een aantal begaafdheids- en intelligentietesten voor groepen zijn de TCS/2, PTCS, InVieuw, OLSAT-8, CogAt en College Admission tests. Een aantal begaafdheids- en intelligentietesten voor individuen zijn de WISC-IV, de SB5, de WJ III COG en de RIAS.
De vaardigheden probleemoplossend vermogen, abstract redeneren en de vaardigheid om kennis te verwerven zijn in elke definitie van intelligentie wel te vinden, maar over verdere invulling van de definitie van intelligentie bestaat nog geen consensus.
De discrepantie tussen begaafdheid en prestatie vergelijkt de prestatie van een persoon op een begaafdheidstest met de prestatie op een prestatietest, wat leerproblemen kan aanduiden bij een persoon.
De Respons op Interventie (RTI) identificeert studenten met leerbelemmeringen eerder dan dat deze worden geïdentificeerd door de discrepantie tussen begaafdheid en prestatie. Hierbij krijgen de studenten eerst een algemene instructie over de test van hun leraar en wordt daarna toezicht gehouden op de vooruitgang van studenten.
Bij gedragsdiagnostiek wordt gekeken naar de typische respons van een persoon in een bepaalde situatie, waarbij er vanuit wordt gegaan dat uit observeerbaar gedrag de gevoelens en gedachten van een persoon representeert.
Een traditioneel klinisch interview begint met een brede vraag zoals ‘Hoe kan ik u helpen?’ of ‘Waarom bent u hier?’. Een gedragsinterview focust op de antecedenten en consequenties van specifieke gedragingen en op de pogingen die al zijn ondernomen om het gedrag te veranderen. Ook wordt er gekeken naar de relevante bekrachtiging. Het gedragsinterview bestaat uit zes stappen.
Continue prestatietests (CPTs) zijn specifieke gedragstests die oorspronkelijk ontwikkeld zijn om oplettendheid, volgehouden en selectieve aandacht en executieve controle te meten. Bij een gedragsbeoordelingsschaal wordt een persoon beoordeeld op verschillende domeinen.
De TRS, PRS, CBCL en TRF worden omnibus beoordelingsschalen genoemd. Dit houdt in dat ze een groot bereik aan symptomen en gedrag meten die worden geassocieerd met verschillende emotionele- en gedragsstoornissen.
De Teacher Rating Scale (TRS) geeft een duidelijke weergave van het schoolgerelateerde gedrag van het kind, terwijl de Parent Rating Scale (PRS) het gedrag van het kind thuis en in de maatschappij weergeeft. De Teacher Report Form (TRF) en de Child Behavior Checklist (CBCL) bestaat uit activiteiten en competenties van het kind op het gebied van recreatie, sociaal functioneren en school en daarnaast uit items over probleemgedrag waarop een beoordelaar zijn of haar mening moet geven.
Enkel-domein (syndroom-specifieke) beoordelingsschalen zijn gericht op een specifieke stoornis of gedragsdimensie, zoals de CARS, de BASC Monitor en de PBRS.
Psychofysiologische diagnostiek is een manier van gedragsdiagnostiek waarbij fysieke veranderingen in het lichaam tijdens een bepaalde gebeurtenis worden gemeten. Bij directe observatie wordt een individu in zijn natuurlijke omgeving, zoals op school of thuis, geobserveerd. Comorbiditeit houdt in dat een persoon minstens twee stoornissen tegelijkertijd heeft.
Het doel van personeelsselectie tests is om als organisatie geld te besparen doordat werknemers worden ingehuurd die hun werk goed doen en tevreden zijn in de werkomgeving.
Cognitieve vaardigheidstests meten onder andere beredenering, verbale vaardigheden en probleemoplossend vermogen.
Bij een ongestructureerde benadering past de interviewer zijn vragen aan de sollicitant of op de inhoud van het gesprek aan en bij een gestructureerde benadering worden de vragen voorafgaand aan het interview bedacht.
Persoonlijkheid beschrijft de unieke karakteristieken van een persoon die hem of haar definiëren en die gebruikt worden door het individu wanneer hij of zij communiceert met anderen. De Hogan Personality Inventory – Revised is gebaseerd op het vijf-factor model van persoonlijkheid en de resultaten meten aanpassing, sociale vaardigheden, interpersoonlijke gevoeligheid, voorzichtigheid, creativiteit en leerbenadering.
Integriteittests zijn zelfrapportage tests die meten of iemand geneigd is om niet eerlijk te antwoorden. Open integriteitstests bestaan uit vragen met betrekking tot algemene aannames en attitudes tegenover onder andere diefstal en andere overtredingen en bekentenissen van dergelijke overtredingen. Persoonlijkheid-georiënteerde integriteitstests bestaan uit vragen over persoonlijkheidskenmerken die gerelateerd zijn aan diefstal, zoals sensatiezoekend gedrag.
Een assessment center is een samenstelling van taken of oefeningen waarmee een werkomgeving wordt gesimuleerd. Werkvoorbeeld tests worden gebruikt om werknemers voor banen te selecteren, waarbij deelnemers taken moeten uitvoeren die gerelateerd zijn aan de functie die ze willen gaan vervullen. Baananalyse is het proces dat gebruikt wordt om een baan te definiëren, door middel van een interview, direct observeren, het inzetten van experts of vragenlijsten.
Met de biografische data, de persoonlijke ervaringen en de achtergrond van deelnemers, kan toekomstig gedrag van werknemers worden voorspeld. Een relatieve beoordelingsmethode vergelijkt de prestatie van de beoordeelde met de prestatie van andere personen die hetzelfde werk verrichten en een absolute beoordelingsmethode vergelijkt het gedrag van een werknemer met een vastgelegde prestatie of meting.
Het criteriumprobleem is de moeilijkheid om prestatiecriteria te meten.
Neuropsychologische diagnostiek is nodig om de specifieke aard en ernst van het eventuele disfunctioneren van de relatie tussen hersenstructuren en getoond gedrag in kaart te brengen. Neuropsychologische diagnostiek begint met het ontvangen van een verwijzing, ook wel een referral genoemd. Er zijn twee benaderingen voor neuropsychologische diagnostiek, namelijk de gefixeerde batterij en de flexibele batterij. De algemene aanname van elke neuropsychologische test is dat de hersenen gedrag bepalen, waardoor metingen van gedrag iets zeggen over het functioneren van het brein.
The Halstead-Reitan Neuropsychological Test Battery (HRNB) was ontwikkeld om de relatie tussen gedrag en hersenfuncties te meten en bestaat uit verschillende categorieën. Luria-Nebraska Neuropsychological Battery (LNNB) for Adults was ontwikkeld om cognitieve tekortkomingen en problemen in het centrale zenuwstelsel te meten.
De belangrijkste variabelen die worden nagelopen voordat een test wordt geselecteerd zijn tijd en kosten, opleiding van de examinator, doelen van de diagnostiek, testfase, psychometrie, interviewgegevens en gedragsobservatie. Testcondities kunnen invloed hebben op de prestatie van een persoon op een test, dus daarom wordt de test afgenomen in een stille, comfortabele omgeving.
Bij de normatieve benadering vergelijken neuropsychologen het huidige prestatieniveau van een patiënt met een normatieve standaard en bij de idiografische benadering gebruikt de neuropsycholoog eerdere scores van premorbide vaardigheden om de scores van de patiënt mee te vergelijken.
Premorbide vaardigheden (premorbide functie) beschrijven de cognitieve staat voorafgaande aan letsel of een ziekte.
Aan de hand van een demografische schatting, patroonanalyse en pathonomische tekens kan de premorbide functie van een persoon geschat of afgeleid worden.
Forensische psychologie is de toepassing van psychologische technieken, procedures en veronderstellingen op het begrijpen van de wettelijke vervolgingen en processen. Het doel van forensische diagnostiek is het aanleveren van objectieve data en onbevooroordeelde meningen. Bij klinische diagnostiek is in tegenstelling tot forensische diagnostiek deelname vrijwillig, zijn de resultaten vertrouwelijk en kunnen deze alleen worden vrijgegeven met toestemming van de persoon.
Een deskundige getuige (expert witness) is een persoon die door zijn of haar opleiding, training en ervaring de kennis bezit die nodig is om belangrijke onderwerpen van de zaak toe te lichten in de rechtszaak en zo de rechter of jury helpt om de zaak beter te begrijpen. Een feiten getuige (fact witness) is een persoon die kennis heeft wat er in een specifieke zaak is gebeurd en een getuigenis geeft met betrekking tot wat er is gebeurd of wat de feiten zijn.
De criteria voor ontoerekeningsvatbaarheid verschillen van staat tot staat, maar in wezen komt het er altijd op neer dat de rechter beslist dat de aangeklaagde tijdens zijn criminele gedrag in een staat van mentale ziekte verkeerde, waardoor hij niet wist dat zijn gedrag fout was. Bij verzachtende omstandigheden hebben de levensomstandigheden van een persoon zodanig invloed gehad dat de morele waarden van een persoon verminderd waren toen het misdrijf gepleegd werd.
De jeugdbank behandelt technisch gezien alleen burgerrechtzaken, dus geen criminele rechtszaken. In een rechtszaak over persoonlijke schade wordt een poging gedaan tot het vergoeden van schade die een persoon heeft geleden door de verantwoordelijke partij.
De cultural test bias hypothesis (CTBH) stelt dat verschillen tussen groepen ontstaan door een bias tegenover een bepaalde groep. Bias is een vooroordeel waardoor vertekende resultaten kunnen ontstaan. Om bias in items op te sporen, wordt gebruik gemaakt van de item respons theory (IRT).
Volgens Reynolds (2000) zijn er vier categorieën verklaringen voor de verschillen tussen groepen, namelijk de 1) genetische basis, 2) de omgeving, 3) de interactie tussen de genen en 4) de omgeving en de test die kennis en vaardigheden van minderheden systematisch onderschat.
De differentiële voorspellende validiteit stelt dat een test beter is in het meten van constructen en het maken van valide voorspellingen voor individuen van de groepen waarop de test voornamelijk gebaseerd is, dan bij andere groepen.
Als een test een culturele lading heeft, betreft dit de mate waarin culturele specificatie aanwezig is in een test of testitems.
De egalitaire denkfout van Jensen stelt dat alle menselijke populaties identiek zijn op alle mentale kenmerken en vaardigheden.
Factoranalyse geeft aan in hoeverre testitems met elkaar correleren.
Homogeniteit is als de regressie voor groepen gelijkwaardig is en er kan worden gesteld dat de voorspelling hetzelfde is voor deze groepen.
Het ontwikkelen van een test kan worden opgesplitst in vier fases, namelijk (1) test conceptualisering (2) specificatie van teststructuur en testvorm (3) standaardisatie en psychometrisch onderzoek (4) het uitvoeren van de test.
Fase 1 begint met de specificatie van het te meten construct en de vaststelling van de behoefte om een nieuwe test te ontwikkelen en vervolgens moet het gebruik en de interpretatie van de testresultaten beschreven worden, wordt bepaald wie de test gebruikt en waarom en worden de te meten constructen gedefinieerd. Als laatste wordt bepaald of de test ook dissimulatie moet meten. Een conceptuele definitie legt het construct uit aan de hand van voorbeelden en theorieën en een operationele definitie legt specifiek uit hoe de test het construct zal gaan meten. Dissimulatie is het anders voordoen van jezelf zodat ware karakteristieken gemaskeerd blijven. Dissimulatieschalen die worden toegepast op persoonlijkheids- en gedragstests zijn F-schalen, L-schalen en inconsistentie indexen.
Fase 2 begint met het bepalen van het leeftijdsbereik van de test en vervolgens wordt het testformaat gekozen, wordt de teststructuur beschreven, wordt een Tabel of Specifications opgesteld, wordt het itemformaat ontwikkeld en als laatste worden de uiteindelijke items bepaald. Een Tabel of Specifications (TOS) laat zien wat de samenhang is tussen de definities van het construct en de inhoud van de test.
Bij fase 3 moet eerst de doelpopulatie beschreven worden en pas daarna wordt een plan gemaakt om een representatieve steekproef te trekken. Vervolgens moeten de schalen worden gekozen, wordt onderzoek gedaan naar de betrouwbaarheid en de validiteit van de test en wordt er gekeken of er speciale onderzoeken nodig zijn. Als laatste zullen de fysieke onderdelen van de test in een lijst worden opgeschreven. In fase 4 voert de testauteur de test daadwerkelijk uit.
De The Joint Committee on Testing Practices (JCTP) zegt dat het fundamentele recht van een participant is dat de afgenomen test hoge professionele standaarden heeft en valide testresultaten geeft.
The Standards geven richtlijnen die meestal direct worden toegepast op professioneel ontwikkelde tests, maar ze kunnen ook toegepast worden op minder formele diagnostiek.
De Mental Measurements Yearbook (MMY) geeft beschrijvende informatie over tests en er wordt ook informatie gegeven over de betrouwbaarheid, validiteit en rapportage van testresultaten.
De Tests in Print (TIP) bevat informatie over elke gepubliceerde psychologische of educatieve test.
Een informed consent is ethisch en wettelijk vereist waarin informatie gegeven wordt over karakteristieken, interpretatie en gebruik van de test. Op basis hiervan geeft de participant wel of niet schriftelijke toestemming voor afname van de test.
Je vertrek voorbereiden of je verzekering afsluiten bij studie, stage of onderzoek in het buitenland
Study or work abroad? check your insurance options with The JoHo Foundation
Add new contribution