Access options

The full content is only visible for JoHo WorldSupporter members with full online access.

  • For information about international JoHo WorldSupporter memberships, read more here.
  • Are you already a member?
    • During the account creation you can select 'I am a JoHo WorldSupporter Member with full online access'.
    • Became a member after you've created the account, or you upgraded your membership, then you can change the settings of your account on your WorldSupporter user page
  • or fill out the contact form

 

For Dutch visitors

Toegang tot pagina of document:

Word JoHo donateur voor online toegang

Je bent al donateur, maar je hebt geen toegang?

  • Log in, of maak een account aan als je dat nog niet eerder hebt gedaan op worldsupporter.org.
  • Bij het aanmaken van je account kan je direct aangeven dat je JoHo WorldSupporter donateur bent (met danwel zonder 'full online access', of je past dit later aan op de user page van je account
  • Kom je er niet uit, neem dan even contact op! Of check de veel gestelde vragen

Kom je er niet helemaal uit of heb je problemen met inloggen?

  • Lees de antwoorden op de meest gestelde vragen.
  • Of laat je helpen door één van de JoHo medewerkers door het online contactformulier in te vullen

-----------------------------------------------


JoHo WorldSupporter donateur worden

JoHo membership zonder extra services (donateurschap) = €5 per kalenderjaar

  • Voor steun aan de JoHo WorldSupporter en Smokey projecten en een bijdrage aan alle activiteiten op het gebied van internationale samenwerking en talentontwikkeling
  • Voor gebruik van de basisfuncties van JoHo WorldSupporter.org
  • Voor het gebruik van de kortingen en voordelen bij partners
  • Voor gebruik van de voordelen bij verzekeringen en reisverzekeringen zonder assurantiebelasting

JoHo membership met extra services (abonnee services) = €10 per kalenderjaar

€10 per kalenderjaar: Online toegang Only

  • Voor volledige online toegang en gebruik van alle online boeksamenvattingen en studietools op WorldSupporter.org en JoHo.org
  • voor online toegang tot de tools en services voor werk in het buitenland, lange reizen, vrijwilligerswerk, stages en studie in het buitenland
  • voor online toegang tot de tools en services voor emigratie of lang verblijf in het buitenland
  • voor online toegang tot de tools en services voor competentieverbetering en kwaliteitenonderzoek
  • Voor extra steun aan JoHo, WorldSupporter en Smokey projecten

Steun JoHo en steun jezelf door JoHo WorldSupporter donateur te worden

Direct Donateur Worden

Title: Bijlage bij de samenvatting Testtheorie: inleiding in de theorie van de psychologische test van Drenth et al
Bijlage bij de samenvatting Testtheorie: inleiding in de theorie van de psychologische test van Drenth et al
Media of Psychology Supporter
Contributions, Comments & Kudos

Add new contribution

CAPTCHA
This question is for testing whether or not you are a human visitor and to prevent automated spam submissions.
Image CAPTCHA
Enter the characters shown in the image.
Supporting content
Samenvatting Testtheorie: inleiding in de theorie van de psychologische test van Drenth et al

Samenvatting Testtheorie: inleiding in de theorie van de psychologische test van Drenth et al

Image


Historische testontwikkeling - Chapter 1

De ontwikkeling van testdiagnostiek kent grofweg vier perioden, namelijk

  1. de periode tot het verschijnen van de Binet-Simon-test,
  2. de periode tussen het verschijnen van de Binet-Simon-test en de Eerste Wereldoorlog (WOI),
  3. de periode tussen het begin van WOI tot de Tweede Wereldoorlog (WOII), en
  4. de periode tussen het begin van WOII tot heden.

1.1 Testontwikkeling tot de BinetSimon-test

1905 is een belangrijke mijlpaal voor de ontwikkeling van de testdiagnostiek; in dit jaar verscheen de eerste versie van de Binet-Simon-test – de eerste waardevolle intelligentietest.  Uiteraard gingen hier een hoop ontwikkelingen aan vooraf, te beginnen met de ontwikkelingen binnen de psychiatrie in Frankrijk en Duitsland. In Frankrijk ontstond eind 18e eeuw een verhoogde interesse in de geestelijke abnormaliteit en zwakzinnigheid. Men begon krankzinnigheid en zwakzinnigheid van elkaar te onderscheiden, waarbij mensen als Esquirol, Séguin, Charcot, Janet en Binet zwakzinnigheid niet beschouwden als ziekte, maar als een gebrek aan intellectuele vaardigheden. Ook in Duitsland veranderde de visie op geestelijke abnormaliteit. In beide landen werd hier steeds meer onderzoek naar gedaan, waardoor er een behoefte ontstond aan methoden om verschillen tussen geesteszieken en verschillende niveaus in zwakzinnigheid te kunnen duiden.

Naast de psychiatrie, ontstond ook binnen de experimentele psychologie – voornamelijk beoefend in Duitsland – een toegenomen interesse in geestelijke abnormaliteit en onderzoek hiernaar. Met de oprichting van zijn experimentele laboratorium in Leipzig, luidde Wundt in 1879 het begin in van systematisch grootschalig experimenteel onderzoek. Aanvankelijk richtte men zich vooral op generaliseerbaarheid en werden afwijkingen en individuele verschillen toegeschreven aan experimenteerfouten en beperkte het onderzoek zich tot primaire sensorische en motorische functies. Later, met de publicatie van een artikel van Cattell in het tijdschrift Mind in 1890, kwam er meer aandacht voor individuele verschillen. In 1893 werd er binnen de American Psychological Association (APA) een commissie ingesteld met als taak tests te registreren en de gebruiksmogelijkheden van deze tests te formuleren.

eEen derde ontwikkelingslijn die van invloed is geweest op testontwikkeling, is de genetica. Eind 19e eeuw verrichtte Galton diverse antropometrische onderzoekingen die gekenmerkt werden door drie elementen die later een pijler van het wetenschappelijk testonderzoek zouden gaan vormen, namelijk: (1) de wenselijkheid van het onderzoek van individuele verschillen, (2) systematisering van onderzoekstechnieken, en (3) normatief denken en weergeven van onderzoeksresultaten in statistische termen.

1.2 Testontwikkeling van verschijnen Binet-Simon-test tot WOI

In 1905 verscheen de eerste intelligentietest – ontwikkeld door Binet en Simon – die ook echt een praktische functie had. Binet’s benadering was vernieuwend in de zin dat hij het accent legde op complexe mentale processen – zoals begrip, geheugen, probleemoplossend vermogen en verbeeldingskracht – in plaats van eenvoudige mentale processen. Daarnaast had hij een empirisch uitgangspunt. Ten slotte kwam hij met het voorstel een totaalscore te gebruiken als weergave van het intelligentieniveau. Binet introduceerde verder het begrip ‘mentale leeftijd’, waardoor een praktische indicatie kon worden verkregen van het intelligentieniveau. De test werd in verschillende landen vertaald/aangepast. Hoewel het werk van Binet in praktisch opzicht veel betekend heeft, was dit in theoretisch opzicht aanzienlijk minder het geval. Zo ontbrak de theorie over samenstellende elementen in de intelligentie. Spearman heeft hier onderzoek naar gedaan en formuleerde aan de hand van dit onderzoek de twee-factorentheorie waarbij hij stelde dat er in alle tests twee intelligentiefactoren een rol speelden; een algemene (g-)factor en een specifieke (s-)factor.

Hoewel de intelligentiemeting grote vooruitgang boekte in deze periode, werd nog niet op grote schaal getest en ook van valideringsonderzoek was nog geen sprake.

1.3 Testontwikkeling van begin WOI tot WOII

De testontwikkeling kwam door het uitbreken van WOI in een stroomversnelling. De psychologie werd voor het eerst regelmatig in de praktijk toegepast en de testpsychologie kreeg een steeds grotere rol bij de beslissingsproblematiek van selectie en plaatsing met betrekking tot functies en opleidingen. In 1917, toen ook de VS bij de oorlog betrokken raakte, kwam de echte doorbraak. Er ontstond een noodzaak om snel en efficiënt te testen. Dit vormde het begin van de ontwikkeling van de groepsgewijs af te nemen schriftelijke test, waarvan de Army Alpha de eerste was.

Na WOI ontstond er een verschil in testontwikkeling in Amerika en Europa. In Europa – destijds gedomineerd door de Gestaltpsychologie, fenomenologie en personalisme – lag het accent vooral op de individuele diagnostiek. Met name de individuele observatietest werd uiterst populair.

In Amerika – destijds gedomineerd door behaviorisme en positivisme – kregen met name de kwantitatief verwerkbare groepstests veel aanhang. Door een toenemend aantal immigranten uit vele landen van herkomst ontstond er een behoefte aan minder taal- en cultuurafhankelijke tests. In 1917 werd een volledig niet-verbale intelligentietest gepubliceerd. In 1918 volgde de Army Bèta. Ondanks de aandacht voor groepstests, werden in de VS ook veel individuele testbatterijen ontwikkeld, waarvan de Terman Merrill en de Wechsler series wellicht de belangrijkste waren.

Engeland bevond zich meer in een tussenpositie tussen Europa en de VS. Hoewel de ontwikkeling van groepstest geen grote bloei doormaakte zoals de VS die doormaakte, was er, net als in de VS en in tegenstelling tot andere Europese landen, wel veel aandacht voor de objectieve evaluatie van schoolprestaties. ‘Vrije-antwoordenexamens’ maakten plaats voor examens met meerkeuzevragen.

Hoewel er tijdens deze periode vaak geen theorieën ten grondslag lagen aan het gebruik van diverse tests, stimuleerde Thurstone (1931) wel kritische evaluatie van de test zelf. Zo moesten testresultaten volgens hem betrouwbare testscores opleveren en diende de relatie tussen test en criterium alvorens het toepassen van de test te zijn aangetoond. Dankzij deze opvattingen kreeg de statistiek een belangrijke rol in de testpsychologie. Ook begon men het begrip intelligentie in deze periode breder op te vatten; naast de algemene en specifieke factoren, werden door diverse onderzoekers – waaronder Thurstone – de groepsfactoren geïntroduceerd.

Verder ontstond er gedurende deze periode aandacht voor de ontwikkeling van persoonlijkheidstests, waaronder observatietests – met name in West-Europa populair –, persoonlijkheidsvragenlijsten en projectietests.

1.4 Testontwikkeling van begin WOII tot nu

1.4.1 Ontwikkelingen in de VS

De testontwikkeling bloeide tijdens en na WOII. Door de grote en belangrijke keurings- en selectiediensten van de krijsmacht, ging zij op het gebied van selectie, testontwikkeling en psychiatrisch-medische keuringen samenwerken met psychologen. Hierdoor nam niet alleen het aantal selectie- en diagnostische tests toe, maar ontstond er ook een sterke professionalisering van het beleid en werden de psychologische principes van testonderzoek meer constructiever en kritischer.

In 1947 werd de Educational Testing Service (ETS) opgericht, met als doel tegemoet te komen aan de behoeften van het Amerikaanse onderwijs- en opleidingsveld op het gebied van de toelating tot en evaluatie van het onderwijs. Zeer belangrijk hierbij was dat het beleid binnen de ETS niet alleen de focus legde op toegepast onderzoek en testconstructie, maar ook gericht is op fundamenteel psychometrisch onderzoek.

De communicatie over tests, testonderzoek en de psychometrie verliep via vele wetenschappelijke en vaktijdschriften en (hand)boeken, zowel op inleidend niveau, als op gespecialiseerd niveau. Binnen het terrein van de selectiepsychologie stond, vooral in de jaren na WOII, de testtheorie centraal. Aanvankelijk werd, onder andere door Thorndike, selectie vooral gezien als toegepaste testpsychologie. Later werd dit, onder andere door Cronbach, meer beschouwd als een beslissingssituatie. Verder zijn veel belangrijke invloeden uitgegaan van het boek Technical recommendations for psychological tests and diagnostic technieques, gepubliceerd in 1954 door een Testcommissie van de APA. Ook het onderwijskundig meten en de schaaltheorie hadden een belangrijke invloed op de testtheorie en de acceptatie van testtheoretische principes.

Al met al vond er in de VS dus een sterke groei van het aantal tests plaats – waarbij ook de computer een grote rol heeft gehad –, welke gepaard ging met grondige bezinning op de theoretische basis.

1.4.2 Ontwikkelingen in Europa, met name Nederland

De testontwikkeling in Europa verliep minder snel. Pas vanaf de jaren ‘60/70 begon de ontwikkeling van de testtheorie en –constructie tot bloei te komen. De boeken van o.a. Rasch (1960) en Fischer (1974) en diverse wetenschappelijke en vaktijdschriften hebben hierbij een grote rol gespeeld.

In Nederland werd de testontwikkeling in de jaren ‘40/50 zeer gekenmerkt – en zelfs beperkt – door de oriëntatie van de psychologie op de intuïtie van de psycholoog, wat een objectieve en kwantitatieve benadering in de weg stond. Stimulering van testgebruik en de algemene ontwikkeling van de Nederlandse psychologie naar het Amerikaanse model werd eind jaren ’50 vooral in gang gezet door psychologen als Kouwer, De Groot, Van de Geer en Van der Giessen. In 1959 werd door het Nederlands Instituut van Psychologen (NIP) een Test Research Commissie (tegenwoordig Commissie Testaangelegenheden Nederland, COTAN) ingesteld. Deze commissie had als doel de communicatie tussen psychologen te verbeteren en het testonderzoek te bevorderen.

Verder werden tijdens deze periode in Nederland schoolvorderingstests ontwikkeld, welke in Engeland en de VS al zeer veel werden gebruikt. In Nederland deed de testtheorie pas in de jaren ’70 haar intrede bij de beoordeling van school- en opleidingsprestaties. De Groot stelde voor een landelijk centraal instituut voor toetsontwikkeling op te richtten en hierbij het model van de Amerikaanse ETS aan te houden. Dit voorstel werd gerealiseerd in de vorm van de oprichting van het Centraal Instituut voor ToetsOntwikkeling (CITO).

Verschillende soorten tests - Chapter 2

Een verantwoorde en gepubliceerde test bestaat doorgaans uit vier onderdelen:

  1. Het testmateriaal is afhankelijk van de soort test. Het testmateriaal bij een schriftelijke intelligentietest zal bijvoorbeeld bestaan uit een boekje met opgaven die opgelost moeten worden. Als de individuele prestaties van een persoon getest moeten worden, kunnen er legpuzzels, tekenpapier of bouwstenen als testmateriaal gebruikt worden;

  2. Testformulieren om de resultaten van de test op te schrijven om hieruit conclusies of interpretaties te trekken;

  3. Testhandleiding die aangeeft hoe de test gebruikt dient te worden. Een goede testhandleiding moet aan de volgende vier eisen voldoen:

    • Een goede testinstructie. Er moet duidelijk zijn over de gang van zaken tijdens de test. Dit wordt bereikt door de testprocedure, uitleg, proefopgaven enzovoort.

    • De verwerkingsprocedure. Dit zijn de instructies over hoe de test gescoord en verwerkt dient te worden;

    • Normtabellen. Hiermee worden de scores vergeleken met die van de representatieve steekproef.

    • De wetenschappelijke kwaliteit van de test. Hierbij gaat het om de betrouwbaarheid van de test, wat de test betekent en wat het voorspelt.

  4. Bij een test gaat het om een systematisch onderzoek met een bepaald doel. Het doel kan zijn het voorspellen, classificeren of beschrijven van een individu in vergelijking met andere mensen.

Een psychologische test is een systematisch onderzoek van gedrag met behulp van speciaal geselecteerde vragen of opgaven, met de bedoeling inzicht te krijgen in een kenmerk van het onderzochte in vergelijking met anderen. Men heeft niet altijd een test nodig om zich een oordeel te vormen over menselijk gedrag. Een psychologische test gebruiken is pas dan gerechtvaardigd als het een juister beeld oplevert dan het voorwetenschappelijk oordeel, of als het een verbetering of een aanvulling hierop kan betekenen en als de kosten of ethische bezwaren niet remmend werken.

Het doen van een psychologische test heeft zes voordelen (kenmerken) boven een 'willekeurig' oordeel (een niet wetenschappelijk oordeel):

  1. Efficiëntie

  2. Standaardisatie

  3. Normering van de testresultaten

  4. Het principe van objectiviteit

  5. De eis van betrouwbaarheid

  6. Validiteit en de betekenis van een test

Ad 1: De intelligentietest is gericht op de reacties die samenhangen met intelligentie. Bovendien wordt geprobeerd om in de testsituatie zoveel mogelijk storende factoren buiten te houden.

Ad 2: Bij een psychologische testafname streeft men ernaar de test op precies dezelfde manier, onder precies dezelfde condities bij iedereen af te nemen. Dit is het standaardiseren van de situatie. Een test kan meer of minder beantwoorden aan de eis van standaardisatie. Als er geen standaardisatie aanwezig is er geen sprake van een test. Standaardisatie maakt een test betrouwbaar en vergelijkbaar. In de praktijk is de inhoud en de situatie steeds verschillend.

Ad 3: Om de resultaten van personen te vergelijken, is het nodig om te weten hoe groot de afstand tussen de resultaten ongeveer is. Door exactheid kan men kleinere verschillen vaststellen. In de praktijk kunnen we een schatting maken van wie intelligenter is dan wie, maar de vraag is hoeveel intelligenter. Bij grote verschillen maakt zo'n schatting niet zoveel uit, maar juist bij kleine verschillen is het nodig een exact instrument te hebben. Een normeringsonderzoek heeft een rangorde van zeer goede tot zeer slechte prestaties. De normen worden vastgesteld op een groep proefpersonen (steekproef). De eenvoudigste vorm van normering is rangorde. Naast een rangorde is een maat nodig die gebaseerd is op gelijke afstanden tussen de verschillende posities. Behalve dat normering nuttig is voor het interpreteren van resultaten, is het een noodzakelijke voorwaarde voor het gebruik van een test. Soms kan men wel een test gebruiken die niet genormeerd is, bijvoorbeeld in experimenteel onderzoek. Maar eigenlijk heeft men bij alle tests normen nodig, dus ook bij observatietests en projectieve technieken.

Ad 4: Met objectiviteit wordt bedoeld dat wie het onderzoek ook doet, het resultaat hetzelfde moet zijn; en dat openheid en reproduceerbaarheid van de test en evaluatie mogelijk zijn. Als men twee personen onafhankelijk van elkaar dezelfde test laat doen onder dezelfde omstandigheden, dan kan men de resultaten met elkaar vergelijken met behulp van bijvoorbeeld correlatie-onderzoek en kan men de procedure op haar objectiviteit toetsen. Dit wordt interbeoordelaar-betrouwbaarheid genoemd. Het is mogelijk bij observatietests en projectietests een verantwoord peil van objectiviteit te bereiken door:

  • Het waarneembare gedrag te beschrijven en niet te interpreteren. Dit verhoogt de objectiviteit en verlaagt de subjectiviteit. Observatie- en projectietests worden vaak niet als volwaardige tests gebruikt, men gebruikt hen voor het verkrijgen van ideeën en voor het creëren van hypothesen;

  • Registratie in plaats van evaluatie van het gedrag. Door inbreng van de verwerker worden de resultaten subjectiever;

  • Een duidelijk voorgeschreven verwerkingsprocedure;

  • Objectiviteit van een grondhouding van de wetenschapsbeoefenaar. Dus geen invloeden van buitenaf, bijvoorbeeld van de maatschappij, de organisatie, de onderzoeker enz.

Door middel van Cohens Kappa kun je de mate van overeenstemming tussen twee beoordelaars berekenen. Dat doe je als volgt. Bereken de kans dat persoon A en persoon B het bij een aselect gekozen proefpersoon met elkaar eens zijn: Po. Dan bekijk je wat de statistische onafhankelijkheid is. Dit is de overeenstemming die er zou zijn als de beoordelaars hun eigen frequentieverdeling aanhouden. Makkelijker gezegd, dit is de toevalskans: Pt. Dan bereken je Cohens Kappa met de volgende formule: Kappa= (Po – Pt)/ (1 – Pt)

Ad 5: Als we een meting nog eens doen op dezelfde manier, dan moet de uitkomst gelijk zijn aan de uitkomst van de eerste meting. Dit is eerder mogelijk bij een lengtemeting dan bij een intelligentiemeting. Eigenlijk is het niet mogelijk om twee onafhankelijke metingen te verkrijgen in de psychologie. Betrouwbaarheid is wenselijk en zelfs noodzakelijk omdat meetresultaten herhaalbaar moeten kunnen zijn; het moet niets of nauwelijks uitmaken wanneer iemand getest wordt.

Ad 6: Een goede test heeft een vaststaande psychologische betekenis. Dat wil zeggen dat de betekenis aan de praktijk getoetst is. Er is dus geen plaats voor fenomenologische beschrijvingen en alternatieve verklaringen.

In de praktijk gebruikt men de termen testen en meten door elkaar. Door middel van tests kunnen we meten.

De vier meetschalen, van laag naar hoog:

  1. De nominale schaal

    Men gebruikt hier getallen om categorieën te onderscheiden en objecten in te delen. Er is geen sprake van een rangorde, het gaat slechts om verschillende getallen. Op de nominale schaal is geen enkele rekenkundige bewerking mogelijk.

  2. De ordinale schaal

    Er is sprake van een rangorde, dus meer of minder. Getallen worden gebruikt om categorieën of objecten te ordenen. Er zijn wel sommige rekenkundige bewerkingen toegestaan, bijvoorbeeld statistische bewerkingen met de rangordecorrelatiecoëfficient.

  3. De intervalschaal

    Hier is er niet alleen een rangorde van minder of meer, ook de afstanden tussen de verschillende posities zijn belangrijk. De afstanden tussen de verschillende posities zijn trouwens gelijk. Een intervalschaal heeft geen nulpunt vandaar dat men bij een intervalschaal niet mag delen, men mag alleen optellen en aftrekken. Een voorbeeld is de temperatuurschaal.

  4. De ratioschaal

    Alle rekenkundige bewerkingen zijn hier toegestaan omdat er sprake is van een gelijke afstand tussen de verschillende posities op de schaal en van een absoluut nulpunt. Voorbeeld zijn lengte en gewicht.

Er zijn slechts weinig metingen in de psychologie die in de ratioschaal vallen, testscores worden meestal op intervalniveau gemeten. Echter bij de interpretatie van testscores zit men eigenlijk tussen de ordinale en de intervalschaal in.

Behalve dat men testen gelijk stelt aan meten, is het ook zo dat men het scoren van tests gelijk stelt aan het meten. In feite gaat het hier om tellen, meten wordt het pas als men conclusies trekt over een bepaalde eigenschap op basis van het aantal tellingen. Dit kan op twee manieren:

  1. Een eigenschap direct meten

    Het gaat hier om operationele c.q. empirische begrippen; ook wel het fenotypische systeem genoemd. Met andere woorden dat wat de test meet is dat wat het is, de begrippen zijn gelijk aan hun operationalisering, er is geen sprake van een extra betekenis

  2. Een eigenschap indirect meten

    Het gaat hier om het meten van eigenschappen die niet direct waarneembaar zijn, zoals intelligentie, neuroticisme. Ze zijn abstract, theoretisch van aard en operaties zijn altijd één niveau van het begrip verwijderd. dat betekent dus dat de begrippen niet gelijk zijn aan hun operationele begrippen. In de literatuur spreekt men

  3. Read more
Access level of this page
  • Public
  • WorldSupporters only
  • JoHo members
  • Private
Statistics
[totalcount]