TentamenTests bij de 3e druk van Psychometrics: An Introduction van Furr

Wat omvat de psychometrie allemaal? - TentamenTests 1
Wat is belangrijk bij het toekennen van cijfers aan psychologische eigenschappen? - TentamenTests 2
Wat betekenen variabiliteit en co-variabiliteit? - TentamenTests 3
Wat is test dimensionaliteit en wat is factor analyse? - TentamenTests 4
Wat houdt het basisbegrip betrouwbaarheid in? - TentamenTests 5
Hoe kunnen empirische schattingen van de betrouwbaarheid worden gedaan? - TentamenTests 6
Wat is het belang van betrouwbaarheid? - TentamenTests 7
Wat is validiteit? - TentamenTests 8
Hoe kun je bewijs voor convergente en discriminante validiteit evalueren? - TentamenTests 9
Welke soorten reactiebias zijn er? - TentamenTests 10
Welke soorten test bias zijn er? - TentamenTests 11
Hoe ziet een confirmatieve factor analyse eruit? - TentamenTests bij Chapter 12
Wat stelt de generalizability theory (G studie)? - TentamenTests 13
Wat is Item Response Theorie (IRT) en welke modellen zijn er? - TentamenTests 14

Wat omvat de psychometrie allemaal? - TentamenTests 1

Meerkeuzevragen

Vraag 1

Geef voor de verschillen aan welke van de twee onderstaande verschillen (a of b) je meet:

1. intra-individuele verschillen
2. inter-individuele verschillen

Gedrag van individu op verschillende tijdstippen
Gedrag van twee of meer mensen

Vraag 2

Aan welke voorwaarden hoeft een psychologische test volgens Cronbach niet te voldoen?

Samples op een systematische manier verzameld.
Doel is om het gedrag te meten van twee of meer personen
Test moet beschikken over gedragssamples.
Test moet op verschillende momenten afgenomen zijn.

Vraag 3

Waar zijn malingering en demand characteristics voorbeelden van?

Participant reactivity
Scoresensitiviteit
Bias
Composite scores

Vraag 4

Een multiple choice tentamen waarbij je alleen geslaagd of gezakt bent is een voorbeeld van:

Een open-ended en norm referenced test.
Een closed-ended en norm referenced test.
Een open-ended en criterion referenced test.
Een closed-ended en criterion referenced test.

Vraag 5

Welke zaken zijn van belang bij het meten van een niet direct observeerbaar psychologisch attribuut?

Assumptie van verband, taak aan theorie gelinkt en operationaliseerbare definities.
Betrouwbaarheid, taak aan theorie gelinkt en operationaliseerbare definities.
Assumptie van verband, operationaliseerbare definities en betrouwbaarheid.
Alleen validiteit en betrouwbaarheid.

Vraag 6

Alle groep 8 leerlingen worden met verschillende opdrachten getest op hun leesvaardigheid. Hiervoor krijgen ze onder andere een lange lijst met allemaal woorden waarvan ze er in 5 minuten zoveel mogelijk moeten lezen. Wat voor een soort test is dit?

Speeded test
PowParticipant reactivityer test
Open-ended test

Vraag 7

De groep 8 leerlingen uit vraag 6 worden opnieuw getest op hun leesvaardigheid. Deze keer krijgen ze een lijst met moeilijke woorden, waarbij het draait om de hoeveelheid correct voorgelezen woorden. Wat voor soort test is dit?

Open-ended test
Power test
Closed-ended test
Speeded test

Vraag 8

Psychometrie heTest moet op verschillende momenten afgenomen zijn.eft betrekking op:

De procedures die gebruikt worden om testattributen te schatten en evalueren.
Het evalueren van verschillen tussen specifieke psychologische testen.

Vraag 9

Wat is volgens Furr psychometrie?

Een procedure om gedragingen van mensen met elkaar te vergelijken.
Een verzameling van procedures om eigenschappen van psychologische tests te bepalen en te evalueren.
Een systematische aanpak om uitspraken over hypothetische constructen te doen.
Het meten van verschillen tussen menselijke psychologische kenmerken.

Antwoordindicatie Meerkeuzevragen

Vraag 1

A . 1, B. 2

Vraag 2

D. Test moet op verschillende momenten afgenomen zijn.

Vraag 3

A. Participant reactivity

Vraag 4

D. Dit tentamen is closed-ended, omdat iemand kan kiezen uit een beperkt aantal keuzes. Het is criterion referenced, omdat er een grens is bepaald (bijv. 13 fout is voldoende) waar iemand aan moet voldoen om het tentamen te halen.

Vraag 5

A. Een assumptie van verband tussen het observeerbare gedrag en de attribuut, dit zou betekenen dat de test (in ieder geval gedeeltelijk) valide is. Een theoretische link tussen de taak en de te meten attribuut is van belang om de validiteit mogelijk te maken. Validiteit is van belang omdat er in dit geval bepaald moet worden waarmee je het attribuut kan meten. Operationele definities maken het mogelijk om onduidelijke begrippen te kunnen meten en begrijpen (zoals intelligentie, leren en dromen).

Vraag 6

A. Speed testen zijn tests met een tijdslimiet en waarbij niet verwacht wordt dat je de hele test afrond en waarbij de test is hoever je komt met beantwoorden. Er wordt hierbij uitgegaan van een hoge kans dat beantwoorde vragen correct beantwoord zijn.

Vraag 7

B. Power testen zijn tests zonder tijdslimiet, waarbij de antwoorden van belang zijn. Hierbij wordt gekeken naar het gegeven antwoord en aan de hand hiervan wordt een score voor het aantal juiste antwoorden bepaald.

Vraag 8

A. Bij psychometrie ligt de nadruk op de attributen van tests en dit kunnen evalueren

Vraag 9

B. Psychometrie is de wetenschap die zich buigt over het evalueren van attributen van psychologische tests.

Wat is belangrijk bij het toekennen van cijfers aan psychologische eigenschappen? - TentamenTests 2

Meerkeuzevragen

Vraag 1

Aan welke eigenschap moet een categorie voldoen?

Categorieën moeten wederzijds uitsluitend zijn.
Proefpersonen binnen de categorie moeten op de gekozen eigenschap identiek zijn.
Iedereen moet in een categorie passen.
Alle bovenstaande.

Vraag 2

Combineer de begrippen aan de juiste voorbeelden:

1. Nominaal

2. Ordinaal

3. Ratio

4. Interval

A. Leeftijd

B. Intelligentie

C. Geslacht

D. Reactietijd

Vraag 3

Bepaal of de uitspraken waar of niet waar zijn.

Een meeteenheid is arbitrair omdat de oorspronkelijke eenheid arbitrair bepaald is.
Een meeteenheid is arbitrair omdat deze meerdere soorten objecten kan meten.
Een meeteenheid is arbitrair omdat deze meerdere soorten metingen kan verrichten.

Vraag 4

Bij een interval schaal kan men de volgende berekeningen toepassen:

Bij een interval schaal kan je niet iets berekenen alleen onderscheid maken in categorieën.
Je kan hierbij optellen en aftrekken.
Je kan hierbij vermenigvuldigen en delen maar ook optellen en aftrekken.
Je mag hierbij alleen vermenigvuldigen en delen.

Vraag 5

Welke van deze vier voorbeelden hoort thuis in een interval schaal?

Graden Celsius
Reactietijd
Geld
Afstand

Vraag 6

Wat is het verschil tussen een ordinale schaal en een nominale schaal?

Bij een nominale schaal is er geen nulpunt en bij een ordinale schaal wel.
Bij een nominale schaal is er geen volgorde en bij een ordinale schaal wel.
Bij een ordinale schaal is er geen nulpunt en bij een nominale schaal wel.
Bij een ordinale schaal is er geen volgorde en bij een nominale schaal wel.

Vraag 7

Meten met een meeteenheid gaat uit van een belangrijke assumptie, welke is dit?

De maat van de meeteenheid moet altijd dezelfde maat hebben.
De meeteenheid kan altijd op meerdere manieren gebruikt worden.

Vraag 8

Bij een rijexamen is er sprake van een ….. variabele waarbij men kan slagen of zakken. Het bloedtype van een proefpersoon is op basis van een …. variabele.

Dichotome, Categorische
Dichotome, Continu
Categorische, Dichotome
Categorische, Continu

Antwoordindicatie Meerkeuzevragen

Vraag 1

D. De drie genoemde eisen zijn de standaard eisen waar een categorie aan moet voldoen.

Vraag 2

C, want geslacht heeft categorieën maar geen volgorde,
A, want leeftijd heeft een volgorde,
D, want reactietijd heeft een absoluut nulpunt,
B, want intelligentie heeft een arbitrair nulpunt.

Vraag 3

Alle drie de uitspraken zijn waar.

Vraag 4

B. Bij een interval schaal heb je een arbitrair nulpunt, je kan daarom wel optellen en aftrekken, maar niet vermenigvuldigen en delen.

Vraag 5

A. Bij graden celsius is er een arbitrair nulpunt, daarom is een interval schaal hier geschikt voor.

Vraag 6

B. Nominaal geeft alleen verschil aan en interval geeft, naast een verschil, ook een volgorde aan.

Vraag 7

A. Als de maat van de meeteenheid niet altijd hetzelfde is kun je er niet mee meten, omdat je totaal dan geen/ weinig informatie geeft.

Vraag 8

A. Dichotoom heeft 2 opties: (0 of 1 / zakken of slagen etc.) en een categorische variabele heeft meerdere categorieën( niet per se gelimiteerd tot 2 opties).

Wat betekenen variabiliteit en co-variabiliteit? - TentamenTests 3

Meerkeuzevragen

Vraag 1

Wat is het verschil tussen variabiliteit en co-variabiliteit?

Het onderwerp wat vergeleken wordt met een ander (bij beide hetzelfde) onderwerp.
De onderwerpen die met elkaar vergeleken worden.
Beide bovenstaande antwoorden zijn correct.
Geen van bovenstaande antwoorden is correct.

Vraag 2

Er wordt een test (Test A) uitgevoerd waarbij er sprake is van meerdere meetmomenten. Iedere participanten doet op ieder meetmoment opnieuw dezelfde test (Test A). De meetresultaten van de verschillende participanten op alle momenten worden met elkaar vergeleken. Naar welke verschillen kan er gekeken worden?

Alleen intra-individuele verschillen.
Alleen Interindividuele verschillen.
Zowel intra-individuele als interindividuele verschillen.
Geen van beide verschillen.

Vraag 3

Bereken het gemiddelde van beide rijen afzonderlijk:

100, 120, 110, 105, 115.
11, 13, 17, 33, 16, 6.

Vraag 4

Bereken de variantie vanuit de volgende standaard deviaties:

s = 100
s = 1
s = 25,2

Vraag 5

Bereken de standaard deviaties vanuit de volgende varianties:

s² = 2500
s² = 900
s² = 144

Vraag 6

Combineer de meest waarschijnlijke correlaties aan de goede onderwerpen:

1. 0,65	A. De correlatie tussen alcoholpromillage en de vaardigheid om recht over een lijn te lopen.
2. -0,65	B. De correlatie tussen opleidingsniveau en inkomen
3. 0,0	C. De correlatie tussen haarkleur en geslacht.

Vraag 7

Wat is de standaard deviatie bij een Sum of Squares van 2000 met N=5 ?

20
400
22,36
√500

Vraag 8

Vul de tabel (a t/m e) verder in:

	Deviatie X	Deviatie Y	Cross-product
A.	0	20
B.	10	10
C.	0	30
D.	20	5
E.	5	10

Vraag 9

Welke correlatie lijst(en) kloppen?

A.	B.	C.	D.
0,5	0,5	0,9	-0,9
-0,5	0,7	0,4	-0,7
0,7	0,2	1,4	-0,6
0,2	0,8	0,8	-1,6

Vraag 10

Is de onderstaande normtabel voor de ruwe testscore X (M = 80, SD = 12) correct?

X	z	T
68	-2	26
74	-1	38
80	0	50
86	1	62
92	2	74

Alleen de z-scores zijn correct; de T-scores zijn niet correct.
Alleen de Tt-scores zijn correct, de z-scores zijn niet correct.
Zowel de z-scores als de T-scores zijn correct.
Zowel de z-scores als de T-scores zijn niet correct.

Antwoordindicatie Meerkeuzevragen

Vraag 1

B. Co-variabiliteit is de mate waarmee de variabiliteit tussen verschillende score sets met elkaar overeenkomen. Variabiliteit is het verschil binnen een set scores. Daarom zijn de onderwerpen verschillend en is er geen sprake van 1 hetzelfde onderwerp bij covariabiliteit en variabiliteit.

Vraag 2

C. Er kan zowel naar intra-individuele verschillen (de resultaten van een participant over alle meetmomenten) gekeken worden als naar interindividuele verschillen (tussen de participanten).

Vraag 3

100+120+110+105+115= 550. 550/N = gemiddelde. 550/5=110.
11+13+17+33+16+6 = 96 --> 96/6 = 16

Vraag 4

s² is de variantie. Omde variantie te berekenen door middel van standaarddeviaties, moeten de standaarddeviaties gekwadrateerd worden.

100²= 10.000
1²= 1
25,2²= 635,04

Vraag 5

s² is de variantie. Om de standaarddeviatie te berekenen door middel van de variantie, bereken je de wortel van de variantie om vanuit deze variantie naar standaard deviaties om te rekenen hoeft er alleen maar √s berekend te worden.

√2500= 50
√900= 30
√144= 12

Vraag 6

B, de hoogte van je opleidingsniveau zal waarschijnlijk een positief verband hebben met je inkomen.
A, hoe hoger je alcoholpromillage, hoe minder goed de vaardigheid om recht over een lijn te lopen zal zijn, dit is dan ook een negatief verband.
C

Vraag 7

A. De eerste stap in deze berekening is om de sum of squares te delen door de populatie (N): 2000/5 = 400 = s². Vervolgens trek je de wortel van deze uitkomst: √400 = 20.

Vraag 8

Om een kruisproduct te berekenen kun de deviaties met elkaar vermenigvuldigen.

0 x 20 = 0
10 x 10 = 100
0 x 30 = 0
20 x 5 = 100
5 x 10 = 50

Vraag 9

Lijst A en B zijn goed, correlaties kunnen tussen de -1 en 1 zijn.

Vraag 10

D. Zowel de z-scores als de T-scores zijn correct.

Wat is test dimensionaliteit en wat is factor analyse? - TentamenTests 4

Meerkeuzevragen

Vraag 1

Welke vragen worden gesteld in verband met de dimensionaliteit van een test?

I. Hoeveel dimensies de test heeft.
II. Hoe deze dimensies gemeten worden
III. Wanneer deze dimensies gemeten worden
IV. Of de dimensies gecorreleerd zijn.

Alleen I. en II. zijn waar
Alleen III. en IV. zijn waar
Alleen I. en IV. zijn waar
Alleen II. en III. zijn waar

Vraag 2

De WISC intelligentietest is een voorbeeld van een:

Unidimensionale test.
Multidimensionale test met gecorreleerde dimensies.
Multidimensionale test zonder gecorreleerde dimensies.

Vraag 3

Combineer de begrippen:

1. Unidimensionale test

2. Multidimensionale test met gecorreleerde dimensies

3. Multidimensionale test zonder gecorreleerde dimensies

A. Test with higher order factors

B. Conceptuele homogeniteit

C. Test without higher order factors

Vraag 4

Welke bewering(en) is/zijn waar?

I. Een test waarbij vragen alleen rekenvaardigheid reflecteren is een unidimensionale test.
II. Een test waarbij rekenvaardigheid en leesvaardigheid gereflecteerd worden is een multidimensionale test.
III. De WISC is een unidimensionale test.

Alleen I. en II. zijn waar
Alleen I. is waar
Alleen II. is waar
Alleen II. en III. zijn waar
Geen van de beweringen is waar

Vraag 5

Welke bewering(en) is/zijn niet waar?

I. EFA wordt het vaakst gebruikt van de factoranalyses.

II. De eerste stap van het uitvoeren van een EFA is het identificeren van het aantal dimensies.

III. Er is geen simpele regel voor het identificeren van het aantal dimensies.

IV. Bij eigenwaarden zoek je naar een punt met groot verschil tussen de opeenvolgende eigenvalues.

I en II zijn waar
I, III en IV zijn waar
Alle beweringen zijn waar
Alle beweringen zijn niet waar

Vraag 6

Wanneer we naar de "eigenwaarden groter dan één" regel kijken, hoeveel dimensies zijn er dan?

Factor	Totaal
1	1,500
2	1,200
3	0,900
4	0,750
5	0,450
6	0,350

1
2
3
4 of meer

Vraag 7

Welke van deze beweringen zijn waar?

I. CFA gebruik je als je al een beter beeld hebt bij de test.
II. Met een CFA controleer je je eigen idee over bijvoorbeeld dimensies.

Alleen I. is waar
Alleen II. is waar
Beide beweringen zijn waar
Beide beweringen zijn niet waar

Vraag 8

In een PCA-oplossing wordt veruit de meeste variantie verklaard door de eerste twee componenten. Er wordt een plaatje gemaakt van de 2-componenten oplossing, dat er als volgt uitziet:

Welk paar van variabelen is vermoedelijk het hoogst gecorreleerd?

V₅ en V₆
V₂ en V₈
V₄ en V₅
V₂ en V₃

Vraag 9

Welke van de volgende uitspraken over principale componenten in PCA is niet juist?

Bij keuze van een principale component wordt ware score variantie gemaximaliseerd ten koste van error-variantie.
Een principale component kan opgevat worden als een richting in de p-dimensionale ruimte van de variabelen.
In de ongeroteerde oplossing is elke principale component orthogonaal ten opzichte van alle andere principale componenten.
De eerste principale component verklaart zo veel mogelijk variantie van de variabelen.

Antwoordindicatie Meerkeuzevragen

Vraag 1

C. De derde vraag (niet genoemd in deze vraag) die gesteld wordt is als er meer dimensies zijn, wat zijn dan die dimensies?

Vraag 2

B. Een intelligentietest bestaat uit een algemene factor gemeten door verschillende subfactoren. De subfactoren vertegenwoordigen ieder verschillende soorten intelligentie.

Vraag 3

Vraag 4

A. Een test waarbij vragen alleen rekenvaardigheid reflecteren is een unidimensionale test, omdat er maar een dimensie gemeten wordt. Bij rekenvaardigheid en leesvaardigheid zijn dit er twee, dus dit is een multidimensionale test. De WISC is een multidimensionale test, want deze reflecteert verschillende psychologische attributen.

Vraag 5

B. Het identificeren van het aantal dimensies ofwel factoren is de tweede stap bij het uitvoeren van een EFA. De eerste stap is het kiezen van een statistische techniek.

Vraag 6

B. Bij de eigenwaarde groter dan één regel kijk je naar de aantal waardes groter dan 1. Iedere waarde groter dan 1 telt als een dimensie. In dit geval zijn er 2 waardes groter dan 1, de test bestaat dan mogelijk uit 2 dimensies.

Vraag 7

C. Beide uitspraken zijn waar. CFA is een test om jouw bestaande idee over de test te controleren.

Vraag 8

D. V₂ en V₃

Vraag 9

A. Bij keuze van een principale component wordt ware score variantie gemaximaliseerd ten koste van error-variantie.

Wat houdt het basisbegrip betrouwbaarheid in? - TentamenTests 5

Meerkeuzevragen

Vraag 1

Uit welke van de onderstaande factoren is betrouwbaarheid niet afgeleid volgens de Klassieke Testtheorie?

Ware scores
Geobserveerde scores
Totale scores
Meetfouten

Vraag 2

Hoe wordt betrouwbaarheid in de klassieke testtheorie gedefinieerd?

De variantie van de error scores gedeeld door die van de geobserveerde scores.
De variantie van de geobserveerde scores gedeeld door die van de ware scores.
De variantie van de ware scores gedeeld door die van de geobserveerde scores.
De variantie van de geobserveerde scores gedeeld door die van de error scores.

Vraag 3

Wat is een belangrijke assumptie over de error?

De error heeft een random effect en is onafhankelijk van de variabelen.
Het effect van error is 0.
De error heeft geen random effect en is niet onafhankelijk van de variabelen.

Vraag 4

Wat zijn de gevolgen van de assumptie van vraag 3? Je mag meerdere antwoorden selecteren.

Het gemiddelde effect van de error is nul.
Error scores zijn niet gecorreleerd met ware scores.
Error scores zijn niet gecorreleerd met geobserveerde scores.
Error scores zijn wel gecorreleerd met ware scores.

Vraag 5

r²_oe = 0.4, s²_e = 20. Wat is de betrouwbaarheid?

Vraag 6

S²_e = 200, S²_o = 600. Wat is de betrouwbaarheid?

0,33
0,50
0,67
0,75

Vraag 7

Welke van de volgende beweringen zijn niet waar?

Als r²_oe nul is, is de betrouwbaarheid 1.
Als r²_oe nul is, is de betrouwbaarheid ook nul.
Als c_oe 1 is, is s²_e dat ook.
Als c_oe 1 is, is s²_e 0.

Vraag 8

I. se_m kan nooit groter zijn dan S_o
II. se_m is 0 als R_XX 1 is.

Alleen I is waar
Alleen II is waar
Beide antwoorden zijn waar.
Geen van de antwoorden is waar.

Vraag 9

Soms kunnen twee testen parallel genoemd worden. Geef van iedere van de onderstaande aannames aan of deze test hieraan moet voldoen:

Beide tests hebben dezelfde errorvariantie.
Beide tests hebben hetzelfde gemiddelde.
De ware scores van de tests zijn gelijk over alle testen.

Vraag 10

R_XX= 0,7, S²_o=200. Wat is s_em?

3,439
10,46
28
140

Vraag 11

Welk van de vier onderstaande modellen kent de meeste restricties (assumpties)?

Parallelle testen
Tau-equivalent
Essentially tau-equivalent
Congenerisch

Vraag 12

Wat is de betrouwbaarheid van een test met een standaarddeviatie van de geobserveerde scores 15 en een standaardmeetfout van 9?

0.75
0.64
0.60
0.40

Antwoordindicatie Meerkeuzevragen

Vraag 1

C. Totale scores horen er niet bij. Betrouwbaarheid is opgebouwd uit ware scores, geobserveerde scores en meetfouten.

Vraag 2

C. De variantie van de ware scores gedeeld door die van de geobserveerde scores.

Vraag 3

A. De error heeft een random effect en is onafhankelijk van de variabelen.

Vraag 4

A en B.

Vraag 5

A. R_xx= 1 - r²_oe. Dus 1-0,4 = 0,6

Vraag 6

s²_t= - s²_o - s²_e

s²_t = 600 - 200 = 400

R_XX = s²_t/ s²_o

R_XX = 400/600 = 0.67

Vraag 7

B en D zijn niet waar: R_XX= 1-r²_oe. En c_oe is gelijk aan s²_e.

Vraag 8

C. Een error kan niet hoger zijn dan de totaal geobserveerde score. Als er geen meetfout zou zijn, was er een perfecte betrouwbaarheid.

Vraag 9

Wel voldoen
Niet voldoen
Wel voldoen

Vraag 10

R_XX= 0,7, s²_o=200.

s_e= se_m

s²_e= s_o√(1 - R_XX) = 200 √(1 - 0,7) = 109,54

s_e = √109,54 = 10,46

se_m= 10,46

Vraag 11

A. Bij parallelle testen worden de meeste assumpties gedaan. Naast de standaard assumpties uit de klassieke testtheorie telt dit model nog drie assumpties.

Vraag 12

s_o= 15 en se_m= 9

se_m=s_e

s²_o= 15²= 225

s²_e = 9² = 81

R_XX = 1- (s²_e / s²_o)

R_XX= 1- (81/225) = 0,64

Hoe kunnen empirische schattingen van de betrouwbaarheid worden gedaan? - TentamenTests 6

Meerkeuzevragen

Vraag 1

Wanneer is er sprake van een paralleltest?

I. De twee testen zijn parallel als beide testen dezelfde set ware scores meten.
II. De twee testen zijn parallel als ze allebei evenveel errorvariantie hebben.
III. De twee testen zijn parallel als dezelfde test twee keer wordt gemeten.

Alleen bij I.
Alleen bij I. en II.
Alleen bij II.
Bij II. en III.

Vraag 2

Als proefpersonen een afwijkende score hebben door een eerdere test, kan er dan een goede betrouwbaarheid gemeten worden vanuit een paralleltest?

Nee, er is dan geen sprake meer van een paralleltest
Ja, de betrouwbaarheid kan nog gemeten worden
Dit is onbekend

Vraag 3

Welke van de redenen, waarom de stabiliteitsassumptie van de test-hertest betrouwbaarheid problematisch kan zijn, zijn waar? (Er kunnen meerdere antwoorden goed zijn).

Sommige attributen zijn niet zo stabiel als andere attributen.
De intervallengtes brengen soms problemen met zich mee.
Sommige periodes in het leven van een participant zijn niet zo stabiel.

Vraag 4

Wat is het gevolg van het niet kloppen van de stabiliteitsassumptie?

De betrouwbaarheid kan niet goed gemeten worden.
De meetfout en de verandering v.d. ware scor

Vraag 5

Interne consistentie is een praktisch alternatief voor ‘alternate form’ en test-hertest betrouwbaarheid. Waarom is dit het geval?

Er is niet meer dan 1 test nodig.
Er is niet meer dan 1 test moment nodig.
Zowel A als B zijn waar.
A en B zijn niet waar.

Vraag 6

Wanneer we kijken naar Split half estimates, en de r_hh = 0,4. Wat is dan de R_xx?

0,38
0,40
0,57
0,80

Vraag 7

Wat is de betrouwbaarheid wanneer je over deze gegevens beschikt: r_ii = 0,6. k=5?

0,33
0,66
0,88
0,95

Vraag 8

Welke berekening is gebruikt bij de vorige vraag?

Ruwe alpha coëfficiënt
Split-half schattingen
Gestandaardiseerde alpha coëfficiënt
Ruwe alpha voor binaire items

Vraag 9

Wat is geen erkende schattingswijze van de betrouwbaarheid van een test?

Coëfficiënt alpha die berekend is over de items van een test.
De correlatie tussen de scores op een test en die op een paralleltest.
De correlatie tussen de scores op een test en die op een herhaalde testafname.
De correlatie tussen de scores op een test voor een interventie en die op dezelfde test na de interventie.

Vraag 10

Een test van 30 items wordt in twee parallelle stukken gesplitst van elk 15 items. De correlatie tussen de scores op elke stuk van 15 items bedraagt 0.60. Wat is de betrouwbaarheid van de gehele test volgens de “prophecy” formule van Spearman-Brown?

0.45
0.75
0.82
0.88

Antwoordindicatie Meerkeuzevragen

Vraag 1

B. 1 en 2 zijn de standaardregels m.b.t. de paralleltest, regel nummer 3 heeft te maken met test-hertest betrouwbaarheid.

Vraag 2

A. Dit zou volgens de klassieke testtheorie betekenen dat de errorscores wel correleren, waardoor er geen sprake meer is van een echte paralleltest.

Vraag 3

Alle drie de antwoorden kloppen.

Vraag 4

C. Als de stabiliteitsassumptie niet klopt heb je een score met daarin de verandering van de ware score en de meetfout, dus kan je geen van beide los bepalen. Je betrouwbaarheid kan door deze meetfouten niet goed berekend worden.

Vraag 5

C. Bij een interne consistentie betrouwbaarheid heb je maar 1 test nodig en ook maar 1 testmoment om te bepalen wat de betrouwbaarheid is.

Vraag 6

C = 0,57. R_xx= 2rhh / 1+rhh.
R_xx= (2x0,4)/ 1,4 = 0,8/1,4 = 0,57.

Vraag 7

C. R_xx= kr_ii / 1+(k-1) r_ii.
R_xx= (5x0,6) / (1+ (5-1) x 0,6 = 3 / 3,4 = 0,88

Vraag 8

C. Gestandaardiseerde alpha coëfficiënt

Vraag 9

D. De correlatie tussen de scores op een test voor een interventie en die op dezelfde test na de interventie.

Vraag 10

B. 0.75

Wat is het belang van betrouwbaarheid? - TentamenTests 7

Meerkeuzevragen

Let op aangepaste notatie in dit chapter:

XM_o = gemiddelde geobserveerde score, M van Mean (bij de normale notatie heeft X een streepje erboven).

Vraag 1

Hoe ziet de formule voor de geschatte ware score eruit?

X_est = XM_o+ R_XX (X_o - XM_o)
X_est = X + R_XX (X_o - X)
Xest = XM_o+ R_XX(X_o- X_e)
Xest = X + R_XX (X_o-X_e)

Vraag 2

R_xx = 0,5, s_o = 5. Wat is de se_m?

2,35
2,50
3,54
5,71

Vraag 3

Wat is het 95% betrouwbaarheidsinterval voor de volgende gegevens?

se_m = 5, X_t = 15, X_e = 5.

Vraag 4

Welke van de beweringen kloppen?

Covariantie van X en Y heeft deze formule: Covx0y0=Cxtyt+cxtye+cxeye+Cxeyteo.
Covariantie van X en Y heeft deze formule: Cx0y0=cxtyt+cxtye+cxeyt+cxeye.
Covariantie van X en Y heeft een verkorte formule: cxy=cxtyt.
Covariantie van X en Y heeft een verkorte formule: cxy=cxtyt/SoSy0.

Vraag 5

Welke van deze gevolgen van meetfouten is niet waar?

Geobserveerde score correlaties zullen altijd zwakker zijn dan die van ware scores.
Het is niet mogelijk een inschatting te geven van de ware correlatie, als deze niet beïnvloed was door verzwakking, tussen twee constructen.
De error beperkt de maximaal te vinden correlatie.
De mate van verzakking (attenuation) hangt samen met de mate van betrouwbaarheid van de individuele testen.

Vraag 6

Wat betekent het om een hoge item-totaal correlatie te hebben?

Dat een persoon op een bepaald item lijkt op het geheel van de participanten.
Dat een persoon op een bepaald item niet lijkt op het geheel van de participanten.
Dat een test-item consistent is met de test.
Dat 1 participant op een bepaald item afwijkt ten opzichte van zijn geheel aan antwoorden.

Vraag 7

Wat wordt vergeleken bij de item discriminatie index (D)?

De proportie (p) van mensen die hoog scoorden op de test met de proportie (p) van mensen die laag scoorden op de test. Zowel goed als fout beantwoorde vragen.
De proportie (p) van mensen die hoog scoorden op de test met de proportie (p) van mensen die laag scoorden op de test. Alleen wanneer goed beantwoorde vragen.
Het effect van een item op een test met andere items op dezelfde test.
Het proportie items waar goed op geantwoord is.

Vraag 8

Wat zegt een itemgemiddelde van 0,85 bij een binaire test?

Dat 85% van de participanten een item goed heeft beantwoord.
Dat een participant 85% kans heeft op een goed antwoord.
Dat een item 85% betrouwbaar is.
Geen van de bovenstaande antwoorden.

Antwoordindicatie Meerkeuzevragen

Vraag 1

A. X_est = XM_o+ R_XX (X_o - XM_o)

Vraag 2

C. se_m = s_o√(1-R_xx).

se_m= 5 x √(1 - 0,5)

se_m= 5 x 0,71 = 3.54

Vraag 3

Voor het 95%-betrouwbaarheidsinterval gebruik je deze formule: Xo±(1,96)(Se_m).
De z score bij 2 standaarddeviaties (95%) is 1,96. Die houden we aan in de formule.
se_m is 5 dus Xo is de enige onbekende in de formule. We weten dan X_t+X_e=X_o.
Dus X_o is in dit geval 15+5 = 20.
20±(1,96)(5). --> 20±9,8. Betrouwbaarheidsinterval v. 95%: 10,2 tot 29,8.

Vraag 4

B en C zijn goed.

D is de correlatie die berekend kan worden uit deze covariantie; A heeft notatiefouten.

Vraag 5

B is fout want consequentie 4 geeft aan dat het mogelijk is de ware correlatie te schatten tussen een tweetal constructen. Er is een formule (de correctie van verzwakking) waarbij de ware correlatie mee geschat kan worden als er geen sprake zou zijn van verzwakking.

Vraag 6

C. Dat een test-item consistent is met de test.

Vraag 7

B. alleen goed beantwoorde vragen worden meegenomen in deze vergelijking.

Vraag 8

A. 0,85 geeft de mate aan waarin participanten een item goed hebben beantwoord en dit staat gelijk aan 85%.

Wat is validiteit? - TentamenTests 8

Meerkeuzevragen

Vraag 1

Indruksvaliditeit (face validity) is:

De mate waarin een meting gerelateerd lijkt aan een specifiek construct.
De mate waarin een meting gerelateerd is aan een specifiek construct.
De zichtbare betrouwbaarheid van de test.
De mate waarin de constructen goed gemeten worden.

Vraag 2

Als iemand wil weten of een test een goede meetmethode is voor een construct:

Geeft content validiteit goede informatie.
Geeft face validiteit goede informatie.
Geeft betrouwbaarheid goede informatie.

Vraag 3

Factor analyse zorgt ervoor:

Dat de interne structuur van een test gemeten kan worden.
Dat aparte factoren toegevoegd kunnen worden.
Dat factoren verwijdert worden.
Dat een factor van een test geanalyseerd kan worden.

Vraag 4

Welke functie heeft factor analyse niet?

Gelinkte items aan bijbehorende factoren koppelen.
Verbanden tussen factoren in een multidimensionale test vinden.
Uitvinden van aantal factoren in set van items.
Onderscheiden van items binnen een factor.

Vraag 5

Motivatie is in onze resultaten gecorreleerd aan betere resultaten, dit zou theoretisch ook zo moeten zijn. Er is sprake van:

Discriminant bewijs
Convergent bewijs
Geen van beide
Zowel A als B

Vraag 6

In de theorie zijn IQ en geluk niet gecorreleerd, er komt geen verband terug in het onderzoek. Er is sprake van:

Discriminant bewijs
Convergent bewijs
Geen van beide
Zowel A als B

Vraag 7

Het theorie rijexamen is een voorbeeld van:

Concurrente validiteit
Predictieve validiteit
Discriminant bewijs

Vraag 8

Is het waar dat criterium validiteit wordt gebruikt om groepen te onderscheiden?

Ja
Nee
Hier kan geen uitspraak over gedaan worden.

Vraag 9

Welke vorm van validiteit staat centraal in onderzoek naar personeelsselectie?

Content validity
Predictive validity
Face validity
Construct validity

Vraag 10

De validiteit van een nieuwe vragenlijst voor depressie (N) wordt onderzocht door vergelijking met een bestaande vragenlijst voor depressie (D) en een bestaande vragenlijst voor werkhouding (W). Het uitgangspunt is dat depressie en werkhouding nauwelijks mogen samenhangen. De volgen de correlaties worden gevonden: rND = 0.63, rNW = 0.11 en rDW = 0.08. Dit wijst op:

Alleen divergente validiteit van N.
Alleen convergente validiteit van N.
Zowel convergente als divergente validiteit van N.
Noch convergente, noch divergente validiteit van N.

Vraag 11

Beoordeel of het juist is dat de “work sample” methode van personeelsselectie is gebaseerd op de volgende assumpties.

I. Toekomstig gedrag kun je goed voorspellen op basis van huidig gedrag.
II. Toekomstige werkprestaties zijn goed te voorspellen als je de persoonlijkheidskenmerken van de sollicitant weet.

Stelling I is niet correct, stelling II is correct
Stelling I is correct, stelling II is niet correct
Beide stellingen zijn correct
Geen van beide stellingen is correct

Antwoordindicatie Meerkeuzevragen

Vraag 1

A. Bij face validiteit draait het er alleen om dat het zo gerelateerd lijkt, niet of het wel of niet zo is.

Vraag 2

B. Participanten en dergelijke verstaan wij in het algemeen onder de non-experts en als wij kijken naar de opinie over de validiteit van deze groep hebben we het over face validity: of het in eerste instantie zo lijkt te zijn.

Vraag 3

A. In dit geval is de inhoud wel van belang. Hoe het eruit ziet en hoe betrouwbaar het is zijn hierbij van minder belang.

Vraag 4

A. Gelinkte items aan bijbehorende factoren koppelen.

Vraag 5

D. Zowel A als B

Vraag 6

B. Convergent bewijs

Vraag 7

A. Discriminant bewijs beschrijft de mate waarin testscores ongecorreleerd zijn met tests van ongecorreleerd construct.

Vraag 8

B. Want de meting is de mate waarin de huidige testscore (kennis over verkeersregels) gecorreleerd is met een relevante variabele die in de toekomst pas gemeten kan worden (het kunnen autorijden en de verkeersregels toepassen).

Vraag 9

A. Ja, criterium validiteit kan groepen verdelen (wel voldaan en niet voldaan aan een specifiek criterium).

Vraag 10

B. Alleen convergente validiteit van N.

Vraag 11

C. Beide stellingen zijn correct

Hoe kun je bewijs voor convergente en discriminante validiteit evalueren? - TentamenTests 9

Meerkeuzevragen

Vraag 1

Validiteit generalisatie onderzoek heeft als doel:

Het evalueren van het voorspellend vermogen van een testscore over verschillende settings en situaties.
Het evalueren van voorspellend vermogen van testscores binnen een setting of situatie.
Het vergelijken van alle soorten validiteit.
Geen van de bovengenoemde opties.

Vraag 2

Waar staat MTMMM voor?

Vraag 3

Wat is geen belangrijk kenmerk van een MTMMM?

Er worden meerdere metingen voor traits uitgevoerd.
Er worden meerdere soorten metingen uitgevoerd.
Er wordt onder andere gedeelde methode variantie ontweken.
Er wordt bij heterotrait-heteromethod de sterkte correlatie verwacht.

Vraag 4

Verbind de soorten correlaties aan de voorbeelden:

Correlatie

Voorbeeld

1. Heterotrait-heteromethod

2. Heterotrait-monomethod

3. Monotrait-heteromethod

4. Monotrait-monomethod

A. Sociale vaardigheidsmeting via observatie en geluksgevoel via vragenlijst.

B. Sociale vaardigheid via observatie en vragenlijst.

C. Geluksgevoel en sociale vaardigheid via vragenlijst.

D. Geluksgevoel via vragenlijst.

Vraag 5

Welke bewering(en) is/zijn waar?

QCV is bedoeld om een precieze en objectieve schatting te geven.
QCV is in deze nadruk op precisie anders dan eerder besproken aanpakken.
rcontrastCV is een van de effect sizes.
Een waarde van ralertingCV van -0,5 is mogelijk.

Vraag 6

Bereken de correlatie tussen motivatie en algemene interesse.
Ware correlatie is 0,6, Motivatietest is 0,81 betrouwbaar, Algemene interesse is 0,49.

0,238
0,378
0,622
0,762

Vraag 7

De formule voor de correlatie tussen een continue en een dichotome variabele (rCD) is:

r_CD = c_CD / S_D
r_CD = c_CD / s_Cs_D
r_CD = p₁p₂ (C_2gem – C_1gem)

Vraag 8

Als er uitgegaan wordt van de richtlijn van Cohen en er is een betrouwbaarheid van 0,58...

... dan is dit een kleine correlatie
... dan is dit een medium correlatie
... dan is dit een grote correlatie
... Hier zijn onvoldoende gegevens voor bekend

Vraag 9

Als er uitgegaan wordt van de richtlijn van Hemphill en er is een betrouwbaarheid van 0,29...

... dan is er geen sprake van een kleine correlatie
... dan is dit een kleine correlatie
... dan is dit een medium correlatie
... dan is dit een grote correlatie

Vraag 10

Een test voor paranoia, een aandoening die bij 2.5 procent van de bevolking voorkomt, heeft een sensitiviteit (i.e., gevoeligheid) van .80 en een specificiteit (i.e., specifiekheid) van .95. Joop verneemt op basis van deze test dat hij een paranoia-lijder is, maar vermoedt dat zijn vijanden hierachter zitten. Hoe groot is de kans dat Joop werkelijk aan paranoia lijdt?

76 – 100 %
51 – 75 %
26 – 50 %
0 – 25 %

Vraag 11

Wat verstaan we onder de specificiteit van een meetinstrument dat de aanwezigheid (positieve diagnose) of afwezigheid (negatieve diagnose) van een bepaalde aandoening wil vaststellen?

De kans dat iemand die de aandoening heeft een negatieve diagnose krijgt.
De kans dat iemand die de aandoening niet heeft een negatieve diagnose krijgt.
De kans op een negatieve diagnose.
De kans dat iemand die de aandoening niet heeft een positieve diagnose krijgt.

Antwoordindicatie Meerkeuzevragen

Vraag 1

A. Het evalueren van het voorspellend vermogen van een testscore over verschillende settings en situaties.

Vraag 2

MultiTrait-MultiMethod Matrices. (wat hier hoofdletters heeft vormt samen MTMMM)

Vraag 3

D. bij een heterotrait-heteromethod wordt juist de laagste correlatie verwacht omdat correlaties door het gebruiken van dezelfde methode en dergelijke eruit gefilterd zijn.

Vraag 4

Vraag 5

Alle vier de beweringen zijn waar.

Vraag 6

B. R_xoyo = r_xtyt √(R_xxR_yy).
R_xoyo = 0,6 x(0,9x0,7)=0,6x0,63=0,378.

Vraag 7

A. r_CD = c_CD / S_D

Vraag 8

C. ... dan is dit een grote correlatie

Vraag 9

C. ... dan is dit een medium correlatie

Vraag 10

C. 26 – 50 %

Vraag 11

B. De kans dat iemand die de aandoening niet heeft een negatieve diagnose krijgt.

Welke soorten reactiebias zijn er? - TentamenTests 10

Meerkeuzevragen

Vraag 1

Op een multiple choice toets is er kans op welke types van response bias?

Acquiensence bias
Extreme / gemiddelde antwoorden
Sociale wenselijkheid
Overdrijven van problemen
Random antwoorden
Gokken

Vraag 2

Bij welke bias is een participant het te snel eens of oneens met een statement, zonder de betekenis hiervan volledig te snappen?

Acquinsence bias
Extreme / gemiddelde antwoorden
Sociale wenselijkheid
Overdrijven van problemen
Random antwoorden
Gokken

Vraag 3

Wanneer een test niet anoniem is, is er meer kans op:

Acquiensence bias
Extreme / gemiddelde antwoorden
Sociale wenselijkheid
Overdrijven van problemen
Random antwoorden
Gokken

Vraag 4

Wat voor bias is waarschijnlijk bij iemand die de test lang vind duren en saai vindt?

Acquiensence bias
Extreme / gemiddelde antwoorden
Sociale wenselijkheid
Overdrijven van problemen
Random antwoorden
Gokken

Vraag 5

Als iemand profijt heeft bij bijvoorbeeld een diagnose van een aandoening, welke bias zou dan kunnen voorkomen?

Acquiensence bias
Extreme / gemiddelde antwoorden
Sociale wenselijkheid
Overdrijven van problemen
Random antwoorden
Gokken

Vraag 6

Welke stellingen zijn correct?

Een goede manier om antwoordbias tegen te gaan is door de test zo te maken dat de kans op een antwoordbias kleiner wordt.
Het anoniem maken van tests vermindert sociaal wenselijke antwoorden.
Aan anonimiteit zitten weer risico’s voor andere vormen van bias.
Een betere concentratie van de participant zou kunnen helpen bias te voorkomen.

Vraag 7

Welke van de genoemde stellingen zijn waar?

Te lange tests hebben een negatief effect op de validiteit.
Als een participant denkt dat onoprechte antwoorden herkent kunnen worden neemt de validiteit toe.
Beide zijn waar.
Geen van de antwoorden is waar.

Vraag 8

Bij welke van de vier opties hoort het voorbeeld:

Een man gaat naar de dokter voor een test van een aandoening. Een week later krijgt hij te horen dat uit de test blijkt dat hij inderdaad de aandoening heeft. De test is incorrect.

True positive
False positive
False negative
True negative

Antwoordindicatie Meerkeuzevragen

Vraag 1

F. Er is kans dat mensen zullen gaan gokken bij een meerkeuze toets.

Vraag 2

A. Acquiensence bias houdt in dat mensen snel ja of nee of in een richting antwoorden op een stelling zonder goed na te denken over wat de betekenis hiervan is.

Vraag 3

C. Als mensen meedoen aan een test waarbij hun naam opgegeven moet worden is de kans groter dat ze sociaal wenselijke antwoorden zullen geven.

Vraag 4

E. Als iemand de test saai vind of te lang vind duren bestaat er een kans dat diegene niet meer serieus de vragen zal lezen en beantwoorden. Diegene zal dan random of beurtlings antwoord gaan geven op vragen wat niets meer met zijn of haar eigen mening/ervaringen te maken heeft.

Vraag 5

D. Overdrijven van problemen (Malingering) is een verschijnsel waarbij iemand doet alsof zijn of haar hersenletsel/ aandoening / dergelijke erger is dan daadwerkelijk het geval is, omdat diegene hier persoonlijk gewin uit kan krijgen. Toeslagen, uitkering, andere zorg of schadevergoedingen kunnen als voorbeelden worden gezien voor een dergelijk persoonlijk gewin.

Vraag 6

Alle stellingen zijn waar.

Vraag 7

C. Beide zijn waar.

Vraag 8

B. Een false positive: het resultaat blijkt positief te zijn maar dit resultaat is niet terecht.

Welke soorten test bias zijn er? - TentamenTests 11

Meerkeuzevragen

Vraag 1

Wat is niet mogelijk met construct bias?

Alle scores op een test met elkaar vergelijken.
Scores van mensen uit verschillende groepen met elkaar vergelijken.
Scores van individuen uit 1 groep met elkaar vergelijken.
Een test er goed uit laten zien voor non-experts.

Vraag 2

Voorspellende bias is er wanneer ...

De relatie tussen ware en geobserveerde score verschilt tussen twee groepen.
Er geen relatie is tussen ware en geobserveerde score.
De relatie tussen ware en geobserveerde score juist op elkaar lijkt bij twee groepen.
Geen van de bovenstaande opties.

Vraag 3

Welke stelling is waar?

I. Item discriminatie index kan gebruikt worden om construct bias te ontdekken.
II. Differentiële item functie analyse kan ook gebruikt worden om construct bias te ontdekken.
III. Factor analyse kan gebruikt worden om de interne structuur van een test te evalueren, apart voor twee groepen.

Alle stellingen zijn waar
Alleen stelling I. en II. zijn waar
Alleen stelling I. en III. zijn waar
Alleen stelling II. en III. zijn waar
Geen van de stellingen is waar

Vraag 4

Zijn deze uitspraken waar of niet waar:

De predictieve en de construct bias zijn onafhankelijk van elkaar.
De predicitieve bias draait meer om de betekenis van de test.
De construct bias draait meer om de bruikbaarheid van de test.

Vraag 5

Is een verschil in testscores tussen groepen genoeg reden om aan te nemen dat er dan een bias is? (mogelijk meerdere antwoorden)

Ja, dit is een duidelijke indicatie en is daarom reden genoeg
Nee, er kan ook sprake zijn van een daadwerkelijk verschil tussen groepen.
Ja, maar alleen als de verschillende reacties niet gerelateerd zijn aan de groepsverschillen.

Vraag 6

Welke stelling is waar?

I. Twee aparte groepen in een test vertonen niet dezelfde interne structuur voor hun testscores. We kunnen daarom concluderen dat de test lijdt aan construct bias.

II. Twee aparte groepen in een test vertonen dezelfde interne structuur voor hun testscores. We kunnen daarom concluderen dat de test niet lijdt aan construct bias.

Alleen stelling I. is waar
Alleen stelling II. is waar
Beide stellingen zijn waar
Geen van beide stellingen is waar

Vraag 7

Wat is geen methode om construct bias te ontdekken?

Item discriminatie index
Factor analyse
Differentiële item functie analyse
Item order

Vraag 8

Zijn deze stellingen waar of niet waar?

Wanneer de gemeenschappelijke regressielijn overeenkomt met de gescheiden lijnen per groep is er een sprake van bias.
De gemeenschappelijke regressielijn is gebaseerd op een regressieformule aan de hand van alle data uit 1 groep.

Vraag 9

Zijn deze stellingen waar of niet waar?

Bij een interceptbias zijn de regressielijnen parallel aan elkaar.
Bij een slopebias zijn de regressielijnen parallel aan elkaar.

Vraag 10

Bij welke bias is er sprake van verschilconsistentie?

Interceptbias
Slopebias
Intercept en slopebias
Bij geen enkele van de bovenstaande biases is er sprake van verschilconsistentie.

Vraag 11

Welk type bewijs is niet van belang voor de constructvaliditeit?

Face validity van de items
Response processen van geteste personen
Interne structuur van de test items
Inhoudsvaliditeit van de items

Antwoordindicatie Meerkeuzevragen

Vraag 1

A. Want construct bias houdt in dat scores op een test verschillende betekenissen kunnen hebben voor verschillende groepen. Met deze reden kunnen ze niet goed vergeleken worden.

Vraag 2

A. De relatie tussen ware en geobserveerde score verschilt tussen twee groepen.

Vraag 3

A. alle uitspraken zijn correct.

Vraag 4

Alleen uitspraak A is waar, de soorten bias bij B en C zijn namelijk omgedraaid.

Vraag 5

B en C zijn correct. A is niet correct, dit is een te snelle en eenduidige conclusie.

Vraag 6

A. Alleen stelling I. is waar

Vraag 7

D. Rank order is wel een methode om construct bias te ontdekken maar item order niet.

Vraag 8

A is waar, B. niet: de regressieformule voor de gemeenschappelijke regressielijn is gebaseerd op de data uit alle groepen, niet uit slechts 1 groep.

Vraag 9

Ja, alleen het intercept verschilt tussen de groepen, de richtingscoëfficiënt is gelijk.

Vraag 10

A. Bij interceptbias blijft het verschil constant terwijl de x stijgt of daalt. Bij de rest is dit niet het geval.

Vraag 11

A. Face validity van de items

Hoe ziet een confirmatieve factor analyse eruit? - TentamenTests bij Chapter 12

Meerkeuzevragen

Vraag 1

CFA kan gebruikt worden om hypotheses over de interne structuur van een meetmodel te evalueren. Maar wat zijn de stappen die je moet nemen voor je hieraan kan beginnen?

I. Negatief gecodeerde items omgekeerd scoren.
II. Duidelijk maken welk construct je gaat meten + alvast aantal items ontwikkelen
III. Participanten vinden
IV. Zelf de test alvast maken

Alleen I. en II. zijn waar
Alleen I. en III. zijn waar
Alleen II. en III. zijn waar
Alleen I., II. en III. zijn waar
Alleen II., III. en IV. zijn waar
Alle stellingen zijn waar
Geen van de stellingen is waar

Vraag 2

Als er een CFA uitgevoerd wordt, wat moet er dan als eerst worden vastgesteld?

Vraag 3

Een factorlading is:

Hoeveelheid invloed van een factor op de test.
De mate waarin een item verbonden is met een factor.
De betrouwbaarheid van een factor
De mate waarin een factor verbonden is met een andere factor.

Vraag 4

In de vierde stap wordt van het uitvoeren van de CFA met software wordt informatie gegeven over:

Varianties en covarianties
Fit ofwel geschiktheid van model
Geschatte parameters
Geïmpliceerde varianties en covarianties

Vraag 5

Wat zegt een significante chi-kwadraat over het veronderstelde model?

Dit geeft aan dat er een slechte fit is, dit betekent dat het aantal dimensies volgens de test niet overeenkomt met de werkelijke uitkomst.
Dit geeft aan dat er een goede fit is, dit betekent dat het aantal dimensies volgens de test wel overeenkomt met de werkelijke uitkomst.
Dit geeft aan dat het model per definitie een te grote steekproef had.
Dit kan betekenen dat er een goede fit is, en dat de steekproef goed was, wat de test nog betrouwbaarder maakt.

Vraag 6

Welke van de factorladingen heeft de minste kans om in de test te blijven?

Factor-item a = 0,82
Factor-item b = 0,78
Factor item c = 0,35
Factor item d = 0,46
Factor-item e = 0, 65

Vraag 7

Hoeveel lower-order factoren heeft het model?

Vraag 8

Welke van de “lower-order” factor heeft/ hebben de slechte lading op de “higher-order” factor?

-0.62
0.62
-0.75
0.75

Vraag 9

Zijn de stellingen waar of niet waar?

Het is mogelijk om CFA te gebruiken om convergente en discriminante validiteit te evalueren.
Convergente validiteit kan geëvalueerd worden door CFA toe te passen op multitrait-multimethod matrixen.
Discriminante validiteit kan niet geëvalueerd worden door CFA toe te passen op multitrait-multimethod matrixen.
MTMMM is niet de enige methode om met CFA de convergente validiteit te evalueren.

Vraag 10

Wat is in een confirmatieve factor analyse een gestandaardiseerd residu?

Een residu met een waarde 0.
De waarde van de chi-kwadraat statistiek na deling door het aantal vrijheidsgraden.
Het verschil tussen de geobserveerde correlatie en de teruggeschatte correlatie.
Het verschil tussen de fitmaat CFI en de gestandaardiseerde fitmaat NFI.

Antwoordindicatie Meerkeuzevragen

Vraag 1

D. Zelf de test maken hoeft niet, de rest is wel van belang om af te hebben voor je de CFA uit gaat voeren.

Vraag 2

Als eerste (na het invoeren van de gegevens) moet het aantal dimensies vastgesteld worden.

Vraag 3

B. Dit is de mate waarin een item verbonden is met een factor. Deze factorlading is de eerste parameter, de tweede parameter is de verbinding tussen verschillende factoren.

Vraag 4

B. Fit ofwel geschiktheid van model

Vraag 5

A. Het kan inderdaad ook betekenen dat de steekproef groot was, (optie C en D) maar dat hoeft het niet per se te betekenen. Bovendien betekent een significante chi-kwadraat een slechte fit, en dus een slechte overeenkomst met de werkelijke resultaten. (B en D kunnen dus niet)

Vraag 6

C. Hoe lager de factorlading hoe slechter de reflectie van de onderliggende factor, dit houdt in dat deze de meeste kans maakt om uit de test te verdwijnen.

Vraag 7

B. De een na laatste kolom is hier de kolom met “lower-order” factoren. Dit is de kolom na de hoogste factoren voor de items.

Vraag 8

A en B, dit zijn de laagste absolute waardes (- of + maakt niet uit).

Vraag 9

A en B zijn waar. C is niet waar, deze methode kan namelijk bij zowel discriminante als convergente validiteit. D is waar; we kunnen convergente validiteit evalueren door een test en één of meer criteriumvariabelen te bekijken met behulp van CFA.

Vraag 10

D. Het verschil tussen de fitmaat CFI en de gestandaardiseerde fitmaat NFI.

Wat stelt de generalizability theory (G studie)? - TentamenTests 13

Meerkeuzevragen

Vraag 1

Welke van de beweringen zijn waar?

De generalizability theorie is minder handig bij complexe meetstrategieën met meerdere facetten dan de klassieke test theorie.
De generalizabilty theorie kan de effecten van verschillende facetten van elkaar onderscheiden.
De CCT kan de effecten van verschillende facetten van elkaar onderscheiden
Door middel van het onderscheiden van de effecten van de verschillende facetten kan de meetstrategie aangepast worden.

Vraag 2

Als er vijf items bij een test zijn en 1 observator, hoeveel facetten zijn er dan?

Vraag 3

Er zijn vijf items bij een test en de test wordt op twee momenten gemeten door twee observatoren. Hoeveel facetten zijn er in dit onderzoek?

Vraag 4

Zijn de uitspraken waar of niet waar?

Een D study is onderdeel van een G theorie analyse.
Variantie componenten worden geschat in de D studie.

Vraag 5

Welke van de beweringen zijn waar?

Bij een een-facet design zijn er drie factoren die de variabiliteit kunnen beïnvloeden.
De mate waarin de targets kunnen verschillen is een van de factoren die variabiliteit zou kunnen beïnvloeden.
Een ANOVA kan gebruikt worden in de D studie.
Meetfouten kunnen de variabiliteit niet beïnvloeden.

Vraag 6

Wat is de targetvariantie als er 4 items zijn, MSt= 5, MSres=1 en MSi= 2.

0,75
0,80
1,00
1,25

Vraag 7

Er is een gerelizability coëfficient van 0,790. Wat is de noise als het signal 50 is?

Vraag 8

Zijn de volgende beweringen waar?

Er is sprake van een fixed facet wanneer men niet wil generaliseren buiten de in de analyse gebruikte condities.
Bij een random facet zijn de items een random gekozen steekproef uit het totaal aantal gerelateerde items.

Vraag 9

Combineer de soort beslissing aan het bijbehorende voorbeeld en aan het bijbehorende soort test:

1. Relatieve beslissing	A. Rij-examen	I. Norm-referenced test
2. Absolute beslissing	B. Auditie	II. Criterion-referenced test

Antwoordindicatie Meerkeuzevragen

Vraag 1

B en D zijn waar.

Vraag 2

A. Er is 1 facet namelijk de items. Van de rest van de meetmogelijkheden is er maar 1.

Vraag 3

C. Er zijn 5 items (1 facet) op 2 momenten (2e facet) door 2 observatoren (3e facet)

Vraag 4

A is waar, B niet, dit gebeurt in de eerste stap van de G theorie analyse (de G study).

Vraag 5

D is niet waar, de rest wel. Meetfouten kunnen de variabiliteit wel beïnvloeden.

Vraag 6

C. Targetvariantie als er 4 items zijn, MSt= 5, MSres=1 en MSi= 2:
(MSt-MSres) /Ni. Ni = 4, (5-1) / 4 = 4/4 =1,00.

Vraag 7

Er is een gerelizability coëfficient van 0,790. Wat is de noise als de signal 50 is?
De generizability coëfficient is signal/(signal+noise). De formule kan omgedraaid worden om signal te ontdekken.
50/(50+x) = 0,790. → keer (50+x) → 50=0,790*(50+x). → gedeeld door 0,79 → 63,29 = 50+x. → - 50 → X = 13,29. Noise is 13,29.

Vraag 8

Zowel A als B zijn waar.

Vraag 9

1-A-II.

2-B-I.

Relatieve beslissingen gaan over relatief beoordeelde scores en zijn norm-referenced (bijv. beste 20%). Absolute beslissingen gaan over een cut-off score die je moet hebben om iets gehaald te hebben, dit is criterion-referenced.

Wat is Item Response Theorie (IRT) en welke modellen zijn er? - TentamenTests 14

Meerkeuzevragen

Vraag 1

Welke van deze beweringen zijn niet waar?

IRT is een alternatief voor KTT.
IRT is minder complex dan KTT.
De IRT legt de nadruk op het feit dat de reactie van een individu beïnvloed wordt door het indivu (traits) en het item (moeilijkheidsgraad).
Moeilijkheidsgraad kan bij IRT ook gezien worden als hoe makkelijk iemand eens kan zijn met een statement.

Vraag 2

Voor welke vraag is waarschijnlijk een hoger traitlevel nodig wanneer het trait vaardigheid in spelling is?

Het spellen van het woord: lepel.
Het spellen van het woord: consciëntieus.
Geen van beide: de moeilijkheidsgraad heeft niets met het traitlevel te maken.

Vraag 3

Zijn de beweringen waar of niet waar?

Als iemand een item met de moeilijkheidsgraad 1 heeft, zal iemand met trait level 1 50% kans hebben om het item goed te volbrengen.
Als een item moeilijkheidsgraad -1 heeft, heeft iemand met trait level 0 weinig kans om het item goed te volbrengen.
Bij een item met moeilijkheidsgraad 0, zal iemand met trait level 1 meer dan 50% kans hebben om het item goed te beantwoorden.

Vraag 4

Er is een negatieve discriminatiewaarde van het item. Wat betekent dit voor de kans om een item goed te beantwoorden wanneer er sprake is van een hoog trait level?

Die kans is hoog omdat er een hoog trait level is.
Die kans is laag omdat het vast een item met nog hogere moeilijkheidsgraad is.
Die kans is hoog omdat dit item dan wel makkelijk moet zijn omdat het trait level hoog is.
Die kans is laag want een negatieve discriminatiewaarde betekent dat hoge trait scores zorgen voor een kleinere kans om het item goed te beantwoorden.

Vraag 5

Bij welke discriminatiewaarde is er sprake van de meeste validiteit?

Bij discriminatiewaarde 0,8
Bij discriminatiewaarde 0
Bij discriminatiewaarde -0,8
Bij discriminatiewaarde 0,5

Vraag 6

Bij het Rasch model wordt gekeken naar:

(mogelijk meerdere goede antwoorden)

De kans op een correct antwoord
De moeilijkheidsgraad van een item
Het traitlevel van het proefpersoon
Het gemiddelde traitlevel

Vraag 7

Het verschil tussen het Rasch model en het twee parameter logistische model is:

Het wel of niet rekening houden met het discriminatie parameter van het item.
Het wel of niet rekening houden met het betrouwbaarheidsinterval
Het wel of niet rekening houden met de moeilijkheid van het item
Geen van de bovenstaande antwoorden is juist

Vraag 8

Vul de formule van het Rasch model in: Traitlevel = 2, Item moeilijkheid = 1,5. Wat is de kans op een correct antwoord?

0,334
0,378
0,447
0,622

Vraag 9

Wat is het geschatte trait level als het proportie correct beantwoorde items van de respondent 0,7 is?

-0,847
0,153
0,847
6,712

Vraag 10

Welke van de volgende voorbeelden is GEEN benoemde toepassing van IRT?

Evalueren van psychometrische eigenschappen items en testen.
Het vergelijken van meerdere facetten van een meetstrategie.
Analyseren van Person Fit.
Computerized adaptive testing.

Vraag 11

Een test, bestaande uit vier items, meet een bepaalde vaardigheid. Gegeven zijn de item-karakteristieke curven van de items.

Welk item heeft de grootste discriminatieparameter?

Item 1
Item 2
Item 3
Item 4

Vraag 12

Een test, bestaande uit drie items, meet een bepaalde vaardigheid. Gegeven zijn de item-karakteristieke curven van de items.

Wat is het meest waarschijnlijke scorepatroon (volgorde item 1, item 2, item 3, waarbij 1 =goed en 0 = fout) voor een persoon met een vaardigheid van θ = 6?

0,1,0
1,0,0
1,0,1
1,1,0

Antwoordindicatie Meerkeuzevragen

Vraag 1

B is niet waar; IRT is juist complexer dan KTT.

Vraag 2

B. Ervan uitgaande dat dit een hogere moeilijkheidsgraad heeft dan de opdracht bij antwoord A.

Vraag 3

A is waar, B is niet waar; juist meer kans dan 50%, C is waar.

Vraag 4

D. Die kans is laag want een negatieve discriminatiewaarde betekent dat hoge trait scores zorgen voor een kleinere kans om het item goed te beantwoorden.

Vraag 5

A, want dat is de hoogste positieve score (alleen positieve scores bevestigen validiteit) negatieve geven juist inconsistentie tussen traitniveau en kans om goed te beantwoorden aan, dit duidt meer op slechte validiteit.

Vraag 6

A. Dit is de uitkomst van het model en B + C : die worden meegenomen in de berekening.

Vraag 7

A. De discriminatie parameter van het item is het verschil tussen de twee formules, beide houden ze verder rekening met trait level en moeilijkheid van het item.

Vraag 8

D. 0,622

Trait level is Өs, Өs = 2. Itemmoeilijkheid is βi, βi = 1,5.
P(Xis=1| Өs, βi) = (e ^(Өs – βi) / (1 + e^(Өs – βi) )
P(Xis=1 | Өs, βi) = e^(2-1,5)/1+e^(2-1,5)
P(Xis=1 | Өs, βi) = e^(0,5)/ 1+e^(0,5)
P(Xis=1 | Өs, βi) = 1,6487 / 2,6487 = 0,622

Vraag 9

Proportie correct beantwoorde item van de respondent = PS. PS= 0,7.
Өs = LN(PS /1-PS)
Өs = LN (0,7/0,3) = LN(2,333) = 0,847.

Vraag 10

B. Dit is een functie van de G theorie niet van IRT.

Vraag 11

A. Item 1

Vraag 12

D. 1,1,0

Why create an account?

Your WorldSupporter account gives you access to all functionalities of the platform
Once you are logged in, you can:
- Save pages to your favorites
- Give feedback or share contributions
- participate in discussions
- share your own contributions through the 7 WorldSupporter tools