TentamenTests bij Experimenteel en Correlationeel Onderzoek - Oefententamen 2 - UL


Vragen

Vraag 1

De effectmaat Hedges' g is een effectmaat gebaseerd op...

  1. de correlatie in de steekproef
  2. het gestandaardiseerde verschil tussen twee groepsgemiddelden
  3. de proportie verklaarde populatievariantie
  4. de associatiesterkte in de populatie

Vraag 2

In een onderzoek wordt bij 10 personen een dichotome variabele X en een intervalvariabele Y gemeten. De resultaten staan in de onderstaande tabel.

Persoon12345678910
X0000011111
Y2315263745
Wat is de waarde van de hier van toepassing zijnde correlatiecoëfficiënt, die de samenhang aangeefttussen beide variabelen?
  1. 0
  2. 0.42
  3. 0.65
  4. 0.81

Vraag 3

Op basis van verzamelde gegevens wil men iemands inkomen voorspellen uit het aantal jaren dat deze onderwijs heeft gevolgd. Welke bewering is juist?

  1. Het inkomen is de responsevariabele; de waarden van deze variabele worden genoteerd op de horizontale as van het spreidingsdiagram
  2. Het inkomen is de responsevariabele; de waarden van deze variabele worden genoteerd op de verticale as van het spreidingsdiagram
  3. Het aantal jaren opleiding is de responsevariabele; de waarden van deze variabele worden genoteerd op de horizontale as van het spreidingsdiagram

Vraag 4

Welke uitspraak over de correlatiecoëfficiënt r is juist?

  1. Het is een robuuste maat voor samenhang, want r is gevoelig voor uitbijters
  2. Het is een robuuste maat voor samenhang, want r is niet gevoelig voor uitbijters
  3. Het is geen robuuste maat voor samenhang, want r is gevoelig voor uitbijters
  4. Het is geen robuuste maat voor samenhang, want r is niet gevoelig voor uitbijters

Vraag 5

Het aantal jaren opleiding is de responsevariabele; de waarden van deze variabele worden genoteerdop de verticale as van het spreidingsdiagramEen significantietest is in het algemeen een functie van effectgrootte en aantal proefpersonen. Welkevan de onderstaande formules geeft deze relatie correct weer als het gaat over een 2 x 2 kruistabel?

  1. \[X{^2} = Φ{^2} *N\]
  2. \[X= Φ * N\]
  3. \[Φ{^2} = X{^2} * N\]
  4. \[Φ = X * N\]

Vraag 6

Voor twee variabelen X en Y is berekend:

\[X̄ = 3.4\]

\[ȳ = 2.6\]

\[s \frac {2}{x} = 1.81\]

\[s \frac {2}{Y} = 2.13\]

\[s_{XY}  = 1.43\]

Wat is de regressievergelijking (in ruwe scores) voor de voorspelling van Y uit X?

  1. \[Ŷ = 0.79X – 0.09\]
  2. \[Ŷ = 0.73X\]
  3. \[Ŷ = 0.61X + 0.23\]
  4. \[Ŷ = 0.73X – 0.09\]

Vraag 7

Voor een regressielijn geldt...

  1. dat de som van de kleinste afwijkingen van punten ten opzichte van de regressielijn het kleinst is.
  2. dat de som van de afwijkingen van punten ten opzichte van de regressielijn in horizontale richting het kleinst is.
  3. dat de som van de gekwadrateerde afwijkingen van punten ten opzichte van de regressielijn in verticale richting het kleinst is.
  4. dat de som van de gekwadrateerde afwijkingen van punten ten opzichte van de regressielijn in horizontale richting het kleinst is.

Vraag 8

Een onderzoeker heeft voor een groep personen de scores vastgesteld met betrekking tot de kwantitatieve variabelen X en Y. Hier is X de verklarende variabele en Y de responsevariabele. Na berekening blijkt dat regressiecoëfficiënt b1 = -2.

  1. Als X met twee eenheden toeneemt, dan neemt de voorspelde waarde van Y met twee eenheden af
  2. Als X met twee eenheden toeneemt, dan neemt de voorspelde waarde van Y met vier eenheden af
  3. Als Y met twee eenheden toeneemt, dan neemt de voorspelde waarde van Y met vier eenheden af
  4. De onderzoeker heeft een rekenfout gemaakt, want b kan nooit kleiner zijn dan -1

Vraag 9

Een onderzoeker heeft bij een groep personen hun lengte (in cm) en hun gewicht (in kg) gemeten. Na berekening blijkt r = 0.80 en b1 = 0.34. Om zijn bevindingen in een Engels tijdschrift te plaatsen, bepaalt hij nieuwe lengtescores met inch als meeteenheid (1 inch = 2.54 cm).Wat kun je zeggen over de nieuwe r en b1

  1. Na deze bewerking is r nog steeds gelijk aan 0.80 en b1 nog gelijk aan 0.34
  2. Na deze bewerking zijn zowel r en  b1 groter geworden
  3. Na deze bewerking is r nog steeds gelijk 0.80, maar is  b1 groter geworden
  4. Hoe groot r en  b1 nu zijn blijkt pas na een nieuwe berekening

Vraag 10

Een onderzoekster analyseert het verband tussen opleiding van de respondent en de opleiding van zijn of haar vader. In de onderstaande SPSS tabel ontbreekt de kolom met de p-waarden van de significantietoetsen voor de twee regressiecoefficienten. Probeer met behulp van de overige informatie in de tabel de juiste conclusie te trekken.

  1. b0 wijkt tweezijdig getoetst op 5% significant van 0 af, maar b1 niet
  2. b0 wijkt tweezijdig getoetst op 5% niet significant van 0 af, maar b1 wel
  3. b0 noch b1 wijken tweezijdig getoetst op 5% significant van 0 af
  4. b0 en b1 wijken tweezijdig getoetst op 5% significant van 0 af

Coefficients (a)

ModelUnstandardized CoefficientsStandardized Coefficientst95% Confidence interval for B
BStd. ErrorBetaLower BoundUpper Bound
(Constant)9.926.219 45.2609.49510.356
Highest Year School Completed, Father.322.0190.46317.050.285.359

(a) Dependent Variable: Highest Year of School Completed

Vraag 11

De ANOVA-tabel voor een enkelvoudige regressie-analyse is (gedeeltelijk) hieronder gegeven.

SourceDFSSMSF
Model Error 12.43  
Total1123.43  

Maak de tabel af. Kan H0 verworpen worden met alfa = 0.05?

  1. Nee, P > 0.05
  2. Ja, 0.025 < P </= 0.5
  3. Ja, 0.01 < P </= 0.025
  4. Ja, P </= 0.01

Vraag 12

 YX1X2
Y-.7.6
X1 --.4
X2  -

Wat is juist met betrekking tot de multipele correlatiecoëfficiënt R voor de voorspelling van Y uit X1 en X2?

  1. \[R=r_{x1y} + r_{x2y}\]
  2. \[R^2=r^2_{x1y} + r^2_{x2y}\]
  3. \[R= r^2_{x1y} + r^2_{x2y}\]
  4. A,B en C zijn onjuist

Vraag 13

We vinden in een onderzoek bij 20 personen de volgende regressievergelijking: ŷ = 1.3 – 2.4x1 + 0.9x2

Gegeven is verder SEb1 = 1.631 en we toetsen b1. Het resultaat is:

  1. t = 1.4715; H0 kan worden verworpen met alfa = 0.05
  2. t = 1.4715;  H0 kan niet worden verworpen met alfa = 0.05
  3. t = -1.4715;  H0 kan worden verworpen met alfa = 0.05
  4. t = -1.4715;  H0 kan niet worden verworpen met alfa = 0.05

Vraag 14

Anne voert een meervoudige regressie-analyse uit om haar onderzoeksvraag te kunnen beantwoorden. Wanneer ze de plot bekijkt waarbij de voorspelde waarden op de X-as staan en de gestandaardiseerde residuen op de Y-as, ziet ze dat er sprake is van homoscedasticiteit. Wat houdt dit in?

  1. De residuen zijn gelijk verspreid voor elke voorspelde waarde
  2. De residuen zijn niet gelijk verspreid voor elke voorspelde waarde, er is bijvoorbeeld een soort driehoek te zien
  3. Er is een (horizontale) lineaire relatie te zien tussen de voorspelde waarden en de residuen
  4. Er zijn geen gestandaardiseerde residuen groter dan een absolute waarde van 3

Vraag 15

Bezie onderstaande stellingen over het bekijken van multicollineariteit tussen predictoren in een meervoudige regressie-analyse:

Stelling I: Wanneer de Tolerance een erg kleine waarde heeft (bijvoorbeeld onder de 0.1) hoeft de onderzoeker zich geen zorgen te maken over onstabiele regressiegewichten

Stelling II: Bij het berekenen van de Tolerance van een predictor wordt gekeken hoeveel variantie van een predictor voorspeld kan worden door de andere predictoren

Wat is juist?

  1. Beide stellingen zijn juist
  2. Alleen stelling I is juist
  3. Alleen stelling II is juist
  4. Beide stellingen zijn onjuist

Vraag 16

Een psychologe heeft de volgende regressievergelijking gevonden in onderzoek met 42 personen die gemiddeld 32 scoorden op de X-variabele: ŷ = 0.61X + 0.23

Tevens vond de psychologe de volgende resultaten in het onderzoek:sx = 3, sy = 1.2 en se = 2

Met behulp van deze regressievergelijking voorspelt de psychologe een score op de Y-variabele voor een cliënt van haar die een X-waarde heeft van 25. Wat is de 99% voorspellingsinterval voor deze individuele observatie?

  1. [7.8, 23.1]
  2. [9.7, 21.3]
  3. [11.1, 19.8]
  4. [13.3, 17.6]

Antwoordindicatie

Vraag 1

Antwoord B. Hedges’ g is voor de steekproef en is gebaseerd op het gestandaardiseerde verschil tussen twee groepsgemiddelden.

Vraag 2

Antwoord C.

Hier geldt:

\[r_{pb} =\frac {s_{xy}}{s_x s_y}\]

\[s_{xy} = \frac {\sum {(x-x̅)^*(y-ȳ)}}{n-1}\]

\[x̅ = 0.5\]

\[ȳ = 3.8\]

\[s_{xy} = \frac {6}{9}\]

\[r_{pb} = \frac {0.66}{0.53^*1.93} = 0.65\]

xyx-x gemy-y gem
02-0.5-1.8
03-0.5-0.8
01-0.5-2.8
05-0.51.2
02-0.5-1.8
160.52.2
130.5-0.8
170.53.2
140.50.2
150.51.2

 

 

 

 

 

 

 

Vraag 3

Antwoord B. Een responsevariabele is hetgeen dat we willen voorspellen. Deze heeft een respons naar aanleidingvan de verklarende variabele. We willen iemand inkomen voorspellen. Deze waarden worden genoteerd op de y-as, oftewel de verticale as.

Vraag 4

Antwoord C. Robuust wil zeggen dat iets niet gevoelig is voor uitbijters. r is wel gevoelig voor uitbijters.

Vraag 5

Antwoord A.

Vraag 6

Antwoord A.

De regressievergelijking is altijd:

\[Ŷ = b_{1} * x + b_0\]

\[b_1 = \frac {s_{xy}}{s^2_x}\]

\[b_{1} = \frac {1.43}{1.81} = 0.79\]

\[b_{0} = ȳ - b_{1} * x̅\]

\[b_{0} = 2.6-0.79*3.4 = -0.09\]

Vraag 7

Antwoord C.

Voor de regressielijn geldt het kleinste kwadratencriterium. Dit houdt in dat de som van de gekwadrateerde afwijkingen van punten ten opzichte van de regressielijn zo klein mogelijk zijn.

Vraag 8

Antwoord B.

X is de verklarende variabel en Y is de responsevariabel.

In de formule:

\[Ŷ = b_{1} * x + b_0\]

Als b1 gelijk is aan -2 dan zou bij een toename van 2 van x er een vermindering van y met -4 (2x -2) zijn. Stel b0 = 0 dan: -4 = -2*2 +0.

Vraag 9

Antwoord C.

De correlatie kan nooit verschillen door een transformatie. R blijft dus gelijk; b1 daarentegen is wel groter geworden, want de helling verloopt stijler (er is dus een grotere slope).

Vraag 10

Antwoord D.

Hiervoor hoeven we eigenlijk alleen maar naar het betrouwbaarheidsinterval te kijken. Als we met 95% zekerheid kunnen zeggen dat b0 tussen de 9,495 en 10,356 ligt, dan kunnen we ook met 95% zekerheid zeggen dat b0 niet gelijk is aan iets wat buiten dit interval ligt. Bij de nul-hypothese ga je van 0 uit en dat ligt bij beide intervallen erbuiten. Ze wijken dus beide significant af.

Vraag 11

Antwoord D.

SourceDfSSMSF
ModelDFM = \[p\]SSM =\[\sum (ŷ_{i}-ȳ){^2}\]MSM=\[\frac {SSM}{DFM}\] F=\[\frac {MSM}{MSE}\]
ErrorDFE=\[n-p-1\]SSM =\[\sum (y_{i} - ŷ){^2}\]   MSE=\[\frac {SSE}{DFE}\]     
TotalDFT=\[n-1\]SSM =\[\sum (y_{i} - ȳ){^2}\] MST=\[\frac {SST}{DFT}\] 

Om dit model af te maken moeten we eerst kijken naar de SSerror. Deze is gelijk aan de SStotaal - de SSmodel. Verder is er sprake van een enkelvoudige regressie en dus 1 predictor. DFM = p =1DFtotaal = n-1 = 11. Dus n = 12. DFE = n-p-1 = 12 - 1 - 1 = 10. Dit telt ook bij elkaar op tot 11. Voor de F-waarde kan heb je ook de MSM en de MSE nodig. MSM = SSmodel/DFM. MSE = SSerror/DFE. Vervolgens kun je voor de F-waarde MSM delen door de MSE. Zoek deze op in de tabel met numerator = DFM en denominator = DFE. We komen uit op een p-waarde van <0.01. We verwerpen dus de nul-hypothese.

Vraag 12

Antwoord D.

Alle drie de stellingen zijn onjuist.

Vraag 13

Antwoord D.

We zien dat b1 een negatief getal is. Dit is omdat we zien dat hoe groter b1 wordt, hoe kleiner onze verwachte waarde voor y. Het gaat dus om de t-waarde van -1,4715. Deze kun je opzoeken in de tabel en die kan niet worden verworpen met een alpha van 0,05.

Vraag 14

Antwoord A.

Homoscedasticiteit is een voorwaarde voor generalisering naar de populatie. Het houdt in dat de residuen gelijk verpreid zijn over elke voorspelde waarde. (zie week 4)

Vraag 15

Antwoord C.

Voor de Tolerance willen wij juist een grote waarde. Hij moet zeker groter zijn 0,1 (vuistregel). Stelling I is dus onjuist. Voor het berekenen van de Tolerance wordt er gekeken naar de hoeveelheidvariantie van een predictor dat door andere predictoren voorspeld kan worden. Stelling II is juist.

Vraag 16

Antwoord B.

De juiste formule hiervoor is:

\[ŷ \pm t * SE_{ŷ}\]

\[ŷ = 0.61x + 0.23\]

x is bij deze client gelijk aan 25. Dus:

\[ŷ = 0.61 * 25 + 0.23\]

\[ŷ = 15.48\]

t* is een waarde die in de tabel geschat moet worden. Hij wordt geschat met n-2 = 40 df. In de t-tabel vinden wij een alpha van 0,01 hier een waarde van 2,704.

\[SE_{ŷ} = s_{e} * \sqrt 1 + \frac {1}{n} + (\frac {(x * - x̅)^{2}}{(n-1) * {s^2_x}}\]

X* is de waarde van x die we willen weten. Dit is 25. In het verhaaltje zien we ook dat x gemiddeld gelijk is aan 32. Als we alles invullen zien we:

\[SE_{ŷ} = 2 * \sqrt 1 + \frac {1}{42} + (\frac {(25 - 32)^{2}}{(42-1) * {3^2}}\]

\[SE_{ŷ} = 2 * \sqrt 1 + \frac {1}{42} + \frac {49}{369}\]

\[SE_{ŷ} = 2 * \sqrt 1 + 0.0238 +0.1328\]

\[SE_{ŷ} = 2.1509\]

Invullen:

\[ŷ \pm t * SE_{ŷ}\]

\[15.48 - 2.704 * 2.1509 = 9.7\]

\[15.48 + 2.704 * 2.1509 = 21.3\]

Contributions, Comments & Kudos

Add new contribution

CAPTCHA
This question is for testing whether or not you are a human visitor and to prevent automated spam submissions.
Image CAPTCHA
Enter the characters shown in the image.
Summaries & Study Note of Psychologie World Supporter
Join World Supporter
Join World Supporter
Log in or create your free account

Why create an account?

  • Your WorldSupporter account gives you access to all functionalities of the platform
  • Once you are logged in, you can:
    • Save pages to your favorites
    • Give feedback or share contributions
    • participate in discussions
    • share your own contributions through the 11 WorldSupporter tools
Content
Access level of this page
  • Public
  • WorldSupporters only
  • JoHo members
  • Private
Statistics
127
Connect & Continue