Begrippenlijst bij het vak statistiek

 

  • Regressie analyse (simpele regressie)

Een manier van het voorspellen van een uitkomstvariabele d.m.v. een voorspellende variabele.

  • Regressie analyse (multipele regressie)

Een manier van voorspellen van een uitkomstvariabele d.m.v. meerdere voorspellende variabelen.

  • Method of least squares

Met deze methode kan gekeken worden welke lijn het beste de verzamelde date beschrijft (de lijn die door de meeste datapunten heen gaat).

  • Intercept

Het punt waarop de lijn de verticale as van de grafiek raakt.

  • Regressie coëfficiënten

De helling en de intercept, dus de parameters bₓ en bₒ.

  • Residual/residu

De deviaties. De regressielijn overschat of onderschat de ware data. De afstand tot de lijn en de ware data is het residu.

  • Goodness of fit

Kijken hoe goed de regressielijn de data representeert, omdat de best gevonden lijn nog niet een goed representatie hoeft te zijn.

  • Total sum of squares

Het kwadrateren van de verschillen tussen de geobserveerde data met het gemiddelde.

  • Residual sum of squares

Het kwadrateren van het verschil tussen de geobserveerde data en de regressielijn.

  • R^2

Het delen van de residual sum of squares door de total sum of squares. Het representeert het percentage variantie dat verklaard wordt door het model (de regressielijn).

  • F-ratio

Een meting van hoeveel het model de voorspelling verbeterd heeft vergeleken met het niveau van onnauwkeurigheid.

  • B expected

De b-waarde die we verwachten als de nul-hypothese waar is.

  • Simpele lineaire regressie

De uitkomstvariabele Y wordt voorspeld met gebruik van de vergelijking van een rechte lijn.

  • Multiple R

Een veelvoudige correlatie coëfficiënt. Dit is de geobserveerde waarden van Y en de waarden van Y die door het model zijn voorspeld.

  • R^2

De hoeveelheid variantie die door het model verklaard kan worden.

  • Hiërarchische regressie voorspellers

Ze worden geselecteerd d.m.v. eerder werk en de onderzoeker besluit in welke volgorde de voorspellers in het model worden gedaan. Als algemene regel is er dat belangrijke voorspellers eerst in het model gestopt moeten worden.

  • Forced entry

Er wordt geen onderscheid gemaakt in de volgorde van inclusie van voorspellers in het model. Ze worden dus allemaal tegelijk erin gedaan.

  • Stepwise methods

Het besluiten van volgorde van voorspellers in het model gebeurd d.m.v. wiskundige criteria.

  • Suppressor effects

Als een voorspeller een significant effect heeft, maar alleen als een andere variabele constant wordt gehouden.

  • Over-fitting

Teveel variabelen in het model hebben die essentieel zijn, maar die te weinig bijdrage leveren aan het voorspellen van de uitkomst.

  • Under-fitting

Belangrijke voorspellers eruit laten.

  • Outliers

Dit is een geval dat substantieel verschilt van de algemene trend van de data.

  • Residuals

Het verschil tussen de waarden van de voorspelde uitkomst door het model en de waarden van de uitkomst geobserveerd door de steekproef. Ze representeren de ‘error’.

  • No perfect multicollinearity

Er zou geen perfecte lineaire relatie moeten zijn tussen twee of meer voorspellers.

  • Externe variabelen

Dit zijn variabelen die niet in het model zitten, maar wel de uitkomst beïnvloeden.

  • Homoscedasticity

Op elk niveau van de voorspellende variabele(n) zou de variantie van de residuele termen constant moeten zijn.

  • Perfect collinearity

Als ten minste één voorspeller een perfecte lineaire combinatie is van de anderen.

  • VIF

Variance inflation factor. Dit is een indicatie of een voorspeller een sterke lineaire relatie met de andere voorspellers heeft.

  • Tolerance statistic

Het omgekeerde van de VIF (1/VIF).

  • ANOVA

Analysis of variance. Model om meer dan twee condities te analyseren.

  • Independent ANOVA

Als er verschillende participanten voor de ANOVA gebruikt worden.

 

  • Familywise/experimentwise error rate

De kans op een Type 1 fout neemt toe, omdat verschillende statistische tests met dezelfde experimentele data worden uitgevoerd.

  • Een omnibus test

Deze test kijkt naar een totaal experimenteel effect. Er wordt vaak geen specifieke informatie gegeven.

  • F-ratio

De ratio van variantie

  • Ongebalanceerd designs

Als de groepen uit een oneven aantal bestaan.

  • Grand variance

De variantie van alle observaties.

  • Residual sum of squares

Hoeveel van de variantie niet verklaard kan worden door het model. Ookwel het verschil tussen wat het model voorspelt en de werkelijke observaties.

  • De systematische variantie

De gemiddelde hoeveelheid variantie dat verklaard kan worden door het model.

  • Niet systematische variantie

Een schatting van de gemiddelde hoeveelheid variantie dat verklaard kan worden door andere factoren.

 

  • Omega squared

De schatting van de effectgrootte.

  • Point-biserial correlation

Pearson’s r tussen twee variabelen als één daarvan continu is en de andere twee categorieën heeft, met de codes 1 en 0.
  • Dummy coding

Een manier van groepen van mensen representeren, gebruikmakend van nullen en enen.
  • Analysis of covariance / Ancova

Dit breidt het basis idee van de Anova uit.

  • Homogeneity of regression slopes

Stel je voor dat je een stippellijngrafiek (scatterplot) maakt van elke experimentele conditie met de covariaat op een as en de uitkomst op een andere as, dan zouden de regressielijnen voor elke stippellijngrafiek er ongeveer hetzelfde uitzien.

  • Factoriële ANOVA

Een ANOVA tussen groepen (ook wel een algemeen lineair model genoemd).

  • Continue variable

Een variabel die niet in groepen verdeeld is.

 

  • Dummy variabelen

Variabelen die alleen de waarden 0 of 1 aan kunnen nemen.

  • Herhaalde metingen

Het gebruik van dezelfde proefpersonen bij verschillende condities in een experiment.

  • Aanname van sphericity

Houdt in dat de relatie tussen paren van experimentele condities gelijk is.

  • Samengestelde symmetrie

De beide varianties langs de condities zijn gelijk en de covarianties tussen de paren zijn ook gelijk. Deze aanname is specifieker van bovenstaande aanname.

  • Mauchly’s test

Toetst de hypothese dat de varianties van de verschillen tussen de condities gelijk zijn. Wanneer de test significant is, wordt er niet aan de aanname voldaan.

  • Totale variantie bij ANOVA

Bestaat uit de tussengroepsvariantie (SSb) en de binnengroepsvariantie (SSw).

  • Binnengroepsvariantie

Bestaat uit het effect van het experiment (SSm) en de residuvariantie (SSr).

  • F-ratio

De verklaarde variantie gedeeld door de variantie verklaard door de niet-systematische factoren. (MSm / MSr).

  • Gemixt ontwerp

Een mix van tussengroepsvariabelen en herhaalde metingen variabelen. Voor dit ontwerp zijn minstens twee onafhankelijke variabele nodig.

  • Levene’s test

Wordt gebruikt om te kijken of voldaan wordt aan de aanname van homogeniteit.

  • Estimated marginal means

Kan naar gekeken worden om te bepalen of de interactie-effecten significant zijn.

  • Multivariate variantieanalyse (MANOVA)

Kan gebruikt worden in een situatie met meerdere afhankelijke variabelen.

  • Matrix

Een verzameling van nummers die geordend zijn in rijen en kolommen.

  • Square matrix

Een matrix met een gelijk aantal rijen en kolommen, waardoor het eruit ziet als een vierkant.

  • Diagonale componenten

De getallen die op de diagonaal van de square matrix liggen.

  • Niet-diagonaal componenten

De getallen die niet op de diagonaal van de square matrix liggen.

  • Identiteitsmatrix

Wanneer de diagonale componenten samen 1 zijn en de niet-diagonale componenten samen 0 zijn.

  • Hypothese kwadratensom en kruisproducten matrix

Matrix die de systematische variantie laat zien. Wordt aangeduid met de letter H.

  • Meetfout kwadratensom en kruisproducten matrix

Matrix die de niet-systematische variantie laat zien. Wordt aangeduid met de letter E.

  • Totale kwadratensom en kruisproducten matrix

Matrix die de totale variantie voor elke afhankelijke variabele laat zien. Wordt aangeduid met de letter T.

  • Totale kruisproduct (CPt)

Een maat voor de totale relatie tussen twee variabelen.

  • Model kruisproduct (CPm)

Kijkt naar hoe de relatie tussen twee afhankelijke variabelen wordt beïnvloed door de experimentele manipulatie.

  • Residu kruisproduct (CPr)

Kijkt naar hoe de relatie van de twee afhankelijke variabelen beïnvloed wordt door individuele verschillen.

  • Variate

Een onderliggende lineaire dimensie bij de afhankelijke variabelen in een matrix.

  • Discriminante functie variaten

De functie die groepen onderscheidt.

  • Pillai-Bartlett trace (V)

Kijkt naar de effectgrootte aan de hand van de som van de proportie verklaarde variantie op de discriminant functies.

  • Hotelling-Lawley trace (T)

Kijkt naar de effectgrootte aan de hand van de som van de eigenwaarden per variate.

  • Wilks’ lambda (Λ)

Kijkt naar de effectgrootte aan de hand van het product van de onverklaarde variantie van elk variate.

  • Roy’s largest root (Θ)

De maximale eigenwaarde voor het eerste variate.

  • Multivariate normaliteit

Aanname die stelt dat bij MANOVA de afhankelijke groepen multivariate normaliteit hebben binnen de groepen.

  • Homogeniteit van de covariantie matrices

Aanname die stelt dat voor elke afhankelijke variabele de varianties gelijk moeten zijn en de correlatie tussen elk van de afhankelijke variabelen hetzelfde moeten zijn in alle groepen.

  • Box’s test

Test waarmee de variantie-covariantie matrices met elkaar vergeleken kunnen worden.

  • Discriminant score

De score van elk persoon op elk variaat.

  • Factor analyse (eerste definitie)

Veel informatie/variabelen wordt in SPSS verminderd tot minder variabelen, waardoor het makkelijker te verwerken is. SPSS doet dit door overmatige informatie eruit te filteren.

 

  • Latente variabelen

Metingen die niet direct gemeten kunnen worden. Er worden dan verschillende aspecten gemeten.

 

  • Factor analyse (tweede definitie)

Het identificeren van groepen of clusters van variabelen.

 

  • Collinear

Op één rechte lijn gelegen.

 

  • Een R-matrix

Dit is een correlatiematrix: een tabel van correlatie coëfficiënten tussen variabelen. De diagonaal van deze matrix bestaat uit enen, omdat alle variabelen perfect correleren met zichzelf.

 

  • Factor

Je kan het voorstellen als een as van een grafiek, waarlangs variabelen gezet kunnen worden.

 

  • Coördinatie van variabelen

Representatie van de relatie met de factoren.

 

  • Factor lading

De coördinatie van variabelen.

 

  • Beschrijvende methode

De bevindingen zijn alleen toepasbaar op de steekproef.

 

  • Inferentiële methode

De bevindingen generaliseren naar de gehele populatie.

 

  • Common variance

De totale variantie voor één variabele heeft twee componenten, waarvan één de common variance is. Dit houdt in dat die totale variantie van een variabele gedeeld kan worden met andere variabele.

 

  • Unique variance

Dit is de andere component van de totale variantie van een variabele. Dit is specifieke variantie voor die meting, wat ook betekent dat het betrouwbaar is.

 

  • Error/random variance

Dit is specifieke variantie, maar niet betrouwbaar.

 

  • Communality

De proportie van common variance die in een variabele wordt gepresenteerd. Dus als een variabele geen specifieke variantie heeft, dan heeft de variabele een communality van 1.

 

  • Principal component analysis

Ontbinden van de originele data in lineaire variaties.

 

  • Eigenwaarde

Associatie met een variabele geeft de belangrijkheid van een factor. Met zo’n waarde kan gekeken worden of een factor belangrijk genoeg is om te behouden.

 

  • Scree plot

Een grafiek van elke eigenwaarde (de y-as) tegen de factoren waarmee de eigenwaardes geassocieerd worden (de X-as).

 

  • Kaiser’s criterion

Kaiser beweerde dat factoren geselecteerd moeten worden als de eigenwaarde groter is dat 1.

 

  • Factor rotation

Het roteren van assen van de factoren, zodat variabelen maximaal geladen zijn op één factor.

 

  • Orthogonale rotatie

Rotatie waarbij de factoren onafhankelijk worden gehouden. De factoren blijven ongerelateerd.

 

  • Oblique rotatie

Bij deze vorm van rotatie mogen de factoren na de rotatie wel correleren.

 

  • Factor transformatie matrix

Hierin staan de geroteerde factor ladingen.

 

  • Betrouwbaarheid/reliability

Een meting moet consistent het gemeten construct reflecteren.

 

  • Test-retest reliability

Een persoon zou dezelfde score moeten krijgen op een test als deze test op twee verschillende momenten gemaakt wordt.

 

  • Split-half reliability

Een vragenlijst is betrouwbaar als elk item dezelfde kant op scoort, dus als een persoon hoog scoort op het ene item, dan moeten alle items hoog scoren. De split-half methode onderzoekt dit door de data aselect in tweeën te delen. De twee helften zouden ongeveer hetzelfde moeten scoren.

 

  • Cronbach’s alfa

Dit is de meest gebruikte meting van schaal betrouwbaarheid. Hiermee wordt de data op elke mogelijke manier in tweeën gesplitst en daarna wordt de correlatie coëfficiënt voor elke deling uitgerekend. Een waarde van .7 of .8 is acceptabel. Daaronder geeft onbetrouwbaarheid weer. Er moet wel voorzichtig met deze getallen omgegaan worden, omdat de Cronbach’s alfa groter wordt naarmate het aantal items toeneemt. Dit zegt dan dus niks over de betrouwbaarheid.

 

  • Unidimensionality

De mate waarin de schaal één onderliggend construct meet.

 

  • Reverse phrased

Als het ene item een hoge score geeft als de participant bijvoorbeeld statistiek niet leuk vindt en het andere item een lage score geeft, terwijl dat item ook gaat over het niet leuk vinden van statistiek.

 

 

 

Contributions, Comments & Kudos

Add new contribution

CAPTCHA
This question is for testing whether or not you are a human visitor and to prevent automated spam submissions.
Image CAPTCHA
Enter the characters shown in the image.
Summaries & Study Note of Psychologie World Supporter
Join World Supporter
Join World Supporter
Log in or create your free account

Why create an account?

  • Your WorldSupporter account gives you access to all functionalities of the platform
  • Once you are logged in, you can:
    • Save pages to your favorites
    • Give feedback or share contributions
    • participate in discussions
    • share your own contributions through the 11 WorldSupporter tools
Content
Access level of this page
  • Public
  • WorldSupporters only
  • JoHo members
  • Private
Statistics
187
Connect & Continue
WorldSupporter Resources

Samenvatting SPSS Survival Manual van Pallant (6e druk, 2016)

Samengestelde samenvatting, gebaseerd op de SPSS Survival Manual van Pallant, 6e druk uit 2016.

Deze samenvatting is zowel te gebruiken bij versie 24 van IBM SPSS als bij andere versies. Bij gebruik van andere versies kan het voorkomen dat de opties een soortgelijke naam hebben gekregen...

Promotions
wereldstage wereldroute

Tussenjaar of sta je op het punt op kamers te gaan?

Wereldroute biedt jou een leerzaam en onvergetelijk Student Prepare Program aan