Samenvattingen en stappenplannen bij SPSS (versie 24) - Bundel
- 5032 reads
De Data Editor (het hoofdscherm van SPSS) is onderverdeeld in twee verschillende tabbladen; Data View en Variabele View (deze tabbladen vind je linksonder in het scherm). Voordat je data kan invoeren moeten er eerst variabelen worden gecreëerd. In het tabblad 'Variabelen View' kun je je variabelen definiëren. In het tabblad ‘Data view’ voer je vervolgens al je data in. Wanneer je een analyse hebt uitgevoerd verschijnt het output scherm.
In dit tabblad kun je de variabelen aanmaken. Iedere rij staat voor een variabele. Je kan in elke kolom informatie over de variabele invoeren.
Name: De naam van de variabele
Type: Type data, vaak zijn dit gewoon nummers oftewel ‘numeric variables’. Ook kan het voorkomen dat er bijvoorbeeld data of letters worden gebruikt. Wil je het type invoeren, selecteer dan de cel en druk op het blauwe vierkantje met puntjes. Vervolgens kun je in een nieuw scherm het type variabele kiezen (bijvoorbeeld numeric, dollar, of date).
Width: Hoeveel posities er beschikbaar zijn
Decimals: Aantal decimalen
Labels: Tekst waarmee je de naam van de variabele kan toelichten
Values: Hier vul je de waarden van de labels in. Een voorbeeld kan zijn dat je variabele geslacht is en de code dan 0 voor man en 1 voor vrouw is. Om de waarden in te vullen selecteer je de cel en klik je op het blauwe vierkantje met de puntjes. Vervolgens schrijf je bij value bijvoorbeeld ‘0’ in en bij label ‘man’.
Missing: Hier kun je een waarde opgeven die je gebruikt hebt om 'geen antwoord' aan te geven. Ook hierbij selecteer je het blauwe vierkantje om de waarden in te voeren.
Columns: Breedte van de kolom in data-view.
Align: Uitlijning
Measure: Op welk level de data is gemeten: nominaal, ordinaal of schaal.
Role: De rol die de variabele speelt in je dataset. Je kunt hierbij selecteren of het om een afhankelijke variabele (‘target’) of onafhankelijke variabele (‘input’) gaat.
Bij het bepalen van variabelen zijn er vier stappen:
Variabelen aanmaken
Labels toekennen aan de antwoord categorieën en de missing values
Invoeren data
Data opschonen
Zie aangehecht .pdf-bestand.
Dit hoofdstuk bevat een algemene introductie met betrekking tot SPSS. Aan bod komt:
Een goed onderzoek is sterk afhankelijk van een uitvoerige planning. Het boek geeft de volgende tips bij het opstarten van een onderzoek:
Kies het design van je onderzoek (bijvoorbeeld experiment, vragenlijst, observationeel). Weeg alle voor- en nadelen van elke methode af.
Als je kiest voor een experiment: beslis of je kiest voor een between-groups design (verschillende proefpersonen in elke experimentele conditie) of een repeated measures design (alle proefpersonen in alle condities).
Als je kiest voor een experiment: zorg voor genoeg niveaus in je onafhankelijke variabele.
Selecteer altijd meer proefpersonen dan nodig (gezien de grote kans op uitval).
Indien mogelijk, wijs proefpersonen random toe aan elke experimentele conditie. Het is van belang dat deze groepen niet op andere zaken van elkaar verschillen (check dit met een covariantie-analyse).
Kies betrouwbare en valide afhankelijke variabelen.
Anticipeer op mogelijke confounding variabelen. Dit zijn variabelen anders dan de onafhankelijke variabele die een mogelijke verklaring kunnen geven voor je resultaat. Controleer indien mogelijk voor deze confounding variabelen.
Als je kiest voor een vragenlijststudie (survey), check dan van tevoren of de instructies, vragen en schalen duidelijk zijn. Dit doe je door middel van pilot testing.
Bij het kiezen van de juiste schaal en methode zijn twee begrippen van belang: betrouwbaarheid en validiteit. Beide begrippen kunnen de kwaliteit van je data beïnvloeden.
De betrouwbaarheid (reliability) van een schaal indiceert in welke mate de schaal vrij is van random error. Er zijn twee soorten betrouwbaarheid:
Test-hertest betrouwbaarheid (test-retest reliability): deze wordt gemeten door de desbetreffende schaal aan te bieden aan twee verschillende personen in twee verschillende situaties en vervolgens de correlatie tussen deze twee scores te berekenen. Des te hoger deze correlatie, des te groter de test-hertest betrouwbaarheid.
Interne consistentie (internal consistency): de mate waarin de items van een schaal met elkaar samenhangen. Deze kan bijvoorbeeld worden berekend met de Cronbach’s cofficient alpha in SPSS. Hierbij geldt dat een Cronbach’s alpha van .7 of groter duidt op een betrouwbare schaal.
De validiteit (validity) van een schaal verwijst naar de mate waarin de methoden meten wat ze beogen te meten. Er bestaan verschillende vormen van validiteit:
Inhoudsvaliditeit (content validity): de mate van accuraatheid waarmee de methode of schaal het beoogde domein of de beoogde inhoud behelst.
Criteriumvaliditeit (criterion validity): de relatie tussen verschillende schaalscores en een gespecificeerd meetcriterium.
Constructvaliditeit (construct validity): de relatie met andere constructen, zowel gerelateerde constructen (convergente validiteit) als ongerelateerde constructen (discriminante validiteit).
Het is belangrijk om bij het opstellen van een vragenlijst in gedachte te houden welke statistische methoden je nodig hebt om de gegevens te analyseren. Afhankelijk van de statistische techniek dien je een bepaalde vraag namelijk op een specifieke manier te stellen.
Veel vragen kunnen worden.....read more
Een variabele is een element dat een bepaalde waarde kan aannemen. Het is een element dat je graag wilt meten en analyseren. Voorbeelden van een variabele zijn ‘geslacht’, ‘leeftijd’, ‘opleidingsniveau’ en ‘IQ’. Middels SPSS kun je onderzoeken of je variabelen met elkaar samenhangen (bijvoorbeeld opleidingsniveau en IQ) of dat een bepaalde variabele een andere variabele voorspelt (bijvoorbeeld: behalen mannen hogere IQ-scores dan vrouwen?).
De afhankelijke variabele is de variabele waarover je een voorspelling doet of de uitkomst van je meting. In het Engels wordt dit de dependent variable genoemd. Een voorbeeld is intelligentie. Je kunt dan onderzoeken welke factoren (onafhankelijke variabelen) invloed hebben op intelligentie (de afhankelijke variabele). In weze hangt de uitkomst van de afhankelijke variabele dus af van andere variabelen (vandaar de naam).
De onafhankelijke variabele is een factor waarvan je gaat meten of deze een verandering veroorzaakt bij de afhankelijke variabele. In het Engels wordt de onafhankelijke variabele de independent variable genoemd. (ID). Als men bijvoorbeeld een onderzoek wilt doen over de invloed van het drinken van alcohol op tentamenresultaten, is de onafhankelijke variabele de hoeveelheid alcohol en de afhankelijke variabele het tentamenresultaat.
Het is van belang om te weten van welk meetniveau je variabele is om vervolgens een goede keuze te maken voor je statistische test (de methode waarmee je je onderzoeksvraag wilt onderzoeken). Een dergelijk meetniveau wordt ook wel een meetschaal genoemd. Er bestaan grofweg vier meetschalen: nominaal, ordinaal, interval en ratio. Deze schalen worden hieronder besproken.
Een discrete variabele kan slechts een paar vaste waarden aannemen. Hieronder vallen de nominale schaal en de ordinale schaal. De nominale schaal is een kwalitatieve meetschaal met losstaande categorieën, bijvoorbeeld geslacht (man/vrouw). Metingen op ordinaal niveau kennen een natuurlijke ordening. De volgorde is duidelijk, maar de verschillen zijn niet te interpreteren. Een voorbeeld is het opleidingsniveau (VMBO-HAVO-VWO). De verschillen tussen deze opleidingsniveaus zijn niet allemaal even groot.
Een continue variabele is een variabele die gemeten kan worden in getallen, waarbij de tussenliggende waarden betekenis hebben. Hieronder vallen de interval schaal en de ratio schaal. Bij een interval schaal zijn de verschillen tussen scores in tegenstelling tot een ordinale schaal wél gelijk. Het verschil tussen 10 en 11 op een test is net zo groot als het verschil tussen 50 en 51. Een intervalschaal heeft echter geen absoluut nulpunt. Daarom kun je niet zeggen hoeveel hoger een waarde is. Een goed voorbeeld hiervan is de Fahrenheit-schaal: 30 graden is niet twee keer zo warm als 15 graden.
Een ratioschaal heeft dezelfde eigenschappen als een intervalschaal, maar een ratioschaal heeft wel een absoluut nulpunt. 50 centimeter is immers twee keer zo lang als 25 centimeter.
Een categorische variabele is een variabele die geen getallen aanneemt, maar onderverdeeld wordt in categorieën. Het meest gebruikte voorbeeld is man/vrouw.
Een dichotome variabele is een variabele die slechts twee opties kent, zoals goed/fout.
Dit hoofdstuk bevat een praktische instructie voor het berekenen van gemiddelden.
Dit is de gemiddelde gekwadrateerde afwijking van het gemiddelde. Je kan de variantie berekenen door eerst het gemiddelde van alle observaties af te trekken. Dan krijg je alle afwijkingen van het gemiddelden. Deze afwijkingen kwadrateer je om ze daarna bij elkaar op te tellen. Op deze manier bereken je de sum of squares. Wanneer we deze delen door het aantal observaties komen we uiteindelijk uit op de gemiddelde gekwadrateerde afwijking van het gemiddelde, dus de variantie.
In SPSS bereken je de variantie met ‘Frequencies’. Je volgt dan de volgende stappen:
Kies Analyze en daarna Descriptive statistics. Vervolgens kies je voor Frequencies.
Kies de variabele waarin je geïnteresseerd bent en selecteer deze door op de pijltjestoets (rechts wijzend) te klikken.
Vervolgens klik je op Statistics en bij Dispersion klik je Variance aan.
Klik vervolgens op Continue en dan op OK (of op Paste als je de analyse wil opslaan wil in de Syntax Editor).
De syntax wordt gegenereerd met het volgende commando:
FREQUENCIES VARIABLES=leeftijd
/STATISTICS=VARIANCE
/ORDER=ANALYSIS.
Dit hoofdstuk bevat een praktische instructie voor het berekenen van een betrouwbaarheidsinterval. Zie aangehecht .pdf-bestand.
Dit hoofdstuk geeft een korte toelichting met betrekking tot het gebruik van de sum of squares als methode. Zie aangehecht .pdf-bestand.
De standaarddeviatie of standaardafwijking is gelijk aan de wortel van de variantie en dus eigenlijk een maat voor min of meer hetzelfde. De variantie heeft de meer aantrekkelijke wiskundige eigenschappen, bijvoorbeeld dat de variantie van de som van onafhankelijke variabelen gelijk is aan de som van de varianties van de afzonderlijke variabelen. De standaarddeviatie is beter interpreteerbaar. Aangezien de variantie gebaseerd is op gekwadrateerde getallen, is hij niet van dezelfde ordegrootte als de observaties. Door er de wortel uit te trekken, dus de standaarddeviatie te nemen, wordt hij weer teruggebracht tot de ordegrootte van de observaties. Symbolen voor de standaarddeviatie zijn S (of s), en SD (of sd); de populatiestandaarddeviatie duiden we aan met de Griekse letter s (sigma).
In SPSS kan de standaarddeviatie worden berekend door middel van Frequencies. Je volgt dan de volgende stappen:
Ga naar Analyze en vervolgens naar Descriptive statistics. Ga dan naar Frequencies.
Vervolgens klik je op Statistics en vink je links onderaan bij ‘Dispersion de volgende optie aan: Std. Deviation.
Klik daarna op Continue en op OK (of op Paste als je de analyse wil opslaan in de Syntax Editor).
De syntax wordt gegenereerd met de volgende commando’s:
FREQUENCIES VARIABLES=leeftijd
/STATISTICS=STDDEV
/ORDER=ANALYSIS.
Met ‘vrijheidsgraden’ (degrees of freedom) wordt bedoeld het aantal onafhankelijke schattingen die je kunt maken van een bepaalde waarde. Het symbool van vrijheidsgraden is (df) = n – 1.
Dit hoofdstuk behandeld twee soorten toetsen. Achtereenvolgens komt aan de orde:
Het is belangrijk om te weten hoe belangrijk of veelzeggend een gevonden effect is. Een effect is bijvoorbeeld niet altijd betekenisvol of belangrijk zelfs als de statistische test een significant effect aangeeft. De effect size is de maat die je gebruikt wanneer je wilt meten hoe sterk een gemeten effect is binnen een populatie. Deze maat geeft een simpele, objectieve en gestandaardiseerde grootte van het gevonden effect aan. De test is gestandaardiseerd, dus men kan de effect sizes vergelijken met andere studies waarin andere variabelen zijn gebruikt. Een effect size is dus een manier van het kwantificeren van het verschil tussen twee groepen.
Er zijn veel verschillende soorten ‘effect sizes’. De bekendste zijn partial eta square en Cohen’s d. Partial eta square is een indicatie van de mate waarin de variantie van de afhankelijke variabele wordt verklaard door de onafhankelijke variabele. Waarden komen voor van 0 tot 1. Een kleine waarde is .01, een medium waarde .06 en een grote waarde .138. Cohen’s d presenteert het verschil tussen groepen in termen van standaardafwijkingen. Een kleine effect size hierbij is tot .2, een medium effect vanaf .5 en een groot effect vanaf .8.
Het onderscheidend vermogen, of onderscheidingsvermogen van een statistische toets is de kans om een nulhypothese terecht te verwerpen, dus de kans dat de toets niet een fout van de tweede soort (type II-fout) maakt. Aangezien de alternatieve hypothese vaak samengesteld is, zal het onderscheidend vermogen een functie zijn, aangegeven door γ (of ook wel door β), van de mogelijke waarden van de betrokken parameter onder de nulhypothese. Ideaal is een power van minstens .8.
In het within-subjects design worden voor elke meting dezelfde participanten gebruikt. Een voorbeeld hiervan is een longitudinale studie waarbij één participant op meerdere momenten getest wordt.
In het between-subjects design worden verschillende groepen met elkaar vergeleken, zoals bij een experimentele en een controlegroep.
Voordat je alle informatie van vragenlijsten en experimenten in IBM SPSS kan invoeren is het noodzakelijk om een ‘codeboek’ te maken. Dit is een samenvatting van de instructies die je gaat gebruiken om de informatie van elke proefpersoon om te zetten in een format dat IBM SPSS kan begrijpen. Het voorbereiden van een codeboek bestaat uit (1) het definiëren en labelen van elke variabele, en (2) het toekennen van nummers aan alle mogelijke antwoorden.
Op bladzijde 12 van het boek vind je een voorbeeld van een codeboek. Zoals te zien is in dit voorbeeld bestaat een codeboek uit vier kolommen:
de afgekorte naam van de variabele (bijvoorbeeld ‘ID’ voor ‘identification number’)
de uitgeschreven naam van de variabele (bijvoorbeeld ‘identification number’)
uitleg over hoe de mogelijke antwoorden worden gedoceerd (bijvoorbeeld 1 = mannen, 2 = vrouwen)
de meetschaal (bijvoorbeeld nominaal)
Elke vraag of item in je vragenlijst dient een unieke variabelenaam te krijgen. Er bestaat een aantal regels waar een variabelenaam aan moet voldoen:
elke variabele moet een andere naam krijgen en dient dus uniek te zijn
elke variabele moet beginnen met een letter (niet met een cijfer)
een variabele kan geen symbool (bijvoorbeeld !, ?) of spatie bevatten
een variabele kan geen woord bevatten die door IBM SPSS wordt gebruikt als commando (bijvoorbeeld all, ne, eq)
een variabele kan niet meer dan 64 karakters bevatten
De Data Editor (het hoofdscherm van SPSS) is onderverdeeld in twee verschillende tabbladen; Data View en Variabele View (deze tabbladen vind je linksonder in het scherm). Voordat je data kan invoeren moeten er eerst variabelen worden gecreëerd. In het tabblad 'Variabelen View' kun je je variabelen definiëren. In het tabblad ‘Data view’ voer je vervolgens al je data in. Wanneer je een analyse hebt uitgevoerd verschijnt het output scherm.
In dit tabblad kun je de variabelen aanmaken. Iedere rij staat voor een variabele. Je kan in elke kolom informatie over de variabele invoeren.
Name: De naam van de variabele
Type: Type data, vaak zijn dit gewoon nummers oftewel ‘numeric variables’. Ook kan het voorkomen dat er bijvoorbeeld data of letters worden gebruikt. Wil je het type invoeren, selecteer dan de cel en druk op het blauwe vierkantje met puntjes. Vervolgens kun je in een nieuw scherm het type variabele kiezen (bijvoorbeeld numeric, dollar, of date).
Width: Hoeveel posities er beschikbaar zijn
Decimals: Aantal decimalen
Labels: Tekst waarmee je de naam van de variabele kan toelichten
Values: Hier vul je de waarden van de labels in. Een voorbeeld kan zijn dat je variabele geslacht is en de code dan 0 voor man en 1 voor vrouw is. Om de waarden in te vullen selecteer je de cel en klik je op het blauwe vierkantje met de puntjes. Vervolgens schrijf je bij value bijvoorbeeld ‘0’ in en bij label ‘man’.
Missing: Hier kun je een waarde opgeven die je gebruikt hebt om 'geen antwoord' aan te geven. Ook hierbij selecteer je het blauwe vierkantje om de waarden in te voeren.
Columns: Breedte van de kolom in data-view.
Align: Uitlijning
Measure: Op welk level de data is gemeten: nominaal, ordinaal of schaal.
Role: De rol die de variabele speelt in je dataset. Je kunt hierbij selecteren of het om een afhankelijke variabele (‘target’) of onafhankelijke variabele (‘input’) gaat.
Bij het bepalen van variabelen zijn er vier stappen:
Variabelen aanmaken
Labels toekennen aan de antwoord categorieën en de missing values
Invoeren data
Data opschonen
Een praktische handleiding voor het invoeren van data kan op twee manieren:
Zie aangehecht .pdf-bestand.
Het komt vaak voor dat je niet alle data van...Read more
Dit hoofdstuk geeft een praktische handleiding voor het controleren van outliers (extreme waarden). Zie aangehecht .pdf-bestand.
Assumpties zijn voorwaarden waaraan je data moet voldoen om een bepaalde toets uit te voeren. Deze assumpties verschillen bij elke toets. Wanneer er aan deze assumpties inderdaad voldaan is, geeft een parametrische toets doorgaans een beter onderscheidingsvermogen dan een niet-parametrische test. Bij een niet-parametrische test zijn er geen veronderstellingen wat betreft een normale distributie.
Er zijn vier assumpties bij parametrische testen:
De data moet normaal verdeeld zijn. Dit kun je testen met de Kolmogorov-Smirnov test.
De variaties door de data heen moeten hetzelfde zijn. De Levene test kan gebruikt worden om dit te testen.
De data moeten op zijn minst op interval schaal gemeten zijn.
De data moet onafhankelijk van elkaar zijn.
Voor veel toetsen is de normale verdeling een assumptie omdat anders de logica van de test niet meer klopt. Het checken van een normaal verdeling kan gecheckt worden aan de hand van grafieken. Ook kan je de Kolmogoroc-Smirnov test doen.
Hier volgt de procedure om normaliteit te meten door middel van Explore.
Kies Analyze en selecteer Descriptive statistics en vervolgens Explore.
Klik de variabelen aan waarin je geïnteresserd bent. Klik op de pijltjestoets (wijzend naar rechts) en sleep deze variabelen naar de Dependent list.
Plaats in de Labels Cases by je onafhankelijke variabele.
In de Display sectie: zorg ervoor dat Both is geselecteerd.
Klik op Statistics en klik Descriptives en Outliers aan. Klik daarna op Continue.
Klik daarna op Plots en klik onder Descriptives aan: Histogram. Vervolgens vink je Stem-and-leaf uit. Klik Normality plots with tests aan en klik daarna op Continue.
Klik op Options. In de Missing Values sectie klik je op Exclude cases pairwise. Klik daarna op Continue en op OK (of op Paste om de analyse op te slaan in de Syntax Editor).
De syntax wordt als volgt gegenereerd:
EXAMINE VARIABLES=leeftijd
/ID=geslacht
/PLOT BOXPLOT HISTOGRAM NPPLOT
/COMPARE GROUPS
/STATISTICS DESCRIPTIVES
/CINTERVAL 95
/MISSING PAIRWISE
/NOTOTAL.
Zie het hoofdstuk 29 voor interpretatie van normaliteit door middel van de Kolmogorov-Smirnov test
Je gebruikt deze functie wanneer je cijfers in je databestand gebruikt die niet meteen de werkelijke betekenis aanduiden. Zo kun je bijvoorbeeld aan de numerieke codes 0 en 1 de waarde ‘man’ en ‘vrouw’ toekennen. Het kader 'define value labels' wordt opgeroepen door in desbetreffende cel te staan van de kolom 'values'. Op dat ogenblik staat er in die cel de waarde 'none'. Als je...Read more
Dit hoofdstuk geeft een praktische handleiding voor het selecteren van data en beschrijft de te volgen procedure. Zie aangehecht .pdf-bestand.
Dit hoofdstuk geeft een praktische handleiding voor het omcoderen ofwel spiegelen van variabelen. Zie aangehecht .pdf-bestand.
Zie aangehecht .pdf-bestand.
Dit hoofdstuk geeft een praktische handleiding voor het opschonen van data. Aan bod komt:
Met een dummy variabele kun je een categorische predictor variabele hanteerbaar maken voor verschillende analyses. Dummy-coderen houdt eigenlijk in dat je van een nominale variabele een intervalvariabele maakt. Dummy- codering gebruikt alleen maar 0 en 1-waarden.
Een voorbeeld:
Bij een nominale variabele geslacht krijgt ‘vrouw zijn’ dan als code 0 en 'man zijn' als code 1. Je moet deze waarde eigenlijk zien als een score op een schaal, bijvoorbeeld de schaal 'mannelijkheid'. Het is dus niet hetzelfde als wanneer je waardes een ‘Label’ geeft. Vrouwen scoren (als het goed is) hier 0 en mannen 1, dus denkt SPSS dan dat het om een intervalvariabele gaat, zodat je hier bijvoorbeeld een regressieanalyse mee kunt uitvoeren. Het aantal dummy’s dat je aanmaakt is altijd 1 minder dan het aantal groepen. Kies één van je groepen als baseline groep (meestal de controle groep), deze groep krijgt voor alle dummy variabele een 0.
Aanmaken van een Dummy:
Selecteer de categorische variabele die je wilt dummy coderen. Noteer het aantal categorieën. Dat is dus zoals hierboven al genoemd werd het aantal categorieën je hebt -1.
Klik op Transform en selecteer ‘Recode into different variables’. Selecteer daarna de data die je wilt recoderen, klik en nu kom je in het scherm ‘Numeric Variable’
Klik hierna op de Output Variable en typ daar de naam voor je nieuwe variabele. Klik op Change. Klik op Old and New Values. Er opent nu een nieuw scherm.
Recode nu de values of de variabele door één categorie met 1 te coderen en de andere met 0. Onder ‘new value’ typ je een ‘1’ en daarna voeg je deze toe door op ‘Add’ te drukken. Onder Old Value selecteer je de knop All other Values en vul je ‘0’ in bij ‘New Value’.
Hierna kan je op Continue klikken en daarna op OK of op Paste om alles op te slaan in de Syntax Editor).
Zie aangehecht .pdf-bestand.
Dit hoofdstuk geeft houvast bij het beschrijvende fase van de data-analyse. Aan bod komt:
Zie aangehecht .pdf-bestand.
Dit hoofdstuk geeft een praktische handleiding voor het gebruik van de functie 'frequencies'.
Zie aangehecht .pdf-bestand.
Dit hoofdstuk geeft een korte beschrijving van het gebruik van de Kolmogorov-Smirnov test.
Zie aangehecht .pdf-bestand.
Dit hoofdstuk geeft een korte beschrijving van het gebruik van de Levene's test.
Eenvoudige analyses die je kunt gebruiken om diverse onderzoeksvragen te onderzoeken zijn de correlatie, de variantieanalyses (ANOVA en ANCOVA), regressieanalyses en de onafhankelijke t-toets.
Een correlatieanalyse wordt gebruikt om de sterkte en de richting van een lineaire relatie tussen twee variabelen te beschrijven. Er zijn verschillende statistieken beschikbaar in IBM SPSS om een correlatie te meten, waaronder de Pearson productmoment correlation cofficient (r) en de Spearman Rank Order Correlation (rho). Pearson r wordt gebruikt bij variabelen op intervalniveau terwijl de Spearman rho wordt gebruikt bij variabelen op ordinaal niveau.
Een correlatie geeft aan in hoeverre twee variabelen samenhangen, bijvoorbeeld het zijn van een vrouw en het dragen van roze kleding. Let op: een correlatie vertelt niets over een causale relatie tussen twee variabelen. Je kunt dus niet direct stellen dat de ene variabele de andere variabele beïnvloedt.
Correlaties worden ook vaak gebruikt om data te beschrijven en de data te checken op assumpties. De correlatiecoëfficiënt kan zowel negatief als positief zijn en ligt altijd tussen -1 en 1. Een correlatie van -1 is een perfect negatieve correlatie. Hierbij is sprake van een verband tussen twee tegenovergestelde dingen. Denk hierbij aan het dragen van een bikini en het niet dragen van handschoenen. Een correlatie van 1 is een perfecte positieve correlatie. Hierbij is sprake van een verband tussen twee positieve of twee negatieve variabelen. Bijvoorbeeld: het dragen van een bikini en het eten van een ijsje. Een correlatie van 0 indiceert dat er geen sprake is van een relatie tussen twee variabelen.
Nu volgt een voorbeeld van een onderzoeksvraag naar een correlationeel verband.
Onderzoeksvraag: Is er een verband tussen de hoeveelheid tentamenstress en de hoeveelheid alcoholconsumptie van studenten? Drinken mensen met meer tentamenstress meer alcohol of minder alcohol?
Wat heb je nodig: twee variabelen, allebei continue, of één continue en de ander dichotoom (twee waarden)
Wat doet het: Correlatie beschrijft de relatie tussen twee continue variabelen van zowel de sterkte van de relatie als de richting van het verband.
Assumpties: zie onder.
Niet-parametrisch alternatief: Spearman Rank Order Correlation (rho).
In de volgende hoofdstukken wordt uitgelegd hoe je een correlatieanalyse uitvoert ofwel met de Pearson r of met de Spearman rho.
Zie aangehecht .pdf-bestand.
In het vorige hoofdstuk werd de Pearson productmoment correlation cofficient (r), hierna verder afgekort met Pearson r, reeds geïntroduceerd. De Pearson r meet het verband of de relatie tussen twee variabelen van intervalniveau.
Zie aangehecht .pdf-bestand.
Dit hoofdstuk geeft een praktische handleiding voor het gebruik van de Spearman Correlation & Kendall’s Tau.
Zie aangehecht .pdf-bestand.
Dit hoofdstuk bespreekt de eenweg variantieanalyse (one-way analysis of variance). Aan bod komt:
Zie aangehecht .pdf-bestand.
Dit hoofdstuk bespreekt de ANCOVA (analysis of covariance) en geeft een praktische handleiding voor het verrichten daarvan. Aan bod komt:
Regressie is een specifieke samenhang tussen verschillende gegevens. Het lijkt in weze op een correlatie, echter is een regressie iets gecompliceerder. Een regressiecoëfficiënt (ß) geeft aan in welke mate de waarde van een afhankelijke variabele zal veranderen wanneer er sprake is van een verandering in de onafhankelijke variabele. Een regressieanalyse geeft een idee hoe twee variabelen aan elkaar zijn gerelateerd, echter geeft...Read more
Zie aangehecht .pdf-bestand.
Dit hoofdstuk geeft een praktische handleiding voor het uitvoeren van een onafhankelijke t-toets. Aan bod komt:
Zie aangehecht .pdf-bestand.
Dit hoofdstuk geeft een praktische handleiding voor het uitvoeren van een multiple regressieanalyse. Aan bod komt:
Een complexe analyse omvat is onder meer de Mann-Whitney test; een non-parametrisch alternatief voor de onafhankelijke t-toets. Daarnaast zijn nog een aantal statistische analyses van gevorderd niveau die kunnen worden gebruikt.
De Mann-Whitney test wordt gebruikt om de verschillen tussen twee onafhankelijke groepen te toetsen met betrekking tot een continue uitkomst. Een voorbeeld is: verschillen mannen en vrouwen in depressiescores? Deze test is een niet-parametrisch alternatief voor een t-toets voor onafhankelijke steekproeven. In tegenstelling tot het toetsen van twee gemiddelden test de Mann-Whitney test de medianen.
Nu volgt een voorbeeld van een onderzoeksvraag die je kunt onderzoeken met de Mann-Whitney test.
Onderzoeksvraag: Verschillen mannen en vrouwen met betrekking tot hun depressiescores? Hebben vrouwen hogere depressiescores dan mannen?
Wat heb je nodig: twee variabelen:
één categorische variabele met twee groepen (geslacht)
één continue variabele (depressiescores)
Nu volgt de procedure voor het uitvoeren van een Mann-Whitney test.
Klik op Analyze en selecteer Nonparametric Tests en klik dan op Independent Samples.
In het blad genaamd Objective klik je op Customize analysis in de sectie “What is your objective?”.
Klik op Fields.
Selecteer je categorische (onafhankelijke) variabele (geslacht) en sleep deze naar de Groups sectie.
Selecteer je continue (afhankelijke) variabele (depressiescores) en sleep deze naar de Test field sectie.
Klik op Settings en selecteer Customize tests. Klik op Mann-Whitney U (2 samples).
Klik op Run (of op Paste om de analyse op te slaan in de Syntax Editor).
In de output wordt vervolgens weergegeven of je de hypothese moet behouden of moet verwerpen.
Naast de eerder besproken eenvoudige en multipele regressieanalyse, is er ook een meer complexe regressieanalyse, namelijk de logistische regressie.
Zie aangehecht .pdf-bestand.
Dit hoofdstuk geeft een praktische handleiding voor het uitvoeren van een logistische regressieanalyse. Aan bod komt:
Een afhankelijke (gepaarde) t-toets (in het Engels aangeduid met paired-sample t-test) wordt gebruikt wanneer er slechts één groep is en je graag data wil verzamelen van deze groep in twee verschillende situaties of onder twee verschillende condities. Een voorbeeld is een pre-test/post-test experimenteel design waarbij elke persoon van de groep wordt gemeten op dezelfde afhankelijke variabele op twee verschillende tijdstippen: tijdstip 1 (vóór de experimentele manipulatie) en tijdstip 2 (na de experimentele manipulatie). De gepaarde afhankelijke t-toets wordt ook gebruik wanneer sprake is van gematchte paren van proefpersonen (bijvoorbeeld elke persoon wordt gematcht aan een andere persoon op basis van geslacht). Scores op een continue variabele worden dan vervolgens met elkaar vergeleken voor elk paar.
Bij de gepaarde afhankelijke t-toets horen de volgende assumpties:
normale verdeling
de groepen moeten afhankelijk zijn
de groepen moeten even groot zijn
Nu volgt de procedure voor het uitvoeren van een afhankelijke t-toets.
Kies Analyze selecteer vervolgens Compare Means en klik dan op Paired Samples T-test.
Klik de twee variabelen aan die je met elkaar wilt vergelijken voor elke proefpersoon (bijvoorbeeld depressiescores op tijdstip 1 en depressiescores op tijdstip 2). Sleep deze variabelen naar de sectie genaamd Paired Variables door te klikken op de pijltjestoets (wijzend naar rechts). Klik op OK (of op Paste om de analyse op te slaan in de Syntax Editor).
Zie aangehecht .pdf-bestand.
Dit hoofdstuk bespreekt de Point-biserial correlatie en geeft een praktische handleiding voor het berekenen daarvan. Aan bod komt:
Zie aangehecht .pdf-bestand.
Dit hoofddtuk geeft een praktische handleiding voor het uitvoeren van de Wilcoxon signed rank test. Aan bod komt:
Zie aangehecht .pdf-bestand.
Dit hoofdstuk beschrijft de One Way repeated measures ANOVA toets. Aan bod komt:
Zie aangehecht .pdf-bestand.
Dit hoofdstuk geeft een praktische handleiding voor het uitvoeren van een Kruskal-Wallis Test. Aan bod komt:
Zie aangehecht .pdf-bestand.
Dit hoofdstuk geeft een praktische handleiding voor het uitvoeren van een Friedman test. Aan bod komt:
Een factor-analyse is op diverse vlakken anders dan de eerder besproken analyses. Een factor-analyse is namelijk niet ontworpen om hypothesen te testen of om te onderzoeken of een groep significant verschilt van een andere groep. Factor-analyse is een zogenaamde ‘data-reductie techniek’. Het neemt een groot aantal variabelen en kijkt of de data kan worden gereduceerd in een kleinere set factoren of componenten. Er bestaan diverse soorten factor-analyses die in...Read more
Zie aangehecht .pdf-bestand.
Dit hoofdstuk geeft een praktische handleiding voor het uitvoeren van een log-lineair analyse. Aan bod komt:
Zie aangehecht .pdf-bestand.
Dit hoofdstuk geeft een praktische handleiding voor het uitvoeren van een Factorial Analysis of Variance. Aan bod komt:
Zie aangehecht .pdf-bestand.
Dit hoofdstuk behandelt de factorial repeated measures ANOVA. Aan bod komt:
Zie aangehecht .pdf-bestand.
Dit hoofdstuk behandelt de factorial mixed ANOVA. Aan bod komt:
Zie aangehecht .pdf-bestand.
Dit hoofdstuk geeft een praktische handleiding voor het uitvoeren van een Multivariate Analysis of Variance (MANOVA). Aan bod komt:
Zie aangehecht .pdf-bestand.
Dit hoofdstuk behandelt de factoriale MANOVA. Aan bod komt:
JoHo can really use your help! Check out the various student jobs here that match your studies, improve your competencies, strengthen your CV and contribute to a more tolerant world
Je vertrek voorbereiden of je verzekering afsluiten bij studie, stage of onderzoek in het buitenland
Study or work abroad? check your insurance options with The JoHo Foundation
There are several ways to navigate the large amount of summaries, study notes en practice exams on JoHo WorldSupporter.
Do you want to share your summaries with JoHo WorldSupporter and its visitors?
Field of study
Add new contribution