Samenvatting van de colleges 7 t/m 9 (Tweeweg ANOVA, Niet reactieve metingen, Chi-kwadraat toetsen


College 7: Tweeweg ANOVA

Gravetter en Wallnau hoofdstuk 14

Kirsten Namesnik, 18 mei 2015

Vandaag wordt de ANOVA uitgebreid met het kijken naar twee variabelen waarvan je categorieën wil vergelijken. Dit wordt de tweeweg ANOVA genoemd, met gelijke steekproefgroottes.

Tweeweg ANOVA

Een voorbeeld is bijvoorbeeld het kijken of scholieren in de derde klas van het VMBO/HAVO/vwo verschillen in de hoeveelheid televisie die ze kijken. De afhankelijke variabele is hierbij tijd, met het meetniveau van ratio.

Deze groepen kunnen verschillen met betrekking tot een tweede variabele/factor, bijvoorbeeld of er een verschil is tussen meisjes en jongens. Hierbij kan een tweede factor in de ANOVA opgenomen worden, bijvoorbeeld het schoolniveau. Er wordt dan niet alleen rekening gehouden met het schoolniveau, maar ook met het verschil tussen jongens en meisjes. Om hier achter te komen wordt een tweeweg ANOVA gebruikt. Met behulp van een analysediagram wordt zichtbaar wat de gemiddelden zijn en waar de spreiding is. De conclusies van deze twee variabelen hoeft niet gelijk te zijn.

Interactiediagrammen

In het algemeen is het zo dat als er parallelle lijnen zijn in de interactiediagrammen dat er dan geen interactie is tussen de twee factoren. Bij kruisende lijnen lijkt er een interactie te zijn tussen twee factoren. Dit moet uiteraard verder onderzocht worden op basis van een statistische toets, want het hoeft niet altijd zo te zijn.

Interactie is het idee dat het effect van de ene onafhankelijke variabele anders is voor de groepen gedefinieerd door de andere onafhankelijke variabele. Dit kan grafisch weergegeven worden door de twee onafhankelijke variabelen te tekenen als effect op de afhankelijke variabele Y. Beide variabelen hebben een hoofdeffect op de Y. Er is echter ook sprake van een interactie-effect AxB.

Onafhankelijke variabelen worden in de ANOVA vaak factoren genoemd. De eerste onafhankelijke variabele wordt vaak aangegeven met factor A en de tweede onafhankelijke variabele met factor B. De interactie hierbij is dat A afhankelijk is van B en andersom.

In het algemeen geldt het volgende voor de interactiediagrammen. Parallelle lijnen geven aan dat er geen interactie is tussen de twee factoren. Kruisende lijnen geven aan dat er wel een reactie lijkt te zijn tussen de twee factoren. Pas op: het kan zo zijn dat er bij een kruisende lijn geen sprake is van interactie en het kan ook zijn dat er wel een interactie is zonder dat de lijnen kruisen. Het is dus van belang om altijd te toetsen en geen conclusie te trekken puur op basis van een interactiediagram.

Stappen

Er zijn verschillende stappen in de tweeweg ANOVA. De eerste stap is het bepalen van de hypotheses en het significantie niveau kiezen. Hierna worden de kritieke waarden bepaald, maar soms kan dat pas later omdat er nog niet voldoende gegevens bekent zijn. Stap drie is de H0 aannemen en de toetsingsgrootheid uitrekenen. Vervolgens wordt er een beslissing genomen over de H0, vaak aan de hand van de p-waarde. Tot slot wordt de conclusie gerapporteerd.

Aan de hand van het bovengenoemde voorbeeld voeren we de stappen uit:

Bij stap één wordt er gekeken bij H0 dat er geen effect is van factor A op de afhankelijke variabele, H1 stelt dat er wel een effect is van factor A op de afhankelijke variabele. Er is sprake van twee hoofdeffecten dus die moeten allebei genoteerd worden. Voorbeeld: Het eerste hoofdeffect is bij H0 dat sekse geen effect heeft op een gemiddelde televisiekijktijd en H1 dat sekse wel effect heeft op de gemiddelde televisietijd. In symbolen wordt dit: H0: µjongens = µmeisjes en H1: µjongens ≠ µmeisjes. Hoofdeffect twee is bij H0 dat het schooltype geen effect heeft op de gemiddelde televisietijd, met H1 dat het schooltype wel een effect heeft op de gemiddelde televisietijd. In symbolen wordt dit: H0: µVMBO = µHAVO = µVWO en H1: er is ten minste 1 gemiddelde anders dan de anderen. Verder toetsen we tweezijdig, omdat de richting niet bekend is. Bij een factor met meer dan 2 levels wordt H1 altijd in woorden beschreven, zoals H1 bij schooltype in het voorbeeld. Ook het interactie-effect moet genoemd worden. Bij H0 is dat dat er geen interactie-effect van sekse en schooltype is op de gemiddelde televisietijd. Bij H1 wordt gesteld dat er wel een interactie0-effect van sekse en schooltype is op de gemiddelde televisietijd. Het heet dus een tweeweg ANOVA maar je toetst drie effecten.

Vervolgens kan er een tabel van de gemiddelden gemaakt worden om overzicht te krijgen over de combinaties en de gemiddelden. Ook de totalen kunnen hierbij weergegeven worden. Elke combinaties van twee levels van de twee factoren heet een treatment of een cel.

Er kunnen twee maten van spreiding berekend worden. Een spreiding binnen de groepen (binnenvariantie) en een spreiding tussen de groepen (tussenvariantie). Wat nu nieuw is, is dat de binnenvariantie verder opgesplitst wordt naar geslacht en naar schoolniveau. Dan krijgen we dus 1 deel voor factor A, een deel voor factor B en een deel voor de interactie tussen A en B. Elke spreidingsmaat is weer een Mean Square, die uiteindelijk in de variantietabel gebruikt kunnen worden. MSa meet de systematische verschillen tussen de rijgemiddelden. MSb meet de systematische verschillen tussen de kolomgemiddelden. De MSaxb meet of de verschillen binnen de kolommen overeenkomen met de verschillen tussen de rijgemiddelden. Het kan ook dat de MSaxb meet of de verschillen binnen de rijen overeenkomen met de verschillen tussen de kolomgemiddelden.

De formules zijn hetzelfde als die van de eenweg ANOVA! Het verschil is dat de SSbetween verder opgesplitst moet worden in factor A (SSa), factor B (SSb) en de interactie (SSaxb). Het aantal vrijheidsgraden is 1, met een df totaal van N-1, df-within=N-k en de df-between=k-1 (aantal cellen -1). Let op! df-between kan opgesplitst worden in dfA (aantal rijen – 1) + dfB (aantal kolommen -1) + dfaxb(dfa keer dfb). En df-total = dfA + dfB + dfAxB + df-within

Vervolgens kunnen de kwadratensommen gedeeld worden door de vrijheidsgraden om er mean squares van te maken. De verschillende mean squares worden gebruikt om de drie verschillende hypothesen te toetsen. Waarbij de mean square van een factor gedeeld wordt door de mean square within.

De verschillende F-ratio’s hangen af van twee vrijheidsgraden, de teller en de noemer. De df onder de streep is de df van de MS within. De df van het effect staat boven de streep. Aan de hand van deze df kunnen we de Fkritiek opzoeken.

Effectgrootte

De effectgrootte meet het effect van factor A nadat de effecten van factor B en de interactie zijn verwijderd. Dit wordt ook vaak de partial eta2 genoemd. Voor factor B of de interactie moet de formule aangepast worden. De richtlijnen van Cohen worden gebruikt om te bepalen hoe groot het effect is. Bij 0.01 is er een klein effect, bij 0.09 een medium effect en bij 0.25 een groot effect.

Rapporteren

Net als bij eenweg ANOVA wordt de tabel weergegeven met M en s per groep. Verder wordt er per effect beschreven over de resultaten.

Bij een significante interactie moeten we altijd voorzichtig zijn met het interpreteren van de hoofdeffecten. Een significante interactie kan de hoofdeffecten camoufleren of vertekenen. Bij significante interactie weten we dat de effecten van één factor afhankelijk zijn van de andere factor. De verschillen tussen de gemiddelden binnen een rij kunnen anders zijn dan de verschillen binnen een andere rij.

 

College 8: Niet reactieve metingen

Neuman hoofdstuk 8 en 12

20 mei 2015

Reactieve metingen zijn metingen die je doet in een onderzoek, waarbij de participanten weten dat er sprake is van een onderzoek. Nadeel van experiment, survey en observatie is dat de participanten doorgaans weten dat zij deelnemen aan een onderzoek. Het gevolg hiervan is dat zij daarop hun gedrag afstemmen, omdat ze graag goede resultaten uit het onderzoek willen zien. Deze reactiviteit is een bedreiging van de interne validiteit.

Neuman onderscheidt vier soorten niet-reactief onderzoek, namelijk fysieke neerslag van gedrag (“Stiekeme metingen”), inhoudsanalyse, kijken naar reeds beschikbare statistieken en secundaire analyse.

Fysieke neerslag van gedrag

Fysieke neerslag van gedrag: data die je gewoon op straat vindt of ziet. Een voorbeeld van fysieke neerslag van gedrag is het voorbeeld van het Garbage Project. Een vuilnishoop is namelijk het ultieme archief! Deze onderzoekers gebruiken archeologische onderzoekstechnieken bij onderzoek naar moderne vuilnisresten, waarbij ze kijken wat mensen kopen in welke stad. Deze fysieke neerslag is non-verbaal gedrag observeren. Het centrale idee hierbij is dat men van verbaal gedrag af wil en men probeert daarom dingen daaromheen te meten. Je krijgt wat we zeggen wat we doen tegenover wat we daadwerkelijk doen, ook wel sociale wenselijkheid genoemd. Het gaat hier ook om image management: we geloven eerder wat men doet dan wat men zegt.

In het vuilnisonderzoek heeft men ook een survey afgenomen, face-to-face. Deze vroegen de mensen naar hun voedingsgewoonten. Tegelijkertijd werd de vuilniszak meegenomen. Er werd dus vergeleken wat mensen aangaven in de survey en wat bleek uit de vuilniszak.

Er zitten wel een aantal ethische problemen aan. Mag je zomaar andermans vuilnis doorzoeken? Hier zijn bepaalde rechtszaken over geweest, publiek gedrag mag je onderzoeken, maar privégedrag niet. Vuilnis is privégedrag. Een ander probleem is dat de neerslag van gedrag/sporen niet heel informatief is. Je kan namelijk observeren wat er gebeurd is, maar niet waarom. Vaak maak je een ‘educated quess’ over hoe en waarom mensen zich op bepaalde manieren gedragen. Er kunnen geen theorieën mee getoetst worden en ook is het onderzoek vaak betrekkelijk arm aan theorie. Er kan ook stiekem geëxperimenteerd worden, bijvoorbeeld met auto’s in de wijk. Je kunt dan de status en nationaliteit van de auto manipuleren, en dan kijken hoe lang het duurt voordat er vandalen toeslaan.

 

Fysiek bewijs meet je door het bewijs eerst te identificeren en het vervolgens te meten en tellen. Dan identificeer je andere variabelen die relevant zijn voor je onderzoek. Je voert toetsen uit en kijkt als laatst naar alternatieve verklaringen voor het bewijs.

Inhoudsanalyse

Inhoudsanalyse is sterker, omdat het boodschappen analyseert. Dit houdt niet alleen analyse in van wat er gecommuniceerd wordt maar ook hoe. Inhoudsanalyse bestudeerd bestaande boodschappen en is daardoor niet reactief. Inhoudsanalyse is heel geschikt omdat er veel informatie verwerkt kan worden en bovendien kan de observatie op afstand of van ver of lang geleden zijn.

Er zijn verschillende stappen in de inhoudsanalyse. Allereerst is een goede vraagstelling nodig. Daarna wordt er materiaal verzameld. Dat is nog niet zo makkelijk, want wat is je eenheid van analyse. Bij boeken bijvoorbeeld; codeer je boeken, bladzijdes of hoofdstukken? Codeer je alles of neem je een steekproef? De volgende stap is het maken van een coderingsschema. Aan de hand van de vraagstelling moet gekeken worden hoe je kan operationaliseren aan de hand van het materiaal. De vraag ‘Wat wil je meten’ staat hierbij centraal. Het coderingssysteem legt vast hoe de boodschappen worden vertaald in variabelen. Te denken valt hierbij aan de frequentie van bepaalde boodschappen, intensiteit en richting, het officiële doel en het verborgen doel.

Net als bij alle andere soorten metingen is er het probleem van betrouwbaarheid en de validiteit.

Betrouwbaarheid is de afwezigheid van toevallige fouten. Het is belangrijk om twee onafhankelijke codeurs te gebruiken. Bovendien moet de inter-codeur betrouwbaarheid berekent worden. Dit betekent dat er gekeken wordt of er sprake is van een correlatie tussen twee codeurs.

De validiteit vraagt of we meten wat we willen meten. Er bestaan hierbij twee verschillende codes, namelijk manifeste codes en latente codes. Manifeste codes coderen kenmerken die we direct kunnen observeren, dat is dus betrouwbaarder. Voorbeelden van manifeste codes zijn bijvoorbeeld woorden of acties in films, deze kun je tellen. Latente codes is het coderen van de betekenis van uitingen of acties, detecteren van inhoudelijke thema’s. Dit vereist interpretatie door de codeurs, subjectiever en minder betrouwbaar.

Analyse kan niet de waarheid van een boodschap bepalen. Ook het belang van de gecodeerde boodschappen is vaag. Verdere kenmerken worden genoemd in Neuman hoofdstuk 8.

Secundaire data

Secundaire data zijn gegevens die eerder verzameld zijn voor een ander doel dan wetenschappelijke analyse. Voorbeelden zijn ambtelijke statistische gegevens, administraties van organisaties, publieke informatie van het CBS enzovoort. De onderzoeker heeft dus geen invloed meer op precieze vraagstelling, dataverzameling en analyse. Toch zijn dit soort gegevens vaak interessant voor wetenschappelijk onderzoek. Secundaire date Analyse is een tweede analyse van gegevens die verzameld zijn voor een ander wetenschappelijk onderzoek. Je hebt dan toegang tot de oorspronkelijke data.

Hoe kom je aan deze secundaire data? Echt ontzettend makkelijk, via allerlei samenvattende tabellen van het CBS, ministeries en gemeenten. Voor deze secundaire data hebben we de ruwe data nodig. Die staan vaak online, meestal gratis na registratie.

Er zijn verschillende beperkingen:

  1. De gegevens die verzameld zijn, zijn oorspronkelijk verzameld voor een ander doel, dus vaak maar beperkt houdbaar. Dit is een soort validiteitsvraag.

  2. Bovendien kunnen er problemen zijn met de data kwaliteit. Er kan sprake zijn van missing data, als de data niet volledig zijn of niet aan te vullen.

  3. Ook de betrouwbaarheid is een vraag: dataverzameling is niet systematisch hetzelfde voor verschillende landen.

  4. Er kan sprake zijn van verschillende definities, er wordt net iets anders gemeten dan je zou willen, dit is een validiteitsvraag.

  5. Een ander probleem is dat de gegevens oorspronkelijk verzameld zijn voor een ander doel. Ook zijn er problemen met de interpretatie. Je moet kennis hebben van het onderwerp en de variabelen.

  6. Fallacy of misplaced concreteness komt vaak voor; veel statistische tabellen geven resultaten in veel decimalen, het is onwaarschijnlijk dat het klopt en is voor interpretatie niet nodig.

  7. Ecological fallacy: er worden gegevens gerapporteerd over staten, provincies, steden of andere gegevens. Dit mag je wel analyseren maar je mag de resultaten niet interpreteren alsof het over individuen gaat!

 

Neuman hoofdstuk 12: wetenschappelijk schrijven

Algemene kenmerken van wetenschappelijk schrijven zijn de volgende. Je schrijft voor vakgenoten, daarom hoeft niet alles uitgelegd te worden. Bovendien schrijf je formeel, dus geen verhaaltjes. Passieve vorm, lange zinnen, moeilijke woorden zijn geen tekenen van kwaliteit. Wat wel een teken van kwaliteit is, is helder taalgebruik en precieze terminologie. Er hoeven geen synoniemen gebruikt te worden voor woorden die je vaak gebruikt, omdat begrippen dan niet meer helder zijn. De tekst moet verder gestructureerd zijn, bondig en met goed refereren. Je moet altijd in gedachten houden voor wie je schrijft; namelijk voor je vakgenoten.

Waarom bestaan er allemaal van die vragen over hoe het moet? Ze stellen ons in staat om wetenschap te bedrijven. Bovendien leidt de vaste structuur tot het snel en efficiënt lezen. Het lezen van een wetenschappelijk artikel kan je leren en daarbij helpen de vragen.

Het zandlopermodel

Het zandlopermodel begint breed, wordt daarna specifiek en dan weer breed. De introductie begint met de achtergrond voor je onderzoek. Vervolgens wordt de onderzoeksvraag genoemd, wat het bijdraagt aan de bestaande kennis, de theoretische onderbouwing en hypothesen. Vervolgens wordt kort genoemd hoe het onderzoek in elkaar zit. Er wordt dus gewerkt van algemeen naar specifiek; van achtergrond naar hypothesen.

De methode beschrijft de verantwoording van de opzet en de uitvoering van het onderzoek. De deelnemers, de opzet, de procedure, de materialen en de analyses worden genoemd. Het doel hiervan is de herhaalbaarheid (iemand moet het na kunnen doen op basis van de informatie die je geeft) en dus de falsificeerbaarheid.

De resultaten zijn de beantwoording van de onderzoeksvraag. De tabellen (uitgebreide analyse), grafieken (in een oogopslag iets aflezen), bespreking van de resultaten van de analyses en beantwoording op de vraag of de hypothesen bevestigd worden.

In de discussie wordt gekeken hoe goed de resultaten de hypothesen bevestigen. Het is fijn als de resultaten de hypothesen bevestigen, maar zo niet dan is de vraag of de resultaten interpreteerbaar zijn. Als er nieuwe resultaten uitkomen, zoek je daar een theorie bij. Zitten er foutjes in het onderzoek, hadden dingen achteraf anders moeten gaan? Wat betekent het voor de theorie? Vervolgens wordt er afgesloten met de eindconclusies.

Het schrijfproces

Neuman noemt prewriting (voorbereiding), freewriting (brainstormen en snelle korte stukken op papier zetten) en rewriting (even laten liggen, dan herschrijven). Het is belangrijk te beseffen dat het schrijven niet vanzelf gaat, dat er tijden overheen gaan voordat het een goed eindproduct is. Vooral het rewriting is belangrijk, je kunt hier een collega om commentaar vragen. Kromme zinnen waar je zelf overheen leest kan iemand anders wel detecteren. Ook kan het helpen om de eerste versie een paar dagen te laten liggen en er dan weer met een frisse blik naar te kijken. Het heeft geen zin om uren naar een scherm of papier te staren om er vervolgens niets beters van te maken.

Om jezelf te helpen is het heel makkelijk om een outline te maken. Een outline helpt namelijk om te structureren, je ziet gaten in je eigen betoog en je herkent sneller irrelevante stukken.

De publicatiestijl is meestal volgens American Psychological Association (APA) stijl. Deze geeft hele uitgebreide aanwijzingen met veel details. Er zijn ook andere schrijfstijlen. Bijvoorbeeld referenties met nummers (medische wetenschappen) of in voetnoten (alfa wetenschappen).

Tabellen zijn in een paper van belang, omdat het meer en preciezere informatie geeft. Een figuur is makkelijker te lezen en makkelijker te interpreteren. Bovendien wil APA graag de toetsingsgrootheid, vrijheidsgraden en de p-waarden. Het is belangrijk om deze gegevens te vermelden.

Iets anders wat belangrijk is, is de titel, omdat dat namelijk de kortst mogelijke samenvatting is. Prikkelend mag daarbij, maar humor is gevaarlijk. Het gebruik van de hoofd en ondertitel is prima. Ook is het belangrijk om zoveel mogelijk (on)afhankelijke variabelen te verwerken.

De volgorde van de manuscript is als volgt, volgens APA (met dubbele regelafstand!):

  1. Titelpagina (met naam en affiliatie)

  2. Abstract

  3. De tekst

  4. Referenties

  5. Voetnoten van de auteur

  6. Voetnoten bij de tekst

  7. Tabellen (elk op aparte bladzij)

  8. De ondertitels van de figuren

  9. Figuren (elk op aparte bladzij)

 

Publiceren is belangrijk voor een academische carrière. Publicatiedruk kan wel leiden tot misstanden. Om een artikel op tijd af te krijgen kunnen resultaten te mooi worden voorgesteld, of kan het betoog worden opgeknipt. Een nieuwe trend is de eis dat alle data beschikbaar moeten blijven, plus alle gebruikte SPSS-setups. Als een artikel onnauwkeurig is of onjuist wordt het teruggetrokken.

 

College 9: Chi-kwadraat toetsen

Kristen Namesnik, 27 mei 2015

Het college begint met een voorbeeld van een onderzoek. Er is een onderzoek naar de kleurvoorkeur bij baby’s. Deze data worden samengevat in bijvoorbeeld een kruistabel. Er is sprake van data op nominaal niveau! Toetsen met nominale variabelen doen we met de Chi-kwadraat toets. Als er sprake is van een variabele noemen we de toets Goodness of Fit. Bij twee variabelen wordt het de Test of Independence genoemd.

Goodness of Fit test

Opnieuw de 4 stappen voor het toetsen. Er zijn in de eerste stap 2 mogelijkheden voor de 0-hypothese. De eerste mogelijkheid is H0=geen voorkeur. Dit betekent dat de verschillende categorieën even vaak gekozen worden. De frequenties en percentages zijn gelijk voor de verschillende categorieën. In het bovengenoemde voorbeeld betekent het dat de kleuren even vaak gekozen worden. Er zijn vier kleuren, dus elke kleur heeft een percentage van 25%. De tweede mogelijkheid is dat er geen verschil is met de bestaande populatieverdeling. Dit betekent dat er een bestaande populatieverdeling bekend is, dat de verschillende categorieën worden gekozen volgens dat model en dat de frequenties/percentages in de populatie voor de verschillende categorieën waarden aannemen van dat bestaande model.

 

De data voor deze toets bestaan uit twee rijen met frequenties, namelijk de geobserveerde frequenties en de verwachte frequenties. De geobserveerde frequenties worden aangegeven met fo, deze frequenties halen we rechtstreeks uit de frequentietabel. De verwachte frequenties worden aangegeven met fe en worden berekend ‘onder H0’. Na deze berekeningen kunnen de frequenties vergeleken worden.

De Chi-kwadraat toetsingsgrootheid meet de verschillen tussen bovengenoemde geobserveerde en verwachte frequenties. Dit verschil is vooral absoluut, maar je wil juist het relatieve verschil meten (dat kan door de toetsingsgrootheid). Om te bepalen of dit verschil groot of niet groot is, worden de verschillen tussen de geobserveerde en verwachte frequenties gerelativeerd aan de hand van de verwachte frequenties. Voor elke categorie kijk je naar het verschil en kwadrateer je het verschil, zodat je geen negatieve getallen hebt. Deze verschillen ga je relativeren en vervolgens tel je alle gerelativeerde verschillen op. Grote verschillen geven een grotere waarde voor Chi-kwadraat. De kleine verschillen geven een kleine waarde voor Chi-kwadraat. H0 wordt dus verworpen als Chi-kwadraat groot is. Dit kun je ook zien aan de p-waarde van de toets.

 

Deze toetsingsgrootheid volgt een verdeling, genaamd Chi-kwadraat verdeling. Aan de hand van deze verdeling kunnen de kritieke waarden en de p-waarden bepaald worden. Deze zogenaamde Chi-kwadraat verdeling wordt gedefinieerd door vrijheidsgraden. De kritieke waarden die hierbij horen kunnen gevonden worden in de tabel B.8. De Chi-kwadraat verdeling is rechtsschreef. Wanneer de Chi-kwadraat groter is dan de kritieke waarde, moet je H0 verwerpen. Er moet volgens APA stijl gerapporteerd worden: Chi-kwadraat (hoeveelheid categorieën, aantal (n)) = …. (toetsingsgrootheid) Met een p

Let erop dat een geobserveerde frequentie een heel getal moet zijn en dus niet kan eindigen op decimalen. Een verwachte frequentie kan wel op decimalen eindigen. Een Chi-kwadraat verdeling kan van vorm veranderen. Dit gebeurt als de df-waarden veranderen. Bij hogere vrijheidsgraden gaat de vorm steeds meer lijken op een normaalverdeling (minder scheef). Observaties gelijk of kleiner aan je vrijheidsgraden zullen niet significant zijn.

Test of independence

Wanneer we data hebben van twee nominale variabelen, vatten we deze samen in een kruistabel. De categorieën van variabele 1 staan in de rijen, de categorieën van variabele 2 staan in de kolommen.

Er zijn twee hypothesen mogelijk bij deze toets, namelijk de hypothese van onafhankelijkheid en de hypothese van gelijke verdeling. De hypothese van onafhankelijkheid gebruik je wanneer je 1 steekproef doet en je 2 nominale variabelen meet. Hierbij is H0: variabele 1 is onafhankelijk van variabele 2. Deze test noemen we ook wel de Test of Independence. De hypothese van gelijke verdeling gebruik je wanneer je meerdere streekproeven doet en maar 1 nominale variabele meet. Hierbij is H0: de verdeling van deze variabele is gelijk binnen alle groepen (populaties). Deze test noemen we ook wel de Test of Homogeneity. De test of independence en de test of Homogeneity zijn in uitvoering hetzelfde, allen de hypothesen en de onderzoeksopzet zijn verschillende. De data bestaan net als bij de Goodness of Fit test uit twee rijen met frequenties, namelijk de geobserveerde frequenties en de verwachte frequenties. De geobserveerde frequenties kunnen direct uit de kruistabel gehaald worden. De verwachte frequenties worden weer onder H0 berekend. Onder H0 kunnen we de verwachte frequenties uitrekenen met een eenvoudige formule, namelijk fe= (fr x fc) / n. De verwachte frequentie tabel kan opgedeeld worden in verschillende namen. De rijtotalen worden de Fr genoemd. De kolomtotalen worden Fc genoemd. De verwachte frequenties worden vaak tussen haakjes gezet in de tabel. De toetsingsgrootheid die we gebruiken is dezelfde als voor de Goodness of Fit toets. De toets is vrijwel hetzelfde, op enkele puntjes na.

De effectgroottes kunnen alleen voor de test of Independence gemeten worden, niet voor de Goodness of Fit test! Dit kan op twee verschillende manieren gemeten worden. Voor 2x2 kruistabellen wordt het phi-coefficient genomen en dat is een soort correlatie. Deze phi-coefficient is de effectgrootte en 0.1 is een klein effect, 0.3 is en medium effect en 0.5 een groot effect. Als de tabel groter is dan 2x2 gebruiken we Cramer’s V. Deze wordt aangepast aan de hand van een soort vrijheidsgraad, namelijk de kleinste vrijheidsgraad die afgelezen kan worden in de tabel. De interpretatie van Cramer’s V hangt af van de df, die afgelezen kan worden in de tabel 17.10 in het statistiekboek. De richtlijnen voor de vrijheidsgraden van Cramer’s V hoef je niet uit je hoofd te weten. Bij een effect tussen twee effectgrootten in, mag je twee effectgrootten melden. Bijv. 0,403 is een medium-groot effect.

Voor de beide toetsen gelden enkele regels. De observaties moeten allemaal onafhankelijk zijn (dus geen within subject toets). Ook mogen de verwachte frequenties niet onder de 5 vallen (de invloed van een bepaalde cel wordt te groot). Het is meestal nog wel toegestaan dat minder dan 10% van de frequenties onder de 5 zijn.

 

 

Contributions, Comments & Kudos

Add new contribution

CAPTCHA
This question is for testing whether or not you are a human visitor and to prevent automated spam submissions.
Image CAPTCHA
Enter the characters shown in the image.
Summaries & Study Note of World Supporter Cycle
Join World Supporter
Join World Supporter
Log in or create your free account

Why create an account?

  • Your WorldSupporter account gives you access to all functionalities of the platform
  • Once you are logged in, you can:
    • Save pages to your favorites
    • Give feedback or share contributions
    • participate in discussions
    • share your own contributions through the 11 WorldSupporter tools
Content
Access level of this page
  • Public
  • WorldSupporters only
  • JoHo members
  • Private
Statistics
42