Hoorcollegeaantekeningen

Deze samenvatting is gebaseerd op het studiejaar 2013-2014.

College 6: Categorische of nominale onafhankelijke variabelen

 

Categorische of nominale onafhankelijke variabelen zijn variabelen waarbij elke score in een categorie geplaatst kan worden. Mogelijke categorieën zijn bijvoorbeeld geslacht of de behandelgroep waar iemand in zit bij een experiment. Een voorwaarde is dat de categorieën elkaar uitsluiten of uitputten. Bijvoorbeeld: in categorie A zitten sluit uit dat je in categorie B zit. Je zit als proefpersoon dus maximaal in één categorie. Als je meerdere categorieën hebt is het is niet noodzakelijk dat deze een volgorde weergeven. Categorische of nominale onafhankelijke variabelen kunnen in een multipel regressiemodel worden gebruikt als er code variabelen van gemaakt worden. Hierbij is g het aantal categorieën en g-1 het aantal code variabelen dat nodig is. Het coderen van variabelen kan door middel van dummycodering, effect codering (ongewogen of gewogen) en contrast codering. Bij het gebruik van de verschillende coderingen blijft het totale effect van de categorische variabele op de afhankelijke variabele (y) hetzelfde (de R, R2 en de F test). De individuele regressie coëfficiënten, partiële- en semipartiële regressie coëfficiënten kunnen wel verschillen per coderingssysteem.

 

Dummycodering

Bij dummycodering, ook bekend als referentiecodering, bereken je de verschillen tussen de referentiegroep en andere groepen. Er zijn g-1 codevariabelen nodig. De groep die als referentiegroep gebruikt wordt, wordt gekozen door de onderzoeker. Het is belangrijk dat de referentiegroep verstandig gekozen wordt, bijvoorbeeld op zo’n manier dat er vergelijkingen tegen afgezet kunnen worden. Dit kan bijvoorbeeld de controlegroep zijn tegenover één of meer behandelgroepen. De referentiegroep wordt gekozen op basis van inhoudelijke in plaat van statistische argumenten. Let er bij het kiezen van een referentiegroep op dat dit een duidelijk gedefinieerde groep is, dus niet de categorie ’’anders’’. Verder mag de groepsgrootte van de referentiegroep ook niet veel kleiner zijn dan de andere groepen. De codevariabelen van de referentiegroep zijn altijd 0. De andere groepen hebben maximaal voor één codevariabele een 1 en de overgebleven codevariabelen krijgen code 0.

 

Interpretatie van de Bi’s

Met deze codevariabelen kun je een regressievergelijking opstellen in de vorm y = B0+B1*C1+B2*C2+B3*C3 bij 3 codevariabelen. In deze vergelijking kun je nu voor iedere groep apart de codevariabelen invullen. B0 heeft als codevariabelen drie keer een 0. B0+B1*0+B2*0+B3*0 =B0. B0 is dus het steekproefgemiddelde van de referentiegroep. Dit kan ook gedaan worden voor de andere groepen. Hieruit kan worden afgelezen dat de regressie coëfficiënten B1, B2 en B3 de verschillen tussen het steekproefgemiddelde van de desbetreffende groep (i) en het steekproefgemiddelde van de referentiegroep zijn. Bi’s zijn dus deviaties van de referentiegroep. Als je de groepsgemiddelden weet kun je deze invullen op de plaatsen van de Bi’s om de regressie coëfficiënten snel uit te rekenen.

Om de Bi’s verder te interpreteren kun je een betrouwbaarheidsinterval (BHI) berekenen voor het verschil in het gemiddelde van groep i en de referentiegroep. Dit kan met de formule Bit1-α/2SEBi waarbij t in tabel D te vinden is bij n-k-1 vrijheidsgraden. Om te testen of de regressie coëfficiënten significant verschillen van 0 waarbij groep i wordt vergeleken met de referentiegroep kan de t-test ti= worden uitgevoerd met n-k-1 vrijheidsgraden. Let op dat de codevariabelen correleren, ze zijn niet afhankelijk van elkaar en er is dus sprake van multicollineariteit. Hierdoor zijn de Bi’s partiële regressie coëfficiënten en is het dus niet mogelijk om de r 2 te berekenen door de semipartiële correlatie coëfficiënten (sri’s) bij elkaar op te tellen. Regressie coëfficiënten zijn handig omdat ze informatie geven over de verschillen tussen de referentiegroep en de andere groepen(i, j etc.). Als je twee groepen (bijvoorbeeld i en j) wilt vergelijken die allebei geen referentie groep zijn, bijvoorbeeld bij 5 groepen waarbij 1 de referentiegroep is en je wilt groep 3 en 4 vergelijken, dan kan je twee dingen doen. De makkelijkste manier is om opnieuw een dummycodering doen met groep i of j als referentiegroep. Ook is het mogelijk een contrast te berekenen m.b.v. een formule maar dit zal niet worden gevraagd.

 

Interpretatie van de ryi’s en de sri’s

Van de verschillende coderingssystemen is het alleen bij dummycoderingen mogelijk de zero-order correlatie coëfficiënten te interpreteren. r²yi is te interpreteren als de proportie totale variantie in y verklaard als er onderscheid tussen groep i en de rest van de groepen gemaakt wordt. Hoe de sri’s geïnterpreteerd moeten is afhankelijk van de codering. Bij dummycodering is dit groep i tegenover de referentiegroep. sr²i’s zijn de proportie verklaarde variantie in y als er onderscheid tussen de groep i en de referentiegroep wordt gemaakt. De manier van coderen maakt voor de totale uitkomsten niet uit maar als er in plaats van 0 en 1 bijvoorbeeld 1 en 2 wordt gebruik maakt dit de interpretatie lastiger.

 

Effectcodering

Bij effectcodering wordt gekeken naar het verschil tussen het totale gemiddelde en het groepsgemiddelde. Er worden g-1 codevariabelen gemaakt op zo’n manier dat de Bi’s deviaties van het totaal gemiddelde zijn. Het totale gemiddelde kan op twee manieren berekent worden, ongewogen of gewogen. Het ongewogen gemiddelde is het gemiddelde van de groepsgemiddelden. Hiervoor wordt deze formule gebruikt Mu= waarbij g het aantal groepen is en Mi het groepsgemiddelde. Om een gewogen gemiddelde te berekenen worden de scores van alle proefpersonen opgeteld en gedeeld door het totaal aantal proefpersonen. Hierbij wordt dus rekening gehouden met de groepsgrootte. De formule voor het gewogen gemiddelde is Mw= waarbij ni de verschillende groepen zijn en Mi het groepsgemiddelde is. Ongewogen effectcodering wordt gebruikt als elk groepsgemiddelde hetzelfde gewicht heeft ongeacht verschillende groepsgroottes. Ook wordt dit bij experimentele designs gebruikt of als de groepsgroottes niet relevant zijn omdat de behandelgroepen gelijk zijn. Gewogen effectcodering is beter als het onderzoek niet experimenteel is en de groepsgroottes verschillen in de populatie weergeven of als elke groepsgemiddelde het relatieve gewicht heeft. Als alle groepen even groot zijn dan maakt het niet of je een gewogen of ongewogen gemiddelde gebruikt.

 

Ongewogen effectcodering

Bij ongewogen effectcodering kies je één groep als basegroep (is niet hetzelfde als de referentiegroep). De basegroep is de groep waar je het minst in geïnteresseerd bent en die het moeilijkst te vergelijken is met het totale gemiddelde. Deze groep krijgt C1= -1. De andere groepen hebben maximaal voor één codevariabele een 1 en de overgebleven codevariabelen krijgen code 0, dit is hetzelfde als bij dummycodering. Als je ziet dat de scores voor een bepaalde groep allemaal -1 zijn dan wijst dit erop dat het om ongewogen effectcodering gaat. Door de codevariabelen voor iedere groep te vervangen kun je een regressiemodel opstellen in de vorm y = B0+B1*C1+B2*C2+B3*C3 (bij 3 codevariabelen). De verkregen regressie coëfficiënten zijn anders dan wanneer je een dummycodering had gebruikt. B0 is het ongewogen gemiddelde van alle groepsgemiddelden. B1, B2 en B3 zijn de verschillen tussen het steekproefgemiddelde van groep i en het ongewogen gemiddelde. Een negatieve Bi geeft aan hoeveel dit dat het groepsgemiddelde kleiner is dan het ongewogen gemiddelde.

 

De Bi’s interpreteren

Opnieuw kan er een BHI worden berekend met de formule Bit1-α/2SEBi (n-k-1 vrijheidsgraden). Dit is het BHI voor het verschil tussen het groepsgemiddelde en het ongewogen totaal gemiddelde. Met de t-test ti= kan berekend worden of het verschil tussen een groepsgemiddelde en het ongewogen totaal gemiddelde significant is. Ook hier correleren de codevariabelen en is het dus niet mogelijk om de semipartiële correlatie coëfficiënten op te tellen tot de r2.

 

Interpretatie van de ryi’s en de sri’s

r²yi is erg moeilijk te interpreteren en is sterk afhankelijk van de groepsgrootte ni. Daarom is het beter er niet naar te kijken. De sr²i’ is de proportie verklaarde variantie in y door onderscheid te maken tussen groep i en alle andere groepen gelijk gewogen.

 

Gewogen effectcodering

Ook bij dit coderingssysteem worden drie nieuwe codevariabelen gemaakt waarbij rekening wordt gehouden met de steekproefgrootte per groep. Eerst wordt een basegroep gekozen. Dit is de groep waar je het minst in geïnteresseerd bent en die het moeilijkst te vergelijken is met het totaal gemiddelde. De codering voor de basegroep is Ci= hierbij wordt de steekproefgrootte van groep i afgezet tegen de steekproefgrootte van de basegroep. De andere groepen hebben maximaal voor één codevariabele code 1 en de overgebleven codevariabelen krijgen code 0. Dit is hetzelfde als bij dummycodering en ongewogen effect codering. Ook nu kunnen de codevariabelen worden ingevuld om de regressie coëfficiënten te berekenen en het regressiemodel op te stellen in de vorm y = B0+B1*C1+B2*C2+B3*C3 (bij 3 codevariabelen). B0 is het gewogen gemiddelde verkregen door alle scores op te tellen en te delen door het totaal aantal proefpersonen. Er wordt eigenlijk geen rekening meer gehouden met in welke groep iemand zit. De formule hiervoor is . B1, B2 en B3 zijn de verschillen tussen het steekproefgemiddelde van groep i en het gewogen gemiddelde. Een negatieve Bi laat zien hoeveel dit groepsgemiddelde kleiner is dan het gewogen gemiddelde.

 

De Bi’s interpreteren

Ook bij gewogen effectcodering kan een BHI worden berekend met de formule Bit1-α/2SEBi (n-k-1 vrijheidsgraden). Dit is het BHI voor het verschil tussen een groepsgemiddelde en het gewogen totaal gemiddelde. Met de t-test ti= kan berekend worden of het verschil tussen een groepsgemiddelde en het gewogen totaal gemiddelde significant is. Net als bij ongewogen effect codering correleren de codevariabelen en is het dus niet mogelijk om de semipartiële correlatie coëfficiënten op te tellen tot de r2.

 

Interpretatie van de ryi’s en de sri’s

r²yi is ook bij gewogen effectcodering erg moeilijk te interpreteren en sterk afhankelijk van de groepsgrootte ni. Het is daarom beter om er niet naar te kijken. De sr²i’ is de proportie verklaarde variantie in y door onderscheid te maken tussen groep i en alle andere groepen gewogen door groepsgrootte.

 

SPSS

Bereken de ongewogen of gewogen gemiddelden met behulp van de knop descriptives. Gebruik de knop transform en dan compute variable om code variabelen te creëren. Nu kun je een multipele regressie analyse uitvoeren en de Bi’s interpreteren.
 

College 7: Categorische of nominale variabelen

 

Interacties met categorische variabelen

In dit college zal eerst contrastcodering besproken worden. Verdere onderwerpen zullen zijn: interacties met nominale of categorische onafhankelijk variabelen en interacties bij meer dan twee variabelen.

 

Contrastcodering

Gewogen of ongewogen effectcodering wordt gebruikt als er geen duidelijke groep is waar je de andere groepen tegen af kan zetten. Contrast codering wordt gebruikt als van tevoren bekend is welke groepen met elkaar vergeleken worden. Je verwacht dat de groepen zich op een bepaalde manier tot elkaar zullen verhouden. Doordat deze hypothese volledig kan worden weergegeven in een contrast geeft contrastcodering meer informatie dan een dummycodering zou geven. Stel dat je drie groepen met elkaar wilt vergelijken waarvan er twee zijn die een behandeling krijgen en één groep die geen behandeling krijgt. Gebaseerd op de onderzoekshypothese kan een contrast worden opgesteld om precies deze groepen te vergelijken. Een contrast is een lineaire combinatie van de groepsgemiddelden die je hebt. Hierbij kunnen betrouwbaarheidsintervallen en significantie toetsen worden berekend.

 

Opstellen van contrastcodes

Bij het bereken van de contrastgewichten kijk je welke groepsgemiddelden met elkaar vergeleken moeten worden. Het groepsgemiddelde dat buiten beschouwing gelaten wordt krijgt contrastcode 0. Ook bij contrastcodering zijn er g-1 nieuwe variabelen nodig. Verder gelden er drie regels bij het opstellen van contrasten :

1. De contrastgewichten moeten opgeteld gelijk aan 0 zijn.

2. Als meerdere groepen samen vergeleken worden met een andere groep (VB: groep 1 en 2 tegenover groep 3) dan moeten de producten van groep 1 en 2 opgeteld ook 0 zijn.

3. Binnen elke variabele moet het verschil tussen de hoogste en laagste code variabele gelijk zijn aan 1 want hierdoor worden den B’s makkelijker interpreteren.

 

VB: Als groep 1 en 2 vergeleken worden met groep 3 dan worden de contrastgewichten respectievelijk 0.5, 0.5 en -1. Wordt alleen groep 1 met groep 2 vergeleken dan zijn de contrastgewichten 1 en -1, gemiddelde groep1 – gemiddelde groep2, groep 3 wordt niet meegenomen dus krijgt een 0.

 

De Bi’s interpreteren         

Na het opstellen van de contrastcodes kan een regressiemodel geschat worden in de vorm van y=B0+B1*C1+B2*C2+B3*C3 (bij 3 codevariabelen). Op de plaats van de code variabelen kunnen de codes voor iedere groep worden ingevuld om inzicht te krijgen in de groepsgemiddeldes. VB: Mgroep1=B0+0,5B1-0,5B2, dit moet gedaan worden voor alle groepen. Om de B’s te kunnen interpreteren wil je deze aan de linkerkant van het = teken hebben. Door de B’s te verschuiven ontstaat bijvoorbeeld B0= wat het ongewogen gemiddelde is. B1,B2 en B3 zijn de verschillen tussen het ongewogen gemiddelde van de groepsgemiddelden afhankelijk van de groepen die d.m.v. de contrastcodering met elkaar vergeleken worden. Opnieuw kan er een BHI worden berekend met de formule Bit1-α/2SEBi (n-k-1 vrijheidsgraden). Dit is het BHI om contrast i. Met de t-test ti= kan berekend worden of de groepen die door met het contrast vergeleken worden significant van elkaar verschillen. Let op dat de codevariabelen correleren tenzij de groepsgroottes ni gelijk zijn.

 

De sri’s interpreteren

sr2i is de proportie totale variantie in y verklaard door contrast i. Dit is dus afhankelijk van de vergelijking die het contrast weergeeft. Stel dat contrast i groep 2 en 3 vergelijkt dan is sr2i de proportie totale variantie in y verklaard door onderscheid te maken tussen groep 2 en 3. De partiële regressie coëfficiënten zijn erg afhankelijk van de steekproefgrootte en kun je daarom beter niet bekijken.

 

Coderingsschema’s met nominale en continue variabelen

Een regressiemodel kan ook bestaan uit nominale én continue variabelen.

Een voorbeeld van dummycodering :Variabele X1 kan bijvoorbeeld een nominale variabele zijn bestaande uit drie groepen (1 = controlegroep en 2 en 3 = behandelgroep o.i.d.) waar dus twee dummyvariabelen (C1 en C2) voor nodig. In ditzelfde model kan variabele X2 zitten die continue is (tijdsduur, leeftijd etc.). Het regressiemodel zou in dit voorbeeld de vorm krijgen y=B0+B1*C1+B2*C2+B3*X2. B0 is de intercept. B1 is het gemiddelde verschil tussen groep 1 en groep 3 waarbij X2 constant is gehouden. B2 is het gemiddelde verschil tussen groep 2 en 3 waarbij X2 weer constant is gehouden. B3 is de verandering in y voor elke toename in X2 waarbij X1 constant gehouden wordt. Omdat er een partiële relatie tussen de variabelen bestaat is het noodzakelijk erbij te vermelden dat de overgebleven variabelen constant gehouden moeten worden.

 

Als je het model uit het vorige voorbeeld zou gebruiken maar i.p.v. dummycodering ongewogen effectcodering gebruikt veranderen de B1 en B2. B1 is dan het gemiddelde verschil tussen groep 1 en het ongewogen gemiddelde waarbij X2 constant is gehouden. B2 is het gemiddelde verschil tussen groep 2 en het ongewogen gemiddelde waarbij X2 constant is gehouden. B3 blijft hetzelfde, namelijk de verandering in y voor elke toename in X2 waarbij X1 constant gehouden wordt.

 

Groepsgemiddelden schatten

Om groepsgemiddelden te schatten kunnen net als bij een model met alleen nominale variabelen de codevariabelen worden ingevuld voor elke groep. Vervolgens komt er bij elk groepsgemiddelde een term bij die bepaald wordt door het gemiddelde van de continue X variabele. In bovengenoemd voorbeeld is de extra toegevoegde term B3*X2 waarin X2 het gemiddelde is van variabele X2 en B3 aangeeft hoe zwaar deze meetelt. De groepsgemiddelden die uiteindelijk verkregen worden zijn ‘adjusted group means’. Bij ANOVA of ANCOVA worden dit ‘marginal means’ genoemd.

 

Interacties met categorische variabelen in een 2x2 design

Een 2x2 design is een model met één afhankelijke variabele en twee categorische onafhankelijke variabelen (A en B) beide bestaande uit twee groepen. Voor beide variabelen geldt dat de 2 groepen met behulp van codevariabelen mee genomen kunnen worden in het model. Het handigst is om dit met contrast codering te doen maar de andere drie systemen zijn ook te gebruiken, afhankelijk van de onderzoeksvraag. In dit 2x2 design bestaan 4 verschillende groepen.

 

Is er een effect voor factor A of factor B en is er een interactie-effect? Deze vragen kunnen beantwoord worden door drie verschillende contrastcoderingen. De codevariabelen die hiervoor gemaakt worden moeten wel aan de eerder genoemde drie regels voldoen maar de interactievariabele CAxB niet want dit is het product van CA en CB. Voor de vier groepen zijn drie codevariabelen nodig. De regressievergelijking wordt: y=B0+B1*Ca+B2*CB+B3*CAxB. Door voor elke groep de codes in te vullen in het regressiemodel kan worden uitgeschreven wat de vier verschillende groepsgemiddeldes zijn. Door dit te verschuiven kun je de vergelijking schrijven in termen van B’s en erachter komen wat de B’s betekenen. Stel dat factor A geslacht is met de groepen Man of Vrouw en dat factor B taal is met de groepen Nederlands en Engels. B0 het ongewogen gemiddelde. B1is het gemiddelde van de groep Man - het gemiddelde van Vrouw, dit is het hoofdeffect van geslacht. B2 is het gemiddelde van Nederlands – gemiddelde Engels, dit is het hoofdeffect van taal. B3 is (gem.ManNL-gem.ManEN) – (gem.VrouwNL-gem.VrouwEN) dit is het verschil tussen het effect van geslacht en het effect van taal en dit is het interactie-effect. R2 is de proportie verklaarde variantie verklaard door het volledige model, dus inclusief hoofdeffecten en interactie-effect.

 

Als een ander coderingssysteem gebruikt zou worden verandert de inhoud van de model summary tabel van SPSS niet (R2, F-test blijven gelijk en ook de t-test voor interactie ). De interpretatie van de Bi’s verandert wel per coderingssysteem. Als je wilt kijken naar de hoofdeffecten dan blijkt dat alleen contrast codering dezelfde regressie coëfficiënten oplevert als de steekroef contrasten. Bij ongewogen effectcodering zijn de codevariabelen orthogonaal (onafhankelijk) daarom blijven, als het om een 2x2 design gaat, de t-testen voor de effecten hierbij gelijk. Dit geldt niet voor dummycodering en als het geen 2x2design is.

College 8: Interacties met categorische variabelen – vervolg

 

Naast een 2x2 design is het ook mogelijk een design te hebben waarin de factoren meer dan 2 levels hebben (ga>2 en gb>2) . Bijvoorbeeld een factor A met 4 groepen en een factor B met 3 groepen, in totaal dus 12 verschillende groepen proefpersonen. Om hier een regressievergelijking voor op te stellen zijn 11 codevariabelen nodig. De eerste stap is beslissen welke effecten meegenomen moeten worden. Stap twee bestaat uit het kiezen van een slim coderingssysteem dat het best bij de onderzoeksvraag past. Vervolgens kan een regressiemodel geschat worden, met 11 codevariabelen lijkt dit erg ingewikkeld maar het idee blijft hetzelfde als bij 2 codevariabelen.

 

Stap 1: welke effecten worden in het model meegenomen?

Beslis of je alleen hoofdeffecten of ook een interactie-effect op wilt nemen in het model. Met behulp van F-toetsen kan gekeken worden of een set van variabelen een significante bijdrage levert. Dit kan op verschillende manieren gedaan worden. Om het effect van Factor A te bekijken zou B genegeerd of gepartialiseerd kunnen worden. Ook voor het interactie-effect geldt dat om AB te bekijken A en B genegeerd of gepartialiseerd kunnen worden. Om dit op te lossen zijn er vier types (1,2,3 en4) Sum of Squares voor regressie. Tot nu toe is alleen type 3 gebruikt bij tweeweg ANOVA in SPSS.

 

Type 1 Sum of Squares (SS)

Type 1 wordt ook wel sequentiële SS genoemd omdat je de SS in een bepaalde volgorde opbouwt. Per factor die wordt toegevoegd bereken je de toename in SS. Een aanname hierbij is dat de steekproefgroottes per groep gelijk zijn of proportioneel zijn aan de populatiegroottes. Bij experimentele studies is dit meestal niet het geval. Voordeel: Het is mogelijk om de aparte SS op te tellen tot de totale SS van het model. Nadeel: de SS die je krijgt zijn afhankelijk van de volgorde waarin de factoren worden toegevoegd. SPSS kiest zelf een volgorde, als je een andere volgorde wilt gebruiken moet dit met de hand berekend worden. 

 

Type 2 Sum of Squares (SS)

Bij type 2 wordt het effect dat buiten beschouwing wordt gelaten eruit gepartialiseerd. Als SSA wordt bekeken wordt factor B eruit gepartialiseerd. Wordt SSAB bekeken dan worden zowel A als B eruit gepartialiseerd. Voordeel: Als er geen interactie is, is de power erg goed. Nadeel: Als er wel sprake is van interactie werkt dit minder goed. Ook is het niet mogelijk de SS op te tellen tot de totale SS.

 

Type 3 Sum of Squares (SS)

Bij type 3 wordt het volledige model vergeleken met een model waarbij de betreffende factor eruit gelaten wordt. Voordeel: onafhankelijk van de steekproefgroottes van de groepen. Nadeel: Als er geen interactie is maar je modelleert dit wel mee dan ontstaat een lagere power. Ook is het onmogelijk de SS op te tellen tot de totale SS. Dit type werkt het best als je interactie verwacht.

 

Welk type?

Het type dat het meest geschikt is om te kiezen wordt bepaald door het onderzoeksdesign en door de steekproefgroottes. Als het een balanced design (steekproefgroottes gelijk per groep) of proportioneel design (proportioneel gelijk per groep) dan leveren type 1,2,3 en 4 dezelfde resultaten. Als het om een unbalanced design gaat is er geen samenhang tussen de groepsgroottes en moet je een bewuste keuze maken voor een bepaald type SS want de resultaten zullen verschillend zijn.

Type 1: als het een niet experimenteel design is, de verschillen in steekproefgroottes geven verschillen in populatie weer.

Type 2: Experimenteel design en je verwacht geen interactie.

Type 3: Experimenteel design en je verwacht interactie. (SPSS gebruikt type 3)

Type 4: Een aanpassing van type 3, er wordt rekening gehouden met missende data.

 

Stap 2: Kies een geschikt coderingssysteem

Kies het coderingssysteem dat het best bij de onderzoeksvraag past. Als er bijvoorbeeld een controlegroep en twee verschillende behandel groepen zijn is dummycodering het handigst waarbij de controlegroep als referentiegroep gekozen wordt.  Ook is het mogelijk per factor een verschillend coderingssysteem te kiezen, voor factor A contrastcodering en voor factor B dummycodering bijvoorbeeld.

 

Een voorbeeld uit het college

Dit voorbeeld is besproken tijdens het college en de data is te bekijken in de slides en het boek. Stel er zijn vier ziekenhuizen, H1, H2, H3 en h4. Verder zijn er 3 treatments bestaande uit 2 behandelmethodes en een controle groep, T1,T2 en T3. In totaal zijn er 108 patienten maar de steekproefgroottes per groep zijn niet gelijk of proportioneel gelijk. Aangezien het een unbalanced design is maakt het verschil of type 1,2 of 3 gebruikt wordt.

 

Stap 1: welke effecten worden in het model meegenomen?

Er wordt interactie verwacht tussen het ziekenhuis en de behandelmethode. De ene behandelmethode werkt misschien beter in een bepaald ziekenhuis, in combinatie met het unbalanced design wordt daarom voor type 3 SS gekozen. Let op bij het kiezen van interactie-effecten dat wanneer je een hogere orde interactie term meeneemt de lagere orde termen ook in het model moeten zitten.

 

SPSS

In SPSS kan dit uitgevoerd worden door bij Analyze te kijken → General Linear Model→ Univariate. Y is de afhankelijke variabele en H en T de fixed factors. Klik op de knop Model en kies full factorial model with Type III SS. Het is belangrijk de tabel goed te begrijpen. De SSModel zijn niet opgebouwd uit de SSH, SST en SSHT want dit kan alleen bij type 1 of type 2 of 3 met een balanced design. Het coderen van de codevariabelen moet met de hand gedaan worden omdat SPSS automatisch dummycodering kiest met de laatste groep als referentiegroep.

 

 

Stap 2: Kies een geschikt coderingssysteem

In dit voorbeeld is voor de factor treatment een duidelijke referentiegroep namelijk de controlegroep daarom is voor dummycodering gekozen. Voor de factor ziekenhuis is geen duidelijke referentiegroep, daarom is voor ongewogen effect codering gekozen met H4 als basegroep. Er zijn 11 codevariabelen nodig, 5 voor de hoofdeffecten en nog 6 voor de interactie-effecten (elke codevariabele van ziekenhuis*codevariabele van treatment). Nu kan een regressiemodel worden opgesteld in de vorm y=B0+B1*C1+B2*C2…B11*C11.

 

Interpretatie van de Bi’s

Bij het interpreteren van de Bi’s worden de interpretaties van de ongewogen effect codering voor ziekenhuis (C1,C2 en C3) gecombineerd met de interpretaties van de dummy coderingen voor treatments (C4 en C5).  B1 is de vergelijking tussen ziekenhuis 1 en het ongewogen gemiddelde van alle ziekenhuizen, binnen de controle groep want de referentiegroep is de controlegroep en deze wordt constant gehouden. B4 is de vergelijking tussen het ongewogen gemiddelde van treatment 1 en het ongewogen gemiddelde van de referentiegroep (=de controlegroep). B6 is de eerste interactieterm. Interactie tussen ziekenhuis 1 en treatment 1 in vergelijking met de controlegroep. Bij interacties kijk je naar verschillen tussen verschillen.  B6 is het verschil tussen Ziekenhuis 1 en het ongewogen gemiddelde binnen de treatment1 groep – het verschil tussen ziekenhuis1 en het ongewogen gemiddelde binnen de controle groep.

 

Interacties met één continue variabele en één categorische variabele

Nu zal worden besproken hoe zowel hoofdeffecten als interacties te interpreteren zijn in modellen met een factor die bestaat uit meerdere groepen en een continue variabele. Dit voorbeeld is ook terug te vinden in de collegeslides. Er wordt onderzocht of met het aantal publicaties en de afdeling waar iemand werkzaam de hoogte van het salaris te voorspellen is. De variabele publicaties is continue en gecentreerd wat betekent dat p=0 de gemiddelde score is. De variabele afdeling bestaat uit drie groepen: Psychologie, Sociologie en Geschiedenis, om dit te modelleren zijn dus twee codevariabelen nodig. In totaal zijn er 150 proefpersonen maar de groepsgroottes zijn niet gelijk. Het model dat hier uitkomt is ysalaris=B0+B1*D1+B2*D2+B3*P+B4*PD1+B4*PD2 waarbij de laatste 2 termen de interactietermen zijn die zeggen of het een verschil maakt om veel of weinig geld op een bepaalde afdeling. Dezelfde stappen worden doorlopen, kies welke effecten je meeneemt en hoe je dit gaat coderen. Onderstaande informatie is een uitwerking van het voorbeeld uit college 8. Voor dummycodering, ongewogen effectcodering en contrastcodering wordt de interpretatie van de Bi’s gegeven. Deze betekenis is te vinden aan de hand van de coderingen, gegeven in een tabel in de collegeslides.

 

Dummycodering

Als je een dummycodering zou gebruiken dan is inde intercept (B0) de adjusted mean terug te vinden want psychologie is de referentiecategorie maar dit is aangepast aan de constanthouding van de variabele publicaties. Publicaties =0 omdat het gecentreerd is.

B1 is het verschil tussen sociologie en psychologie bij constant houding van publicaties.

B2 is het verschil tussen geschiedenis en psychologie bij constant houding van publicaties.

B3 is het effect van publicaties op het salaris in de psychologiegroep, dit is ook de simple slope van psychologie.

B4 is het verschil tussen salarisverandering binnen sociologie en salarisverandering binnen psychologie, je kijkt dus naar het effect van publicaties op salaris. Dit is hetzelfde als de simple slope voor sociologie - de simple slope voor psychologie.

B5 is het verschil tussen salarisverandering binnen geschiedenis en salarisverandering binnen psychologie. B4 en B5 zijn interactie-effecten.

 

Ongewogen effectcodering

Bij ongewogen effectcodering is B0 het ongewogen gemiddelde aangepast aan de constant houding van Publicaties bij P=0, dit is dus anders dan bij dummycodering.

B1 is het aangepaste gemiddelde van sociologie – het aangepaste ongewogen gemiddelde.

B2 is het aangepaste gemiddelde van geschiedenis – het aangepaste ongewogen gemiddelde.

B3 is het ongewogen gemiddelde van het afdelingsgemiddelde effect van publicatie op salaris. Dit is hetzelfde als de ongewogen gemiddeldes per groep.

B4 is het effect van salaris binnen sociologie per publicatie - het ongewogen gemiddelde van het effect van salaris op publicaties binnen alle afdelingen. Dit is hetzelfde als de simple slope voor sociologie – het ongewogen gemiddelde van de simple slopes.

B5 is het effect van salaris binnen geschiedenis per publicatie – het ongewogen gemiddelde van het effect van salaris op publicaties binnen alle afdelingen. 

 

Contrastcodering

Wat de B’s betekenen is af te lezen uit de codering. Bij contrastcodering is de B0 het ongewogen gemiddelde als P constant gehouden wordt. 

B1 is een aangepaste steekproef contrast waarde die het gemiddelde van psychologie met het gemiddelde van sociologie en geschiedenis vergelijkt, allemaal aangepast aan P.

B2 is een aangepaste steekproef contrast waarde die het verschil in gemiddelde tussen sociologie en geschiedenis vergelijkt.

B3 is het ongewogen gemiddelde van het afdelingsgemiddelde effect van publicaties op salaris. Dit is hetzelfde als het ongewogen gemiddelde van de simple slopes per groep.

Voor B4 kijk je hoever de simple slope van psychologie afwijkt van de simple slope van geschiedenis en sociologie. Dit is het verschil tussen salarisverandering voor psychologie en de gemiddelde salarisverandering voor de afdelingen geschiedenis en sociologie per publicatie (simple slope van psychologie).

B5 is het verschil tussen salarisverandering voor sociologie per publicatie en salarisverandering voor geschiedenis per publicatie. 

Alle regressiecoefficienten zijn aangepast aan de aanwezigheid van de andere variabelen in het model. Je kan hierbij simple slopes berekenen en de simple regression lijnen in een plot afbeelden. Per regressielijn kan je kijken hoe de interacties hiertussen eruit zien.

College 9: Repeated measures ANOVA

Eén-weg en twee-weg ANOVA

Bij één-weg ANOVA heb één afhankelijke variabele en één categorische onafhankelijke variabele A. Er wordt een vergelijking gemaakt tussen de gemiddeldes van Y en alle groepen van A. Bij twee-weg ANOVA heb je ook één afhankelijke variabele maar twee categorische onafhankelijke variabelen, A en B (factoren). Er wordt een vergelijking gemaakt tussen de gemiddeldes van Y en alle groepen van A en B. Hoofteffect van A, tegenover de levels van B en het hoofdeffect van B, tegen de levels van A worden geanalyseerd. Ook wordt er een interactie-effect AxB, verschillen tussen verschillen, geanalyseerd.

Assumpties bij ANOVA zijn:

  • onafhankelijke observaties.
  • groepen moeten normaal verdeeld zijn
  • de variantie van de verschillende groepen moeten gelijk zijn aan elkaar (homogeniteit van varianties)

 

Bij ANOVA draagt iedere proefpersoon met één score (één meting) bij aan de afhankelijke variabele. Als elke proefpersoon gemeten wordt in elk level van een factor moet je repeated measures ANOVA gebruiken wat eigenlijk een uitbreiding van de gepaarde t-procedure is. Een gepaarde t-procedure met meer groepen is niet handig omdat je meerdere t-toetsen zou moeten doen waardoor je te maken krijgt met kanskapitalisatie.

 

Repeated measures ANOVA

Er zijn verschillende situaties waarin je een repeated measures ANOVA kunt gebruiken:

situatie 1: Een groep proefpersonen wordt gemeten onder verschillende condities van een behandeling of op verschillende meetmomenten . Situatie 2: proefpersonen zijn gegroepeerd op basis van geslacht worden gemeten onder verschillende condities van een behandeling of op verschillende meetmomenten. Situatie 3: twee groepen proefpersonen krijgen twee verschillende soorten medicijnen toegediend en worden op 3 tijdstippen gemeten. Situatie 4: proefpersonen zijn gegroepeerd op basis van leeftijd (twee groepen) en dieetprogramma (drie groepen) en het gewicht wordt op drie verschillende momenten gemeten. De proefpersonen komen worden op meerdere momenten gemeten dus als je gemiddeldes uitrekent komen de proefpersonen hier ook meerdere keren in terug. Hierdoor is er geen onafhankelijkheid tussen de verschillende groepen en is een repeated measures design nodig.  

 

Er zijn 2 soorten factoren (categorische onafhankelijke variabelen) in repeated measures designs. Between-factors zijn variabelen die aangeven welke groepen personen je met elkaar wilt vergelijken.  De within-factors bevatten het herhaalde metingen aspect. 

 

Het hoofddoel van repeated measures is testen of het effect van de within-factor op de afhankelijke variabele significant is (heeft de behandeling effect?). Je kijkt of de gemiddelden van de groepen van elkaar verschillen met behulp van een F-test. Bij repeated measures zijn er twee mogelijkheden die beide de F-tests gebruiken namelijk  de univariate test en de multivariate test.

 

Univariate test

Bij de univariate tests wordt net als bij gewone ANOVA een variantie term opgesplitst in between en within sum of squares. Omdat het repeated measures is splits je vervolgens de within sum of squares verder op in SSB1 en SSE waarbij SSB1 de between subjects (proefpersonen) sum of squares is en de SSE het residu dat niet verklaard kan worden groepen of tijdstip. Poefpersonen wordt nu dus als willekeurige factor beschouwt.

 

 

Voor- en nadelen

Het voordeel van repeated measures is dat de within-group variantie verkleint wordt doordat individuele verschillen tussen proefpersonen verwijderd worden. De variatie tussen en binnen personen wordt nu verklaard door de between-treatments sum of squares en een error term. Dit leidt tot een grotere power, de procedure wordt gevoeliger om within-subjects effecten te testen. Daarnaast zijn er minder proefpersonen nodig aangezien er meer informatie verzameld wordt per proefpersoon. Nadelen zijn dat de volgorde waarin proefpersonen aan de condities worden toegewezen de prestatie kan beïnvloeden. Ook kan er een leereffect optreden en kunnen proefpersonen  vermoeid of ongemotiveerd raken van zoveel metingen. Verder is het moeilijk aan de assumpties van dit model te voldoen en is het model in het algemeen ingewikkelder.

 

Voorbeeld besproken in college

Dit voorbeeld is terug te vinden in de collegeslides. In het voorbeeld wordt het effect van  4 verschillende medicijnen op de reactietijd van 5 proefpersonen getest. De reactietijden van de proefpersonen per medicijn is geplot in een lijngrafiek en de spreiding in reactietijden per medicijn is weergegeven in een boxplot. Te zien is dat er bij medicijn 1 een grotere variatie in reactietijden is dan bij medicijn 3. Ook op niveau van gemiddeldes heeft medicijn 3 het minste effect op de reactietijd. De 4 gemiddeldes worden vervolgens vergeleken door gebruik van. een F-toets. In SPSS gaat dit m.b.v.  de knoppen Analyze, General Linear Model, Univariate. Bij fixed wordt medicijn ingevuld, dit is namelijk geen random effect. Proefpersoon is wel random omdat de steekproef een random trekking uit de populatie is. De afhankelijke variabele is de reactietijd. Er wordt naar zowel interactie als hoofdeffecten gekeken dus het model is full factorial.

 

De tests of between subjects effects tabel

De sum of squares model kan worden verdeeld in een between en within factor. De between factor (SSB1) is de variantie tussen proefpersonen. De within factor (SSB) is dat deel van de variantie binnen proefpersonen veroorzaakt door verschillen tussen behandelingen.  SSE is het interactiedeel, in welke mate proefpersonen verschillend reageren op behandelingen. Er worden twee F-waardes gegeven omdat er ook twee bronnen van variantie zijn (proefpersonen en behandelingen)

 

Multivariate test

Bij multivariate tests wordt elk level van behandeling of tijdstip gezien als een afhankelijke variabele. De repeated measures van één proefpersoon is dan een multivariate observatie van de afhankelijke variabelen. In het voorbeeld zijn er bijvoorbeeld 4 observaties voor proefpersoon 2 (4 medicijnen).

 

De test is multivariate omdat meerdere afhankelijke variabelen simultaan vergeleken worden. Er wordt gekeken naar verschillen tussen groep 1 en 2, groep 2 en 3 etc. . Dit kan gezien worden als een veralgemenisering van de gepaarde t-procedure. Om dit te doen moet een verschilvariabele worden aangemaakt en wordt gekeken of deze afwijkt van 0. Er zijn verschillende multivariate tests beschikbaar waarvan SPSS er 4 geeft. Bij statistiek 3 kijken we naar Wilk’s lambda hoewel de testen allemaal soortgelijke resultaten leveren. Voor het voobeeld: de nulhypothese wordt verworpen ongeacht welke toets je gebruikt, medicijn heeft dus een effect op de reactietijd. Let op dat je nu weet dat gemiddeldes niet gelijk zijn maar niet waar precies het verschil zit.

 

Assumpties bij repeated measures

Voor univariate tests zijn meer voorwaarden dan voor multivariate tests. Voor beide testen geldt dat er onafhankelijke observaties tussen personen moeten zijn. Bij treatments kan je dat niet garanderen omdat iemand meerdere keren bekeken wordt.  Verder moet er voldaan worden aan mutivariate normaliteit waarbij elke subgroep normaal verdeeld is. een extra assumptie voor de univariate F-toets is die van compound symmetry. Dit is een heel strenge eis die inhoudt dat als je een covariante matrix zou maken voor de variantie  op verschillende tijdstippen of behandelingen de waarden op de diagonaal hetzelfde moeten zijn. Ook de waarden op buiten de diagnoaal moeten overeenkomen want zowel varianties als covariantis moeten allemaal gelijk zijn. Eigenlijk is deze eis te streng en wordt er nooit aan voldaan. Als de data voldoet aan de iets zwakkere aanname van sfericiteit dan werkt de univariate test nog steeds goed. 

 

Sfericiteit

Bij sfericiteit kijk je naar paarsgewijze verschillen, de varianties van de verschilvariabelen moeten gelijk zijn. In SPSS wordt sfericiteit berekent door Mauchly’s test. Aan de aanname is voldaan als de toetsingsgrootheid niet verworpen hoeft te worden, dus p

Als de sfericiteitsaanname geschonden is dan is de kans op een type 1 fout groter (nulhypothese verwerpen terwijl dat niet moet). Dit probleem kan verholpen worden door een correctie toe te passen op de vrijheidsgraden van de univariate test of door een multivariate test te gebruiken. De vrijheidsgraden worden aangepast d.m.v. een epsilon correctie. De getallen in de epsilon tabel zijn factoren waarmee de vrijheidsgraden vermenigvuldigd kunnen worden. Kijk in SPSS naar de greenhouse-Geisser correctie of de Huynh-Feldt correctie. Omdat G-G overcorrigerend is en H-F eigenlijk te weinig corrigeert moet je hier het gemiddelde van nemen. Als de epsilon dan groter is dan 0,7 dan kun je beter de H-F correctie toepassen, is epsilon kleiner  dan 0,7 of helemaal onbekend gebruik dan de G-G correctie. Door de correctie verandert de F-waarde niet maar de overschreidingskans wel aangezien je naar een andere F-verdeling kijkt met andere vrijheidsgraden.

 

Univariate of multivariate tests?

Als de sfericiteit geschonden is maar de steekproef is groter dan k+10 waarbij k het aantal meetmomenten is dan wordt aangeraden een multivariate test te gebruiken omdat  deze toetsingsgrootheden niet afhankelijk zijn van aannames en de power  het hoogst is.  Als de sfericiteit goed is dan kan je beter een univariate tets doen ook als je sample size klein is. Als er sprake is van missende waarden dan is een univariate test ook beter.

 

Within-factor effect opsplitsen

De univariate en multivariate testen zijn beide omnibus testen, dat betekent dat ze alleen algemene effecten kunnen detecteren. Als het within-factor effect beter wilt begrijpen kun je contrasten gebruiken. Bijvoorbeeld als je wilt weten welk effect een bepaald medicijn heeft. SPSS geeft meerdere contrasten maar een polynomial contrast heeft als voordeel dat het een trend analyse uitvoert. Er wordt gekeken naar een patroon in verandering over tijdstippen. Dit patroon kan  lineair (stijgende of dalende lijn), kwadratisch ( omhoog  en weer omlaag of om omgekeerd) of kubisch zijn (eerst omhoog dan omlaag en weer omhoog).  De verschillende delen zijn op te tellen omdat de polynomiale contrasten orthogonaal zijn (onafhankelijk dus)  In de SPSS tabel staat of een trend wel of niet significant is. In het voorbeeld zijn de kwadratische en kubische trend beide significant. Op basis van deze trendanalyse lijkt het alsof medicijn 3 beter werkt dan de andere medicijnen.

Post hoc procedures

Het is ook mogelijk post hoc procedures te gebruiken bij repeated measures ANOVA. Bonferroni methode: Groepen worden paarsgewijs met elkaar vergeleken maar er wordt rekening gehouden met het aantal verschillende toetsen. Het significantie niveau wordt gecorrigeerd zodat de kans op type 1 fouten niet te groot wordt. Deze toets wordt vooral gebruikt als er schending is van de sfericiteitsaanname. Als deze aanname niet geschonden is kan de methode van Tukey gebruikt worden maar deze is niet standaard beschikbaar in SPSS.

 

 

Image

Access: 
Public

Image

Join WorldSupporter!

Join with a free account for more service, or become a member for full access to exclusives and extra support of WorldSupporter >>

Image

 

 

Contributions: posts

Help other WorldSupporters with additions, improvements and tips

Add new contribution

CAPTCHA
This question is for testing whether or not you are a human visitor and to prevent automated spam submissions.
Image CAPTCHA
Enter the characters shown in the image.

Image

Image

Follow the author: Vintage Supporter
Share this page!
Statistics
3791
Submenu & Search

Search only via club, country, goal, study, topic or sector