Join with a free account for more service, or become a member for full access to exclusives and extra support of WorldSupporter >>

Hoorcolleges Methoden en Statistiek I

Deze samenvatting is gebaseerd op het studiejaar 2013-2014.

Methoden, technieken en statistiek 1, Bachelor Psychologie jaar 1

1. Aantekeningen hoorcollege 1

 

Er zijn twee typen kennis:

  • Normale kennis (iedereen heeft een algemeen idee, kent de situatie)

  • Wetenschappelijke kennis (op basis van onderzoek en bewijzen)

Bij wetenschappelijke kennis wordt gebruik gemaakt van systematiseren, details onderzoeken en toevalligheden moeten worden uitgesloten.

 

Er zijn vijf kenmerken waar wetenschappelijk onderzoek aan moet voldoen:

  • Systematiek (de opzet van onderzoek is nauwkeurig)

  • Creativiteit (het onderzoek moet iets toevoegen aan bestaande kennis)

  • Theorie (verwachtingen worden hierop gebaseerd)

  • Objectiviteit (belangen van de onderzoeker mogen geen invloed hebben)

  • Waarnemingen (hierop zijn de resultaten en conclusies gebaseerd)

 

Er wordt onderscheid gemaakt tussen twee onderzoeksvelden:

  • Ontologie = de wat- of waarom-vraag: inhoudelijk onderzoek

  • Epistemologie = de hoe-vraag: hoe kan kennis het beste verkregen worden?

 

Ook worden verschillende benaderingen of paradigma’s gebruikt:

  • De empirisch-analytische benadering, kenmerken hiervan zijn: het moet herhaalbaar en controleerbaar zijn; het is waardenvrij; het is kwantitatief; en er wordt gebruik gemaakt van reductie

  • De interpretatieve benadering, kenmerken hiervan zijn: het is gericht op het begrijpen van fenomenen; het gaat om waardenverheldering; het is kwalitatief; en het is holistisch

  • De kritisch-emancipatoire benadering, kenmerken hiervan zijn: het is gericht op verbetering van de onderzochte situatie; het belang van proefpersonen speelt een rol; en het is waardengebonden

Welk paradigma gebruikt wordt bij een onderzoek, beslist de groep onderzoekers. Dit is afhankelijk van hun eigen mening, normen en waarden.

 

Er zijn tevens verschillende onderzoeksmethoden:

  • Experimenten

  • Vragenlijsten

  • Literatuuronderzoek

  • Inhoudsanalyse

  • Interviews

  • Veldonderzoek

  • Historisch-vergelijkend onderzoek

Bij de empirisch-analytische benadering wordt veelal gebruik gemaakt van de eerste drie methoden; interpretatief onderzoek is vaak gebaseerd op interviews en veldonderzoek. Echter kunnen alle methoden toegepast worden bij iedere benadering; er is veel overlap.

 

Afhankelijk van het doel van het onderzoek, wordt het ingedeeld bij één van de volgende vormen:

  • Fundamenteel onderzoek (doel is het verzamelen van kennis)

  • Toegepast onderzoek (doel is om een oplossing te vinden voor een praktijkprobleem)

 

Bij fundamenteel onderzoek hoort de empirische cyclus. Die bestaat uit vijf stappen:

  1. Observatie (startpunt van onderzoek: bestaande kennis verzamelen, situatieschets)

  2. Inductie (het vormen van een voorlopige, algemene voorspelling, theorievorming)

  3. Deductie (de hypothese specificeren)

  4. Toetsing (onderzoek uitvoeren en zodoende de voorspelling controleren)

  5. Evaluatie (kijken of het kennisprobleem is opgelost, of een antwoord is gevonden)

 

Bij toegepast onderzoek wordt een iets andere cyclus doorlopen: de regulatieve cyclus. Het verschil met de empirische cyclus zit vooral in de evaluatie. Dan wordt tevens een advies gegeven over het praktijkprobleem.

Verder bestaat de regulatieve cyclus uit de stappen:

  1. Formulering van een probleem

  2. Diagnostisch onderzoek

  3. Planvorming en beslissing/beoordeling

  4. Interventie/procesevaluatie

  5. Verandering/uitkomstevaluatie

In principe wordt in iedere stap een cyclus doorlopen van observatie tot evaluatie (zie empirische cyclus).

 

2. Aantekeningen hoorcollege 2

 

De empirische cyclus stap voor stap uitgewerkt

 

Stap 1: het onderzoeksprobleem

Deze volgt uit het onderdeel ‘observatie’ van de empirische cyclus

  • Bij fundamenteel onderzoek ontstaat er een kennisprobleem omdat er onvoldoende antwoorden zijn op vragen die volgen uit de observatie;

  • Bij toegepast onderzoek ontstaat er een praktijkprobleem waar een oplossing voor gezocht moet worden.

Deze eerste stap bevindt zich tussen de onderdelen ‘observatie’ en ‘inductie’.

 

Stap 2: theorievorming

  • Deze stap volgt uit de ‘inductie’.

  • Definitie: een theorie is een samenhangend verhaal van algemene uitspraken over een geobserveerd fenomeen, en is de basis voor het doen van voorspellingen die empirisch getest kunnen worden.

  • Nodig voor theorievorming: literatuurstudie.

Hieruit wordt informatie gehaald om het onderzoeksprobleem te verhelderen, en eventueel aan te passen.

 

Stap 3: de onderzoeksvraag en hypothesen

Deze stap volgt op de theorievorming.

Ten eerste is er de onderzoeksvraag:

  • 2 eisen: de vraag moet empirisch te onderzoeken zijn, en moet gespecificeerd zijn naar plaats, tijd en doelgroep.

  • 3 soorten onderzoeksvragen: exploratieve, beschrijvende en verklarende vragen.

Ten tweede is er de formulering van hypothesen:

  • Deze formulering gebeurt via het onderdeel ‘deductie’

  • Hypothesen zijn verwachtingen die volgen uit de theorie en de onderzoeksvraag.

  • De hypothesen worden bevestigd ofwel weerlegd door middel van toetsing.

 

Stap 4: Toetsen

Deze stap bestaat uit 3 onderdelen: 1) operationaliseren; 2) dataverzameling en 3) analyse.

  1. Operationaliseren:

Dit is het bepalen van de methode die gebruikt wordt om het onderzoek uit te voeren.

Er moet gekozen worden tussen:

  • Kwalitatief/ kwantitatief onderzoek

  • Gebruik van experiment/ vragenlijst/ veldwerk/ inhoudsanalyse/ interview

In Kwantitatief onderzoek worden variabelen gemeten.

Een variabele is: iets dat kan variëren en een breed onderwerp vertegenwoordigt. Er wordt onderscheid gemaakt tussen verschillende soorten variabelen:

  • De onafhankelijke variabele: de verklarende factor;

  • De afhankelijke variabele: iets dat verklaard moet worden.

Tussen de variabelen moet een verband getest worden: causaliteit.

Bij een causaal verband moeten er drie dingen aangetoond worden:

  • Twee of meer variabelen vertonen samenhang

  • De oorzaak ( onafhankelijke variabele) moet voorafgaan aan de uitkomst in de tijd

  • Er mogen geen andere verklaringen mogelijk zijn

Als er wel een alternatieve verklaring mogelijk is, kan er sprake zijn van:

  • een schijnverband

  • een mediërend verband (een tussenkomende variabele die niet onderzocht is).

 

  1. Dataverzameling

Dit is de daadwerkelijke uitvoering van het onderzoek.

Er moet rekening gehouden worden met 3 dingen:

  • Tijd;

  • Geld;

  • Menskracht (zelden kunnen alle eenheden van een doelgroep onderzocht worden, dus wordt meestal gebruik gemaakt van een steekproef).

Deze zorgen soms voor beperkingen.

 

  1. Analyse

De analyse is het verwerken van de verzamelde data.

Iedere methode van onderzoek vraagt om een andere vorm van analyse:

  • Experiment: beschrijvende statistiek, verschil tussen experimentele- en controlegroep

  • Vragenlijst: beschrijvende statistiek, en verbanden tussen variabelen in kaart brengen

  • Etnografisch veldwerk: coderen van een interview (antwoorden op open vragen worden samengevat in codes).

 

Stap 5: Evaluatie van hypothesen

  • Bij kwantitatief onderzoek worden hypothesen getest aan de hand van inferentiële statistiek (komt aan de orde in college 6)

  • Bij kwalitatief onderzoek wordt bekeken of de gecodeerde informatie uit de analyse aansluit bij de hypothesen.

De uitkomst van een onderzoek roept altijd nieuwe vragen op, en zo leidt de 5e stap weer tot de 1e stap: een nieuwe empirische cirkel.

 

3. Aantekeningen hoorcollege 3

 

Meten in de sociale wetenschappen.

 

Hypothesen moeten aan drie eisen voldoen:

Toetsbaarheid, maximale informativiteit en explicitering.

 

1)Toetsbaarheid

Toetsbaarheid berust op verificatie of falsificatie.

Verificatie = zoeken naar bevestiging van de hypothese

Falsificatie = streven naar weerlegging van de hypothese.

Gebruik van de Nulhypothese (voorspelling dat de hypothese niet waar is) tegenover alternatieve hypothese biedt snel duidelijkheid.

Falsificatie: idee van Karl Popper.

Voordelen volgens zijn denkwijze:

  • Één observatie dat het tegendeel van een uitspraak bewijst is genoeg om te falsifiëren;

  • Falsificatie leidt tot vooruitgang omdat onderzoek veel sneller tot nieuwe vragen leidt;

 

Reacties op Popper: verschillende theorieën over vooruitgang.

  • Kuhn: wetenschap bestaat uit 2 fases: ‘normale wetenschap’ en ‘revolutionaire wetenschap’. Vooruitgang vindt plaats in de fase van revolutionaire wetenschap, en wordt veroorzaakt doordat paradigma’s veranderen.

  • Feyerabend: vooruitgang in de wetenschap wordt veroorzaakt door vernieuwing en verandering van onderzoeksmethoden, want de methoden worden bepaald door paradigma’s.

 

2) Maximale informativiteit

Dit is afhankelijk van twee eigenschappen van de hypothese:

  • Domein: afbakenen van de doelgroep

  • Specifiteit: afbakenen van kenmerken (tijd, plaats, variabelen)

 

  1. Explicitering

Dit is het nauwkeurig beschrijven van de stappen die gevolgd worden in de onderzoeksmethode, zodat het onderzoek herhaalbaar is voor andere onderzoekers.

 

Manier van meten

De manier van meten wordt bepaald tijdens operationalisering, de 1e stap van onderzoek doen (zie hoorcollege 2).

  • Operationele definitie: een omschrijving van de manier waarop de theoretische constructen gemeten worden.

Belangrijk hierbij is dat duidelijk omschreven wordt wat voor kenmerken gemeten worden (vaardigheden, gedrag, attitudes, opinies). Deze kenmerken worden steeds verder opgedeeld:

  1. Construct = het kenmerk

  2. Dimensie = aspect van het construct

  3. Indicator = iets om de dimensie te meten (in variabelen)

Hetzelfde geldt voor waarden:

  1. Waarde

  2. Attitude

  3. Opinie

 

Het is afhankelijk van het construct op wat voor manier gemeten wordt. Bij iedere methode hoort ook een specifieke manier van meten:

Methodes met bijbehorende manieren van meten

- Experiment Observatie/ gesloten vragen

- Vragenlijst Gesloten vragen

- Inhoudsanalyse Teksten/ video/ audiofragmenten

- Etnografisch

veldwerk Observatie/ open vragen

- Historisch-

vergelijkend Observatie/ teksten

 

De manier van meten is afhankelijk van wat de onderzoeker wil afleiden:

- Observatie: gedrag en reacties

- Vragenlijst: gevoelens en meningen

- Tekst, video, audiofragmenten: gevoelens en ideeën.

 

Analyse

De manier van analyse is weer afhankelijk van de manier van meten:

- Observeren: coderen via schema

- Open vragen: volledige antwoorden worden samengevat in codes, codes vormen data

- Gesloten vragen: vastgelegde soorten antwoorden vormen een code (met vastgelegde antwoorden wordt het geven van sociaal wenselijke antwoorden voorkomen)

 

Meetniveaus

Bij operationalisering moet bepaald worden welk meetniveau het best toegepast kan worden.

Er zijn 4 verschillende meetniveaus:

  • Nominaal = categorisch, zonder logische volgorde (bijv. bij kleur: zwart, wit, blauw)

  • Ordinaal = categorisch, met logische volgorde (hoog naar laag, eens tot oneens)

  • Interval = continu, in getallen, afstand tussen waarden is gelijk (bijv. temperatuur, IQ)

  • Ratio = continu, in getallen, verhouding tussen waarden heeft een betekenis, vaak vanaf absoluut nulpunt (leeftijd, aantal schoenen)

 

Meetfouten

Er zijn 2 soorten meetfouten:

  • Systematische fouten, bij een vertekening voor alle metingen (het is niet valide)

  • Willekeurige fouten, bij toevallige vertekeningen. Kunnen veroorzaakt worden door bijv. raden of vergissingen (het is niet betrouwbaar)

 

Validiteit = kwaliteit van het onderzoek.

Validiteit van meetinstrument kent 3 gradaties:

  • Indruksvaliditeit (face validity) = mate van goedkeuring door verschillende experts

  • Inhoudsvaliditeit (content validity) = in hoeverre alle aspecten van het gemeten construct aan bod komen

  • Convergente validiteit (criterion validity) = validiteit vergeleken met andere metingen van hetzelfde construct.

Ook wordt onderscheid gemaakt tussen 2 soorten over het gehele onderzoek:

  • Interne validiteit = in hoeverre de methode geschikt is voor de onderzoeksvraag

  • Externe validiteit = in hoeverre het mogelijk is de resultaten van het onderzoek te generaliseren (dus de representativiteit van het bestudeerde domein)

 

Opmerkingen over schaaltechnieken

  • Vaak worden meerdere vragen gebruikt om een bepaald concept te meten, want het is onmogelijk om een construct of waarde te meten met één vraag.

  • Uit veel individuele vragen moet één uitkomst gehaald worden

  • Het is van belang om meetfouten te verminderen en betrouwbaarheid te vergroten.

 

4. Aantekeningen statistiekcollege 4

 

Binnen de statistiek wordt onderscheid gemaakt tussen:

  • Beschrijvende statistiek, het samenvatten van data;

  • Inductieve statistiek (inferential statistics), het generaliseren van resultaten van een steekproef naar de populatie

De aanduiding van onderzoeksgroepen werkt als volgt:

  • In een onderzoek wordt een populatie bestudeerd, aangeduid met de letter N;

  • Er wordt een steekproef getrokken (dit is een subset, kleiner dan de gehele populatie, waarvan data daadwerkelijk verzameld worden) aangegeven met de kleine letter n.

Resultaten van de onderzoeksgroepen zijn:

  • De parameter, een numerieke waarde die de gehele populatie beschrijft;

  • De statistiek, die bestaat uit de resultaten van een steekproef.

 

Statistiek wordt gebruikt omdat in de sociale wetenschappen vaak abstracte kenmerken gemeten moeten worden, dit is moeilijker dat fysieke, concrete kenmerken.

Er wordt gebruikt gemaakt van variabelen:

  • Een variabele is een kenmerk dat direct geobserveerd en dus gemeten kan worden;

  • Een variabele heeft voor iedere eenheid een andere waarde;

  • Een variabele wordt aangegeven met een letter van het einde van het alfabet (zoals X of Y);

  • Voor abstracte kenmerken worden gerelateerde concrete variabelen gebruikt.

Er is onderscheid tussen twee soorten variabelen:

  • Continue variabelen, deze kunnen waarden aannemen overal in een interval, en steeds kleiner opgedeeld worden

  • Discrete variabelen, deze kunnen maar een beperkt aantal vaste waarden aannemen.

 

In de beschrijvende statistiek worden gegevens op verschillende manieren samengevat.

Een frequentieverdeling is de verdeling van een bepaalde waarde in een populatie.

De frequentieverdeling wordt op verschillende manieren weergegeven:

  • In een frequentietabel, waarin de frequentie van iedere mogelijke waarde van een variabele in getallen staat weergegeven;

  • Een apart soort frequentietabel is de gegroepeerde frequentietabel, waarin continue variabelen verdeeld zijn in klassen;

  • In een grafiek

Er kunnen verschillende soorten grafieken gebruikt worden:

  • Histogrammen, die gebruikt worden voor numerieke gegevens (interval- of ratiomeetniveau), en waarbij de frequentie wordt aangeduid met de hoogte van de staven;

  • Polygonen, die tevens voor numerieke data gebruikt worden, maar in plaats van staven worden punten gebruikt die verbonden worden door middel van een lijn;

  • Staafdiagrammen, die gebruikt worden voor discrete data (nominaal of ordinaal meetniveau), hierbij is geen sprake van een vaste volgorde van de categorieën.

 

De vorm van een grafiek kan beschreven worden:

  • Een glooiende curve (smooth curve) wordt gebruikt bij een histogram of polygoon, en geeft globaal het verloop van de numerieke waarden weer;

  • Een symmetrische verdeling is meestal een normaalverdeling, waarbij de gemiddelde waarden het meest voorkomen en aan beide kanten geleidelijk aflopen;

  • Een rechtsscheve verdeling heeft een piek aan de kant van de laagste waarden en loopt af in een staart naar de positieve kant;

  • Een linksscheve verdeling heeft een piek aan de kant van de hoogste waarden en loopt af naar de negatieve kant;

  • Een bimodale verdeling heeft twee toppen, wat meestal duidt op een fout in de verwerking van de gegevens;

  • Een uitschieter is een waarde die ver van de rest van de data ligt, en duidt ook op een fout.

 

Om data te beschrijven wordt gebruikt van centrummaten:

  • Het gemiddelde, de som van alle waarden gedeeld door het totaal aantal waarden;

  • De mediaan, de waarde waar 50% van de waarden onder liggen en 50% boven;

  • De modus, de waarde die het meest frequent voorkomt in een verdeling.

Om de centrummaten in een breder perspectief te plaatsen, worden er extra beschrijvende waarden aan gekoppeld:

  • De standaardspreiding en variantie aan het gemiddelde;

  • Kwartielen aan de mediaan.

 

5. Aantekeningen instructiecollege 5

 

In dit college worden opgaven van een aantal even nummers uit hoofdstuk 1 t/m 4 besproken. Verder kan geoefend worden met:

  • Oneven genummerde opgaven waarvan de antwoorden achterin het boek staan;

  • De internetsite van Gravetter & Wallnau.

 

De belangrijkste punten uit de hoofdstukken zijn:

  • Onderscheid tussen de meetniveaus, zie hoofdstuk 1;

  • Frequentietabellen voor beschrijvende statistiek, zie hoofdstuk 2;

  • Centrummaten voor beschrijvende statistiek, zie hoofdstuk 3;

  • De standaardafwijking die altijd gekoppeld wordt aan het gemiddelde, zie hoofdstuk 4.

 

6. Aantekeningen hoorcollege 6

 

Steekproeven

Steekproeven worden gebruikt in de laatste fase van operationalisering.

Belangrijk bij het trekken van een steekproef is dat een representatief deel van de populatie getrokken wordt. Dit kan bereikt worden door rekening te houden met bepaalde principes:

  • De grootte van de steekproef (hoe groter de steekproef, hoe representatiever hij is);

  • De kans voor ieder element om in de steekproef te komen moet even groot zijn.

 

Bij kwantitatief onderzoek kan gebruik gemaakt worden van de volgende soorten steekproeven:

  • De enkelvoudig aselecte steekproef;

  • De gestratificeerde aselecte steekproef;

  • De clustersteekproef;

  • De getrapte steekproef.

Kenmerken van de enkelvoudig aselecte steekproef zijn:

  • Elementen komen willekeurig (aselect) in de steekproef terecht;

  • De steekproef wordt in één poging getrokken (enkelvoudig);

  • De 1e stap is het maken van een lijst van alle elementen in een populatie;

  • De 2e stap is het trekken van de steekproef uit de lijst, op basis van volledige willekeurigheid.

Kenmerken van de gestratificeerde steekproef zijn:

  • De populatie wordt verdeel in groepen (strata);

  • De 1e stap is weer het maken van een lijst van alle elementen in de populatie;

  • De 2e stap is het verdelen van de populatie in strata;

  • De 3e stap is het trekken van een steekproef binnen ieder stratum, zodat in een populatie met een ongelijke verdeling van eigenschappen uit iedere groep met zekerheid een deel in de steekproef valt.

Kenmerken van de clustersteekproef zijn:

  • Binnen een populatie worden groeperingen gemaakt (clusters) bijvoorbeeld op basis van geografisch gebied;

  • De 1e stap is het maken van een lijst van de clusters, de populatie bestaat dus uit clusters;

  • De 2e stap is het trekken van een steekproef uit de clusters – ieder element dat binnen een cluster valt, valt in de steekproef.

Kenmerken van de getrapte steekproef zijn:

  • De eerste stappen zijn gelijk aan de clustersteekproef;

  • Een 3e stap is het trekken van een aselecte steekproef binnen de elementen van de clusters.

 

Er kan ook gebruik gemaakt worden van niet-aselecte steekproeven:

  • De gemakssteekproef, waarbij gevraagd wordt naar vrijwillige deelnemers (de steekproef bestaat uit alle vrijwilligers);

  • De quotasteekproef, waarbij bewust bepaalde kenmerken geselecteerd worden in vastgestelde proporties.

Deze vormen van steekproeven zijn vaak niet representatief voor een populatie.

 

Bij kwalitatief onderzoek wordt gebruikt gemaakt van andersoortige steekproeven:

  • De doelgerichte steekproef;

  • De sneeuwbalsteekproef.

Kenmerken van de doelgerichte steekproef zijn:

  • Er worden elementen gekozen met specifieke eigenschappen, die van essentieel belang zijn voor het onderzoek;

  • Dit soort steekproeven wordt vaak gebruikt bij kleine aantalen elementen.

Kenmerken van de sneeuwbalsteekproef zijn:

  • Nieuwe proefpersonen worden geworven via de netwerken van deelnemers;

  • Verborgen populaties kunnen hiermee bereikt worden.

 

Belangrijke punten die in overweging genomen moeten worden bij het trekken van een steekproef:

  • Is het een steekproef met of zonder teruglegging? Met teruglegging betekent dat ieder element een gelijke kans heeft om in de steekproef te komen, en dit is belangrijk voor de representativiteit en voor berekeningen in de statistiek;

  • Hoe wordt de lijst van elementen van de populatie verkregen? De bron moet beschikbaar zijn en representatief, dus er moet voorkomen worden dat er elementen buiten de lijst vallen;

  • Wat voor invloed heeft de keuze van een bepaald soort steekproef op de validiteit van het onderzoek? Bij kwantitatief onderzoek is dit van zeer groot belang, bij kwalitatief iets minder, omdat meestal gegeneraliseerd wordt naar een minder grote populatie.

 

Veelvoorkomende fouten bij het trekken van een steekproef zijn:

  • De dekkingsfout, een fout die optreedt doordat een onvolledige lijst van de populatie gebruikt wordt;

  • De steekproeffout, waarbij op basis van toeval een groot verschil optreedt tussen de parameter van de populatie met de statistiek van de steekproef;

  • De nonrespons-fout, die optreedt doordat geselecteerde proefpersonen deelname weigeren.

 

7. Aantekeningen statistiekcollege 7

 

Kansverdelingen

Een veelvoorkomende verdeling is de normaalverdeling.

De verdeling wordt bepaald door het gemiddelde en de standaarddeviatie.

Handige kenmerken zijn:

  • Het inflectiepunt is waar de buiging van de grafiek verandert;

  • De standaarddeviatie bepaalt de schaalverdeling;

  • De oppervlakte onder de grafiek wordt gebruikt voor berekeningen met percentages en proporties;

  • De structuur van iedere normaalverdeling is overeenkomstig.

 

 De standaardnormaalverdeling

Omdat de structuur overeenkomstig is, kan er een gestandaardiseerde verdeling gebruikt worden: de standaardnormaalverdeling.

  • Het gemiddelde is altijd 0

  • De standaarddeviatie is altijd (-)1

Berekeningen met oppervlaktes worden gedaan met behulp van de standaardnormaaltabel:

  • bij iedere waarde van z hoort een kolom B, C en D;

  • In kolom B staat de oppervlakte in de body (het grootste deel) tot z

  • In kolom C staat de oppervlakte in de staart (het kleinste deel) tot z

  • In kolom D staat de oppervlakte tussen het gemiddelde en z.

 

Omdat iedere normaalverdeling hetzelfde patroon volgt en er een gestandaardiseerde verdeling bestaat, kunnen alle normaalverdelingen omgerekend worden naar de standaardwaarden, met de formule:

 

Z = (X - μ) / δ

 

De z-score wordt gebruikt voor twee toepassingen:

  • Het bepalen van de locatie van de originele score (Engels: raw score);

  • Het vergelijken van twee observaties met verschillende normaalverdelingen (met andere woorden: de relatieve score bepalen). Hierbij wordt met het teken ( + of -) aangeduid of de score boven of onder het gemiddelde ligt, en de waarde van de z-score geeft aan wat de afstand tot het gemiddelde is.

 

 De steekproeffout en steekproevenverdeling

  • Bij het trekken van een steekproef is er altijd een verschil tussen de waarde van de statistiek en die van de parameter: dit wordt een schattingsfout genoemd (Engels: sampling error).

  • Steekproefgemiddelden verschillend per steekproef. Het steekproefgemiddelde is dus variabel.

  • Het steekproefgemiddelde kan dus als variabele gebruikt worden, en er kan een normaalverdeling gemaakt worden van alle steekproefgemiddelden: de steekproevenverdeling.

 

De steekproevenverdeling heeft een aantal eigenschappen:

  • Bij het trekken van vele steekproeven, resulteert dit in een gemiddelde uitkomst die gelijk is aan het populatiegemiddelde;

  • De grootte van de schattingsfout van een steekproef kan bepaald worden aan de hand van de afstand tot het steekproevengemiddelde;

  • Voor het gemiddelde van een enkele steekproef geldt: hoe groter de steekproef, hoe kleiner de schattingsfout.

 

Hierbij hoort de centrale limiettheorie:

  • Hoe groter een steekproef, hoe dichter de steekproevenverdeling bij de normaalverdeling van de populatie ligt;

  • Als een populatie normaalverdeeld is, is de verdeling van de steekproefgemiddelden ook normaalverdeeld;

  • Als de populatie niet normaalverdeeld is, is de verdeling van de steekproefgemiddelden normaalverdeeld mits er meer dan 30 elementen toe behoren.

 

8. Aantekeningen instructiecollege 8

 

In dit instructiecollege worden opgaven uit hoofdstuk 5 t/m 7 besproken.

Deze hoofdstukken gaan over:

  • H5: z-scores

  • H6: kansen

  • H7: kansverdelingen en de steekproevenverdeling.

Hoofdstuk 7 is ERG belangrijk voor inductieve statistiek. De belangrijkste punten:

  • De standaardfout is afhankelijk van twee dingen:

  1. De spreiding van de scores: hoe groter de spreiding, hoe groter de standaardfout;

  2. De grootte van de steekproef: hoe groter de steekproef, hoe dichter het steekproefgemiddelde bij het populatiegemiddelde ligt.

  • Let op het onderscheid tussen de normaalverdeling van de ware scores van de steekproef, en de normaalverdeling van (mogelijke) steekproefgemiddelden;

  • Let op problemen met de centrale limiettheorie: de parameter moet óf normaalverdeeld zijn, óf bij niet-normaalverdelingen moet een steekproef van minimaal 30 elementen gebruikt worden.

Verder is belangrijk:

  • Het onderscheid tussen de verschillende formules:

  1. de standaardfout

  2. de standaarddeviatie

  3. de z-score.

 

9. Aantekeningen statistiekcollege 9

 

Inductieve statistiek bij hypothesetoetsen

 

Nogmaals de definitie van inductieve statistiek: het generaliseren van gegevens van herhaalde steekproeven naar de populatie.

 

Keuzes over gegevens kunnen gemaakt worden op basis van waarschijnlijkheid.

Dit wordt gedaan aan de hand van stellingen over de populatie: hypothesen.

Meestal worden twee tegenstrijdige hypothesen gebruikt:

  • De Nulhypothese, waarmee gesteld wordt dat en geen effect, verschil, relatie of

verandering is na gebruik van de onafhankelijke variabele (notatie: H₀). Het doel is om de nulhypothese te falsifiëren om de alternatieve hypothese te ondersteunen;

  • De Alternatieve hypothese, waarmee gesteld wordt dat de onafhankelijke variabele wel een bepaald effect (notatie: H₁).

In rapporteringen over onderzoek wordt altijd de Nulhypothese genoemd: er wordt vermeld of die wordt verworpen of niet.

 

Bij de keuze of een Nulhypothese wordt verworpen of niet, kunnen fouten gemaakt worden:

  • De Type I-fout: de nulhypothese wordt verworpen terwijl hij waar is;

  • De Type II-fout: de nulhypothese wordt aangenomen terwijl hij niet waar is.

 

De kans op de type I-fout kan zo klein mogelijk gemaakt worden door middel van:

  • Het significantieniveau: de grenswaarde die bepaald wordt voor de kans om een type I-fout te maken;

  • Het kritieke gebied: de oppervlakte onder de grafiek in de staarten van de normaalverdeling vanaf de grenswaarden van het significantieniveau.

Als de gevonden waarden van een steekproef in het kritieke gebied vallen, wordt de nulhypothese verworpen. De resultaten worden dan significant genoemd, omdat de alternatieve hypothese hiermee wordt ondersteund.

 

Voor een hypothesetoets geldt:

  • Het gemiddelde van de populatie is onbekend;

  • De standaarddeviatie van de populatie is onbekend.

  • Er kan dus geen z-toets gedaan worden.

Bij hypothesetoetsen wordt daarom een t-toets gebruikt, met:

  • De geschatte standaardfout: de standaardfout van de steekproef;

  • Het gemiddelde volgens de nulhypothese (meestal 0).

  • Vrijheidsgraden (df) : het aantal waarden in de steekproef dat kan variëren. Dit zijn alle waarden behalve het gemiddelde, dus df = n – 1.

  • De specifieke tabel voor de t-toets.

 

Er zijn twee verschillende t-toetsen:

  • De tweezijdige toets: bij een hypothese die over twee richtingen gaat, dus puur een verandering. Dit kan lager of hoger dan het gemiddelde van de nulhypothese zijn.

  • De eenzijdige toets: bij een hypothese over een specifieke richting, dus ofwel een toename ofwel een afname van het gemiddelde. Het kritieke gebied ligt dan ofwel aan de positieve kant ofwel aan de negatieve kant van de verdeling.

 

Bij het trekken van een conclusie, is het tot slot belangrijk om te bepalen of de gevonden waarden wel relevant zijn. Dit gebeurt door middel van de effectgrootte.

De effectgrootte kan op verschillende manieren berekend worden:

  • Met Cohen’s d: (M – μ) / δ

  • Met de geschatte d: (M – μ) / s

  • Met de percentageverklaarde spreiding: r² = t² / (t² + df)

 

Er is een manier om de kans op een type II-fout te bepalen.

Dit gebeurt met de power: de kans dat de type II-fout niet gemaakt wordt (dus dat de nulhypothese niet aangenomen wordt als hij niet waar is, oftewel dat hij correct verworpen wordt).

Er zijn vier factoren die invloed hebben op de power:

  • De gekozen grootte van het significantieniveau (hoe groter het significantieniveau, hoe groter de kans dan de nulhypothese verworpen wordt, dus groter de power);

  • Het verwachte effect: het verschil tussen het gemiddelde volgens de nulhypothese en het gemiddelde van de alternatieve hypothese (hoe groter het verschil, hoe groter de power);

  • De grootte van de steekproef (hoe groter de steekproef, hoe groter de power);

  • De keuze voor een eenzijdige of tweezijdige toets (een eenzijdige toets heeft een grotere power),

De berekening van de power is geen verplichte stof. Wel is belangrijk om te begrijpen hoe de power werkt.

 

10. Aantekeningen instructiecollege 10

 

In dit instructiecollege worden opgaven over hoofdstuk 8 en 9 besproken.

Er zijn nu vooral veel verschillende formules bekend. Formules die in dit college veel gebruikt worden:

 

  • De z-score voor een populatie = z = (X - μ) / δ

  • De z-score voor een steekproef = z = (M - μ) / δm

  • De schattingsfout (verschil steekproef-

gemiddelde en populatiegemiddelde): δm = δ / √n

  • De standaardfout (van een steekproef): s = √(SS / df)

  • De variantie van een steekproef: s² = SS / df

  • De geschatte standaardfout: sm = s / √n of sm = √(s² / n)

  • De vrijheidsgraden: df = n – 1

  • De t-score voor een enkelvoudige

steekproef: t = (M - μ) / sm

  • Cohen’s d: d = (M - μ) / δ

  • Geschatte d: d = (M - μ) / s

 

11. Aantekeningen statistiekcollege 11

 

Toetsen voor gekoppelde en onafhankelijke metingen

 

Er kunnen verschillende soorten metingen gedaan worden:

  • Herhaalde metingen: een gekoppelde meting waarbij één steekproef in twee verschillende situaties gebruikt wordt;

  • Matched-subjects design: een gekoppelde meting waarbij twee steekproeven gebruikt worden, waarvan ieder individu uit de ene groep gekoppeld is aan een individu uit de andere groep;

  • Onafhankelijke metingen: twee aparte steekproeven worden gebruikt.

 

Voor iedere meting wordt een andere t-toets gedaan.

 

 Bij gekoppelde metingen:

  • wordt gebruikt gemaakt van verschilscores: het verschil tussen de eerste en tweede meting van een herhaalde steekproef, of tussen de score van het individu uit de ene groep en het gekoppelde individu uit de andere groep bij een matched-subjects design.

  • worden de verschilscores gebruikt voor de waarden in de kansverdelingen.

De stappen zijn als volgt:

  1. Het berekenen van de verschilscores, inclusief het gemiddelde (Md) de standaardfout (sd).

  2. De nulhypothese en alternatieve hypothese opstellen

  3. Het significantieniveau kiezen en kritieke waarden bepalen (let op het aantal vrijheidsgraden, of er eenzijdig of tweezijdig getoetst wordt, en welke kolom in de t-tabel gebruikt moet worden)

  4. De toetsingsgrootheid bepalen:

t = (Md – μd) / (sd / √n)

  1. De beslissing over de hypothese nemen: de nulhypothese aannemen of verwerpen, bepalen of het significant en relevant is.

 

 Bij onafhankelijke metingen:

  • is de berekening van de toetsingsgrootheid anders, omdat het twee aparte steekproeven betreft;

  • wordt gebruik gemaakt van de gepoolde variantie.

De stappen zijn als volgt:

  1. Het opstellen van de hypothesen (dit gaat altijd om een verschil: het vergelijken van het gemiddelde van de ene steekproef, μ₁, met het gemiddelde van de andere steekproef, μ₂).

  2. Het bepalen van het significantieniveau en de kritieke waarden

  3. De toetsingsgrootheid berekenen. Hier moeten weer aparte stappen gebruikt worden:

 

  • De gepoolde variantie berekenen: sp² = (SS₁ + SS₂) / (df₁ + df₂)

  • De standaardfout schatten: s(M₁ – M₂) = √ ((sp² / n₁) + (sp² / n₂))

  • De t-toets uitvoeren: t = ((M₁ – M₂) – (μ₁ - μ₂) / s(M₁ – M₂)

  1. Een beslissing nemen over de hypothese, significantie en relevantie.

 

 Significantie kan berekend worden op een andere manier dan met de kritieke waarden:

de overschrijdingskans, ook wel de p-waarde.

  • Hierbij wordt gebruik gemaakt van de staartoppervlakte;

  • Het is de kans dat een geobserveerde waarde nog extremer dan, of net zo extreem als de gevonden waarde is.

  • Het doel is om te bepalen of de nulhypothese verworpen of aangenomen moet worden.

Er zijn een aantal richtlijnen voor de p-waarde:

  • Hoe groter de geobserveerde waarde, hoe kleiner de staartoppervlakte, dus hoe kleiner de p-waarde;

  • Bij een zeer kleine p-waarde kan de nulhypothese al verworpen worden

  • De grenswaarde voor de p-waarde is het significantieniveau; als de p-waarde extremer is dan het significantieniveau, is dit een indicator om de nulhypothese te verwerpen.

 

 Schatten

Schattingen worden gebruikt omdat de waarde van de parameter meestal niet bekend is.

Er zijn twee soorten schattingen:

  • Puntschattingen zijn enkele, specifieke waarden. De schatting is dat de waarde van de parameter gelijk is aan de statistiek.

  • Intervalschattingen zijn bredere schattingen, waarbij gebruik gemaakt wordt van grenswaarden. De schatting is dat de waarde van de parameter ergens in het interval tussen de grenswaarden valt.

Bij intervalschattingen wordt gebruikt gemaakt van een betrouwbaarheidsniveau:

  • Deze wordt aangegeven met een percentage

  • Het betrouwbaarheidsniveau is de kans dat een schatting juist is

  • Het betrouwbaarheidsinterval wordt berekend door een t-toets met de geschatte standaardfout en een gekozen significantieniveau.

 

 Levene’s test

  • Levene’s test wordt gebruikt om te kijken of de variantie in twee steekproeven (voor gekoppelde of onafhankelijke metingen) gelijk is

  • Hier wordt opnieuw een paar hypothesen (een nulhypothese en alternatieve hypothese) voor opgesteld.

  • De nulhypothese houdt in dat de varianties gelijk zijn, de alternatieve hypothese dat de varianties verschillen.

 

 

 

 

 

Image

Access: 
Public

Image

Image

 

 

Contributions: posts

Help other WorldSupporters with additions, improvements and tips

Add new contribution

CAPTCHA
This question is for testing whether or not you are a human visitor and to prevent automated spam submissions.
Image CAPTCHA
Enter the characters shown in the image.

Image

Spotlight: topics

Check the related and most recent topics and summaries:
Study fields and working areas:

Image

Check how to use summaries on WorldSupporter.org

Online access to all summaries, study notes en practice exams

How and why use WorldSupporter.org for your summaries and study assistance?

  • For free use of many of the summaries and study aids provided or collected by your fellow students.
  • For free use of many of the lecture and study group notes, exam questions and practice questions.
  • For use of all exclusive summaries and study assistance for those who are member with JoHo WorldSupporter with online access
  • For compiling your own materials and contributions with relevant study help
  • For sharing and finding relevant and interesting summaries, documents, notes, blogs, tips, videos, discussions, activities, recipes, side jobs and more.

Using and finding summaries, notes and practice exams on JoHo WorldSupporter

There are several ways to navigate the large amount of summaries, study notes en practice exams on JoHo WorldSupporter.

  1. Use the summaries home pages for your study or field of study
  2. Use the check and search pages for summaries and study aids by field of study, subject or faculty
  3. Use and follow your (study) organization
    • by using your own student organization as a starting point, and continuing to follow it, easily discover which study materials are relevant to you
    • this option is only available through partner organizations
  4. Check or follow authors or other WorldSupporters
  5. Use the menu above each page to go to the main theme pages for summaries
    • Theme pages can be found for international studies as well as Dutch studies

Do you want to share your summaries with JoHo WorldSupporter and its visitors?

Quicklinks to fields of study for summaries and study assistance

Main summaries home pages:

Main study fields:

Main study fields NL:

Submenu: Summaries & Activities
Follow the author: Vintage Supporter
Statistics
1632
Search for summaries and study assistance

Select any filter and click on Apply to see results