Nederlandstalige Oefenvragen - Statistical Methods for the Social Sciences - Agresti - 5e druk

Vragen
Wat zijn statistische methoden? - Tentamens 1
Welke soorten steekproeven en variabelen zijn er? - Tentamens 2
Hoe werkt beschrijvende statistiek? - Tentamens 3
Hoe gebruik je kansverdelingen voor statistische inferentie? - Tentamens 4
Hoe maak je schattingen voor statistische inferentie? - Tentamens 5
Hoe gebruik je significantietoetsen? - Tentamens 6
Hoe vergelijk je twee groepen met elkaar in de statistiek? - Tentamens 7
Hoe kun je het verband tussen categorische variabelen analyseren? - Tentamens 8
Hoe werken lineaire regressie en correlatie? - Tentamens 9
Welke vormen hebben multivariate verbanden? - Tentamens 10
Hoe wordt een multipele regressie geanalyseerd? - Tentamens 11
Hoe werkt ANOVA? - Tentamens 12
Hoe werkt multipele regressie met zowel kwantitatieve als categorische predictoren? - Tentamens 13
Hoe construeer je een model voor multipele regressie van extreme of sterk gecorreleerde data? - Tentamens 14
Hoe werkt logistische regressie? - Tentamens 15
Antwoordindicatie

Vragen

Wat zijn statistische methoden? - Tentamens 1

Vraag 1

Welk soort data beschrijft de populatie?

De parameter
De statistiek
De steekproef
De regressie

Vraag 2

Wat is het verschil tussen beschrijvende en inferentiële statistiek?

Vraag 3

Lydia doet onderzoek naar de invloed van kauwgum kauwen op concentratie bij jongeren. Ze selecteert deelnemers op verschillende middelbare scholen om mee te doen aan haar experiment. Wat is hier de populatie en wat is de steekproef?

Vraag 4

Myrthe kijkt naar de jaarlijkse uitgaven van gezinnen in verschillende regio’s in Nederland over de periode 1980 tot afgelopen jaar. Gebruikt zij inferentieel of beschrijvende statistiek?

Vraag 5

Een arbeidspsycholoog doet onderzoek naar werkstress bij startende ondernemers. Hij gebruikt gegevens van de Kamer van Koophandel en vindt dat 62% van de ondernemers man is, en 38% vrouw. Van de ondernemers die aan zijn onderzoek meedoen, rapporteert 73% van de vrouwen bovengemiddelde stress, tegenover 45% van de mannen. Hij voorspelt dat vrouwelijke ondernemers vaker last zullen krijgen van burn-outklachten. Welk deel in het onderzoek is beschrijvende statistiek, en welk deel is inferentieel?

Vraag 6

Hoe wordt de vorm van statistiek genoemd die zich bezig houdt met het trekken van conclusies?

Vraag 7

Wat is het verschil tussen een parameter en een statistiek?

Welke soorten steekproeven en variabelen zijn er? - Tentamens 2

Vraag 1

Wat is het verschil tussen een continue en een discrete variabele?

Vraag 2

In een demografische vragenlijst wordt naar opleidingsniveau gevraagd, waarbij de antwoordopties zijn: basisschool, voortgezet onderwijs, middelbaar onderwijs en hoger onderwijs. Wat voor soort variabele is ‘opleidingsniveau’ in dit geval?

Interval
Ordinaal
Nominaal
Ratio

Vraag 3

Joost doet een opiniepeiling onder studenten en trekt een steekproef op iedere universiteit in Nederland. Wat voor soort steekproeftrekking is dit?

Systematisch
Cluster
Gestratificeerd
Gelaagd

Vraag 4

Noem de drie typen bias die kunnen ontstaan in een steekproef.

Vraag 5

Welke van de volgende variabelen zijn zowel discreet als kwantitatief:

Aantal hoofdsteden in Europa dat je binnen een minuut op kunt noemen
Tijd die studenten nodig hebben om statistiek te leren begrijpen
Bij welke studentenvereniging studenten zitten
Aantal keer per jaar dat Spongebob op tv is

Vraag 6

Iemand beweert over een bepaalde variabele dat de score van Elise twee keer zo groot is als die van Adriaan. Welk meetniveau moet de variabele ten minste hebben om deze uitspraak te kunnen doen?

Interval
Ordinaal
Nominaal
Ratio

Vraag 7

In een onderzoek wordt de variabele Intelligentie op de volgende manier gemeten:

1 = IQ lager dan 70

2 = IQ tussen 71 en 90

3 = IQ tussen 91 en 110

4 = IQ tussen 111 en 120

5 = IQ hoger dan 120

Welk meetniveau heeft deze variabele?

Interval
Ordinaal
Nominaal
Ratio

Vraag 8

Wat is het verschil tussen een onafhankelijke en een afhankelijke variabele? Beschrijf beide begrippen?

Hoe werkt beschrijvende statistiek? - Tentamens 3

Vraag 1

Welke centrummaat kun je gebruiken voor categorische variabelen?

Het gemiddelde
De mediaan
De module
De modus

Vraag 2

Welke weergave kan worden gebruikt om de observaties van een kwantitatieve variabele in kaart te brengen?

Scatterplot
Contingency table
Regressieanalyse
Staafdiagram

Vraag 3

Wat wordt bedoeld met het begrip de interkwartielafstand?

Vraag 4

Welke maat beschrijft de typische afstand tot het gemiddelde in een distributie?

Vraag 5

Mireille heeft in haar eerste studiejaar 8 vakken gevolgd en met succes afgerond. Hieronder zie je de eindresultaten van haar tentamens. Wat is haar gemiddelde cijfer en wat is de standaarddeviatie?

Inleiding in de psychologie: 8.8

Statistiek en methoden 1: 7.2

Hersenen en gedrag: 7.0

Ontwikkelingspsychologie: 7.4

Sociale psychologie: 6.4

Statistiek en methoden 2: 6.8

Psychopathologie 1: 7.8

Toegepaste psychologie: 7.1

Hoe gebruik je kansverdelingen voor statistische inferentie? - Tentamens 4

Vraag 1

Stel dat 94% van de Nederlandse bevolking Sinterklaas viert met cadeaus en 60% geeft cadeaus met Kerstmis. Hoe groot is de kans dat iemand zowel Sinterklaas als Kerst viert met cadeaus?

Vraag 2

Hoe kan de kansverdeling van een discrete variabele het beste worden weergegeven?

In een histogram
In een curve
In een boxplot
Scatterplot

Vraag 3

De IQ-distributie heeft een gemiddelde van 100 en een standaarddeviatie van 15. Wat is de z-score van iemand met een IQ van 120?

Vraag 4

Stel, er wordt een onderzoek gedaan naar het aantal keren dat fietsers in Utrecht per dag een stoplicht passeren. De steekproef bestaat uit 700 mannelijke fietsers en 800 vrouwelijke fietsers. Het gemiddelde is 20 en de standaarddeviatie is 10. Wat is de standaardfout?

Vraag 5

De verdeling van inkomens in India is rechtsscheef. Hoe ziet een steekproefverdeling eruit volgens de centrale limiettheorie als er een grote steekproef wordt gebruikt?

Hoe maak je schattingen voor statistische inferentie? - Tentamens 5

Vraag 1

Hoe wordt de waarde die het meest consistent is met de geobserveerde data genoemd?

Puntschatting
Intervalschatting
Maximale waarschijnlijkheidsschatting
Minimale waarschijnlijkheidsschatting

Vraag 2

In een marktonderzoek naar online winkelgedrag zegt 79% van een steekproef van 1200 personen regelmatig online producten te bestellen. Bereken het 95% betrouwbaarheidsinterval.

Vraag 3

In een onderzoek naar de houding van jongeren tegenover het vuurwerkverbod wordt een steekproef gedaan. In de steekproef van 500 middelbare scholieren is 56% voor en 44% tegen. Bereken het 99% betrouwbaarheidsinterval.

Vraag 4

Hoe kun je het betrouwbaarheidsinterval verkleinen?

Vraag 5

Een vrouwenblad plaatst een poll met de stelling ‘Mijn vriendinnen gaan voor mijn familie’. 883 lezeressen nemen deel aan de poll. Wat is de geschatte standaardfout als 36% het eens is?

Vraag 6

Een onderzoeker wil onderzoeken of het gemiddelde IQ van personen met een smal hoofd (mu smal) groter is dan 100. De nulhypothese wordt verworpen vanaf een gemiddelde van 107.5. Het is bekend dat de IQ scores in de populatie normaal verdeeld zijn met standaarddeviatie 15; dit geldt zowel onder de nulhypothese als onder de alternatieve hypothese. De onderzoeker heeft de beschikking over een aselecte steekproef (SRS) van n = 20 personen uit de populatie personen met een smal hoofd. Het gemiddelde IQ in de steekproef was gelijk aan 91.

Welk significantieniveau heeft de onderzoeker hier gebruikt?

Vraag 7

Een beroepskeuzebureau hanteert een genormeerde IQ-test voor HAVO leerlingen uit de hoogste klas. Deze test heeft een variantie van 225. De scores die hiermee verkregen worden, zijn normaal verdeeld. Een steekproef van 25 leerlingen uit de groep die zich bij dit bureau voor advies heeft aangemeld, scoort op deze test gemiddeld 119. Wat is het 95% betrouwbaarheidsinterval van het populatiegemiddelde?

Vraag 8

We berekenen het gemiddelde cijfer voor het vak Inleiding in de psychologie. Dit gemiddelde bedraagt 6.5 met een standaarddeviatie van 1.67. We nemen aan dat de cijfers normaal zijn verdeeld. Hoeveel procent van de leerlingen heeft een 7 of ho-ger behaald?

Hoe gebruik je significantietoetsen? - Tentamens 6

Vraag 1

Gebruik je de t-distributie bij een significantietoets voor een gemiddelde of voor een proportie?

Vraag 2

Welke distributie wordt gebruikt voor proporties in een hele kleine steekproef?

Vraag 3

Wat betekent een type 1 fout?

Vraag 4

Martijn wil weten of slaapproblemen verminderd kunnen worden met iedere dag een kwartier lichaamsbeweging. Hij heeft een onderzoek gedaan waaruit blijkt dat er waarschijnlijk een positief effect is, maar om een gegronde uitspraak te kunnen doen, wil hij de power van zijn toets vergroten. Wat kan hij het beste doen?

Het onderzoek opnieuw uitvoeren
Een andere statistiek gebruiken
Een grotere steekproef gebruiken
Een kleinere steekproef gebruiken

Vraag 5

In welk van onderstaande gevallen kun je éénzijdig toetsen?

Je test of de productiviteit verandert wanneer werknemers ouder worden door drie verschillende leeftijdsgroepen te vergelijken.
Je test of vrouwen meer praten dan mannen.
Je test of een onderwijsprogramma effectief is in het veranderen van motivatie voor leren.
Je test of de productiviteit verandert wanneer werknemers ouder worden door vijf verschillende leeftijdsgroepen te vergelijken.

Vraag 6

De scores van een bepaalde variabele zijn in de populatie normaal verdeeld met een standaarddeviatie van 12. Stel er wordt rechtseenzijdig getoetst met de nulhy-pothese dat het populatiegemiddelde gelijk is aan 80. Bekend is dat de nulhypothe-se verworpen wordt vanaf een steekproefgemiddelde van 82.5. Wat zal de power zijn wanneer het populatiegemiddelde 86 zou zijn?

Vraag 7

Voor een steekproef van 134 studenten is de afﬁniteit met vlees eten onderzocht. Aan de helft werd voorafgaande aan het onderzoek ﬁlmpjes getoond over hoe vlees wordt gemaakt. De andere helft keek naar een comedy film. De volgende gegevens zijn bekend: Het gemiddelde de eerste groep is 4.78 met een standaard-deviatie van 1.61.Het gemiddelde van de tweede groep bedraagt 4.54 met een standaarddeviatie van 1.56. Voer de geschikte t-toets uit op deze gegevens. Kun je de nulhypothese verwerpen wanneer je eenzijdig toetst met α = 0.05?

Hoe vergelijk je twee groepen met elkaar in de statistiek? - Tentamens 7

Vraag 1

Myrthe doet onderzoek naar de kans op delirium bij chronisch alcoholgebruik. Ze vraagt participanten bij een verslavingszorginstituut op meerdere momenten deel te nemen. Wat voor soort onderzoeksdesign gebruikt ze?

Cross-sectioneel
Longitudinaal
Experimenteel
Experimenteel 2x2 design

Vraag 2

Peter doet onderzoek naar verschillende behandelvormen voor een eerste psychose. Hij vergelijkt de effecten van sociale vaardigheidstraining en cognitieve gedragstherapie. De eerste groep krijgt eerst 10 sessies sociale vaardigheidstraining en daarna 10 sessies cognitieve gedragstherapie, bij de tweede groep is de volgorde omgekeerd. Welke toets kan hij het beste gebruiken?

Een significantietoets voor onafhankelijke groepen
Een gepaarde t-toets
Een vergelijking van z-scores
Een z-score

Vraag 3

Welke nonparametrische test kun je gebruiken als je ordinale data gebruikt?

Vraag 4

Wanneer gebruik je McNemar’s test?

Vraag 5

Wat is het verschil tussen statistische significantie en praktische significantie?

Hoe kun je het verband tussen categorische variabelen analyseren? - Tentamens 8

Vraag 1

Wat voor soort verdeling gebruik je als je percentages op basis van de totale groep weergeeft?

Conditionele verdeling
Marginale verdeling
Simultane verdeling
Normale verdeling

Vraag 2

Wat meet je met de chi-kwadraattest van onafhankelijkheid?

Vraag 3

Hoe interpreteer je de chi-kwadraattest? De hypothesen zijn: H0: de variabelen zijn statistisch onafhankelijk, Ha: de variabelen zijn statistisch afhankelijk.

Hoe groter X², hoe groter het verschil tussen fe en fo. De nulhypothese wordt verworpen.
Hoe groter X², hoe groter het verschil tussen fe en fo. De nulhypothese wordt aangenomen.
Hoe groter X², hoe kleiner het verschil tussen fe en fo. De nulhypothese wordt verworpen.
Hoe groter X², hoe kleiner het verschil tussen fe en fo. De nulhypothese wordt aangenomen.

Vraag 4

In de onderstaande tabel zie je de geobserveerde frequenties van lievelingskleuren voor jongens en meisjes.

	Blauw	Rood	Geel	Totaal
Jongens	320	70	10	400
Meisjes	580	10	10	600
Totaal	900	80	20	1000

Bereken de verwachte frequenties.

Vraag 5

Voer de chi-kwadraattest voor onafhankelijkheid uit voor bovenstaande data over lievelingskleuren. Wat is je conclusie?

Vraag 6

Een onderzoeker bekijkt de samenhang tussen mate van alcoholgebruik en studieresultaat (allebei de variabelen hebben drie categorieën). De onderzoeker heeft 15 personen onderzocht en vindt een chi-kwadraat waarde van 1.3. Met hoeveel vrijheidsgraden moet hij toetsen?

Vraag 7

Om te toetsen of er een associatie is tussen geslacht en blowen (wel of niet blowen) tel je in een groep van 75 mannen en 69 vrouwen het aantal blowers en niet-blowers. Vervolgens voer je een chi-kwadraat test uit. Wat is het aantal vrijheidsgraden?

Vraag 8

Men wil weten of de ‘man/vrouw’-verhouding onder de werknemers van bedrijf A en B van elkaar verschillen. Op steekproefbasis stelt men vast dat de proportie man in van bedrijf A 0.40 en in bedrijf B 0.52 bedraagt. In beide gevallen zijn 100 studenten onderzocht. Toets de nulhypothese met de chikwadraattoets. Welke waarde heeft de toetsstatistiek?

Vraag 9

Een onderzoeker gaat na of het moment van geboorte van invloed is op of iemand een professionele turner wordt. Hiervoor zijn random 220 turners geselecteerd die de afgelopen 10 jaar hebben geturnd. Het kwartaal waarin ze geboren zijn is bepaald: eerste kwartaal 62, tweede kwartaal 69, derde kwartaal40 en het vierde kwartaal 49. Toets de nulhypothese met de chi-kwadraat-toets. Wat is de waarde van de toets statistiek?

Hoe werken lineaire regressie en correlatie? - Tentamens 9

Vraag 1

Welke waarde in een regressiefunctie is de constante waarde?

Vraag 2

Wat is het effect van een uitschieter op een lineaire regressielijn?

Vraag 3

Wanneer is een correlatie sterker?

Als de waarde groter is
Als de waarde kleiner is
Als de waarde negatief is
Als de waarde positief is

Vraag 4

Wat betekent R² binnen de regressieanalyse?

Vraag 5

Waarom kun je beter niet extrapoleren met een regressieanalyse?

Vraag 6

Variabele X en Y hebben een R² van 0.15. Wat houdt dit in? Betekent dit een grote, een kleine of een gemiddelde correlatie?

Vraag 7

Welke drie eigenschappen van de relatie tussen X en Y worden er gemeten met een correlatie?

Welke vormen hebben multivariate verbanden? - Tentamens 10

Vraag 1

Een atleet gebruikt sportdrank voordat hij de 100 meter sprint op een wedstrijd loopt. Hij verbreekt zijn persoonlijke record. Waarom kun je niet stellen dat er sprake is van een causaal verband tussen het gebruik van sportdrank en de verbetering van prestatie?

Vraag 2

Ilse doet onderzoek naar de erfelijkheid van intelligentie. Ze vindt een verband tussen het IQ van ouders en kinderen, maar het blijkt geen direct verband te zijn. IQ van de ouders heeft invloed op blootstelling aan educatief materiaal in de opvoeding, wat op zijn beurt invloed heeft op het IQ van het kind. Van welk soort relatie spreek je hier? Meer antwoorden zijn mogelijk:

Onecht verband (spurious association)
Kettingverband (chain relationship)
Multipele oorzaken
Onderdrukkende variabelen (suppressor variables)
Statistische interactie
Mediatie
Moderatie

Vraag 3

In de sociale wetenschappen is het belangrijk om controlevariabelen te gebruiken. Te veel controlevariabelen zijn echter ook niet wenselijk. Waarom?

Vraag 4

Uit een sociaal-psychologisch onderzoek blijkt dat de hoeveelheid vrienden van een individu samenhangt met geluksgevoel. Dit verband is echter afhankelijk van persoonlijkheid: voor introverte personen geldt het verband niet zo sterk als voor extraverte personen. Van wat voor soort relatie spreek je hier?

Onecht verband (spurious association)
Kettingverband (chain relationship)
Multipele oorzaken
Onderdrukkende variabelen (suppressor variables)
Statistische interactie

Vraag 5

Wat is Simpson’s paradox?

Hoe wordt een multipele regressie geanalyseerd? - Tentamens 11

Vraag 1

Welke vraag kun je niet met multipele regressie beantwoorden?

Je wilt weten wat de invloed is van leeftijd, EQ en sociaal-economische status op alcoholgebruik.
Je wilt weten of de relatie tussen geslacht en carrièresucces significant blijft als je corrigeert voor opleidingsniveau.
Je wilt weten of er een verschil is in acceptatie van het homohuwelijk tussen verschillende culturele groepen.

Vraag 2

Hoe interpreteer je R2 in een multipele regressieanalyse?

Vraag 3

Welke analyse gebruik je als er sprake is van interactie tussen verschillende verklarende variabelen?

Pearsons correlatie
Partiële correlatie
Cross-products
Bivariate correlatie

Vraag 4

Wat is multicollineariteit?

Vraag 5

Met welk type correlatie kun je controleren voor extra variabelen?

Partiële correlatie
Bivariate correlatie
Multipele correlatie
Pearsons correlatie

Vraag 6

Wat is het verschil tussen de pearson correlatie en de multipele correlatie R?

Vraag 7

Voor twee modellen berekenen we de adjusted R2 : Model 1 heeft een adjusted R2 van 0.788 en model 2 van 0.793. Welke model is het betere model op basis van deze waarden?

Vraag 8

Multicollinariteit zorgt voor een hogere/lagere R2 waarde en is wel/niet goed wan-neer men de interactie tussen variabelen wil begrijpen.

hogere, wel
hogere, niet
lagere, wel
lagere, niet

Hoe werkt ANOVA? - Tentamens 12

Vraag 1

Voor welk type variabele kun je ANOVA gebruiken?

Een categorische verklarende variabele
Een categorische responsvariabele
Een kwantitatieve verklarende variabele
Een kwantitatieve respons variabele

Vraag 2

Wat gebeurt er met de F-statistiek als het verschil tussen groepen in ANOVA kleiner wordt?

Vraag 3

Welke analyse gebruik je als je meerdere categorische verklarende variabelen hebt?

Eenweg-ANOVA
Tweeweg-ANOVA
Multipele regressie
Pearsons correlatie

Vraag 4

Welke methode gebruik je om meerdere vergelijkingen te maken met nauwe betrouwbaarheidsintervallen?

Greenhouse-Geisser
Bonferroni
Mauchly
Tukey

Vraag 5

In een ziekenhuis worden begeleidingstrajecten aangeboden voor mensen met chronische pijn. De effectiviteit van deze begeleidingstrajecten wordt onderzocht door drie condities met elkaar te vergelijken. Hieronder vind je de gemiddelde resultaten van de drie groepen. Is er sprake van significante verschillen?

Conditie 1 (n = 6) Conditie 2 (n = 4) Conditie 3 (n = 4)

M = 12 M = 10 M = 20

SS = 14 SS = 9 SS = 10

Vraag 6

Wat zijn de drie aannames voor het uitvoeren van een ANOVA?

Hoe werkt multipele regressie met zowel kwantitatieve als categorische predictoren? - Tentamens 13

Vraag 1

Wat is er bijzonder aan covariantieanalyse?

Er worden zowel kwantitatieve als categorische predictoren geanalyseerd
Er is sprake van een categorische responsvariabele
Er wordt gecontroleerd voor een variabele

Vraag 2

Hoe test je of een covariantiemodel beter past dan een andere regressielijn?

Met een controlevariabele
Met een gereduceerd model
Met een test voor multicollineariteit
Met een test voor heteroskedasticiteit

Vraag 3

Wat weet je over de hellingscoëfficiënten van de kruisproducten wanneer er sprake is van interactie?

Vraag 4

In het model E(y) = α + βx + β1z1 + β2z2 worden er categorische dummyvariabelen gebruikt. Hoeveel categorieën zijn er?

Vraag 5

Er wordt een F-test gedaan om te beoordelen of een compleet model beter is of een gereduceerd model. Het complete model is E(y) = α + βx + β1z1 + β2z2 en het gereduceerde model is E(y) = α + βx. De P-waarde is 0,00003 en er wordt gekozen voor het complete model. Wat was de nulhypothese?

H0 : α = 0
H0 : β = 0
H0 : β1 = β2 = 0
H0 : z1 = z2 = 0

Hoe construeer je een model voor multipele regressie van extreme of sterk gecorreleerde data? - Tentamens 14

Vraag 1

Welke vorm moet een functie hebben om te voldoen aan de assumpties van regressie?

Vraag 2

Jonathan doet onderzoek naar de duurzaamheid van chocolade en kijkt of het land van herkomst, de grootte van de cacaoplantage en de locatie van de fabriek toegevoegde waarde hebben voor een regressiemodel door ieder van de drie variabelen één voor één toe te voegen. Welke selectiemethode gebruikt hij?

Vraag 3

Carolien wil weten of het aantal historische monumenten en het aantal musea in een stad samenhangen met het aantal toeristen dat de stad bezoekt. Eerder had ze gedacht dat de gemiddelde prijs van vliegtickets en het aantal uren zon invloed hebben op het toerisme. Daarom voegt ze aan haar regressie nu de nieuwe variabelen toe en verwijdert ze de oude. Welke selectiemethode gebruikt Carolien?

Vraag 4

Hoe interpreteer je R2 bij polynomiale regressie?

Vraag 5

Wat weet je over de vorm van de functie als x2 positief is?

Het is een bergparabool
Het is een dalparabool
Het is een negatieve lineaire functie
Het is een exponentiële functie

Hoe werkt logistische regressie? - Tentamens 15

Vraag 1

Wat test je met logistische regressie?

Vraag 2

Vanaf welke waarde van een gestandaardiseerd residu past een model niet bij de data?

Vraag 3

Wat voor soort verdeling heeft de Wald statistiek?

Een F-distributie
Een chi-kwadraatdistributie
Een normale verdeling
Een t-distributie

Vraag 4

Wat is de belangrijkste assumptie in het proportional odds model?

Vraag 5

Bij logistische regressie is er enkel een verband tussen X en de:

de odds.
de kans om bij groep 1 te horen.
de log(odds) (logit).
de odds ratio

Antwoordindicatie

Antwoorden hoofdstuk 1

A
Beschrijvende statistiek wordt gebruikt om data samen te vatten. De beschrijvende statistiek heeft betrekking op de hele populatie. De beschrijvende data wordt eerst besproken in een wetenschappelijk artikel om een beeld te krijgen van de gegevens. Inferentieel statistiek wordt gebruikt om voorspellingen te doen en om de opgestelde hypotheses te testen. Beschrijvende statistiek en inferentieel statistiek staan tegenover elkaar.
De populatie: jongeren
Steekproef: de geselecteerde deelnemers op middelbare scholen
Beschrijvende statistiek. Als ze met haar onderzoek voorspellingen zou doen over de uitgaven van gezinnen in het huidige jaar, dan zou het inferentiële statistiek zijn.
De verdeling mannelijke/vrouwelijke ondernemers is beschrijvend, evenals het percentage ondernemers in beide groepen dat bovengemiddelde stress rapporteert. De voorspelling over burn-outklachten is inferentieel.
Inferentiële statistiek. Deze methode gaat ervan uit dat de onafhankelijke variabele effect heeft gehad, wanneer het verschil tussen de gemiddelden van de condities groter is dan dat we zouden verwachten op basis van alleen toeval. We vergelijken daarom de groepsgemiddelden die we gevonden hebben met de groepsgemiddelden die we verwachtten te vinden als er alleen sprake zou zijn van errorvariantie. Deze methode geeft helaas geen zekerheid. We kunnen alleen de kans vaststellen dat de verschillen in groepsgemiddelden het gevolg zijn van errorvariantie.
Een parameter staat voor een waarde die de populatie beschrijft. Denk hierbij aan de gemiddelde schoolprestatie in de populatie. Een statistiek beschrijft, in tegenstelling tot een parameter, gegevens over een steekproef. Meestal wordt gebruik gemaakt van een kanssteekproef.

Antwoorden hoofdstuk 2

Een variabele is discreet wanneer de mogelijke waarden alleen bepaalde, afzonderlijke nummers zijn. Een variabele is continu wanneer de waarden alle mogelijke waarden kunnen aannemen.
B
A
Sampling bias, response bias en nonresponse bias
A en D
D
B: Een ordinale schaal bestaat uit een set van categorieën die in een duidelijke volgorde georganiseerd zijn. Je kunt deelnemers aan een zangwedstrijd bijvoorbeeld op volgorde zetten van beste tot slechtste op basis van het applaus dat ze ontvangen. We kunnen echter niet perfect beoordelen hoeveel meer applaus de ene zanger dan de andere heeft ontvangen.
De afhankelijke variabele is de variabele waarover een voorspelling wordt gedaan. Er wordt een voorspelling gedaan over de afhankelijke variabele. De afhankelijke variabele wordt ook wel de uitkomst genoemd. De onafhankelijke variabele wordt gebruikt om een voorspelling op te baseren. Dit is de predictor. Een onderzoeker verwacht dat de onafhankelijke variabele invloed heeft op de afhankelijke variabele.

Antwoorden hoofdstuk 3

C
A
Het verschil tussen het eerste en derde kwartiel
Standaarddeviatie
Gemiddelde cijfer = 7.3 Standaarddeviatie = 0.01

Antwoorden hoofdstuk 4

0.94 x 0.60 = 0.564 = 56,4%
A
z = (100-120) / 15 = 1,33
10: de wortel van 1500 = 0,26
Normaalverdeeld

Antwoorden hoofdstuk 5

C
Se = $http://latex.codecogs.com/gif.latex?\sqrt%7b\frac%7b(0.79)(0.21)%7d%7b1200%7d%7d$ = 0.012. Dit is de standaardfout. 0.012 x 1.96 = 0.02. Het 95% betrouwbaarheidsinterval is 0.79 ± 0.02, dus 77 tot 81% in de bevolking bestelt weleens producten online.Se = = 0.012. Dit is de standaardfout. 0.012 x 1.96 = 0.02. Het 95% betrouwbaarheidsinterval is 0.79 ± 0.02, dus 77 tot 81% in de bevolking bestelt weleens producten online.
Se = $http://latex.codecogs.com/gif.latex?\sqrt%7b\frac%7b(0.56)(0.44)%7d%7b500%7d%7d$ = 0.022. Dit is de standaardfout. 0.022 x 2.58 = 0.06. Het 99% betrouwbaarheidsinterval voor het percentage jongeren dat voor het vuurwerkverbod is, is 0.56 ± 0.06, dus 50 tot 62% van de totale populatie is voor.
Door een grotere steekproef te gebruiken.
Se = $http://latex.codecogs.com/gif.latex?\sqrt%7b\frac%7b(0.36)(0.64)%7d%7b883%7d%7d$ = 0.016
Het significantieniveau is 0.0125
113.12 ≤ gemiddelde ≤ 124.88
38%

Antwoorden hoofdstuk 6

Voor een gemiddelde
De binomiale distributie
Een type 1 fout betekent dat de nulhypothese wordt verworpen, terwijl deze waar is.
C
B. Ook al zou het interessant zijn om te zien of vrouwen minder praten dan mannen, de alternatieve hypothese is hier letterlijk dat vrouwen meer praten dan mannen. Bij de andere gevallen is het onderzoek meer open en gaat het om een verandering, daarbij is niet gespecificeerd welke richting de verandering kan nemen.
0.99
Nee, P > 0.05

Antwoorden hoofdstuk 7

B
B
De Wilcoxon test
Als je gepaarde proporties wilt vergelijken.
Een verschil dat statistisch significant is, kan in de praktijk zo klein zijn dat er geen merkbaar verschil is. Een verschil dat in de praktijk merkbaar is, is praktisch significant.

Antwoorden hoofdstuk 8

C
In welke mate geobserveerde frequenties overeenkomen met verwachte frequenties.
B
Verwachte frequenties zijn:

	Blauw	Rood	Geel	Totaal
Jongens	360	32	8	400
Meisjes	540	48	12	600
Totaal	900	80	20	1000

X² = 83.44. Er is een significant verschil in lievelingskleur tussen jongens en meisjes.
Hij moet 4 vrijheidsgraden toetsen.
De variabele geslacht heeft twee klassen namelijk man en vrouw. De variabele blowen heeft er ook twee: wel blowen en niet blowen. Het aantal vrijheidsgraden is dan (2 - 1) x (2 - 1) = 1. Anders gezegd: er zijn vier mogelijke combinaties met de 2 x 2 klassen: vrouw en blowen, vrouw en niet blowen, man en blowen, en man en niet blowen. Als je de aantallen in een van de vier klassen kent, dan liggen de aantallen in de overige drie klassen vast, omdat je weet hoe groot de aantallen mannen en vrouwen zijn die je voor je toets hebt ondervraagd. Vandaar is het aantal vrijheidsgraden 1.
2.899. Chi2 = (40-46)2/46 + (52-46)2/46 + (60-54)2/54 + (48-54)2/54
Chi2 = 36/46 + 36/46 + 36/54 + 36/54 = .782 + .782 + .667 + 667 = 2.889
9.20

Antwoorden hoofdstuk 9

B
De regressie wordt onevenredig beïnvloed door de uitschieter, waardoor de andere waarden grotere residuen krijgen.
A
R-kwadraat ofwel de determinatiecoëfficiënt. Dit is de meting van hoe goed de kleinste-kwadratenlijn ŷ = a + b(x) de y voorspelt in vergelijking tot de voorspelling van ȳ. De r2 geeft aan hoeveel procent de variantie van een conditionele distributie groter of kleiner is dan de variantie van een marginale distributie. In het kort, r2 meet hoe goed x de y voorspelt.
Buiten het bereik van de geobserveerde data kan de vorm van de lijn anders lopen dan lineair, dus hier kunnen geen uitspraken over gedaan worden met extrapoleren.
Dit houdt in dat het een gemiddelde correlatie is.
De drie eigenschappen zijn 1) de richting van een relatie, 2) de vorm van een relatie en 3) de mate van een relatie.

Antwoorden hoofdstuk 10

Een andere oorzaak kan niet uitgesloten worden, dus er kan niet met zekerheid gesproken worden van een causaal verband.
Zowel B als F zijn goed
Wanneer je veel controlevariabelen gebruikt, moet je de steekproef over veel verschillende categorieën verdelen, waardoor de steekproefgrootte per categorie erg klein wordt.
E
Simpson’s paradox houdt in dat de richting van een verband verandert wanneer een controlevariabele wordt toegevoegd.

Antwoorden hoofdstuk 11

C
R2 geeft aan hoeveel de verklaarde variantie toeneemt als gevolg van een toegevoegde variabele. Hoe groter R2 is, hoe beter de verklarende variabelen y voorspellen.
C
Multicollineariteit houdt in dat de verschillende verklarende variabelen onderling sterk correleren, waardoor ze minder verklaarde variantie toevoegen.
A
Het verschil is dat de multipele correlatie altijd een waarde heeft tussen de 0 en 1. Deze correlatie kan dus niet negatief zijn. De pearson correlatie kan van -1 tot 1 lopen.
Model 2, want die heeft een hogere R2, wat wijst om meer verklaarde variantie. Adjusted R2 is de multiple R2 plus een “straf” voor de complexiteit van het model. We zoeken modellen die het beste de data verklaren met het minst aantal verklarende variabele (simpleste model) en dat is wat de adjusted Rˆ2 doet; deze maat heeft een voorkeur voor eenvoudigere modellen. We kiezen hier dus voor model 2 omdat de grotere adjusted Rˆ2 een betere balance representeert tussen de grootte van de variantie van de rest-term en de complexiteit van het model. De adjusted Rˆ2 wordt gegeven door. AdjustedR2 =1− RSS/(n−d−1) TSS/(n−1) Met RSS de residual sum of squares en TSS de total sum of squares (sum of squares van de response variabele) Als het aantal verklarende variabele d toeneemt wordt de breuk groter en de Adjusted R2 kleiner, d is dus de straf die wordt opgelegd voor meer complexe modellen.
B

Antwoorden hoofdstuk 12

A
F wordt kleiner.
B
D
F(2, 11) = 11.5 / 3 = 3.83. Er is bij een alfaniveau van .05 geen sprake van significante verschillen.
De drie aannames zijn: 1) homogeniteit van varianties, 2) normale verdeling van de error en 3) onafhankelijke scores

Antwoorden hoofdstuk 13

C
B
B
C
C is de beste manier om deze nulhypothese op te schrijven, D komt op hetzelfde neer.

Antwoorden hoofdstuk 14

Een lineaire functie
Forward selection
Stepwise regression
Bij polynomiale modellen verwijst R² niet naar de sterkte van het verband, maar naar de vermindering van schattingsfouten.
A

Antwoorden hoofdstuk 15

Logistische regressie test of de kans van iedere categorie van een binaire responsvariabele afhankelijk is van de verklarende variabele.
Ongeveer 3
B
Dat het effect van de verklarende variabele x gelijk is voor iedere cumulatieve proportie.
C

Access:

Public

Join WorldSupporter!

Join with a free account for more service, or become a member for full access to exclusives and extra support of WorldSupporter >>

This content is related to:

Statistical Methods for the Social Sciences van Agresti, 5e druk

3356 reads

Going abroad?

Insure your way around the world

International expat insurances

Travel & Worldsupporter insurances (NL)

Study with summaries

Associate with your Field of Study

Search Summaries or Notes&

Start using Summaries

Add a Summary

Contributions: posts

Help other WorldSupporters with additions, improvements and tips

Add new contribution

Spotlight: topics

Check how to use summaries on WorldSupporter.org

Online access to all summaries, study notes en practice exams
How and why use WorldSupporter.org for your summaries and study assistance?
Using and finding summaries, notes and practice exams on JoHo WorldSupporter
Quicklinks to fields of study for summaries and study assistance

Online access to all summaries, study notes en practice exams

Check out: Register with JoHo WorldSupporter: starting page (EN)
Check out: Aanmelden bij JoHo WorldSupporter - startpagina (NL)

How and why use WorldSupporter.org for your summaries and study assistance?

For free use of many of the summaries and study aids provided or collected by your fellow students.
For free use of many of the lecture and study group notes, exam questions and practice questions.
For use of all exclusive summaries and study assistance for those who are member with JoHo WorldSupporter with online access
For compiling your own materials and contributions with relevant study help
For sharing and finding relevant and interesting summaries, documents, notes, blogs, tips, videos, discussions, activities, recipes, side jobs and more.

Using and finding summaries, notes and practice exams on JoHo WorldSupporter

There are several ways to navigate the large amount of summaries, study notes en practice exams on JoHo WorldSupporter.

Use the summaries home pages for your study or field of study
Use the check and search pages for summaries and study aids by field of study, subject or faculty
Use and follow your (study) organization
- by using your own student organization as a starting point, and continuing to follow it, easily discover which study materials are relevant to you
- this option is only available through partner organizations
Check or follow authors or other WorldSupporters
Use the menu above each page to go to the main theme pages for summaries
- Theme pages can be found for international studies as well as Dutch studies

Do you want to share your summaries with JoHo WorldSupporter and its visitors?

Check out: Why and how to add a WorldSupporter contributions
JoHo members: JoHo WorldSupporter members can share content directly and have access to all content: Join JoHo and become a JoHo member
Non-members: When you are not a member you do not have full access, but if you want to share your own content with others you can fill out the contact form

Quicklinks to fields of study for summaries and study assistance

Main summaries home pages:

Main study fields:

Business organization and economics, Communication & Marketing, Education & Pedagogic Sciences, International Relations and Politics, IT and Technology, Law & Administration, Medicine & Health Care, Nature & Environmental Sciences, Psychology and behavioral sciences, Science and academic Research, Society & Culture, Tourisme & Sports

Main study fields NL:

Studies: Bedrijfskunde en economie, communicatie en marketing, geneeskunde en gezondheidszorg, internationale studies en betrekkingen, IT, Logistiek en technologie, maatschappij, cultuur en sociale studies, pedagogiek en onderwijskunde, rechten en bestuurskunde, statistiek, onderzoeksmethoden en SPSS
Studie instellingen: Maatschappij: ISW in Utrecht - Pedagogiek: Groningen, Leiden , Utrecht - Psychologie: Amsterdam, Leiden, Nijmegen, Twente, Utrecht - Recht: Arresten en jurisprudentie, Groningen, Leiden

WorldSupporter: what are the features, functionalities and rules on WorldSupporter.org?

WorldSupporter NL: hoe vind je samenvattingen en studiehulp op WorldSupporter.org en JoHo.org

Summaries and Study Assistance - Start

Submenu: Summaries & Activities

Follow the author: Psychology Supporter

Psychology Supporter

Work for WorldSupporter

JoHo can really use your help! Check out the various student jobs here that match your studies, improve your competencies, strengthen your CV and contribute to a more tolerant world

Working for JoHo as a student in Leyden

Parttime werken voor JoHo

Statistics

2653

Search a summary, study help or student organization

Select any filter and click on Search to see results