Statistical Methods for the Social Sciences van Agresti, 5e druk
- 3356 reads
Welk soort data beschrijft de populatie?
Wat is het verschil tussen beschrijvende en inferentiële statistiek?
Lydia doet onderzoek naar de invloed van kauwgum kauwen op concentratie bij jongeren. Ze selecteert deelnemers op verschillende middelbare scholen om mee te doen aan haar experiment. Wat is hier de populatie en wat is de steekproef?
Myrthe kijkt naar de jaarlijkse uitgaven van gezinnen in verschillende regio’s in Nederland over de periode 1980 tot afgelopen jaar. Gebruikt zij inferentieel of beschrijvende statistiek?
Een arbeidspsycholoog doet onderzoek naar werkstress bij startende ondernemers. Hij gebruikt gegevens van de Kamer van Koophandel en vindt dat 62% van de ondernemers man is, en 38% vrouw. Van de ondernemers die aan zijn onderzoek meedoen, rapporteert 73% van de vrouwen bovengemiddelde stress, tegenover 45% van de mannen. Hij voorspelt dat vrouwelijke ondernemers vaker last zullen krijgen van burn-outklachten. Welk deel in het onderzoek is beschrijvende statistiek, en welk deel is inferentieel?
Hoe wordt de vorm van statistiek genoemd die zich bezig houdt met het trekken van conclusies?
Wat is het verschil tussen een parameter en een statistiek?
Wat is het verschil tussen een continue en een discrete variabele?
In een demografische vragenlijst wordt naar opleidingsniveau gevraagd, waarbij de antwoordopties zijn: basisschool, voortgezet onderwijs, middelbaar onderwijs en hoger onderwijs. Wat voor soort variabele is ‘opleidingsniveau’ in dit geval?
Joost doet een opiniepeiling onder studenten en trekt een steekproef op iedere universiteit in Nederland. Wat voor soort steekproeftrekking is dit?
Noem de drie typen bias die kunnen ontstaan in een steekproef.
Welke van de volgende variabelen zijn zowel discreet als kwantitatief:
Iemand beweert over een bepaalde variabele dat de score van Elise twee keer zo groot is als die van Adriaan. Welk meetniveau moet de variabele ten minste hebben om deze uitspraak te kunnen doen?
In een onderzoek wordt de variabele Intelligentie op de volgende manier gemeten:
1 = IQ lager dan 70
2 = IQ tussen 71 en 90
3 = IQ tussen 91 en 110
4 = IQ tussen 111 en 120
5 = IQ hoger dan 120
Welk meetniveau heeft deze variabele?
Wat is het verschil tussen een onafhankelijke en een afhankelijke variabele? Beschrijf beide begrippen?
Welke centrummaat kun je gebruiken voor categorische variabelen?
Welke weergave kan worden gebruikt om de observaties van een kwantitatieve variabele in kaart te brengen?
Wat wordt bedoeld met het begrip de interkwartielafstand?
Welke maat beschrijft de typische afstand tot het gemiddelde in een distributie?
Mireille heeft in haar eerste studiejaar 8 vakken gevolgd en met succes afgerond. Hieronder zie je de eindresultaten van haar tentamens. Wat is haar gemiddelde cijfer en wat is de standaarddeviatie?
Inleiding in de psychologie: 8.8
Statistiek en methoden 1: 7.2
Hersenen en gedrag: 7.0
Ontwikkelingspsychologie: 7.4
Sociale psychologie: 6.4
Statistiek en methoden 2: 6.8
Psychopathologie 1: 7.8
Toegepaste psychologie: 7.1
Stel dat 94% van de Nederlandse bevolking Sinterklaas viert met cadeaus en 60% geeft cadeaus met Kerstmis. Hoe groot is de kans dat iemand zowel Sinterklaas als Kerst viert met cadeaus?
Hoe kan de kansverdeling van een discrete variabele het beste worden weergegeven?
De IQ-distributie heeft een gemiddelde van 100 en een standaarddeviatie van 15. Wat is de z-score van iemand met een IQ van 120?
Stel, er wordt een onderzoek gedaan naar het aantal keren dat fietsers in Utrecht per dag een stoplicht passeren. De steekproef bestaat uit 700 mannelijke fietsers en 800 vrouwelijke fietsers. Het gemiddelde is 20 en de standaarddeviatie is 10. Wat is de standaardfout?
De verdeling van inkomens in India is rechtsscheef. Hoe ziet een steekproefverdeling eruit volgens de centrale limiettheorie als er een grote steekproef wordt gebruikt?
Hoe wordt de waarde die het meest consistent is met de geobserveerde data genoemd?
In een marktonderzoek naar online winkelgedrag zegt 79% van een steekproef van 1200 personen regelmatig online producten te bestellen. Bereken het 95% betrouwbaarheidsinterval.
In een onderzoek naar de houding van jongeren tegenover het vuurwerkverbod wordt een steekproef gedaan. In de steekproef van 500 middelbare scholieren is 56% voor en 44% tegen. Bereken het 99% betrouwbaarheidsinterval.
Hoe kun je het betrouwbaarheidsinterval verkleinen?
Een vrouwenblad plaatst een poll met de stelling ‘Mijn vriendinnen gaan voor mijn familie’. 883 lezeressen nemen deel aan de poll. Wat is de geschatte standaardfout als 36% het eens is?
Een onderzoeker wil onderzoeken of het gemiddelde IQ van personen met een smal hoofd (mu smal) groter is dan 100. De nulhypothese wordt verworpen vanaf een gemiddelde van 107.5. Het is bekend dat de IQ scores in de populatie normaal verdeeld zijn met standaarddeviatie 15; dit geldt zowel onder de nulhypothese als onder de alternatieve hypothese. De onderzoeker heeft de beschikking over een aselecte steekproef (SRS) van n = 20 personen uit de populatie personen met een smal hoofd. Het gemiddelde IQ in de steekproef was gelijk aan 91.
Welk significantieniveau heeft de onderzoeker hier gebruikt?
Een beroepskeuzebureau hanteert een genormeerde IQ-test voor HAVO leerlingen uit de hoogste klas. Deze test heeft een variantie van 225. De scores die hiermee verkregen worden, zijn normaal verdeeld. Een steekproef van 25 leerlingen uit de groep die zich bij dit bureau voor advies heeft aangemeld, scoort op deze test gemiddeld 119. Wat is het 95% betrouwbaarheidsinterval van het populatiegemiddelde?
We berekenen het gemiddelde cijfer voor het vak Inleiding in de psychologie. Dit gemiddelde bedraagt 6.5 met een standaarddeviatie van 1.67. We nemen aan dat de cijfers normaal zijn verdeeld. Hoeveel procent van de leerlingen heeft een 7 of ho-ger behaald?
Gebruik je de t-distributie bij een significantietoets voor een gemiddelde of voor een proportie?
Welke distributie wordt gebruikt voor proporties in een hele kleine steekproef?
Wat betekent een type 1 fout?
Martijn wil weten of slaapproblemen verminderd kunnen worden met iedere dag een kwartier lichaamsbeweging. Hij heeft een onderzoek gedaan waaruit blijkt dat er waarschijnlijk een positief effect is, maar om een gegronde uitspraak te kunnen doen, wil hij de power van zijn toets vergroten. Wat kan hij het beste doen?
In welk van onderstaande gevallen kun je éénzijdig toetsen?
De scores van een bepaalde variabele zijn in de populatie normaal verdeeld met een standaarddeviatie van 12. Stel er wordt rechtseenzijdig getoetst met de nulhy-pothese dat het populatiegemiddelde gelijk is aan 80. Bekend is dat de nulhypothe-se verworpen wordt vanaf een steekproefgemiddelde van 82.5. Wat zal de power zijn wanneer het populatiegemiddelde 86 zou zijn?
Voor een steekproef van 134 studenten is de affiniteit met vlees eten onderzocht. Aan de helft werd voorafgaande aan het onderzoek filmpjes getoond over hoe vlees wordt gemaakt. De andere helft keek naar een comedy film. De volgende gegevens zijn bekend: Het gemiddelde de eerste groep is 4.78 met een standaard-deviatie van 1.61.Het gemiddelde van de tweede groep bedraagt 4.54 met een standaarddeviatie van 1.56. Voer de geschikte t-toets uit op deze gegevens. Kun je de nulhypothese verwerpen wanneer je eenzijdig toetst met α = 0.05?
Myrthe doet onderzoek naar de kans op delirium bij chronisch alcoholgebruik. Ze vraagt participanten bij een verslavingszorginstituut op meerdere momenten deel te nemen. Wat voor soort onderzoeksdesign gebruikt ze?
Peter doet onderzoek naar verschillende behandelvormen voor een eerste psychose. Hij vergelijkt de effecten van sociale vaardigheidstraining en cognitieve gedragstherapie. De eerste groep krijgt eerst 10 sessies sociale vaardigheidstraining en daarna 10 sessies cognitieve gedragstherapie, bij de tweede groep is de volgorde omgekeerd. Welke toets kan hij het beste gebruiken?
Welke nonparametrische test kun je gebruiken als je ordinale data gebruikt?
Wanneer gebruik je McNemar’s test?
Wat is het verschil tussen statistische significantie en praktische significantie?
Wat voor soort verdeling gebruik je als je percentages op basis van de totale groep weergeeft?
Wat meet je met de chi-kwadraattest van onafhankelijkheid?
Hoe interpreteer je de chi-kwadraattest? De hypothesen zijn: H0: de variabelen zijn statistisch onafhankelijk, Ha: de variabelen zijn statistisch afhankelijk.
In de onderstaande tabel zie je de geobserveerde frequenties van lievelingskleuren voor jongens en meisjes.
| Blauw | Rood | Geel | Totaal |
Jongens | 320 | 70 | 10 | 400 |
Meisjes | 580 | 10 | 10 | 600 |
Totaal | 900 | 80 | 20 | 1000 |
Bereken de verwachte frequenties.
Voer de chi-kwadraattest voor onafhankelijkheid uit voor bovenstaande data over lievelingskleuren. Wat is je conclusie?
Een onderzoeker bekijkt de samenhang tussen mate van alcoholgebruik en studieresultaat (allebei de variabelen hebben drie categorieën). De onderzoeker heeft 15 personen onderzocht en vindt een chi-kwadraat waarde van 1.3. Met hoeveel vrijheidsgraden moet hij toetsen?
Om te toetsen of er een associatie is tussen geslacht en blowen (wel of niet blowen) tel je in een groep van 75 mannen en 69 vrouwen het aantal blowers en niet-blowers. Vervolgens voer je een chi-kwadraat test uit. Wat is het aantal vrijheidsgraden?
Men wil weten of de ‘man/vrouw’-verhouding onder de werknemers van bedrijf A en B van elkaar verschillen. Op steekproefbasis stelt men vast dat de proportie man in van bedrijf A 0.40 en in bedrijf B 0.52 bedraagt. In beide gevallen zijn 100 studenten onderzocht. Toets de nulhypothese met de chikwadraattoets. Welke waarde heeft de toetsstatistiek?
Een onderzoeker gaat na of het moment van geboorte van invloed is op of iemand een professionele turner wordt. Hiervoor zijn random 220 turners geselecteerd die de afgelopen 10 jaar hebben geturnd. Het kwartaal waarin ze geboren zijn is bepaald: eerste kwartaal 62, tweede kwartaal 69, derde kwartaal40 en het vierde kwartaal 49. Toets de nulhypothese met de chi-kwadraat-toets. Wat is de waarde van de toets statistiek?
Welke waarde in een regressiefunctie is de constante waarde?
Wat is het effect van een uitschieter op een lineaire regressielijn?
Wanneer is een correlatie sterker?
Wat betekent R2 binnen de regressieanalyse?
Waarom kun je beter niet extrapoleren met een regressieanalyse?
Variabele X en Y hebben een R² van 0.15. Wat houdt dit in? Betekent dit een grote, een kleine of een gemiddelde correlatie?
Welke drie eigenschappen van de relatie tussen X en Y worden er gemeten met een correlatie?
Een atleet gebruikt sportdrank voordat hij de 100 meter sprint op een wedstrijd loopt. Hij verbreekt zijn persoonlijke record. Waarom kun je niet stellen dat er sprake is van een causaal verband tussen het gebruik van sportdrank en de verbetering van prestatie?
Ilse doet onderzoek naar de erfelijkheid van intelligentie. Ze vindt een verband tussen het IQ van ouders en kinderen, maar het blijkt geen direct verband te zijn. IQ van de ouders heeft invloed op blootstelling aan educatief materiaal in de opvoeding, wat op zijn beurt invloed heeft op het IQ van het kind. Van welk soort relatie spreek je hier? Meer antwoorden zijn mogelijk:
In de sociale wetenschappen is het belangrijk om controlevariabelen te gebruiken. Te veel controlevariabelen zijn echter ook niet wenselijk. Waarom?
Uit een sociaal-psychologisch onderzoek blijkt dat de hoeveelheid vrienden van een individu samenhangt met geluksgevoel. Dit verband is echter afhankelijk van persoonlijkheid: voor introverte personen geldt het verband niet zo sterk als voor extraverte personen. Van wat voor soort relatie spreek je hier?
Wat is Simpson’s paradox?
Welke vraag kun je niet met multipele regressie beantwoorden?
Hoe interpreteer je R2 in een multipele regressieanalyse?
Welke analyse gebruik je als er sprake is van interactie tussen verschillende verklarende variabelen?
Wat is multicollineariteit?
Met welk type correlatie kun je controleren voor extra variabelen?
Wat is het verschil tussen de pearson correlatie en de multipele correlatie R?
Voor twee modellen berekenen we de adjusted R2 : Model 1 heeft een adjusted R2 van 0.788 en model 2 van 0.793. Welke model is het betere model op basis van deze waarden?
Multicollinariteit zorgt voor een hogere/lagere R2 waarde en is wel/niet goed wan-neer men de interactie tussen variabelen wil begrijpen.
Voor welk type variabele kun je ANOVA gebruiken?
Wat gebeurt er met de F-statistiek als het verschil tussen groepen in ANOVA kleiner wordt?
Welke analyse gebruik je als je meerdere categorische verklarende variabelen hebt?
Welke methode gebruik je om meerdere vergelijkingen te maken met nauwe betrouwbaarheidsintervallen?
In een ziekenhuis worden begeleidingstrajecten aangeboden voor mensen met chronische pijn. De effectiviteit van deze begeleidingstrajecten wordt onderzocht door drie condities met elkaar te vergelijken. Hieronder vind je de gemiddelde resultaten van de drie groepen. Is er sprake van significante verschillen?
Conditie 1 (n = 6) Conditie 2 (n = 4) Conditie 3 (n = 4)
M = 12 M = 10 M = 20
SS = 14 SS = 9 SS = 10
Wat zijn de drie aannames voor het uitvoeren van een ANOVA?
Wat is er bijzonder aan covariantieanalyse?
Hoe test je of een covariantiemodel beter past dan een andere regressielijn?
Wat weet je over de hellingscoëfficiënten van de kruisproducten wanneer er sprake is van interactie?
In het model E(y) = α + βx + β1z1 + β2z2 worden er categorische dummyvariabelen gebruikt. Hoeveel categorieën zijn er?
Er wordt een F-test gedaan om te beoordelen of een compleet model beter is of een gereduceerd model. Het complete model is E(y) = α + βx + β1z1 + β2z2 en het gereduceerde model is E(y) = α + βx. De P-waarde is 0,00003 en er wordt gekozen voor het complete model. Wat was de nulhypothese?
Welke vorm moet een functie hebben om te voldoen aan de assumpties van regressie?
Jonathan doet onderzoek naar de duurzaamheid van chocolade en kijkt of het land van herkomst, de grootte van de cacaoplantage en de locatie van de fabriek toegevoegde waarde hebben voor een regressiemodel door ieder van de drie variabelen één voor één toe te voegen. Welke selectiemethode gebruikt hij?
Carolien wil weten of het aantal historische monumenten en het aantal musea in een stad samenhangen met het aantal toeristen dat de stad bezoekt. Eerder had ze gedacht dat de gemiddelde prijs van vliegtickets en het aantal uren zon invloed hebben op het toerisme. Daarom voegt ze aan haar regressie nu de nieuwe variabelen toe en verwijdert ze de oude. Welke selectiemethode gebruikt Carolien?
Hoe interpreteer je R2 bij polynomiale regressie?
Wat weet je over de vorm van de functie als x2 positief is?
Wat test je met logistische regressie?
Vanaf welke waarde van een gestandaardiseerd residu past een model niet bij de data?
Wat voor soort verdeling heeft de Wald statistiek?
Wat is de belangrijkste assumptie in het proportional odds model?
Bij logistische regressie is er enkel een verband tussen X en de:
| Blauw | Rood | Geel | Totaal |
Jongens | 360 | 32 | 8 | 400 |
Meisjes | 540 | 48 | 12 | 600 |
Totaal | 900 | 80 | 20 | 1000 |
Join with a free account for more service, or become a member for full access to exclusives and extra support of WorldSupporter >>
There are several ways to navigate the large amount of summaries, study notes en practice exams on JoHo WorldSupporter.
Do you want to share your summaries with JoHo WorldSupporter and its visitors?
Main summaries home pages:
Main study fields:
Business organization and economics, Communication & Marketing, Education & Pedagogic Sciences, International Relations and Politics, IT and Technology, Law & Administration, Medicine & Health Care, Nature & Environmental Sciences, Psychology and behavioral sciences, Science and academic Research, Society & Culture, Tourisme & Sports
Main study fields NL:
JoHo can really use your help! Check out the various student jobs here that match your studies, improve your competencies, strengthen your CV and contribute to a more tolerant world
2653 |
Add new contribution