Hoorcollege 4
In dit college:
Hypothese formuleren en schematisch toetsen dmv statistische technieken en daaruit de juiste conclusies strekken
Samenhang tussen twee variabelen beschrijven en interpreteren alsmede kunnen bepalen wanneer dit een causaal verband betreft
Tentamenvraag leerdoel 4
Een steekproef onder 53 Nederlanders over de gemiddelde lengte van een Nederlander (uitgedrukt in meters) heeft een gemiddelde van 1,75 en een variantie van 0.0025. Ga er vanuit dat de Nederlandse populatie normaal verdeeld is. Waardoor wordt een 95%-betrouwbaarheidsinterval voor µ gegeven?
Antwoord: 174
Gemiddelde lengte populatie: 1,75
Normaal verdeeld: Z-waarde
Variantie: 0.0025
Standaardafwijking: = 0,05
95% betrouwbaarheidsinterval invullen: zie de slide
Zie slides voor de berekening van een betrouwbaarheidsinterval van het populatiegemiddelde.
Testen van hypotheses: Centrale ideeën
Hypotheses: statements waar je vanuit gaat dat deze waar is. Als er genoeg bewijs is wordt deze aangenomen, anders verworpen
Nul hypothese: H0 = … (testprocedure begint met de aanname dat deze hypothese klopt)
Alternatieve hypothese: H1 = … (bij genoeg bewijs wordt deze hypothese aangenomen)
Er zijn twee mogelijkheden
Er is genoeg bewijs voor de alternatieve hypothese
Er is niet genoeg bewijs voor de alternatieve hypothese
Er zijn twee mogelijkheden foute:
Type 1: Verwerpen als H0 klopt, of
Type 2: niet verwerpen als H0 niet klopt.
Rejection region: kritiek gebied, range aan variabelen, als de test statistic hier in valt verwerpen we H0 hypothese.
Two-tailed test (tweezijdige test): Hierbij kan de nul hypothese bij kleiner en bij groter verworpen worden
One-tailed test (eenzijdige test): H1 zegt dat het gemiddelde groter is dan het gemiddelde van de nul hypothese, of H1 zegt dat het gemiddelde kleiner is dan het gemiddelde van de nul hypothese.
Doorloop de volgende 6 stappen bij het gebruik van de rejection region:
Schrijf de 0 en alternatieve hypothese op
Kies het niveau van siginicantie α (meestal 5%)
Bereken de test statistiek (T waarde) en geef de distributie van de test statistiek aan wanneer de 0 hypothese waar is.
Bereken de kritieke waarden van de rejection region
Bekijk of de teststatistiek in de kritieke waarde valt. Zo ja, verwerp de nul hypothese
Vertel dit in woorde
Z-waarde hou je uit de tabel 1, hier ga je op zoek naar 95%
Gebruik deze formule: z =
De p-waarde methode
De p-waarde van een test is de kans dat je een teststatistiek vindt die zo extreem is, is gelijk aan jou p-waarde. Een p-waarde 10% onderbouwd de alternatieve hypothese helemaal niet.
Doorloop de volgende 6 stappen bij het berekenen van de p-waarde:
Formuleer de nul en alternatieve hypothese
Kies het significantieniveau α
Bereken de test statistiek (T waarde) en geef de distributie van de test statistiek aan wanneer de 0 hypothese waar is.
Bereken de p-waarde
Bekijk of de p-waarde kleiner is dan α
Formuleer de conclusie in woorden
Betrouwbaarheidsinterval bij tweezijdige toets hanteer je als volgt:
Als het buiten betrouwbaarheidsinterval valt, verwerp je de nul hypothese ook.
De volgende 6 stappen dienen doorlopen te worden bij een hypothesis test:
Formuleer de nul en alternatieve methode
Kies het significantieniveau
Breken de test statistiek en geef de distributie van de test staistiek aan waar de nul hypothese waar is
Bereken de kritieke waardes, de rejection region, de p-waard OF de confidence interval (alleen bij een tweezijdige toets)
Bekijk of de test statistiek valt in de rejection region of bekijk of de p-waarde kleiner is dan a, of buiten de Confidence interval ligt. Zo ja, verwerp de nul hypothese.
Formuleer de conclusie in woorden.
Er zijn 3 gangbare benaderingen voor het testen van een hypothese:
Rejection region approach: bereken de rejection region en bepaal of de test statistiek in deze regio ligt
P-value approach: bereken de waarde van de test statistiek, vind de kans dat de test statistiek ten minste zo extreem is als die waarde, en vergelijk de p-waarde met a.
Confidence interval approach: Bereken de 1-a confidence interval en bepaal of het gemiddelde vna de nul hypothese in het interval valt. Dit geldt alleen bij een tweezijdige toets.
Je kunt de standaardafwijking schatten door de sample standard deviation:
Dit is een Students’s t distributie met v = n-1 als mate van vrijheid. Er zijn twee onzekere objecten, waardoor er meer informatie nodig is om een hypothese te verwerpen. Kijk in tabel 8 voor de kritieke waarden voor tn-1,a/2
Als de sample standaardafwijking bekend is in plaats van de populatiestandaardafwijking, kun je de t-test gebruiken.
Simple linear regressie analyse
In veel gevallen zijn we geïnteresseerd in de vraag of een specifieke random variabele (x) invloed heeft op een andere random variabele (Y). Dit kun je leiden uit een regressie analyse.
Elk van deze relaties kan uitgedrukt worden in een lineair model. Probabilistic model: een (kans)model waar de willekeurigheid dat deel is van een levensecht proces in berekend is.
First-Order Lineair Model
De simple lineair population regression model is een model met een rechte lijn met één onafhankelijke variabele
Waar:
Y = afhankelijke variabele (interval variabele)
X = onafhankelijke variabele (interval variabele)
β0 = y-intercept
β1 = slope of the line
E = error variabele (random variabele)
De restfactoren zijn normaal verdeeld met een gemiddelde van 0 en een variantie.
Schatten van de coefficienten
Het doel is om de relatie tussen de onafhankelijke en afhankelijke variabele X en Y te analyseren. Hiervoor moeten we β0 en β1 schatten.
- for free to follow other supporters, see more content and use the tools
- for a small donation by becoming a member to see all content
Why create an account?
- Your WorldSupporter account gives you access to all functionalities of the platform
- Once you are logged in, you can:
- Save pages to your favorites
- Give feedback or share contributions
- participate in discussions
- share your own contributions through the 11 WorldSupporter tools
Add new contribution