Maak eerst een grafische weergave van je variabele (bijvoorbeeld een histogram). Kijk naar de grafische weergave naar de verdeling en eventuele afwijkende variabele. Geef vervolgens een numerieke beschrijving van de verdeling (in een tabel bijvoorbeeld). Fit vervolgens een dichtheidscurve.
Dichtheidscurve
Een dichtheidscurve is de ideale benadering van je empirische verdeling; het vormt om je verdeling een gladde curve. Als deze curve overeenkomt met de daadwerkelijke verdeling kan je deze gebruiken om waarden af te lezen en berekeningen te maken. Je kunt een dichtheidscurve toepassen bij een interval meetniveau of hoger. De parameters van een dichtheidscurve zijn het gemiddelde (µ) en de standaardafwijking (σ). De dichtheidscurve toont de relatieve frequentie als oppervlakte. Het gedeelte onder de lijn van de curve is de oppervlakte. De totale oppervlakte van de curve is 1; dit is 100% en dat komt omdat alle waardes binnen de curve liggen. De curve ligt altijd op of boven de x-as. Dit komt omdat de y-as frequenties aangeeft. Al zou de curve onder de x-as liggen betekent dit dat de curve een negatieve y-waarde heeft en dit kan niet, je kan namelijk geen -1 of -2 frequentie hebben, 0 is het minimum. Een dichtheidscurve kan een staart naar links hebben (negative skew) als er veel hoge waardes zijn of een (positive skew) als er veel lage waardes zijn (zie sheet 5).
Eigenschappen van een normale verdeling.
Een normale verdeling is klokvormig en symmetrisch. Symmetrisch wilt zeggen dat de vorm van een perfecte normaalverdeling links en rechts van het gemiddelde hetzelfde is. De normale verdeling wordt bepaald door de parameters σ en µ. µ geeft de horizontale locatie en is precies in het midden van een perfecte normaalverdeling. Let op het gemiddelde zit vaak niet precies in het midden, omdat de meeste verdeling niet perfect symmetrisch zijn. De σ geeft het buigpunt van de verdeling aan. Op dit punt verandert de richting waar de normaalverdeling heenbuigt. Als er een hoge waarde van σ is zal de verdeling breder en lager zijn. Bij een lage waarde van σ zal de verdeling smaller en hoger zijn. Op sheet 6 kun je alle eigenschappen van een normale verdeling in een figuur zien. Op sheet 5 kun je voorbeelden van verschillende breedtes en hoogtes van verdelingen zien (laptokurtic, normaal en platykurtic).
Waarom is een normale verdeling belangrijk?
Een normale verdeling is een model maar ook een norm. Er zijn drie redenen waarom een normale verdeling een norm is:
biedt de mogelijkheid tot verschillende berekeningen
belangrijke aanname voor veel statistische toetsen
Verdeling van steekproefgemiddelden (hier wordt verder op ingegaan bij het vak Toetsende Statistiek)
Standaardscores (z-scores) berekenen
Een normaalverdeling wordt bepaald door het gemiddelde en de standaarddeviatie. Omdat je oneindig veel combinaties van waarden voor het gemiddelde en de standaarddeviatie kunt hebben betekent het dat je ook een oneindig veel verschillende normaal verdelingen kunt tekenen. Met behulp van een tabel kan je met een normaalverdeling berekeningen maken hoeveel procent van de scores tussen twee grenzen of boven of onder een grens valt. Dit geeft ook een indicatie voor de kans dat iemand van een populatie binnen twee of onder of boven een grens valt. Als 20% van de scores tussen twee grenzen vallen is ook de kans dat iemand uit die populatie tussen die twee grenzen valt 20%.Voor elke verschillende gemiddeldes en standaarddeviaties (en dus ook een andere normale verdeling) heb je een tabel met andere waardes nodig om berekeningen te maken. Omdat er oneindig veel combinaties gemiddeldes en standaarddeviaties zijn, is het handig om je gemiddelde en standaarddeviatie om te rekenen naar een standaardscore. Voor deze standaardscore is al een tabel gemaakt (die achter in met boek van Howell staat: appendix z of op collegesheet 14 en 22). Deze standaardscore heeft altijd een gemiddelde van 0 en een standaarddeviatie van 1. Deze scores worden ook wel z-scores genoemd en je kunt ze berekenen per x-waarde. De formule voor een z-score is:
Z = (x- µ)/σ
Je kunt ook een x-score berekenen als je de z-score, de standaarddeviatie en het gemiddelde weet. De formule hiervoor is:
X = µ+zσ
De z-scores staan op de x-as van een gestandaardiseerde verdeling. Met behulp met appendix z achter in het boek van Howell of met de tabel op sheet 17 en 19 kun je bepalen wat voor oppervlakte er links, rechts of tussen twee grenzen ligt. Deze oppervlakte heeft een relatieve frequentie. Links van de tabellen van sheet 17 en 19 staat een rij (de verticale)met scores. Dit is de z-score afgerond op 1 decimaal. De horizontale rij geeft de tweede decimaal achter de komma aan. Op deze manier kun je verschillende waardes uitrekenen. Bijvoorbeeld de cumulatieve waarde van het gebied links van een z-score en rechts van een z-score. Door de cumulatieve relatieve waarde links van een lagere z-score van de cumulatieve relatieve waarde recht van een z-score af te trekken kun je de cumulatieve relatieve waarde tussen de twee punten uitrekenen. Op sheet 13 en 21 kun je voorbeelden van sommen zien die je met de normale verdeling en de tabel kunt maken.
Dus:
standaardiseren geeft een gemiddelde van 0 en een standaarddeviatie van 1.
als de waardes van de verdeling voor het standaardiseren een normale verdeling waren zijn ze het na het standaardiseren ook. Je kunt een niet-normale verdeling niet normaal maken door ze te standaardiseren; de verdeling blijft namelijk hetzelfde.
Het gemiddelde verschuift met afstand µ; dit kun je ook zien omdat je van elke x score µ aftrekt. Als je dat bij elke score doet en je zou dat bij elkaar optellen kom je op 0 uit.
De standaardafwijking verandert met 1/σ. Al was je standaardafwijking eerst 15 en het is nu 1 (bij het standaardiseren maak je de standaardafwijking 1) dan is het 0.07% van wat het eerst was.
De 68 – 95 – 99.7% regel
Een handige vuistregel is dat bij elke normale verdeling ongeveer 68% van de scores tussen -1σ en 1σ ligt, ongeveer 95% tussen -2σ en 2σ en ongeveer 99.7% tussen -3σ en 3σ. Dit kun je gebruiken bij het aflezen van een verdeling. Ook is het handig als je een tekening maakt van een verdeling om deze waardes te vermelden.
Normaliteit vaststellen
Je kunt met spss met een P-P plot en een Q-Q plot de normaliteit van een verdeling vaststellen. Soms is het lastig om aan een verdeling te zien of het normaal verdeelt is. Je kunt met spss een P-P plot en een Q-Q plot de normaliteit van een verdeling vaststellen. Op sheet 25 zie je links een P-P plot en rechts een Q-Q plot. Bij de Q-Q plot kun je zien aan de puntjes welke waarde de observaties die op de x-as staan hebben en op de y-as kun je zien welke waarde je deze waarde verwacht te zijn als de verdeling normaal was. Bij de P-P plot zijn de waarden op de y-as de cumulatieve verwachte relatieve scores en op de x-as de cumulatieve geobserveerde relatieve scores. Bij de Q-Q plot zijn de waarden op de y-as de absolute verwachte scores en op de x-as de absolute geobserveerde scores. De lijn geeft aan waar de puntjes zouden moeten staan als de verdeling perfect normaal verdeeld is. Dit is echter vrijwel nooit zo. Hoe ver de puntjes van de lijn afstaan bepaalt hoe normaal verdeeld de verdeling is. Als de lijntjes systematisch afwijken van de diagonale lijn is de verdeling niet normaal verdeeld. Aan het begin en aan het einde van de lijn zijn vaak afwijkingen; dit komt door outliers (uitschieters). Daarnaast kun je naar de skewness (scheefheid van een verdeling) of de kurtosis kijken: zie sheet 5. Ten slotte heb je nog de Kolmorgorov-Smirnov (K-S) test die kan uitrekenen of een verdeling normaal verdeeld is. Deze test is echter zeer (over)gevoelig en kan daardoor soms iets bepalen als niet-normaal verdeeld hoewel het wel normaal verdeeld is.
JoHo can really use your help! Check out the various student jobs here that match your studies, improve your competencies, strengthen your CV and contribute to a more tolerant world
For compiling your own materials and contributions with relevant study help
For sharing and finding relevant and interesting summaries, documents, notes, blogs, tips, videos, discussions, activities, recipes, side jobs and more.
Using and finding summaries, study notes en practice exams on JoHo WorldSupporter
There are several ways to navigate the large amount of summaries, study notes en practice exams on JoHo WorldSupporter.
Use the menu above every page to go to one of the main starting pages
Starting pages: for some fields of study and some university curricula editors have created (start) magazines where customised selections of summaries are put together to smoothen navigation. When you have found a magazine of your likings, add that page to your favorites so you can easily go to that starting point directly from your profile during future visits. Below you will find some start magazines per field of study
The topics and taxonomy of the study and working fields gives you insight in the amount of summaries that are tagged by authors on specific subjects. This type of navigation can help find summaries that you could have missed when just using the search tools. Tags are organised per field of study and per study institution. Note: not all content is tagged thoroughly, so when this approach doesn't give the results you were looking for, please check the search tool as back up
Check or follow your (study) organizations:
by checking or using your study organizations you are likely to discover all relevant study materials.
this option is only available trough partner organizations
Non-members: When you are not a member you do not have full access, but if you want to share your own content with others you can fill out the contact form
Add new contribution