Aantekeningen van Statistiek BDK College 1

 

Hoorcollege 1

De data revolutie: vandaag de dag speelt data analyse een rol in praktisch elke beslissing die gemaakt wordt door corporaties en grotere bedrijven. Kennis uit data is een zogenoemde significant corporate asset geworden. Statistiek is het halen van informatie uit een gegevensset van (ongeordende) data. Dit is belangrijk om betere beslissingen te kunnen maken en om interessante vragen te stellen.

Er valt een onderscheid maken tussen:

  • Beschrijvende statistiek (descriptive statistics): data samenvatten en op een informatieve manier presenteren

  • Verklarende statistiek (inferential statistics): gebruik maken van een steekproef uit populatie en hieruit conclusies trekken.

 

Statistische hoofdconcepten

  • Populatie: Een groep waarin je geïnteresseerd bent

Voorbeeld: alle eerstejaars BDK studenten

  • Sample: Een steekproef uit je populatie

Voorbeeld: Alle eerstejaars BDK studenten op de eerste rij.

  • Variabele: Het karakteristiek waarin je geïnteresseerd bent

Voorbeeld: Het inkomen van een Formule-1 rijder

  • Waarde: Alle mogelijke observaties van een variabele

Voorbeeld: Van €150.000 tot €30.000.000

  • Data: De daadwerkelijke geobserveerde waarde

Voorbeeld: Het geobserveerde jaarlijkse inkomen van 12 verschillende Formule-1 rijders in miljoenen euro’s.

 

Typen data:

  • Kwantitatieve data: Je kunt er mee rekenen en het zijn reële nummers op de getallenlijn.

Voorbeeld:jaarlijkse inkomen van Formule-1 rijders

  • Ordinale data: Er bestaat een rangorde in de data

Voorbeeld: gezondheid status (1= very good, 2 = good etc.).

  • Nominale waarde: Er bestaat geen rangorde binnen de data

Voorbeeld: Burgerlijke staat (1=single, 2=getrouwd, 3=gescheiden, 4=weduwe).

 

Een bar chart (of staafdiagram) wordt gebruikt om frequenties te beschrijven (histogram). Een pie chart (of taartdiagram) wordt gebruikt om relatieve frequenties te beschrijven (cirkeldiagram).

 

Relatie tussen 2 variabelen:

  • Scatter diagram: hoe dichter de punten op de lijn liggen, hoe sterker de relatie. Als alle punten op de lijn vallen noemen we dit deterministisch.

  • Lineaire relatie: Als de meeste punten dicht bij een rechte lijn liggen

 

Basisprincipes voor grafieken en tabellen

Visualisatie van data is heel belangrijk

Het boek “The Visual Display of Quantitative Information” laat 7 basisprincipes van grafische uitmuntendheid zien:

  • Geef de data weer

  • Vermijd onduidelijkheid over wat er in moet staan

  • Grafieken moeten goed leesbaar zijn, er moet in 1 oogopslag te zien zijn wat bedoeld wordt

  • Integreer de tekst en de grafiek

 

Er kan ook gelogen worden met statistiek. Dit gebeurt door bijvoorbeeld een grafiek heel erg uit te vergroten waardoor het verschil tussen de verschillende gemeten eenheden heel erg groot lijkt. In werkelijkheid kan het verschil dan veel kleiner zijn.

 

Arithmetic mean (average): de som van de observaties gedeeld door het nummer van de observasties

  • Population mean (gemiddelde): µ = , met N=populatiegrootte

  • Sample mean (steekproefgemiddelde): x̅ = , met n=steekproefgrootte

Let op de notatie! µ is een onbekende parameter en x̅ een statistiek

 

Maten van centrale locatie

  1. Mediaan: De middelste observatie

  2. Modus: De observatie dat de hoogste frequentie heeft. De modus van een steekproef of populatie hoeft niet uniek te zijn.

  3. Percentiel: De waarde voor welke P % minder dan de waarde is en (100-P)% groter is dan het waarde. Voorbeeld: als jouw cijfer het 80th percentiel is, zit 80% er onder en 20% er boven.

  4. Kwartiel: Het 25e, 50e en 75e percentiel

  5. Mediaan: Het 50e percentiel/ het tweede kwartiel

  6. Spreiding (range): De grootste observatie – de kleinste observatie

  7. Interquartile range: 3e kwartiel – 1e kwartiel

 

Een boxplot bestaat uit eerste, tweede en derde kwartiel. Ook heb je ‘snorharen’, het maximum en het minimum. Punten dat buiten de snorharen liggen worden outliers genoemd. De maximale lengte van een snorhaar is 1,5 keer de interquartile range. Een voorbeeld van een boxplot is te vinden in de slides van hoorcollege 1 slide 38 en 39.

 

De range en interkwartiel range maken maar gebruik van 2 datapunten.

Variantie: De gemiddelde afwijking van het gemiddelde.

  • Populatie variantie: σ2 =

  • Steekproefvariantie: s2 =

De afwijking kan positief en negatief zijn, daarom wordt er een kwadraat genomen.

 

Voor een voorbeeld van steekproefvariantie, zie de slides van de colleges.

Chebyshev’s ongelijkheid en de empirical regel

In elke steekproef of populatie zijn bijna alle waarden dichtbij het centrum. Ten minste 1-(1/k2) van de waarden zijn in de k standaard deviaties van het centrum, voor k>1.

 

 

Correlatie: het weergeven van de relatie tussen 2 waarden. Dit kan goed weergegeven worden bij gewicht en lengte. Het kan bijvoorbeeld weergegeven worden in een scatterplot. Bij een rechte lijn is er geen relatie, bij een stijgende lijn een positieve relatie, en bij een dalende lijn een negatieve relatie.

  • Population covariance:

  • Sample covariance:

 

Image

Access: 
Public

Image

Join: WorldSupporter!

Join with a free account for more service, or become a member for full access to exclusives and extra support of WorldSupporter >>

Check: concept of JoHo WorldSupporter

Concept of JoHo WorldSupporter

JoHo WorldSupporter mission and vision:

  • JoHo wants to enable people and organizations to develop and work better together, and thereby contribute to a tolerant and sustainable world. Through physical and online platforms, it supports personal development and promote international cooperation is encouraged.

JoHo concept:

  • As a JoHo donor, member or insured, you provide support to the JoHo objectives. JoHo then supports you with tools, coaching and benefits in the areas of personal development and international activities.
  • JoHo's core services include: study support, competence development, coaching and insurance mediation when departure abroad.

Join JoHo WorldSupporter!

for a modest and sustainable investment in yourself, and a valued contribution to what JoHo stands for

Check: how to help

Image

 

 

Contributions: posts

Help others with additions, improvements and tips, ask a question or check de posts (service for WorldSupporters only)

Image

Image

Share: this page!
Follow: lucaslucas103 (author)
Add: this page to your favorites and profile
Statistics
1280
Submenu & Search

Search only via club, country, goal, study, topic or sector