Aantekeningen Hoorcollege 2 - Kwantitatieve Biologie aan de UU (2023-2024)

Hoorcollege 2

Beschrijvende statistiek

  • Je probeert data te visualiseren. Ipv veel getallen in een tabel.

Je kunt:

  • Gegevens samenvatten in een tabel
  • Gegevens visualiseren in grafieken en diagrammen
  • Gegevens samenvatten in ligging (zie slides)

Variabelen kan je indelen in numeriek of categoriaal

  • Numeriek is continu of discreet, dit zijn getallen
  • Categoriaal is ordinaal of nominaal
  • Nominaal zijn labels of namen
  • Ordinaal is categorieën met een natuurlijke volgorde

Voorbeelden:

  • Levenscyclus van een organisme is categoriaal en ordinaal: ei, rups, pop en vlinder
  • Van welk type variabele is de optische dichtheid van een bacteriële cultuur:
  • Numeriek en continu, want elk positief getal is een nieuwe waarde. Ook 1,3 is iets. Hij kan niet negtaief zijn.
  • Aantal puppy’s in een worp honden: numeriek en discreet. Dat zijn gewoon 6 puppy’s.
  • Van welk type variabele is handedness linkshandig of rechtshandig.
  • Dit is categoriaal en nominaal. Het heeft iets met labels te maken, dus nominaal en categoriaal.

Eisen voor een staafdiagram:

  • Snijd nooit de y-as af, dus deze moet bij 0 beginnen
  • Staven moeten los van elkaar
  • Wij gebruiken het alleen voor een categoriale variabele

Je kunt categoriale data ook visualiseren in een taartdiagram:

  • Je kunt de relatieve frequentie zien, het deel van het geheel.

Voor nummerieke data is de optie een histogram, dit lijkt op een staafdiagram maar is het niet

  • Nummerieke variabelen op de x-as
  • Staven staan aan elkaar vast
  • y-as op 0 laten beginnen
  • Hier kan je de x-as verdelen in categorieën: 0-50, 50-100 en 100-150

Vorm van een histogram: moet normaalverdeeld zijn, dus klokvormig.

  • Welk histogram is uniform?
  • Dat is die linksboven, zie dia 29
  • De frequentie is gelijk over de verschillende categoriën op de x-as.

Welk histogram is scheef?

  • Dat is linksonder op dia 32
  • Hij is niet symmetrisch
  • Een lange staart naar links
  • In het Engels: skewed, skewed-left

Welk histogram is bimodaal?

  • Dat is rechtsonder
  • Twee heuvels.
  • Hier zijn er twee modi (enkelvoud: modus). Twee zijn in hun eigen categorie de hoogste waarde.

Ligging vs spreiding

  • Ligging is de positie op de x-as, ze hebben hetzelfde gemiddelde als ze op de x-as liggen
  • De spreiding is hoe breed de klokvorm is
  • Zie Dia 36

Maten voor de ligging van (numerieke) gegevens:

  • Rekenkundig gemiddelde
  • Mediaan: het middelste getal na sorteren
    • Bij een even aantal aan getallen, neem je het gemiddelde van de middelste twee
  • Modus: plek van de piek

De mediaan is veel minder gevoelig voor ‘uitbijters’ dan het gemiddelde.

Maten voor de spreiding van numerieke data

  • Range = het verschil tussen grootste getal en kleinste getal
  • Standaarddeviatie of standaardafwijking
  • Variantie
  • Interkwartielafstand (IQR)
  • Variatiecoëfficiënt (VC)

Standaardafwijking:

  • Gemiddelde data berekenen. Dan van ieder datapunt trek je het gemiddelde af. Dat kwadrateer je. Dat tel je bij elkaar op. En dat deel je dan door n-1. En van dat totaal neem je de wortel. Zie de dia.

Variantie is de standaardafwijking in het kwadraat.

Interkwartielafstand

  • Je hebt de mediaan al gevonden
  • Dan neem je de middelste waarde van de linkerhelft en van de rechterhelft. Dus een kwart van je data en driekwart van je data
  • De mediaan is dan het tweede kwartiel
  • IQR is Q3 - Q1

Symmetrische klok:

  • Gemiddelde is 10
  • Mediaan is 10
  • De modus is ook 10

Standaardafwijking schatten:

  • Je kijkt naar de helft van de lijn in het midden op dia 40. Dan opzij, dat is de s (standaarddeviatie)

Nog een manier om data te visualiseren: Boxplots

  • Een uitbijter is 1,5x de IQR van de box verwijderd, dan wordt deze apart geplot
  • Q2 is 50% van je data, dus P50
  • 1e kwartiel is Q1, P25
  • 50% van je data valt in je box, alles tussen Q3 en Q2
  • De staart is de ‘whisker’

Boxplot laat zien dat de verdeling asymmetrisch is met uitbuiters. Dat zie je aan het lengteverschil van de whiskers

Berkenen van outliers gaat als volgt:

  • Q3 + 1,5 x IQR
  • Q1 - 1,5 x IQR

In die range liggen de waarden, daarbuiten is het een outlier. IQR is ook niet afhankelijk van de outliers.

Image

Access: 
Public

Image

Check: concept of JoHo WorldSupporter

Concept of JoHo WorldSupporter

JoHo WorldSupporter mission and vision:

  • JoHo wants to enable people and organizations to develop and work better together, and thereby contribute to a tolerant and sustainable world. Through physical and online platforms, it supports personal development and promote international cooperation is encouraged.

JoHo concept:

  • As a JoHo donor, member or insured, you provide support to the JoHo objectives. JoHo then supports you with tools, coaching and benefits in the areas of personal development and international activities.
  • JoHo's core services include: study support, competence development, coaching and insurance mediation when departure abroad.

Join JoHo WorldSupporter!

for a modest and sustainable investment in yourself, and a valued contribution to what JoHo stands for

Image

 

 

Contributions: posts

Help others with additions, improvements and tips, ask a question or check de posts (service for WorldSupporters only)

Image

Check more: related and most recent topics and summaries
Check more: study fields and working areas
Check more: institutions, jobs and organizations

Image

Follow the author: Hugo
Share this page!
Statistics
1587
Submenu & Search

Search only via club, country, goal, study, topic or sector