Statistische Modellen 2 - Collegeaantekeningen
- 968 reads
College 6
Binaire uitkomsten
in logistische regressieanalyse is de afhankelijke variabele een dummy
variabele (2 categorieën)
uitkomstmaten met 2 categorieën komen veel voor
dummy (binaire) uitkomstmaten makkelijk te interpreteren als
Transformatie naar binair
afhankelijke variabele heel scheef verdeeld
verdeeld zijn
(mogelijke) oplossing
naar twee categorieën
Voorbeeld
wel of niet behalen tentamen SM2 (N = 421)
afhankelijke variabele Y (DUM)
onafhankelijke variabele X1 (INT)
onderzoeksvraag: kan slagen voor het tentamen SM2 worden voorspeld door het aantal studie-uren?
Spreidingsdiagram Regressielijn
Groep proporties Niet-lineaire curve
Machtsverheffen
machtsverheffen: an = c
het getal e = 2.71828…
grondtal te gebruiken
e0 = 1
e1 = 2.72
e2 = 7.39
e3 = 20.09
Logistische functie
eigenschappen
Statistisch model
als we in ex het deel x vervangen door een lineair regressiedeel
β0 + β1X1 + β2X2 krijgen we het logistische regressiemodel (regressievergelijking)
waarbij
Voorbeeld
wel of niet behalen tentamen SM2 (N = 421)
afhankelijke variabele Y (DUM)
onafhankelijke variabelen X1 en X2 (INT)
onderzoeksvraag: kan slagen voor het tentamen worden voorspeld door aantal studie-uren?
Statistisch model
afhankelijk variabele is een
dummy variabele
model produceert kansen
op slagen
kans op zakken is
P0 = 1– P1
(dalende curve)
Je hebt steile (goed worden gescheiden) of vlakke curve (niet goed worden gescheiden).
SPSS: Analyze/Regression/Binary Logistic
Geschatte regressievergelijking
wat is de regressievergelijking? P = geschatte kans
regressiecoëfficiënten
invullen in vergelijking
geeft:
Significante voorspellers
welke voorspellers zijn significant?
regressiecoëfficiënten
voor alle coëfficiënten een toets met H0 : ßstudieuren = 0
hier: 2x p < 0.001 à zeer waarschijnlijk dat beide coëfficiënten verschillend van 0 zijn in populatie
Odds ratio
regressiecoëfficiënten
interpretatie regressiecoëfficiënten
hier: e0.12 = 1.126 en e-3.9 = 0.021 (odds > 1 omdat b1 > 0)
Voorspellen
Classificatietabel
hoe goed is regressiemodel?
à geen R2 maar classificatietabel
beslisregel voorspelling
correct voorspeld (vergelijk met random = 50% correct)
correct voorspeld
geavanceerder
Kans op slagen = kans op zakken
bij welk aantal studie-uren
geldt P1 = P0?
wanneer is kans op slagen
gelijk aan kans op zakken?
oplossen: –3.9 + 0.12*studie-uren = 0
à studie-uren = 3.9/0.12 = 32.5
Odds
de odds van een gebeurtenis
als p is de kans dat een gebeurtenis plaatsvindt
dan 1 – p de kans dat de gebeurtenis niet plaatsvindt
en
eigenschappen
Voorbeelden odds
kans op slagen tentamen P1 = 0.8
dan zijn de odds van slagen:
kans op slagen is 4 maal zo groot als kans op zakken
kans op slagen tentamen P1 = 0.33
dan zijn de odds van slagen:
kans op slagen is een half maal zo groot als kans op zakken
ofwel, kans op zakken is 2 maal zo groot als kans op slagen
Meer odds
logistische regressievergelijking:
uren P1 odds
10 0.063 0.068
25 0.287 0.403
30 0.422 0.731
43 0.775 3.435
50 0.888 7.901
60 0.963 25.97
Odds ratio
odds ratio (OR) van een voorspeller
iedere voorspeller in LRA heeft een OR
bijv.: als b = 0.12, dan OR = exp(b) = e0.12 = 1.13
Odds ratio voor k eenheden
OR(1) = e0.12 = 1.13
waarbij (1) staat voor één eenheid
à toename in odds van slagen als je 1 uur extra studeert
OR voor k eenheden: OR(k) = OR(1)k
OR(10) = OR(1)10 = (1.13)10 = 3.3
à voorspelde odds van slagen 3.3 keer zo groot als je 10 uur extra studeert
OR(20) = OR(1)20 = (1.13)20 = 11
à voorspelde odds van slagen 11 keer zo groot als je 20 uur extra studeert
Odds ratio 2 groepen
odds ratio (OR) = ratio van twee odds
kans op slagen tentamen (algemeen)
odds van slagen tentamen = p/(1 – p)
àkans op slagen 4 maal zo groot dan kans op zakken
àkans op slagen 1.5 maal zo groot dan kans op zakken
odds ratio (OR) = ratio van twee odds
odds van slagen tentamen
odds ratio
à odds van slagen 2.67 maal zo groot voor vrouwen dan voor mannen
à odds van slagen 0.38 maal zo groot voor mannen dan voor vrouwen
à odds van slagen 2.67 maal zo klein voor mannen dan voor vrouwen
Regressievergelijking
met regressievergelijking niet altijd makkelijk werken
alternative manier van opschrijven mogelijk: logit
transformeer naar odds:
transformeer met natuurlijk logarithme:
(uitspraak log odds) Voorspelde log odds van slagen
Geschatte regressievergelijking
Regressiecoëfficiënten
alternatieve regressievergelijking:
ln(odds) = b0 + b1*studie-uren + b2*hoorcolleges
invullen geeft
ln(odds) = -6.6 + 0.13*studie-uren + 0.50*hoorcolleges
Assumpties
twee assumpties
beide worden vaak niet gecheckt in de praktijk
Join with a free account for more service, or become a member for full access to exclusives and extra support of WorldSupporter >>
There are several ways to navigate the large amount of summaries, study notes en practice exams on JoHo WorldSupporter.
Do you want to share your summaries with JoHo WorldSupporter and its visitors?
Main summaries home pages:
Main study fields:
Business organization and economics, Communication & Marketing, Education & Pedagogic Sciences, International Relations and Politics, IT and Technology, Law & Administration, Medicine & Health Care, Nature & Environmental Sciences, Psychology and behavioral sciences, Science and academic Research, Society & Culture, Tourisme & Sports
Main study fields NL:
JoHo can really use your help! Check out the various student jobs here that match your studies, improve your competencies, strengthen your CV and contribute to a more tolerant world
1280 |
Add new contribution