Samenvatting literatuur bij Academische en Wetenschappelijke Vorming - Geneeskunde UL

Bevat samenvattingen bij relevante artikelen en hoofdstukken uit Epidemiology (Rothman) .

Epidemiologie - Het meten van het optreden van ziekte en de causale effecten (4)
Epidemiologie - Soorten epidemiologische studies (5)
Epidemiologie - Het opzetten van onderzoek (6)
Epidemiologie - Omgaan met bias (7)
Artikelen
Samenvatting ‘Users’ Guides to the Medical literature – A. Are the results of the study valid?
Samenvatting ‘Users’Guides to the medical literature’ – B. What were the results?’
Sensitiviteit en Specificiteit
Positief en negatief voorspellende waardes
Kansen
Eenzijdige en tweezijdige tests
De normale verdeling
Afwezigheid van bewijs is geen bewijs van afwezigheid
Analyse van variantie
Subgroepen vergelijken
Standaarddeviatie en Standaarderror
Parametrische en non-parametrische methoden

Epidemiologie - Het meten van het optreden van ziekte en de causale effecten (4)

In de wetenschap staat het meten van gegevens centraal. Epidemiologie is de wetenschap van het optreden van ziektes. Het gaat vooral over de frequentie, risico, incidentie en prevalentie van de ziekte. Bij het risico wordt er onderscheid gemaakt tussen een persoon en een populatie. Voor een populatie is de formule: risico = A / N te gebruiken. A is hier het aantal mensen dat gedurende een bepaalde periode de ziekte heeft ontwikkeld en N is de hele populatie die gedurende een periode is gevolgd. Het algemene risico wordt ook wel het incidentie proportie genoemd. De enige manier om een risico te interpreteren is wanneer het bekend is over welke tijdsperiode het risico geldt.
Tijdens een onderzoek moet er rekening gehouden worden met het ‘concurrerende risico’. Dit fenomeen houdt in dat er in de populatie die wordt gevolgd mensen zijn die overlijden, waardoor het niet zeker is welke uitkomst van het onderzoek zij zouden hebben. Dit risico wordt groter wanneer de deelnemers van het onderzoek ouder zijn of een langere tijd worden gevolgd. De incidentie van een ziekte kan worden berekend met de formule: incidentie = A / T.

Hierbij is A het aantal mensen dat de ziekte ontwikkeld en T is de tijd waarin deze groep werd gevolgd. De incidentie wordt hier niet gemeten binnen een domein [0,1]. Dat komt doordat het aantal mensen dat door een bepaalde ziekte getroffen wordt heel erg groot kan zijn. Bij een epidemie is de tijd waarin dit gemeten wordt ook nog eens erg klein. Daarom kan de incidentie in theorie oneindig groot worden.

In een onderzoek wordt ernaar gestreefd om zo veel mogelijk variabelen gelijk te houden en om één variabele te laten verschillen in de onderzoeksgroepen. Dit is de determinant. Het is niet mogelijk om alle variabelen constant te houden, daarom moet hier ook altijd rekening mee worden gehouden bij het interpreteren van de resultaten van het onderzoek.

Voor een onderzoek zijn er verschillende opzetten mogelijk. Zo is er het crossover onderzoek, hierbij neemt dezelfde groep mensen twee keer deel aan een experiment. Dit experiment kan alleen worden gebruikt als de proefpersonen worden blootgesteld aan iets dat maar voor korte tijd effect heeft. Verder bestaat er nog het gerandomiseerde experiment. Bij deze studie worden alle mensen willekeurig in twee groepen verdeeld en wordt de ene groep met de andere vergeleken. Dit wordt gedaan door te kijken naar het risico en de mate van incidentie.

Het risico verschil (risico difference RD) is het verschil in risico tussen de groep die wel is blootgesteld aan een factor en de groep die niet is blootgesteld aan die factor. Er is ook een mate van incidentie verschil (incidence rate difference IRD). Zo kan het absolute effect worden gemeten. Het relatieve effect kan worden berekend door de volgende formule:

Relatieve effect = risico verschil / risico in niet-blootstelden (R_{0) = R}₁_{- R}₀_{/ R}₀

Epidemiologie - Soorten epidemiologische studies (5)

Cohort studies worden vooral gebruikt in de epidemiologie. Hierbij wordt het optreden van ziektes binnen één of meer cohorten gemeten. Over het algemeen bevatten de cohorten personen die vergelijkbaar zijn qua leeftijd, ras etc. Eén cohort is blootgesteld en het andere cohort niet. Blootgesteld wordt hier op een andere manier gebruikt dan in de alledaagse taal, het kan bijvoorbeeld ook betrekking hebben op een bepaald gen.

Elk experiment heeft bepaalde regels, dit is het protocol van het experiment. Het woord trial wordt als synoniem gebruikt voor experiment. Een clinical trial is een experiment waarbij in een klinische setting wordt gekeken naar welk medicijn voor een ziekte beter is. Om te zorgen dat dit experiment optimaal verloopt moet de onderzoeker het medicijn zelf aan de patiënt geven. Zo wordt voorkomen dat patiënten de medicijnen op een verkeerde manier of helemaal niet innemen. Ook is het van belang dat de patiënt zelf niet weet welk medicijn hij of zij heeft, dit wordt een blinde studie genoemd. Het allerbeste is een dubbel-blind onderzoek, hierbij weet de onderzoeker die het medicijn geeft zelf niet wat voor een medicijn hij of zij geeft.

Cohort studies kunnen worden onderverdeeld in subcategorieën; prospectieve studies retrospectieve cohort studies, special-exposure cohort studies en algemene populatie studies. Een prospectieve studie is een onderzoek waarbij de informatie wordt verzameld aan het begin van het onderzoek en de tijdsperiode van het onderzoek gelijk loopt met de tijdsperiode waarin het risico van een ziekte wordt bekeken. Een retrospectieve studie is een onderzoek waarbij alle data al bekend is en waarbij de tijdsperiode waarin de proefpersonen zijn blootgesteld aan een risico al voorbij is wanneer er met het onderzoek wordt begonnen.

Special exposure cohort studies vindt plaats wanneer een bepaalde groep mensen zijn blootgesteld aan één factor. Denk hierbij aan de Tsjernobyl ramp, blootstelling aan substanties in een werkplek etc. Het is efficiënter om al deze mensen in één keer te bestuderen. Algemene populatie studies zijn onderzoeken waarbij wordt gekeken naar het gemiddelde van de bevolking, bijvoorbeeld hoeveel alcohol mensen drinken, drugs gebruik, roken, eetgewoontes etc.

Epidemiologie - Het opzetten van onderzoek (6)

In de epidemiologie probeert men de invloed van een determinant, een fenomeen dat vaak aan het optreden van een ziekte voorafgaat, op het ontstaan van een ziekte te bepalen. De vele verschillende testen komen overeen in het feit dat ze de situatie met en de situatie zonder de determinant vergelijken, waarbij de rest van de omstandigheden in deze groepen wel gelijk zijn. De drie belangrijkste onderzoeksvormen zijn case-control, follow-up en cross-sectional.

Follow-up

Bij follow-up wordt de gang van oorzaak door de determinant tot de ziekte gevolgd, door twee groepen te nemen waarbij de een wel met het fenomeen in aanraking is gekomen (exposure) en de ander niet. Deze twee groepen (index en controle) worden na een tijdje vergeleken op de frequentie van de ziekte. Een groep in een follow-up studie heet een cohort, daarom wordt de follow-up studie soms ook een ‘cohort-studie’ genoemd. De nulhypothese stelt dat er geen verschil is tussen de groepen, deze wordt aangenomen of afgewezen. Hierna wordt het verschil in relatief risico berekend. Er zijn twee versies van follow-up: prospectief en retrospectief.

Bij een prospectief onderzoek begin je in het nu en wordt de onderzoeker als het ware oud met de onderzochte populatie. Bij een retrospectief onderzoek kijk je terug hoe dingen in het verleden het nu hebben beïnvloed. Retrospectief heeft als voordeel dat je grote groepen langere tijd kunt volgen zonder dat je onderzoek jaren hoeft te duren. Het grootste nadeel is dat je afhankelijk bent van de verslaglegging uit het verleden, die vaak niet compleet is en waar veel determinanten vaak niet zijn vastgelegd. Bij prospectief is het voordeel dat je zelf alles vastlegt en dus naar alle gewenste determinanten kunt kijken, maar dat het veel tijd en mankracht vergt om grote groepen langere tijd te volgen. Voorbeelden van een prospectief en retrospectief onderzoek staan van bladzijde 87 tot 89 van ‘Grondslagen der Epidemiologie’.

Index en controlegroep

Bij het kiezen van de index (groep die je onderzoekt) en controlegroep zijn er drie methodes.

Selectie. Selectie past men toe als een determinant zeldzaam is, er wordt dan in archieven gezocht naar mensen met de determinant en een vergelijkbare controlegroep zonder de determinant. Het probleem met deze methode is dat de ene groep zowel de determinant als de ziekte heeft en de andere groep geen van beide.
Natuurlijke gegevenheid. Natuurlijke gegevenheid is toe te passen bij determinanten die bij een groter percentage van de bevolking voorkomen, zoals roken of serum cholesterol. Hierbij worden de groepen ingedeeld op hoeveelheid exposure, bijvoorbeeld een groep met hoog cholesterol als index en met laag cholesterol als controle. De selectie is nu weggenomen, maar mensen hebben zelf nog een grote invloed over in welke groep ze komen.
Randomisatie. Bij randomisatie worden twee groepen op toeval ingedeeld, waarna de ene groep aan de determinant wordt blootgesteld en de ander niet. Hierbij is zowel selectie van patiënt als van onderzoeker weggenomen. Daarnaast zullen andere eventuele determinanten in beide groepen (ongeveer) evenveel voorkomen en de uitslagen dus niet beïnvloeden.

De eerste twee onderzoeken zijn observatieonderzoeken, de derde een interventie.

Veelgemaakte fouten bij Follow-Up

Een veelgemaakte fout bij follow-up is dat de personen in de onderzoeksgroep al in aanraking zijn geweest met de ziekte, en dus sowieso al meer kans hebben om de ziekte te krijgen.
Een tweede fout is dat onderzoekers vanaf het moment van de eerste symptomen gaan tellen. Dit is onjuist, omdat niet iedereen met de symptomen ooit medisch behandeld wordt en je dus een foutieve groep krijgt. Het is beter om te tellen vanaf de eerste medische interventie.
Een derde fout is het onjuist doen van follow-up, waarbij de gegevens van vorige medische controle worden overgenomen zonder erop te letten dat deze controle wellicht voor de ene patiënt veel langer geleden is dan voor de andere patiënt. Hierdoor komen de levensjarentabellen en de persoonsjaren tabellen, twee technieken om de invloed van de determinant te bepalen, niet overeen. We noemen dit ‘loss to follow-up’.

Case-Control onderzoek

Bij een case-control ga je omgekeerd te werk als bij een follow-up studie: nu neem je een groep met mensen met de ziekte en een groep met mensen zonder de ziekte en kijk je bij beide groepen naar de blootstelling aan de determinant. Voorbeelden van case-control onderzoeken staan op bladzijde 92 en 93 van ‘Grondslagen der Epidemiologie’. Uit een case-control onderzoek is ook het relatief risico te berekenen. Hiervoor zijn de blootstellingsfrequenties nodig.

Het relatief risico

Bij het relatief risico in een follow-up nemen we het aantal personen met exposure (Z) en de tijd dat ze gevolgd worden (T), dit geeft persoonsjaren ZxT. Het aantal mensen met de ziekte binnen deze groep is A. Bij de controlegroep doen we hetzelfde: aantal mensen (Y) maal de tijd dat ze gevolgd worden (T) geeft persoonsjaren YxT, het aantal mensen met de ziekte binnen deze groep is B. De formule voor het relatief risico is nu (A/ZxT)/(B/YxT). Dit is ook om te schrijven als (A/B)/(ZxT/YxT), dan bereken je de odds. In principe bereken je hiermee het verschil tussen de odds (dus de odds ratio van) (A/B) en (Z/Y).

Deze oddsratio is ook uit te rekenen bij een case-control. Hierbij neem je binnen de groep zieken mensen met de exposure (a) en mensen zonder de exposure (b). Ditzelfde doe je binnen de controlegroep, mensen met exposure (z) en zonder exposure (y). De odds ratio wordt dan (a/b)/(z/y). Hieruit kan het relatief risico worden berekend, maar nooit het absolute risico (daarvoor is een follow-up studie nodig).

Keuzes bij case-control onderzoek

Binnen een case-control moeten verschillende keuzes worden gemaakt.

Het kiezen van de cases (te onderzoeken patiënten). Het is bij case-control nodig dat er een grote groep patiënten bij elkaar komt. Dit kan door speciale centra of speciale registraties. We onderscheiden verschillende cases: incidente, prevalente en cumulatieve. Bij incidente kijk je naar verse gevallen, bijvoorbeeld mensen die in de afgelopen week de ziekte hebben gekregen. Bij prevalente kijk je naar alle ziektegevallen op een moment, zo heb je snel een grote patiëntengroep maar heb je als nadeel dat sommige al veel langer ziek zijn en behandeld worden dan andere. Bij cumulatief neem je alle mensen uit een groep die in een bepaalde tijd ziek zijn geworden (er worden dus aspecten van een follow-up studie gebruikt). Meestal gebruik je hiervoor een oud prevalentie onderzoek en doe je op basis daarvan een case-control studie.

De keuze van de controlegroep. De controlegroep heeft twee doelen. Ten eerste moet het een idee geven van de algemene frequentie van de exposure binnen de populatie, zodat hiermee de nulhypothese getest kan worden. Ten tweede geeft het een idee van de exposure binnen de oorsprongspopulatie van de cases, dus hoeveel vergelijkbare mensen blootgesteld worden aan de determinant. Mogelijkheden voor het kiezen van de controle groep: kiezen van de controlegroep als een steekproef van de populatie aan het begin van de follow-up periode of het kiezen van een vergelijkbare controle op het moment dat een case een ziekte ontwikkeld.

Vaak moet de keuze tussen een populatie-controlegroep of een patiënten-controlegroep worden gemaakt. Bij een populatie-controlegroep worden mensen uit dezelfde populatie als de patiënten genomen, soms zodat deze dichtbij de patiënten staan. Bij een patiënten-controlegroep worden patiënten met andere aandoeningen genomen, vaak liggen deze in hetzelfde ziekenhuis als de patiënten. De laatste wordt vooral gebruikt als het onderzoek gebaseerd is op patiënten uit een bepaald centrum en het drainagegebied van dit centrum onduidelijk is: je weet niet uit welk geografisch gebied de patiënten komen en kunt dus niet de populatie bepalen. Hier zijn enkele problemen mee: ten eerste is niet zeker of het drainagegebied van beide ziektes gelijk is (en of de populaties dus vergelijkbaar zijn) en ten tweede kan de controle-ziekte ook met de determinant te maken hebben. Om het laatste te voorkomen wordt er vaak een mix van allerlei ziektes gebruikt in de patiënten-controlegroep. Het voordeel van patiënten-controlegroep is dat patiënten vaak sneller geneigd zijn mee te doen aan onderzoek dan de populatie, en dat veel gegevens van patiënten al zijn vastgelegd.

Een andere te maken keuze zijn de in- en exclusie criteria (wie kunnen er wel en wie kunnen er niet aan het onderzoek meedoen). Vaak worden patiënten met hoge indicaties of contra-indicaties uitgesloten, dit moet in beide groepen gebeuren om het evenwicht tussen de groepen te behouden. De criteria worden vaak bepaald door te denken aan welke patiënten bij een gerandomiseerd experiment zouden worden aangenomen of juist uitgesloten.

Cross-sectional onderzoek

Bij cross-sectional of ‘dwarsdoorsnede’ onderzoek is er geen tijdsverloop: exposure en aan/afwezigheid van de ziekte worden tegelijk gemeten. Omdat dit onderzoek altijd van prevalentie uitgaat, zijn er twee mogelijkheden waarop het onderzoek niet precies is. Het eerste is dat mensen met een aandoening niet meer bloot worden gesteld aan de risicofactor (bijvoorbeeld dat mensen met gehoorschade niet meer op een bouwplek werken), het tweede dat mensen met de aandoening juist met de risicofactor werken omdat ze de aandoening toch al hebben (bijvoorbeeld dat alleen matig dove menen het op de bouwplek uithouden). Het voordeel is dat de controlegroep niet gekozen hoeft te worden: het zijn gewoon de onderzochte mensen zonder de ziekte. Een cross-sectional onderzoek kan op de wijze van een follow-up of een case-control onderzoek worden onderzocht. Een nadeel is dat er bij cross-sectional onderzoek vaak chronische ziektes worden onderzocht en dat er veel mensen op gescreend moeten worden. Preventieve screening is ook een vorm van cross-sectional onderzoek.

Voor- en nadelen afwegen

Bij een case-control studie zit het grote nadeel van een vaak niet goed definiëerbare controlegroep. Daar staat tegenover dat deze vorm van onderzoek direct toepasbaar is in de praktijk, bijvoorbeeld als verlenging van de anamnese, en dus statistisch en economisch zeer voordelig is.

Epidemiologie - Omgaan met bias (7)

In epidemiologische studies komen twee soorten fouten voor, random fouten en systematische fouten. Als een studie wordt ontworpen, is het noodzakelijk om de fouten zoveel mogelijk te reduceren (vooral de apparaten waarmee gemeten wordt kunnen voor veel fouten zorgen) . Een ander woord voor systematische fouten is bias. Deze fouten zorgen voor een andere uitkomst van het onderzoek, zelfs al zou het onderzoek oneindig groot worden gemaakt. Random fouten vallen weg als een onderzoek oneindig groot zou worden gemaakt.

Bias kan worden onderverdeeld in drie categorieën; selectie bias, informatie bias en confounding. Selectie bias is afhankelijk van de procedure die wordt gebruikt om de deelnemers te selecteren en van de factoren die de deelnemers van het onderzoek beïnvloeden. Information bias komt voor wanneer er een fout is gemaakt in het interpreteren van de informatie van de studie, zo kan een proefpersoon in de verkeerde categorie zijn ingedeeld. Verder kan er recall bias ontstaan. Dit gebeurt wanneer informatie terug wordt gevraagd aan een proefpersoon over een bepaalde gebeurtenis. Een voorbeeld is hiervan moeders die een ziek kind kregen, zij zijn geneigd veel meer slechte gebeurtenissen te onthouden van de zwangerschap, zoals een glas alcohol dat ze hebben gedronken, medicijnen die ze eigenlijk niet hadden mogen innemen etc. terwijl moeders die een gezond kind krijgen zich zulk soort gebeurtenissen minder vaak herinneren.

Confounding is het door elkaar halen van effecten. Zo werd bijvoorbeeld uit een onderzoek geconcludeerd dat het vijfde kind van een moeder veel meer kans had op het syndroom van Down in vergelijking met het eerste kind. Maar het kost tijd om kinderen te krijgen, de moeder is daardoor bij het vijfde kind ouder dan bij het eerste kind. Oudere moeders hebben een grotere kans om een kind met het syndroom van Down te krijgen. Leeftijd was hier dus de oorzaak van het vergrote risico en niet hoeveel kinderen een vrouw al had gekregen.

Artikelen

Samenvatting ‘Users’ Guides to the Medical literature – A. Are the results of the study valid?

Deze gids legt uit hoe je een artikel kunt gebruiken over nieuwe therapie of preventie. Hierbij moet je jezelf altijd 3 vragen stellen:

‘Zijn de resultaten van het onderzoek geldig?’
Is het effect van de behandeling representatief in grootte en richting? Er wordt gekeken of er geen sprake is van bias of andere invloeden die tot een valse conclusie zouden kunnen leiden.
‘Wat zijn de resultaten?’

Dit benadert de grootte en de precisie van het effect van de behandeling. Hoe groter de studie hoe preciezer de schatting van het effect.

‘Kunnen deze resultaten de zorg van mijn patiënt verbeteren?’

De resultaten moeten ten slotte toepasselijk zijn voor de patiënt. De patiënt mag niet de afwijkend zijn van de populatie in de trial. De uitkomst moet een positief effect hebben op de patiënt en de impact van de behandeling moet reëel zijn. Met impact bedoelen we de voor en nadelen (bijwerkingen) van de behandeling en de gevolgen van eventueel niet behandelen van de patiënt. Dit gebeurt, wanneer de patiënt bijvoorbeeld al een goed prognose heeft zonder de behandeling.

Er bestaan evaluaties van resultaten van verschillende onderzoeken, omdat het overdragen van nieuwe kennis voor personeel en uitvoerende artsen efficiënt en soms uitgebreid moet zijn. De geldigheidscriteria zijn dan ook de primaire gidsen, om door te nemen in korte tijd.

Primaire richtlijnen

Om de geldigheid te beoordelen, kijken we allereerst of er randomisatie van patiënten in de verschillende groepen heeft plaatsgevonden. Klinische uitkomsten hangen namelijk, naast de therapie alleen, ook af van de ernst van de ziekte, de aanwezigheid van comorbiditeiten, andere prognostische factoren. Deze andere factoren beïnvloeden de clinicus in niet-gerandomiseerde trials. Behandelingen via een andere methode verdelen dan randomisatie geeft dan ook een groter (maar vaak vals-positief) effect dan bij gerandomiseerde studies. Als er geen gerandomiseerde studies beschikbaar zijn, moet de arts zijn besluit op zwakkere studies baseren.

Daarna kijken we naar de volledigheid van de follow-up en de analyse van patiënten naar de aanvankelijk toebedeelde groepen. Bij een substantieel aantal patiënten ‘lost to follow-up’ is er mogelijk sprake van bias, doordat deze patiënten een andere prognose hebben, verdwijnen door ernstige bijwerkingen (behandelgroep) of juist nergens meer last van hebben (controlegroep). Er vanuit gaande dat de uitgevallen patiënten het extreem goed (controle) of slecht (behandelgroep) deden, kun je een herberekening maken van het effect. Verandert de conclusie, dan is het aantal verloren patiënten extreem. De mate van verandering geeft tevens aan hoe waarschijnlijk het is dat die patiënten het inderdaad heel slecht of goed deden.

Het is belangrijk dat je ook patiënten die hun medicatie niet (goed) innemen, toch meeneemt in de analyse, omdat dit vaak samenhangt met de prognose. Door ze te excluderen verdwijnt de randomisatie.

Het principe waarbij je iedereen toeschrijft aan de groep waarin ze in eerste instantie waren ingedeeld, noem je intention-to-treat analyse.

Secundaire richtlijnen

Niet alleen patiënten, maar ook artsen en het personeel betrokken bij het onderzoek moet geblindeerd zijn. Hun mening over de effectiviteit van de behandeling kan andere aspecten of uitkomsten van de behandeling beïnvloeden en zo de betrouwbaarheid van de studie verminderen. Deze bias kun je het best vermijden door dubbel-blinderen met behulp van bijvoorbeeld een placebo. Bij behandelingen, die onmogelijk te blinderen zijn voor de patiënt of uitvoerend arts, is het in ieder geval belangrijk het personeel te blinderen die de uitkomsten meten.

Tevens moeten groepen vergelijkbaar zijn at baseline. Vooral bij kleine groepen, kan randomisatie niet garanderen dat er twee vergelijkbare groepen ontstaan. Het gaat hier niet om statistisch significante verschillen, maar de omvang van het verschil. Als de groepen niet vergelijkbaar zijn at baseline, zijn er nog statistische technieken, die hiervoor kunnen corrigeren (adjustment). Wanneer er na correctie dezelfde conclusie uitkomt, zijn de resultaten betrouwbaar.

Tot slot is het belangrijk dat de groepen gelijke worden behandeld. Hiermee bedoelen we dat ze twee groepen eenzelfde follow-up moeten krijgen. Het beter volgen van één groep, kan leiden tot betere rapportage van events of intensievere behandeling met een middel dat niet tot de onderzoekstherapie behoort. Als de follow-up van de controle groep strenger is, leidt dit tot een kleiner effect en kan de effectiviteit van de behandeling zelfs volledig gemist worden.

Samenvatting ‘Users’Guides to the medical literature’ – B. What were the results?’

In dit artikel gaan we kijken hoe we een geldig onderzoek kunnen gebruiken.

Wat zijn de resultaten?
A. Hoe groot was het effect van de behandeling?

Stel: In een controlegroep overlijdt 20% (X), tegenover 15% in de therapiegroep (Y).

Het absolute verschil/absolute risico reductie: X – Y = 20 – 15 = 5%
Het relatieve risico, risico voor Y vergeleken met X (RR) : Y/X = 0.15/0.20 = 0.75
Relatieve risico reductie (RRR): 1 – (Y/X) x 100% = (1 – 0.75) x 100% = 25%

Dichotome uitkomst: Alleen ja/nee waarden. (dood, terugkomen klachten)

B. Hoe precies was de schatting van het effect van de behandeling?

Het ware effect van een behandeling, gevonden in de trial, noemen we de point estimate. Het betrouwbaarheidsinterval (CI) geeft de range waarbinnen het ware effect van de behandeling ligt. Hierbinnen valt in 95% van de gevallen de ware RRR. Dit hangt nauw samen met de statische significante waarde voor P <0.05.

Bij een trial met 100 patiënten in beide groepen en een RRR van 25%, hoort een CI (-38% ; 59%). In dit geval kan er ook sprake zijn van geen tot een zelfs schadelijk effect. Hoe groter de steekproef, hoe groter smaller het CI.
Een trial met 1000 patiënten in iedere groep en een RRR van 25%, levert dan ook een CI (9% ; 41%) op.

De steekproef is dus groot genoeg bij een positieve studie. Dat wil zeggen een laagste grenswaarde boven de 0. Klinisch significant bepaalt de arts echter zelf en hoeft niet gelijk te staan aan statistisch significant (p<0.05). Daarentegen is een kans van 2.5% dat de waarde onder de laagste grenswaarde zo klein, dat een CI van 90% ook de voorkeur kan hebben. Op deze manier verklein je het betrouwbaarheidsinterval zonder dat je een grotere populatie nodig hebt. CI kan ook helpen bij de beoordeling van een negatieve studie. Je kijkt naar de bovenste grenswaarde van de studie, is deze, als de waarde waar is, wel klinisch significant, dan heeft de studie ook niet bewezen dat er geen belangrijk behandeleffect is.

Als de CI niet wordt genoemd, kun je deze op 3 manieren berekenen:

P-waarde: is deze precies 0.05, dan is de onderste grenswaarde precies 0. Als deze lager is dan 0.05, is de onderste grenswaarde groter dan 0.
Standaard error (SE) van de RRR/RR: bovenste en onderste grenswaarden vind je door 2 keer de SE bij de RRR op te tellen of hiervan af te trekken.
Zelf berekenen

Bij een niet dichotome uitkomst is de point estimate ook wel het verschil met de controlegroep. Als de studie negatief is en de bovenste grenswaarde ook niet klinisch significant zou zijn, is de behandeling zeker niet nuttig voor de patiënt

Verbeteren de resultaten de zorg van mijn patiënt? Zijn de resultaten op mijn patiënt van toepassing?

Dit kun je beoordelen door te kijken of de patiënt voldoet aan de inclusiecriteria van de trial en geen van de exclusiecriteria bevat. Mocht aan één van de inclusiecriteria net niet worden voldaan, zijn de resultaten meestal nog wel relevant. Het is daarom beter om de vraag te stellen waarom de patiënt NIET voor de behandeling in aanmerking zou komen.
Indien de patiënt binnen een subgroep valt, waarvoor de behandeling niet effectief schijnt te zijn, is het belangrijk om het verschil in effect goed te beoordelen:

Wat is het voordeel voor de subgroep als het verschil groot is?
Is het heel onwaarschijnlijk dat dit per ongeluk gebeurt?
Zijn de resultaten in de analyse gebruikt als hypothese voor de studie begon?
Één van de subgroepen is geanalyseerd?
De subgroep is ook gebruikt in andere studies.

Hoe minder criteria waaraan de subgroep analyse voldoet, hoe kleiner de kans dat het voor je patiënt gebruikt kan worden.

Zijn alles klinisch belangrijke uitkomsten overwogen?

Bewijs dat de behandeling bepaalde uitkomsten verbetert, is nodig. Daarnaast heb je aanvullende uitkomsten bij de belangrijke uitkomst. Als onderzoekers een positief effect meten met een klinisch belangrijke uitkomst, moeten zij nog wel oppassen dat het geen schadelijk effect heeft op andere uitkomsten.

Er moet dus altijd goed worden gekeken naar de infromatie over directe, vroege en lange termijn mortaliteit.

Wegen de voordelen op tegen de potentiële schade en kosten?

ls de gegevens geldig zijn en van toepassing op de patiënt, is het nog de vraag of het genoeg oplevert. Dit hangt namelijk niet alleen af van het RRR maar ook van het ‘number needed to treat (NNT)’. Stel de patiënt heeft een baseline risico van 1% op doodgaan zonder therapie. RR = 0.75 en RRR dus 25%. Dat wil zeggen dat het risico op dood met behandeling nog 0.01 x 0.75 = 0.0075 is en de absolute reductie 0.01 – 0.0075 = 0.0025. Number needed to treat bereken je vervolgens door: 1 / 0.0025 = 400. Om te voorkomen dat één patiënt sterft, moet je dus 400 patiënten behandelen. Is het baseline risico 10%, zou NNT 40 zijn.

Hoe meer patiënten je zou moeten behandelen, hoe kleiner de kans dat het je patiënt daadwerkelijk iets oplevert.Daarnaast moet gekeken worden naar de mogelijke bijwerken. Stel dat het in 10% van de gevallen moeheid veroorzaakt en het baseline risico 1% is. NNT is dan 400, wat betekent dat het in (400 x 0.1 =) 40 patiënten wel moeheid veroorzaakt. Is het baseline risico groter en NNT dus kleiner, gebeurt dit maar bij 4 patiënten. Desondanks beoordelen we patiënten individueel, wat inhoud dat de therapie wordt gestopt als er indivuele responses optreden. Door de therapie af te breken bij patiënten met bijwerkingen, kun je de rest behandelen zonder dat iemand moe wordt.

Sensitiviteit en Specificiteit

De simpelste test is een test die de groep proefpersonen in twee groepen verdeeld: een groep waarbij een symptoom of teken aanwezig is en een groep waarbij dit ontbreekt. Om te kijken hoe goed een test is, kijk je hoeveel mensen juist zijn gediagnosticeerd. Sensitiviteit is de proportie van echt positieve (dus echt zieke mensen) die positief zijn getest. Dit is dus (echt ziek / test positief), het aantal mensen met een positieve test die echt positief zijn delen door het totale aantal mensen met een positieve test. Specificiteit is de proportie van echt negatieve mensen die negatief zijn getest. Dit is dus (niet ziek / test negatief), het aantal mensen met een negatieve test die echt negatief zijn delen door het totale aantal mensen met een negatieve test. Omdat het hierbij over proporties gaat, kunnen betrouwbaarheidsintervallen hierover gemaakt worden.

Positief en negatief voorspellende waardes

We maken een diagnostische test om een diagnose te stellen, en hebben daarbij niet zoveel aan de sensitiviteit en specificiteit. Daarom gebruiken we de positief voorspellende waarde (PPV) en de negatief voorspellende waarde (NPV). De eerste is het aantal mensen met een positieve test onder de populatie mensen die echt positief zijn, dus (test positief / echt positief). Dit bereken je door het aantal positief geteste mensen te delen door het totale aantal echt positieve mensen. De negatief voorspellende waarde is het aantal mensen met een negatieve test onder de populatie mensen die echt negatief zijn, dus (test negatief / echt negatief). Dit bereken je door het aantal negatief geteste mensen te delen door het totale aantal echt negatieve mensen. De voorspellende waardes hangen sterk af van de prevalentie van een ziekte. Hoe zeldzamer de ziekte, des te zekerder kan je zijn dat een negatieve test betekent dat een persoon de ziekte niet heeft (de negatief voorspellende waarde wordt dus groter bij een lage prevalentie). De positief voorspellende waarde wordt echter kleiner, omdat er minder kans is op de ziekte, ook bij een positieve test. De PPV is uit te rekenen met sensitiviteit*prevalentie+(1-specificiteit)*(1-prevalentie)*specificiteit*(1-prevalentie). De NPV is uit te berekenen met (1-sensitiviteit)*prevalentie+specitiviteit*(1-prevalentie). Hieruit volgt opnieuw dat een lage prevalentie lijdt tot een lage PPV, al zijn de specificiteit en sensitiviteit hoog. Daarom zullen de meeste positieve testresultaten vals zijn bij zeldzame ziektes.

Kansen

De prevalentie noemen we ook wel de a priori kans (vooraf kans), omdat dit de kans aangeeft om een ziekte te krijgen, voordat er tests zijn gedaan. Dit bereken je door de prevalentie te delen door (1-prevalentie). De PPV en NPV vormen de achterafkans. Het verschil tussen de vooraf- en achterafkans is een maat om het nut van een test aan te geven. Hiervoor gebruiken we ook de likelihood ratio, die het verschil in kans aangeeft tussen een positieve test als je gezond bent en als je ziek bent. Deze bereken je met (1-specificiteit). Een hoge likelihood ratio geeft aan dat een test nuttig is, maar betekent niet dat een positieve test altijd een ziek persoon aangeeft.

Eenzijdige en tweezijdige tests

Meestal beginnen we een onderzoek vanuit de nulhypothese (H0). De nulhypothese gaat er vanuit dat er geen verschil is tussen de populatie en de uitkomst van de steekproef. De alternatieve hypothese zegt dat de nulhypothese niet waar is en er dus wel een verschil is. Zowel de nulhypothese als de alternatieve hypothese zegt niet of het verschil beter of slechter is. Hierbij doet men een tweezijdige test, waarbij zowel positieve als negatieve uitkomsten worden beredeneerd. Het kan ook zijn dat de nulhypothese verworpen wordt en dat de alternatieve hypothese is dat er een positieve uitkomst is. Dan is een eenzijdige test geschikt, waarbij vaak niet van belang is wat de negatieve effecten zijn.

Het gevaar met eenzijdige tests is dat de significantie groter is, omdat je niet 2,5% aan beide kanten van de grafiek hebt, maar 5% aan een kant. Hierdoor is een resultaat met positieve resultaten sneller significant. Eigenlijk wordt een eenzijdige test alleen gedaan als een verschil naar een van beide kanten hetzelfde resultaat heeft als geen verschil, waardoor die ene kant kan worden uitgesloten. Meestal worden tweezijdige tests gebruikt, omdat dan ook negatieve effecten naar boven kunnen komen.

De normale verdeling

Het patroon dat we krijgen wanneer we een grote hoeveelheid individuen meten, noemen we de verdeling. De meest gebruikte (theoretische) verdeling is de normale verdeling. Een normale verdeling kan er normaal verdeeld of scheef verdeeld uitzien. Een scheve verdeling komt vaker voor. Vaak hebben de (kleinere) steekproeven dan ook geen normale verdeling, maar vormen ze samen met andere steekproeven een populatie die wel een normale verdeling heeft. Hoe meer data, hoe normaler de verdeling eruit zal zien. Het is soms ook niet aan een steekproef te zien of deze uit een normaal verdeelde populatie komt. Soms helpt het om de waardes om te zetten, bijvoorbeeld door de wortel of log te nemen. Volgens de centrale limietstelling hebben veel biologische waardes een normale verdeling, omdat er een tendens naar het midden is. Bij binaire tests heb je ook een normale verdeling, maar alleen als de steekproef groot genoeg is.

Afwezigheid van bewijs is geen bewijs van afwezigheid

Er is vaak de misinterpretatie dat niet-significante uitkomsten negatief zijn en dat er dus geen verschil optreedt. Als er uit een test komt dat er geen verschil is (p is groter dan 0,05) dan wil dat niet altijd zeggen dat de H0 wordt aangenomen en de alternatieve hypothese verworpen moet worden. Dit komt omdat niet elke steekproef goed is, de steekproef kan te klein zijn, afwijkend zijn of er kunnen fouten gemaakt zijn. Ook kan het omgekeerde gebeuren, een H0 wordt afgewezen terwijl lang niet alle steekproeven een significantie van p<0,05 hadden. Het afwezig zijn van bewijs is geen bewijs dat de alternatieve hypothese niet waar is (absence of evidence is no evidence of absence). Omdat het bewijzen dat een verband tussen A en B niet bestaat vrijwel onmogelijk is, moet er gezocht worden naar een bewijs die tegen het verband tussen A en B is.

Analyse van variantie

Veel testen maken gebruik van meerdere steekproeven. Een t-toets gaat ervan uit dat de groepen van de steekproef een normale verdeling en dezelfde standaarddeviaties hebben als de populatie. Een t-toets kan gepaard of niet gepaard zijn. Als je meer dan twee groepen wilt vergelijken, gebruik je een ANOVA (analyse van variantie) heet. De eerste kolom in zo'n test toont de som van de kwadraten, de tweede de vrijheidsgraden (n-1, waarbij n het aantal groepen is) en de derde kolom de som van de kwadraten gedeeld door de vrijheidsgraden. Volgens de nulhypothese is er geen verschil in de groepen en is de verwachte ratio 1. De variatie tussen de groepen noemen we F, hoe groter F hoe meer verschillen. In speciale tabellen kan je zien of deze F een p waarde onder de 0.05 representeert. De waarde F zegt evenveel als de uitkomst van twee t-toetsen, dus geldt F=t². Als er eenmaal een verschil gevonden is, kan met t-toets tussen elk tweetal steekproeven (dus 1 en 2, 2 en 3, 1 en 3 etc) gekeken worden waar dat verschil dan zit. De eerste stap, de ANOVA test, zorgt ervoor dat we dit laatste onderzoek, wat veel tijd kost, alleen hoeven uit te voeren als er daadwerkelijk een verschil gevonden is.

Subgroepen vergelijken

Het lijkt logisch om twee subgroepen apart te observeren en testen, maar dit is niet de goede manier. Als je twee subgroepen apart bekijkt, krijg je daar twee P waardes uit. Je bent geneigd deze te vergelijken, maar dit is niet goed. De P waarde zegt namelijk niks over de mate van effect, alleen of er effect is gemeten of niet. Daarbij kunnen verschillen in P waarde veroorzaakt worden door een (te) kleine steekproef. Wat je wel moet doen is de directe effecten op de subgroepen met elkaar vergelijken.

Standaarddeviatie en Standaarderror

e termen 'standaarddeviatie' en 'standaarderror' worden vaak door elkaar gehaald. Standaarddeviatie (SD) is een maat van spreiding. Hiermee kan de normaalwaarde (referentieinterval) worden bepaald, waarbij 95% van de verzamelde data ligt binnen twee (eigenlijk 1,96) standaarddeviaties aan iedere kant vanaf het gemiddelde. De overige 5% kan verspreid aan beide kanten, of aan een kant liggen. De standaarderror (SE) geeft aan hoeveel het gemiddelde van een steekproef kan verschillen van het gemiddelde van de populatie. Je kan dit ook zien als een maat van precisie van de steekproef. De standaarderror is uit te rekenen door de standaarddeviatie te delen door de wortel van de grote van de steekproef (s.e. = ϭ/n). Hieruit volgt dat de standaarderror kleiner wordt als de steekproef groter wordt. Als we willen zeggen hoever data uit elkaar ligt, gebruiken we SD. Als we onze onzekerheid over een steekproef willen uiten, gebruiken we SE. Met het SE maken we ook het betrouwbaarheidsinterval, dit vormt 95% van alle data aan beide kanten van het gemiddelde, dus 1,96*SE. Hiermee kan de P waarde worden uitgerekend. Vaak worden SD en SE aangegeven als ±. Soms wordt hier niet bij vermeld of het om SD of SE gaat.

Parametrische en non-parametrische methoden

De meeste medische data is continu (kan alle waardes tussen bepaalde grenzen aannemen). Analyses kan je in twee groepen verdelen: die met aannames en die zonder. Theoretische verdelingen maken gebruik van aannames, namelijk het gemiddelde en de standaarddeviatie. Deze testen noemen we parametrisch, een voorbeeld hiervan is de (gepaarde of ongepaarde) t-toets of de ANOVA-toets. Ze nemen aan dat de data volgens een normale verdeling verdeeld is. Alternatieve tests, zoals de Wilcoxon rangtekentoets en de Mann-Whitney toets, volgen geen vaste verdeling maar gebruiken alleen de data zelf en de mediaan met kwartielen. Dit noemen we niet-parametrisch. Deze toetsen zijn ongeveer even krachtig als parametrische, maar zijn veel handiger voor scheve data omdat ze minder snel beïnvloed zijn. Door de data te transformeren kan scheve data ook parametrisch geanalyseerd worden. Testen met veel mogelijke uitkomsten worden vaak parametrisch geanalyseerd, testen met slechts een beperkt aantal waardes met proportionele testen.

Parametrische metingen hebben het voordeel ten opzichte van niet-parametrische en proportionele metingen dat zij aannames en betrouwbaarheid duidelijk aangeven. Proportionele metingen hebben ook het nadeel dat ze te weinig generaliseren.

Join World Supporter

for free to follow other supporters, see more content and use the tools
for €10,- by becoming a member to see all content

Waarom een account aanmaken?

Je WorldSupporter account geeft je toegang tot alle functionaliteiten van het platform
Zodra je bent ingelogd kun je onder andere:
- pagina's aan je lijst met favorieten toevoegen
- feedback achterlaten
- deelnemen aan discussies
- zelf bijdragen delen via de 7 WorldSupporter tools

Follow the author: Medicine Supporter

Medicine Supporter

Content is used in bundle

Medische wetenschappen - Geneeskunde - Bundel

Academische en Wetenschappelijke Vorming (AWV): Samenvattingen, uittreksels, aantekeningen en oefenvragen - UL

Main study and working fields

Access level of this page

Public
WorldSupporters only
JoHo members
Private

Statistics

[totalcount]

Content categories

Learn & Study

Goal 4: Quality Education

Universiteit Leiden en studieverenigingen

Medicine & Health Care

Comments, Compliments & Kudos

Add new contribution

Promotions

Je vertrek voorbereiden of je verzekering afsluiten bij studie, stage of onderzoek in het buitenland

Study or work abroad? check your insurance options with The JoHo Foundation

More contributions of WorldSupporter author: Medicine Supporter

WorldSupporter Resources

Academische en Wetenschappelijke Vorming (AWV): Samenvattingen, uittreksels, aantekeningen en oefenvragen - UL

In deze bundel zijn samenvattingen, oefenmaterialen en aantekeningen samengevoegd voor het lijnonderwijs Academische en Wetenschappelijke Vorming (AWV) voor de opleiding Geneeskunde, aan de Universiteit van Leiden

Heb je zelf samenvattingen en oefenmaterialen? Deel ze met je medestudenten!

Study Notes bij Academische Wetenschappelijke Vorming - Jaar 1 - Geneeskunde UL (2019-2020)

Study Notes bij Academische Wetenschappelijke Vorming - Jaar 1 - Geneeskunde UL (2016-2017)

Samenvatting literatuur bij Academische en Wetenschappelijke Vorming - Geneeskunde UL

Study Notes bij Academische Wetenschappelijke Vorming - Jaar 1 - Geneeskunde UL (2015-2016)

Study Notes bij Academische Wetenschappelijke Vorming - Jaar 2 - Geneeskunde UL (2015-2016)

Study Notes bij Academische Wetenschappelijke Vorming - Jaar 2 - Geneeskunde UL (2014-2015)

Study Notes bij Academische Wetenschappelijke Vorming - Jaar 2 - Geneeskunde UL - Deel 1 (2013-2014)

Samenvattingen en studiehulp voor Geneeskunde Bachelor 1 aan de Universiteit Leiden