Deze samenvatting is gebaseerd op het studiejaar 2013-2014.
- HC Inleiding (maandag 6 januari 2014, 14.30)
- HC Vraagstelling en opzet van onderzoek (maandag 6 januari 2014, 15.30)
- HC Regulering en medischethische toetsing van wetenschappelijk onderzoek met mensen (maandag 6 januari 2014, 16.30)
- HC Studieprotocol (dinsdag 07 januari 2014, 8.30)
- HC Laboratoriumonderzoek (dinsdag 08 januari 2013, 9.30)
- HC Bias en confounding (dinsdag 07 januari 2014, 10.30)
- HC Onderzoek met gegevens uit registraties (dinsdag 07 januari 2014, 11.30)
- HC Zoeken naar literatuur deel 1 en 2 (dinsdag 07 januari 2014,13.30)
- HC Vragenlijst onderzoek (donderdag 09 januari 2014, 11.30)
- HC Meten en reproduceerbaarheid (donderdag 10 januari 2014, 12.30)
- HC Pragmatisch en economisch onderzoek (donderdag 10 januari 2014, 13.30)
- HC Statestiek bij onderzoek deel 1 (donderdag 10 januari 2014, 14.30)
- HC Statistiek bij onderzoek deel 2 (donderdag 10 januari 2014, 15.30)
- HC Analyse van overlevingsdata (vrijdag 10 januari 2014, 11.30)
- HC Confounding - statistische aspecten (vrijdag 10 januari 2014, 12.30)
HC Inleiding (maandag 6 januari 2014, 14.30)
Doelstelling van het blok Praktische Onderzoeksvaardigheden:
- een voorbereiding op de wetenschapsstage leidt tot betere stages,
- kennis van methodologie van onderzoek,
- praktische onderzoeksvaardigheden.
Wat gaan we leren dit blok?
- Opzet van een onderzoek
- Formuleren vraagstelling, ethiek , wetgeving
- Protocol/ onderzoeksplan
- Bias en confounding
- Literatuur zoeken
- Verschillende soorten onderzoek: labonderzoek, vragenlijstonderzoek, registratieonderzoek, pragmatisch onderzoek, kwaliteit van leven en economisch onderzoek
- Analyse en interpretatie van onderzoeksresultaten
- Metingen
- Uitvoeren van het onderzoek
- Opslaan van gegevens
- Statistische analyse van gegevens
- Het interpreteren van resultaten
- Schrijven en presenteren van onderzoeksaanvraag
- Uitvoeren van statistische analyse
- Praktische vaardigheden
Toetsing:
Week 2 van dit blok eindigd met een theoretische deeltoets: 40 MC, voorbeeldvragen op BB.
Leerstof uit blokboek. Open boek tentamen: artikelen, aantekeningen, grafische rekenmachine, geen oude deeltoetsen
Wetenschapsaanvraag: WG 2,u schrijft een wetenschapsaanvraag over eigen onderzoek of aan de hand van 2 artikelen. Eerste versie een dag voor de WG inleveren per email, in WG krijg je feedback en hierna kun je de aanvraag verbeteren en de uiteindelijke aanvraag eind van het blok inleveren.
- Theoretische deeltoets van 2,5 uur: 35%. Het bestaat uit ongeveer 40MC vragen, open boek tentamen: boeken, artikelen, aantekeningen, grafische rekenmachine. De leerstof en voorbeeldvragen staan in het blokboek en op blackboard.
- Onderzoeksaanvraag opdracht: 30%
- Statistiek opdracht: 35%
- Keuzeonderwerp: actieve deelname
HC Vraagstelling en opzet van onderzoek (maandag 6 januari 2014, 15.30)
Een publicatie is een toevoeging aan de totale literatuur over het onderwerp en vormt daarmee de terugkoppeling dat het systeem tot een cyclus maakt. Een volgende persoon gaat hier vaak weer verder mee. Goed ondezoek heeft zijn basis in een goede vraagstelling. De vaste opbouw van ieder wetenschappelijk artikel is als volgt:
- Inleiding met daarin de probleemstelling en literatuur.
- Vraagstelling
- Methode met daarin methode en dataverzameling.
- Resultaten met daarin analyse
- Discussie waarin de interpretatie vermeld wordt.
Deze opbouw is het logische vervolg van de empirische cyclus van een onderzoek. Elk onderzoek doorloopt een empirische cyclus ( = draaiboek onderzoek):
- Probleemstelling
- Literatuur raadplegen over het onderwerp
- Vraagstelling
- Methode
- Dataverzameling
- Analyse
- Interpretatie van de resultaten
- Publicatie
De basis van een goed artikel begint dus met een idee. Vervolgens vindt de theoretisch uitwerking plaats waar een vraagstelling uit volgt. Uit de praktische uitwerking volgt dan de onderzoeksopzet.
Een begin van onderzoek ontstaat vaak doordat er vraag is vanuit de klinische zorg, vanuit eigen observatie, een hiaat (=gat) in de kennis, vanuit eigen ervaring, een onverwachte bevinding in eerder onderzoek, iemand leest wat en gaat daar wat mee doen, observatie in eerder onderzoek of overheidsvraag naar gezondheidsrisico’s.
Van idee naar vraagstelling:
- Aanscherpen: precies, concreet en duidelijk, beperkt, wetenschappelijk, onderzoekbaar, relevant
- Inperken om een heel preciese en concrete vraagstelling te hebben waardoor het ondezoekenbaar is en de conclusie duidelijker wordt.
Wetenschappelijk en onderzoekbaar: bijvoorbeeld: bestaat God? Hier is geen methode voor om dit te onderzoeken. Het is een filosofische kwestie. Helpt bidden? Ja, dit is te onderzoeken.
In de epidemiologie moet een vraagstelling de volgende drie aspecten bevatten: blootstelling/ determinant (risicofactor, interventie, etc) die leidt tot een bepaalde uitkomst binnen een bepaald domein (categorie, patientengroep, sekse, etc)
Bij de gang van vraagstelling naar opzet is het belangrijk te achterhalen welke aanvulling van kennis van etiologie / prognose / therapie nodig is, welke tabel (2 x2) of figuur nodig is en welke opzet volgt daaruit? Het is heel belangrijk om het mechanisme van determinant op uitkomst goed te begrijpen en integreren in het onderzoek. Verder is het definieren van determinanten cruciaal: als sporten gezond is moet gedefinieerd worden hoeveel van welke soort sport dan gezond is.
Van de vraagstelling moet een optimale onderzoeks opzet gevonden worden. Research designs in de epidemiologie:
Cohort (of follow-up) onderzoek: je hebt 2 groepen, waarvan 1 groep is blootgesteld en de andere groep niet. Beide groepen volg je over de tijd en je kijkt hoeveel er ziek worden. Hiermee kun je bereken:
- Absoluut risico:
cumulatieve incidentie (incidence risk: nieuwe gevallen / totaal aantal mensen. Nadeel hiervan is dat niet iedereen even lang met de studie meedoet.
Incidentiecijfer (incidence rate): nieuwe gevallen / totaal x gevolgde tijd. Hierbij wordt een cijfer gegeven aan de bijdrage per individu aan de studie. - Relatief risico: incidentiecijfers op elkaar delen (rate rato) of cumulatieve incidenties op elkaar delen (risk ratio).
- Therapeutisch onderzoek wordt gerandomiseerd gedaan.
- Analysetechnieken: kaplan-Meier overlevingscurves (van risk ratios en rate ratios) en cox regressie analyse (van rate ratios)
Cohort studie versus RCT:
- RCT: experiment: Blootstelling wordt door toeval (random) toegewezen.
- Cohort: observationeel: blootstelling ligt vast, is al bepaald door patiënt of omstandigheden
Cohortstudie versus case control studie:
- Cohort: blootstelling leidt tot ziekte
- Case controle: ziekte ontstaat door onbekende blootstelling (achteraf bekijken of de zieken blootgesteld zijn)
Odds: verhouding van kansen dat de gebeurtenis plaatsvindt en dat de gebeurtenis niet plaatsvindt. Als het optreden van een gebeurtenis 3x zo waarschijnlijk is als niet optreden, dan zijn de odds 3 tegen 1. De kans van optreden is in dit geval ¾.
Kans = met / alle
Odds = met / niet = p / (1-p)
Relatief risico: incidentiecijfer blootgesteld / incidentiecijfer niet blootgesteld
In een case control onderzoek worden de odds ratio berekend als een relatief risico.
Case control onderzoek
- verzamel cases
Stel blootstelling vast (wel/niet)
- verzamel controles
- Stel blootstelling vast
- bereken odds ratio, wat dan hetzelfde is als het relatief risico.
- Analysetechnieken: logistische regressie.
(Contra)-indicaties cohort onderzoek:
- Voordeel is dat je het absoluut risico (en relatief risico) kunt bereken.
- meting voor de uitkomst
- inefficiënt, grote cohorten nodig
(contra)- indicaties case-control onderzoek:
- Makkelijk om relatief risico te krijgen. Je hebt alleen geen absoluut risico (incidentie)
- meting na de uitkomst (post-hoc fenomenen), de relatie kan dan andersom causaal zijn.
- kortdurende blootstelling
Meestal keuze voor case-control onderzoek tenzij:
- je het absolute risico wilt weten
- de blootstelling heel zeldzaam is
- je zeker wilt zijn dat de blootstelling voor de ziekte is gemeten
- je een behandeling wilt onderzoeken (dan is een RCT de studieopzet)
1/4500 absoluut risico trombose. Vliegen 2-3 keer hoger risico. Risicofactoren: lang/klein, dik, pilgebruiksters, genetisch. Preventie niet bekend.
HC Regulering en medischethische toetsing van wetenschappelijk onderzoek met mensen (maandag 6 januari 2014, 16.30)
1747: Scheurbuik. De eerste RCT met 12 scheurbuikpatiënten simultaan in 6 groepen, behandeling met respectievelijk cider, vitriool, azijn, zeewater, citrusfruit en nootmuskaat. Citrusfruit behandeling was overduidelijk beter en dit was de eerste aanwijzing dat scheurbuik een vitamine C deficientie is. Er gebeurde niets met het resultaat van dit onderzoek.
In 1900 (Pruisen) werd de eerste ministeriële regeling opgesteld over “proeven met mensen” en “medische experimenten buiten de therapeutische setting”. Dit naar aanleiding van een riskant syfilis experiment uitgevoerd door prof. Albert Neisser met als doel onderzoek naar mogelijkheden tot vaccinatie. De acht jonge vrouwen werden geïnjecteerd met syfilis waarvan 4 intraveneus en 4 subcutaan. Er werd geen voorlichting gegeven of toestemming gevraagd. De vrouwen die intraveneus geïnjecteerd werden kregen daarna syfilis.
Regeling van Pruisen (1900):
Geen medische proeven met minderjarigen en wilsonbekwamen, zonder toestemming van de proefpersoon of zonder adequate info voorafgaand aan toestemming. Nadere bepalingen: alleen met toestemming van leiding van instelling, nauwgezette documentatie dat aan alle voorwaarden is voldaan + documentatie onderzoeksprocedures, deze regeling geldt niet voor curatieve, diagnostische en preventieve gezondheidzorg. Hierin zie je elementen terug die ook heden ten dagen nog gelden!
Casus van Schloendorf: patiënte werd tegen haar wil in geopereerd. Zij ging naar de rechter, die deed de volgende uitspraak: Verenigde Staten, 1914: “Every human being of adult years and sound of mind has a right to determine what shall be done to his own body; and a surgeon who performs an operation without his patient’s consent commits an assault, for which he is liable in damages”
Hieruit vloeide het toestemmingsbeginsel, in eerste instantie in verband met de behandeling van patiënten, later ook in verband met onderzoek en proefpersonen. De gangbare term hiervoor nu is informed consent.
In Nazi Duitsland (1933-1945) zijn veel medische experimenten op (krijgs)gevangen uitgevoerd. Onder andere hoogte-experimenten, afkoeling, behandeling van vlektyfus, farmacotherapie bij wondinfecties en chirurgische technieken. Echter, ook tijdens de oorlog in Japan proeven op gevangenen en geïnterneerden met o.a. miltvuur, cholera, builenpest, malaria, tyfus, tetanus, gasgangreen, etc. De artsen die dit hebben gedaan zijn berecht in Neurenberg (23 beklaagden, 7 doodvonnissen, 7 vrijspraken en 9 langdurige vrijheidsstraffen) en Chabarowsk (12 beklaagden, veroordeeld tot 2-25 jaar werkkamp, vrijgelaten 1956). Na de oorlog zijn codes en verklaringen opgesteld: de code van Neurenberg (“The voluntary consent of the human subject is absolutely essential) en de verklaring van Helsinki (1964). Hierbij wordt onderscheid gemaakt tussen therapeutische (mogelijk gezondheidsvoordeel) en niet therapeutisch (nooit gezondheidsvoordeel) onderzoek en tussen onderzoek met patiënten of gezonde vrijwilligers. Er vindt nu ook ethische toetsing door medisch ethische toetsingcommissies plaats bij onderzoek. Ook uitgevers kijken bij publicatie of het onderzoek wel ethisch is.
In de jaren ‘60: Softenon Affaire. Softenon (thalidomide = angiogenese-remmer) werd voorgeschreven aan zwangere vrouwen tegen ochtendmisselijkheid in het eerste trimester van de zwangerschap. Er werden heel veel gehandicapte kinderen geboren: misvormingen, neurologische schade en afwezigheid van handen en voeten. Dit was het gevolg van het gebruik van softenon. Het was in deze tijd nog mogelijk om geneesmiddelen op de markt te brengen zonder dat er veel onderzoek naar was gedaan. De Softenon affaire luidt het begin van het tijdperk van patiëntgebonden onderzoek, registratie eisen, GCP (good clinical practice) en IRB’s in.
Wetenschappelijk onderzoek met mensen moet wetenschappelijk van belang zijn (deugen, belang, kwalificatie onderzoeker en locatie), medisch ethisch getoetst worden en er moet informed consent gegeven worden. Informed consent is subjectief (volledigheid, begrijpelijkheid, vrijwilligheid) en objectief (mag/wil je zoiets aan iemand vragen?). De eerste belangrijkste ethische eis is een waardevolle wetenschappelijke vraag en een kloppende methodologie. Zonder deze is elk klinisch onderzoek onethisch.
Er zijn specifieke wetten gemaakt die tot doel hebben het handelen van professionals te normeren. Specifieke wetten m.b.t. medisch-wetenschappelijk onderzoek zijn:
- Wet Medisch wetenschappelijk onderzoek (1998)
- Wet Bescherming Persoonsgegevens
- Wet Geneeskundige Behandelingsovereenkomst
- Wet Bevolkingsonderzoek
- Wet op dierproeven
- Bepalingen in specifieke wetten.
De WMO definieert wetenschappelijk onderzoek als onderzoek waarvan deel uitmaakt het onderwerpen van personen aan handelingen of het opleggen aan personen van een bepaalde gedragswijze. (Art.1 lid 1 sub b WMO (1998))
Toetsingscriteria WMO:
- Voorwaardelijk verbod onderzoek met minderjarigen en wilsonbekwamen (art. 4)
- Voorwaardelijk verbod onderzoek met afhankelijke personen (art. 5)
- Verbod onderzoek zonder informed consent (art. 6)
Morele problemen in de onderzoeksmethodologie:
- Placebo: element van bedrog, informed consent is belangrijk om over het risico van onderbehandeling te informeren.
- Randomisatie:
- Pre-randomisatie: is uiterst omstreden.
- Sham-procedures: blinderen?
- Niet-therapeutisch onderzoek met wilsonbekwame: altruisme van proefpersonen, maar niet ethisch met wilsonbekwame proefpersonen.
- Trials in ontwikkelingslanden: de beste beschikbare behandeling vs. de in dat land beschikbare behandeling. Zou het geen exploitatie zijn? Of is het juist een goede manier om te investeren in de gezondheidszorg in ontwikkelingslanden?
- Ook over non-resultaten moet gepubliceerd worden.
- Biobank onderzoek: zonder een bekend doel wordt lichaamsmateriaal verzameld om in de toekomst er wellicht iets mee te kunnen doen voor onderzoek.
Incidenten in NL:
1978: Huize Assisië te Udenhout
1998: Fraude van neuroloog bij geneesmiddelenonderzoek (almelo)
2003: hyperthermie studie UMC utrecht
2006: stamcelonderzoek Med. Spectr. Twente, Enschede
2008: probiotica studie UMC utrecht
2011: fraude bij pijn-onderzoek UMC nijmegen
2011: fraude bij cardiovasculair onderzoek ErasmusMC
Uiteindelijk is de beste bescherming van patiënt en proefpersoon is een integere en gewetensvolle onderzoeker. Met regelingen / wetten / ordeningen op zichzelf is nog niet alles geregeld, je hebt ook mensen nodig die fatsoenlijk zijn.
HC Studieprotocol (dinsdag 07 januari 2014, 8.30)
Medische research wordt gedaan om de patiënt beter te helpen en meer van de ziekte te snappen.
Het is belangrijk voor aanvang van een onderzoek een goed studieprotocol te schrijven. Dit doe je zowel voor jezelf (als houvast; wat ga je doen, waarom; voor je eigen planning en als opstap voor je verslag) alsmede voor anderen (goedkeuring stage- en medisch ethische commissie en evt. voor subsidieaanvraag).
Wet en protocol(richtlijnen bij het uitvoeren van onderzoek):
- WOG = Wet op de Geneesmiddelenvoorziening.
- GCP = Good clinical practice = afspraak tussen onderzoekers en industrie over onderzoek doen. Dit is niet helemaal wettelijk, maar moet wel toegepast worden: er moet eindeloos geregistreerd worden en overal moet toestemming voor verkregen worden.
- WMO: Wet medische Wetenschappelijk Onderzoek.
- CCMO: Centrale Commissie voor Medisch Wetenschappelijk Onderzoek
- METC: Medisch Ethische Toetsingscommissie
- EU: European Directive on Clinical Trials
- ICH: International Conference on Harmonisation of Technical Requirements of the Registration of Pharmaceuticals for Human Use.
Hoe schrijf je een protocol?
- Wetenschappelijke aspecten
- Wetenschap in het protocol
- “Hoe verkoop ik mijn idee?” de stagecommissie moet je aanvraag goedkeuren.
- Zorg ervoor dat het onderzoek zo in elkaar zit dat je ondanks non-resultaten iets kunt vertellen.
Protocol volgorde:
- Relevant (brede) problem = Onopgelost dilemma
- Hypothese/vraagstelling: volgt uit het relevant probleem en onopgelost dilemma.
- Doel: hypothese testen in bepaalde populatie, met bepaalde opzet,
- Eindpunten: Wat levert een negatief antwoord op? Wat zeg/ doe je als blijkt dat het antwoord op jouw hypothese negatief is.
Wat moet er worden vermeld in een protocol:
Voor wetenschapspagina zal het een kort protocol zijn (1 pagina), maar voor werkelijk onderzoek vraagt een uitgebreider protocol. In ieder geval moeten de volgende elementen verwerkt worden:
- Titel pagina
- Samenvatting: zet toon, omschrijft het plaatje waar het om gaat.
- Achtergrond/rationele: Dit is een betoog waarin staat waar het idee vandaan komt en waarom het antwoord belangrijk is.
- Hypothese/vraagstelling: wat willen we precies weten. Achtergrond/betoog mondt uit in een vraagstelling.
- Doel: vaak het toetsen van hypothese, oplossen van het probleem, ligt deels bij hypothese.
- Eindpunten beschrijft de optimale uitkomst van de interventie: genezing, minder schoolverzuim, pijnbestrijding. Er is een verschil tussen een middel dat werkt en dat helpt.
- Studiepopulatie (proefpersonen): aantal, hoe geselecteerd, in- exclusiecriteria (afhankelijk van over welke groep je uitspraak wil doen), controlegroep, subgroepen
- Opzet: wat voor studie wordt gebruikt (Follow-up, Case-control studie) – “design” moet erin
- Interventie
- Meetmethode: metingen - welke gegevens verzamel je, hoe vaak en wanneer, procedures (SOP) (bijv. onderzoek staand of liggend uitvoeren), variabelen met eenheden, definitie en classificatie over de eindpunten, apparaat met ijking en detectie limiet.
- Analyse:
- Variabelen: berekening, transformatie, reproduceerbaarheid
- Statistiek: welke test, ‘sample-size’ of ‘power’ berekening, missing data, confounders. De power die je nodig hebt: hoe meer mensen, hoe groter de significatie. Gebruik in de berekening voor de benodigde sample size de aannames (assumptions).
- Data management: vastleggen van gegevens (welk programma zou je ervoor gebruiken), logistiek van aanleveren, hoe gaat het de computer in (invoer in computer), kwaliteitscontrole (fouten herkennen), beheer database, back-up!!!
- Referenties
- Ethische aspecten in geval van klinisch onderzoek: o.a. hoe om toestemming gevraagd wordt. De aanvraag wordt dan beoordeeld door de Medisch Ethische Commissie, hou er rekening mee dat dit ongeveer een maand zal duren en dat er mogelijk wijzigingen gevraagd worden.
- Informatie voor leken – van belang, zodat patiënten en patiëntenorganisatie mee kunnen praten.
- Appendices: bijlagen. SOP (Standard Operating Procedures) is een draaiboek over bijv. een bepaald onderzoek/meetmethode dat uitgevoerd moet worden tijdens de studie.
Om van onopgelost dilemma naar antwoord te gaan, worden al deze stappen eerst ondergaan.
Er is beschreven dat bij chronische ontsteking kan leiden tot atherosclerose. Er is een samenhang gebleken tussen malnutrutie, inflamatie en atherosclerose. Duidelijk oorzaak-gevolg relatie is onbekend, hierdoor stelt men dat CRP specifiek marker is.
Het doel van studie-hypothese is te toesten:
- In de populatie
- Met die opzet
- En die eindpunten
Voorbeeld eindpunten van de studie:
- Primair: belangrijkste eindpunten, zoals CRP gerelateerd aan mortaliteit
- Secundair: CRP gerelateerd aan cardiovasculaire ziekten
- Tertiair: CRP gerelateerd aan niet-cardiovasculaire ziekten
Het doel is de studie-hypothese te toetsen bij beginnende dialyse patiënten in prospectief cohort onderzoek. Wat levert een negatief antwoord? Er kan veel ruis zitten in verzameling of door een te kleine populatie, waardoor antwoord geen verklaring levert. In dit voordbeeld: Stel dat CRP aan geen enkel eindpunt gerelateerd is (negatieve uitkomst), dan is dat ook een resultaat: CRP is dan meer een marker voor algehele ellende dan een specifieke rol in de ontwikkeling van atherosclerose.
Studiepopulatie
- Aantal, hoe geselecteerd, door wie?
- Inclusie-(doelgroep van onderzoek, domein van onderzoek) en exclusiecriteria (technisch gezien mogen deze mensen er niet in, omdat er complicaties kan optreden)
- Controlegroep, subgroep
Metingen: Hoe vaak en wanneer verzamel je welke gegevens. Procedures. variabelen eenheden. definitie, classificatie. apparaat, ijking, detectielimiet. Kwaliteitscriteria. Referenties.
Hoe zorg je dat data op goede manier verzamelt? = Data management
- Vastleggen van gegevens
- Logistiek
- Invoer in computer
- Kwaliteitscontrole – kwaliteit van die gegevens, moet steekproef nemen om dit na te gaan
- Beheer databese – er zitten vaak namen van patiënten in, hierdoor moeten de namen niet in data in; echter namen moeten wel ergens terug te vinden zijn, maar deze moet op klinische afdeling blijven en onderzoeker eraan gekoppelde nummers overhoudt.
- Backups maken
Analyse
1. Variabelen:
- berekening, transformatie (van te voren is het van belang te weten hoe je berekeningen doe)
- Reproduceerbaarheid
2. Statistiek
- welke test bij welke hypothese
- sample size of power berekening - Hoe vaak je meet is van belang voor het bepalen van verschil. Er is minder mensen nodig om een groot verschil te kunnen detecteren.
- missing data
- confounders
Aanvragen wetenschapsstage (waarop let de stagecommissie):
- Schrijf een helder betoog/protocol (probleem, belang, vraagstelling, wat en hoe ga je het doen, haalbaar(aantal patiënten, tijdplanning) – eerste zin is van groot belang).
- Onderzoek moet relevant zijn – een artikel kan eruit komen.
- Onderzoek moet uitvoerbaar en haalbaar zijn (let op tijdsplanning) – een maand de tijd om te schrijven is niet te veel, twee weken is vrij weinig vooral als het schrijven niet je sterkste kant is.
- De vraagstelling moet te beantwoorden zijn – niet te breed beschreven, je moet het toespitsen/inzoomen op één onderdeel.
- In werkplan moet je van te voren weten wat je precies wilt gaan verzamelen.
HC Laboratoriumonderzoek (dinsdag 08 januari 2013, 9.30)
Rol van labonderzoek: doen van bepalingen, vastleggen van mechanismen (hoe werkt het allemaal), nieuwe diagnostiek, nieuwe geneesmiddelen.
Experimentele wetenschappelijke methode(- cyclus):
- Experimenten en data verzamelen
- Hypothese stellen. Dit kan leiden tot
- Uitgebreid getoetste en algemeen geaccepteerde hypotheses worden wetenschappelijke theorieën(kan met behulp van laboratoriumonderzoek)
- Nieuwe hypothese/voorspellingen maken, doe experimenten en verzamel data
Elk antwoord werk een nieuwe vraag, daarom is de cirkel nooit gesloten, maar blijft het een cyclus.
Claude Bernard heeft concept bedacht van constante innerlijke mileu en is vader van wetenschappelijke onderzoek. Hij maakte onderscheid tussen waarnemend en experimenteel onderzoek: waarnemend onderzoek (onderzoeker doet passief metingen zonder in te grijpen in proces dat hij bestudeert) vs. experimenteel onderzoek (actief ingrijpen).
Voorbeeld van een experimenteel onderzoek: trombose en vliegen
- Hypothese relatie vliegen en trombose: immobilisatie of bloedstollingactivatie door hypobare hypoxie.
- Onderzoek: 75 mensen met inclusiecriteria latenvliegen, in een bioscoop zetten of in het dagelijks leven laten bewegen. Rol van het lab is het uitvoeren van bepalingen zoals TAT: stollingsactivatie meten – deze metingen werd in zelfde personen herhaald in de 3 verschillende omgevingen (vlucht, bioscoop en dagelijks leven). Dit zijn proeven op mensen, echter er mag niet altijd zomaar proeven op mensen.
Proeven kunnen worden uitgevoerd op mensen, jonge volwassenen mannen of dierproeven. Er bestaat tegenstand tegen proeven op dieren. Muizen zijn de meest gebruikte proefdieren. Experimenteel onderzoek wordt vaak uitgevoerd op muizen (vooral omdat ze makkelijk genetisch modificeerbaar zijn). Blastocysten kunnen gebruikt worden om de muizen genetisch te manipuleren. Muteren van een muizengen: gemodificeerde cel injecteren in blastocyst, dan implantatie in de muis waardoor genetische veranderingen in de schijnzwangere muis ontstaan (bijv een andere kleur vacht) die doorgekweekt kan worden in meerdere muizen. Tweede rol van laboratorium is het ontwikkelen van experimentele, nieuwe methodes. Door muizen aan laag zuurstofspanning bloot te stellen, kan bevestigen worden of stollingsactivatie optreedt. Er blijkt uit onderzoek met muizen is dat hypoxie belangrijk is bij stijging fibrine. Hoe dit precies werkt is nog niet duidelijk.
Descartes introduceerde het reductionisme: Complexe systemen is een som van meerdere simpele systemen. Dit is belangrijk in laboratorium onderzoek. Dit leidt onder andere tot verschillende onderzoeksmodellen. Het ‘gecontroleerde experiment’ bestaat uit het verzamelen van resultaten van experimentele en controle groep en het vergelijken en analyseren van deze groepen wat leidt tot een conclusie. Experiments of Nature = indirect experimenteel onderzoek:
- Kenmerkend voor genetisch onderzoek naar multifactoriële ziekten(zoals diabetes, HVZ etc.)
- Maakt gebruik van veelvoorkomende DNA-variaties( tussen 2 mensen bestaan er variaties > 1miljoen)
- Het speelt een belangrijke rol voor koppeling aan ‘intermediaire’ fenotypen(kleur ogen, kleur haar, haarstructuur)
- Vaak uitgevoerd in de vorm van een patiënt-controlegroep(case-control): genetische associatie studie
In laboratorium doen we metingen, methoden(muizen), uitdenken en uitvoeren van experimenten. Het genoom tijdperk leidt tot een oneindige hoeveeleheid experiments in nature. Resultaten kunnen gebruikt worden in het ontwikkelen van nieuwe geneesmiddelen.
HC Bias en confounding (dinsdag 07 januari 2014, 10.30)
Bias
Het gebrek aan validiteit.
Bias is appels en peren vergelijken. Als je dat doet kan je het ook niet meer goed gelijk krijgen. Daarom moet je een dergelijke vergelijking van te voren proberen uit te sluiten. Validiteit is de systematische afwijking. Het is van belang om onderscheidt te maken met random fout en systematische fout. Een fout door gebrek aan precisie noemen we toevalsfouten. Fouten door gebrek aan validiteit noemen we systematische fouten of ook wel bias.
Onvergelijkbaarheid, waardoor de onderzoeksresultaten niet betrouwbaar zijn. Bias zit in alle designs (Cohort/Follow-up), de enige oplossing is van tevoren bedenken waar het zit (kan zowel in informatiekant als selectiekant zijn), hoe je het kunt voorkomen (van te voren een beter protocol te maken) en richting van effect veelal inschatten (onder- of overschatten). Problemen zijn op grond van validiteit in de schatten:
- Selectiebias: probleem t.g.v. selectie onvergelijkbare groepen (bijvoorbeeld appels met peren vergelijken).
- Informatiebias: probleem t.g.v. onvergelijkbare informatieverzameling (bijvoorbeeld mensen met longkanker vertellen niet eerlijk dat ze vroeger gerookt hebben, het is geen gestandaardiseerde verzameling van de informatie, er kan bijvoorbeeld een systematisch verschil tussen mannen en vrouwen onstaan in het beantwoorden van deze vraag).
- Confounding: probleem t.g.v. vertekening door andere risicofactoren
Bias = onvergelijkbaarheid, zit in alle designs, maar waar zit de bias? De truc is om te zeggen dat het onbekend is welke kant de bias op zou werken, in je voordeel of nadeel?
Een onderschatting zorgt voor een minder sterk effect dan in de werkelijkheid. Een relatief risico van 1 betekent dat er geen relatie is. Bijvoorbeeld bij onderzoek naar verband van grijs haar en sterfte. Nadat de groepen in leeftijd wordt verdeeld blijkt RR=1, terwijl toen groep samen was RR=1,5. Hierdoor kan effect van grijs haar op sterfte geheel worden verklaard door leeftijd. Leeftijd is dus hoierbij een confounder.
- Bij een follow up onderzoek bestaat vooral gevaar voor selectiebias bij de exposure (bijvoorbeeld rokers willen niet mee doen met onderzoek) en voor informatiebias bij de outcome (bijvoorbeeld alleen hoestende mensen onderzoek je op longkanker).
- Bij een case control onderzoek bestaat vooral gevaar voor informatiebias bij de exposure en voor selectiebias bij de outcome (bijvoorbeeld mensen met longkanker willen niet meedoen).
Dus als je begint aan een studie heb je te maken met een selectiebias en tijdens/bij het einde van een studie met informatiebias.
Confounder
Het ene effect vertroebelt andere effect – de interpretatie wordt beïnvloed, dus verwijderen uit analyse.
- Een confounder is een additionele risicofactor die van invloed is op de uitkomst
- Een confounder is onevenredig verdeeld over de mate van risicofactoren die worden bestudeerd
- Een confounder heeft geen causaal effect op de te onderzoeken risicofactor, want ander is het een mechanisme.
Het is belangrijk om voor confounders te corrigeren (bijvoorbeeld door het uitsplitsen van factoren).
Voorbeeld: Leeftijd (C) heeft een verband met grijs haar (E) en leeftijd en grijs haar (E) heeft ook verband met sterfte (D). Leeftijd is daarom een confounder (C) bij onderzoek naar verband tussen grijshaar en sterfte. Indien je naar verband zoekt tussen leeftijd (E) en sterfte (D), is grijs haar geen confounding. Dus een confounder (C) hangt samen met de te onderzoeken risicofactor (E) en beinvloed de uitkomst (D), ook behandeling. Als een additionele risicofactor (C) zich in het causale pad van de te onderzoeken risicofactor (E) bevindt (dus een gevolg van E), dan is het geen confounder. Correctie is dan niet nodig.
Uit de data zelf kan je niet opmaken of er sprake is van een confounder, er zijn externe factoren nodig. Om een factor aan te duiden als confounder is achterliggende kennis noodzakelijk, voornamelijk over het volgende:
- Is de factor een onafhankelijke risicofactor?
- Kan de factor gerelateerd zijn aan de bestudeerde risicofactor (determinant)?
- Ligt de factor NIET in het causale verband?
Een confounder is vaak ontdekt in vorig onderzoek.
Wat doe je aan confounding?
Voor aanvang van de studie
- Randomisatie (allocate van beide bekende als onbekende confounder – geen selectie bias)
- Restrictie: kijken naar een homogene groep, hierdoor geen variatie (bij mensen model), bijvoorbeeld alleen een oude populatie
- Matching
- Na aanvang studie
- Stratificatie (analyseseparatie voor alle confounderlevels)
- Multivariante analyse (lineaire, logistieke of cox regressie) - per paar of per dag rangschikken.
Alle strategiën (m.u.z. randomisatie) werken alleen bij BEKENDE confounders. Je kunt dus niet corrigeren voor onbekende confounders. Leeftijd en sekse zijn bijna altijd confounders, indien je dat miet bedenkt blijft het bestaan. Anders moet je randomniseren om die factor weg te werken.
Van belang is van te voren oorzaakgevolg te bepalen, zodat correctie voor factoren die geen confounders zijn, krijg je verkeerde conclusie.
HC Onderzoek met gegevens uit registraties (dinsdag 07 januari 2014, 11.30)
Straks ga je zelf wetenschapstage doen, waarbij je uitkomsten krijg( met de vraag: is dat goed? slecht? veel of weinig?). Hoe maak je optimaal gebruik van data? Waar moet je rekening mee houden met al verzamelde data?
Je kan zelf een studie opzetten en data verzamelen. Je kan als bronnen voor je studie gebruik maken van bestaande registraties. Opzet van studie: maken van studieprotocol/vragenlijst, je kan dan zelf al rekening houden met confounding en bias. Bij bestaande registraties heb je dit minder in de hand. Waarvoor kan je ze dan gebruiken?
Bestaande registraties:
- Grote aantallen zijn makkelijk mee te rekenen
- Soms niet bruikbaar (ooit voor een ander doel opgezet)
- Je hebt er zelf geen invloed op het studieprotocol en vragenlijst
- Soorten registraties: www.zorggegevens.nl Hier vind je o.a. onderstaande registraties:
CBS doodsoorzaken statistiek
- Op basis van doodsoorzaakformulier, ingevuld door een arts
- Compleet: het is wettelijk verplicht voor elk sterfgeval
- Er is een check of alle formulieren zijn ingevuld door bevolkingsregister.
- Indeling op basis van ICD-10.
- Primaire doodsoorzaken betrouwbaar, secundaire oorzaak zijn minder betrouwbaar.
- Dit kan gebruikt worden voor onderzoek naar volksgezondheid en follow-up van patiënten.
Landelijke Medische Registratie
- Per opname wordt ontslagdiagnose bepaald door codeur, meestal op basis van ontslagbrief – niet alle ziekenhuizen doen er hier aan mee.
- Vrij volledige dekking (bijna 100%),
- Niet verplicht, daarom geen 100% dekking
- Dekking verschilt per ziekenhuis, de codeur moet invullen. Als er geen terugkoppeling tussen codeur en arts zal de ontslagdiagnose die ingevuld wordt, minder betrouwbaar zijn.
- Hoofdgroepen diagnoses betrouwbaar, gedetailleerde diagnoses minder
- Kan gebruikt worden voor steekproeven, landelijk onderzoek, vergelijking data eigen onderzoek.
Nederlandse kankerregistratie(bekendste ziektespecifieke registraties)
- Alle nieuwe maligne tumoren worden door een arts vastgesteld
- Vrij compleet (95%), gegevens verzameld en gecodeerd door medewerkers van IKC.
- Data vanaf 1989
- Geen follow-up, dus geen ziekte-vrije overlevoing
- Gebruik oro steekpeof, vergelijking met eigen data.
Continue Morbiditeitsregistratie (CMR)
- Reden voor contact met huisarts
- Representatieve steekproef van huisartsen (1% van de huisartsen registreren dit)
- Hiermee kan echter niet altijd wat gezegd worden over de incidentie en prevalentie
- CBS gezondheidsenquete
- Steekproef (60% respons) – niet representatief voor NL bevolking
- Niet representatief steekproef, dit betekend dat het niet een goede dwarsdoorsnede van de bevolking. Dit beperkt je in wat je erover wil zeggen.
- Gegevens over ervaren gezondheid, psychische gezondheid, lichamelijke beperkingen, chronische aandoeningen, ongezonde leefgewoonten, medische consumptie
Complicatieregistratie
- Per specialisme of ziekenhuisbreed
- Meestal klinische patiënten, tijdens opname
- Geregistreerd door artsen zelf – hierdoor kan er sprake zijn van onderrapportage..
- Gegevens over complicaties in relatie tot medisch handelen, ingedeeld baar aard, lokalisatie, determinanten en ernst. Een complicatie is niet hetzelfde als een incident. Complicatie is een ongewenste uitkomst, incident is een ongewenst proces.
Framing ontstaat doordat je gericht naar bepaalde klachten vraagt, mensen vaker invullen dat ze er last van hebben, waardoor je een overschatting maakt. Bij vergelijkingen moet je rekening houden dat je geen appels met peren vergelijkt, denk aan:
- Confounding: zie meer hieronder.
- Selectiebias:
- Niet-representatieve steekproef: niet alle relevante groepen zijn ingesloten, bijv convenience sample (verkiezing VS kandidaat door telefonisch sample) – geeft vertekening.
- Non-response bias: verschil respondenten/non-respondenten, hier heb je alleen last van als er ook daadwerkelijk een verschil in de uitkomst van non-respondenten is.
- Informatiebias:
- Informatie-bias: a.g.v. directieve vragen, sociale wenselijkheid
- Observer-bias: bias a.g.v. observers, bijvoorbeeld nauwkeuriger noteren van bepaalde doodsoorzaken, dan wel onderrapportage (niet met dezelfde mate van nauwkeurigheid noteren).
- Recall-bias: verschil in herinnering beïnvloedt door ondergaan van nadelige situatie (bijv patiënt met longkanker herinnert sigaretje eerder, dus juist omdat ze ziek zijn, zijn ze meer geneigd zich iets te herinneren).
Confounding:
- Zelf gerelateerd aan uitkomst
- Ongelijk verdeeld in groepen die je vergelijkt.
Bij vergelijken van ziekenhuizen moet er rekening gehouden worden met confounding (meer hoogrisico patiënten ongelijk verdeeld) en selectiebias (insturen van verslag); soms ook informatiebias. Registraties worden steeds meer gebruikt om associaties te vinden. Er zijn drempels voor ziekenhuizen in het uitvoeren van interventies: zit je onder de drempels, dan mag je de interventies niet meer uitvoeren. Ziekenhuizen die veel operaties uitvoeren:
- Practice makes perfect: hoe vaker een ingreep wordt verricht, wordt je er beter in
- Follow the crowd: wanneer een ziekenhuis heel goed is in het uitvoeren van een ingreep, zullen daar meer mensen (patiënten) heengaan.
De vraag is bestaat er een relatie tussen volume en uitkomst; dat hangt echter van veel factoren.
Voordeel: population based, grote power.
Problemen:
- minder controle voor confounding – bestaat echt relatie tussen volume en uitkomst; het hangt namelijk van verschillende factoren
- analyse-eenheid: ziekenhuis/chirurg? Wat is hoog-volume?
- publicatiebias (als je iets vindt, heb je een grotere kans op publicatie) – er mist veel
- longitudinaal versus cross-sectioneel – je kijkt op één moment, het gaat dus meer om vaste verschillen.
- zeldzame uitkomsten (sterfte): gemiddelde rates per volume groep (ééntje die het wel goed doet wordt op een hoop gegooid met mindere) zijn mortaliteit en volume iets over de kwaliteit van ziekenhuizen?
De kwaliteit van ziekenhuizen kan op verschillende manieren gemeten worden. Hospital Standardised Mortality Ratio (HSMR). HSMR = (geobserveerd/verwacht)x100. Voldoende correctie voor confounding door patiëntenmix en informatiebias a.g.v. codeervariatie en relevantie voor patiënten zijn vragen die alsnog blijven bestaan.
Patiënten vinden een operatie dat volgens het boekje verloopt (geen complicaties etc.) en ingreepspecifieke informatie een belangrijke factor om te kiezen voor een bepaald ziekenhuis.
Goed gebruik van registratie is van belang voor signaalfunctie. Registratie is handig. Weet wat je doe en hoe je het interpreteert. Echter hou rekening met vertekening.
HC Zoeken naar literatuur deel 1 en 2 (dinsdag 07 januari 2014,13.30)
Systematisch literatuur zoeken:
- formuleer een zoekvraag
- oriëntatie en evalueren
- sneeuwballen en/of zoeken in databanken evalueren
- formuleren zoekvraag.
- Zorg dat je dit alles goed documenteert.
PICO is handig voor medische vragen:
- Patiënten/populatie
- Interventie (vaak het nieuwe middel)
- Comparison (vaak het al gebruikte middel / gouden standaard / de standaard behandeling)
- Outcome
In een databank moet je zoeken per aspect. Begin hier met de PICO en neem daar de meest essentiële aspecten van. Op deze manier heb je meer controle over de strategie. Hierdoor kom je eerder achter het verwachte aantal, mogelijke spelfouten en kan je gemakkelijker een probleem vinden en oplossen. Het is als het ware een controle van de strategie.
Zoekstrategie bouwen:
MeSH term OR vrije tekst.
MeSH-term: systematisch trefwoord, handmatig toegevoegd (NB: nieuwe artikelen nog niet), opzoeken in de MeSH-database en zoekt automatisch ook op onderverdeling. Zoek MeSH-terms altijd op, maak ze niet zelf!
Vrije tekst zijn termen waarmee je zoekt en die geen MeSH term is. Vrije tekst zijn termen met veldcodes als [All Fields], [Tiab] (titel en abstract), [Ti] (titel), [Tw] (oudere term voor All Fields). Deze moeten toegevoegd worden om recente artikelen te vinden. Bovendien is de indexering vaak onvoldoende, bijv. omdat de verkeerde term is gekoppeld aan het artikel.
Combineren van aspecten na zoeken op losse aspecten:
(Aspect 1) AND (aspect 2)
Combineren van aspecten: OR: vereniging (verzameling groter maken), AND; doorsnede (verzameling kleiner maken)
Kopieer je zoekstrategie in een Word document en/of in de standaard zoekstrategie lijst op blackboard via de Walaeus module.
Of het aantal referenties teveel is hangt af van het onderwerp en het doel waar je voor zoekt. Moet je bijvoorbeeld ergens een praatje over houden of een systematic review schrijven? Wanneer moet je de referenties gaan inperken?
- wanneer het meer is dan je kan verwerken
- diffuus
Inperken kun je doen door specifieker te zoeken. Dit doe je door een extra aspect toe te voegen (AND) of door een Major MeSH-term te gebruiken. Major Mesh terms zijn de Mesh term waar het artikel echt over gaat, er staat tevens een sterretje achter. Limits worden geïmplementeerd d.m.v. MeSH-achtige informatie waardoor alleen geïndexeerde referenties worden gevonden. Bij gebruik van limits worden dus alle referenties die nog niet geïndexeerd zijn (recente referenties) niet gevonden. Vaak gaan dan wel de meest relevante referenties verloren. Je moet dit niet gebruiken, behalve voor taal en datum.
Strategieën om in te perken bij teveel artikelen:
- Major mesh gebruiken met [tiab] of [ti]
- Filter: niet additional filters gebruiken want dan valt ook veel recente literatuur weg
- Toevoegen extra component
- Subheadings
Strategieën om uit te breiden bij te weinig artikelen:
- minder componenten
- meer zoektermen
- andere databanken
Indexed voor Medline betekend dat er Mesh terms toegevoegd zijn aan het artikel.
HC Vragenlijst onderzoek (donderdag 09 januari 2014, 11.30)
Vragenlijsten kunnen worden gebruikt bij zelf rapportage (selectieve ervaringen van een persoon worden onderzocht). Hierbij kan gevraagd worden naar: affect (gevoelens, emoties), cognitie (ideeën, feiten, meningen, kennis) of gedrag (gewoontes). Er moet gelet worden naar het al enige kennis en verder moet er ook gelet worden op de gevoeligheid van een onderwerp: sommige onderwerpen zijn te direct of gevoelig voor mensen. Een ander aandachtspunt is dat mensen erover nagedacht moeten hebben, kunnen mensen wel een antwoord geven op de vraag.
Soorten vragenlijsten
- Short From -36: heeft de voorkeur en meest gebruikt en dekt aspecten - lichamelijk, psychisch en sociaal. Het is echter lang en globaal.
Betreft antwoordcategorieën: voor veel patiënten is het soms moeilijk om vragen te beantwoorden. De generieke vragen aan het eind kan voor patiënten die geen klachten hebben, maar wel ernstige ziekte hebben een dilemma vormen. Fout van de schaal is dat het maar twee onderdelen van het sociaal aspect wordt nagevraagd.
- Hospital Anxiety an Depression Scale
- WHO-QoL Bref
Hoe selecteer je een vragenlijst? Op basis van onderzoeksvraag domeinen – deze moeten bepaald worden en schalen moeten ontwikkeld worden met representatieve vragen door literatuuronderzoek
Op basis van de onderzoeksvraaag worden domeinen bepaald en daarin schalen met representatieve vragen ontwikkeld.
Aandachtspunten bij het formuleren van vragen:
- open versus gesloten vragen
- wees concreet, geen vage en onduidelijke formuleringen (duidelijk en helder formulering is van belang!)
- een goede vragenlijst is maar op één manier interpretabel.
- geen samengestelde, meervoudige vragen (vraag bestaat uit twee delen, als mensen hier me eens zijn weet men niet waar ze wel en niet eens mee zijn). Dit soort vragen dienen opgesplitst te worden.
- geen dubbele ontkenningen (moeilijk, want mensen moeten er langer over nadenken)
- geen sturende vragen, dit geeft namelijk risico op sociaal wenselijke antwoorden.
- volledige en concrete vragen (let op dat ze elkaar niet uitsluiten)
- 1 of meerkeuze vragen, geef duidelijke instructie bij het invullen. Bij meerkeuze vragen zorg dat de antwoorden elkaar niet overlappen en dat de categorieën alle mogelijke antwoorden omvatten. Is dit niet het geval dan loop je het risico dat mensen zomaar iets invullen of niets invullen. Categorieën: 1-10 en 10-20 moet zijn 1-10 en 11-20.
Ja/nee vragen kunnen beperkend zijn.
- Let op de combinatie van vraag en antwoord, deze moet aansluiten. Gebruik dezelfde begrippen in vraag en antwoord.
Nadelen van open vragen:
- Lastig om te vergelijken
- Moeilijker invoeren en verwerken
- Wanneer je statistiek toe wilt passen is het nodig om na afloop de antwoorden (alsnog) te categoriseren.
- Soms zijn handschriften onleesbaar
Het aantal antwoordcategorieën hangt af van de soort respondent en wat je wilt weten. Continu visueel analoge schaal met best denkbare – slechtst denkbare. Dichotome schaal, 5- en 7-puntsschaal.
Ja-Nee vragen worden niet erg aangeraden, omdat het vaak geen absolute ja of nee is.
Voorkeur 5-7 puntsschaal i.v.m.:
- Betrouwbaarheid: Betrouwbaarheid neemt af met minder aantal categorieën.
- Onderscheidend vermogen (7-puntsschaal is daarvoor het maximum)
- Invulgemak is groter bij een 5-puntsschaal.
Bij meningsvragen kan men beter een even schaal gebruiken.
Oneven schalen hebben een middencategorie, even schalen dwingen meer tot een antwoord. Het kan wel onprettig zijn. De middencategorie wordt vaak als neutraal gezien, als een soort escape. Geen mening of ‘niet van toepassing’ creëert vaak missende informatie maar voorkomt missende waarden (bijv. bij seksualiteit).
Richting van de vragen:
Om antwoord-tendentie te vermijden is spiegelen een oplossing, het blijkt in het algemeen lastiger
Specifieke patiënttevredenheid meting: patiënten geven niet snel kritiek, dus meer positieve antwoorden op de vragenlijst zetten zodat meer onderscheidend vermogen ontstaat. Bijvoorbeeld: zeer slecht, slecht, niet goed niet slecht, goed, zeer goed, uitstekend.
Vraag niet naar tevredenheid (indien gebruik ter kwaliteitsverbetering wil je weten wat zijn de klachten, zodat je iets kan verbeteren) maar naar specifieke ervaringen en verbeter aspecten. Bijv duur wachttijd, prettig bejegend aan de telefoon of steeds wisselende dokters.
Opzet vragenlijsten:
- Let op de volgorde van vragen
- niet te veel van de hak op de tak
- wees zuinig met filtervragen (zo ja ga naar vraag 23 b; zo nee ga naar vraag 27), dit kan wel makkelijk met internet vragenlijsten.
- Verveling vermijden, zorg dat de relevante informatie uit de eerste paar vragen gehaald kan worden, als de vragenlijst te lang is raakt men minder geconcentreerd.
- Pilot testen vragenlijst is belangrijk! -
- Idealiter: cognitieve interview en kwantitatieve pilot (om opmerkingen op te schrijven)
Bestaande vragenlijsten zijn gevalideerd. Dit valideren kost tijd en geld, dus is het gemakkelijker een al bestaande vragenlijst te gebruiken. Vragenlijsten kan je bijvoorbeeld vinden in PubMed. Je kan op onderwerp, naam auteur of Mesh term zoeken. Vind je een Engelstalige vragenlijst ga dan na of er een Nederlandse versie van de lijst bestaat. Zoek hiernaar in Pubmed of neem contact met de auteur om te achterhalen of de lijst al vertaald is en of je het mag gebruiken. Pubmed (language [LA] of affiliation [AD]) Indien geen Nederlandse versie bestaat moet deze formeel vertaald worden wat tijd en geld kost. Vertalen via forward-backward vertalen: ‘native’ NL-spreker vertaalt naar NL, ‘native’ Engels-spreker vertaalt terug, vergelijking deze en originele Engelse vervolgens discussie en consensus over eindversie.
Normering? Vergelijking met referentiegroepen- hoe scoren ten opzichte van algemene bevolking.Lengte van de vragenlijst? Grote lengte geeft belasting voor respondent.
Ga na hoe het zit met de copyright.
Meeste lijsten geven zogenaamde profielen, dwz opgebouwd uit subschalen.
Voor ieder schaal heb je een aantal vragen (-items). Items operationaliseren construct op net iets andere wijze (vb depressie: opgewekt zijn, somber). Klassieke testtheorie stelt aantal eisen aan dergelijke vragenlijsten.
Eisen aan een vragenlijst:
- Betrouwbaarheid (precisie): als hij zonder al te veel ruis kan meten, is de meting herhaalbaar, meet je elke keer dezelfde waarde. Verhouding tot de werkelijke waarde en de ruis daarom heen.
- Vormen van betrouwbaarheid
- Test-hertest: het te meten concept moet over de tijd stabiel zijn gebleven
- Interne consistentie (Cronbach’s alpha) is een maat over in hoeverre in een vragenlijst de vragen over een ziekte samenhangen. De vragen moeten correleren. Het wordt ook wel inter-item betrouwbaarheid genoemd. Bij herhaalde meting heb je betere vergelijkbare score. Het gebruikt inter-item correlaties oi te beoaken of items hetzelfde domen meten. Inter-itemcorrelatoe – items moeten hoog correleren met totale schaal. Degene die 0,8 dan wellicht redundantie.
- Interbeoordelaars: bij het gebruik van proxy. De patiënt kan het zelf niet invullen dus vult een proxy de lijst in. Er moet op dezelfde manier worden gescoord.
- Vormen van betrouwbaarheid
- Validiteit: wordt het concept gemeten? Meet je wat je wil meten.
- Content validiteit – vraag naar expert. Het is echter niet genoeg.
- Criterium validiteit (vereist gouden standaard)
- Construct validitiet (construct = minitheorie) (wanneer 2 aspecten: welbevinden en tevredenheid samenhangen en er van beide goede vragenlijsten zijn kan je die eventueel combineren)
- Divergente (meet bijv. geluk), convergente validiteit,
- Extreme (psychiatrische patiënten vergelijken met bijv studenten) groepen validiteit
- responsiviteit: gevoeligheid voor verandering – lastig want twee moment zijn n=zeker nodig waarbij men zeker weet dat er meetbare verandering optreedt.
- meet het instrument klinische verandering? Het meest gebruikt is Effect Size dit is een maat voor de sterkte van het effect (t.o.v. standaard deviatie). Gemiddelde verandering gerelateerd aan variatie tussen personen bijv. de variatie op baseline) – om toevalsvariatie te berekenen.
Valideren van een vragenlijst
Betekent het bepalen van validiteit en betrouwbaarheid.
Niet ontwikkelde of naar NL vertaalde lijst moet eerst gevalideerd worden. Het valideren betekent het bepalen van de betrouwbaarheid en validiteit (en liefst ook responsiviteit). Dit kan maanden tot jaren duren, vandaar de voorkeur voor reeds in NL gevalideerde lijsten.
Afname vragenlijsten:
- in de wachtkamer (onderzoeker aanwezig)
- via de post
- via internet
Analyse vragenlijst:
Op basis van factor analyse zijn items gergoepeerd die ongeveer hetzelfde meten. Gevolgd door analyse betrouwbaarheid schaal. Daarna is het meestal simpel score optellen. Schaalconstructie o.b.v. factoranaylse: items gegroepeerd die ongeveer hetzelfde meten, gevolgd door analyse betrouwbaarheid schaal: inter-item betrouwbaarheid. Gespiegelde items in de vragenlijst moet je omcoderen om de juiste score uit de vragenlijst te krijgen. QUOTE (Nivel) vraag naar mening over instelling, naar wat persoon belangrijk vindt in leveren van zorg en van het voldoen van verwachtingen van de persoon door de arts.
HC Meten en reproduceerbaarheid (donderdag 10 januari 2014, 12.30)
Reproduceerbaarheid (precisie): de mate waarin bij herhaalde metingen dezelfde uitkomst wordt gevonden. Validiteit: je meet wat je wilt meten. Vaak worden deze begrippen door elkaar heen gebruikt, beide begrippen zijn van belang.
Welke fouten zijn erg? Wat voor soort fouten beinvloeden de resultaten ongewenst? Dat zijn systematische fouten, die door bijvoorbeeld bias of verkeerde vragen ontstaan. Random fouten zijn meestal ook ongewenst, maar in een grote onderzoeksgroep zal het effect uitmiddelen.
Schalen: structuur van gegevens
- Nominaal (een aantal groepen): bijv. ras.
- Binair: bijv. geslacht
- Ordinaal (rangorde, logische ordening): vaak gradering, bijvoorbeeld dyspneu graad
- Dimensioneel (interval): categorieën (eenheden) of continu (lengte, bloeddruk), bijvoorbeeld aantal objecten / kinderen.
Verschil tussen nominaal en ordinaal: Nominaal zijn verschillende categorieën zonder bepaalde ordening. Bij ordinaal zit er ene bepaalde ordening(rangorde) in.
Voorbeeld inflammatie van luchtwegen bij astma:
Meten van ernst van ontstekingsprocessen bij astmapatiënten op een semi-kwantitatieve manier scoren (op ordinale schaal) 0-4 (0 = geen, 1 = weinig, 2 = veel, 3 = zeer veel)
Bv. kijken op biopten naar eosinofielen (wat, waar, hoe, wie, wanneer?). Daarnaast speelt ervaring een belangrijke rol in de betrouwbaarheid van het scoren.
Met categoriale gegevens kan je iets zeggen over de reproduceerbaarheid d.m.v. de Kappa waarde. Dit is een getal 0-1 (perfect = 1), theoretisch gezien mogelijk -1 - + 1. Overeenstemming boven toeval in twee series van metingen van dezelfde.
gegevens = Po-Pe
- Verwachte overeenstemming in metingen o.b.v. toeval (expected proportion): Pe. Afhankelijk van eigen metingen (randtotalen). Uit te rekenen door de randtotalen met elkaar te vermenigvuldigen.
- Waargenomen overeenstemming (observed proportion) : Po, is te berekenen door de waarden op diagonaal bij elkaar op te tellen.
Kruistabel: perfecte overeenstemming is lijn door de diagonaal.
Maximum haalbaar boven toeval = 1-Po
Kappa = overeenstemming boven toeval / maximum haalbaar boven toeval
Kappa = (Po-Pe) / (1-Po)
Toeval uitrekenen: randvoorwaarden/randtotalen vermenigvuldigen en optellen
Voorbeeld:
| 0 | 1 | 2 |
|
0 | a | b | c | a + b + c |
1 | d | e | f | d + e + f |
2 | g | h | i | g + h + i |
| a + d + g | b + e + h | c + f + i | Totaal |
Verwachte overeenstemming op basis van toeval = [(a + d + g) * (a + b + c)] + [(b + e + h) * (d + e + f)] + [(c + f + i) * (g + h + i)]
Kappa waarde interpretatie: sterkte van overeenstemming:
- 0-0.2 gering, verwaarloosbaar
- 0.2-0.4 echt, niet verwaarloosbaar
- 0.4-0.6 matig, middelmatig
- 0.6-0.8 substantieel
- 0.8-1.0 bijna perfect
Dus het liefst heb je een Kappa waarde van 1, want dan is er maximaal reproduceerbaarheid.
Kappa alleen heb je niet zoveel aan, eigenlijk moet hier je het tabelletje bij zien om het te interpreteren. Categoriale gegevens laat je zien in een kruistabel of (gewogen) Kappa waarde. Continue gegevens laat je grafisch zien met een identiteitsplot/Brand-Altman plot. En getalsmatig met Correlatiecoëfficiënt/Intraklasse correlatiecoëfficiënt, limits of agreement (95% betrouwbaarheid)
Overeenstemming in metingen:
- Gepaarde T-Test: vergelijkt de gemiddelden tussen meting 1 en meting 2.
- Grafisch: identiteitplot, Bland en Altman plot. De Bland en Altman plot: gemiddelde van meting 1 en 2 op de x-as, verschil tussen meting 1 en 2 op de y-as (0 lijn verschil = perfecte overeenstemming). Hierin kan je zien of de spreiding tussen de punten een beetje gelijk is. Hierin kan je ook de lijnen + en - 2x SD zetten, deze geven de grenzen aan waarbinnen 95% van je waarnemingen zitten. Hiermee kun je beoordelen of dit in redelijke range zit met de gehele meet-schaal. Limits of agreement = grensen van overeenkomst.
- Getalsmatig: Pearson correlatiecoëfficiënt (r) en Intraklasse CorrelatieCoëfficiënt (ICC, is een variant). De r kijkt in hoeverre de lijn lineair is. De ICC kijkt naar de afwijking van de optimale lijn. De reproduceerbaarheid uitgedrukt in correlatiecoëfficiënt zegt minder dan de Kappa waarde. Dus een correlatie van 0.9 wil niet zeggen dat het ook echt goed reproduceerbaar is. Getallen/grafiek zien en zelf uitrekenen is het beste. Andersom is het ook: een kleine correlatie wil niet zeggen dat de reproduceerbaarheid slecht is: aan alleen het getal kan je dit niet zien, je hebt dan het plaatje/getallen nodig. Als de spreiding van getallen klein is, is de correlatiecoëfficiënt klein.
Samenvatting:
Reproduceerbaarheid gaat om goede standaardisatie van de metingen
Validiteit gaat om goede ijking van de metingen. Beiden zijn van belang voor de interpretatie van klinische gegevens en wetenschappelijke gegevens. Een coëfficiënt verteld slechts een deel van het verhaal, je wilt eigenlijk het tabel (categoriale gegevens) of figuur (continue gegevens) gezien (dit moet je ook rapporteren!)
HC Pragmatisch en economisch onderzoek (donderdag 10 januari 2014, 13.30)
Spectrum van onderzoek:
- Verklarend (pathofysiologisch) onderzoek: hoe werkt het?
- Pragmatisch onderzoek: helpt het de patiënt?
- Pragmatisch onderzoek omvat ook economisch onderzoek.
- Gezondheidseconomisch onderzoek: hoeveel helpt het? Is het z’n geld waard?
Het verschil tussen deze onderzoeken is het type validiteit waar je in geïnteresseerd bent.
Validiteit:
- Interne validiteit: interpreteerbaarheid van de resultaten van het onderzoek (rechtvaardigheid conclusies).
- Aantoonbare causaliteit
- Geen alternatieve verklaringen.
- Voldoende steekproefomvang voor statistische significantie.
- Externe validiteit: generaliseerbaarheid naar beoogde omstandigheden buiten het onderzoek (naar de dagelijkse praktijk).
- Alleen mogelijk indien intern valide
- Onderzoek zoveel mogelijk conform dagelijkse praktijk.
- Effectiveness in plaats van efficiency (doeltreffendheid in plaats van werkzaamheid).
Statistische efficiëntie: als groepen meer overlappen dan is (ceteris paribus) een grotere steekproefomvang nodig om een statistisch significant verschil te kunnen aantonen. Dus als de groepen minder van elkaar verschillen (kleinere delta) en/of als de groepen een grotere spreiding hebben (grotere omega) is de statistische efficiëntie groter en zijn kleinere steekproeven nodig.
Meer overlap is slecht voor interne validiteit, omdat de kans groter wordt dat het een random fout is. Er kunnen minder significante conclusies getrokken worden. Hier is wel voor te corrigeren door een grotere steekproef te nemen.
Consequenties voor onderzoeksopzet
- Keuze van behandelingen:
- Verklarend onderzoek (interne validiteit belangrijk) voor nieuwe behandelingen in vergelijking met placebo of niets doen. Controle op correcte uitvoering door de arts en op compliance van de patiënt vindt plaats.
- Pragmatisch onderzoek voor een nieuw beleid in vergelijking met de usual care. Er is geen controle op de uitvoering en compliance, meer overlap (dus slechtere interne validiteit), maar meer toepasbaar in dagelijkse praktijk (dus betere externe validiteit).
- Keuze van patiëntengroep:
- Verklarend onderzoek: nadruk op interne validiteit. Homogene onderzoekspopulatie met strikte inclusiecriteria, elimineert de alternatieve verklaring voor een eventueel verschil. De populatie met het grootst verwachte effect vergroot de statistische efficiëntie, maar kan ook beperkend zijn omdat het niets over de brede dagelijkse praktijk zegt (bijv. bij een populatie van 'gezonde, niet-rokende 35-jarige mannen' in een onderzoek is niet te vergelijken met de gewone patiënten populatie).
- Pragmatisch onderzoek: externe validiteit. Dagelijkse heterogene patiënten uit verschillende centra, bijv. 75-jarigen met comorbiditeit.
- Blindering:
- Verklarend onderzoek: nadruk op interne validiteit, idealiter dubbelblind omdat kennis van de behandeling het effect kan beïnvloeden.
- Bij pragmatisch onderzoek: nadruk op interne en externe validiteit hebben in de praktijk zowel patiënt als arts kennis van de behandeling, dus niet blind. Dubbelblind is ook hier ideaal, maar kan de externe validiteit benadelen dus meestal is het niet blind. Sommige behandelingen zijn belastend (bijv. operatie) en sommige patiënten hebben een aversie tegen medicatie (placebo is dan ook geen optie). Een alternatief voor dubbelblind is in dit geval een geblindeerde waarnemer die de metingen verricht ( = pragmatisch alternatief).
- Controlegroep:
- Allerlei methoden om de controlegroep te selecteren: cohorten, cross-sectioneel, case-control, voor-na meting, randomisatie, enz.
- Patiëntrandomisatie heeft meestal de voorkeur. Het is goed voor de interne validiteit want het voorkomt grote verschillen tussen groepen (causaliteit) en de standaard statistiek is toepasbaar. Randomisatie kan echter slecht zijn voor de externe validiteit: selectieve inclusie is mogelijk door informed consent, en patiënten worden zich bewust van het alternatief (invloed op compliance en uitkomst en rapportage). Hierdoor zou je de effectiviteit van de behandeling van het onderzoek kunnen overschatten.
- Pragmatische alternatieven voor randomisatie zijn:
Clusterrandomisatie: randomisatie van patiëntenclusters per arts, per regio etc. en alle patiënten binnen een cluster dezelfde behandeling. Dit is goed voor de externe validiteit want het voorkomt “vervuiling” binnen eenzelfde cluster, maar slecht voor de interne validiteit. Je introduceert verschillende inclusie criteria per cluster (wanneer loting bekend is voor inclusie). Je hebt meer clusters nodig om de variatie tussen artsen te verminderen, er zijn niet genoeg artsen. Voor een onderzoek met huisartsen en hun patientenpopulatie zou een clusterrandomisatie wel kunnen.
- Analyse
PP, AT en ITT
- Verklarend onderzoek: evaluatie van behandeling met de nadruk op correcte uitvoering en compliance.
Per protocol (PP) analyse: exclusie afwijkende behandeling (protocol violations), exclusie indien achteraf niet voldaan aan inclusie criteria.
As-Treated analyse (AT): groepering volgens behandeling, ongeacht randomisatie
- Pragmatisch onderzoek: evaluatie van beleid, inclusief fouten en variatie
Intention To Treat (ITT) analyse: evaluatie volgens randomisatiegroep, zonder exclusie. Dit is goed voor de externe validiteit. Nadeel: slecht voor de interne validiteit, want protocol violations verzwakken het effect.
- Uitkomstmaten:
Helpt het? De uitkomstmaten moeten een maat zijn voor de ziektelast, zoals:
- Ongemak
- Beperkingen
- Bijwerkingen
- Sterfte
- Kosten
De eerste 3 vragen richten zich op de kwaliteit van leven.1+2+3 = kwaliteit van leven – lichamelijk, psychisch en sociaal. Je meet de ziektelast bij de patiënt, dit is subjectief en op langere termijn. Veelal wordt dit gedaan door middel van vragenlijsten (ziektespecifieke vragenlijsten, generieke kwaliteit-van-leven vragenlijsten).
- Verklarend: intermediaire uitkomstmaten (surrogaat, proxy, biomarker): metingen van cholesterol, hormonen, bloeddruk, botdichtheid etc. De relatie met de ziektelast is verondersteld maar kan onduidelijk zijn. Resultaten zijn vooral relevant in de vroege stadia van onderzoek. Voordelen is dat ze gevoeliger zijn voor verschil tussen behandelingen (sluit aan bij aangrijpingspunt van behandeling) en minder beïnvloed door allerlei subjectieve factoren. Statistisch is het efficiënter, makkelijker, objectiever en meer op korte termijn. Nadelen kunnen zijn dat het er het gevaar bestaat dat de relatie met ziektelast toch ontbreekt en dat onverwachte effecten gemist kunnen worden.
Overzicht verschil tussen de twee onderzoeks designs:
Verklarend onderzoek | Pragmatisch onderzoek |
Hoe werkt het | Helpt het de patiënt? |
Interne validiteit | Interne & externe validiteit |
Experimentele setting | Dagelijkse praktijk |
Werkzaamheid (efficacy) | Doeltreffendheid (effectiveness) |
Evaluatie van behandeling | Evaluatie van beleid |
Vergeleken met placebo | Vergeleken met usual care |
Controle op correcte uitvoering | Geen controle op correctheid |
Controle op compliance | Geen controle op compliance |
Homogene patiëntengroep | Heterogene patiëntengroep |
Blindering | Geen blindering |
Randomisatie | (cluster) randomisatie |
Per-protocol analyse | Intention-to-treat analyse |
Kortere termijn | Langere termijn |
Intermediaire uitkomstmaten | ziektelast |
- Economisch: Is het z’n geld waard? Kwantificeren van (maatschappelijke) ziektelast.
Kosten: perspectief bepaalt welke kosten meetellen.- Medisch perspectief: primaire interventie en korte en lange termijn effect op andere medische zorg.
- Maatschappelijk perspectief: omvat medisch perspectief, patiëntenkosten (reiskosten, mantelzorg, tijdkosten, etc.) en arbeidskosten (verzuim, arbeidsongeschiktheid, etc.)
- Ziekenhuisperspectief, afdelingsperspectief, verzekeraar, etc.
Is het z’n geld waard? kwantificeren van (maatschappelijke) ziektelast.
De effectiviteit wordt idealiter gemeten d.m.v. de QALY.
Utiliteit = waardering van het leven (0-100%)
QALY = oppervlakte onder utiliteitscurve / waarde van kwaliteit van leven en lengte van leven.
- Meetmomenten:
- Verklarend onderzoek: meten op dat moment dat het te verwachten effect maximaal is.
- Pragmatisch onderzoek: meten op dat moment van verwacht maximaal verschil. Ziektelast uitkomstmaten worden bekeken op langere termijn.
- Economisch onderzoek: langer baat = meer waard, daarom analyse niet op 1 bepaald moment maar over de hele periode waarbij meerdere keren gemeten wordt. Zo weinig mogelijk meten, maar wel vaak genoeg om ook de duur van het verschil te meten. Je meet dan of er baat is, maar ook hoeveel baat er is
Samengevat
Het optimale design hangt af van de onderzoeksvraag:
Hoe werkt het?
- Verklarend onderzoek
- Intermediaire uitkomstmaten
- Interne validiteit
Helpt het de patiënt?
- Pragmatisch onderzoek
- Ziektelast uitkomstmaten in de dagelijkse praktijk
- Balans tussen interne en externe validiteit
Is het z’n geld waard?
- Economisch onderzoek (is ook pragmatisch)
- Kosten per QALY
HC Statestiek bij onderzoek deel 1 (donderdag 10 januari 2014, 14.30)
Veel voorkomende kritiekpunten bij stageaanvraag:
- Een tijdsplanning ontbreekt.
- Patiëntaantallen worden niet genoemd.
- Er wordt geen onderbouwing gegeven van de patiëntaantallen.
- Let op haalbaarheid van aantal patiënten: instroom, kosten, tijd.
- Let op statistische onderbouwing: welke verschillen wil ik detecteren met deze aantallen? En waarom, want sommige verschillen kunnen ook bij toeval bestaan.
Berekening aantallen bij vergelijken van twee groepen:
- Wat is de primaire uitkomstmaat? Wat ga je meten en wanneer zeg je dat er een verschil is?
- Is de uitkomst numeriek (continue als lengte, gewicht, bloeddruk) of categorisch (ja/nee variabele, ziek/niet ziek, genezen/niet genezen)?
- Bij een numerieke uitkomst moet je weten wat de spreiding is. Als bij iedereen de bloeddruk bijv gelijk is, dan is een verschil door een interventie makkelijker te meten, bij veel variatie is dit moelijker. Als binnen de groep veel variatie is, heb je dus een veel grotere groep nodig.
- Welk verschil wil je vrij zeker (als het er is!) detecteren? Hoe zeker moet het verschil zijn? 80%? 90%? Als het gaat om een klein verschil zou je meer mensen moeten includeren dan wanneer je zoekt naar een groot verschil.
Een hulpmiddel om het patientenaantal te berekenen staan in het boek. Formules voor de meest voorkomende gevallen staan in Petrie en Sabin topic 33. Power zegt iets over met hoeveel procent zekerheid je het verschil wilt meten. Bij 80% is de power 0.80.
- Bij een power van 0.80 is het aantal per groep = 16 / (standardized difference)2.
- Bij een power van 0.90 is het aantal per groep = 21 / (standardized difference)2.
Het gestandaardiseerd verschil / standardized difference (bij numerieke uitkomst):
- δ/σ = te detecteren verschil / standaarddeviatie.
VOORBEELD Studie
P = patiënten: Patiënten met 6-12 weken rugklachten, en radiologisch bewezen hernia.
I = interventie: Binnen twee weken opereren
C = controle: Conservatief beleid, afwachten.
O = outcome: RDQS vragenlijst; geeft aan hoe invalide iemand is. Deze score werd meerdere malen gedurende een jaar afgenomen. Outcome wordt vastgesteld na een jaar, er wordt gekeken of er verschil is tussen de twee groepen.
In eerdere studies was de spreiding, de standaarddeviatie, een scoreverschil van 10 punten op de vragenlijst. Een bewezen verschil tussen de groepen van 4 punten als outcome vindt men relevant.
Het gestandaardiseerde verschil is hier 4/10 = 0,4. Als we het verschil met 80% zekerheid willen weten hebben we 16/ 0,42 = 100 personen per groep nodig. Bij een power van 90% is dat 21/ 0,42 = 132 personen per groep.
Steekproefberekening om fracties in twee groepen met binaire variabele te vergelijken
- Gaat op dezelfde manier (en met chi-kwadraat test):
- Verschil in verwachte fracties in beide groepen p1-p2
Gestandaardiseerd verschil is = (p1 – p2) / wortel (p(1-p))
Voorbeeld
P1 = 65% p2 = 77%
Gebruik de chi kwadraat toets om het gestandaardiseerd verschil uit te rekenen. We nemen alfa = 0.05, bij een power van 80% is 16 / (gestandaardiseerd verschil)2. Bij two-sided moet je het dubbele patiëntenaantal nemen dat je hebt uitgerekend met de formule voor power.
Wat gebeurt er met de aantallen als:
- δ (te detecteren verschil) kleiner wordt: meer mensen nodig. Als je hele kleine verschillen wilt detecteren heb je meer mensen nodig.
- σ (standaarddeviatie) kleiner wordt: minder mensen nodig. Als de spreiding kleiner wordt kun je nauwkeuriger iets meten en heb je minder mensen nodig om een verschil te detecteren.
- Power groter wordt: meer mensen nodig.
Soms vergelijk je geen groepen, bijvoorbeeld: wat is de sensitiviteit van een nieuwe diagnostische toets? Of: wat is het percentage kinderen met ernstige slaapproblemen? Zeg dan iets over de nauwkeurigheid waarmee je het percentage bepaalt.
Voorbeeld:
Als we verwachten dat de sensitiviteit ongeveer 0.80 is, dan:
De standaardfout van een kans (p) is: se = wortel (p(1-p)/n)
95% betrouwbaarheidsinterval (geeft aan dat je 95% zeker weet dat de échte waarde tussen deze grenzen ligt): (p-1,96 se, p+1,96 se)
Maak tabel voor p = 0.80
N | Se | 95% bi |
5 | 0.18 | 0.45 - 1.15 |
10 | 0.13 | 0.55 - 1.05 |
50 | 0.057 | 0.69 - 0.91 |
100 | 0.04 | 0.72 - 0.88 |
Dus; als je bij 50 ziekten een geschatte sensitiviteit van 0.8 vindt, dan ligt de werkelijke sensitiviteit met 95% zekerheid tussen 69 en 91 %. Er zijn erg veel mensen nodig om kansen nauwkeurig te schatten.
Keuze uitkomstmaten:
Soms willen mensen in elke studie een 2x2 tabel maken. Bijv een studie naar het effect van een diët. Voor en na het dieët meten hoeveel het gewicht is. Bij discreet kijk je dan alleen na overgewicht ja/nee. Een continue meting zou beter zijn, omdat je dan ook kijkt hoeveel mensen daadwerkelijk afgevallen zijn, ook al hebben ze misschien nog steeds overgewicht. Verschillen in een continue uitkomst zijn nauwkeuriger te meten, dus aantallen zijn kleiner dan bij discrete uitkomst.
Analyseplan
Tijdens de opzet van het onderzoek moet er al een analyseplan worden gemaakt. Hierin worden de onderzoeksvragen op een rij gezet. Bedenk van tevoren met welke methodes je de vraag gaat beantwoorden.
Bij het opzetten van een studie moet je aangeven hoe nauwkeurig en betrouwbaar je metingen zijn. Je moet ook nadenken over uitval, missende gegevens, protocol violations, intention to treat etc. Personen die niet volgens protocol behandeld worden mogen niet weggelaten of vervangen worden door nieuwe personen! Bij eerder genoemde studie, waar patiënten in controlegroep zijn geloot maar toch geopereerd worden door ernst van de hernia of andere redenen, dan mogen deze personen niet uit het onderzoek worden gehaald. Dit kan d.m.v. intention to treat of met een per protocol analyse. Hier zijn allemaal statistische methodes voor, maar het belangrijkste is dat dit zo veel mogelijk vermeden wordt. Het is belangrijk na te denken voor je met de studie begint hoe mensen zo veel mogelijk volgens protocol behandeld kunnen worden en niet halverwege afhaken.
Opslaan van gegevens:
- Opslaan van gegevens kan met Excel, SPSS, Access of andere database programma's. Statistici geven niet de voorkeur aan Excel, omdat dit geen structuur heeft (SPSS wel)..
- Nadelen Excel: één kolom kan meerdere soorten gegevens hebben, vermenging van data en metadata (bv. waarden en kolommen), vermenging van data en analyse (observaties en gemiddelde berekening)
- Voordeel Excel: mooi om plaatjes in te maken
- SPSS: handig voor kleine studies, er zit structuur in. De kolommen zijn de variabelen en de rijen zijn de metingen/proefpersonen.
- Access: handig voor grotere studies, waar bijvoorbeeld vaker bij patiënten gemeten wordt. Een of meerdere tabellen, heeft structuur (kolommen zijn variabelen, rijen zijn onderzoekseenheden / cases). Je kunt restricties op data invoeren (>0,
Gouden tips voor de invoer van data:
- Voer alleen ruwe data in (lengte en gewicht).
- Laat het programma de berekeningen uitvoeren (zoals BMI bij lengte en gewicht).
- Bewaar ruwe data als apart bestan en voer bewerkingen uit in een nieuw bestand. Anders kunnen je data overschreven worden.
- Documenteer:
- Labels voor variabelen en waarden (man/vrouw). Dus 0=man en 1=vrouw bijvoorbeeld.
- Check of activiteiten kunnen doorgaan en data duidelijk is voor evt. opvolgers.
- In SPSS syntax kun je opslaan welke berekeningen hebt gedaan.
- Archiveer:
- Versiebeheer: op elk moment kunnen terugvallen op een eerdere situatie.
- Op gemarkeerde tijdstippen.
- Back-up: tegen calamiteiten, liefst elke dag.
- Controleer de gegevens op invoerfouten/typfouten.
HC Statistiek bij onderzoek deel 2 (donderdag 10 januari 2014, 15.30)
De gegevens zijn verzameld wat nu?
Probeer gevoel voor de data te krijgen:
- Bij kleine dataset: kijk naar gegevens zelf.
- Bij grotere dataset: vat gegevens samen in getallen / in grafieken
Beschrijving van de gegevens:
- Continue variabelen (interval, numeriek): geef maat voor gemiddelde en spreiding (gemiddelde en standaarddeviatie). Als variabele erg scheef/niet-symmetrisch is dan geef je de mediaan met de min. en max. of 75e en 25e percentielen.
- Categorische variabelen: aantallen, subgroepen en percentages.
Bij het vergelijken van twee groepen moet je kijken naar de soort uitkomst (numeriek of categorisch) en of de gegevens gepaard of niet gepaard zijn. Vervolgens kun je het stroomdiagram achterin het statistiek boek gebruiken om te kijken welke toets gebruikt moet worden.
Dus twee stappen:
- uitkomst -> numeriek of categorisch
- gepaard of niet gepaard
Toetsen voor niet gepaarde metingen:
Type uitkomst | Vergelijk tussen groepen | Toets |
Numeriek (bloeddruk, leeftijd) | Gemiddelden | Ongepaarde t-toets (als verschillen redelijk normaal verdeeld zijn, of grote aantallen) Mann-Whitney toets |
Categorisch (ja/nee, ziek/gezond) | Percentages | Chi kwadraat toets Fisher exact (bij kleine aantallen) |
Tijd tot gebeurtenis (bijv. overlijden) | Overlevingskrommes | log rank toets |
Toetsen bij gepaarde metingen:
Type uitkomst | Toets |
Numeriek | - Gepaarde t-toets (als verschillen redelijk normaal verdeeld zijn, of grote aantallen) - Wilcoxon toets (kan ook bij ongepaard) |
Categorisch | - McNemar |
Voorbeelden:
- Is bij 85-jarigen de bloeddruk van mannen en vrouwen gelijk?
- Numeriek, niet gepaard, dus een ongepaarde T-toets (of evt. Mann Whitney toets).
- Is het percentage mannen en vrouwen dat rookt gelijkt?
- Categorisch, niet gepaard, dus Chi-kwadraattoets
- Aantal sigaretten tussen mannen en vrouwen gelijk?
- Numeriek, maar scheve verdeling, ongepaard, dus Mann Whitney toets
- Heeft behandeling X invloed op het gewicht van een patiënt?
- Numeriek, gepaard, dus gepaarde t-test
- Koppels van broer/zus, je doet een IQ-test. Is het IQ van mannen hoger?
- Numeriek, gepaard, dus gepaarde t toets of Wilocxo toets. Als je hiervoor een ongepaarde t-toets zou doen dan is het minder precies en minder significant.
Bij voorbeeld 1 zie je in de gemiddelden van de bloeddruk onder mannen en vrouwen kleine verschillen. Maar is dit significant? Om deze vraag te beantwoorden gebruik je de statistische toets.
Hypothese toetsen: Je stelt twee hypothesen op:
H0: geen verschil (geen effect, geen associatie).
H1: wel een verschil (effect, associatie).
Veronderstel dat H0 waar is, tenzij H1 is bewezen. Bereken hoe waarschijnlijk het is dat je de geobserveerde verschillen observeert als H0 waar is. Dit doe je met een statistische test, waarbij je de p-waarde berekent. Als de resultaten erg onwaarschijnlijk zijn onder de nulhyptohese (anders gezegd: de p-waarde is erg klein) dan verwerpen we H0. Er bestaat dan dus wel een verschil. Grote p-waarde betekend een klein verschil, betekend dat de H0 niet verworpen kan worden.
P-waarde: kans op geobserveerde verschillen als H0 waar is. P
Alleen de p-waarde zegt niet veel; Hoe groot is het verschil? Hoe nauwkeurig is het geschat? Is het klinisch relevant? Daarom moet de grootte van het effect en betrouwbaarheidsintervallen rapporteren.
Rapportage van effectschattingen met hun precisie:
- Numerieke uitkomsten: vermeld het verschil tussen de 2 groepen in gemiddelden.
- Categorische uitkomsten: er bestaan verschillende manieren om het effect te rapporteren zoals risicoverschil, relatief risico en de Odds ratio.
- Ook: geef de standaardfout van deze schatting of een 95% betrouwbaarheidsinterval. Het 95% betrouwbaarheidsinterval geeft aan dat in 95 van de 100 studies de echte waarde in dit interval zit.
- Als 0 in het betrouwbaarheidsinterval zit, dan betekent dit dat de nulhypothese niet verworpen kan worden (niet significant) want het is mogelijk dat er geen verschil is. De p-waarde is dan ook groter dan 0.05.
Hulpmiddelen (zie slide 55 in PPT voor websites):
- Wiki Statistiek (AMC). Hierop staat een schema met wanneer welke toets, je kunt doorklikken waar staat hoe je de toets kunt gebruiken en hoe je dit met SPSS moet doen.
- Statistiek om 2x2 tabellen te maken
HC Analyse van overlevingsdata (vrijdag 10 januari 2014, 11.30)
Uitkomst: tijdsduur tussen twee gebeurtenissen (begin naar eindpunt). Mogelijke vragen: wat is de verdeling van de overlevingsduren, verschilt de levensverwachting tussen groepen patiënten, wat zijn de determinanten van een bepaalde ziekte?
Probleem is dat niet alle deelnemers het eindpunt van het onderzoek bereiken. (bijv. niet alle rokers overlijden aan longkanker tijdens de onderzoeksduur). Het gemiddelde valt dan niet meer te berekenen. Als proefpersonen het eindpunt niet bereiken, maar niet door overlijden, worden dit gecensureerde waarnemingen genoemd. Individu bereikt het uitpunt niet door uitval (lost to follow up): a.g.v. verhuizing, niet meer op controle komen (het gaat het goed, of juist heel slecht), sterven aan een andere ziekte. Veronderstelling: de reden van censurering is onafhankelijk van de overleving.
Dus niet: patiënt komt niet meer op controle omdat hij te ziek is.
De overlevingsfunctie S(t)
S(t): de kans dat de overlevingstijd groter is dan t. In andere woorden: Overleving = kans dat mensen op tijdstip t nog in leven zijn. Hoe schat je nou die kromme? Dit bereken je d.m.v. de Kaplan-Meier.
Voorbeeld Kaplan Meier:
Patiënten die eindpunten bereiken: 4, 7+, 9, 10, 11+, 12, 20, 20, 25+. + betekent gecensureerd, het weglaten van gecensureerden is niet slim, want je verliest informatie. Van gecensureerde persoon met bijv. overleving 25+ heb je juist veel bruikbare informatie. Je gebruikt gewoon de gegevens tot het moment van uitval van de patiënt. Dit doe je met een Kaplan-Meier kromme..
Tijdstip | Aantal at risk | Aantal overleden | Sterfte risico | overlevingsfractie | Overlevingskans |
0 | 10 |
|
|
| 1 |
3 | 10 | 1 | 1/10 | 9/10 | 9/10 = 0.9 |
4 | 9 | 1 | 1/9 | 8/9 | 0.9 x 8/9 = 0.8 |
7 | 8 | 0 | 0 | 1 | 0.8 |
9 | 7 | 1 | 1/7 | 6/7 | 0.8 x 6/7 = 0.69 |
10 | 6 | 1 | 1/6 |
| 0,69x5/6=0,57 |
11 | 5 | 0 |
|
| 0,57 |
12 | 4 | 1 | ¼ | ¾ | 0,57x3/4=0,43 |
20 | 3 | 2 | 2/3 | 1/3 | 0,14 |
25 | 1 |
|
|
| 0,14 |
Van de waarden die je bij de overlevingskans overhoudt kan je een kromme maken: de Kaplan-Meier kromme. Je zet verticale streepjes op de kromme voor gecensureerde metingen.
De schatting / kromme is gebaseerd op 10 observaties, dit is dus niet exact. Voor elk tijdstip kun je de standaardfout (se) berekenen in SPSS en daaruit het 95% betrouwbaarheidsinterval.
- 95% betrouwbaarheidsinterval = (S(t) – 1,96 x se, S(t) + 1,96 x se)
Bv. op tijdstip 3: S(t) = 0.9, Se = 0.0949
(0.9 – 1.96 x 0.0949, 0.9 + 1.96 x 0.0949 = 0.71 , 1.08, oftewel (0.71, 1)
Het betrouwbaarheidsinterval kan je ook in het figuur van de Kaplan-Meier kromme verwerken. Het berekenen van een mediane overleving: tijdstip waarop 50% nog in leven is en 50% overleden is. Dit kan aan de hand van de kromme. Je kijkt bij de kans op overleven bij 0,5 (50%), hierbij kijk je welk tijdstip erbij hoort.
Vergelijken twee krommen:
Je kunt ook twee krommen (bijvoorbeeld: twee verschillende therapieën getest in grote groepen) in 1 figuur met elkaar vergelijken. Soms zie je in de grafiek al een duidelijk verschil maar om de significantie van (kleine) verschillen te berekenen gebruik je de Log rank toets: toets om twee overlevingskrommen te vergelijken.
- Nulhypothese - H0: twee krommes zijn gelijk
- Ha: twee krommes zijn significant verschillend
Het idee is: Vergelijk de geobserveerde getallen met wat je verwacht als er geen verschil tussen de groepen is (H0 is waar). Dit geeft een toetsingsgrootheid: X2 (en samenhangende p-waarde).
Onder H0 geeft X2 een chi kwadraat verdeling met n-1 vrijheidsgraad (aantal kromme – 1). Als X2 te groot is en p-waarde te klein: verwerpen we H0. conclusie: verschil tussen de overlevingskromme is statistisch significant.
Sterfte risico (hazard)
Het risico om in maand (of jaar/week/dag) i te overleven als je aan het begin van maand (jaar/week/dag) i nog in leven bent.
- H(i) = (S(i-1) – S(i)) / S(i-1)
S(i-1): kans op begin in de maand nog in leven te zijn. S(i): kans om op eind van de maand i nog in leven te zijn.
Bv. S(12) = 0.30 , S(13) = 0.20.
h(13) = (S(12) – S(13)) / S(12) = 0.30 – 0.20 / 0.30 = 0.33
Iemand die na 12 maanden overleefd heeft een kans van 0.33 om in de 13e maand te overlijden.
Hazards en overlevingscurve kan je in elkaar omzetten. Van de hazards kan je ook een curve maken, soms geeft dit meer informatie (duidelijker) dan de overlevingscurve.
Hazard ratio: maat voor verschil in hazards tussen twee groepen. Dit doe je door de hazards van de twee groepen op elkaar te delen.
Hazard ratio = hazard groep 1 / hazard groep 2
- Uitkomst > 1 betekent dat sterfte in groep 1 groter is
- Uitkomst
- Uitkomst = 1 betekent dat sterfte gelijk is in beide groepen
Hazard Ratio = Rate Ratio: gaat over snelheden (hazard curve)
Relatief Risico (Risk Ratio): gaat over kansen (overlevingskromme)
HC Confounding - statistische aspecten (vrijdag 10 januari 2014, 12.30)
Het fenomeen confounding betekent dat effecten ongewenst worden vertekend door andere factoren.
Standaard deviatie: verteld de spreiding in de populatie
Standaard fout is een fout in het gemiddelde
Mean difference: gemiddeld verschil tussen de twee groepen
Hazard ratio: als 1 in het betrouwbaarheidsinterval zit, dan is het niet significant. De kans op het ene is bij 1 even groot als de kans op het andere. Als 1 niet in het BI zit, dan is er wel een significant verschil in risico. Je kijkt hier naar 1, omdat het om een risicoratio gaat.
Bij een risicoverschil moet 0 niet in het betrouwbaarheidsinterval zitten, wil het significant zijn.
De vraag is: mag je dit wel concluderen, misschien is er wel sprake van confounding? Voorbeeld: Leeftijd bij vergelijken verschillende vormen van dialyse. Om het werkelijke therapie effect te schatten heb je patiënten nodig met dezelfde startwaarden. Als je na corrigeren voor confounding een verschil vindt, kun je pas echt een conclusie trekken.
Corrigeren voor confounding:
- Restrictie: neem alleen bepaalde patiënten op in het onderzoek (leeftijd).
- Matching: maak paren van patiënten met dezelfde karakteristieken.
- Stratificatie: bereken effect in subgroepen met gelijke karakteristieken en neem het gewogen gemiddelde van de gevonden effecten.
- Standaardisatie: bereken in beide groepen wat effecten zouden zijn bij leeftijdsverdeling in een standaardpopulatie. Dus wanneer de ene groep even oud zou zijn als de andere groep (zie blok Maatschappij en gezondheid).
- Multipele regressiemodellen
Stratificatie: kijk apart naar de behandelingen voor jonge en oude patiënten. Per subgroep reken je het verschil uit tussen de 2 behandelingen. Hieruit bereken je een gewogen gemiddelde samen met een betrouwbaarheidsinterval. Dit is een vrij grove manier om te corrigeren voor confounding.
Bij het splitsen van de groepen kan je voor beide groepen een odds ratio bereken (1 niet in het BI betekend significant). Hieruit kan je weer een gewogen gemiddelde berekenen. Dit is de Mantel-Haenszel odds ratio: gewogen gemiddelde van odds ratio’s (gepoolde odds ratio).
| Ziek | Gezond |
Blootgesteld | A1 | B1 |
Niet blootgesteld | C1 | D1 |
| Ziek | Gezond |
Blootgesteld | A2 | B2 |
Niet blootgesteld | C2 | D2 |
Mantel-Heanszel OR = (a1xd1/n1+a2xd2/n2) / (b1xc1/n1+b2xc2/n2)
n1 = totaal aantal personen groep 1
n2 = totaal aantal personen groep 2
Wanneer er teveel confounders zijn, krijg je heel veel subgroepen bij stratificatie, je kan dan beter gaan werken met regressiemodellen.
Matchen: vergelijken van groepen die je matched op verschillende variabelen, cases worden aan passende controle gekoppeld. Bijvoorbeeld partner-studie om omgevingsfactoren als SES, eetpatronen e.d. zo weinig mogelijk te laten meespelen.
Voordeel:
- groepen zijn vergelijkbaar op variabelen waarop je matched.
- Je verwacht een grotere respons
- Het is efficiënter, je kijkt binnen een paar naar de verschillen.
Nadelen:
- Je kunt effect van variabelen waarop je match niet meer bepalen (bijvoorbeeld als case en controle zelfde geslacht hebben kun je niet meer nagaan of mannen meer kans op ziekte hebben).
- Je kunt “overmatchen”. Omstandigheden van invloed zijn teveel gelijk tussen cases en controles.
- Als een van de twee personen in een paar missende data heeft, kun je het hele paar niet gebruiken.
- Statistische analyse is lastiger (gepaarde gegevens).
- 1 of 2153
- next ›
JoHo can really use your help! Check out the various student jobs here that match your studies, improve your competencies, strengthen your CV and contribute to a more tolerant world
Online access to all summaries, study notes en practice exams
- Check out: Register with JoHo WorldSupporter: starting page (EN)
- Check out: Aanmelden bij JoHo WorldSupporter - startpagina (NL)
How and why would you use WorldSupporter.org for your summaries and study assistance?
- For free use of many of the summaries and study aids provided or collected by your fellow students.
- For free use of many of the lecture and study group notes, exam questions and practice questions.
- For use of all exclusive summaries and study assistance for those who are member with JoHo WorldSupporter with online access
- For compiling your own materials and contributions with relevant study help
- For sharing and finding relevant and interesting summaries, documents, notes, blogs, tips, videos, discussions, activities, recipes, side jobs and more.
Using and finding summaries, study notes en practice exams on JoHo WorldSupporter
There are several ways to navigate the large amount of summaries, study notes en practice exams on JoHo WorldSupporter.
- Use the menu above every page to go to one of the main starting pages
- Starting pages: for some fields of study and some university curricula editors have created (start) magazines where customised selections of summaries are put together to smoothen navigation. When you have found a magazine of your likings, add that page to your favorites so you can easily go to that starting point directly from your profile during future visits. Below you will find some start magazines per field of study
- Use the topics and taxonomy terms
- The topics and taxonomy of the study and working fields gives you insight in the amount of summaries that are tagged by authors on specific subjects. This type of navigation can help find summaries that you could have missed when just using the search tools. Tags are organised per field of study and per study institution. Note: not all content is tagged thoroughly, so when this approach doesn't give the results you were looking for, please check the search tool as back up
- Check or follow your (study) organizations:
- by checking or using your study organizations you are likely to discover all relevant study materials.
- this option is only available trough partner organizations
- Check or follow authors or other WorldSupporters
- by following individual users, authors you are likely to discover more relevant study materials.
- Use the Search tools
- 'Quick & Easy'- not very elegant but the fastest way to find a specific summary of a book or study assistance with a specific course or subject.
- The search tool is also available at the bottom of most pages
Do you want to share your summaries with JoHo WorldSupporter and its visitors?
- Check out: Why and how to add a WorldSupporter contributions
- JoHo members: JoHo WorldSupporter members can share content directly and have access to all content: Join JoHo and become a JoHo member
- Non-members: When you are not a member you do not have full access, but if you want to share your own content with others you can fill out the contact form
Quicklinks to fields of study for summaries and study assistance
Field of study
- All studies for summaries, study assistance and working fields
- Communication & Media sciences
- Corporate & Organizational Sciences
- Cultural Studies & Humanities
- Economy & Economical sciences
- Education & Pedagogic Sciences
- Health & Medical Sciences
- IT & Exact sciences
- Law & Justice
- Nature & Environmental Sciences
- Psychology & Behavioral Sciences
- Public Administration & Social Sciences
- Science & Research
- Technical Sciences
Add new contribution