Help! Statistiek!

Help! Statistiek! Doorlopende serie laagdrempelige lezingen, voor iedereen vrij toegankelijk. Doel: Informeren over statistiek in klinisch onderzoek. Tijd: Derde woensdag in de maand, 12-13 uur 20 februari : Hoe gaan we om met herhaalde metingen? 19 maart : ROC curve en diagnostische nauwkeurigheid 16 april : Hoe moeten we toetsresultaten interpreteren? Sprekers: Vaclav Fidler, Hans Burgerhof, Wendy Post DG Epidemiologie

Herhaalde metingen Wat zijn herhaalde metingen? Waarom zijn de gebruikelijke methoden niet geschikt? Mogelijke benaderingen De random effects modellen Random interceptmodel Waarom moeten we random effects modellen gebruiken?

Herhaalde metingen Subjecten(personen, patiënten, dieren) van één of meer groepen hebben meerdere metingen opéén of meervariabelen. Wanneer interessant? Verschillen binnen personen Verschillen tussen personen Probleem: Waarnemingen zijn niet onafhankelijk

Voorbeelden algemeen Voor- en nameting voor 1 groep personen: within design Herhaalde metingen voor 2 verschillende behandelgroepen: within en between design Uitbreiding naar meerdere within-factoren en meerdere between factoren: zoals geslacht en leeftijd en behandeling (between factoren) meerdere momenten door verschillende observers (within factoren)

Voorbeelden algemeen Longitudinale studie: groei-curves Cross-over designs In duplo of meer uitgevoerde lab-bepalingen

Voorbeelden algemeen Multi-level benadering: multicenter clinical trials Patiënten kunnen opgevat worden als herhaalde metingen binnen 1 centrum In meta-analyses: de waarnemingen binnen elke studie zijn de herhaalde waarnemingen Kortom: Geclusterde data kunnen opgevat worden als herhaalde metingen data en andersom.

Voorbeeld 5 subjecten 4 herhaalde metingen Stofwisseling- parameter 2 factoren: Dieet: N en O Tijd: voor en na

Voorbeeld Drie vragen Is er een dieet effect? Is er een tijdseffect Is er een interactie effect?

Voorbeeld

Voorbeeld Is er een dieet effect? Gepaarde t-test per tijdmoment (of gemiddelde) 5 observaties

Voorbeeld Is er een tijds effect? Gepaarde t-test per dieet (of gemiddelde) 5 observaties

Voorbeeld Is er een interactie effect? Is de verandering over tijd verschillend voor de beide diëten? Varieert het verschil tussen de diëten over de tijd? Gepaarde t-test op delta (verandering)

Voorbeeld Als er slechts 2 herhaalde metingen zijn per factor: gepaarde t-test is een oplossing Maar wat als er meer herhaalde metingen zijn? De afhankelijkheden tussen metingen binnen elk persoon zijn de oorzaak van het feit dat we de technieken moeten gebruiken die rekening houden met deze correlaties!

Mogelijke benaderingen 1. Gebruiken van 1 samengevatte variabele: • Verschilscore van na- en voormeting • Maximum of minimum • Gemiddelde Voordeel • simpel: we hebben weer onafhankelijke waarnemingen Nadelen: • Informatie wordt weggegooid • Bij missende data is er geen goede samenvatting

Mogelijke benaderingen 2. Per herhaalde meting de analyse uitvoeren Voordeel1. simpel: alleen onafhankelijke waarnemingen Nadelen 1. multiple testing 2. houdt geen rekening met de afhankelijkheidsstructuur

Mogelijke benaderingen • RM-ANOVA Uitbreiding van ANOVA/MANOVA met zelfde terminologie Voordelen: • Voor mensen die ANOVA-technieken kennen is het een natuurlijke uitbreiding • Bekend bij velen als enige manier, omdat tot voor een paar jaar geleden dit de enige manier was om herhaalde metingen in SPSS te analyseren Nadelen • Alleen continue responsematen • Zeer strenge eisen t.a.v. afhankelijkheidsstructuur van de data (compound symmetry) • Kan geen missende gegevens aan

Mogelijke benaderingen 4. Random-effectsmodellen Regressiemodelbenadering met zelfde terminologie Ook wel multilevelmodellen, random parameter modellen of mixed models genoemd Voordelen • Standaard in pakketten als SAS, MLwin, S-plus en R, en SPSS (sinds versie 12 werkt mixed models redelijk) • Kan missing data aan (MAR) • Flexibiliteit in modelleren van afhankelijkheidsstructuur Nadeel: Complexe modellen! Vraagt veel van onderzoeker

Nieuw voorbeeld met 2 factoren: factor tijd (within) factor dieet (between) Onderzoeksprobleem: Vergelijken van 2 verschillende diëten t.a.v. effect op gewicht Experiment: • Gerandomiseerde trial • 2 diëten A and B; 20 personen • Elk persoon wordt elke 3 maanden gewogen • Baseline: voor start dieet; laatste meting: 12 maanden na start dieet: in totaal 5 metingen per persoon Na randomisatie: 8 personen krijgen dieet A ; 12 personen dieet B

Nieuw voorbeeld (vervolg): factor tijd en factor dieet Onderzoeksvraag: Welk dieet heeft meer effect op het gewicht? Eigenlijk: Zijn er verschillen tussen de 2 diëten voor wat betreft de veranderingen in gewicht over tijd? Vraag betreft interactie tussen tijd en dieet.

Random effects model Twee niveaus: Niveau 1: (within) Metingen binnen een persoon: veranderingen over de tijd Niveau 2: (between) Metingen tussen personen: verschillen als gevolg van dieet

Nieuw voorbeeld (vervolg): factor tijd en factor dieet

Random effects model: niveau 1 Model voor verandering over tijd gewichtij = 0i + 1itijdj + (eij) i = 1,…, 20 personen; j = 1,…5 tijdmomenten 0i = intercept voor persoon i 1i = helling voor persoon i Elk persoon heeft z’n eigen regressielijn

Random effects model: niveau 1 Model voor verandering over tijd gewichtij = 0i + 1itijdj + (eij) eij =niveau 1 residu: within person fout, meetfout eij ~ N(0,2e)

Random effects model: niveau 2 Model voor verschillen tussen personen Elk persoon heeft eigen intercept en eigen helling We brengen dus de herhaalde metingen terug tot intercept en helling! • Zijn er verschillen in intercept en helling? • Welke predictoren verklaren die verschillen?

Random effects model: niveau 2 Model voor verschillen tussen personen: Welke predictoren verklaren verschillen in intercept en helling ? 0i = γ00 + γ01*dieeti + u0i 1i =γ10 + γ11*dieeti +u1i γ00 , γ01, γ10 en γ11 : fixed effects 0i , 0i : random effects u0i en u1i : niveau 2 residuen; tussen-persoons fouten

Random effects model samengesteld: beide niveaus samengestelde model gewichtij = γ00 + γ01*dieeti+ γ10*tijdj + γ11*dieeti*tijdj + u0i + u1i*tijdj + eij Resultaat: regressie model met complex residu

Random effects model samengesteld: beide niveaus Residu van samengesteld modelu0i + u1i*tijdj + eij Heteroscedasticiteit: ongelijke variantie per tijdsmoment Autocorrelatie: residuen zijn gecorreleerd

Random intercept modelniveau 1 en niveau 2 Niveau 1: voor verandering over de tijd gewichtij = 0i + 1itijdj + (eij) (zelfde als hiervoor) Niveau 2: 0i = γ00 + γ01*dieeti + u0i 1i = γ10 + γ11*dieetihelling heeft geen fout Dus alleen random intercept

Random intercept model: het samengestelde model gewichtij = γ00 + γ01*dieeti+ γ10*tijdj + γ11*dieeti*tijdj + u0i + eij Resultaat: regressie model met simpeler residu eij ~ N(0,2e) , u0i ~ N(0,20) Splitst variantie componenten op in variantie tussen personen en variantie binnen personen Intraclass correlatie:  = 20/(2e+ 20)

Random intercept model: Constante variantie en covariantie: Met: Intraclass correlatie:  = 20/(2e+ 20) Dit komt neer op de aanname van compound symmetrie: Is de aanname van RM-ANOVA

Waarom randomeffects modellen gebruiken? • De correlatie binnen subjecten kan expliciet worden gemodelleerd. • Ingewikkelde designs kunnen worden gemodelleerd • Ook voor categoriele responsematen • Missende data leveren geen problemen op voor random effects modellen, mits de data Missing At Random zijn (MAR).

Help! Statistiek!

Help! Statistiek!

Presentation Transcript