280 likes | 513 Vues
Medicinsk statistik III Läkarprogrammet, Termin 5 HT 2013. Jonas Björk E-post: Jonas.Bjork@skane.se. Medicinsk statistik III. Mer om statistik för binära utfall Kapitel 12 Dimensionering av studier Statistisk styrka ( power ) En grupp, två grupper Kontinuerliga och binära utfall
E N D
Medicinsk statistik IIILäkarprogrammet, Termin 5HT 2013 Jonas Björk E-post: Jonas.Bjork@skane.se
Medicinsk statistik III • Mer om statistik för binära utfall • Kapitel 12 • Dimensionering av studier • Statistisk styrka (power) • En grupp, två grupper • Kontinuerliga och binära utfall • Avsnitt 6.4, 8.4 och 10.4 • Tolkning av p-värden • Statistiska vs. diagnostiska test • Avsnitt 9.2 Kapitel 12 Avsnitt 6.4, 8.4, 9.2 och 10.4 Webbplats
1. Binära utfall Binära utfall • Sjuk / frisk • Positiv / negativ • Reaktion / ingen reaktion • ... • Dikotomiseringar
1. Binära utfall Dikotomiseringar • Kontinuerliga data • CRP > 15 • Systoliskt blodtryck >160 mmHg • Ordinaldata (data endast möjliga att rangordna) Ex. Klassning av allergisk reaktion +++, ++(+), ++, +(+), +, (+), ?, - Information kastas bort – väsentlig eller ovidkommande?
1. Binära utfall Binära utfall - Exempel • Alarm om glutenallergi bland barn Bland 7 207 skolbarn i åk 6 år 2005-2006 fann man att 212 (2,9%) var glutenintoleranta 1. Hur stor är den statistiska felmarginalen 2. Kan vi vara ”säkra” på att den verkliga andelen glutenintoleranta är över 2%?
1. Binära utfall Konfidensintervall (KI) kring en uppskattad andel Prevalens q =a / n = 0,029 = 2,9% n = 7 207, a = 212 positiva Om a 5 och (n – a) 5 kan konfidensintervallet beräknas på följande sätt (asymptotisk = ungefärlig metod): 95% konfidensgrad c = 1,96, SE = Medelfel (Standard error) Felmarginal ± 0,4% 95% KI: 2,5 - 3,3%
2. Dimensioneringsberäkningar - en grupp Uppskatta en andelHur stor ska studien vara? • Anta att vi vill skatta en andel q, t.ex. en prevalens eller risk • Hur stor studien bör vara bestäms av • Andelen q (okänd för oss, men vi kan kanske gissa) • Önskad felmarginal F • Utnyttja formel för 95% KI, lös ut n: I boken finns motsvarande formel för ett medelvärde (formel 6.3)
1. Binära utfall Jämförelse av två andelar Två separata (oberoende) grupper: q1 = a1 / n1, q2= a2 / n2 • Differens q1 – q2 -Ex. prevalensdifferens, riskdifferens • Kvot q1 / q2 -Ex. prevalenskvot, riskkvot (RR = relativ risk) • Oddskvot OR = 1 / 2 Odds1 = q1 / (1– q1), 2 = q2 / (1– q2)
1. Binära utfall Jämförelser av andelar Randomiserad studie av tamoxifen, strålbehandling och återfall av bröstcancer under fem års uppföljning (Overgaard et al. 1999) Sjukdomsfri överlevnad i grupp 1:q1 = 357 / 686 0,52 = 52% Sjukdomsfri överlevnad i grupp 1:q2 = 276 / 689 0,40 = 40% Vad kan vi säga om skillnaden i sjukdomsfri överlevnad (eller i återfallsrisk)?
1. Binära utfall Differens mellan två andelar Randomiserad studie av tamoxifen, strålbehandling och återfall av bröstcancer bland kvinnor Riskdifferens RD (absolut riskreduktion) = 357/ 686 – 276 / 689 0,12 = 12 fler sjukdomsfria per 100 behandlade Medelfel Om a15, (n1 – a1)5, a2 5 och (n2 – a2)5 kan ett 95% KI för RD bildas som 7 – 17 fler per 100
1. Binära utfall Antal som behöver behandlasNNT = Numbers Needed to Treat Från föregående problem:Riskdifferens RD = 357 / 689 – 276 / 686 0,12 = 12 fler sjukdomsfria per 100 behandlade • NNT = 1 / RD 1 / 0,12 8,3vilket innebär att ungefär 8 (8,3) patienter behöver behandlas med kombinationsbehandlingen för att förhindra ett återfall i genomsnitt • 95% KI för RD: 0,12 ± 0,052, dvs. 0,068 till 0,172 • 95% KI för NNT: 6 till 15 patienter behöver behandlas för att förhindra ett återfall i genomsnitt 1 / RD
1. Binära utfall Kvot mellan två andelar Randomiserad studie av tamoxifen, strålbehandling och återfall av bröstcancer bland kvinnor gånger (25%) högre risk om enbart tamoxifen ges Relativ risk RR = (413 / 689) / (329 / 686) 1,25 ln(RR) = ln(1,25) 0,223 Medelfel 95% KI för RR bildas på log-skalan som 1,08 – 1,44 gånger högre risk
1. Binära utfall Oddskvot (OR) i fall-kontrollundersökningar Odds för exponering bland fall: 630/101 6,2 Odds för exponering bland kontroller: 573/158 3,6 70% riskökning bland rökare 95 % KI: 1,3 till 2,3 (30 till 130% riskökning)
2. Dimensioneringsberäkningar - två grupper Statistisk styrka • Sannolikheten a priori att H0 kommer att förkastas, givet en viss verklig skillnad mellan de grupper som studeras • Sensitiviteten hos det statistiska testet (jämför sensitivitet hos diagnostiska test)
2. Dimensioneringsberäkningar Dimensioneringsberäkningar Två oberoende grupper, medelvärdesjämförelse (Kursboken s. 156)
2. Dimensioneringsberäkningar Dimensionering av två oberoende grupper
3. Statistisk styrka 2. Dimensioneringsberäkningar Gruppstorlek vs. effektstorlek
2. Dimensioneringsberäkningar SyreupptagningsförmågaReplikera tidigare resultat i en ny studie spooled 8
2. Dimensioneringsberäkningar Dimensioneringsberäkning (enl. 1.)Två oberoende grupper,medelvärdesjämförelse • Ex. Syreupptagningsförmåga 5% signifikansgräns k1 = 1.96 80% statistisk styrka k2 = 0.84 Standardiserad effektstorlek per grupp
2. Dimensioneringsberäkningar Dimensioneringsberäkningar - Allmänt • Redovisas först och främst för primär frågeställning. • Minst 80% statistisk styrka är ett vanligt krav om nya data ska samlas in • Gör beräkningen under olika antaganden om , sStandardiserad effektstorlek = / s avgörande • Ibland enklare att uppskatta variationskoefficienten (CV=Coefficient of variation, mätt i % av medelvärdet) än standardavvikelsen • Ta hänsyn till förväntad deltagandefrekvens • Utnyttja tidigare studier inom området! • I en överlevnadsanalys är det antal händelser (events) som avgör. Avvägning: Uppföljningstid - Antal patienter
3 Statistisk styrka 2. Dimensioneringsberäkningar Program för dimensioneringsberäkningar • PS Power and Sample Size Calculation • Enkelt, lättattanvända • Kanladdasned gratis via http://biostat.mc.vanderbilt.edu/twiki/bin/view/Main/PowerSampleSize • G*Power 3 • Meravancerat, någotsvårareattanvända • Kanladdasned gratis via http://www.psycho.uni-duesseldorf.de/abteilungen/aap/gpower3
2. Dimensioneringsberäkningar Diskutera med bänkgrannen...Känslighetsanalys Vad händer med minsta gruppstorlek i exemplet på föregående bilder om • Man vill kunna detektera en skillnad som är hälften så stor, dvs = 5 / 2 = 2,5 ? • Standardavvikelsen s är 12 istället för 8 i båda grupperna? • 90% statistisk styrka krävs (k2 = 1,28)?
3. Statistisk styrka 2. Dimensioneringsberäkningar Förklara studiens storlek Randomiserad studie av tamoxifen, strålbehandling och återfall av bröstcancer Författarna skrev så här i metoddelen: (Overgaard et al. 1999)
2. Dimensioneringsberäkningar Fall-kontrollundersökningHur många fall och kontroller behövs? • Förväntad OR =1.7 enligt tidigare studie • Rökprevalens i den befolkning vi studerar? • Utnyttja PS Power Sample Size
4. Tolkning av p-värden 3. Tolkning av p-värden Statistiskt vs. Diagnostiskt test • Statistisk styrka = Sensitivitet • Signifikansgräns (; ofta 5%) = 1 - Specificitet (Kursboken, s. 261)
3. Tolkning av p-värden Sifting the evidence –what’s wrong with significance tests? Tolkning av p-värdenModernt förhållningssätt • P-värdet bör främst ses som ett index (0-1) som svarar på följande fråga:Vilka belägg mot nollhypotesen finns i insamlade data? • Undvik skarp signifikansgränsEx. p = 0,04 och p =0,06 är två snarlika resultat som båda ger ”måttliga” evidensmot nollhypotesen • P-värdet är inte sannolikheten att nollhypotesen är sann: (Sterne & SmithBMJ 2001;322:226-231)
3. Tolkning av p-värden Testets prediktiva värden bestäms av sjukdomsprevalensen
3. Tolkning av p-värden Sannolikheten att H0 är sannFPRP = False Positive Report Probability P-värde omkring 0,001 innebär i allmänhet starka belägg för ett samband