610 likes | 2.33k Vues
www.uab.es/s-estadistica www.e-biometria.com. Cálculo de tamaños de muestra (Con el programa Ene 3.0) Llorenç Badiella Busquets Servei d’Estadística . Contenido. Cálculo de tamaños de muestra (Con el programa Ene 3.0). El problema del tamaño de muestra
E N D
www.uab.es/s-estadistica www.e-biometria.com Cálculo de tamaños de muestra (Con el programa Ene 3.0) Llorenç Badiella Busquets Servei d’Estadística
Contenido Cálculo de tamaños de muestra (Con el programa Ene 3.0) • El problema del tamaño de muestra • Que es Ene 3.0? Utilidades y novedades • Descripción de las fases de un ensayo clínico • Soluciones empleando Ene 3.0
El problema del tamaño de muestra En el apartado de Material y Métodos de cualquier publicación podemos encontrar frases del estilo: “Se eligió una muestra aleatoria de 26 pacientes que permitiera detectar una diferencia de un 20 % en la proporción de sujetos curados (90% vs. 70%) con un poder del 80% empleando un nivel de significación del 5% y un contraste bilateral”. ¿No seria más fácil tomar un número “redondo” de pacientes como 50, 60 ó 100? ¿Por qué la estadística tiene que intervenir en todo esto? ¿Por que no coger el mismo tamaño que en estudios parecidos? ¿Por qué se eligieron 26 pacientes? ¿Es el poder algo relacionado con la eficacia de los tratamientos? ¿No es el conocimiento de la enfermedad y su tratamiento lo que debería marcar las pautas? ¿Es un contraste bilateral porque hay dos tratamientos? ¿Porque precisamente un 90% frente a un 70%, si todavía no hemos comenzado la experimentación? ¿De donde sale y quien decide el nivel de significación?
El problema del tamaño de muestra Pero cuidado con las turbulencias: Estudios de Marketing requieren mayor tamaño de muestra que los estudios exploratorios. En el apartado de Material y Métodos de cualquier publicación podemos encontrar frases del estilo: “Se eligió una muestra aleatoria de 26 pacientes que permitiera detectar una diferencia de un 20 % en la proporción de sujetos curados (90% vs. 70%) con un poder del 80% empleando un nivel de significación del 5% y un contraste bilateral”. Un TM de 400 individuos garantiza siempre una muestra válida y fiable. El tamaño de muestra adecuado es el 1% del total de la población. Si ya existe un estudio similar, el TM será el mismo Por favor que alguien llame al estadístico! Si se trata de pollos, el TM debe ser mayor que si se trata de caballos Si las unidades son escasas o caras, el TM será reducido. No es lo mismo un artículo de impacto, que una tesis o que una tesina Aumentando las expectativas de resultados se reduce el TM. El TM para un objetivo sirve para todos los demás objetivos del estudio. Aumentando los riesgos a y b se reduce el TM. El TM se fija en función del presupuesto
El problema del tamaño de muestra El tamaño de muestra (TM) representa el número mínimo de elementos que debería tener una muestra para que proporcione resultados suficientemente fiables. Cuanto mayor sea el tamaño de una muestra, mayor precisión se obtendrá en el análisis. Por motivos éticos y a veces económicos se requiere que el tamaño de muestra sea el más pequeño posible. Por lo tanto el TM es el número óptimo de sujetos de manera que satisface ambas condiciones simultáneamente. No obstante, el TM no hace milagros: No resuelve problemas de validez (sesgos). Al contrario: asume que no existen.
El problema del tamaño de muestra Es necesario el TM? Confirmar que la dimensión del estudio para comprobar cierta hipótesis es asequible. Cuantificar el riesgo de que un estudio con tamaño de muestra fijado de antemano no pueda alcanzar las conclusiones de interés. No empezar estudios que están condenados a no proporcionar conclusiones útiles. Asumir que un estudio debe ser considerado como piloto o exploratorio si no hay garantías claras de poder detectar diferencias de relevancia clínica.
El problema del tamaño de muestra Estimación
El problema del tamaño de muestra Contraste vs
El problema del tamaño de muestra Contraste
El problema del tamaño de muestra Nivel de significación Qué parámetro se va a estimar? Media Proporción OR – RR Cuantil Previsión de los resultados experimentales Muestreo empleado Aleatorio simple Sin reemplazo Estratificado Conglomerados Inverso Estimación Contraste Estimación Nivel de significación – Potencia (Sensibilidad) Qué parámetros se van a comparar? Medias (log-medias) Proporciones Coeficientes de regresión Medianas Tiempos de supervivencia Previsión de los resultados experimentales (Mínima diferencia relevante) Tipo de muestras empleadas Una muestra 2 Muestras indepentientes k muestras independientes 2 Muestras relacionadas En comparación, hipótesis alternativa? No–igualdad /No–inferioridad / Superioridad relevante / Equivalencia Otros: Compensación de grupos, % abandonos
El problema del tamaño de muestra Método General Determinar la distribución del Estadístico de contraste bajo H0. Calcular el valor crítico para a. Determinar la distribución del Estadístico de contraste bajo H1. Obtener una expresión para b bajo H1 Fijado a , determinar n , que proporciona una potencia de 1-b al realizar el contraste. Observación: La fórmula del TM para un IC, corresponde a un CH con potencia del 50% para una muestra
El problema del tamaño de muestra Conclusión y recomendaciones • Bajo las pruebas más habituales es posible llevar a cabo un cálculo del tamaño de muestra. • Confirmar la magnitud del TM simplificando el estudio y el análisis estadístico • La principal dificultad consiste en fijar la hipótesis alternativa • Emplear estudios piloto, consultar bibliografía • Fijar un tamaño del efecto que represente una diferencia relevante. • Propuestas de investigadores independientes • Adoptar una actitud conservadora • Valorar diferentes escenarios • Cuantificar y aceptar el riesgo de obtener resultados inconcluyentes
Que es Ene 3.0? Utilidades y novedades El programa Ene 3.0: www.e-biometria.com
Que es Ene 3.0? Utilidades y novedades Software en Castellano Distribución libre Amplio espectro de técnicas implementadas Ayuda integrada Ejemplos pre-programados Control dinámico de errores Extenso manual con detalles técnicos Gráficos e informes Redactado automático Utilidades
Que es Ene 3.0? Utilidades y novedades Ampliación de 22 a 61 técnicas Cálculo del TM contemplando abandonos Mayor precisión en los parámetros de entrada/salida Navegador de técnicas Ampliación del ayuda y del glosario Novedades Simon bietápico Regresión múltiple Supervivencia - abandonos e inclusión T-test Satterhwite Log-medias Equivalencia / No-inferioridad / Superioridad Un cuantil Muestreo
Descripción de las fases de un ensayo clínico Fase 0 Estudios preclínicos – invitro, invivo Fase I Constituyen los primeros experimentos con humanos (sanos). Realizados para valorar la seguridad y la máxima tolerancia del tratamiento. También valoran metabolismo, farmacocinética, farmacodinamia, biodisponibilidad. 20-80 pacientes.
Descripción de las fases de un ensayo clínico Estudio a pequeña escala para explorar la eficacia. Realizados para Seleccionar los tratamientos con mayor potencial y menos tóxicos entre diversos candidatos. Identificar posibles eventos adversos. 50 a 400 pacientes. Fase IIa –Estudios de búsqueda de dosi. Fase II Fase III Estudios para confirmar la superioridad en eficacia frente al tratamiento de referencia . Suelen ser estudios rigurosos y de gran envergadura Pretenden confirmar la indicación y las pautas de tratamiento. (ensayo clínico genérico) Observación: En el caso de tratamientos genéricos, “sólo” es necesario demostrar bioequivalencia o no-inferioridad frente al tratamiento de referencia. 1000 - 3000 pacientes
Descripción de las fases de un ensayo clínico Fase IV Estudios para evaluar la eficacia y seguridad en grupos especiales de pacientes (con otras enfermedades concurrentes) y en condiciones reales de la práctica clínica. Pueden ser de larga duración. También permiten valorar nuevas indicaciones, nuevas formulaciones o vías de administración. El término estudio de fase IV también puede referir-se a estudios de marketing para el tratamiento en fase de aprobación. En este caso, su validez científica es limitada. > 5000 pacientes
Soluciones empleando Ene 3.0 Fase IV Estimación con precisión del porcentaje de efectos adversos. Muestreo estratificado Porcentaje esperado de efectos adversos: Estrato 1 ~ 4% (50% población) Estrato 2 ~ 2% (20% población) Estrato 3 ~ 8% (30% población) Muestreo estratificado proporcional Precisión deseada: +/- 1% Nivel de confianza: 95% (bilateral) Porcentaje esperado de abandonos: 15% N1=1023 N2=410 N3=615
Soluciones empleando Ene 3.0 Fase III Comparación de dos medias (estudio paralelo), desviaciones diferentes Promedio esperado grupo control : ~ 5 Desviación esperada grupo control : ~ 10 Promedio esperado grupo experimental : ~ 8 Desviación esperada grupo experimental : ~ 15 Significación : 5% (bilateral) Potencia: 80% Estudio no-equilibrado: 1 control / 2 experimentales Porcentaje esperado de abandonos: 10% N1 = 207, N2 = 415
Soluciones empleando Ene 3.0 Fase III Comparación de dos curvas de supervivencia (estudio paralelo), contemplando período de inclusión y tasa de abandonos Duración del período de inclusión: 12 meses Duración del seguimiento: 36 meses Mediana del tiempo de sup. control: ~ 30 meses Mediana del tiempo de sup. experimental: ~ 36 meses Mediana del tiempo hasta abandono: ~ 70 meses Significación : 5% (bilateral) Potencia: 80% N1 = 485, N2 = 485 Número total de eventos = 380
Soluciones empleando Ene 3.0 Fase III Comparación de equivalencia ratio de medias (estudio cruzado) Prueba unilateral doble Promedio esperado grupo control : ~ 10 Desviación esperada grupo control : ~ 3 Promedio esperado grupo experimental : ~ 10 Desviación esperada grupo experimental : ~ 3 Desviación típica diferencia escala log: = 0.41 Significación : 5% (unilateral doble) Potencia: 80% N parejas = 31
Soluciones empleando Ene 3.0 Fase II Comparación entre una proporción y un valor de referencia Método bietápico de Simon Método para valorar la eficacia de un tratamiento experimental frente a una eficacia de referencia. La valoración se lleva a cabo a través del porcentaje de éxitos (proporción). La idea del método consiste en llevar a cabo un análisis intermedio de los resultados para detener el estudio si no hay indicios del éxito del tratamiento experimental. Fase 1) La técnica permite determinar un umbral de éxitos a superar. Si no se consigue sobrepasar el umbral, el estudio finaliza y el investigador puede concluir que el tratamiento experimental no ofrece las expectativas de éxito previstas y declararlo en cierto modo inútil. Fase 2) Si se consigue sobrepasar el primer umbral, el estudio continua y el método proporciona un nuevo umbral a superar. Si el estudio supera el segundo umbral de éxitos, el investigador puede declarar que el tratamiento mejora la proporción de referencia o valor teórico. El método de Simon pretende optimizar el TM para que sea el menor posible bajo la suposición de que no existen diferencias entre tratamientos, es decir, parte de una posición conservadora.
Soluciones empleando Ene 3.0 Fase II Comparación entre una proporción y un valor de referencia Método bietápico de Simon Proporción grupo control : ~ 20 % Proporción grupo experimental : ~ 35% Significación : 5% (unilateral) Potencia: 90% 1a etapa: N = 37 pacientes, > 8 éxitos se continúa 2a etapa: N = 83 en total, > 22 éxitos se confirma la eficiacia
Soluciones empleando Ene 3.0 Fase I Determinación del tiempo hasta eliminación de residuos En los estudios de período de retirada y eliminación de residuos el parámetro de interés es el valor correspondiente a un percentil determinado: 90, 95 o 99. Por ejemplo, se desea establecer un margen de seguridad para el tiempo transcurrido hasta la eliminación de los residuos en sangre tras la toma de cierto medicamento. El objetivo es determinar el valor correspondiente al percentil 95 (por ejemplo) con cierta fiabilidad. Para ello será necesario proporcionar un margen de precisión conservador: El límite superior del intervalo de confianza al 95% para el percentil 95. Observación: Suele referirse a este valor cómo Límite de tolerancia 95/95
Soluciones empleando Ene 3.0 Fase I Determinación del tiempo hasta eliminación de residuos Percentil de interés: 95% Desviación típica: ~ 5 Precisión: +1 Nivel de confianza: 95% (unilateral superior) N = 187
Conclusiones Conclusión Ene 3.0 incorpora todas las técnicas habituales en estimación y en contraste Ene 3.0 cubre todas las fases de un ensayo clínico El tamaño de muestra adecuado no garantiza una muestra adecuada No olvidar justificar adecuadamente todas las decisiones en el CTM Versión actualizada Ene 3.0.1
Turbulencias Estadísticas y tamaño de muestra Left-handedness: a marker for decreased survival fitness. Coren S, Halpern DF Life span studies have shown that the population percentage of left-handers diminishes steadily, so that they are drastically underrepresented in the oldest age groups. Data are reviewed that indicate that this population trend is due to the reduced longevity of left-handers. Some of the elevated risk for sinistrals is apparently due to environmental factors that elevate their accident susceptibility. Further evidence suggests that left-handedness may be a marker for birth stress related neuropathy, developmental delays and irregularities, and deficiencies in the immune system due to the intrauterine hormonal environment. Some statistical and physiological factors that may cause left-handedness to be selectively associated with earlier mortality are also presented. Do left-handers die sooner than right-handers? Commentary on Coren and Halpern's (1991). Harris, Lauren J. Cross-sectional life span studies of handedness typically show decreasing percentages of left-handers in older age groups. S. Coren and D. F. Halpern argued that this age trend reflects the shorter life span of left-handers than right-handers. They presented 2 studies providing what they regard to be direct evidence that left-handers, on average, die sooner than right-handers. They also proposed a variety of reasons for what they called left-handers' "decreased survival fitness." The author discusses Coren and Halpern's reasons for rejecting a more conventional explanation of the life span data, the 2 studies that they offered in support of their argument, their analysis of other evidence they invoked to account for left-handers' putative decreased survival fitness, and new studies in which the longevity explanation was tested by more direct means than have been used thus far. The author concludes that the case for the "decreased survival fitness" hypothesis cannot be sustained. Left-handedness and life span : a reply to Harris - HALPERN D. F. (1) ; COREN S. ; L. G. Harris's (1993) critique of our hypothesis that left-handedness is associated with a shorter life span (S. Coren & D. F. Halpern, 1991) ignores the supporting statistical evidence, which virtually always shows an increased incidence of left handedness (or other left-sided laterality) associated with a wide range of health risk factors, including serious accidents, immune disorders, early onset breast cancer, alcoholism, smoking, some types of mental retardation, homosexuality, birth-related complications (e.g., resuscitation at birth, extremely low birth weight, Rh incompatibilities, multiple birth, breechbirth, and older maternal age), and selected categories of mental disorders Douglas G Altman: Statistics Notes Time to event (survival) data. The differing longevity in relation to handedness would have arisen if the prevalence of left handedness had increased over the past 80 years. Proper prospective studies have found no evidence of an effect of handedness on lifespan.
II Error de tipo II: Falso negativo ThemeGalleryis a Design Digital Content & Contents mall developed by Guild Design Inc. Utilidades