Elementos del Diseño de Experimentos y Análisis de la Varianza

Elementos del Diseño de Experimentos y Análisis de la Varianza

¿Qué es un estudio observacional? Sobre un proceso existente se observa una o más variables aleatorias (registrar información) Finalidad: explorar, describir, confirmar hipótesis

¿Qué es un experimento? “Prueba o serie de pruebas en las cuales se inducen cambios deliberados en las variables de entrada de un proceso o sistema, de manera que sea posible observar e identificar las causas de los cambios en la respuesta de salida” (Montgomery 1991). Finalidad: confirmar hipótesis, modelar, predecir

Experimentos Comparativos Consisten en la aplicación de tratamientos a un conjunto de unidades experimentales para valorar y comparar las respuestas obtenidas desde diferentes tratamientos Se busca incrementar la precisión y el alcance de la inferencia realizada Diseño

Algunos diseños clásicos Completamente aleatorizadoBloques completos aleatorizadosCuadrado latinoExperimentos factorialesDiseños en parcelas divididas

Diseño de Experimentos: Elementos Unidad experimentalFactores y TratamientosFuentes de Error Aleatorización RepeticiónEstructura de parcelasEstructura de tratamientos

Unidad Experimental (UE) • Porción de material, individuo o grupo de individuos, que recibe un tratamiento y sobre la que se observa una respuesta. • El tamaño de la UE es usualmente una decisión arbitraria, pero afecta la calidad de la observación de la variable respuesta. • La UE es definida y tratada de forma tal que provea una respuesta “nueva” o estadísticamente independiente de la provista por otras UE.

Variables de respuesta • Las respuestas suelen llamarse variables de respuesta o variables dependientes. • Las variables de respuesta pueden ser cualitativas o cuantitativas. • Las observaciones de la respuesta pueden ser uni o multivariadas.

Factores • Las potenciales fuentes de variación de la respuesta en un experimento identificadas a priori son llamadas factores. • Los distintos estados o valores de los factores se llaman niveles. • La combinación de niveles evaluados para un conjunto de factores recibe el nombre de tratamiento.

Error experimental • El término de error experimental es la diferencia entre el valor observado de la variable respuesta sobre una UE y su valor esperado. • El error experimental es la fuente de variación observada entre UE tratadas de la misma forma.

Aleatorización • Aunque la aleatorización “distribuye los errores” y controla el sesgo, no elimina ni minimiza el error experimental. • Cuando se puede reconocer una fuente sistemática de variación en el error, entonces es posible incorporarla al modelo y descontarla del error experimental. • El bloqueo es el resultado de un reconocimiento a priori de fuentes sistemáticas de error y permite obtener experimento más eficientes.

Repetición • Repetición de un tratamiento es la aplicación del tratamiento a una nueva UE • Dado que toda observación tiene error, la única forma de estimar insesgadamente el efecto de un tratamiento es promediando sobre un conjunto de repeticiones • La identificación de las fuentes de error facilita obtener repeticiones genuinas de un tratamiento Pseudoréplicas

Estructura de parcelas El diseño de la estructura de parcelas consiste en el agrupamiento de unidades experimentales homogéneas en grupos o bloques

Estructura de parcelas Unidades experimentales homogéneas, es decir sin estructura Diseño Completamente al Azar Unidades experimentales heterogéneas, es decir que presentan variabilidad sistemática natural o inducida Diseño en Bloques

Estructura de tratamientos Consiste en el conjunto de tratamientos o poblaciones que el experimentador ha seleccionado para estudiar y/o comparar

Modelo • A través de la modelación estadística se analiza la respuesta del sistema en estudio • El modelo debe incluir todas las fuentes de variación reconocidas, ya sean debida a factores de tratamiento o a la estructura de las UE • También debe reconocer fuentes de variación no explicadas (error) de naturaleza aleatoria • El modelo debe incluir supuestos distribucionales sobre las componentes aleatorias

Diseño Completamente Aleatorizado

Diseño Completamente Aleatorizado: Modelo variable respuesta = media general + efecto de tratamiento + error aleatorio Media general de las observaciones () Efecto del tratamiento (i ) El error aleatorio (ij )

Diseño Completamente Aleatorizado: Modelo Yij = + i + ij , con i=1,...,a y j=1,..,n donde: Yij es la j-ésima observación del i-ésimo tratamiento  es la media general de las observaciones i es el efecto del i-ésimo tratamiento ij es una variable aleatoria normal, indep. distribuida con esperanza 0 y varianza 2 ij

Diseño Completamente Aleatorizado El objetivo del ANAVA de efectos fijos es contrastar las hipótesis H0: µ1=...=µa versus H1: Al menos un par de medias difieren

Diseño Completamente Aleatorizado O bien: H0: 1=...=a= 0 vs. H1: Al menos un tratamiento tiene efecto no nulo

Diseño Completamente Aleatorizado La prueba consiste en calcular el estadístico F utilizando los estimadores de 2E y 2D de la siguiente forma:

Diseño Completamente Aleatorizado

Diseño Completamente Aleatorizado: ejemplo El porcentaje de humedad relativa (HR) es determinante para el ataque de hongos en semillas. Para evaluar la susceptibilidad de las semillas de una forrajera al ataque de un hongo se realizó un ensayo en cámaras de cría con tres porcentajes de HR: 70%, 80% y 90%. Se tomaron cinco observaciones para cada porcentaje de HR, registrándose el número de semillas atacadas en un grupo de 100 semillas.

Diseño Completamente Aleatorizado: ejemplo

Diseño Completamente Aleatorizado: ejemplo Cuadro de Análisis de la Varianza F.V. SC gl CM F p-valor Modelo 294.93 2 147.47 21.90 0.0001 HR 294.93 2 147.47 21.90 0.0001 Error 80.80 12 6.73 Total 375.73 14 _

Diseño Completamente aleatorizado: ejemplo Si  = 0.05 luego el punto crítico que delimita la zona de aceptación y rechazo de H0 es F(2,12; 0.95) = 3.88 Valor p= 0.0001 Se concluye, con un nivel de significación del 5%, que se rechaza la hipótesis nula de igualdad de medias, por lo tanto al menos una de las HR produce un grado de ataque de hongos diferente de los restantes.

Comparaciones Múltiples Si se rechaza la hipótesis nula del ANAVA, la pregunta que sigue es ¿cuál o cuáles de las medias poblacionales en estudio son las diferentes? Existe una gama muy amplia de alternativas para llevar adelante este tipo de pruebas, entre las que se destacan las pruebas de Tukey (Tukey, 1949), Scheffé (Scheffé, 1953), Duncan (Duncan, 1955), Dunnet (Dunnet, 1964) y la de Fisher (Fisher, 1966), entre otras

Prueba de Tukey La DMS de la prueba de Tukey para el ejemplo es 4.37 Luego, se debe observar que las diferencias entre medias muestrales sean mayores que 4.37

Prueba de Tukey Así se concluye: 70% 80% 70% 90% 80% = 90%

Prueba de Tukey Test: Tukey Alfa= 0.05 DMS= 4.37841 Error: 6.7333 gl: 12 HR Medias n 70 7.20 5 A 80 16.40 5 B 90 16.80 5 B Letras distintas indican diferencias significativas (p <= 0.05)

Verificación de Supuestos Los errores se suponen normales con esperanza cero, varianza común e independientes. Los predictores de los errores son los residuos Se llama residuo de la observación j-ésima correspondiente al i-ésimo nivel del factor tratamiento al predictor de ij, que se denota por eij y se obtiene como la diferencia entre el valor observado y el valor predicho por el modelo

Normalidad Seleccionando los residuos como variable de análisis, una de las técnicas más usadas es construir un Q-Q plot normal. Mediante esta técnica se obtiene un diagrama de dispersión en el que, si los residuales son normales y no hay otros defectos del modelo, entonces se alinean sobre una recta a 45°

Normalidad InfoStat provee automáticamente el coeficiente de correlación (r) entre los residuos y los estadísticos de orden muestrales, en el gráfico Q-Q plot. El cuadrado de r es el estadístico r2 de Shapiro-Francia, para la prueba de normalidad. Los valores de significancia asociados a r2 para muestras de tamaño 35 a 99 fueron publicados por Shapiro y Francia en 1972 (Rawlings,1988). Valores de r2 cercanos a 1 sugieren distribución normal de la variable en estudio.

Homogeneidad de Varianzas Cuando los errores son homocedásticos, haciendo un gráfico de dispersión de residuos vs. valores predichos por el modelo se debe observar una nube de puntos sin patrón alguno. Un patrón típico que indica falta de homogeneidad en las varianzas, se muestra en la siguiente figura:

Homogeneidad de Varianzas: Ejemplo

Aleatorización Para modelar es importante identificar DOS tipos de estructuras Estructura de parcelas Estructura de tratamientos

Estratificación o Bloqueo de UE • El balance de algunos factores que influyen sobre las unidades experimentales se puede mejorar aleatorizando separadamente dentro de subgrupos de unidades (estratificando o bloqueando). • Toda restricción a la aleatorización completa debe ser considerada durante el análisis.

Diseño en Bloques completos • aleatorizados

Diseño en Bloques completos • aleatorizados Homogeneidad dentro de bloques Heterogeneidad entre bloques

Modelo Yij =  + i + j + ij con i=1,...,a j=1,...,b •  corresponde a la media general • i el efecto del i-ésimo tratamiento • j el efecto del j-ésimo bloque • ij es el error aleatorio El error aleatorio está asociado con la unidad experimental en el bloque j , que recibe el tratamiento i. Comúnmente los términos de error se asumen normalmente distribuidos con esperanza cero y varianza común 2.

Diseño en Bloques completos aleatorizados: ejemplo Se realizó un ensayo para evaluar el rendimiento en kg de materia seca por hectárea de una forrajera con distintos aportes de N2 en forma de urea. Las dosis de urea probadas fueron 0 (control), 75, 150, 225 y 300 kg/ha. El ensayo se realizó en distintas zonas, en las que por razones edáficas y climáticas se podían prever rendimientos diferentes. Las zonas en este caso actuaron como bloques.

Diseño en Bloques completos aleatorizados: ejemplo

Diseño en Bloques completos • aleatorizados

Diseño en Bloques completos aleatorizados: ejemplo

Comentarios finales El DBCA es una estrategia experimental para disminuir el efecto de variaciones sistemáticas entre UE sobre la comparación de medias de tratamiento. Tales variaciones son reconocidas antes de realizar el experimento. Un bloque es un grupo de UE homogéneas. El DBCA representa una restricción a la aleatorización. Los tratamientos son aleatorizados por bloques.

Elementos del Diseño de Experimentos y Análisis de la Varianza

Elementos del Diseño de Experimentos y Análisis de la Varianza

Presentation Transcript

SUPUESTOS DEL ANALISIS DE VARIANZA

Nívea Cordeiro 2010

XML Schema (XSD)

Unidad 12 : FORMULACIÓN Y NOMENCLATURA INORGÁNICAS

Unidad 3: La diversidad hídrica y biogeográfica de España

ELEMENTOS DE PROTECCIÓN PERSONAL AUDITIVOS - RESPIRATORIOS

ELABORADO POR: FRANCISCO XAVIER C ÓRDOVA ALARCÓN JONATHAN ERNESTO BENAVIDES BELTRÁN

399

Projeto de Experimentos Científicos Análise de Sistemas por Usuários

TEORIA DE JUEGOS Edelina Coayla

Elementos del bloque d (metales de transición)

‘’’’’’’’’’’’’’’’’’’’’’’’’’’’’’’’’

Nívea Cordeiro 2014

Elementos de un lenguaje de programación

CIRCUITOS NEUMÁTICOS Y SISTEMAS HIDRÁULICOS

Química Inorgânica I

Componentes de una Dentadura Parcial Removible de Cromo Cobalto

LEYES DE MENDEL

ANALISIS DE VARIANZA

Estadística Descriptiva y Elementos de Probabilidad

UNIDAD 3 BIOELEMENTOS Y BIOMOLÉCULAS

‘’’’’’’’’’’’’’’’’’’’’’’’’’’’’’’’’