200 likes | 385 Vues
Técnicas estadísticas multivariantes: de la visualización al contraste de hipótesis. b. a. a. b. b. a. c. c. c. Técnicas multivariantes:. muestras. a. especies. ordenación. matriz triangular de similitudes. a. a. b. b.
E N D
Técnicas estadísticas multivariantes: de la visualización al contraste de hipótesis
b a a b b a c c c Técnicas multivariantes: muestras a especies ordenación matriz triangular de similitudes a a b b Ordenación y clasificación son formas de explorar/visualizar las relaciones de similitud entre muestras/tratamientos/factores c clasificación
Clasificación (análisis clúster) Técnicas para agrupar/separar grupos de objetos (e.g. muestras/especies) “en paquetes” basadas en su similitud (se basan en índices de similitud) Genera en dendograma basado en una clasificación generalmente jerárquica: pequeños grupos de objetos (p.e. muestras/especies) dentro de grupos mayores y estos a su vez dentro de grupos mayores; y aglomerativa: se parte de tantas clases como objetos tengamos que clasificar y en pasos sucesivos vamos obteniendo clases de objetos similares
Clasificación: un ejemplo Diseño experimental y análisis estadístico: su aplicación en biología marina
Clasificación: ¿merece la pena? No sólo depende del tipo de distancia que seleccionemos, sino tb de las muchos estrategias para construir el dendograma. Y hay muchísimas¡ Escepticismo respecto a la clasificación "The availability of computer packages of classification techniques has led to the waste of more valuable scientific time than any other statistical innovation (with the possible exception of multiple regression techniques)." Cormack (1971) A review of classification. Journal of the Royal Statistical SocietyA 134, 321-367. Diseño experimental y análisis estadístico: su aplicación en biología marina
Un dendograma pueden ser re-estructurado alrededor de cualquier intersección/nodo y objetos que aparecían distantes pueden aparecer cerca D C B A B A D C En estudios de ecología la mejor clasificación es una ordenación Diseño experimental y análisis estadístico: su aplicación en biología marina
PCA/MDS/cluster son técnicas de visualización de patrones: no permite contraste de hipótesis Necesidad de un test para contrastar las diferencias entre grupos que acompañe a una técnica de visualización de patrones Rutina ANOSIM
Por ejemplo, ¿diferencias entre tratamientos 1 y 2? Ho = tratamientos son iguales Ha = tratamientos NO son iguales Tratamiento 1 Tratamiento 2
Ho = verdad variabilidad entre tratamientos = o < variabilidad dentro de cada tratamiento
Ha = verdad variabilidad dentro de tratamientos < variabilidad entre tratamientos Diseño experimental y análisis estadístico: su aplicación en biología marina
ANOSIM • Técnica de contraste hipotético que proporciona un p-valor para contrastar la hipótesis: Ho = tratamientos son iguales Ha = tratamientos NO son iguales • Podemos ejecutar tantos contraste como pares de niveles queramos contrastar. Obtengo un estadístico (R) y lo importante: un p-valor asociado
BIOENV Análisis directo de gradientes: explicar la variabilidad de la matriz Y (biótica) en términos de variables predictoras “Xs” (abiótica) X (matriz abiótica) Y (matriz biótica)
RDA: cómo actúa Problema: colinealidad; muchas X están correlacionadas. Por ello, uso RDA siempre en combinación la regresión multivariante múltiple para seleccionar las X apropiadas (rutina/freeware DISTLM que veremos en las prácticas) = buscar el modelo con mayor “parsimonia”
Técnicas multivariantes: resumiendo Diseño experimental y análisis estadístico: su aplicación en biología marina
b a a b b a c c c Variables (muestras) a Objetos (especies) ordenación matriz triangular de similitudes a a b b c clasificación
Ordenación: casos tipo y sus tests de contraste PCA, nm-MDS, análisis indirecto de gradientes Test = ANOSIM BIOENV – análisis directo de gradientes Test = reg. múltiple Multivariante