590 likes | 1.17k Vues
SEMINARIO DE POSGRADO. METODOLOGÍA DE INVESTIGACIÓN MÓDULO 6: TÉCNICAS ESTADÍSTICAS DE ANÁLISIS MULTIVARIADO. Métodos multivariados. Su clasificación. La investigación EMPÍRICA se ocupa de fenómenos multidimensionales .
E N D
SEMINARIO DE POSGRADO METODOLOGÍA DE INVESTIGACIÓN MÓDULO 6: TÉCNICAS ESTADÍSTICAS DE ANÁLISIS MULTIVARIADO
Métodos multivariados Su clasificación La investigación EMPÍRICA se ocupa de fenómenos multidimensionales • Problemas de interdependencia o creación de índices (análisis factorial, cluster y escalamiento). • Problemas de causalidad o asociación (análisis de varianza, regresión y discriminante). Clasificación de los métodos multivariados
Métodos multivariados Métodos de interdependencia • Descripción de Dimensiones: posibilitan la identificación de dimensiones o conceptos complejos subyacentes (Análisis Factorial, Componentes Múltiples, etc.). • Clasificación de unidades o variables: permiten clasificar unidades individuales o colectivas o variables con el fin de crear tipologías, cluster o clases de individuos (Cluster, Escalamiento, etc.).
Métodos multivariados Métodos de interdependencia • Utilidad de este tipo de métodos: • Evalúan correlaciones y sintetiza información • Muestran la estructura de los datos según criterio • Establecen clasificaciones y/o genera valores índices • Técnicas de Análisis • ANÁLISIS FACTORIAL • ANÁLISIS DE CORRESPONDENCIAS • ANÁLISIS DE CLUSTER
Análisis factorial • Busca una síntesis del fenómeno objeto de estudio. Logra resumir la información e identificar lo fundamental de la misma, revelando la estructura subyacente de los datos. • Algunos ejemplos: • Identificar los factores o componentes principales que intervienen en la construcción de la imagen de una marca o de una organización, de un comportamiento o de una actitud. ANÁLISIS DE CASOS
Análisis factorial EN LA INVESTIGACIÓN SOCIAL SE TRABAJA CON MUCHOS CONCEPTOS COMPLEJOS QUE NO SON DIRECTAMENTE OBSERVABLES USOS MÁS FRECUENTES Creación de variables resumen Reducción de información Identificación de estructuras subyacentes
Análisis factorial REQUISITOS PARA SU UTILIZACIÓN • Selección de variables que formen conjuntos coherentes (FACTORES) • Variables en escala métrica • Variables no métricas (ESTADARIZACIÓN DE SUS VALORES) • CANTIDAD DE CASOS: mínimo de 100 casos • CIERTA CORRELACIONES ENTRE LAS VARIABLES OBSERVABLES
Análisis factorial ETAPAS BÁSICAS FASE DE PREPARACIÓN DE VARIABLES. ANÁLISIS DE CORRELACIÓN. MÉTODO DE COMPONENTES. EXTRACCIÓN Y SELECCIÓN DE LOS FACTORES. GRÁFICO DE SEGMENTACIÓN. VALORES PROPIOS Y VARIANZA EXPLICADA. MATRIZ DE CARGAS FACTORIALES. INTERPRETACIÓN: ROTACIÓN VARIMAX Y REPRESENTACIÓN GRÁFICA EVALUACIÓN Y VALORACIÓN DEL ANÁLISIS
Análisis de Componentes Principales Caracterización de los factores: Saturaciones Factor 1 Acceso deficitario a la educación y la vivienda
Análisis de Componentes Principales Extracción de los factores principales
Análisis de correspondencia • Busca descubrirydescribirlas dimensiones fundamentales de un fenómeno pero con la particularidad de que trabaja con variables categóricas que proporcionan mapas perceptuales que permiten una representación fácilmente comprensible. • Algunos ejemplos: • Posicionamiento de productos y de atributos. ANÁLISIS DE CASOS
Análisis de correspondencia RELACIONES ENTRE VARIABLES CATEGÓRICAS QUE SE ANALIZAN MEDIANTE MAPAS PERCEPTUALES Y EFECTOS FACTORIALES A TRAVÉS DE FACTORES REDUCE LAS DIMENSIONES DE ANÁLISIS Paso intermedio para la aplicación de otras técnicas como el análisis de cluster, regresión y análisis discriminante. Permite estudiar las formas que adoptan las relaciones entre las variables
Análisis de correspondencia ETAPAS BÁSICAS ANÁLISIS DE CORRESPONDENCIAS MÚLTIPLES ANÁLISIS DE CORRESPONDENCIAS SIMPLES Tablas multidimensionales Tablas bidimensionales • Preparar tablas de contingencia: Perfiles filas y columnas • Distancias chi-cuadrado entre filas y columnas • Valores propios e inercia de valores propios • Contribuciones absolutas y relativas • Coordenadas de filas y columnas • Representación factorial de filas y columnas
Análisis cluster • Partiendo de un conjunto de variables se obtienen subconjuntos o grupos, ya sea de casos ya sea de variables. Se busca establecer grupos HOMOGÉNEOS internamente y HETEROGÉNEOS entre ellos. Algunos ejemplos: • En el campo del Marketing es útil para clasificar e identificar segmentos, tipos de productos, tipos de consumidores, etc. ANÁLISIS DE CASOS
Análisis cluster • Responde a la necesidad de: • DIFERENCIAR • CLASIFICAR • SEGMENTAR (TIPOLOGÍAS) SE PUEDEN AGRUPAR CASOS / INDIVIDUOS VARIABLES / CARACTERÍSTICAS
Análisis cluster CRITERIOS PARA DISTINGUIR GRUPOS Criterio estricto (dicotómico) Criterio estadístico (probabilidad) • Se busca formar grupos mutuamente excluyentes y colectivamente exhaustivos, pero los criterios de agrupamiento y la medida de distancia pueden producir cambios en la estructura de los grupos
Análisis cluster REQUISITOS y ETAPAS • Representatividad de la MUESTRA • Controlar la MULTICOLINEALIDAD entre las variables • Definir MÉTODO y medidas de distancia para la formación de grupos • Análisis de distancias euclídeas (diagrama en árbol), esquemas de agrupación y de la media de los grupos. • Delimitación del NÚMERO de grupos significativos.
Métodos multivariados Problemas de causalidad • Diferencian entre variables (a) explicativas, independientes o predictivas, (b) variables a explicar o dependientes, y (c) variables control o intervinientes. • La distinción entre variables dependientes e independientes debe efectuarse con arreglo a fundamentos teóricos, por conocimiento o experiencia y estudios anteriores. Métodos de tipo: • EXPLICATIVOS /PREDICTIVOS
Métodos multivariados Problemas de causalidad • Utilidad de este tipo de métodos • Mide la fuerza y sentido de relaciones parciales • Predice valores a partir de una serie de variables • Explica el comportamiento de una o más variables • Evalúa la bondad de ajuste de un modelo teórico a los datos • MÉTODOS • ANÁLISIS DE VARIANZA (ANOVA) • ANÁLISIS DE REGRESIÓN • ANÁLISIS DISCRIMINANTE • REGRESIÓN LOGÍSTICA
Análisis de regresión • Es suceptible de utilizar cuando contamos con una variable dependiente métrica y variables independientes métricas ó categóricas (ficticia). • Explica el comportamiento de la variable dependiente (ej: ventas, gastos, consumo), • Anticipa sus valores en función de los atributos de las variables independientes (ej: precio, gasto en publicidad, atributos personales, segmento de mercado) y • Estima las incidencias que cada una de éstas tiene en la variable dependiente. ANÁLISIS DE CASOS
Análisis de regresión TIPOS DE DATOS • Los datos que se utilizan en la aplicación de esta técnica pueden ser: • SERIES DE TIEMPO y • DATOS DE CORTE TRASVERSAL Modelo de Regresión Lineal Simple (MLS) • Figura una sola variable explicativa, el comportamiento de la variable Y se puede explicar a través de la variable X Modelo de Regresión Múltiple • La variable dependiente viene explicada por varias variables independientes.
Análisis de regresión HIPÓTESIS BÁSICAS • Se supone que la forma funcional que liga la variable explicada son las variables explicativas es de tipo LINEAL al menos en los parámetros. • Las variables explicativas deben ser linealmente INDEPENDIENTES, es decir, que no hay multicolinalidad exacta.
Análisis de regresión REQUISITOS Y ETAPAS • Control de distribución de errores • Estimación de coeficientes e interpretación • Intervalos de confianza y prueba de hipótesis • Bondad de ajuste • Predicción • Variables ficticias
Modelos de Regresión Lineal ANÁLISIS DE UN EJEMPLO El ingreso horario de los ocupados (entre 25 y 45 años) no se ve afectados por el sexo sino que depende de la cantidad de años de instrucción
EJEMPLO CORRELACIÓN Total Ocupados entre 25 y 45 años (con ingresos)
Modelos de Regresión Lineal ANÁLISIS DE UN EJEMPLO • BONDAD DE AJUSTE DEL MODELO (R2)
Modelos de Regresión Lineal ANÁLISIS DE UN EJEMPLO • ANÁLISIS DE VARIANZA DE LOS MODELOS
Modelos de Regresión Lineal ANÁLISIS DE UN EJEMPLO • COEFICIENTES B Y PRUEBAS T DE SIGNIFICANCIA
Modelos de Regresión Lineal Control de Supuestos • Detección de MULTICOLINEALIDAD a través de tablas de correlación simple entre las variables independientes. Seleccionar las variables con menor correlación o transformar en variables ficticias no correlacionadas. • Detección de la HETEROSCEDASTICIDAD /a través de gráficos de residuos є para cada valor de ŷ. Estandarización de la variable dependiente Y. • Detección de la AUTOCORRELACIÓN DE ERRORES / a través de la prueba Durbin-Watson. El valor 2 indica no autocorrelación.Corrección de observaciones o eliminación de casos.
Análisis de regresión logística • Es un caso particular de regresión en el cual la variable dependiente es de naturaleza dicotómicay las independientes son cuantitativas o categóricas y no exige restricciones tan fuertes sobre la distribución de las variables independientes. Estima y explica las probabilidades de que un evento ocurra. • Estas peculiaridades la hacen interesante para situaciones en las que no cabe aplicar la regresión lineal. Algunos ejemplos: • Identificar los principales factores que pueden influir en aumentar la probabilidad de que un nuevo producto sea introducido con éxito en el mercado. ANÁLISIS DE CASOS
Análisis de regresión logística • Permite construir un MODELO EXPLICATIVO a partir de un conjunto de variables independientes de tipo categóricas o continuas (estado civil, ingresos, nivel de estudios, edad y números de hijos) y una variable dicotómica o binaria que solo definen opciones (contratar un servicio o no, consumir determinado producto o no, etc.) Ejemplo: • En qué medida ciertas características socio-demográficas influyen en que un individuo contrate un nuevo servicio de televisión por cable. • ¿En qué medida la aceptación de un producto está relacionado con el nivel de ingresos del cliente?
Análisis de regresión logística REQUISITOS Y ETAPAS • Proceso de codificación de las variables independientes categóricas • Codificación de variable dependientes en 0 y 1 • Significancia de los coeficientes de regresión • Significancia global del modelo • Bondad de ajuste y eficacia predictiva • Estimación de probabilidades parciales y conjuntas • Métodos de selección de las variables independientes (INTRODUCIR Y ELIMINACIÓN POR PASOS)
Modelos de Regresión Logística ANÁLISIS DE UN EJEMPLO • Classification Table for XCDEA • The Cut Value is ,78
Modelos de Regresión Logística ANÁLISIS DE UN EJEMPLO • Beginning Block Number 2. Method: Enter • Variable(s) Entered on Step Number • 1.. H13 * XMEN5
Modelos de Regresión Logística ANÁLISIS DE UN EJEMPLO