1 / 28

DIRECCIÓN DE ESTADÍSTICAS DE LA PROVINCIA

DIRECCIÓN DE ESTADÍSTICAS DE LA PROVINCIA. INTRODUCCIÓN A LA ESTADÍSTICA DESCRIPTIVA Lazarte Víctor Fabio y Naidicz Paula Lorena. Distribuciones de Frecuencias Conjuntas. Dado una unidad experimental podemos observar o medir más de una variable simultáneamente.

olisa
Télécharger la présentation

DIRECCIÓN DE ESTADÍSTICAS DE LA PROVINCIA

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. DIRECCIÓN DE ESTADÍSTICAS DE LA PROVINCIA INTRODUCCIÓN A LA ESTADÍSTICA DESCRIPTIVA Lazarte Víctor Fabio y Naidicz Paula Lorena

  2. Distribuciones de Frecuencias Conjuntas Dado una unidad experimental podemos observar o medir más de una variable simultáneamente. Por ejemplo: X = “peso de una persona” Y = “altura de la misma persona” Distribuciones bivariadas y su representación gráfica 1er caso: X e Y ambas variables cualitativas. En este caso la distribución conjunta se llama “tabla de contingencia”

  3. Ejemplo 1: Se desea estudiar si existe o no relación entre los hábitos de fumar de una persona y el hecho de padecer problemas de hipertensión. Es decir que se sospecha que el fumar aumenta el riesgo de tener problemas de hipertensión. Se definen las siguientes variables. X = “Condición de Fumador”. Categorías = {No fuma, Fuma Moderadamente, Fuma en Exceso} Y = “Condición de hipertenso”. Categorías = {Si tiene hipertensión, No tiene hipertensión}

  4. En el análisis bivariado los datos están de a pares, es decir, tendrían la siguiente forma. Tabla 7: Datos de condición de fumador y condición de hipertenso.

  5. Tabla 8: Distribución de frecuencias conjunta de condición de fumador vs. condición de hipertenso. Distribuciones marginales: Son los totales por filas y columnas, estos corresponden a las distribuciones de las variables X e Y respectivamente.

  6. Estudio de porcentajes: Se pueden calcular porcentajes sobre total de filas o total de columnas. Sirve para estudiar la influencia de una variable sobre la otra. Tabla 9: Distribución conjunta de porcentajes sobre total de filas

  7. Representación Gráfica: Diagramas de barras o Diagrama Circular Figura 6: Distribución de personas con y sin hipertensión según su condición de fumador.

  8. Figura 7: Distribución de personas con y sin hipertensión según su condición de fumador

  9. Ejemplo 2: Se quiere realizar un estudio para analizar qué medicamentos toma la gente para 4 dolencias determinadas. Los datos recolectados son los siguientesTabla 10: Distribución conjunta de Padecimiento y medicamentos

  10. Porcentajes: Para hacer el estudio de porcentajes nos hacemos la pregunta de que variable influye sobre cual Tabla 11: Distribución porcentual sobre el total de filas

  11. Ejercicio Se desea investigar si el al Partido Demócrata es más fuerte en la Ciudad A que en la B, los datos que se obtienen son los siguientes:

  12. Preguntas • A) Determine las distribuciones marginales. • B) Calcule los porcentajes en el sentido que crea conveniente • C) Diría usted que el apoyo al partido demócrata es diferente en la ciudad A que la B?

  13. Distribuciones Marginales

  14. Análisis de Porcentajes:Los porcentajes deben estar basados en los totales de las ciudades. Sí puede decirse que el partido Demócrata es más fuerte en la ciudad A que en la B, ya que los porcentajes de simpatizantes es 13% mayor en la ciudad A.

  15. 2do caso:X Cualitativa e Y Cuantitativa. Ejemplo: Se desea estudiar si las personas de sexo masculino tienen mayores niveles de colesterol en la sangre que las de sexo femenino. Se definen las siguientes variables X = “Sexo de una persona” Categorías = {Masculino, Femenino} Y = “Nivel de colesterol de la persona” A la variable cualitativa se le llama variable agrupadora.

  16. Representación Gráfica: Una forma adecuada de representación gráfica para comparar entre grupos son los diagramas de tipo caja. Figura 8: Niveles de colesterol por sexo. El grupo 1 es de los varones y el grupo 2 de las mujeres.

  17. Un caso similar es el de una variable cuantitativa continua y una cualitativa discreta, en este caso a la variable discreta se la puede tomar como una variable agrupadora. Ejemplo 2: Veamos el ingreso total familiar en Tucumán en el 3er. Trimestre de 2005 según la cantidad de miembros de una familia.

  18. Análisis descriptivo

  19. Representación gráfica mediante diagramas de tipo caja Figura 9: ingreso total familiar en Tucumán en el 3er. Trimestre de 2005 según la cantidad de miembros de una familia

  20. 3er caso:X e Y Cuantitativas Ejemplo 1: Se desea estudiar si la tensión arterial sistólica cambia con la edad, se considera una muestra de 46 varones de edades entre 16 y 64 años y se mide su tensión arterial sistólica. Se definen las siguientes variables: X = “Edad” Y = “Tensión arterial sistólica” En este caso de tener dos variables cuantitativas el gráfico adecuado se llama Diagrama de Dispersión en el mismo se muestran los pares de datos para cada persona

  21. Figura 9: Tensión arterial sistólica por edad de 46 personas de sexo masculino Se observa que la tensión arterial sistólica aumenta en promedio con la edad. Para estudiar con mayor precisión esta relación se puede ajustar una relación lineal, es decir una recta.

  22. Ejemplo 2: Se desea estudiar el consumo diario de energía en una casa en función de la temperatura.

  23. Gráfico de dispersión:Temperatura- Consumo

  24. Observaciones • En ambos ejemplos es razonable pensar que la relación que existe entre las variables es lineal. • En esta situación utilizamos una herramienta que se denomina REGRESIÓN LINEAL SIMPLE

  25. Regresión Lineal Simple • Cuando los datos mediante un gráfico de dispersión sugieren que se puede ajustar una recta: • La recta tendría la forma y =  + βx • Luego el modelo teórico que se utiliza es el siguiente: yi=  + βxi +ei • Se ajusta utilizando métodos de Mínimos Cuadrados y se implementa con Excel o con alguna calculadora científica

  26. Recta Ajustada con Excel

  27. La recta ajustada con Excel es: y = -2,34x + 138,7 R2 = 0,9126 • El coeficiente -2.34 se interpreta diciendo: Es cuanto cambia Y en promedio, cuando X cambia en una unidad.Quiere decir que Y disminuye 2.34 en promedio, cuando X aumenta una unidad. • El valor de  no siempre tiene sentido. • Este modelo me sirve para “Predecir y dado un valor de x” pero vale solo dentro del rango de las observaciones. • El valor del R2 me indica el porcentaje de cuanto explica X a la variable Y.

More Related