DIRECCIÓN DE ESTADÍSTICAS DE LA PROVINCIA

DIRECCIÓN DE ESTADÍSTICAS DE LA PROVINCIA INTRODUCCIÓN A LA ESTADÍSTICA DESCRIPTIVA Lazarte Víctor Fabio y Naidicz Paula Lorena

Distribuciones de Frecuencias Conjuntas Dado una unidad experimental podemos observar o medir más de una variable simultáneamente. Por ejemplo: X = “peso de una persona” Y = “altura de la misma persona” Distribuciones bivariadas y su representación gráfica 1er caso: X e Y ambas variables cualitativas. En este caso la distribución conjunta se llama “tabla de contingencia”

Ejemplo 1: Se desea estudiar si existe o no relación entre los hábitos de fumar de una persona y el hecho de padecer problemas de hipertensión. Es decir que se sospecha que el fumar aumenta el riesgo de tener problemas de hipertensión. Se definen las siguientes variables. X = “Condición de Fumador”. Categorías = {No fuma, Fuma Moderadamente, Fuma en Exceso} Y = “Condición de hipertenso”. Categorías = {Si tiene hipertensión, No tiene hipertensión}

En el análisis bivariado los datos están de a pares, es decir, tendrían la siguiente forma. Tabla 7: Datos de condición de fumador y condición de hipertenso.

Tabla 8: Distribución de frecuencias conjunta de condición de fumador vs. condición de hipertenso. Distribuciones marginales: Son los totales por filas y columnas, estos corresponden a las distribuciones de las variables X e Y respectivamente.

Estudio de porcentajes: Se pueden calcular porcentajes sobre total de filas o total de columnas. Sirve para estudiar la influencia de una variable sobre la otra. Tabla 9: Distribución conjunta de porcentajes sobre total de filas

Representación Gráfica: Diagramas de barras o Diagrama Circular Figura 6: Distribución de personas con y sin hipertensión según su condición de fumador.

Figura 7: Distribución de personas con y sin hipertensión según su condición de fumador

Ejemplo 2: Se quiere realizar un estudio para analizar qué medicamentos toma la gente para 4 dolencias determinadas. Los datos recolectados son los siguientesTabla 10: Distribución conjunta de Padecimiento y medicamentos

Porcentajes: Para hacer el estudio de porcentajes nos hacemos la pregunta de que variable influye sobre cual Tabla 11: Distribución porcentual sobre el total de filas

Ejercicio Se desea investigar si el al Partido Demócrata es más fuerte en la Ciudad A que en la B, los datos que se obtienen son los siguientes:

Preguntas • A) Determine las distribuciones marginales. • B) Calcule los porcentajes en el sentido que crea conveniente • C) Diría usted que el apoyo al partido demócrata es diferente en la ciudad A que la B?

Distribuciones Marginales

Análisis de Porcentajes:Los porcentajes deben estar basados en los totales de las ciudades. Sí puede decirse que el partido Demócrata es más fuerte en la ciudad A que en la B, ya que los porcentajes de simpatizantes es 13% mayor en la ciudad A.

2do caso:X Cualitativa e Y Cuantitativa. Ejemplo: Se desea estudiar si las personas de sexo masculino tienen mayores niveles de colesterol en la sangre que las de sexo femenino. Se definen las siguientes variables X = “Sexo de una persona” Categorías = {Masculino, Femenino} Y = “Nivel de colesterol de la persona” A la variable cualitativa se le llama variable agrupadora.

Representación Gráfica: Una forma adecuada de representación gráfica para comparar entre grupos son los diagramas de tipo caja. Figura 8: Niveles de colesterol por sexo. El grupo 1 es de los varones y el grupo 2 de las mujeres.

Un caso similar es el de una variable cuantitativa continua y una cualitativa discreta, en este caso a la variable discreta se la puede tomar como una variable agrupadora. Ejemplo 2: Veamos el ingreso total familiar en Tucumán en el 3er. Trimestre de 2005 según la cantidad de miembros de una familia.

Análisis descriptivo

Representación gráfica mediante diagramas de tipo caja Figura 9: ingreso total familiar en Tucumán en el 3er. Trimestre de 2005 según la cantidad de miembros de una familia

3er caso:X e Y Cuantitativas Ejemplo 1: Se desea estudiar si la tensión arterial sistólica cambia con la edad, se considera una muestra de 46 varones de edades entre 16 y 64 años y se mide su tensión arterial sistólica. Se definen las siguientes variables: X = “Edad” Y = “Tensión arterial sistólica” En este caso de tener dos variables cuantitativas el gráfico adecuado se llama Diagrama de Dispersión en el mismo se muestran los pares de datos para cada persona

Figura 9: Tensión arterial sistólica por edad de 46 personas de sexo masculino Se observa que la tensión arterial sistólica aumenta en promedio con la edad. Para estudiar con mayor precisión esta relación se puede ajustar una relación lineal, es decir una recta.

Ejemplo 2: Se desea estudiar el consumo diario de energía en una casa en función de la temperatura.

Gráfico de dispersión:Temperatura- Consumo

Observaciones • En ambos ejemplos es razonable pensar que la relación que existe entre las variables es lineal. • En esta situación utilizamos una herramienta que se denomina REGRESIÓN LINEAL SIMPLE

Regresión Lineal Simple • Cuando los datos mediante un gráfico de dispersión sugieren que se puede ajustar una recta: • La recta tendría la forma y =  + βx • Luego el modelo teórico que se utiliza es el siguiente: yi=  + βxi +ei • Se ajusta utilizando métodos de Mínimos Cuadrados y se implementa con Excel o con alguna calculadora científica

Recta Ajustada con Excel

La recta ajustada con Excel es: y = -2,34x + 138,7 R2 = 0,9126 • El coeficiente -2.34 se interpreta diciendo: Es cuanto cambia Y en promedio, cuando X cambia en una unidad.Quiere decir que Y disminuye 2.34 en promedio, cuando X aumenta una unidad. • El valor de  no siempre tiene sentido. • Este modelo me sirve para “Predecir y dado un valor de x” pero vale solo dentro del rango de las observaciones. • El valor del R2 me indica el porcentaje de cuanto explica X a la variable Y.

DIRECCIÓN DE ESTADÍSTICAS DE LA PROVINCIA

DIRECCIÓN DE ESTADÍSTICAS DE LA PROVINCIA

Presentation Transcript

Curso Corto HINARI

INDICE

Ordine dei Medici della Provincia di Milano

TRATAMIENTO DE AGUAS RESIDUALES

CALDERAS: CARACTERÍSTICAS Y DATOS TÉCNICOS

Linguagem Python

Principales resultados

“La perfección de los medios y La confusión de los fines, son las características

Vista 10 P

Características de la vida

LA CONTABILIDAD PÚBLICA Y SU RELACIÓN CON LAS

Estadísticas de los Servicios: líneas de actuación Fernando Cortina García fcortina@ine.es

Lenguaje

VISIÓN GENERAL DE LAS REDES DOMÉSTICAS MULTIMEDIOS

Características do Sistema:

VERTEBRADOS

Principales resultados

LAS ENSEÑANZAS ARTÍSTICAS EN CANARIAS

Características del recién nacido

CARACTERÍSTICAS DE LOS SERES VIVOS

ORDINE DEGLI INGEGNERI DELLA PROVINCIA DI CATANIA

REINO PROTISTA características gerais REINO PROTISTA