1 / 36

Descripción de una variable

Descripción de una variable. Tema 1. Descripción breve del tema. Definiciones fundamentales Tabla de frecuencias Datos agrupados Medidas de posición Medidas de tendencia central: media, mediana, moda Cuantiles Medidas de dispersión Varianza, desviación típica, rango

devi
Télécharger la présentation

Descripción de una variable

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Descripción de una variable Tema 1 Depto. Estadística, Universidad Carlos III

  2. Descripción breve del tema • Definiciones fundamentales • Tabla de frecuencias • Datos agrupados • Medidas de posición • Medidas de tendencia central: media, mediana, moda • Cuantiles • Medidas de dispersión • Varianza, desviación típica, rango • Representaciones gráficas • Diagrama de barras, histograma, diagrama de cajas… • Medidas de forma • Asimetría, curtosis Depto. Estadística, Universidad Carlos III

  3. Objetivos • Reconocer el papel de la Estadística en la resolución de problemas. • Conocer los términos básicos que se utilizan en Estadística. • Interpretar las representaciones gráficas asociadas a un conjunto de datos. • Conocer los estadísticos básicos que se utilizan para describir una muestra. Depto. Estadística, Universidad Carlos III

  4. Descripción breve del tema • Definiciones fundamentales • Tabla de frecuencias • Datos agrupados • Medidas de posición • Medidas de tendencia central: media, mediana, moda • Cuantiles • Medidas de dispersión • Varianza, desviación típica, rango • Representaciones gráficas • Diagrama de barras, histograma, diagrama de cajas… • Medidas de forma • Asimetría, curtosis Depto. Estadística, Universidad Carlos III

  5. Definiciones fundamentales • Población: conjunto de elementos de los que se estudia una característica. Tamaño de la población es su número de elementos (N, puede ser infinito).   N = 50 • Muestra: conjunto (representativo) de elementos de la población. Tamaño de la muestra es su número de elementos (n).  n = 11 • Individuo: cada elemento de la población.  Depto. Estadística, Universidad Carlos III

  6. Definiciones fundamentales • Variable: característica a estudiar en los individuos de la población (X ó Y). • Dato: valor, numérico o no, que toma la variable sobre un individuo concreto de la muestra, (x ó y). Depto. Estadística, Universidad Carlos III

  7. Tipos de variables • Cuantitativa: toma valores numéricos • Discreta: el conjunto de valores que puede tomar es finito o numerable. • Número de hijos. • Continua: puede tomar una cantidad infinita no numerable de valores. • Duración de una batería. • Cualitativa: los valores que toma se corresponden con cualidades no cuantificables Depto. Estadística, Universidad Carlos III

  8. Descripción breve del tema • Definiciones fundamentales • Tabla de frecuencias • Datos agrupados • Medidas de posición • Medidas de tendencia central: media, mediana, moda • Cuantiles • Medidas de dispersión • Varianza, desviación típica, rango • Medidas de forma • Asimetría, curtosis • Representaciones gráficas • Diagrama de barras, histograma, diagrama de cajas… Depto. Estadística, Universidad Carlos III

  9. Tabla de frecuencias Tenemos k valores distintos en la muestra x1,…, xk • Frecuencia absoluta de un valor xi número de veces que aparece xi en la muestra, ni • Frecuencia relativa de un valor xi cociente de frecuencia absoluta entre tamaño, fi= ni /n Si tenemos variables cuantitativas, ordenamos x1<…< xk • Frecuencia absoluta acumulada del valor i-ésimo suma de las frecuencias absolutas hasta la de xi, Ni=n1+…+ni • Frecuencia relativa acumulada del valor i-ésimo frecuencia absoluta acumulada entre tamaño, Fi= Ni /n Depto. Estadística, Universidad Carlos III

  10. Tabla de frecuencias Altura de los alumnos de una clase (en cm). Se ha cogido una muestra de tamaño n = 12, obteniendo los siguientes datos: 174, 180, 187, 174, 179, 172, 180, 180, 176, 180, 160, 160 Depto. Estadística, Universidad Carlos III

  11. Descripción breve del tema • Definiciones fundamentales • Tabla de frecuencias • Datos agrupados • Medidas de posición • Medidas de tendencia central: media, mediana, moda • Cuantiles • Medidas de dispersión • Varianza, desviación típica, rango • Representaciones gráficas • Diagrama de barras, histograma, diagrama de cajas… • Medidas de forma • Asimetría, curtosis Depto. Estadística, Universidad Carlos III

  12. Datos agrupados A veces es necesario agrupar los datos de una variable cuantitativa. • Muestra grande y difícil de manejar • Variable continua y no se repite ningún valor Clase: cada intervalo en que se agrupan los datos, pueden ser del mismo tamaño o no. Marca de clase: punto medio del intervalo. El número de clases suele tomarse entre 5 y 20, generalmente entero más próximo a n1/2 . Depto. Estadística, Universidad Carlos III

  13. Tabla de frecuencias (agrupados) Altura de los alumnos de los N = 48 alumnos de la clase de la tabla anterior. Depto. Estadística, Universidad Carlos III

  14. Descripción breve del tema • Definiciones fundamentales • Tabla de frecuencias • Datos agrupados • Medidas de posición • Medidas de tendencia central: media, mediana, moda • Cuantiles • Medidas de dispersión • Varianza, desviación típica, rango • Representaciones gráficas • Diagrama de barras, histograma, diagrama de cajas… • Medidas de forma • Asimetría, curtosis Depto. Estadística, Universidad Carlos III

  15. Valores típicos o representativos que pretenden resumir los datos en un solo valor. Media: es la media aritmética de los datos (su centro de gravedad). Es sensible a valores extremos y particularmente útil cuando los datos son simétricos respecto a ella. Medidas de tendencia central Depto. Estadística, Universidad Carlos III

  16. Mediana: al menos la mitad de los datos son mayores o iguales que ella y al menos la mitad son menores o iguales. No es sensible a valores extremos (es robusta). Moda: es el valor con mayor frecuencia (no tiene por qué se único) Medidas de tendencia central Depto. Estadística, Universidad Carlos III

  17. Medidas de tendencia central = 175.17 Me = 177.5 Moda = 180 174, 180, 187, 174, 179, 172, 180, 180, 176, 180, 160, 160 Depto. Estadística, Universidad Carlos III

  18. Cuantiles Son medidas de posición no central. • Cuartiles: dividen a la muestra en 4 partes iguales (Q1, Q2, Q3). • Percentiles: dividen a la muestra en 100 partes iguales (P25= Q1). • Deciles: dividen a la muestra en 10 partes iguales. Depto. Estadística, Universidad Carlos III

  19. Cuantiles Dada la muestra de alturas de alumnos • Primer cuartil = 173.5 • Segundo cuartil (mediana) = 177.5 • Tercer cuartil = 180 • Valores extremos: 160 y 187 Depto. Estadística, Universidad Carlos III

  20. Descripción breve del tema • Definiciones fundamentales • Tabla de frecuencias • Datos agrupados • Medidas de posición • Medidas de tendencia central: media, mediana, moda • Cuantiles • Medidas de dispersión • Varianza, desviación típica, rango • Representaciones gráficas • Diagrama de barras, histograma, diagrama de cajas… • Medidas de forma • Asimetría, curtosis Depto. Estadística, Universidad Carlos III

  21. Medidas de dispersión Cuantifican la dispersión de los datos de la muestra. • Varianza: promedio de las desviaciones cuadráticas a la media • Desviación típica: raíz cuadrada de la varianza Depto. Estadística, Universidad Carlos III

  22. Medidas de dispersión • Aplicación de la desviación típica (y media): Al menos el 100(1-1/k2)% de los datos están en el intervalo • Ejemplo: Anotación de Pau Gasol en los 51 partidos que jugó en la temporada 2006/2007. 4; 10; 10; 10; 11; 11; 12; 12; 13; 13; 15; 15; 16; 16; 16; 16; 17; 17; 19; 19; 20; 21; 21; 21; 21; 22; 22; 22; 23; 23; 23; 23; 23; 23; 24; 24; 24; 24; 25; 25; 25; 27; 28; 28; 29; 29; 30; 30; 31; 31; 34. Anotación media = 20.55 ; Desv. Típica anotación = 6.64 Depto. Estadística, Universidad Carlos III

  23. Medidas de dispersión • Rango: Distancia entre observaciones extremas, xk – x1 • Rango intercuartílico: Distancia entre el tercer y el primer cuartil, RI = Q3– Q1 • Coeficiente de variación: CV = s / • MEDA = Mediana|X-Mediana(X)| Depto. Estadística, Universidad Carlos III

  24. Medidas de dispersión Partimos de los datos: 174, 180, 187, 174, 179, 172, 180, 180, 176, 180, 160, 160 • Varianza = 60.14 • Desv. Típica = 7.75 • Rango = 27 • Rango intercuartílico = 6.5 • Coeficiente de variación = 4.43% • MEDA = 3 Depto. Estadística, Universidad Carlos III

  25. Media = 174.65 Mediana = 174 Moda = 180 Primer cuartil = 169.5 Tercer cuartil = 180 Varianza = 58.40 Desv. típica = 7.64 Rango = 27 RI = 10.5 CV = 4.38% Medidas de posición y dispersiónpara los N = 48 individuos obtenemos Depto. Estadística, Universidad Carlos III

  26. Descripción breve del tema • Definiciones fundamentales • Tabla de frecuencias • Datos agrupados • Medidas de posición • Medidas de tendencia central: media, mediana, moda • Cuantiles • Medidas de dispersión • Varianza, desviación típica, rango • Representaciones gráficas • Diagrama de barras, histograma, diagrama de cajas… • Medidas de forma • Asimetría, curtosis Depto. Estadística, Universidad Carlos III

  27. Diagrama de barras Cada barra tiene como longitud la frecuencia de la variable que representa. Se utiliza con variables cualitativas o cuantitativas discretas. Diagrama de barras para el Congreso de los Diputados Depto. Estadística, Universidad Carlos III

  28. Diagrama de sectores Cada sector del círculo tiene un área proporcional al valor que representa. Se utiliza con variables cualitativas o cuant. discretas con pocos valores. Diagrama de sectores para el Congreso de los Diputados Depto. Estadística, Universidad Carlos III

  29. Diagrama de cajasAparecen cuartiles, mediana y valores extremos Depto. Estadística, Universidad Carlos III

  30. Histograma El área de cada rectángulo es proporcional a su frecuencia. Se utiliza para variables cuantitativas (continuas), precisa de su agrupamiento. Histograma y polígono (poligonal) de frecuencias para las clases de la diapositiva 13 Depto. Estadística, Universidad Carlos III

  31. Muestra de n = 12 individuos 16 | 00 17 | 24469 18 | 00007 Población con los N = 48 individuos 16 | 000 16 | 23 16 | 4 16 | 16 | 888899 17 | 000001 17 | 22233 17 | 445 17 | 6 17 | 8999 18 | 0000000 18 | 23 18 | 445555 18 | 77 Diagrama de tallos y hojas Anotación Pau Gasol Temporada 06/07 0 | 4 0 | 1 | 000112233 1 | 5566667799 2 | 011112223333334444 2 | 55578899 3 | 00114 Depto. Estadística, Universidad Carlos III

  32. Descripción breve del tema • Definiciones fundamentales • Tabla de frecuencias • Datos agrupados • Medidas de posición • Medidas de tendencia central: media, mediana, moda • Cuantiles • Medidas de dispersión • Varianza, desviación típica, rango • Representaciones gráficas • Diagrama de barras, histograma, diagrama de cajas… • Medidas de forma • Asimetría, curtosis Depto. Estadística, Universidad Carlos III

  33. Medidas de forma • Coeficiente de Asimetría: sirve para estudiar las desviaciones respecto de la media Depto. Estadística, Universidad Carlos III

  34. Asimetría CA<0 CA>0 CA~0 Depto. Estadística, Universidad Carlos III

  35. Medidas de forma • Coeficiente de Apuntamiento (o curtosis): indica el grado de concentración de los valores que toma la variable en torno a su media Depto. Estadística, Universidad Carlos III

  36. Apuntamiento o curtosis CAp>0 CAp<0 CAp~0 Depto. Estadística, Universidad Carlos III

More Related