130 likes | 575 Vues
Estadística Descriptiva. TEMA 4: OUTLIERS. MÉTODOS SIMPLES DE DETECCIÓN Y ACOMODACIÓN. En Estadística , la información debe ser de mayor precisión y fiabilidad posible . Debe existir una depuración de los datos experimentales . Elementos de un experimento estadístico :
E N D
Estadística Descriptiva TEMA 4: OUTLIERS. MÉTODOS SIMPLES DE DETECCIÓN Y ACOMODACIÓN
En Estadística, la información debe ser de mayor precisión y fiabilidad posible. Debe existir una depuración de los datos experimentales. • Elementos de un experimento estadístico: • Una Población( ), objeto del estudio que se está realizando. • Un Subconjunto(M), de elementos de la población, que serán observados. • Una Variable(X), que actuando sobre los elementos de M, los transforma o valora. • El Experimentador(E), encargado de observar y manipular los datos. 4.1-INTRODUCCIÓN
Errores en las Observaciones Muestrales • Errores o variables que pueden existir en X(M): • a) Variabilidad de la fuente o inherente: comportamiento natural de los datos. • b) Errores del Medio: Cuando no se dispone de la técnica adecuada o cuando no existe un procedimiento para realizar la transformación de una forma exacta. Ej: Redondeo forzoso con variables continuas. • Error del experimentador: • a) Error de la Información: cuando un modelo o estructura matemática no adecuada o precisa a la población, o al considerar información o hipótesis iniciales incorrectas. • b) Error de Planificación: cuando no se delimita correctamente la población , se experimenta con una población distinta • c) Error de realización: por una valoración errónea de los elementos de M( es decir, el paso de la información de un instrumento a otro, Ej: de la libreta al ordenador.). 4.2-ERRORES EN LAS OBSERVACIONES MUESTRALES
4.2-ERRORES EN LAS OBSERVACIONES MUESTRALES • En las observaciones extrañas o anómalas: • a) Observación Atípica: es aquel valor de X(M) que presenta una gran variabilidad de tipo inherente. • b) Observación Errónea: es el valor que presenta un gran error del medio y/o un gran error del experimentador. • Outliers e Inliers • Outlier: Se llamará Outlier a aquella observación que siendo atípica y/o errónea, tiene un comportamiento muy diferente respecto de los datos, frente al análisis que se desea realizar sobre las observaciones experimentales. • Inlier: Se llamará Inlier a aquella observación atípica y/o errónea que no tiene el comportamiento de Outlier. Es decir, se comporta casi igual o igual que los datos de nuestro análisis.
Método basado en la Desviación Típica Desigualdad de CHEBYSHEV: al menos contiene el al menos contiene el De las observaciones 4.3-METODOS SIMPLES DE IDENTIFICACIÓN DE OUTLIERS
Método basado en el Recorrido Intercuartílico IQR = Q3 - Q1 Las vallas interiores de la variable estadística X: f1 = Q1 - 1´5 IQR [f1,f2] f2 = Q3 + 1´5 IQR 25% 25% Q1 Q2=Me Q3 1´5 IQR IQR 1´5 IQR f1 Q1 Q3 f2 4.3-METODOS SIMPLES DE IDENTIFICACIÓN DE OUTLIERS
Las vallas exteriores de la variable estadística X: F1 = Q1 - 3 IQR [F1,F2] F2 = Q3 + 3 IQR 1´5 IQR IQR 1´5 IQR F1 f1 Q1 Q2 f2 F2 INLIER OUTSIDE Far-OUTSIDE 4.3-METODOS SIMPLES DE IDENTIFICACIÓN DE OUTLIERS
Método de Recorte Datos TRIMMING ELIMINA T n se reduce xT, S2T, MeT 4.3-METODOS SIMPLES DE ACOMODACIÓN DE OUTLIERS
Método de Reemplazamiento Número de observaciones: a) NO AGRUPADAS EN INTERVALOS: de las menores / de las mayores b) AGRUPADAS EN INTERVALOS: y ¿Quién es el último de los que quedan? a) La menor y mayor de las observaciones que quedan. b) es el extremo inferior del primer intervalo. Datos WINSORIZING SUSTITUIR W xw, S2w, Mow La observación menor de los que quedan La observación mayor que queda 4.3-METODOS SIMPLES DE ACOMODACIÓN DE OUTLIERS
Diagrama de Caja y Bigotes 1) Min xi y Max xi 2) Q1, Q2 = Me, Q3 3) Valores Adyacentes: 4) OUTSIDES: FAR-OUTSIDES: * Va Va Min xi Max xi Q1 Q3 Q2 4.4-REPRESENTACIONES GRÁFICAS
Diagrama de Vallas 1´5 IQR f1 f2 F1 F2 4.4-REPRESENTACIONES GRÁFICAS
Diagrama de Esquemas RI(xi) = posición que ocupa, cuando los datos están ordenados de menor a mayor. RS(xi) = posición que ocupa, cuando los datos están ordenados de mayor a menor. n Prof(Me) Me Prof(Qi) Qi Q3 IQR Prof(Min) Min xi Max xi Rg 4.4-REPRESENTACIONES GRÁFICAS
FIN José Antonio Cortegana Camúñez 2001-2002