510 likes | 690 Vues
UNIVERSIDAD NACIONAL EXPERIMENTAL DEL LOS LLANOS OCCIDENTALES “EZEQUIEL ZAMORA” UNELLEZ – NÚCLEO TINAQUILLO. ANÁLISIS DE DATOS ESTADÍSTICOS DE LA ACTIVIDAD FÍSICA Coordinador de unidad de apoyo de estadística: MSc Alexis Durán power021@gmail.com.
E N D
UNIVERSIDAD NACIONAL EXPERIMENTALDEL LOS LLANOS OCCIDENTALES“EZEQUIEL ZAMORA”UNELLEZ – NÚCLEO TINAQUILLO ANÁLISIS DE DATOS ESTADÍSTICOS DE LA ACTIVIDAD FÍSICA Coordinador de unidad de apoyo de estadística: MSc Alexis Durán power021@gmail.com
Desarrollado en 1.993 por Ross Ihaka y Robert Glenteman (University of Auckland, Nueva Zelanda). A partir de 1.995 comenzó a distribuirse gratuitamente (GNU, Free Software Foundation). R
Es un conjunto integrado de programas. Efectiva manipulación y almacenamiento de datos. Una amplia, coherente e integrada colección de herramientas para el análisis de datos. Posibilidades gráficas para el análisis de datos. CARACTERÍSTICAS:
R – Commander (Rcmdr) Es una interfaz gráfica del programa R. Existe una dirección que descarga el R y el R-Commader juntos para windows es la siguiente: http://knuth.uca.es/R/R-UCA Se ejecuta normal como cualquier programa. Para abrir el programa se le da doble clic a la R azul.
Nota • Algunas veces cuando el R-Commander se abre, el programa puede preguntar que si se quieren instalar otros paquetes, si disponen de tiempo e internet coloquen si, de lo contrario coloquen no.
Ventana de Instrucciones Ventana de Resultados
Colocar el nombre de la matriz ó conjunto de datos y luego aceptan
Aparece algo como esto: Selecciona la hoja donde estén los datos dentro del archivo y le das ok
ANÁLISIS INFERENCIAL • Es el estudio que parte de una muestra pequeña y representativa de miembros de gran una colectivo, donde se extraen conclusiones que afectan a todos los elementos del mismo.
PRUEBAS DE HIPÓTESIS Objetivo: Tratar de determinar cuándo es razonable concluir, que la población entera posee determinada propiedad y cuando esto no es razonable, a partir del análisis de una muestra.
Una hipótesis se define como una afirmación ó suposición que está sujeta a verificación o comprobación La prueba de hipótesis es el procedimiento estadístico que parte de una suposición del comportamiento de la población (hipótesis) y en función del análisis de la(s) muestra(s) se comprobará su veracidad
TIPOS DE HIPOTESIS El procedimiento de toma de decisiones en la prueba de hipótesis, se basa en la elección de una opción entre dos conjuntos posibles de valores del parámetro, es decir, en dos hipótesis estadísticas, que son: Hipótesis nula H0 Hipótesis alternativa H1
HIPOTESIS NULA y ALTERNATIVA • Hipótesis nula corresponde a la ausencia de una modificación en la variable investigada, y por lo tanto se especifica de una forma exacta: • H0 : = 0 • Hipótesis alternativa se especifica de manera más general : • H1: 0 • H1: > 0 • H1: < 0.
MEDICIÓN DE LOS ERRORES es la Probabilidad de cometer un Error tipo I. Se llama Nivel de significación (1-10 %) es la probabilidad de cometer un Error tipo II (5-20 %) Es deseable que estas dos probabilidades de error sean pequeñas.
P - VALOR • Es la Probabilidad de obtener una discrepancia mayor o igual que la observada en la muestra n cuando Ho es cierta. • Es la probabilidad de observar un valor de prueba más extremo que el valor observado, dado que la hipótesis nula es verdadera. • Si el valor p es más chico que el nivel de significación la hipótesis nula es rechazada. Por el contrario, si es más grande que el nivel de significación la hipótesis nula no es rechazada.
PRUEBAS PARA PROMEDIOS • En primer lugar se debe hacer una análisis de normalidad a las variables para poder seleccionar el test adecuado. • Siempre se quiere realizar test paramétricos por ser más objetivos que los no paramétricos.
Análisis de la Normalidad de los datos ANÁLISIS GRÁFICO • Se debe escribir lo siguiente en el programa en la ventana de instrucciones: attach(Nombre del conjunto de datos) qqnorm(variable,xlab="Cuantiles Teóricos“, ylab="Cuantiles de la Muestra" ,main="Gráfico Q-Q de Probabilidad Normal")qqline(variable) se sombrea y luego se da ejecutar y se obtiene:
La recta indica la distribución teórica de una normal • Las interpretaciones se hacen en función de los puntos con su cercanía en la línea recta. • Entre los puntos estén mas cerca a la recta, mejor será su aproximación a una distribución normal.
Pruebas de Normalidad • Establece: Ho: existe normalidad en los datos H1: no existe normalidad en los datos • Test de normalidad de ShapiroWilk: se utiliza cuando la muestra es menor o igual a 50. En el programa:
Para muestras mayores a 50, se utiliza el test de komogorov – Smirnov, en el programa se escribe en la ventana de instrucciones lo siguiente: attach(Nombre del conjunto de datos) ks.test(variable,pnorm, mean(variable), sd(variable))
Medias para una población Para poblaciones normales Hipótesis
Se selecciona la opción De la hipótesis alternativa plateada Se selecciona la variable Se coloca el valor del promedio establecido en la Hipótesis nula
Para poblaciones no normales:Test de Wilcoxon Hipótesis • Se coloca en la ventana de instrucciones: attach(nombre del conjunto de datos) wilcox.test(variable, mu=valor, alternative = c("ver H1") )
Luego se sombrea y se ejecuta NOTA: En caso de muestras grandes (Mayores de 30), de debe añadir correct=FALSE y quedaría: attach(nombre del conjunto de datos) wilcox.test(variable, mu=valor, alternative = c("ver H1"), correct=F)
Prueba de hipótesis entre dos poblaciones • Muestras independientes y normales HIPÓTESIS:
Antes de realizar esta prueba se debe realizar una prueba para comparar las varianzas poblacionales que se necesitará más adelante PRUEBA F DE FISHER Hipótesis:
La matriz que se debe introducir en R: En el programa:
Se selecciona el grupo (debe ser cualitativo) Se selecciona la Variable
Prueba de T-Student (poblaciones) Hipótesis:
Se marca Sí, para el caso que se acepte H0 en la prueba F de Fisher, caso contrario si marca No Se selecciona el grupo (debe ser cualitativo) Se selecciona la Variable Se selecciona la opción planteada en la hipótesis alternativa Se observa la Diferencia
Muestras dependientes y normales Hipótesis: Nota: recordar que se debe calcular la diferencia entre las condiciones iniciales y finales para hacer el análisis de la normalidad
La matriz que se debe introducir en R: En el programa:
Se le da doble clic primero a la variable inicial, se coloca el signo – y luego se le da doble clic a la variable final Se coloca un nombre distinto para identificarla
La matriz que se debe introducir en R: En el programa:
Se selecciona la opción planteada en la hipótesis alternativa Se selecciona la condición final Se selecciona la condición inicial
Muestras independientes y al menos una no normal Prueba de Suma de Rangos de Wilcoxon Hipótesis:
Se observa la diferencia Para muestras menores a 30, se marca la opción Por defecto, para muestras mayores a 30 se marca Aproximación normal Se Selecciona el grupo Se Selecciona la variable Se selecciona la opción de la hipótesis alternativa planteada
Muestras dependientes y al menos una no normal Prueba de Rangos con signos de Wilcoxon: Hipótesis: