100 likes | 188 Vues
Estadística 101. Notas del Curso. 1. Introducción. Datos – Información recolectada para ganar conocimiento sobre un tema o para contestar una pregunta de interés Fuentes de información incluyen : Encuestas ( correo , teléfono , internet) Experimentos
E N D
Estadística 101 Notas del Curso
1. Introducción • Datos – Informaciónrecolectadaparaganarconocimientosobre un tema o paracontestarunapregunta de interés • Fuentes de informaciónincluyen: • Encuestas (correo, teléfono, internet) • Experimentos • Estadística – Conjunto de métodospararecolectar/analizardatos (el arte y la ciencia de aprendizajebasado en datos)
Estadísticaproveemétodospara: • Diseño – Planear/implementar un estudio • Encuesta o experimento? • Cómoescoger a las personas (sujetos) para el estudio, y cuántos? • Descripción – Métodosgráficos y numéricospararesumir los datos • Inferencia – Métodosparahacerprediccionessobre la población (conjunto total de sujetos de interés), basada en unamuestra (subconjunto del quecual se recolectainformaciónpara el estudio)
Ejemplos • Cómopodemosestudiarsiunanuevaterapiaesmejorque la terapiaestándarparatratardepresión? • Cómoestáasociada la tasa del crime porcondado con factores tales como el % de residentes con al menosestudios de preparatoria, % desempleo, % en ambienteurbano, …? • Estácorrelacionado el promedio (GPA) en la universidad con el coeficienteintelectual (IQ), tiempopromedio de estudioporsemana, promedio en la preparatoria, calificación en el examen SAT, número de horasdestinadas a actividadessociales, …?
Parámetro – Resumennumérico de la población • Media poblacional • Proporciónpoblacional • Estadística – Resumennumérico de la muestra Utilizamos la estadística de la muestraparahacerinferenciassobre el parámetropoblacional
Ejemplos: parámetros / estadísticas Parámetro % de todos los adultosqueaprueban el desempeño de Barack Obama comopresidente Tiempopromedio de reacción de la luzroja en un experimentousando (no usando) el celularmientrasmanejan Estadística % de 1000 adultosAmericanos en unaencuestaqueaprueban el desempeño de Obamacomopresidente Tiempopromedio de reacción a la luzroja de 100 estudiantes en un experimentocuandousan (no usan) el celularmientrasmanejan
Notas • Poblacionespueden ser conjuntos de personas reales o conceptuales (hipotéticos) • Para tenerbuenasinferencias, se necesitanmuestrasrepresentativas de la población • Software estadístico (como SPSS) se utilizaparaanalizardatos
Software utilizaarchivos de datos • Cualquierrenglóncontieneobservacionespara un determinadosujeto (persona) en la muestra • Cualquiercolumnacontieneobservacionesparaunadeterminadacaracterística (“variable”) medida. Los nombres de lascaracterísticasestán en la primerafila
Ejemplos: www.stat.ufl.edu/~aa/social/data.html El primer archivo de datos, de unaencuesta a 60 estudiantes de la Universidad de Florida, iniciaasí: subject gen age high colltvveg party ideology abor 1 m 32 2.2 3.5 3 n r 6 n 2 f 23 2.1 3.5 15 y d 2 y 3 f 27 3.3 3.0 0 y d 2 y 4 f 35 3.5 3.2 5 n i 4 y 5 M 23 3.1 3.5 6 n i 1 y