1.12k likes | 1.61k Vues
Métodos y procesos para el desarrollo y construcción de exámenes. Taller para la Universidad del Valle de Guatemala Antonio Magriñá Director Ejecutivo División de Medición e Investigación 12 de junio de 2007. Quienes somos.
E N D
Métodos y procesos para el desarrollo y construcción de exámenes Taller para la Universidad del Valle de Guatemala Antonio Magriñá Director Ejecutivo División de Medición e Investigación 12 de junio de 2007
Quienes somos • Somos una asociación educativa sin fines de lucro que aboga por la excelencia educativa para todos los estudiantes a través de la colaboración continua de sus miembros que incluyen las escuelas secundarias, instituciones universitarias, sistemas de educación y organizaciones educativas.
Quienes somos Miembros • La participación activa de los miembros en los procedimientos es lo que garantiza la adecuada respuesta a sus necesidades y constituye una de las características excepcionales de los programas. • Participan: • En la Junta de Síndicos: 28 miembros electos por los representantes de las instituciones que componen y rigen la asociación. Los síndicos designan el presidente del College Board. • En las Juntas asesoras o consultivas: funcionarios directivos, profesores, profesionales de orientación y de ayuda económica procedentes de las instituciones miembros trabajan en cada programa de importancia. • En las asambleas anuales y regionales en Juntas, congresos técnicos, conferencias, comités y grupos de trabajo: Los representantes de las instituciones miembros hacen aportaciones, evaluaciones, revisiones, y comparten sus experiencias y conocimientos con colegas y expertos en las materias.
Dirección electrónica: oprla@collegeboard.com
Objetivos del primer dia Analizar algunos conceptos fundamentales de la evaluación del aprendizaje con exámenes - Construcciones lógicas y tipos de examen • Ventajas y limitaciones de un examen estandarizado • exámenes estandarizados y exámenes con referencia a criterio (criterion referenced) • Presentar un modelo de desarrollo sistemático de un examen
Objetivos • Usos de exámenes en la evaluación de la Aptitud y el aprovechamiento • Modelo de desarrollo de un examen • Desarrollo de especificaciones y alineamiento con los objetivos de enseñanza-aprendizaje • Redacción de ítems • Teoría general de medición • Uso de índices psicométricos y estadísticos • Análisis estadísticos de ítems • Construcción del examen: formas experimentales y formas operacionales • Desarrollo de Escalas: • Diseños y metodos de calibracion, igualacion y equiparacion • Interpretación de los resultados • Estudios de validez y otras investigaciones
CONSTRUCCIONES LOGICAS • APTITUD: • DEFINICIONES DEL DICCIONARIO DE LA LENGUA ESPAÑOLA DE LA REAL ACADEMIA (Ed.Espasa Calpe, 2001): “Capacidad para operar competentemente en una determinada actividad.” “ Capacidad o disposición para el buen desempeño o ejercicio de un negocio, de una industria, de un arte, etc.”
CONSTRUCCIONES LOGICAS: • Pruebas de: • APTITUD: Teoría cognoscitiva – procesos • Lo que la persona hace con lo que sabe, como aplica sus conocimientos • APTITUD: Capacidad para desempeñarse competentemente en actividad: • CIENTÍFICA • MUSICAL • MECÁNICA • Etc. • APTITUD ACADÉMICA • Razonamiento Verbal • Razonamiento Matemático
CONSTRUCCIONES LÓGICASPruebas de Aptitud vs Conocimiento • Conocimiento: • Teoría = Currículo • Conocimiento NO es MEMORIA unicamente • Taxonomía cognitiva de Bloom: • MEMORIA: aprendizaje y recuerdo de términos y conceptos • COMPRENSIÓN: comparar, extrapolar, organizar ideas • APLICACIÓN: uso del conocimiento • ANÁLISIS: extraer y organizar información para hacer inferencias y apoyar generalizaciones • SÍNTESIS: derivar relaciones abstractas, proponer planes y operaciones eficientes • EVALUACIÓN: opiniones y juicios informados; juicios sobre validez en función a criterios internos y externos
Cuestionamientos frecuentes al examen estandarizado • Influencia excesiva en la toma de decisiones administrativas y educativas • No evalúan niveles superiores de conocimiento y destrezas de pensamiento • No evalúan adecuadamente la capacidad de integrar, sintetizar, encontrar soluciones innovadoras, crear, imaginar • Se le da mucha importancia en perjuicio de otras formas de evaluar mas ligadas al proceso de enseñanza-aprendizaje • Disonancia entre los objetivos propuestos y la realidad de los estudiantes • Disonancia entre los objetivos propuestos y la realidad de la docencia • La inclinación a “enseñar para el examen” puede restarle amplitud, espontaneidad y creatividad al proceso de enseñanza-aprendizaje
Modelo del proceso de desarrollo de un examen Justificación o necesidad para el examen Por qué el examen Para qué el examen Para quién el examen Etapa de planificación Recursos humanos Recursos económicos Calendario Infraestructura Consideraciones políticas, técnicas y prácticas Etapa de diseño Fundamento teórico (validez de construcción) Criterios y estándares curriculares Tipo de examen/ítems Especificaciones Revisión Etapa experimental - prepruebas Evaluación Redacción de items Análisis Psicométricos Revisión/evaluación Etapa operacional Administración Análisis psicométricos (controles de calidad) Desarrollo de escalas o métricas y calificación Informes e implantación Validación y Seguimiento Formas nuevas, equiparación Etapa de investigación Evaluación y revisión
Justificación o necesidad para el examen • Propósito educativo: ¿Por qué se quiere un examen?, ¿Cuál es el propósito?, ¿Cuál es la necesidad o problema que espera resolver? • Uso: ¿Para qué se usará el examen? • Diagnóstico individual • Diagnóstico sistémico • Promoción de un nivel educativo a otro • Ingreso a universidad • Graduación (salida) • Certificación de competencias profesionales • Población: ¿Para quién será el examen? • Población a la que va dirigido • Nivel que se interesa evaluar • Toda la población del nivel seleccionado o una muestra
Etapa de planificación • Recursos humanos disponibles • ¿Quiénes desarrollarán el examen?: centro profesional de evaluación de la institución; grupo adhoc de docentes con asesoría especializada; organismo externo; combinación de los componentes anteriores • Asignación y distribución de los recursos humanos • Recursos económicos • Cuánto dinero habrá disponible para el desarrollo, operación y mantenimiento del examen • Quién pagará el examen: universidad, estudiantes, otros recursos • Infraestructura • Equipo • Espacio • Calendario: • Para cuándo se quiere el examen
Consideraciones políticas, técnicas y prácticas • Políticas: Impacto y aceptación de los distintos sectores universitarios: recintos, administración, facultad, estudiantes; probabilidad de continuidad más allá de cambios administrativos • Técnicas: Tipo de examen que se requiere para el uso; contenido; tipos de ítems; análisis estadísticos requeridos; nivel de dificultad; tiempo; comparabilidad • Prácticas: Tiempo para el desarrollo e implantación; recursos económicos y humanos; infraestructura para el desarrollo, aplicación y calificación
Etapa de diseño • Fundamento teórico: Teorías, modelos y marco conceptual para fundamentar el examen; tipos de examen; formatos de ítems • Criterios y estándares curriculares: en los que se sustentará el examen • Determinación del tipo de examen e ítems • Determinación de las especificaciones: contenidos, cantidad de ítems total y para cada área, dificultad, niveles de abstracción de los ítems, destrezas evaluadas, especificaciones estadísticas
Proceso de desarrollo • Selección y adiestramiento de los redactores • Redacción de ítems • Revisión y edición de ïtems: diversas revisiones internas y externas, revisión de contenido, de lenguaje, de estereotipos, de formato • Construcción de prepruebas • Administración de prepruebas: Selección de muestra representativa, adiestramiento, diseño de materiales administrativos • Análisis estadísticos y psicométricos de los ítems: dificultad, discriminación, confiabilidad, ajuste, etc. • Evaluación y revisión de los ítems • Selección de losítems que conformarán la versión operacional
Aspectos de control de calidad a considerar: • I- Selección de los comités de examinadores, redactores y otro personal experto • II- Desarrollo de las pruebas • III- Materiales de apoyo y procesos de aplicación de las pruebas • IV- Controles de calidad estadísticos y psicométricos • V- Controles de calidad de calificación e informes de resultados
I-Selección de los comités de examinadores, redactores y otro personal • Trabajo en equipo de • especialistas en contenido específico, redactores y editores especializados • expertos en desarrollo de pruebas, psicómetras, expertos en medición, estadísticas y evaluación. • Personal o servicios de apoyo: sistemas de información, personal clerical y secretarial, artistas gráficos, personal de imprenta y otros
I-Selección de los comités de examinadores, redactores y otro personal • Comités de examinadores: • Expertos o conocedores de la materia • En el caso del comité de la Prueba de Aptitud Académica se seleccionan especialistas en diversidad de áreas: • Linguística o literatura • Filosofía • Matemáticas y Ciencias • Ingeniería • Psicología y psicometría • Educación • Representatividad: • Balancear proporcionalmente: • Género y edad • Área académica • Geográfica e Institucional • Rotación de miembros del comité
FUNCIONES Y DEBERES DEL COMITÉ DE EXAMINADORES DE LA PRUEBA DE APTITUD ACADÉMICA (PAA) • Analizar los ofrecimientos académicos para los estudiantes a quienes se dirige la prueba. • Para la PAA, estudiantes de primer ingreso a nivel postsecundario y los ofrecimientos a nivel secundario, a la luz de la política de admisión de las instituciones postsecundarias latinoamericanas. • Participar en el análisis de los desarrollos del programa de pruebas de admisión postsecundaria, así como del uso y los efectos de éstos en el proceso de admisión. • Evaluar el uso de resultados de la prueba. • Revisar las Especificaciones del contenido y nuevos enfoques de la Prueba. {1 de 2}
FUNCIONES Y DEBERES DEL COMITÉ DE EXAMINADORES DE LA PRUEBA DE APTITUD ACADÉMICA (PAA) • Recomendar y ponderar cambios que la Prueba amerite. • Ayudar en la preparación de las guías para los redactores. • Revisar o ayudar en la definición de los procedimientos y la preparación de las guías de los examinadores. • Revisar los ejercicios que preparen los redactores y, de ser necesario, redactar otros para cumplir con las Especificaciones de la Prueba. • Examinar el modelo de la prueba que se administrará a los estudiantes. • Participar en el análisis de documentos y artículos pertinentes. • Revisar el material de divulgación para los estudiantes y la Guía de Estudio para tomar las Pruebas. (2 de 2)
Selección de redactores de reactivos • Como redactores participan expertos de contenido, usualmente facultad universitaria. • Se adiestran por personal especializado en el desarrollo de pruebas en talleres de 1 a 3 días dependiendo de la experiencia previa de los redactores y las necesidades operacionales. • Se aplican criterios de representatividad análogos a los usados para el comite examinador (género, edad, etc.) • La labor del redactor se evalúa mediante: • Evaluación del coordinador del programa de pruebas quien preselecciona el material para someter al comité examinador • La evaluación a que se somete el material nuevo en el comité de examinadores • Evaluación por editores de reactivos y de pruebas quienes han sido previamente redactores con experiencia y producción de calidad. • Evaluación estadística y psicométrica
Desarrollo de las Pruebas • Desarrollo de especificaciones: • CONTENIDO: • CONCEPTUALIZACIÓN, TEORÍA O CURRÍCULO • Consideraciones del comité examinador • AREAS • IMPORTANCIA • PESO • DIFICULTAD • VALIDACIÓN DE ESPECIFICACIONES • Análisis de validez de contenido • PSICOMÉTRICAS • PARALELISMO • DISTRIBUCIÓN DE DIFICULTADES DE LOS EJERCICIOS • DISCRIMINACIÓN • AJUSTE A MODELOS DE MEDICIÓN • UNIDIMENSIONALIDAD • Independencia local • VALIDEZ DE CONSTRUCCIÓN LÓGICA: • CONSIDERACIONES ESTRUCTURALES
Consideraciones cualitativas en el desarrollo y evaluación de los ejercicios: Análisis de sensibilidad: • información o descripciones que puedan afectar a algún grupo (social, religioso o étnico). • material (lecturas, vocabulario, etc.) con estereotipos • efectos de contexto que se pueda prestar a diferentes interpretaciones • El contenido de un ejercicio aparece aislado y no dentro del contexto del material lo cual afecta la interpretación correcta • material que se considere sensitivo, polémico o controvertible debe excluirse de la prueba • Redactores, comités, editores y personal especializado toma en consideración estos aspectos al momento de desarrollar y seleccionar material para preprueba.
Consideraciones cualitativas en el desarrollo y evaluación de los ejercicios: • Perspectiva cognoscitiva/afectiva – Estas dos dimensiones deben considerarse cuando se evalúan textos, en las pruebas, que hagan referencia a sectores específicos de una sociedad o cultura. • Ejemplo: • dimensión cognoscitiva: presentar datos que confirmen que un determinado sector social tiene un mayor índice de criminalidad • dimensión afectiva: información que pueda herir la sensibilidad de un grupo.
Consideraciones cualitativas en el desarrollo y evaluación de los ejercicios: • Investigaciones (Englehard, et.al.,1990) sugieren que es más fácil identificar deficiencias o vicios culturales en los reactivos y más difícil estimar deficiencias técnicas como: • Nivel de dificultad del reactivo • Estimado de discriminación • Dependencia o independencia del reactivo • Contribución del reactivo a la estructura factorial
Algunas consideraciones en la redacción y evaluación de ejercicios: • Se requiere que los ejercicios sean independientes unos de otros • Un ejercicio no debe proveer o sugerir la solución a otro • Los ejercicios que forman parte de un grupo, como los ejercicios de lectura, tabla con datos para interpretación, etc., han de hacer referencia a la información presentada, pero no deben depender uno del otro. • Los ejercicios han de adaptarse a las características de la poblacion a la que van dirigidos: • Vocabulario o léxico • Nivel de dificultad • Niveles de desarrollo humano (edad, etc)
Algunas consideraciones en la redacción y evaluación de ejercicios: • El enunciado ha de presentar solamente un problema central • Si al leer la frase principal del enunciado, ocultando las opciones, se puede entender de qué trata el problema o pregunta, el ejercicio cumple con este requisito. • El problema ha de expresarse con precisión • El ejercicio debe redactarse con sencillez y corrección • No se debe incluir más información de la necesaria para contestar.
Algunas consideraciones en la redacción y evaluación de ejercicios: • Un ejercicio se puede presentar tanto de forma negativa como positiva, es preferible la forma positiva. Los ejercicios con situaciones o problemas presentados en forma negativa tienden a confundir al examinando • Si es necesario emplear una forma negativa, la palabra negativa debe presentarse en mayúsculas, es decir, MENOS, EXCEPTO, NO, etc.
Algunas consideraciones en la redacción y evaluación de ejercicios: • Las opciones han de ser tan breves como sea posible. Cuando las opciones son excesivamente largas, casi siempre incluyen problemas adicionales al expuesto en el enunciado. • Las opciones que son mucho más cortas o más largas que las demás tienden a ser obviamente correctas o incorrectas
Ensamblaje de la prueba: • Selección de ejercicios de acuerdo a especificaciones de contenido y psicométricas • Contenido • ÁREAS • IMPORTANCIA • PESO • Características estadísticas y psicométricas en la selección de los reactivos o ejercicios individuales • Dificultad y su distribución • Observada y calibrada • Discriminación • Ajuste estadístico (INFIT y OUTFIT) • Tiempos asignados a las secciones y por ejercicio • ESTRUCTURA FACTORIAL • PARALELISMO con formas anteriores
Ensamblaje paralelo: • Es necesario que distintas versiones midan la misma construcción lógica • Estructuras factoriales similares • Procedimiento: creación de especificaciones que detallen las construcciones lógicas representadas en la prueba • Identificar los reactivos por construcción lógica ayuda a desarrollar versiones paralelas
Consideraciones adicionales en el desarrollo de las pruebas: • Desarrollo de hojas de claves de respuesta • Descripción de contenido y estadísticas de ejercicios que consituirán la prueba • Edición de claves • Mascarillas de respuesta • controles de calidad mediante calificación manual • Contraste con calificación computadorizada • Consideraciones de estilo y formatos de presentación • Uso de mayúsculas, tipos (fonts), tamaño de letra, etc. • INSTRUCCIONES A LOS ESTUDIANTES EN EL EXAMEN • FORMATOS DE INSTRUCCIONES • DESARROLLO DE EJEMPLOS DE TIPOS DE EJERCICIO EN CADA SECCIÓN • INSTRUCCIONES EN EL MANUAL DEL EXAMINADOR • CONCORDANCIA ENTRE MANUAL, EXÁMEN y HOJA DE RESPUESTA
III-Materiales de apoyo y procesos de aplicación • Desarrollo y controles de calidad de las hojas de respuesta • Diseño concorde a estructura del examen • Campos de identificación • Número único de identificación, códigos de barra, etc. • Coordinación con sistemas de información • INSTRUCCIONES • En el manual del examinador: • Funciones del examinador y examinador auxiliar • Desarrollo de instrucciones específicas ‘verbatim’ • A ser leídas a los estudiantes en la administración del examen • A ser leídas y estudiadas por los examinadores previo a la administración de examen
III-Materiales de apoyo y procesos de aplicación • Desarrollo de Guías para el estudiante con pruebas o ejemplos de ejercicios • Desarrollo o revisión de materiales de inscripción con información de: • Calendario de pruebas • Costos o cuotas • Formularios de inscripción, cuestionarios, etc.
Materiales de apoyo y procesos de aplicación • Lectura y controles de calidad de las hojas de inscripción para tomar la prueba • Preparación y envío de boletos de inscripción • Directores de Centros de Examen: • Organización administrativa mediante reuniones de orientación Reciben adiestramiento que a su vez transmitirán, junto a materiales de apoyo (manuales, instrucciones, etc) a los examinadores y sus auxiliares
Materiales de apoyo y procesos de aplicación • Procesos de control de distribución de exámenes • Diseño de ‘spiralling’ • Representatividad de subformas de preprueba y subformas de calibración • Implicaciones para impresión y distribución de folletos
Materiales de apoyo y procesos de aplicación • Desarrollo y controles de calidad de matriculados o inscritos en el examen • Métodos de corroboración de identidad • Preparación y distribución de boletos de admisión individual al salón de examen • Desarrollo y distribución de listas de inscritos para los centros de examen: • Para el Director de Centro • Para los examinadores (por salón, etc.) • Materiales para el control de distribución y recogido de exámenes • Hojas de cotejo y conteo para el director de centro de examen Hojas de cotejo y conteo para los examinadores Informes de examinadores y hojas de irregularidades • Control extricto de distribución y recopilación de folletos de examen y otros materiales
IV- Controles de calidad estadísticos y psicométricos • Los resultados de análisis estadísticos y psicométricos se utilizan para: • La evaluación de las características y calidad de versiones nuevas de las pruebas y de los nuevos ejercicios de preprueba • El desarrollo del banco de ejercicios y de pruebas nuevas • Operacionalización de los procesos de calificación • Controles de calidad de los procesos de calificación • Calibración, equiparación y desarrollo de escalas • Ensamblar pruebas nuevas • Controles de calidad de los reactivos o ejercicios que consituyen las nuevas versiones de prueba • Calidad de la prueba como unidad total de medición • Desarrollo de versiones paralelas
Psicometría: • AREA ESPECIALIZADA DE INVESTIGACIÓN PARA EL ANÁLISIS DEL DESARROLLO, CONFIABILIDAD Y VALIDACIÓN DE INSTRUMENTOS DE MEDICIÓN
Dos conceptos psicométricos fundamentales: • Dos objetivos principales de los procesos de desarrollo psicométrico de las pruebas son lograr: • Confiabilidad • Validez • Para que un instrumento sea válido tiene que ser confiable • Validez < (confiabilidad) • Ej: confiab.=0.80: validez < 0.64 2
Que es una medida: • una VARIABLE que define cuantitavamente una propiedad o característica • medir es asignar numeros a las cantidades de las propiedades de los objetos • se mide de acuerdo a reglas cuya validez puede ser sometida a prueba empírica
Niveles de medición y estadísticas descriptivas (1 de 3) • Medición: asignación de símbolos a eventos de acuerdo a reglas • Las reglas varían en complejidad • cada nivel de complejidad lleva implícito un nivel de medición distinto • la complejidad difiere con respecto a la CANTIDAD de INFORMACION que representan los números • una escala de medición consiste de: • un conjunto de reglas de acuerdo al nivel de medición • una definición operacional de los atributos o eventos a medirse
Niveles de medición y estadísticas descriptivas (2 de 3) • Nominal- clases discretas de eventos • Ordinal- clases discretas ordenadas por rango; provee el orden de los objetos en la escala (mayor que, menor que) • Intervalo- medición ordinal con distancias iguales entre las clases discretas; provee información de las magnitudes de las diferencias y no solo del orden o rango • Razón- medición de intervalo con un cero no arbitrario; tiene unidades iguales a traves de la variable; NO necesita referencias externas a la medida misma ya que utiliza el cero como referencia
Requisitos basicos para medición: • requiere localizar un objeto en un punto de un continuo abstracto • reducción de la experiencia a una abstracción de una sola dimensión • comparación de más (+) o menos (-) entre A y B (B=personas; A=ítemes) • interacción de personas e ítemes para producir información útil • magnitud y dirección linear inherente en la ubicación de objetos en una línea
Otros requisitos para medición • aditividad- significa que personas e ítemes se definen linealmente y se puede diferenciar entre habilidad de las personas y dificultad de los ítemes • para lograr aditividad es necesario separar parámetros de ítemes y parámetros de personas • suficiencia estadística- implica separabilidad: capacidad del modelo para factorizar como producto (multiplicación) cada parámetro y las estadísticas asociadas al mismo- debe resumir la información relevante que suple la muestra • objetividad específica: requiere que las diferencias entre pares de objetos o medidas (calibraciones) sean independientes de las muestras; • la medida provee la localización de objetos en el continuo • la misma escala (métrica) se usa para definir la localización de diversos objetos (ítemes o personas en el modelo Rasch)
De los ítemes dificultad observada y calibrada discriminación de cada opción factor de corrección por respuestas al azar ajuste del ítem al modelo psicométrico curvas características del ítem De la prueba confiabilidad alpha de Cronbach y de Teoría de Respuesta al Ítem dificultad observada y calibrada discriminación de la prueba total error de medición análisis factorial ANÁLISIS PSICOMÉTRICOS
Análisis de itemes • Estimados de dificultad • Modelos clasicos • Modelos IRT • Estimados de discriminación • Biserial • “Infit” • Otros