![]() |
Dentro de los exámenes, los ejercicios de evaluación objetiva siempre parecen ser
los más fáciles de diseñar. La respuesta que los alumnos den es objetivamente correcta
o incorrecta, por lo que no parece ser demasiado difícil diseñar una actividad
de este tipo. O esto es lo que yo siempre he creído hasta hace poco. Hace ya
unos meses cursé la asignatura Evaluación para el Aprendizaje cuyo propósito
era el de instruirnos sobre los diferentes tipos de evaluación que existen y en
cómo utilizarlos en el aula. En ella aprendimos a corregir tareas subjetivas, como son las actividades de producción escrita o
producción oral, a desarrollar tareas
objetivas, como las de comprensión lectora y la importancia que el alumnado
hiciera una autoevaluación de sus
conocimientos. De entre estos tipos de evaluación el que más me he llamado la
atención por el todo el trabajo que implica el desarrollo de sus actividades es
la evaluación de tareas objetivas.
La evaluación en sí de las tareas objetivas suele ser
fácil y no tiene demasiada complicación. Por ejemplo, en los ejercicios tipo
test de la comprensión lectora de un
texto la opción correcta es la que es real y todas las demás son incorrectas.
Este tipo de corrección no tiene más misterio. En cambio, el desarrollo de las preguntas de evaluación objetiva
es mucho más complejo de lo que parece. Como parte de una de las actividades de
la asignatura tuvimos que crear una batería
de preguntas tipo test leer sobre una noticia. Esta actividad la realizamos
siguiendo las recomendaciones de Steven Downing y Thomas Haladyna en su artículo A Taxonomy of Multiple-choice ítem-writing
rules (1989) sobre cómo redactar las preguntas de opción múltiple. Algunas de estas recomendaciones son muy lógicas
como, por ejemplo, Use vertical order, Do
not use humor o Avoid opinions (1989,
p.44), pero otras resultaban más difíciles de seguir a la hora de redactar como
Keep options homogeneous o Use only correct options (1989, p.44). Aunque la redacción de la batería de
preguntas era un ejercicio individual, en grupos pequeños teníamos que comentar
las preguntas de otros compañeros y apuntar qué era lo que fallaba en su
redacción y porqué. Esto nos ayudó mucho a darnos cuenta de cuáles eran los
puntos débiles de nuestras preguntas y a recapacitar
sobre su correcta redacción. Esto nos llevó días ya que la reescritura de
las preguntas podía resultar de lo más complicada. Algunas veces el fallo era
muy sencillo como que la longitud de las respuestas era desigual, por lo que se
tenían que reformular todas las opciones o que una de las opciones no era real
y por lo tanto no se podía utilizar.
Otro paso fundamental para comprobar si la redacción de
la batería de preguntas es correcta y la
evaluación de esta es significativa, es la realización de una prueba piloto con estas preguntas. Al
no haber tiempo suficiente para realizar esta prueba piloto con alumnos,
evaluamos los resultados de una prueba piloto ya realizada a un grupo alumnos y,
a partir de los datos de esta, calculamos el índice de dificultad y el de discriminación
de las respuestas. El cálculo de los datos es relativamente fácil, no se
necesita un nivel alto de estadística ni de matemáticas para hacerlo, pero la revisión
escrupulosa del resultado es fundamental. A través de estos resultados se verá
si hay preguntas que resultan demasiado fáciles o demasiado difíciles para los
alumnos, con lo que se tendrían que modificar o eliminar de la batería de
preguntas. Todo este procedimiento es complejo y normalmente no se utiliza en
las evaluaciones de centros de enseñanza privados, pero calcular a través de
una prueba el índice de dificultad y el
de discriminación es fundamental para aquellos exámenes a nivel nacional
como lo son las Pruebas de Acceso a la Universidad o el DELE.
A través de este ejercicio he podido ver la complejidad y
el trabajo que esconde las preguntas de opciones múltiples y cómo redactarlas
correctamente para que la evaluación de
los conocimientos de los alumnos sea representativa. Gracias a ella ahora
me veo mucho más capacitada para poder crear actividades de evaluación para
aquellos textos que yo quiera trabajar en clase sin tener que recurrir a ejercicios diseñados por otros compañeros
y/o editoriales que no me resulten tan útiles para los objetivos que haya
marcado en mis clases. Posiblemente no vuelva a realizar una prueba de pilotaje
sobre un tipo test, pero considero que es una información y un procedimiento
fundamental a la hora de comprobar la validez de una prueba.
Bibliografía
- Haladyna, T. y Downing, S. (1989) A Taxonomy of Multiple-Choice Item-Writing Rules. Applied Measurments in Education (2), 37-50.

No hay comentarios:
Publicar un comentario