Grupo Educación y Empresa

Educando en competencias

Uso de resultados a gran escala

By admin | noviembre 12, 2019 | 0 Comment

Editorial56

Las pruebas a gran escala han surgido gracias a la relación entre la educación y la psicología, cuando hablamos del terreno educativo, son pruebas de orden cognitivo, para el terreno psicológico, son de orden del comportamiento.

Con la ayuda de la estadística y su creciente uso para el análisis tanto de los ítems, como de los resultados, se recurre necesariamente a la psicometría. De este triángulo: educación – psicología – psicometría, se crean y aplican las primeras pruebas estandarizadas.

Si bien en la escuela ya se venía evaluando desde sus inicios hace más de 2.000 años, fue en el siglo XX donde se establecieron los parámetros de Confiabilidad, Validez y Objetividad, necesarios para lograr una mejor evaluación.

Una de las preguntas claves que surgen al crearse las evaluaciones estandarizadas es: ¿cómo los sistemas educativos aportan valor a la formación de sus estudiantes o a mejorar, por ejemplo, su nivel socioeconómico o sus actitudes éticas?, esto debido a que a lo largo del siglo XX y el siglo XXI diversas encuestas y estudios (Hanusek, 1986) han planteado que ir a la escuela no tiene un impacto tan alto como el que se cree, por ejemplo, en términos de empleabilidad, mejora en el nivel y calidad de vida, o en aspectos como aportar a la sociedad mejores ciudadanos (Informe Coleman, 1966). De allí que las evaluaciones estandarizadas tengan diversas intenciones.

Intención de las evaluaciones a gran escala

Podemos destacar que las evaluaciones a gran escala pueden tener la intención de:
Admisión a programas e instituciones
Ubicación escolar
Formación
Retroalimentación
Institucional
Certificación

Y ahora, ¿qué decisiones debemos tomar?

Como lo expresamos en el artículo anterior de Confiabilidad y Validez, podemos diferenciar dos caminos en la evaluación, uno que aborda la evaluación al interior de la escuela y que es construida por los docentes, y otra, llamada estandarizada, que sirve para evaluar a un sistema educativo, un país, una región o un grupo de países (por ejemplo, las pruebas PISA).

Vamos entonces a centrarnos en la siguiente pregunta: ¿cómo las Evaluaciones, sean estandarizadas o no, pueden aportar al aprendizaje y alcance de competencias? Lo que nos lleva a las siguientes preguntas: ¿cómo usar adecuadamente los resultados de la evaluación? ¿cómo podemos interpretarlos de manera acertada para implementar acciones y lograr los resultados esperados?

Lo que nos dicen diversos estudios es que la mayoría de los docentes no tienen conocimientos en teoría de la medición (Brookhart, 2003). De esto se deriva también la siguiente conclusión: tampoco sabemos leer e interpretar adecuadamente los resultados de las evaluaciones.

Lo primero que debemos tener presente para entender e interpretar los resultados de la evaluación, es reconocer cuál es su intención evaluativa. Desde un inicio, sea en una prueba para un grupo de estudiantes de un grado determinado al interior de una pequeña escuela rural, o la prueba para 5 millones de estudiantes de un país, siempre se debe tener clara la intención. ¿Qué deseo evaluar? La respuesta a esta pregunta, responde automáticamente al tipo de resultados que vamos a encontrar.

“Las evaluaciones estandarizadas pueden proporcionar dos tipos de resultados: normativos y criteriales. Los primeros sirven para comparar los resultados de un individuo con respecto a una población de referencia, con la cual se normalizan estadísticamente las puntuaciones. Así, los resultados de una persona pueden presentarse en puntuaciones Z, en una escala predefinida (ej.: 200 a 800, con una media de 500 y una desviación estándar de 100 puntos), en puntuaciones percentilares o, bien, en niveles de desempeño (ej.: alto, medio, bajo). Por su parte, los resultados de una evaluación referidos a un criterio hablan de la cantidad o proporción de competencias que un estudiante domina, del total de competencias evaluadas. Los resultados se presentan, por lo general, de dos maneras: porcentaje de respuestas correctas y si se cuenta o no con el nivel de maestría requerido para ejecutar una tarea”. Eduardo Backhoff Escudero. Evaluación Estandarizada del Logro Educativo: Contribuciones y Retos.

Ya hemos visto como podemos construir una prueba con confianza y validez, hemos explorado herramientas y conceptos tanto cualitativos como cuantitativos sobre la evaluación. Además, hemos revisado como unir los eslabones de la cadena de la evaluación para lograr obtener unos resultados. Por suerte, si hemos llevado a cabo todo el proceso nombrado en detalle, los resultados que obtendremos harán un camino iluminado y mucho más fácil de transitar. No lo olvidemos, estamos evaluando para el aprendizaje.

Cuando tenemos una buena evaluación intencionada para el aprendizaje, gracias a los resultados podemos:
1. Definir niveles de desempeño de cada estudiante, de cada grado y de la institución.
2. Comparar activamente el desempeño de un año a otro en el mismo grado con diversas poblaciones.
3. Evaluar las estrategias usadas en cada contexto y definir cuales han sido las más exitosas para replicarlas.
4. Subir paulatinamente los niveles de exigencia y poder medir esa mejora de un año a otro.
5. Proveer retroalimentación efectiva a los estudiantes, la cual debe:
Ser oportuna, poseer información detallada y centrada en la tarea que debe alcanzar.
6. Diseñar estrategias de auto evaluación, que puedan desarrollar por sí mismos.
7. Evaluarse como docente y como equipo, los resultados son responsabilidad no solo del estudiante.

Vamos a mostrar un ejemplo del tipo de resultados que pueden construirse a partir de una prueba de orden cognitivo que puede aplicarse tanto a un pequeño grupo de estudiantes (50 estudiantes) o a una población mucho más alta (500.000 estudiantes).

img 1 img 2 img 3 img 4 img 5

Para terminar:
Los reportes de resultados pueden ser tan amplios y detallados como las pruebas lo permitan, la confección y ensamble adecuados de los ítems garantizan que la prueba evalúe lo que desea evaluar, que sus resultados sean válidos. Luego, la estadística adecuadamente aplicada hace el resto. Mención especial debemos hacer en este caso a los variados tipos de pruebas y evaluaciones que se aplican a diario en las escuelas y universidades. Cuando se levantan todo tipo de evidencia de evaluación por medio de diversos mecanismos evaluativos podemos crear los informes de resultados más robustos y complejos.

Una prueba estandarizada no puede medir la totalidad de conocimientos, habilidades o competencias adquiridos por un estudiante. Sean competencias de orden cognitivo o de orden comportamental. Ninguna prueba puede hacerlo en su totalidad. La sumatoria de modelos de evaluaciones, de pruebas y la adecuada observación e interpretación de los resultados nos van a dar el insumo para emitir juicios confiables sobre el progreso y logro de los aprendizajes. Una prueba estandarizada jamás podrá evaluar de forma detallada las actitudes de trabajo en equipo de un estudiante o su capacidad para afrontar la frustración.

Lo que sí puede hacer un grupo de docentes y los mismos estudiantes en actividades de autoevaluación, coevaluación y heteroevaluación. Por eso no podemos suponer que existe un mecanismo perfecto para la evaluación. Existe sí, un grupo de mecanismos que de la mano de una adecuada lectura mejorará siempre la evaluación para el aprendizaje.

TAGS

0 Comments

¡Comparte!
Cerrar