viernes, 25 de enero de 2008

En este ensayo se analizan algunas de las razones por las cuales las pruebas estandarizadas no miden la calidad en la educación.

Pruebas Estandarizadas: “Una puerta cerrada a la diversidad”

Por Alicia Barrios Benítez y Shaila Mª Díaz González.

La preocupación por la mejora cualitativa de la educación está presente en la práctica totalidad de los países desarrollados o en vías de desarrollo de manera que a las administraciones públicas les resulta imposible obviar el debate sobre la calidad de la educación y los medios para mejorarla.

En el contexto de ese debate la evaluación ocupa un lugar cada vez más central, junto a otros elementos tales como la actuación profesional del docente, el proceso de diseño y desarrollo del currículo, o la organización y funcionamiento de los centros educativos.

La principal función que desempeña la evaluación en relación con la mejora cualitativa de la enseñanza es precisamente la de proporcionar datos, análisis e interpretaciones válidas y fiables que permitan forjarse una idea precisa acerca del estado y situación del sistema educativo y de sus componentes. Es lo que se suele denominar función diagnóstica de la evaluación, que cumple un doble objetivo: en primer lugar, satisface la demanda social de información que se manifiesta de manera creciente en las sociedades democráticas; en segundo lugar, sirve de base para los procesos de toma de decisión que se producen en los diferentes niveles del sistema educativo, por sus diversos agentes.

Pero, la evaluación, pese a ser un instrumento muy útil para la mejora de la calidad educativa, se encuentra “atrapada” en un remolino de incertidumbre y cambios inesperados. Dentro de la realidad política se clama por una información inmediata acerca de las evaluaciones que se están experimentando con innumerables enfoques sobre la evaluación, sin dedicar el tiempo suficiente para dar lugar a la seriedad, a la reflexión o a las investigaciones cuidadosamente diseñadas. La base de los conocimientos sobre la evaluación está desarrollándose al mismo tiempo que se están implementando los procedimientos de la misma, lo que equivale a obtener pruebas estándar cada vez más exigentes de experimentación en la práctica[1].

Dentro de las críticas a la educación y, en concreto, al sistema de evaluación nos encontramos con el descontento con las prácticas evaluativas, en especial las quejas a los sistemas de evaluación basados en los tests o pruebas estandarizadas. Éstas nos dicen que, si bien están cuidadosamente diseñados para ser psicométricamente fidedignas y válidas, tienden a mal-interpretarse cuando se utilizan para otros fines bien distintos de aquellos para los que son concebidas:

“A la hora de analizar los resultados de una prueba estandarizada en un centro, se piensa que por obtener unos resultados altos es sinónimo de eficacia docente; y por el contrario, si nos encontramos ante unas puntuaciones bajas pasaríamos a hablar de profesores ineficaces..[2]

Para Popham tres son las razones por las cuales considera totalmente inválido basar inferencias respecto a la calidad en educación: los desajustes entre la enseñanza y la medición, la tendencia psicométrica a eliminar ítems importantes de las pruebas y las causalidades confundidas relacionadas con tres factores que contribuyen a los resultados de los alumnos, como son: lo que se enseña en la escuela, la capacidad intelectual innata del estudiante y el aprendizaje del estudiante fuera de la escuela. Algunas de éstas preocupaciones sobre el uso de pruebas estandarizadas como único método de medir conocimiento son compartidas también con otros investigadores como Cummins (2001), Gardnerd (1993) y Sohomay (2001) y, que veremos a continuación:

Las pruebas de logros no deberían ser utilizadas para evaluar la calidad en la educación (”Emplear pruebas estandarizadas de logros para averiguar la calidad educativa es como medir la temperatura con una cuchara” [3]), dado que las puntuaciones de los estudiantes en estas pruebas no suministran un indicio preciso de la eficacia de la enseñanza, ya que “existe un desajuste significativo entre lo que se enseña y lo que se mide” ya que el contenido de las pruebas estandarizadas no es abordado satisfactoriamente en los libros de texto escolares. Esto puede conducir a que las pruebas estandarizadas fomenten una instrucción que enfatice el aprendizaje de memoria enfocado en conocimientos y capacidades de bajo nivel; y que conducen a enseñar sólo lo que se va a evaluar, a reducir el plan de estudios, y a un énfasis en opiniones superficiales y sin fundamentos, a expensas de un pensamiento disciplinado y razonado, tal y como lo expresa Cummins: “los maestros están presionados a obtener altos puntajes, generalmente gastan mucho tiempo de sus clases practicando lo que va a ser evaluado en la prueba, focalizándose más que todo en las habilidades básicas evaluadas”. [4]

Otra preocupación es que las pruebas estandarizadas que abarcan tantos conocimientos “permiten hacer comparaciones significativas entre estudiantes basadas en sólo un conjunto pequeño de ítems”, por lo que los resultados de dichas pruebas pueden ser fundamentalmente injustos y tal vez perjudiquen a muchos grupos de niños, ya que el propósito principal de muchas de estas pruebas es clasificar a los estudiantes (también a maestros y colegios) convirtiéndolos en muchos casos en ganadores o perdedores dependiendo del puntaje, de manera que “los resultados de las pruebas tienen serias implicaciones para los individuos y los sistemas educativos; estas pruebas pueden crear exitosos o perdedores en relación a que son aceptados o rechazados dependiendo de los resultados[5]

Además estos ítems son previamente seleccionados para que dispersen los puntuajes totales de los estudiantes, de manera, que aquellos que son respondidos por el 90% de los examinados son desechados frente a aquellos respondidos por sólo el 40 ó 60% que se consideran idóneos para diferenciar. De esta forma, las pruebas estandarizadas enfocan su atención en lo que los estudiantes no saben o no pueden hacer, o lo que es lo mismo, que “las pruebas estandarizadas son frecuentemente usadas para resaltar las debilidades de los estudiantes y no sus fortalezas”. [6]

Así mismo, estas pruebas se basan en “conocimiento homogéneo[7] ya que los diseñadores de pruebas, ante la diversidad de currículo y de alumnado, se ven obligados a crear una serie de evaluaciones “talla única”[8], asumiendo que todo el mundo tiene las mismas habilidades, las mismas condiciones para aprender o el mismo contacto con el conocimiento evaluado. Gardner (1993), defensor de la teoría de las múltiples inteligencias expresa esta idea: “un enorme deseo de convertir la educación en algo uniforme, de tratar a todos los estudiantes de la misma manera, sin tener el cuenta sus habilidades individuales, y aplicar el mismo tipo de evaluación unidimensional”.[9]

Otro gran defecto de las pruebas estandarizadas radica en que son diseñadas para un grupo específico de personas y son después transferidas directamente a otro grupo, el cual es completamente diferente para el que la evaluación fue diseñada. “Esto no debería hacerse porque es mucho más conveniente evaluar el conocimiento dentro del contexto en donde se está desarrollando[10]. Cummins se une de alguna forma a esta perspectiva al decir que “poner a los estudiantes a tomar estas pruebas que han sido diseñados para otra cultura es someterlos a condiciones injustas y de desigualdad y que los datos obtenidos de esta manera no tienen sentido alguno[11].

Por todas estas razones, es por lo que Popham nos advierte de los peligros de la mala utilización de estas pruebas estandarizadas al ser utilizadas para otros fines diferentes a aquellos para los que son diseñados. Es por ello que recomienda que estas pruebas midan el grado de dominio por parte de los estudiantes de destrezas cognitivas significativas, tales como su habilidad para escribir composiciones efectivas, su habilidad para usar las lecciones de historia para hacer análisis convincentes de problemas actuales y su habilidad para resolver problemas matemáticos de alto nivel, atendiendo a los contextos y a la diversidad de alumnado existente, pero las deroga totalmente para la medición de la calidad educativa por su falta de objetividad y eficacia. Entonces, el problema radica en que “si los educadores aceptan la posición de que los puntajes de las pruebas estandarizadas de logros no deberían ser usados para medir la calidad de la enseñanza, entonces deben suministrar otra evidencia confiable que pueda usarse para establecer la calidad de la enseñanza”.[12]



[1] Earl, L. (1996): Comprehensive Assessment and Accountability in The Knowledge Base for Educational. Reform, edited by K. Leithwood. Toronto: Ontario Institute for Studies in Education, University of Toronto.

[2] Popham, W. J. (1999):“¿Por qué las pruebas estandarizadas no miden la Calidad Educativa?” Tomado y traducido de Educational Leadership, volumen 56, número 6, marzo de 1999, con autorización de ASCD (editores). El autor es profesor emérito de UCLA.

[3] Popham, W. J. (1999):“¿Por qué las pruebas estandarizadas no miden la Calidad Educativa?” Tomado y traducido de Educational Leadership, volumen 56, número 6, marzo de 1999, con autorización de ASCD (editores). El autor es profesor emérito de UCLA.

[4] Cummins, J. (2000). Theory as dialogue. In Language, power and pedagogy. Bilingual children in the crossfire. 1-30 y Cummins, J. (2000) Dilemmas of inclusion: Intergrating English language learners in standards-based reform. In Language, power and pedagogy. Bilingual children in the crossfire. 140-167

[5] Shohamy, E. (2001): Democratic assessment as an alternative. Language Testing. 18(4) 373-391

[6] Gardner, H. (1993): Inteligencias Múltiples: The theory in practice. Basic Books. 159-207

[7] Idem.

[8] Popham, W. J. (1999):“¿Por qué las pruebas estandarizadas no miden la Calidad Educativa?” Tomado y traducido de Educational Leadership, volumen 56, número 6, marzo de 1999, con autorización de ASCD (editores). El autor es profesor emérito de UCLA

[9] Gardner, H. (1993): Inteligencias Múltiples: The theory in practice. Basic Books. 159-207

[10] Idem.

[11] Cummins, J. (2000). Theory as dialogue. In Language, power and pedagogy. Bilingual children in the crossfire. 1-30 y Cummins, J. (2000) Dilemmas of inclusion: Intergrating English language learners in standards-based reform. In Language, power and pedagogy. Bilingual children in the crossfire. 140-167

[12] Popham, W. J. (1999):“¿Por qué las pruebas estandarizadas no miden la Calidad Educativa?” Tomado y traducido de Educational Leadership, volumen 56, número 6, marzo de 1999, con autorización de ASCD (editores). El autor es profesor emérito de UCLA


No hay comentarios: