22
La evaluación Andy Hargreaves La evaluación es «la cola que menea el perro» del curriculum (Hargreaves, 1989). A menudo vemos la evaluación como algo que sigue al aprendizaje, que aparece después de la enseñanza (Burgess y Adams, 1985). Sin embargo, y según argumenta Broadfoot (1979), la evaluación suele tener un efecto de «rechazo» sobre el curriculum y los procesos de la enseñanza y del aprendizaje que lo acompañan. En consecuencia, la evaluación es tanto el mecanismo que hace funcionar nuestros objetivos educativos como un reflejo de los mismos (Murphy y Torrance, 1989). En este sentido, cualquier cambio en la evaluación educativa debería planificarse en consonancia con los cambios que se propongan para el curriculum. La reforma del curriculum y de la evaluación es una labor que debería emprenderse de forma conjunta, coherente y previamente planificada. De otro modo, la reforma de la evaluación se limitará a configurar el curriculum por defecto (Hargreaves, 1989). Si nuestros objetivos educativos promueven una amplia gama de resultados y reconoce una amplia variedad de logros educativos, esos objetivos deberían quedar reflejados en una política de evaluación que contara con la misma amplitud (Leithwood et al., 1988). Dado el poder de la evaluación para configurar el curriculum, la enseñanza y el aprendizaje, los desequilibrios de ésta crearán muy probablemente desequilibrios en los tres últimos aspectos nombrados. Algunos tipos de evaluación, como los exámenes escritos y las pruebas estandarizadas, son comúnmente criticados por sus efectos negativos sobre el curriculum, la enseñanza y el aprendizaje (véase, por ejemplo, Hargreaves, 1982; Haney y Madaus, 1989). Esto ha inducido a algunos a defender la abolición de estrategias concretas de evaluación que parecen ejercer estos efectos (véase, por ejemplo, Whitty, 1985). Pero la evaluación, como concepto general, no puede ser eliminada. Es una parte constitutiva de la enseñanza. Los profesores evalúan continuamente. Controlan el progreso y la respuesta de sus estudiantes durante el transcurso de los acontecimientos que tienen lugar en el aula. Al escudriñar las expresiones faciales, al comprobar el trabajo de los estudiantes, al hacer preguntas para comprobar el nivel de comprensión, los profesores emprenden una tarea de evaluación informal como parte rutinaria de su trabajo (Jackson, 1988). Si no lo hicieran así, no estarían enseñando. La evaluación, pues, no se puede suprimir, pero sí reformar. A la vista de nuestra argumentación anterior, parece sensato sugerir que la fuerza impulsora que anima la reforma de la valoración debería ser el propósito de satisfacer de un modo más efectivo los objetivos de nuestro curriculum y nuestra enseñanza. La evaluación cumple muchas funciones. Entre ellas se incluyen fomentar la responsabilidad, la titulación, el diagnóstico y la motivación del estudiante. Todas

La evaluacion Hargreaves

Embed Size (px)

Citation preview

La evaluación Andy Hargreaves

La evaluación es «la cola que menea el perro» del curriculum (Hargreaves,

1989). A menudo vemos la evaluación como algo que sigue al aprendizaje, que

aparece después de la enseñanza (Burgess y Adams, 1985). Sin embargo, y según

argumenta Broadfoot (1979), la evaluación suele tener un efecto de «rechazo» sobre

el curriculum y los procesos de la enseñanza y del aprendizaje que lo acompañan.

En consecuencia, la evaluación es tanto el mecanismo que hace funcionar nuestros

objetivos educativos como un reflejo de los mismos (Murphy y Torrance, 1989). En

este sentido, cualquier cambio en la evaluación educativa debería planificarse en

consonancia con los cambios que se propongan para el curriculum. La reforma del

curriculum y de la evaluación es una labor que debería emprenderse de forma

conjunta, coherente y previamente planificada. De otro modo, la reforma de la

evaluación se limitará a configurar el curriculum por defecto (Hargreaves, 1989).

Si nuestros objetivos educativos promueven una amplia gama de resultados y

reconoce una amplia variedad de logros educativos, esos objetivos deberían quedar

reflejados en una política de evaluación que contara con la misma amplitud

(Leithwood et al., 1988). Dado el poder de la evaluación para configurar el

curriculum, la enseñanza y el aprendizaje, los desequilibrios de ésta crearán muy

probablemente desequilibrios en los tres últimos aspectos nombrados. Algunos tipos

de evaluación, como los exámenes escritos y las pruebas estandarizadas, son

comúnmente criticados por sus efectos negativos sobre el curriculum, la enseñanza y

el aprendizaje (véase, por ejemplo, Hargreaves, 1982; Haney y Madaus, 1989). Esto

ha inducido a algunos a defender la abolición de estrategias concretas de evaluación

que parecen ejercer estos efectos (véase, por ejemplo, Whitty, 1985). Pero la

evaluación, como concepto general, no puede ser eliminada. Es una parte

constitutiva de la enseñanza. Los profesores evalúan continuamente. Controlan el

progreso y la respuesta de sus estudiantes durante el transcurso de los

acontecimientos que tienen lugar en el aula. Al escudriñar las expresiones faciales, al

comprobar el trabajo de los estudiantes, al hacer preguntas para comprobar el nivel

de comprensión, los profesores emprenden una tarea de evaluación informal como

parte rutinaria de su trabajo (Jackson, 1988). Si no lo hicieran así, no estarían

enseñando. La evaluación, pues, no se puede suprimir, pero sí reformar. A la vista de

nuestra argumentación anterior, parece sensato sugerir que la fuerza impulsora que

anima la reforma de la valoración debería ser el propósito de satisfacer de un modo

más efectivo los objetivos de nuestro curriculum y nuestra enseñanza.

La evaluación cumple muchas funciones. Entre ellas se incluyen fomentar la

responsabilidad, la titulación, el diagnóstico y la motivación del estudiante. Todas

estas metas no pueden abarcarse con una sola estrategia de evaluación (ése sería el

caso de las pruebas estandarizadas o los portafolios) (Haney, 1991; Hargreaves,

1989; Broadfoot, 1979). Algunas estrategias de evaluación, por ejemplo los porta-

folios, útiles para estimular la motivación del estudiante, resultan poco eficientes

como instrumentos para satisfacer las exigencias de responsabilidad pública. Del

mismo modo, algunas estrategias, como las pruebas o exámenes nacionales que

proporcionan datos asequibles y concisos a audiencias externas, no resultan de gran

ayuda a la hora de diagnosticar los problemas del estudiante. En consecuencia, es

más probable que podamos satisfacer los diversos propósitos de la evaluación

mediante el empleo de una extensa gama de estrategias de evaluación. El objetivo

último de todo esto es que si invertimos en una serie limitada de estrategias de

valoración, sólo cumpliremos algunos de nuestros propósitos en ese ámbito, a

expensas del resto.

Desarrollar y desplegar una amplia gama de estrategias de evaluación es una

práctica habitualmente criticada ya que, según sus detractores, ocupa una porción

importante del tiempo asignado al profesor para realizar sus funciones (Stiggins y

Bridgeford, 1985; Broadfoot et a l , 1988). Las demandas de evaluación adicional

planteadas al profesor pueden representar una carga considerable allí donde las

tareas de evaluación, como las pruebas escritas, son administradas por separado

con respecto al resto del curriculum. Sabemos, sin embargo, que los profesores

valoran continuamente a sus estudiantes de modo informal, como parte integral de

su enseñanza. Si queremos desarrollar y desplegar una gama más amplia de

estrategias de evaluación, y que éstas no mantengan ocupado un tiempo excesivo al

profesor, deberán ser incluidas en el aprendizaje que se imparte en el aula, y dejar

de ser algo a lo que se aplica un criterio o clasificación similares a los utilizados para

ordenar las estanterías que contienen los libros de texto, una vez que haya

terminado el aprendizaje. La integración de las nuevas estrategias de evaluación en

el curriculum y el aprendizaje es uno de los mayores avances prácticos y

conceptuales que precisa la reforma de la evaluación. En resumen, basamos nuestra

revisión de la evaluación educativa en los siguientes principios:

La reforma de la evaluación y la reforma del curriculum están estrechamente relacionadas y deberían emprenderse juntas.

Los amplios objetivos del curriculum deberían tener su reflejo en objetivos de evaluación a su vez más amplios.

No se puede abolir la evaluación educativa, sino sólo reformarla.

La evaluación educativa cumple diversos propósitos que no pueden ser abarcados adecuadamente por una sola estrategia de evaluación, sino por una amplia gama de estrategias.

La evaluación debería constituir una parte integral del proceso de aprendizaje, y no algo que se pone en práctica una vez terminado éste.

En el resto del capítulo ampliaremos estos puntos, clarificando la naturaleza

de la evaluación educativa, perfilando sus propósitos principales y describiendo los

tipos específicos de evaluación que los profesores pueden utilizar y practican en sus

aulas. Examinaremos después las pautas tradicionales de evaluación y sus

implicaciones en la enseñanza y el aprendizaje. Finalmente, analizaremos una gama

de estrategias alternativas de evaluación, junto con algunas posibilidades y

problemas que pueden surgir en su aplicación.

Definiciones de la evaluación

Según Bloom (1970), la evaluación es uno de los tres aspectos de la labor

examinadora, siendo los otros dos la medición y la valoración. Bloom definió la

evaluación como «un intento de valorar las características de los individuos respecto

a un ambiente, tarea o situación de carácter particular". Satterly (1981) definió la

evaluación más ampliamente como «un término que incluye todos los procesos y

resultados que describen el aprendizaje de los estudiantes», y Wood y Power (1984)

expresaron la necesidad de separar el término «evaluación» del de «medición». La

evaluación se define por otro lado como el proceso que valora la evolución del

estudiante hacia los objetivos educativos establecidos, e incluye juicios de valor

(Stennett, 1987). En este capítulo, la evaluación será definida como los métodos

utilizados para describir y diferenciar lo aprendido por los estudiantes en la escuela.

Es razonable que aquellos que están implicados en el proceso de aprendizaje

quieran comprender sus resultados (Murphy y Torrance, 1988). En consecuencia, y

por definición, la buena evaluación no sólo forma una parte esencial de la enseñanza

y el aprendizaje, sino que es inherente a la propia enseñanza (Shipman, 1983).

La valoración puede ser diferenciada atendiendo a aquellos aspectos que los

profesores valoran: el proceso de trabajo (de qué manera el estudiante asimila,

organiza e interpreta la información), o el producto (la presentación de las ideas y la

calidad y cantidad del trabajo). Por lo general, se da preferencia a la evaluación del

producto terminado, puesto que, comúnmente, se la considera un intento por

cuantificar rendimientos, dentro de una visión del aprendizaje orientada hacia el

producto (Shipman, 1983).

La evaluación puede ser diagnóstica, formativa o recopiladora, dependiendo

del motivo que requiera su aplicación. La evaluación inicial se lleva a cabo para

descubrir si un estudiante tiene dificultades o para identificar la naturaleza de su

comprensión, con objeto de tomar decisiones acerca de posibles modificaciones en

cuanto a su asignación a un grupo o al programa. Buena parte de este tipo de

valoraciones se hace de modo informal y continuado. La evaluación informal tiene

lugar al interactuar el profesor con los estudiantes en el aula, interpretar las

respuestas de éstos y responder a ellas mediante la modificación de su estilo de

enseñanza, ya sea adaptando el tema o cambiando el curriculum...

Los términos de evaluación formativa y recopiladora se utilizan,

respectivamente, para distinguir entre evaluación continuada a lo largo del curso,

cuyo propósito fundamental será mejorar la enseñanza y el aprendizaje, y la

evaluación que se produce una vez terminada la enseñanza y cuyo objetivo consiste

en valorar los logros del alumno. Tal y como sucede con la distinción entre proceso y

producto, se pone especial énfasis en determinar en qué medida la evaluación ayuda

al profesor a identificar los problemas del que aprende, proporcionándole apoyo

inmediato, en comparación con la descripción del rendimiento final (Scriven, 1978).

Finalmente, la evaluación también se puede diferenciar en lo que respecta a

su punto de referencia, evaluación basada en el criterio o en el resultado, y que

registra el logro de objetivos curriculares específicos alcanzados por el estudiante.

Esta evaluación equipara a los estudiantes con un nivel. La ventaja de este método

es que permite a los profesores identificar hasta qué punto un estudiante ha

alcanzado un nivel de rendimiento predeterminado, de modo que se les pueda

ofrecer la ayuda apropiada (Rowntree, 1980). Cuando la comparación se establece

con los compañeros y no con niveles específicos, la evaluación pasa a tomar como

referencia la norma. Broadfoot (1979) argumenta que el predominio de la evaluación

que toma como referente la norma es de poca ayuda para los profesores a la hora de

mejorar su enseñanza y refleja la competitividad que caracteriza nuestra sociedad.

Además de estos dos puntos de referencia ampliamente discutidos en la evaluación,

hay un tercero, analizado de forma más superficial: la evaluación «ipsativa» o

autoreferenciada. Derivada del latín ipse (que significa «uno mismo»), esta pauta de

valoración es aquella en la que el rendimiento y los logros propios no se miden

atendiendo a ninguna norma o promedio, ni respecto a ningún criterio preestablecido,

sino tomando como referencia los rendimientos y logros del alumno en el pasado.

Uno de los problemas del tránsito a la escuela secundaria es el

desconcertante descenso que se produce en las notas de algunos estudiantes

cuando pasan de ser valorados por referencia «ipsativa» en la escuela elemental, a

serlo atendiendo a normas o criterios establecidos en la escuela secundaria (ILEA,

1984). Este problema generalizado indica la importancia de procurar una coherencia

según el punto de referencia adoptado en la práctica de la evaluación, dado que los

estudiantes pasan de una institución a otra. En síntesis:

La evaluación ha sido definida como los procesos utilizados para describir y diferenciar los conocimientos adquiridos por los estudiantes en la escuela.

La evaluación puede valorar el proceso de trabajo o su producto.

La evaluación puede ser de naturaleza diagnóstica, formativa o recopiladora.

La evaluación puede tomar como punto de referencia criterios y normas, o ser de carácter «ipsativo» autoreferencial.

Puesto que la incoherencia en la práctica de la evaluación puede conducir a

confusión y desilusión, a medida que los estudiantes efectúan el tránsito entre las

escuelas (primaria a secundaria), es prioritario para la evaluación establecer con

claridad y coherencia su punto de referencia.

Objetivos de la evaluación

La evaluación educativa cubre una serie de objetivos diferentes. Cuatro de

ellos se analizan ampliamente en la bibliografía: responsabilidad, titulación,

diagnóstico y motivación.

Responsabilización

Para el público, en general, la evaluación puede legitimar la existencia de un

sistema educativo dado y comunicar a la sociedad hasta qué punto se están

satisfaciendo las expectativas que ésta tiene depositadas en la escolarización.

Puesto que los contribuyentes invierten dinero en la educación, quieren estar

seguros de que su dinero se emplea bien. A medida que aumenta la proporción de

contribuyentes que no tienen hijos e hijas en edad escolar, también aumenta la

demanda pública de rendimiento de la responsabilidad educativa.

La calidad del trabajo que los propios estudiantes llevan consigo a casa o

describen no es suficiente para este público más amplio, que exige criterios de

responsabilidad generalizados y perceptibles. Según este punto de vista, las

escuelas tienen que producir «bienes» lo que, en términos educativos, equivale a

conseguir que los estudiantes alcancen un cierto nivel (Broadfoot, 1984).

Esta presión que exige dar cuentas a la sociedad no es nada nuevo. Ya se

daba, por ejemplo, en la Inglaterra del siglo XIX, cuando se pagaba a las escuelas

«según los resultados», es decir, si los estudiantes obtenían niveles específicos y

perceptibles. Incluso en la actualidad, en Holanda, las becas estatales sólo se

conceden a aquellas escuelas cuyos estudiantes pueden demostrar un mínimo de

competencia en habilidades numéricas y básicas de carácter general (Maguire,

1976).

Titulación

Éste es quizá el propósito más comúnmente reconocido de la evaluación

escolar, sobre todo en los últimos años de la educación secundaria (Broadfoot,

1979). La titulación constata la competencia de los estudiantes en un ámbito

particular del aprendizaje, una vez han terminado su trayectoria escolar o un tramo

importante de la misma. Esta competencia se demuestra en pruebas o exámenes en

apariencia imparciales y objetivos, confeccionados habitualmente por los profesores.

Los resultados de esta evaluación se comparan con el rendimiento de otros

estudiantes, clasificando por tanto a los estudiantes atendiendo a unos criterios

predeterminados y, en ocasiones, estableciendo comparaciones entre sí. El objetivo

principal de esta clasificación es el de permitir que los dos «principales

consumidores» del sistema educativo, es decir, los empresarios y las instituciones de

educación superior, seleccionen a aquellos que, en su opinión, han tenido un

rendimiento satisfactorio (Mc Lean, 1985).

Al igual que sucede con el precepto de responsabilidad, la titulación ha crecido

en importancia a lo largo de los años al ser considerado un propósito clave de la

evaluación. Su creciente influencia sobre los sistemas de evaluación y los sistemas

educativos puede ser atribuida en general a lo que Dore (1976), en su revisión

internacional de las tendencias de la evaluación, califica como «inflación de cali-

ficaciones», «la enfermedad del diploma» o «titulitis». Este proceso ha supuesto, a lo

largo del tiempo, una escalada en las exigencias de calificación para un mismo

puesto de trabajo, aun cuando las habilidades requeridas para realizar la tarea se

hayan mantenido relativamente estáticas. En la búsqueda de equidad dentro de un

sistema donde prevalece la igualdad formal de oportunidades, aumenta el número de

estudiantes que se someten a exámenes, pruebas y otras valoraciones, en niveles

cada vez superiores, con objeto de sacar el máximo rendimiento a sus posibilidades

de éxito. A medida que un mayor número de estudiantes alcanza con éxito el nivel

exigido en los centros educativos y aumenta la reserva de candidatos aptos para

puestos de trabajo concretos, aquellos que abren las puertas de acceso a dichos

puestos elevan sus estándares de admisión para reducir la reserva y conseguir

aspirantes mejor calificados. Por su parte, los que abren las puertas de acceso a

otros trabajos paralelos hacen lo mismo para no rebajar su posición, lo que da como

resultado una inflación. El efecto inmediato de dicha inflación es la creación de pro-

gramas de nivel más elevado para satisfacer la demanda de un creciente número de

estudiantes, y la dependencia de otros programas a titulaciones que antes no tenían,

con objeto de dotarlos de mayor credibilidad pública. En general, la titulación acaba

por ejercer una influencia cada vez más amplia, lo que la convierte en uno de los pro-

pósitos más poderosos de la valoración educativa.

Diagnóstico educativo

La evaluación permite al profesor valorar el proceso de aprendizaje, identificar

los niveles de comprensión de los estudiantes, localizar problemas y ofrecer ayuda

individualizada o ajustar el programa en consecuencia. Este tipo de evaluación no

sólo es ventajosa para el público externo, obsesionado por la responsabilidad, o el

reclutamiento de personal competente, sino también para los propios profesores, ya

que de este modo pueden ayudar a sus estudiantes ajustando su programa y

mejorando su enseñanza. En este sentido, la evaluación mejora la calidad de la

enseñanza y el aprendizaje (Rowntree, 1980).

Motivación del estudiante

Es evidente, la evaluación motiva, según el principio del «palo y la zanahoria», allí

donde los estudiantes están dispuestos a realizar el esfuerzo necesario para llevar a

cabo una tarea por la que van a ser recompensados (Natriello, 1987). También se

estimula la motivación cuando el logro del estudiante es oficialmente registrado y

reconocido (Munby, 1989). En aquellos casos en que los estudiantes participan en el

proceso de evaluación, ésta puede resultar un acicate porque ayuda a fomentar entre

los estudiantes un sentido de responsabilidad sobre su propio aprendizaje (Burgess y

Adams, 1985). La valoración también puede ejercer "un efecto positivo en la

motivación del estudiante de forma indirecta, al conllevar mejoras en el curriculum y

la enseñanza, así como en la calidad del aprendizaje que experimentan los

estudiantes (Hargreaves, 1989). Utilizar la valoración en beneficio de la motivación

es, sin embargo, una espada de doble filo. Stiggins (1988) señala que las

puntuaciones o categorías no son motivadores para los que rinden poco, que se

protegen a sí mismos mostrándose menos persistentes y poco motivados.

En un sentido general, la responsabilidad y la titulación son propósitos

importantes e inevitables dentro de la evaluación educativa. Pero, desde nuestro

punto de vista, los propósitos clave de la evaluación son aquellos que abordan las

necesidades de los preadolescentes durante los años de transición. El diagnóstico y

la motivación son, por lo tanto, propósitos fundamentales de la evaluación si aten-

demos a las necesidades del estudiante. Si estas necesidades predominan

realmente en un sentido tanto práctico como retórico, entonces la prioridad principal

en la reforma de la evaluación sería el cumplimiento adecuado a los propósitos del

diagnóstico y la motivación.

Éste sería el criterio seguido en nuestra revisión de las estrategias de

evaluación. No se trata de un análisis sobre las ventajas y desventajas que

presentan las diferentes pautas de evaluación en un sentido amplio. Abordaremos la

evaluación como un aspecto a tener en cuenta a la hora de satisfacer las

necesidades de los preadolescentes. En consecuencia, se considerarán diferentes

pautas de evaluación, atendiendo a su capacidad para intensificar o disminuir la

motivación del estudiante, de mejorar o inhibir el diagnóstico efectivo, y de reconocer

y estimular una gama amplia o limitada de logros y experiencias educativas.

Pautas tradicionales de evaluación

Históricamente, las formas de evaluación dominantes y públicamente visibles

han sido las pruebas estandarizadas, los exámenes externos y las pruebas y

exámenes supervisados por los profesores. En una revisión de la bibliografía sobre

los procesos de evaluación en las escuelas y aulas, Natriello (1987) llegó a la

conclusión de que «la técnica dominante para reunir información sobre el rendimiento

del estudiante es siempre algún tipo de examen», ya sea nacional, estatal, de distrito

o de aula, en el que los profesores confían ampliamente (Hermán y Dorr-Bremme,

1984; Wilson, 1989).

Efectos de la evaluación tradicional

En todas las sociedades industriales occidentales, los exámenes se iniciaron

como un medio de asegurar el ingreso en ciertas profesiones de élite, controlando

así el reclutamiento de sus miembros (Broadfoot, 1979). Ya desde el principio, por

tanto, los exámenes formaron parte de un proceso de clasificación y selección que

puso de relieve los frutos concretos de la educación. Dos tipos de exámenes han

prevalecido en la bibliografía de los últimos años: de competencia mínima y

exámenes específicos de grado (Nagy, Traub y MacRury, 1986). Las pruebas de

competencia han sido muy utilizadas en Estados Unidos. Aunque fueron introducidas

originalmente para proteger los intereses de estudiantes cuyas necesidades estaban

siendo descuidadas, han provocado innumerables debates sobre su imparcialidad y

el impacto que tienen sobre los programas educativos (Corcoran, 1985).

Además de exámenes y pruebas estandarizadas confeccionados fuera de la

escuela, los profesores también se han valido, en gran medida, de sus propias

pruebas escritas, como base para calificar el rendimiento del estudiante (Gullickson,

1982). De hecho, Stiggins y sus colaboradores (1989) descubrieron que los

profesores consideran las evaluaciones de aula hechas por ellos mismos como la

fuente fundamental de información sobre el logro del estudiante, y manifiestan su

preferencia por desarrollar sus propias evaluaciones. Varios estudios sobre las

prácticas de evaluación realizados en escuelas canadienses han descubierto que los

profesores prefieren ser ellos los que preparen sus pruebas (Wahlstrom y Daley,

1976; Anderson, 1989; Wilson e t a l , 1989).

Las pautas tradicionales de examen y evaluación tienen en común las

siguientes características:

Se aplican predominantemente fuera de contexto, una vez completado el

aprendizaje requerido.

Suelen ser pruebas escritas.

Suelen tomar como referentes normas o criterios.

Proporcionan la base para las puntuaciones o notas, que pueden utilizarse

como mediciones del rendimiento individual, de la escuela, del distrito, del

estado/provincia o del plano nacional.

Los argumentos a favor y en contra de los exámenes públicos ya fueron

planteados hace casi ochenta años de modo elocuente, aunque un tanto singular,

por parte del Consejo de Educación (1911), en Inglaterra. Análisis más recientes

sobre los efectos de los exámenes y otras pautas similares de evaluación han

añadido considerables detalles, pero poca sustancia a aquellos argumentos

expresados concisamente.

Los efectos positivos de los exámenes sobre el alumno son:

Le obligan a prepararse a tiempo (sic) al exigirle que alcance un grado de conocimiento determinado en una fecha fijada.

Le incitan a asimilar sus conocimientos de forma reproducible y disminuye el riesgo de imprecisión.

Le exigen asimilar partes de un estudio que, aunque importantes, pueden resultarle poco interesantes o incluso desagradarle profundamente.

Desarrollan la capacidad de abordar una asignatura para un propósito definido, aun cuando no le parezca necesario recordarla más tarde; un entrenamiento útil para algunas de las tareas profesionales que deberá ejercer en el campo de la abogacía, la administración, el periodismo y los negocios.

En algunos casos, estimulan una cierta constancia en el trabajo durante un periodo de tiempo prolongado.

Permiten que el alumno tenga una idea precisa sobre su verdadero logro mediante:

el estándar requerido por los examinadores externos;

la comparación con los logros de sus compañeros, y

la comparación con los logros de alumnos pertenecientes a otras escuelas.

Por otro lado, los exámenes pueden causar un efecto negativo en la mente del

alumno al:

Premiar únicamente la capacidad de reproducir las ideas de otros y los métodos de presentación de los demás, desviando así la energía del proceso creativo.

Recompensar las formas más evanescentes del conocimiento (que desaparecen con rapidez).

Favorecer a un tipo de mente en cierto modo pasiva.

Conceder una injusta ventaja a aquellos que, al contestar a las preguntas por escrito, pueden hacer un uso inteligente de logros quizá más tenues.

Inducir al alumno, en su preparación para un examen, a absorber la información transmitida por el profesor, antes que a formarse un juicio independiente aquellos temas impartidos en clase.

Estimular el espíritu competitivo en la adquisición de conocimiento, un espíritu que, en el peor de los casos, puede llegar a ser mercenario.

Los efectos positivos que un examen bien elaborado tiene sobre el profesor son:

Lo inducen a tratar meticulosamente su asignatura.

Le obligan a organizar sus lecciones de modo que puedan abarcar con esmero intelectual un curso de estudio previamente determinado, dentro de unas limitaciones concretas de tiempo.

Le impulsan a prestar atención no sólo a sus mejores alumnos, sino también a aquellos que van más retrasados o son más lentos y que también están siendo preparados para el examen.

Lo familiarizan con el nivel que de la misma asignatura son capaces de alcanzar otros profesores y sus alumnos, en otros lugares de la educación.

En contrapartida, los exámenes ejercen un efecto negativo en el profesor en la

medida en que:

Le obligan a vigilar las manías del examinador y a tomar nota de su idiosincrasia (o tradición del examen), con el propósito de dotar a sus alumnos de la clase de conocimientos requeridos para afrontar con éxito las cuestiones que probablemente se les plantearán.

Limitan la libertad del profesor para elegir el camino que desea seguir a la hora de tratar su asignatura.

Le animan a asumir una tarea que, de otro modo, habrían realizado sus alumnos por sí solos, lo que le induce a filtrar la información antes de impartirla, o a seleccionar hechos o aspectos concretos de la asignatura que cada alumno debería recoger o descubrir adecuadamente por sí mismo.

Predisponen al profesor a sobrevalorar ese tipo de desarrollo mental que asegura el éxito en los exámenes.

Provocan que el profesor centre su atención en aquellos aspectos que atañen directamente al «examen», desviándole de aquellas otras tareas en su labor educativa que no quedan reflejadas en una prueba escrita.

Por muy persuasivo que resulte este documento, y a pesar de su utilidad para

estimular el debate acerca de los beneficios y desventajas que ofrece la pauta

tradicional de evaluación, no debe olvidarse que fue escrito en otra época, cuando la

gama de estrategias de evaluación era bastante más limitada de la que existe en la

actualidad. Al disponer de otras estrategias de evaluación, muchos de los llamados

efectos «positivos» del examen no serían exclusivamente atribuibles a éste. A los

estudiantes se les puede exigir que «alcancen un grado de conocimiento

determinado en una fecha fijada» con la preparación, por ejemplo, de presentaciones

para una feria sobre ciencia. De modo similar, «el riesgo de imprecisión» en el

examen por escrito puede disminuir mediante la evaluación formativa de una serie de

borradores, como sucede en el proceso de escritura utilizado ahora ampliamente en

los programas ingleses de escuela elemental y secundaria. De igual manera, muchos

de los supuestos efectos adversos de los exámenes también se producen en las

evaluaciones, llevadas a cabo por el profesor.

Aunque buena parte de la investigación aquí analizada se refiere a los efectos

producidos por los exámenes, no son sólo éstos los que nos preocupan, sino

también otras pautas tradicionales de evaluación, como las pruebas estandarizadas

que comparten muchas características con los exámenes convencionales, pautas de

evaluación, en buena medida, descontextualizadas, escritas y obligatorias a la termi-

nación de una unidad o programa de estudio. Consideraremos las consecuencias

que tienen estas pautas tradicionales de evaluación sobre el curriculum y el

estudiante.

Efectos sobre el curriculum

El debate sobre los efectos de las pautas tradicionales de evaluación en el

curriculum se ha centrado en dos puntos: la restricción del curriculum y la

importancia otorgada a las asignaturas de las que se examina a los alumnos. Aunque

la mayoría de exámenes se realizan cuando finaliza el año escolar, han sido cri-

ticados porque influyen sobre el curriculum desde mucho antes (Broadfoot, 1979).

Nuestra mayor inquietud es que esos exámenes puedan llegar a dictar el curriculum

(Nagy, Traub y MacRury, 1986). En una crítica al sistema de la educación secundaria

en Gran Bretaña, claramente dominado por valores y preocupaciones académicas,

Hargreaves (1982) afirmó que el sistema de exámenes públicos transmitía a los

estudiantes el mensaje de que sólo aquellas asignaturas de las que tenían que

presentarse a examen eran realmente importantes, al igual que los conocimientos,

habilidades y capacidades que pudieran evaluarse con facilidad, especialmente en

una prueba por escrito. Argumentó que los exámenes filtraban sistemáticamente la

experiencia cotidiana de mucha gente joven, alejándola del curriculum. En música,

por ejemplo, el énfasis puesto en el aspecto intelectual-cognitivo de la asignatura, por

encima de la habilidad para interpretar la notación dentro de una estructura clásica,

excluía a mucha gente joven de disfrutar y de alcanzar el éxito en esta asignatura

dentro de la escuela. La valoración tradicional de la música transformaba una

asignatura potencialmente accesible en otra inaccesible y ajena para muchos

estudiantes, al resaltar sus componentes intelectual-cognitivos. Bresler (1993) ha

detectado reacciones similares entre los estudiantes de música en el conservatorio.

Las pautas tradicionales de evaluación tienden a resaltar los aspectos

intelectual-cognitivos del logro y las asignaturas en las que predominan estas formas

de logro. Sólo reconocen una fracción de las múltiples inteligencias descritas por

Gardner (1983). Al limitar de este modo el curriculum y las posibilidades de logro, las

pautas tradicionales de valoración, que dominan el sistema de evaluación de una

escuela, reducen las posibilidades de éxito y tienden a crear un curriculum

académicamente orientado, alejado de la realidad cotidiana de los estudiantes, y

desmotivador para muchos de los que podríamos calificar como «menos capaces».

El formato de elección múltiple de las pruebas estandarizadas también estimula los

procesos de reconocimiento y memoria de bajo nivel, en lugar de procesos de pensa-

miento desde las estrategias.

En un estudio nacional sobre los usos y percepciones de las pruebas

educativas realizado entre directores y profesores en Estados Unidos, Hermán y

Dorr-Bremme (1984) descubrieron que el aumento de las pruebas tenía como

consecuencia un mayor énfasis en las habilidades básicas de la enseñanza. Al

parecer, las habilidades básicas consumían más tiempo y más recursos educativos,

sobre todo en aquellas escuelas con estudiantes procedentes de ambientes

socioeconómicos más pobres. En este contexto, recibían menos atención las

asignaturas que resultaban más difíciles de valorar mediante pruebas escritas, como

los estudios de carácter social (Rimmington, 1977).

Allí donde imperan las pautas tradicionales de evaluación, resulta improbable

que los objetivos del curriculum y de la enseñanza se logren en su totalidad, y es

muy posible que los estudiantes se vean expuestos a un curriculum desmotivador,

académicamente orientado y alejado de su experiencia, precisamente cuando se

encuentran en un momento vital de su desarrollo.

Efectos sobre el profesor

Los efectos que la evaluación tradicional tienen sobre el profesor han sido

extensamente documentados en el Reino Unido, donde los exámenes públicos

constituyen una característica importante del sistema educativo. Se ha afirmado que

los efectos de tales exámenes sobre el profesor son abrumadoramente negativos

(Mortimore y Mortimore, 1984). En una encuesta efectuada por el servicio de

Inspección de Su Majestad entre escuelas secundarias (1979), pudo constatarse que

el trabajo abordado en el aula se veía limitado a menudo por la importancia otorgada

al programa para el examen, es decir, a aquellos temas que se pensaba serían

elegidos por el examinador.

Este estilo dominante de enseñanza, observó la inspección «carecía de

sentido crítico, resultaba poco estimulante y presentaba serias deficiencias». En su

estudio sobre los alumnos que abandonaban la escuela superior en Escocia, Gray y

sus colaboradores (1983) llegaron también a la conclusión de que los métodos

tradicionales de enseñanza predominaban en los recuerdos que tenían muchos

estudiantes de su paso por la escuela. Gray et al. escribieron: «se puede inferir de

todo ello que el hecho de estudiar para aprender entró en conflicto con la tónica

general de estudiar para aprobar los exámenes».

Las pautas tradicionales de evaluación también pueden frenar los intentos de

innovación en el aula. En distintos estudios llevados a cabo por el Proyecto de

Ciencia Integrada del Consejo Escolar, en Gran Bretaña, tanto Olson (1982) como

Weston (1979) descubrieron que los profesores no se atenían a las guías del

proyecto y persistían en enseñar desde la pizarra, invitando a los estudiantes al

repaso, prácticas éstas que los profesores atribuían a las limitaciones impuestas por

los exámenes. Las evaluaciones sobre el método utilizado para poner en práctica los

nuevos programas de matemáticas en las escuelas elementales de California

mostraron efectos similares. A los profesores les resultaba difícil acometer de forma

adecuada los proyectos que recomendaban un enfoque de solución de problemas en

el estudio de las matemáticas, puesto que el rendimiento matemático de sus

estudiantes seguía valorándose mediante pruebas estandarizadas que premiaban las

habilidades básicas (Darling-Hammond, 1990).

Los profesores no siempre se muestran reacios a atenerse a las condiciones

impuestas por los exámenes y las pruebas estandarizadas. Muchos de ellos acogen

los exámenes con entusiasmo, al considerarlos un recurso clave para motivar a sus

estudiantes en un periodo en el que, de otro modo, ese entusiasmo brillaría por su

ausencia (Sikes, Measor y Woods, 1985). En una profesión en la que son constantes

las dudas de los profesores sobre la consecución de sus objetivos, las puntuaciones

favorables de las pruebas estandarizadas les proporcionan una cierta tranquilidad

respecto a la efectividad de su trabajo.

Los efectos de las evaluaciones tradicionales sobre los profesores no siempre

pueden calificarse de positivos o negativos. En un estudio interesante y detallado

realizado por Hammersley y Scarth (1986), se plantearon algunas cuestiones

polémicas relativas a los efectos supuestamente negativos de los exámenes públicos

sobre la enseñanza y el aprendizaje. Los autores compararon programas sometidos

a evaluación y programas no sometidos a evaluación, utilizados por diferentes

profesores. También recogieron las diferencias observadas en los mismos profesores

al enseñar programas diferentes, algunos de los cuales serían preguntados en

examen y otros no. En consecuencia, pudieron estudiar las variaciones en la

enseñanza causadas tanto por el profesor, como por la categoría del programa, que

venía determinado por la existencia de un examen posterior. Los investigadores no

descubrieron variación significativa en las pautas de enseñanza entre los cursos

examinados y los no examinados. No obstante, una lectura atenta del estudio revela

que el baremo que escogieron para calcular los efectos de la enseñanza fue la

cantidad y proporción de charla introductoria utilizada por el profesor. Cabe

argumentar que éste es un criterio inapropiado o insuficiente para hacer distinciones

entre los diversos estilos de enseñanza. Otros criterios pueden dar resultados

diferentes, como el número de estudiantes que componen el grupo de trabajo o

debate.

Para algunos profesores, los exámenes son una imposición, mientras que

para otros, una oportunidad. Para la mayoría, sin embargo, simplemente están ahí,

son un «hecho» que se da por sentado, y hacia el que orientan invariablemente su

enseñanza (Scarth, 1987). Lo mismo cabría decir de la actitud de los profesores

norteamericanos con respecto a la calificación y Tas pruebas a las que someten a

sus alumnos, especialmente cuando son ellos mismos los que establecen tales

evaluaciones. En una encuesta realizada entre profesores de Dakota del Sur,

Gullickson (1982) encontró que el 82% de los profesores elementales y el 99% de los

profesores de secundaria se apoyaban en algún tipo de examen, y la mayoría de

ellos efectuaban pruebas por lo menos una vez a la semana (95%) o cada quince

días (98%). Stiggins (1988) reveló que los profesores dedicaban habitual-mente una

tercera parte, o incluso más, de su tiempo profesional a actividades relacionadas con

la evaluación. Las pruebas constituyen una parte significativa de la cultura escolar.

Para la mitad de los profesores encuestados en el estudio de Gullickson (1984),

estas pruebas aportaban la base fundamental para la calificación de los estudiantes.

Hermán y Dorr-Bremme (1984) descubrieron que un estudiante medio de grado 10

ocupa aproximadamente una octava parte del tiempo empleado en aprender inglés y

matemáticas realizando pruebas. Traub y Nagy (1988) descubrieron que, en una

selección de varias clases de grado 13 en Ontario, Canadá, el 12% del tiempo de

clase dedicado al estudio del cálculo se empleaba en realizar pruebas. Las

investigaciones de Gullickson (1982) y la de Hermán y Dorr-Bremme (1984)

plantearon cuestiones importantes acerca de la calidad de las pruebas efectuadas

por el profesor y sus implicaciones negativas para la enseñanza y el aprendizaje (que

fueron respaldadas por Stiggins, 1988; Crooks, 1988; Wilson, 1989). Se descubrió

que las pruebas presentadas por el profesor:

Prefieren la respuesta breve y los elementos concordantes.

Raras veces son exámenes en los que los alumnos tengan que hacer algún

comentario o expresar una opinión.

Exigen principalmente de los estudiantes que recuerden datos y términos.

Raras veces obligan a los estudiantes a interpretar o aplicar sus

conocimientos.

Se limitan a constatar una comprensión cognitiva de bajo nivel.

No son mejoradas con regularidad por los profesores de una forma sistemática

que sea producto de un análisis llevado a cabo sobre la calidad de los temas.

Son a menudo ilegibles o no asignan directrices claras.

Es obvio que muchas de las críticas comúnmente planteadas a los exámenes

en lo que concierne a sus efectos sobre el profesor y a la calidad de la enseñanza

ofrecida al estudiante son igualmente atribuibles a las pruebas y calificaciones

hechas en el aula. La supresión de los exámenes o de las pruebas estandarizadas

no supone una panacea para la reforma de la evaluación.

La amplia revisión de Crooks (1988) sobre el impacto que tienen en el

estudiante las prácticas de evaluación realizadas dentro del aula llama la atención

sobre la falta de formación formal de los profesores en técnicas de valoración

educativa, y sobre el riesgo de que, al no seguir importantes procedimientos de

evaluación, esos mismos profesores puedan elaborar informes poco fiables y no

válidos para los estudiantes (temores compartidos por Stiggins y Bridgeford, 1985).

La realización de pruebas y las calificaciones, ya sea un instrumento ideado

por el profesor, o impuesto externamente por el sistema, se hallan profundamente

enraizadas en la cultura de nuestras escuelas y ejercen una poderosa influencia

sobre los profesores y su concepción de la enseñanza. Está claro que la práctica

tradicional de las pruebas y calificaciones tienen en la actualidad demasiado peso

dentro de la estructura general de valoración del estudiante, y que el objetivo de

proporcionar un ambiente de aprendizaje más apropiado para las necesidades de los

preadolescentes se alcanzará con mucha mayor efectividad mediante el desarrollo

de unas estructuras de valoración más amplias, flexibles y equilibradas.

Efectos sobre el estudiante

El Informe del Consejo de Educación Británico de 1911 argumentó que los

exámenes recompensaban la reproducción del conocimiento, provocaban la

pasividad de la mente y estimulaban el espíritu competitivo entre los estudiantes. En

Estados Unidos, Bloom (1970) sugirió que, en su deseo de superar los sistemas

tradicionales de evaluación, los estudiantes se limitaban a «empollar» y memorizar.

Muchos autores han afirmado que los tipos tradicionales de valoración, ya sea en

forma de pruebas o exámenes, no fomentan la capacidad crítica ni la independencia

de pensamiento que las instituciones de enseñanza superior pretenden inculcar a

sus estudiantes (Makins, 1977; Entwistle, 1981). Existe, pues, el peligro de que las

formas tradicionales de evaluación generen en los estudiantes una actitud cínica,

calculadora e instrumental con respecto a su aprendizaje. Deutsch (1979) observa

que los sistemas de evaluación explícita pueden conducir a algunos estudiantes a

limitar su esfuerzo a conseguir estrictamente aquello que va a ser valorado. Los estu-

diantes conscientes de sus logros pueden llegar incluso a influir sobre sus

profesores, haciéndoles regresar a terreno más seguro cuando sus digresiones y

especulaciones parezcan desviar a los estudiantes de su objetivo centrado en los

exámenes (Atkinson y Delamont, 1977; Turner, 1983).

Uno de los efectos más destacados que producen los exámenes en los

estudiantes, más incluso que las pruebas, es la ansiedad. Ésta puede variar,

dependiendo del estudiante. Algunos experimentan una ligera ansiedad que incluso

los estimula a ser más competitivos y a rendir mejor (Ligón, 1983). Otros, sin

embargo, sufren un alto nivel de ansiedad que puede llegar a debilitarles (Sarason,

1983). Así pues, la ansiedad puede ser una ayuda o un obstáculo para que los estu-

diantes demuestren su verdadero nivel de habilidades. El temor al fracaso es un

factor clave a la hora de analizar la ansiedad producida por las pruebas de

evaluación. El verdadero fracaso puede tener efectos nocivos sobre el concepto que

de sí mismo y de su propia valía tiene el estudiante (Mortimore y Mortimore, 1984),

que se traducen en un alto índice de alumnos que abandonan los estudios,

problemas de disciplina y una disminución de la autoestima (Ratsoy, 1983).

Las pruebas y los exámenes también ejercen su influencia sobre la motivación

y los hábitos de aprendizaje. Los estudiantes pueden sentirse motivados a estudiar

para los exámenes y las pruebas, puesto que serán recompensados con buenas

notas y calificaciones. No obstante, los casos recogidos en los estudios sobre el

impacto de las pruebas estandarizadas sugieren que la motivación provocada por

tales pruebas varía según la capacidad del estudiante. Parece existir una relación

curvilineal entre el rendimiento del estudiante y los niveles o estándares de un curso.

Mientras los estudiantes de mayor capacidad encuentran un desafío en las

asignaturas de estándares elevados, los de menor capacidad pueden llegar a

rendirse (Natriello, 1987). Además, el valor motivador de los títulos como poder de

retención que ejerce la escuela sobre sus estudiantes varía con relación a las

oportunidades del mercado laboral. Allí donde se encuentra trabajo con relativa

facilidad, sin necesidad de títulos, o allí donde es tan escaso que cualquier titulación

carece de valor (Hargreaves, 1989), disminuye el efecto motivador extrínseco de los

títulos. Además, la tendencia generalizada que obliga a un promedio cada vez mayor

de estudiantes a presentarse a exámenes, hace que aumente el número de aquellos

que ingresan en programas de alto nivel académico, lo cual, con el transcurso del

tiempo, puede resultar desmoralizador y desmotivador (Gray et al., 1983). Además,

deberíamos preguntarnos qué motiva realmente a los estudiantes. Si las formas

tradicionales de evaluación recompensan la aceptación pasiva del conocimiento pre-

valeciente, entonces los estudiantes se verán motivados a convertirse en receptores

pasivos en el proceso de aprendizaje, y se inclinarán a valorar las habilidades

cognitivas por encima de las demás.

Esto plantea algunas cuestiones importantes relativas a valores y objetivos. Se

ha observado que las pruebas y las calificaciones que recompensan «la excelencia»

ayudan a los estudiantes a establecer expectativas «realistas» (Ebel, 1980) y los

preparan para una sociedad competitiva (Simón, 1972). Muchas personas valoran

estos objetivos y consideran apropiado que las pautas tradicionales de evaluación les

estimulen a cumplirlos. Pero, tal y como hemos sugerido con anterioridad, es

importante que nuestras prácticas de evaluación se hallen en consonancia con los

objetivos educativos más amplios que proponemos para los preadolescentes en

particular, y para la escolarización en general. Los resultados obtenidos siguiendo

pautas tradicionales de evaluación parecen discrepar con respecto a tales objetivos.

Al contrario de lo que podría parecer, las pautas tradicionales de evaluación parecen

afectar a los estudiantes al:

Fomentar un enfoque instrumental con respecto al aprendizaje, particularmente entre los estudiantes de alto rendimiento.

Crear una sensación de ansiedad en los estudiantes, especialmente entre los de menor rendimiento, sobre todo dentro de un contexto de exámenes y pruebas «finales».

Frustran y desmotivan a los estudiantes de menor capacidad.

Promueven cualidades tales como la competitividad individual, que mantienen una relación más que cuestionable con objetivos educativos más amplios.

Técnicas tradicionales de evaluación y el propósito de ésta

¿Hasta qué punto satisfacen las pautas tradicionales de evaluación los

diferentes propósitos de la misma?

Responsabilidad

Generalmente, las pautas tradicionales satisfacen las exigencias de

responsabilidad, puesto que las notas y puntuaciones derivadas de las pruebas y

exámenes permiten establecer comparaciones entre estudiantes, escuelas y

sistemas. Estas demostraciones de responsabilidad han sido abordadas a través de

comparaciones internacionales de los logros estudiantiles obtenidos en asignaturas

como ciencias y matemáticas. Tales comparaciones han impulsado y justificado el

establecimiento de nuevos y ambiciosos objetivos nacionales para la educación, en

muchos países que se ven a sí mismos, basándose en las cifras, académicamente

deficientes, lo que los convierte a su vez en deficientes competidores económicos a

un plano internacional. Uno de los recientemente creados Objetivos Educativos

Nacionales de Estados Unidos, por ejemplo, proclama que, para el año 2000,

«Estados Unidos será el primer país del mundo en logros matemáticos y científicos».

Los suecos, por su parte, aspiran a ser, simplemente, ¡los mejores de Europa! Las

comparaciones de pruebas internacionales, sin embargo, no suelen establecerse

entre países de características similares. Un país puede verse impulsado, por

cuestiones de equidad, a incluir el estudio de las ciencias y las matemáticas en el

programa general de aprendizaje impartido a un gran número de estudiantes en los

últimos años de escolarización. Otro quizá sólo induzca a una minoría selecta a

estudiar estas asignaturas (Barlow y Robertson, 1994). Por tanto, el principio de res-

ponsabilidad contenido en dichas comparaciones es a menudo más simbólico que

real.

Las puntuaciones de las pruebas también han servido para dar cumplimiento a

propósitos que determinan el grado de responsabilidad, al comparar el logro de las

escuelas, de modo más controvertido mediante concursos de rendimiento, que

facilitan la labor de clasificación de los mismos dentro de un distrito o incluso de toda

una nación, como criterio para la elección de centro escolar por parte de los padres.

Esta pauta de responsabilidad ha sido seguida en varios lugares, como Australia,

Inglaterra y Gales. Aunque esta práctica de comparar escuelas de acuerdo a los

resultados obtenidos en pruebas estandarizadas o exámenes no tiene en cuenta la

inmensa variedad de estudiantes que acogen dichas escuelas. Esta comparación

desigual no sólo resulta profundamente injusta, sino que además, según demuestra

un estudio de Glatter (1994) sobre algunas escuelas de Inglaterra que ocupan

lugares diferentes en las ligas de competición por resultados, los efectos de éstos

pueden ser devastadores para la moral del profesor. Por ejemplo, los profesores que

mantienen un sólido compromiso con las escuelas, por ingrato que resulte su trabajo

en las de los grandes vecindarios socialmente bendecidos del estado de bienestar,

siguen quedando los últimos en los concursos, donde sus esfuerzos se ven pública y

vergonzosamente calificados de abyectos fracasos, en comparación con las escuelas

de altos standing situadas en comunidades más socialmente favorecidas.

En respuesta a las críticas dirigidas contra estos burdos concursos, se ha

intentado satisfacer las exigencias de responsabilidad mediante la creación de

medidas de «valor añadido» con respecto al rendimiento escolar. En estos casos se

utilizan los datos de las pruebas estandarizadas para establecer baremos básicos de

rendimiento escolar, con la esperanza de que las escuelas los mejoren con el trans-

curso del tiempo. Esta práctica compara a las escuelas con su propio rendimiento, en

lugar de hacerlo con el de los demás, y las estimula a mantener el compromiso de

lograr una mejora constante. En algunos casos, las recompensas, como los fondos

adicionales, son asignadas a escuelas que hayan mejorado su record, mientras que

las sanciones o castigos se aplican a las escuelas cuyo record no haya sido

mejorado o que incluso haya empeorado. Según la Ley de la Reforma Educativa de

Kentucky, por ejemplo, las escuelas de esta última categoría deben contar con un

«educador eminente», cuya tarea consiste en «darle la vuelta a la escuela» en

menos de dos años, identificando dónde están los fallos y poniendo en práctica

soluciones apropiadas. El poder de estos educadores eminentes es inmenso e

incluye la destitución del director si lo consideran oportuno (Guskey, 1994).

A pesar de las ventajas que aportan las medidas de valor añadido para

estimular a las escuelas a hacer un seguimiento de su propio rendimiento a lo largo

del tiempo, la vinculación de recompensas y sanciones con el rendimiento otorga a la

evaluación una importancia tan excepcional que las escuelas pueden verse inducidas

a falsificar datos, relajando intencionadamente los baremos básicos (para facilitar así

posteriores «mejoras»), enseñar atendiendo únicamente a aquellos aspectos que

puedan garantizar una buena calificación en las pruebas, etcétera, con objeto de

evitar los resultados negativos y las consecuencias punitivas. También surgen graves

dificultades al comparar los cocientes de mejoría basados en la escuela, sin haber

ajustado antes sus puntuaciones mediante la inclusión de medidas que permitan

comparar «semejantes entre sí» (Sammons, 1993).

A pesar de todos los problemas que rodean las evaluaciones de valor añadido

y estandarizadas de cualquier otro tipo, está claro que las demandas de

responsabilidad pública son tan grandes que conducirán a su utilización continuada y

aumentada en los próximos años.

Titulación

El segundo gran propósito de la evaluación es proporcionar a los estudiantes

un registro de sus logros educativos al abandonar la escuela. Los mayores

consumidores de estos certificados han sido, tradicionalmente, las instituciones de

educación superior y las empresas.

Los estudios realizados en Canadá han puesto de relieve que las

calificaciones del grado 13 guardan una clara conexión con las obtenidas durante el

primer año en la universidad (Traub et al., 1977), y que las universidades siguen

teniendo en cuenta las notas de los candidatos a la hora de admitir sus solicitudes de

ingreso (McLean, 1985). A pesar de todo, incluso en las universidades, empieza a

observarse una tendencia a alejarse de las notas para acercarse a una evaluación

más holística de los estudiantes (por ejemplo, a menudo se solicita información sobre

los logros extracurriculares de los estudiantes, que debe acompañar a la solicitud

enviada a una institución de educación superior).

De modo similar, los empresarios se muestran a menudo más interesados en

las cualidades personales, como entrega y responsabilidad, que en las notas

obtenidas en la escuela secundaria (Broadfoot, 1986; McLean, 1985). Son muchos

los que tienen la impresión de que las calificaciones de la escuela secundaria no dan

indicación alguna sobre el compromiso de los estudiantes con el trabajo, y se quejan

de que «la mayoría de los graduados no tienen sentido común... y lo único que saben

es lo que han memorizado de un libro» (McLean, 1985). El Consejo Corporativo de

Educación Canadiense, por ejemplo, describe «la combinación de habilidades,

actitudes y comportamientos necesarios para conseguir, mantenerse y progresar en

un puesto de trabajo y lograr los mejores resultados», entre los que se incluyen los

siguientes:

Autoestima y seguridad en uno mismo.

Honestidad, integridad y ética personal.

Una actitud positiva hacia el aprendizaje, el desarrollo y la salud personal.

Iniciativa, energía y persistencia en la realización del trabajo.

Capacidad para establecer objetivos y prioridades en el trabajo y en la vida

personal,

Capacidad para planificar y repartir el tiempo, el dinero y otros recursos para

conseguir cumplir los objetivos.

Responsabilidad sobre las acciones emprendidas.

Actitud positiva ante el cambio.

Reconocimiento y respeto de la diversidad y diferencias individuales.

Capacidad para elaborar y sugerir nuevas ideas en la realización del trabajo:

creatividad.

Y entre «las habilidades necesarias para colaborar con los demás en el puesto de

trabajo y lograr los mejores resultados», se incluyen la habilidades para:

Comprender y contribuir a lograr los objetivos de la organización.

Comprender la cultura del grupo y trabajar de acuerdo a ella.

Planificar y tomar decisiones con los demás, y apoyar los resultados.

Respetar las ideas y opiniones de los otros miembros del grupo.

Mantener una actitud de «toma y daca» para lograr los objetivos del grupo.

Buscar un enfoque de equipo apropiado.

Tomar el mando cuando sea necesario, movilizar al grupo para alcanzar un

rendimiento superior (Conference Board of Canadá, 1991).

Los empresarios que otorgan una especial importancia a las calificaciones

suelen ser aquellos que necesitan trabajadores para realizar tareas que guardan

cierta relación con los conocimientos adquiridos en la escuela, como bancos, cajas

de ahorro y compañías de seguros. En consecuencia, el propósito de la titulación

sólo se cumple parcialmente en las actuales prácticas de evaluación.

Tal y como hemos demostrado en nuestro análisis del capítulo 5, parece

aumentar la demanda de titulaciones que reflejen logros o resultados personales y

sociales, además de cognitivos, que las actuales prácticas de valoración no

contemplan.

Diagnóstico

Las pruebas y exámenes estandarizados que expresan principalmente

estimaciones finales, en lugar de identificar aspectos concretos que puedan requerir

ayuda, no son instrumentos válidos a la hora de dar un diagnóstico. Las pruebas

preparadas por los profesores son más útiles para diagnosticar las necesidades de

habilidades básicas e identificar las lagunas y deficiencias que se producen en el

aprendizaje cognitivo real de bajo nivel (Crooks, 1988; Stiggins et al., 1989). Pero

como quiera que raramente se centran en el razonamiento cognitivo superior, estas

pruebas no suelen ser útiles a la hora de aplicar el concepto de diagnóstico a estos

ámbitos del aprendizaje. Es más, puesto que las pruebas sólo se hallan, en el mejor

de los casos, débilmente relacionadas con las tareas del aula, el suspenso que pue-

dan indicar significa un suspenso en la prueba, no en la tarea (Natriello, 1987).

Motivación

La motivación se puede intensificar aplicando el principio del «palo y la

zanahoria» a las pruebas o exámenes cuando se trata de estudiantes de alto

rendimiento. Los estudiantes de bajo rendimiento, sin embargo, tienden a mostrar

una falta de motivación debido al estrés que les produce la prueba o examen, y un

programa excesivamente difícil o desequilibrado, de claro enfoque académico.

Broadfoot (1979) sintetiza del siguiente modo los errores en los que han incurrido las

pautas tradicionales de evaluación en lo que respecta a la motivación:

En nuestra sociedad... elegimos valorar, principalmente la habilidad académica.

No elegimos valorar de modo formal alguno las cualidades no cognitivas: el

esfuerzo, la cooperación, el liderazgo, la responsabilidad o la experiencia útil en

actividades extracurriculares, como la participación en obras teatrales de la

escuela, las unidades de servicio social, actividades al aire libre o grupos de

debate... Puesto que la evaluación de tales actividades y habilidades no forma

parte del sistema formal de evaluación, cuya influencia llega incluso hasta el

sistema de evaluación informal, resulta que estas actividades no proporcionan una

fuente alternativa de motivación o de autoevaluación a los alumnos. En

consecuencia, se descuida una fuente potencial de motivación para alumnos no

académicos y un mecanismo potencial que podría ayudar al desarrollo de muchas

cualidades personales que la mayoría de nosotros consideraríamos deseables en

los miembros futuros de la sociedad.

Una solución al problema de la motivación causado por la infravaloración de

los logros no académicos en el sentido convencional, sería por tanto valorarlos. Este

capítulo se centra ahora en el tema de la evaluación, el reconocimiento y la

recompensa del logro del estudiante, más allá del ámbito cognitivo-intelectual,

mediante el análisis de los enfoques alternativos a la evaluación convencional y sus

implicaciones. Esta revisión de la evaluación alternativa también mostrará cómo

estamos aprendiendo a reconocer logros «cognitivos» más convencionales de un

modo más «auténtico» y efectivo.