viernes, 19 de julio de 2024

Evaluación. Pruebas.

Memoria. Escala RIAS. Test de memoria no verbal (MnV).

Entre los recursos de evaluación de la inteligencia y los procesos cognitivos se encuentra la Escala de Inteligencia de Reynolds (1), y dentro de ella disponemos de dos pruebas para la evaluación de la memoria. En esta entrada hablaré del test de memoria no verbal (RIAS-MnV).

Lo que sigue no pretende sustituir la información disponible en la red, incluyendo el [informe] que elaboró en su momento el Consejo General de Colegios Oficiales de Psicólogos, cuya lectura te recomiendo para una mejor comprensión de las características de RIAS. Evidentemente, también es muy recomendable la lectura de su manual técnico ([aquí un extracto], aunque si tienes oportunidad de acceder al manual completo, mucho mejor). 

En esta entrada mi objetivo no es explicar el uso estándar del test de memoria no verbal, ya que para eso ya está toda la información que proporcionan las fuentes antes citadas y, mejor aun, los materiales originales del test que comercializa la editorial [TEA ediciones]

Lo que yo pretendo es, por decirlo de algún modo, investigar sobre cuestiones que son de interés para un uso "reformulado" de este instrumento de evaluación. Pero para ello es necesario analizar el propio test.

El test RIAS-MnV consta de 44 ítem, aunque la puntuación máxima (PD) que se puede obtener es de 88 pts (más abajo veremos el motivo). Como el resto de los test RIAS, se plantean puntos de inicio en función de la edad del sujeto, así como criterios de retorno y de finalización. Por muy necesario que sean todos ellos, no deja de ser un inconveniente para el manejo funcional de la prueba. Personalmente considero que, aunque aunque es prescriptivo seguir el procedimiento establecido (de ello de depende la validez de los resultados) caben otras opciones complementarias (no sustitutivas) de utilizar la prueba. Estas opciones, que son varias, deberán ajustarse y estar justificadas por los objetivos que nos planteemos en la evaluación (2).

Teóricamente podríamos aplicar RIAS-MnV a partir de los tres años, pero personalmente lo considero poco adecuado para estas edades y, salvo excepciones, no soy partidario de utilizarlo antes de los seis (ítem de inicio 13). No obstante, sí es interesante el análisis de los resultados esperados para todas las edades, incluidos los tramos inferiores.

Cada estímulo se presenta al alumno durante 5", tiempo en principio suficiente para los ítem más sencillos, pero es dudoso que lo sea para los más complejos o para alumnos con algún tipo de dificultad atencional y/o de velocidad de procesamiento. Esta duración (invariable) del tiempo de exposición del estímulo puede ser (3) la causa del fracaso conforme se avanza en la prueba, por lo que me genera dudas como test de evaluación de la memoria en sentido estricto (4).

Decía antes que cada ítem recibe dos puntos (5), cuando el sujeto responde correctamente en el primer intento (dentro de los 20"), aunque también puede obtener un punto, lo que suponen dar una segunda oportunidad  en caso de fracaso en la primera (en este caso el tiempo disponible es de 10"), pero no en caso de omitir la respuesta transcurridos los 20". Esto dificulta es estudio de los baremos de corrección para el análisis de los resultados normativos en función del ítem, pero también incrementa las dudas sobre el propio test como prueba de memoria al intervenir de nuevo variables perceptivo-atencional y, ahora además, también de estrategias de respuesta (6).

Igual que existen ítem de inicio en función de edades, en cuanto a la puntuación, los baremos están especificados para periodos invariables de 4 meses, a partir de los 3:00-3:03 años. Estos cortos intervalos en edades tempranas intentan ofrecer estimaciones precisas en función del criterio edad, pero los datos empíricos de las puntuaciones no parece justificar estos intervalos tan breves, especialmente a partir de la edad de 7:00 años, si bien los datos sí parecen indicar que son pertinentes para edades tempranas, justamente aquellas en las que es dudoso que el uso del test sea pertinente. Posiblemente intervalos de edad más amplios (¿6 meses?) en las edades superiores aportarían la misma información evolutiva, simplificando el procedimiento de puntuación de la prueba.

Lo que más me interesa es contribuir al análisis del test desde la perspectiva de la evaluación centrada en el conocimiento de la causalidad de las dificultades de aprendizaje. Esto no supone renunciar al modelo normativo (del que se debe partir, repito) pero éste sólo permite el rendimiento del sujeto en relación al grupo normativo (7).

Desde esa perspectiva, en primer lugar categorizo este test como de input visual (frente a input verbal), de estímulos discretos (estímulo único) y de memoria a corto plazo (8). Los contrastes y comparaciones con otras dimensiones de la memoria requieren aplicar otras pruebas, pero esta primera categorización nos facilita tomar decisiones sobre el uso de este test en función de que lo que deseamos conocer (evaluar) se ajusta con lo que el test nos aporta. Más aun si tenemos en cuenta lo que no se explica en la documentación consultada, pero que  sí considero relevante para un uso estratégico del test: me refiero al análisis cualitativo de los estímulos y su  análisis como complemento del que deriva de los resultados normativos.

Como test referido a norma, se espera de RIAS-MnV, además valores adecuados de fiabilidad y validez, el cumplimiento estricto de los criterios normativos: que los valores Moda, Mediana y Media sean coincidentes y que la distribución de las frecuencias se ajuste a la curva normal (campana de Gaus), con lo que conlleva de ajuste entre puntuaciones y frecuencias, así como que los ítem estén debidamente ordenados en función de su índice de dificultad.

Bajo esos supuestos podemos considerar fiables los valores Promedio y Desviación típica, lo que permite el cálculo de la puntuación típica y su conversión a puntuación tipificada, tanto la que se usa en los baremos de la prueba, como en otras escalas, lo que nos permitirá establecer comparaciones con otras pruebas que se expresan en otras escalas (9), facilitando así la correcta definición de perfiles aptitudinales.

El supuesto de posicionamiento de los ítem según nivel de dificultad facilita el análisis de los mismos, tanto en términos cuantitativos como cualitativos, definiendo así niveles competenciales esperados en función de la edad del sujeto y las características de los ítem.

En esta línea, el análisis de los materiales que aporta RIAS-MnV nos permiten identificar cuatro categorías de ítem, las cuales, además de informar sobre qué criterio se emplea en la prueba para aumentar la varianza, responde al proceso evolutivo de la capacidad de memoria no verbal a corto plazo. En este sentido, se aprecia un incremento de la dificultad que responde adecuadamente al recorrido etario de la prueba, aunque no en todos los intervalos de edad parece justificado establecer baremos específicos (10). Esas categorías pueden definirse en función del estímulo y diferenciarse al menos en dos niveles de dificultad teórica, correspondiendo...

  • al nivel básico los estímulos más simples, bien de tipo "dibujo" (Categoría 1) o bien de figuras geométricas (Categoría 2) unitarias o en combinaciones simples.
  • y nivel superior, formado por estímulos más complejos, bien por el número de figuras y sus combinaciones (Categoría 3), bien por presentar combinaciones de elementos simples pero numéricamente elevados (Categoría 4).

Este gráfico muestra (en porcentajes) el peso de cada categoría respecto al total; pudiendo observar cierto equilibrio entre los dos niveles de dificultad teórica (primero - 41%, segundo - 59%), aunque con predominio del nivel 2 y en cuanto a categorías, la Categoría 3 (amarillo en el gráfico) destaca sobre el resto (31,82% del total).

Muestro en las imágenes que siguen un ejemplo de cada categoría y analizo su presencia en el test, teniendo en cuenta su posición en el listado de ítem, en el que se posicionan en bloque compacto, sólo roto por la presencia de dos elementos de la categoría 3.

Categoría 1. 

Los ítem que forman parte de esta categoría (8), teóricamente los de menor índice de dificultad representan el 18,2% del total y se posicionan al inicio de la prueba (ítem 2-9), con bajo nivel de discontinuidad, salvo uno de ellos (el 20) que, por su posición, se puede considerar deslocalizado.

Esta categoría nutre el nivel bajo de rendimiento (< T 40) en todos los grupos etarios a partir del intervalo 3:8-3:11, por lo que no se puede considerar relevante para explicar la varianza, pero puede ser relevante para la detección de dificultades significativas de memoria a corto plazo. 

Categoría 2.

Los ítem que forman esta categoría (10) suponen el 22,7% del total, se presentan predominantemente en la primera parte del test, pero no de forma continua (como sí lo hacen los de la categoría 1), sino  interpolados con los de la categoría 1 y, más frecuentemente con los de la categoría 3.

Este conjunto de ítem resulta relevante para niveles medios de rendimiento hasta 4:11 años y mantienen cierto peso en este mismo nivel intermedio de rendimiento hasta los 6:11 años. Para edades superiores es de suponer que lo son para niveles bajos de rendimiento.

Categoría 3.

Como dije antes son los más numerosos (14) y representan cerca del 32% del total. Su posicionamiento en la prueba es similar a los de la categoría 2, con la que se intercalan, aunque tienden a una mayor continuidad en las posiciones intermedias del recorrido de los ítem. También dos de ellos se encuentran deslocalizados en posiciones finales, dentro del bloque de la categoría 4.

Esta categoría tiene un papel similar a la anterior en cuanto al nivel de rendimiento que parece definir y las edades, aunque presenta mayor centralidad, por lo que, al contrario de la categoría 2, conserva esta posición clave para el nivel medio de rendimiento en edades superiores hasta los 8:11 años, edad a partir de la cual se posiciona, junto con las inferiores, como relevante para identificar niveles bajos de rendimiento. 

Categoría 4.


Son sin duda los de mayor nivel de complejidad como estímulos y se puede presumir que también de mayor nivel de dificultad, dado su posicionamiento en la serie de ítem (a partir del elemento 31) y en bloque, salvo la intrusión de dos elementos de la categoría 2.

La categoría 4 es determinante como indicador de niveles de rendimiento superiores a partir de los 5:11 años, edad en la que pasa a formar parte de puntuaciones teóricas de nivel medio, manteniendo esta función hasta agotar los grupos etarios analizados (4:11 a 12:11) 

Estos análisis que preceden son de carácter teórico-hipotético, por lo que deberán ser contrastados a nivel empírico, Su interés es facilitar la elaboración de perfiles de rendimiento en función del tipo de ítem, los cuales pueden ser útiles para entender las diferencias entre los resultados esperados y los que obtiene un alumno.

Pero no son los únicos que podemos realizar. Propongo a continuación otro tipo de análisis complementario, esta vez basado en el posible significado psicológico de las puntuaciones. Sabemos que en RIAS-MnV un ítem puede recibir tres puntuaciones: 2, 1 ó 0, y que esto afecta al recorrido de ítem que realice hasta alcanzar el criterio de finalización. Este análisis toma en cuenta la incidencia de los factores perceptivo-atencionales en los procesos mnésicos que teóricamente evalúa esta prueba, dado que aquellos son indisociables de éstos.

Entonces cabe la posibilidad de comparar el perfil de resultados teóricos (dos puntos por ítem) con el real, ya que el test no distingue entre un sujeto que obtiene 20 puntos y resuelve correctamente 10 ítem, que quien obtiene la misma puntuación pero resuelve 20 ítem con 20 fallos en primera opción, pero 20 aciertos en la segunda (11).

Lo que propongo es comparar la puntuación real (la que determina el valor T que obtiene el sujeto), con la que obtendría bien por eliminación de los ítem que puntúa 1 o por incremento a puntuación 2 de cada uno de esos ítem (12), ambos en términos de ganancia-pérdida en puntuaciones T.

Esta diferencia (13) nos permite valorar la posible incidencia de los factores perceptivo-atencionales en los resultados del test. Debe entenderse como valor aproximado; sólo tiene sentido si existen datos procedentes de otras fuentes que indiquen una posible dificultad atencional (14) y se deben contrastar con evaluaciones específicas de las capacidades perceptivo-atencionales. Además es necesario que el perfil de respuestas del alumno cumpla determinados requisitos, como, por ejemplo, que el número de ítem con puntuación 1 alcance cierto peso porcentual en el total de ítem resueltos por el alumno (15). Por eEste peso puede tomar como referencia la comparación entre el número de ítem que resultaría de no observarse ninguna puntuación 1 y los que realmente resuelve.


NOTAS

(1) Hablaremos de la escala RIAS en otro momento, aunque por ahora me limitaré a uno de sus test, el de memoria no verbal (MnV). De momento [te dejo aquí enlace] a la información disponible sobre esta escala en TEA Ediciones, editorial especializada que la comercializa en España.
(2) Estoy pensando, por ejemplo, en la aplicación de todos los ítem inferiores al de inicio en función de la edad del sujeto, cuando nos interesa conocer el rendimiento concreto de un alumno en función de las características del ítem. La puntuación T se calculará en función de la PD que resulte de la aplicación normativa, para lo que es conveniente iniciar la prueba por el ítem normativo, evidentemente, así como cumplir el criterio de retroceso cuando sea pertinente. Esto garantiza que podamos puntuar el test según criterio normativo. La aplicación del resto se realizaría en un segundo momento. Esta es una de las opciones, pero caben otras que puedes concretar según los objetivos que te plantees.
(3) Hasta donde yo se, no hay estudios al respecto y la documentación del test no aporta datos, por ejemplo, sobre el índice de dificultad del ítem. Se echa en falta.
(4) Como es sabido, todo test de memoria evalúa necesaria y con frecuencia implícitamente (esto es: sin que se explicite ni controle su incidencia real) también las capacidades perceptivas y atencionales. En eso RIAS-MnV no es una excepción. Pero es muy probable que las características del test (incluyendo el tiempo de exposición del estímulo en relación con la dificultad perceptivo-atencional que presenta) acentúe el peso de estos factores en los resultados de la prueba. Propongo que, al menos en caso de puntuaciones inferiores a promedio (2 o 1,5 Dt por debajo de T 50, por ejemplo) sería conveniente una evaluación específica de esas variables a fin de no realizar interpretaciones erróneas en términos de déficit mnésico, cuando puede serlo de tipo perceptivo-atencional.
(5) De ahí que siendo 44 los ítem, sea 88 la puntuación máxima.
(6) Con independencia de que debemos cumplir las normas de puntuación para interpretar normativamente los resultados, este sistema de puntuación, además de complicar la aplicación de la prueba al examinador (algo que personalmente no lo veo justificado), "premia" de algún modo (y disimula también) las limitaciones perceptivo-atencional; pero lo que considero es aun más negativo en cuanto que puede incidir en la puntuación del sujeto, es que favorece la respuesta al tanteo (de forma moderada), y sobre todo, la respuesta por aproximación ("si no es éste, es este otro"). No obstante, lo que en principio puede ser un "defecto", se puede convertir en un dato interesante para analizar la incidencia de los procesos perceptivo-atencionales y/o del recurso del alumno a estrategias de "descarte". En ese caso puede ser conveniente modificar de forma específica las norma de finalización, aunque sólo con fines bien definidos, sin que repercuta en la PD del test.
(7) Y con todas las cautelas que derivan de utilizar esa referencia, incluyendo la incidencia de los estadísticos relativos al margen de error de la prueba, el significado de los intervalos de puntuación y el establecimiento de indicadores de dificultad o de alto rendimiento en términos de desviación respecto a las puntuaciones del intervalo central.
(8) Aunque se usan ambos términos de forma indistinta, la memoria de trabajo (MT) debe entenderse como la operatoria que se realiza sobre la información contenida en el almacén de memoria a corto plazo (MCP). En este sentido se podrían diferenciar al menos distintos niveles de complejidad operativa en función de lo que se requiera hacer con la información contenida en dicho almacén. RIAS-MnV exige únicamente la comparación del ítem observado como estímulo con los presentados como opciones de respuesta, lo que se puede calificar como exigencia operativa básica. El incremento en el nivel de dificultad (del cual no tenemos más que indicadores indirectos), aunque empíricamente evidente, está en función de los procesos perceptivo-atencionales, especialmente de velocidad de procesamiento perceptivo-visual (aunque no sólo). Test como dígitos (WISC) permiten comparar operaciones simples con operaciones de mayor nivel de exigencia en términos de MT: dígitos en orden directo y dígitos en orden inverso.
(9) Por ejemplo en CI, puntuación escalar o decatipo. Esto nos permite comparar niveles de rendimiento en diferentes capacidades y ámbitos del desarrollo.
(10) Con independencia del uso de los baremos para la correcta puntuación del test, a fin de obtener un resultado ajustado a norma, otros análisis (que consideremos posibles y/o necesarios) no tienen necesariamente que ajustarse a esas referencias normativas, como tampoco los criterios de puntuación del ítem y de categorización de los resultados de cuerdo con los que propone el test. Digamos que el primer análisis debe ajustarse estrictamente a norma, pero que podríamos considerar pertinente un segundo (e incluso un tercer nivel de análisis), que estaría(n) justificado(s) en función de nuestras hipótesis de trabajo y de que los propios resultados del sujeto lo permitan, que podría aportar (y esta sería su principal justificación) información cuantitativa y/o cualitativa relevante para la determinación de las necesidades educativas del alumno.
(11) Es una forma exagerada de exponer la cuestión, pero refleja de forma extrema el problema que aquí se expone.
(12) Las puntuaciones 0 podrían tener el mismo tratamiento, pero en la mayoría de los casos pueden tener un significado psicológico diferente. Personalmente con considero pertinente tratarlos del mismo modo que los ítem con puntuación 1. En todo caso, lo más prudente es observar el perfil real del sujeto y tomar decisiones respecto al modo de proceder. Esto nos lleva a una segunda cuestión que también es de interés: qué perfil de aciertos (2 ptos), aciertos parciales (1 punto) y errores (0 puntos) presenta el alumno, qué incidencia tienen los 2º y 3º en el total de ítem procesados y en qué medida se incrementan éstos respecto a lo que sería un recorrido de ejecución teóricamente ajustado a los planteamientos teóricos del test.  
(13) Que se debe interpretar en positivo o en negativo, según la opción elegida.
(14) Por ejemplo, informaciones aportadas por el profesorado u otras fuentes.
(15) Por ejemplo, este peso porcentual puede tomar como referencia la comparación entre el número de ítem que resultaría de no observarse ninguna puntuación 1 y los que realmente resuelve.

No hay comentarios:

Publicar un comentario

Comenta esta entrada