Estadística del ítem
Índice de dificultad del ítem
Empezamos esta subsección analizando el que posiblemente sea el índice relacionado con el análisis del ítem más conocido y de más uso... pero también, como anécdota, el de nombre más impreciso.
Es ciertamente anecdótico y no genera mayor dificultad por lo conocido que resulta, pero el propio nombre de índice de dificultad (ID) se opone radicalmente a su naturaleza, ya que refleja de todo lo contrario: el acierto, que no el fallo. Es por eso que también se puede denominar (ahora sí, con toda la razón) índice de facilidad (IF).
Esto es así porque lo que se calcula es el nivel de acierto de un grupo de sujetos respecto a un ítem en concreto.
Así, si 20 alumnos responde a un ítem de una prueba y 15 de ellos lo hacen correctamente (1 * 15 = 15), el IF del ítem es 0,75, o también del 75%, que de las formas se puede expresar. Curiosamente el ID no es 1-IF = 0,25, como correspondería, sino que se asimilan IF = ID y también se usa ID = 15/20.
Los valores del ID van de 0 a 1, existiendo categorizaciones del nivel de dificultad, como es el caso de [la siguiente], adaptada a partir de Cortada (1999):
| Clasificación del ítem | Índice de dificultad del ítem |
| Muy fácil | De 0,81 a 1,00 |
| Relativamente fácil | De 0,66 a 0,80 |
| Dificultad adecuada | De 0,51 a 0,65 |
| Relativamente difícil | De 0,31 a 0,50 |
| Difícil | De 0,11 a 0,30 |
| Muy difícil | De 0,00 a 0,10 |
Los ID son sensibles a las personas que responder al ítem, y a su número. Cuanto mayor sea la muestra de participantes en la baremación, más fiables son los resultados de los ID, mientras que muestras pequeñas pueden incidir en resultados de escasa fiabilidad.
Cierta es también la relación entre el nivel de dificultad de los ítem y resultados que puede obtener una muestra de sujetos: a mayores índices de dificultad, resultados más modestos, mientras que si los ítem presentan ID bajos o muy bajos, los resultados serán extraordinariamente altos. Es por ellos que los ID de los ítem deben corresponderse con el tipo de prueba que se quiere crear. Por ejemplo, para un prueba de screening es de esperar que los ítems tengan altos ID y resulten, en su conjunto, relativamente fáciles. En pruebas de selección, lo esperable es lo contrario: la mayoría de los ítem deben ser difíciles a muy difíciles.
Pero también los sujetos empleados en la baremación de la prueba influyen en los ID de los ítem que la forman. Los sujetos competentes aciertan los ítem de alto nivel de dificultad, mientras que los de bajo nivel son acertados por todos o la mayoría de los sujetos. De ahí que sea necesario controlar también el nivel de conocimiento, aptitud o competencia de los sujetos que participan en la baremación de la prueba para evitar la sobreabundancia de altos o bajos niveles competenciales que puedan afectar a los ID de los ítem realmente observados, distorsionando el resultado del uso de la prueba con sus potenciales usuarios.
Conocer los ID de los ítem, además de permitir mejorar la calidad de las pruebas, también nos permite realizar análisis más ricos de los resultados obtenidos por un sujeto o por un grupo, siempre en función del tipo de prueba empleada y de cómo esté conformada en términos de ID de sus ítem. No es lo mismo que el niño falle (o acierte) los ítem fáciles que los difíciles. El significado de esos errores (o aciertos) puede ser interpretado de forma diferente que si desconocemos su ID.
Otro uso posible de los ID, en este caso los empíricos derivados de la aplicación de la prueba a un grupo, es su referencia respecto a un criterio establecido a priori dentro de un planteamiento de evaluación criterial. Si establecemos como nivel de logro (grupal) un determinado porcentaje y el ID de un subconjunto de ítem cumple/incumple las expectativas, esto nos está informando de lo cerca/lejos que está el grupo de alcanzar la meta de aprendizaje. De aquí podemos, además, derivar análisis en términos de los resultados individuales de determinados sujetos.
En resumen, el análisis del ID/IF del ítem, a pesar de su sencillez, puede ser más complejo de lo que aparenta; pero también servir para más objetivos de los que pudiéramos pensar desde una perspectiva psicométrica estricta.
Como vimos, su cálculo es extremadamente sencillo, por lo que no existen funciones built-in en los servicios de cálculo (Excel o Calc). Para su cálculo es necesario realizar la suma de las puntuaciones del grupo en el ítem y dividir después entre el N del grupo. En consecuencia, siendo B3:B22 la lista de puntuaciones del ítem y A3:A22 el listado de alumnos de un grupo...
- E3 =SUMA(B3:B22)
- E4 =CONTARA(A3:A22)
- E5 =E3/E4
... podría ser el procedimiento se cálculo del ID en Calc.

