Medidas de tendencia central (II)
Moda
Dentro de las medidas de tendencia central, la más sencilla, pero a su vez la más segura en cuanto representación del conjunto de datos cuando las otras dos se ven alteradas por efecto de las peculiaridades de la distribución, es la moda. No obstante, no nos debemos dejar engañar por su aparente simplicidad, ya que puede resultar mucho más informativa, a costa, eso sí, de prestar atención al cumplimiento de ciertas condiciones no siempre explicitadas en la literatura, pero de relevancia para el uso práctico de este estadístico.
No voy a repetir aquí lo ya visto en la [entrada inicial] sobre esta temática, que para eso está, así que me permito ir a lo que me interesa destacar ahora. Tampoco insistiré en la sencillez con la que podemos apreciar la presencia y relevancia de este estadístico desde la simple observación de un gráfico de barras o de frecuencias. Omito también las debilidades que presenta respecto a la mediana y a la media o promedio cuando éstas son realmente representativas, especialmente cuando lo es la media.
Me interesa que nos centremos ahora exclusivamente en la moda cuando las demás de centralidad no son representativas, especialmente cuando no lo es el promedio. Podría parecer que, en ese caso, la sola posibilidad de disponer de la moda fuera suficiente, pero no lo es; no en cualquier caso, ni cuando la moda es única (distribución unimodal) ni cuando no lo es (bimodal o polimodal). En todos ellos me parece pertinente analizar lo que la moda destaca respecto al resto de las frecuencias y la posición que ocupa en el recorrido de los valores de la variable.
Empecemos por decir que para entender la distribución, no es lo mismo que moda sea una o sean varias (1), ya que cuantas más modas menos moda son; pero también es relevante (2) cuánto representa respecto al total del sumatorio de las frecuencias la distribución (mejor en porcentaje) y en qué posición del recorrido de los valores se sitúa o sitúa el o los valores identificados como moda.
Si la moda es plural puede que lo sea tanto que se pueda considera que la distribución carece de moda (amodal) o que la distribución sea también plural, especialmente que se pudieran diferenciar (con el tiempo) al menos dos distribuciones (3).
Cuanto menos destaque la moda (especialmente cuando la distribución es unimodal) del resto en términos porcentuales respecto al sumatorio de las frecuencias (4) menos moda es; cuanto más, más significado tiene para explicar la distribución en términos estáticos (cómo se presenta en estos momentos) y dinámico (en qué fase del desarrollo se encuentra el fenómeno en relación al conjunto de implicado).
Algo similar (respecto a la "madurez" del proceso) podemos decir del significado de la posición que ocupe la o las modas en el recorrido de la distribución: suponiendo una distribución unimodal, su interpretación no puede ser la misma si se ubica al inicio (en el valor mínimo o cerca de él), en la zona media del recorrido o próxima al máximo (5).
Realmente este último análisis requiere (o se beneficia al menos) del conocimiento de los valores que analizan la distribución (cuantiles) y de la mediana. Pero queda para otra entrada.
NOTAS
(1) Recuerda que disponemos en Calc de dos funciones diferentes, según sea el caso; pero es suficiente con el análisis de la tabla de frecuencias y/o del gráfico (histograma) para observar la incidencia de la moda, incluyendo esta cuestión.
(2) Y para esto no hay estadísticos.
(3) Esto puede ser más viable cuando existen dos modas y se encuentran separadas en la distribución.
(4) No me atrevo a decir cuanto, pero la diferencia debe ser clara y suficiente para que la moda sea realmente un valor representativo de la centralidad de la distribución.
(5) El significado concreto de esta posición dependerá de la naturaleza del fenómeno estudiado, incluyendo si el interés es por su naturaleza estática o por su posible dinámica, pero un posicionamiento en los extremos indica distribución sesgada a la izquierda o a la derecha en la que se espera una determinada relación entre moda, mediana y promedio que se debería comprobar empíricamente, pero que no resulta más que confirmatoria; mientras que una posición centrada exige el análisis de estos estadísticos para comprobar el tipo de distribución subyacente, posiblemente de tipo normal o gaussiana, o tendente a ella.

