martes, 24 de junio de 2025

Datos. Estadística.

Medidas de dispersión (III)


El tercer conjunto de estadísticos de dispersión tienen en común su dependencia del promedio, además de ser los usados con más frecuencia en los análisis de datos  como medidas de dispersión. Me refiero a la varianza, la desviación típica y, en menor medida, el coeficiente de variación de Pearson.


Entendemos por varianza el sumatorio de las diferencias entre los valores o datos y el promedio del conjunto, elevadas al cuadrado para eliminar el efecto del signo de la diferencia y dividido entre el valor N o población (1).


La desviación típica resulta de calcular la raíz cuadrada de la varianza, lo que equivale a revertir la potencia (al cuadrado) aplicada a la diferencia valor-promedio, con la ventaja (para los cálculo) de haber anulado antes el efecto de los valores negativos de dichas diferencias (2).


Finalmente el coeficiente de variación es una medida de dispersión relativa que resulta de dividir la desviación típica entre la media...

CV = S/Med 

... lo que supone calcular el número de veces que la desviación contiene a la media y permite afirmar el grado de representatividad de la media en una distribución (3).

En Calc contamos con fórmulas para el cálculo de la varianza muestral (VAR()) y poblacional (VAR.P()), lo mismo que para el cálculo de la desviación típica (Dt) muestral (DESVEST()) y poblacional (DESVEST.P()), aunque también podemos calcula la Dt aplicar la raíz cuadra al resultado del cálculo de la varianza.

Además podemos realizar el cálculo de forma manual, desarrollando el procedimiento que deriva del cálculo manual de la varianza:
  1. Calculamos la diferencia entre el dato o PD y la media del conjunto (A3-$G$4)
  2. Elevamos al cuadrado esa diferencia () o realizamos la operación equivalente (B3*B3)
  3. Extendemos ambas fórmulas al conjunto de los datos
  4. Calculamos el sumatorio de 2->3 (SUMA(C3:C48))
  5. Y dividimos el resultado 4 entre N (4) para la varianza poblacional o N-1 para la varianza muestral.
A partir del cálculo de la varianza procedemos a calcular la Dt aplicando la fórmula la de la raíz cuadrada (RAIZ(K28)) (5)

Respecto al coeficiente de variación de Pearson, no existe una función Calc específica, pero el cálculo no presenta mayor dificultad aplicando la fórmula que ya conocemos (6).


NOTAS

(1) Esta fórmula es válida para el cálculo de la varianza poblacional, pero si se desconoce y lo que se calcula es la varianza muestral, el sumatorio de las diferencias se divide entre N-1. La varianza es el estadístico de más transcendencia de los tres, ya que sobre su análisis (análisis de varianza) se construyen modelos de análisis de la llamada estadística inferencial.
(2) La misma modificación de la fórmula que para la varianza respecto a la muestra (N-1). La desviación típica o estándar es posiblemente el estadístico de dispersión de más uso. 
(3) Con frecuencia se expresa como porcentaje, resultando de la fórmula Cv = (S/Med)*100. Si Cv = 0 se considera óptima la representatividad de la media; sí Cv =< 0,3 la representatividad de la media es óptima.
(4) Para calcular N usamos la fórmula CONTAR(A$3:A$48)
(5) Esta posibilidad de cálculo manual también lo es de desarrollo de un procedimiento enteramente basado en OOo Basic, pero resulta innecesariamente complejo pudiendo recurrir, aquí también, al uso de las fórmulas Calc dentro de un script.
(6) Ni en Calc ni en Excel. En ambas se debe recurrir al uso manual de la fórmula S/Med

No hay comentarios:

Publicar un comentario

Comenta esta entrada