Frecuencia y tabla de frecuencias
La frecuencia el número de veces que se repite un dato. La tabla de frecuencias es la forma en que expresamos estas observaciones.
La distribución de frecuencias consiste en observar, clasificar y ordenar las repeticiones de una observación, generando lo que denominamos tabla de frecuencias.
Las frecuencias se pueden expresar en valores absolutos (frecuencia absoluta o número de repeticiones de un valor) o en valores relativos (frecuencia relativa o proporción que representa la frecuencia absoluta sobre el total de observaciones), que pueden expresarse como proporción (4/10 = 0,4) o como porcentaje ((4/10) * 100 = 40%). Finalmente, la frecuencia acumulada es el resultado de sumar los datos anteriores con el actual. El resultado de estos procesos es una tabla de frecuencias.
Cuando las variables son cuantitativas (intervalo o razón) y las observaciones son muchas y próximas entre sí, es conveniente realizar agrupamientos de frecuencias en intervalos (intervalos de clase) , cuya amplitud vendrá dada por la diferencia entre el valor máximo y el valor mínimo del intervalo, definiéndose un valor intermedio entre ambos que se denomina marca del intervalo o marca de clase, siendo este valor el que se tomará como referencia para realizar los cálculos posteriores.
Para establecer el número de intervalos se tienen en cuenta el tamaño de la muestra y de la dispersión de los datos. Como norma general se emplea el criterio de crear tantos intervalos como resulte de la raíz cuadrada de la frecuencia absoluta acumulada, concretamente tomando como referencia el número entero más próximo a ese valor, y siempre que no se superen los 20 intervalos.
Asumiendo el principio de igualdad, se calcula la amplitud del intervalo redondeando por exceso el cociente del recorrido entre el número de intervalos.
Por otra parte, según el número de observaciones y el recorrido de la variables se pueden diferenciar tres tipos de tablas de frecuencias.
- Tipo I. Cuando tamaño y recorrido son pequeños es suficiente con anotar los datos en filas o columnas. Veamos un ejemplo: tabla de frecuencias de un conjunto de 10 alumnos. Variable sexo (H -> Masculino, M -> Femenino)
- Tipo II. Cuando el tamaño de la muestra es grande y el recorrido de la variable es pequeño (por lo que hay valores que se repiten) es necesario elaborar una tabla-resumen. Este puede ser un ejemplo: Nuevas escolarizaciones 2022. Número de sujetos con categoría NEE
- Tipo III. Cuando muestra y recorrido son grandes es necesario realizar agrupamientos en intervalos, para lo que precisamos calcular el rango y la amplitud total. Datos para un ejemplo:
- Rango (R): max -min (2500 - 120 = 2.380)
- Amplitud: Definida a priori bajo el principio de igualdad (10 a 12 intervalos): 2.380 / 10 = amplitud 250.
- Tabla resultante: Intervalo Li a Lj [0 - 250] -> Frecuencia ni [5] (1)
Un ejemplo de distribución (y tabla) de frecuencias de tipo III (datos agrupados) (2):
NOTAS
(1) Para los límites del intervalo: Li -> Límite inferior; Lj -> Límite superior. Salvo en el primer intervalo, en el resto Li resulta de Lj+1.
(2) La marca de clase (mc) resulta de dividir entre dos la suma de los límites del intervalo (Li+Lj/2). El cálculo de las frecuencias relativas resulta de multiplicar la marca de clase por la frecuencia de datos del intervalo (mc*fi). De ello puede derivar cierto grado de inexactitud en las frecuencias relativas y en su sumatorio.




No hay comentarios:
Publicar un comentario
Comenta esta entrada