martes, 4 de noviembre de 2025

Expedientes. Análisis.

Análisis de datos (V)

Repositorios (b)



Aunque mi pretensión es incorporar procedimientos basados en Python para automatizar o al menos facilitar el análisis de ese conjunto de registros/directorios que he llamado repositorios, un primer análisis de éstos es posible mediante Calc y sus funciones. Este será el objetivo de esta entrada.


Empezando por una cuantificación básica, primero en relación con el total de registros/directorios...
  • Contamos con un total de 161 directorios que contienen 1 o 2 documentos, lo que representa el 33,5% del total de lo directorios que se analizan en este estudio (481). Como se ve, un número nada despreciable, ya que supone un tercio de ese total. Esto da una idea de la importancia de la categoría repositorio, motivo más que suficiente para justificar la necesidad de su análisis.
  • Si tomamos como referencia el número de documentos (no de directorios), lógicamente el peso de los repositorios sobre el total de documentos se reduce considerablemente, ya que son precisamente los directorios con menos documentos: representan únicamente el 6,35% del total de documentos, limitación cuantitativa que se acentúa aun más por comparación con el alto porcentaje de directorios implicados. Evidentemente esto no resta interés a su análisis.
 ... y después como conjunto independiente;
  • Esos 161 directorios se reparten en 97 directorios de un documentos frente a 64 de dos.
  • Los porcentajes respectivos (60,25% frente a 39,75%) refleja el claro predominio de los repositorios más simples en este conjunto...
  • ... lo que modera significativamente el peso porcentual del número de documentos que pertenecen a una categoría (43,11%) y a otra (56,89%), a pesar de presentar ésta última el doble de documentos por directorio que la primera.
  • Todos estos datos reflejan el importante peso que tienen los repositorios más simples, tanto en el conjunto absoluto como en el resultante de su tratamiento diferenciado.
  • Aun así es necesario considerar el análisis de ambos (repositorios de uno y dos documentos) como una unidad, ya que esta necesidad está implícita en la conceptualización de ambos como entidades diferenciables de los directorios-expedientes.
Tras esta primera fase del análisis, pasemos a la siguiente. En ella analizaremos la información que aportan los documentos que contienen estos repositorios, a algunos de ellos, atendiendo a las hipótesis que formulamos para su análisis en la [entrada precedente].



No hay comentarios:

Publicar un comentario

Comenta esta entrada