Análisis de datos (VI)
Repositorios (c)
Si algún directorio representa lo que queremos decir con repositorio este es, sin duda, aquel que contiene un único documento. En esta entrada analizaré este subconjunto de repositorios con el objetivo de conocer con más detalle cuales son sus características.
Ya vimos en [entradas anteriores] dedicadas a este análisis de expedientes que el conjunto de directorios que contiene un único documento era el mayoritario (moda) y con mucho de todo el conjunto, llegando a representar algo más del 20% del total. Aunque no sean los únicos directorios que podemos considerar repositorios más que expedientes, sin duda que son los más representativo, por lo que analizarlo nos puede servir para comprender cuáles son las características distintivas de éstos frente a los directorios-expedientes.
Cómo ya comenté en la [primera entrada] en la que planteo el análisis de este subgrupo, este análisis requiere que nos centremos en el tipo de documentos que contienen los repositorios, ya que es esta variable, incluso más que la del número de documentos, la que define qué es un repositorio y en qué se diferencia de un expediente. Es evidente que el número de documentos importa por lo que delimita en teoría el campo de unos y de otros, pero no es tan evidente que sea sólo el número ni que lo sea siempre.
Podemos diferenciar la tipología de documentos en función de la extensión de los mismos, pero por lo que resulta de asociación entre ésta y el contenido del documento.
En este sentido tenemos los documentos doc, docx y odt como representantes de todos aquellos que derivan del uso de un procesador de texto (Word o Writer). Estos servicios son los más usados por los SEO y lo son desde hace ya mucho tiempo. Con ellos se han elaborado la inmensa mayoría de los informes y dictámenes que, con mucho, son los documentos que cuantitativamente más y cronológicamente antes han formado parte de los directorios que llamaremos repositorios, pero también expedientes SEO. Estos documentos se guardan en su respectiva carpeta a la espera de ser impreso cuando resulte necesario, aunque posteriormente se observan (y usan) otras utilidades (las que con el tiempo favorecerán que un repositorio se convierta en expediente), como son la consulta y el uso para posteriores intervenciones.
En lo que se refiere a este análisis, se espera, por tanto, que este tipo de documento predomine en los repositorios. Evidentemente también en su prototipo: el repositorio de documento único.
El segundo tipo de documento es el PDF. En este caso su presencia se justifica como resultado de varios procesos posibles, de naturaleza diferenciada en relación con lo que hemos planteado como hipótesis básica:
- Bien como transformación de un documento del tipo anterior a PDF como forma de garantizar que se mantiene no modificable. En este caso, para el cómputo total podemos sumarlo a los del grupo anterior.
- Bien como resultado del escaneo de un documento originariamente en formato papel.
El tercer y último tipo de documento (podría haber otros, pero en la práctica no los hay) de los que forman parte de los repositorios de documento único es el que se presenta sobre una hoja de cálculo (xls, xlsx, ods), resultantes del uso de servicios como Excel o Calc. Estos, al contario que los PDF, generalmente representan potenciales anomalías, ya que no es frecuente, pero tampoco descartable, el uso de estos soportes para crear documentos compatibles con repositorios. Evidentemente nunca se tratará de informes psicopedagógicos, pero sí cabe la posibilidad de crear una ficha de datos del alumno desde planteamientos compatibles con un repositorio; al menos tanto como desde planteamientos de expediente.
Con todo, es más fácil que se trata de una recopilación de datos resultantes del estudio del expediente académico o de la aplicación de una prueba de evaluación. En este caso, si bien no se puede prescindir del concepto de repositorio, es más plausible que se trate de desarrollar un expediente SEO, ya que se dan dos excepcionalidades desde el planteamiento del repositorio que son, en realidad, dos motivos frecuentes desde el planteamiento de la configuración de un expedientes: recopilar sistemáticamente datos que no son necesarios usando expedientes en papel y usar para ello una hoja de cálculo (en lugar de un procesador de texto).
Aclaradas estas cuestiones, en la entrada que sigue pasaré a realizar el análisis empírico de los directorios de documento único. Empezaré por exponer el script Python usado para obtener los datos y después mostraré y analizaré el resultado de su aplicación.


No hay comentarios:
Publicar un comentario
Comenta esta entrada