jueves, 6 de noviembre de 2025

Datos. Análisis.

Fases del análisis de datos

Acceso a datos (II)



Cuando los datos que interesa analizar son los directorios y su contenido los procedimientos vistos en la [entrada anterior] no sirven. Necesitamos hacer uso de procedimientos mucho más primitivos, conocidos, aunque posiblemente ya olvidados, para quienes aprendimos a usar el ordenador cuanto todavía se trabajaba con órdenes de sistema y el interfaz de usuario era básicamente el cmd. Python vuelve a ponerlos de moda desde su [módulo os], y volvemos a necesitarlos ahora como recursos (también) para ciertas formas de análisis de datos.


Por diferentes razones (en este caso suponemos en el marco de un proyecto de análisis de datos) podemos necesitar trabajar con el contenido de un directorio. Para ello recurriremos al módulo os, concretamente desarrollando un procedimiento de identificación de rutas relativas o absolutas y de [listado y cuantificación] de los componentes del directorio. Uno y otro pueden tener gran utilidad en el proceso de análisis.

Veamos el script:

import os

# Define la ruta del directorio
directorio = "D:/BasesDatosTest"

# Obtiene una lista con los nombres de los archivos y carpetas
contenido = os.listdir(directorio)

#Lee el listado de componentes del directorio (serviría como ruta relativa)

print(f'Colección de elementos del directorio \n {contenido} \n')

#Recorre el directorio y muestra las rutas absolutas

print('Rutas absolutas de archivo \n')

for elemento in contenido:
    print(directorio + '/' + elemento + '\n')

#Recorre el directorio, cuenta los elementos y muestra los componentes y cuántos son

n_elem = 0

print('Listado de documentos y subdirectorios componentes \n')
 
for elemento in contenido:
    n_elem = n_elem +1
    print (f'Elemento número {str(n_elem)} -> {elemento}')

print(f'\n TOTAL elementos del directorio {str(n_elem)}')

No me detengo a analizar el script porque los comentarios me ahorran el trabajo. Lo único decir que podemos plantear diferentes soluciones para tratar los datos obtenidos, siempre en función de los objetivos que nos planteemos con la aplicación de este código. Una de estas acciones es archivar los datos resultantes en un documento de texto (.txt) para su posterior uso o análisis. En ese caso deberíamos recoger los listados resultantes en listas u otro tipo de colección de datos con que cuenta Python. Pero esta es ya otra cuestión que va más allá de los limitados objetivos de esta entrada.