Fases del análisis de datos
Según la literatura especializada (y aquí poco margen hay para salirse del guion, aunque, como en todo, hay variaciones) son siete (otros dicen que seis) los pasos o fases del análisis de datos. En esta entrada, a modo de síntesis, expondré una breve reseña sobre cada una de ellas.
Dice la IA, resumiendo, como es costumbre en ella, lo que han dicho otros muchos muchas veces (que no es lo suyo, lo de la IA, inventar nada, salvo que alucine), que el análisis de datos se caracteriza por desarrollar un proceso en el que se diferenciar varias fases, las cuales pueden variar de número y nombre según las preferencias de los autores. Yo me adscribo a la siguiente categorización y la explico:
Fase 1. Definición del problema. Se trata de definir con claridad el objetivo del análisis; para qué estudiar esta cuestión, qué pretendemos con ello.
Fase 2. Recopilar los datos. Partiendo del qué y el para qué de nuestro análisis, identificamos los datos que son necesarios, relevantes y suficientes (que no es poco decir) y accedemos a ellos mediante diferentes procedimientos.
Fase 3. Preparación y limpieza de datos. Dado que es frecuente que los datos recopilados presenten algún tipo de limitación (están incompletos, duplicados o contienen errores), es necesario realizar sobre ellos diferentes operaciones para limpiarlos, validarlos y/o transformarlos para asegurar su precisión y adecuación para el análisis.
Fase 4. Análisis exploratorio. Se utilizan técnicas estadísticas y herramientas de análisis para explorar los datos, identificar patrones, tendencias, relaciones y anomalías.
Fase 5. Visualización y comunicación de resultados. Se elabora un informe que incluye documentación y visualización del resultado del análisis exploratorio (fase 4) que se presentan a quien corresponda de manera clara y concisa, a fin de facilitar la comprensión de la información y, en su caso, la toma de decisiones.
Fase 6. Cuando es ese el objetivo (y no el mero conocimiento del fenómeno), en este caso los identificados como gestores o responsables, toman de decisiones y desarrollan los planes de acción coherentes con los resultados del análisis de datos que les ha sido presentado.
Respecto al conjunto del proceso, pero especialmente respecto a su final, aunque en la explicación se plantea un contexto en el que el analista lo es por encargo y se diferencia de los gestores, también cabe la posibilidad de que ambos, analistas y gestores, sean las mismas personas. Es de esperar que esta sea la situación en la que se desarrolle nuestros proyectos de análisis de datos, lo que no deja de simplificar el procedimiento, además de servir para dar solidez a la evaluación de los procesos que se sirven del análisis de datos como herramienta de trabajo.

No hay comentarios:
Publicar un comentario
Comenta esta entrada