Fases del análisis de datos
Según la literatura especializada (y aquí poco margen hay para salirse del guion, aunque, como en todo, hay opciones) son siete (otros dicen que seis) los pasos o fases del análisis de datos. En esta entrada, a modo de síntesis, expondré una breve reseña de cada una de ellas.Dice la IA, resumiendo, como es costumbre en ella, lo que han dicho otros muchos muchas veces (que no es lo suyo, lo de la IA, inventar nada, salvo que alucine), que el análisis de datos se caracteriza por desarrollar un proceso en el que se diferenciar varias fases, las cuales pueden variar de número y nombre según las preferencias de los autores. Yo me adscribo a la siguiente categorización y la explico:
Fase 1. Definición del problema. Se trata de definir con claridad el objetivo del análisis; para qué estudiar esta cuestión, qué pretendemos con ello.
Fase 2. Recopilar los datos. Partiendo del qué y el para qué de nuestro análisis, identificamos los datos que son necesarios, relevantes y suficientes (que no es poco decir) y accedemos a ellos mediante diferentes procedimientos.
Fase 3. Preparación y limpieza de datos. Dado que es frecuente que los datos recopilados presenten algún tipo de limitación (están incompletos, duplicados o contienen errores), es necesario realizar sobre ellos diferentes operaciones para limpiarlos, validarlos y/o transformarlos para asegurar su precisión y adecuación para el análisis.
Fase 4. Análisis exploratorio. Se utilizan técnicas estadísticas y herramientas de análisis para explorar los datos, identificar patrones, tendencias, relaciones y anomalías.
Fase 5. Visualización y comunicación de resultados. Se elabora un informe que incluye documentación y visualización del resultado del análisis exploratorio (fase 4) que se presentan a quien corresponda de manera clara y concisa, a fin de facilitar la comprensión de la información y, en su caso, la toma de decisiones.
Fase 6. Cuando es ese el objetivo (y no el mero conocimiento del fenómeno), en este caso los identificados como gestores o responsables, toman de decisiones y desarrollan los planes de acción coherentes con los resultados del análisis de datos que les ha sido presentado.
Respecto al conjunto del proceso, pero especialmente a su final, aunque en la explicación se plantea un contexto en el que el analista es especialista y actua por encargo, por lo que se diferencia de los gestores (y ejecutantes), también cabe la posibilidad de que ambos, analistas, gestores y ejecutores, sean las mismas personas. No es lo mismo, pero tampoco es una situacuón tan extraña. O no lo debería ser, como de hecho no lo es en la situación en la que se desarrollan nuestros proyectos de análisis de datos. Y tampoco esta situación, un tanto "artesanal" si se quiere, carece de ventajas (incluso) procedimentales: por ejemplo, simplifica el desarrollo del procedimiento; pero lo más impotantes, da solidez a la auto-evaluación de los procesos de intervención de esos ejecutantes que somos nosotros mismos, ya que esta auto-evaluación se sirve del análisis de datos como herramienta para la mejora de la práctica.
No hay comentarios:
Publicar un comentario
Comenta esta entrada