De la teoría a la práctica en el análisis de datos

19 diciembre 2019 Deja tu comentario

A medida que se acercan las etapas finales de diferentes estudios, se hace necesario procesar todos los datos que hemos reunido para extraer tanta información de los estudios como sea posible.

Una de las posibles definiciones del análisis de datos es describirla como la ciencia, aunque podría ser más parecido a un arte viendo cuanto depende del analista, de convertir una cantidad de datos difícil de manejar en algo que sea pequeño y útil. Sin embargo, en la versatilidad de esta descripción se encuentra uno de sus mayores obstáculos, ya que “útil” es una palabra demasiado versátil. La misma descripción plantea la siguiente pregunta: ¿Qué es útil?

Claramente, todo depende de la meta, del problema que necesita ser resuelto. No hay dos problemas iguales, a veces un simple promedio puede cumplir con este criterio de utilidad, por ejemplo, si el problema que se resuelve es obtener una visión general muy mínima de los datos. En la mayoría de los casos eso no es suficiente, ya que nadie necesita un analista de datos para calcular un promedio. A medida que el problema se vuelve más complejo también lo hacen las herramientas necesarias para manejarlo por lo que se requiere más procesamiento para convertir esta complejidad en una unidad “pequeña y útil”.

En un escenario ideal, el objetivo se definiría claramente desde el principio y se sabría de inmediato qué tipo de análisis se desea. Desafortunadamente, el mundo es de todo menos ideal; irónicamente, es extremadamente común que la única forma de tener un objetivo claramente definido es haber realizado un análisis previo de los datos.

En un escenario más realista, el objetivo es impreciso porque no hay suficiente información previa para limitarlo, por lo que se convierte en parte del análisis determinar qué preguntas podrían responder estos datos. Por lo general, esto implica realizar exploraciones iniciales junto con un experto en ese campo, que pueda dar significado y valor a la información recopilada y así ayudar al analista a comprender y, de alguna manera, traducir este conocimiento al análisis.

Una vez que este proceso inicial de garantizar que los analistas puedan comprender lo más a fondo posible los datos con los que trabajarán, será cuando comience el verdadero análisis. Dado que el análisis de datos es un proceso iterativo, el objetivo de cada paso no es responder de inmediato al problema planteado al comienzo, sino adquirir más información reduciendo en el proceso las preguntas que estos resultados iniciales pueden responder, mientras se da cuenta cómo de bien se están resolviendo estas preguntas.

Esta información permitirá una mejor toma de decisiones durante el análisis, y el conocimiento adquirido hará que el problema sea resuelto lentamente (o rápidamente, en casos afortunados). Con suficiente iteración, el problema en sí mismo se irá definiendo progresivamente con mayor claridad y, por lo tanto, puede comenzar el proceso de resolución real, con el beneficio adicional de haber adquirido mucha información sobre los datos que se estudian en esta fase inicial, lo que puede abrir nuevas posibilidades interesantes.

En general, el proceso es similar al intento de llegar a un destino a través de una tierra inexplorada: el camino a seguir es desconocido y el destino es vago. Pero cada intento de lograrlo revela más de la disposición de la tierra, de más puntos de referencia y de nuevas rutas que facilitan la planificación del próximo intento.

Por supuesto, esto no significa que el viaje sea simple. Hay que tomar muchas decisiones a lo largo del camino y, si bien es relativamente sencillo detenerse y buscar errores cuando es obvio que algo no funciona como se esperaba; se necesita mucha más disciplina para mirar un resultado positivo, o tal vez solo prometedor, y detenerse a encontrar lo que podría hacer que no fuera válido.

Sin embargo, a pesar de los desafíos, el análisis de datos puede ser la piedra angular de un gran proyecto si se hace correctamente. Miles de horas de trabajo pueden culminar en una pepita de información comprimida que contenga la solución a la pregunta que generó todo este esfuerzo. Pequeño y útil, de hecho.

 

Escrito por: Luis Fernández, Analista de Datos en Life Length

Facebook
Twitter

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *