Los datos y su importancia en la era de la información

“In god we trust, all others (must) bring Data”.  Creo que fue William Edwards Deming, un estadístico adelantado a su tiempo quien dijo esta frase que tanto dice en tan pocas palabras. Hoy en día la vigencia de ellas es si cabe mucho mayor que en su época. Estamos sin duda en la era de la información, no son pocos los que dicen que los datos son el nuevo petróleo.

En cualquier caso, como el petróleo, los datos sin refinar tienen un escaso valor, incluso pueden resultar tremendamente molestos, pastosos y hasta perjudiciales. De ahí que la ciencia y la ingeniería e incluso el mundo de la economía lleven trabajando décadas en obtener la fórmula para limpiar, tratar y extraer información de esos datos, en establecer los procesos necesarios para que esa información sea útil.

Datos limpios, siempre son el punto de partida. A veces nos preguntamos ¿pero es que hay datos sucios? Los datos, como todo en nuestro mundo, se ensucian por el mero hecho del paso del tiempo, les cae polvo, dejamos enredos y trastos por en medio, por ejemplo, se da de alta un cliente que nos iba a comprar pero que jamás envió su autorización. Se gestiona un pedido, pero no hay stock, queda en el limbo, el cliente ya no lo quiere, nadie lo anula, dimos el cliente con CIF 1111111-A porque al día siguiente nos iba a enviar la información y nunca llegó. Todo eso es parte del día a día y es suciedad, que hay que eliminar, o al menos tratar para que el resto de la información brille con todo su esplendor.

A partir de esa información vamos a poder hacer varios tipos de analíticas.

Información útil

Análisis Descriptivo. 

El que nos cuenta qué paso, agrega y resume la información, la grafica, y la muestra para que la entendamos y procesemos. Es la analítica básica, los pilares del análisis. Con un conocimiento profundo del dominio (el entorno de negocio en el que nos estemos desenvolviendo) además podremos empezar a establecer conclusiones. Sabremos que hay productos que triunfan mas en algunos lugares y no se distribuyen en absoluto en otros, podremos, en resumen, tomar medidas correctoras en base a datos.

 Análisis Predictivo.

Un análisis predictivo es el que nos muestra un escenario futuro más probable, el que nos dice que va a pasar. En el sector de la distribución, por ejemplo, podría darnos una previsión de los consumos para gestionar adecuadamente la cadena de suministro. No es que vaya a acertar el 100% de las ventas, pero obviamente será mejor que ninguna previsión en absoluto. Si para esa predicción alimentamos los datos con información precisa y limpia, las predicciones serán bastante mejores y mas cercanas a la realidad.

Análisis Prescriptivo.

Un análisis prescriptivo es el que dice las recetas a aplicar para conseguir un objetivo. Es la analítica de palancas en la que podemos tocar ciertos resortes para conseguir un objetivo. Un ejemplo podría ser evitar el abandono de clientes. Imaginemos que recopilamos una serie de variables sobre los clientes que nos dejan, imaginemos que esas variables son para los últimos 6 meses, número de quejas, tiempo medio de entrega desde pedido, número de compras, tendencia (alza, baja o neutra), datos de la competencia (estamos más caros o más baratos, etc.)  y algunas más que determinemos relevantes. A partir de ahí podríamos obtener la probabilidad de que un cliente abandone en base a los datos de clientes que ya nos abandonaron.  Con esto tendríamos los dos primeros análisis, el descriptivo, con los datos de las variables que hablábamos y el predictivo, sabríamos si el cliente se marcha o se queda con una probabilidad. Ahora podemos establecer campañas de fidelización, descuentos, bonificaciones, mejoras en el servicio, lo que sea que determinemos y medir la eficacia de esas medidas. El análisis nos diría que, si cambias esta o aquella variable, el cliente ya no nos abandonará.

Análisis de diagnóstico.

En otras ocasiones hay que hacer un análisis de causas. ¿Por qué se fue este cliente? Que es lo que hicimos mal para que nos abandonara. Este tipo de analítica se basa en el detalle de los datos, en las diferencias entre unos sujetos y otros y va a ser muy útil para poner medidas que mejoren situaciones que no deseamos.

Pero .. , ¿esto no es cosa de informáticos y estadísticos?

Pues lo cierto es que ya no, o al menos, no tenemos que ponernos en las manos de terceros para realizar buena parte de los análisis anteriores.  Desde hace algunos años, los fabricantes de software se han preocupado mucho de lo que llaman “democratización de la inteligencia de negocio”, esa democratización no es más que la creación de herramientas con las que los meros mortales, lejos del olimpo de matemáticos e ingenieros, podemos realizar todos y cada uno de esos pasos, podremos obtener la información del origen de datos en el que esté, desde fuentes de datos abiertas, gubernamentales, climatológicas, instituto de estadística, hasta bases de datos propias de empresas, hojas de Excel o ficheros exportados del ERP.

Una vez obtenida esa información, podremos limpiarla, transformarla y enriquecerla, es decir podremos quitar lo clientes y pedidos que nunca llegaron a serlo, podremos resumirla por meses y podremos explotarla en gráficos y tablas. Seguro que muchos estamos pensando en Excel, la herramienta del copia-pega mas usada en el mundo, sí, pero también otras y que pueden resolver esta problemática de forma mucho mas eficaz con volúmenes de datos sustancialmente mayores. En mi caso, PowerBI que ha sido una autentica revolución en lo que se ha llamado el SelfService BI.

Contenido en esta herramienta vamos a poder hacer, al menos en un primer paso, buena parte de los cuatro tipos de analítica que acabamos de exponer. Vamos a poder hacer por supuesto análisis descriptivo, como puede verse en el gráfico, en donde estamos obteniendo las métricas clave para comprender y medir nuestro negocio, datos de evolución y comparativas entre elementos, en resumen, mucha analítica descriptiva.

También podremos hacer análisis predictivo, algunos de sus componente permiten graficar futuros usando algoritmos de series temporales (por debajo usan regresión múltiple, pero nosotros no tenemos por qué conocer los fundamentos matemáticos para usarlos), también podremos buscar anomalías, datos que no era probable que pasaran o que se salen de lo esperado.

Podremos hacer análisis prescriptivo, usando analítica de tipo What-if (que pasaría si)  de manera que podamos plantear distintos escenarios y ver el resultado si se dan esos factores y también podremos hacer análisis de causalidad a través de algunos componentes que realizan complejos cálculos estadísticos por nosotros.

En resumen

Estamos en la era de los datos, y además se nos ha concedido un enorme poder, el poder de las herramientas que acercan complejísimos cálculos matemáticos a nuestro día a día, usados desde el punto de vista de un usuario convencional que conoce su negocio y puede aportar mucho valor, pero también con la rigurosidad que requieren este tipo de procesos.

¡Fórmate de la mano de EIP, la escuela nº1 en empleabilidad!

Suscríbete a nuestra newsletter para estar al día de todas las novedades

Información básica sobre protección de datos.
Responsable del tratamiento: Mainfor Soluciones Tecnológicas y Formación S.L.U.
Finalidad: Gestionar su suscripción a la newsletter.
Legitimación para el tratamiento: Consentimiento explícito del interesado otorgado al solicitar la inscripción.
Cesión de datos: No se cederán datos a terceros, salvo obligación legal.
Derechos: Podrá ejercitar los derechos de Acceso, Rectificación, Supresión, Oposición, Portabilidad y, en su caso Limitación, como se explica en la información adicional.
Información adicional: Puede consultar la información adicional y detallada sobre Protección de Datos en https://www.mainfor.edu.es/politica-privacidad

Deja un comentario

¡Comparte en redes sociales!