El data health determina la calidadde los datos de tu empresa

“Salud de los datos”. Puede sonar a término marketiniano, pero lejos de este fin puramente comercial, hace referencia a todo un proceso dentro de la digitalización donde la calidad de la información extraída de nuestras bases, se convierte en el baremo que garantiza si nuestras decisiones basadas en datos son correctas o nos pueden inducir a error. En definitiva, cuando hablamos de data health, hablamos de la capacidad de diagnosticar y saber si podemos fiarnos de nuestros datos o, por el contrario, debemos intervenir en alguna de sus fases de producción.

 

 

¿Qué es y en qué consiste el data health?

En esta introducción ya hemos comentado términos relevantes que nos sirven para poder visualizar de forma más completa a qué nos referimos a la hora de hablar de data health: concretamente hemos hablado de “diagnóstico” y de “salud”. ¿Por qué nos referimos con términos médicos a un proceso puramente de gobierno, ingeniería y arquitectura del dato?

El siguiente símil nos puede ayudar a ver con claridad cómo funciona todo lo relativo al funcionamiento del data health o salud del dato: nuestro organismo se compone de múltiples sistemas independientes pero que actúan como un todo (sistema respiratorio, digestivo, inmunitario, etc.). Un solo fallo en alguno de estos sistemas y la salud general se resiente en mayor o menor medida.

Con los datos de la empresa ocurre lo mismo: provienen de diferentes “sistemas” (marketing, IT, ventas, RRHH, finanzas, etc.) y debemos asegurarnos en todo momento que su ingesta, su tratamiento, son lo suficientemente “saludables” como para que no produzcan un colapso o fallo en el correcto y orgánico funcionamiento de la empresa como un todo.

Siguiendo con el símil médico, no todos los organismos son iguales: los hay más propensos a enfermar, los hay más atléticos, quienes siguen una buena alimentación o los que deben estar constantemente a dieta, etc. En cualquier caso, todos necesitan periódicas revisiones y tratamientos en el caso de encontrar que algo no va bien. Mismo caso que las empresas, cuyas necesidades, mercados y comportamiento de los clientes son totalmente distintos según sector, capital, proyección, etc.

Lo que sí es común a todas es la necesidad de, para poder basar sus decisiones correctamente según la información que manejan, garantizarse en todo momento que, tanto su organización como los procesos llevados a cabo en el tratamiento del dato, son “saludables”.

 

 

Data Quality y Data Health: dos conceptos básicos para un excelente gobierno del dato

Esa necesidad común a todas las empresas, indistintamente del tamaño o dedicación, es lo que une los conceptos de calidad y salud del dato. Así, data health es el fin: asegurar que en todo momento el viaje del dato (desde que ingresa a nuestras bases hasta que se obtiene información válida de él) se produce de forma adecuada y “saludable”. Data quality es el tratamiento: todo el procedimiento al que se somete al dato durante su viaje para que no produzca daños ni un mal funcionamiento al sistema, la garantía de que toda fuente de información de la que se nutre la empresa es de la suficiente calidad como para que se pueda obtener de ella crecimiento y toma de decisiones adecuadas.

¿Y cómo sabemos que nuestros datos son de calidad y, por tanto, saludables? Tomar un medicamento no basta para estar saludables: a este tratamiento debemos acompañarlo de buenos hábitos, práctica de ejercicio, una dieta equilibrada, etc. Con la gestión de datos sucede lo mismo: no se trata de aplicar un tratamiento, sea ocasional o recurrente, a nuestras fuentes de información, sino de crear todo un ecosistema adecuado para garantizar la calidad del dato y, con ello, disponer de un buen data health. Es aquí donde data quality y data health se encuentran dentro del concepto más amplio de gobierno del dato.

El gobierno del dato amplia el tratamiento (data quality) con otros conceptos o procesos que aseguren la buena salud de la información de la empresa. Así, un data governance se compone de medidas preventivas (una correcta arquitectura e ingeniería del dato que asegure la ingesta, el almacenado y la integración adecuada de los datos), tratamientos eficaces (calidad del dato) y cultura de apoyo (organización data-driven, en la que todos los implicados establecen medidas de cuidado y mantenimiento de los datos).

En definitiva, hablamos de gobierno del dato cuando en el viaje del dato se garantiza su calidad (se presenta libre de errores, limpio), su confianza (tenemos la garantía de poder usarlos para cualquier toma de decisiones) y que cualquier implicado en su producción o tratamiento, puede intervenirlo sin que ello no suponga otra cosa más que añadirle valor. Todo ello se traduce en una excelente salud del dato.

 

 

Procesos para garantizar una buena salud del dato

Calidad y gobierno del dato: dos conceptos clave que garantizan un buen data health pero, ¿cómo desplegamos una estructura data-driven en nuestro negocio? No se trata solo de saber la importancia de un dato saludable y aplicar herramientas que lo proporcionen, sino de dotar a nuestra empresa de la infraestructura, el conocimiento y los procesos que lo blinden. Para ello nos ayudan los siguientes “hábitos saludables”:

 

 

  • Auditar factores de riesgos: lo primero es identificar qué riesgos internos (aplicaciones, herramientas, procesos, metodologías y plantilla de tu empresa) y qué riesgos externos (socios, proveedores e incluso clientes) pueden intervenir en la calidad del dato. Podríamos calificar como factor de riesgo que diferentes departamentos intervengan en el proceso de información sin que queden registrados los cambios.
  • Establecer medidas de prevención: una vez tenemos conocimiento de dónde se encuentran los puntos débiles de nuestra empresa respecto a la gestión del dato, debemos crear protocolos que eviten cualquier riesgo, por ejemplo un correcto etiquetado (que cada dato se conozca de dónde proviene y la razón de estar en las bases) y unas normas específicas a cada departamento implicado en su tratamiento.
  • Automatizaciones de gestión: en la era big data, de media el 60% del tiempo productivo de un gestor de datos se gasta en tareas de limpieza y depuración de bases. El aprendizaje automático puede capacitar a tus sistemas para que reconozcan datos incorrectos y fuentes sospechosas antes de que puedan contaminarlas, aumentando la productividad de la plantilla.
  • Evaluación constante: cuanto antes se detecte un problema de estado de los datos, mayores serán las posibilidades de una intervención eficaz. Por ello, resulta buena práctica la creación de perfiles de datos continuos además de las evaluaciones de todos los datos entrantes y los controles por lotes regulares.
  • Pronóstico continuo: a una evaluación, le debe seguir una receta que determine cómo actuar tanto de forma preventiva, como reactiva. En todo momento debemos saber no solo el estado de nuestras fuentes, sino cómo y desde dónde se está interviniendo en ellas.
  • Equilibrio permanente: a estas alturas ya deberíamos ser conscientes de la cantidad de factores que aplican en la gestión del dato. Tenerlos todos bajo control implica tiempo y modular riesgos como no cumplir con la seguridad y sus regulaciones al respecto (por ejemplo permitiendo un libre acceso a todas las bases). La buena gestión del dato debe sopesarlos y equilibrarlos (por ejemplo, con restricciones de acceso por perfil).

 

Cómo asegurar un buen data health en la empresa

A estas alturas puede que estemos abrumados de la cantidad de información, procesos, riesgos, protocolos y medidas que implican que nuestros datos sean saludables. ¿Existe una solución que nos permita aplicar todo lo que supone un excelente gobierno del dato sin que ello suponga un extenso equipo de data scientist, ingenieros del dato, etc.? La respuesta es sí: herramientas de gobierno del dato.

¿Necesitamos una compleja solución o una red de aplicaciones que procesen el dato desde su introducción en nuestras bases hasta que se tramita como información empresarial? Complejo es el proceso, pero la solución que apliquemos debe ser sencilla en términos de usabilidad, y rentabilidad.

Así, lo primero a la hora de dar con la solución que mejor se adapte a nuestra empresa es plantearnos esta serie de preguntas:

¿Cuánta información manejo en el día a día?

¿Cuánto tiempo me lleva tramitarla?

Y, la que es la pregunta clave a todo ello: ¿estoy seguro de la calidad de la información que se maneja en mi empresa?

Según el nivel de concreción de las tres respuestas, podremos optar por una solución de gobierno del dato integral, parcial (que asegure o intervenga en parte del ciclo del dato) o integrar en nuestro ecosistema de herramientas soluciones que refuercen los procesos productivos (automatizaciones, migraciones a cloud, etc.).

 

 

La implicación económica como factor decisivo

No debemos ignorar que la base de toda actividad empresarial es que toda inversión, reporte mayores beneficios. Por ello, a las preguntas sobre la gestión del dato, le debemos sumar la cuestión: ¿me es rentable aplicar X solución?

La respuesta no es una simple cifra que venga determinada por el coste de X solución, la respuesta viene de medir desde el tiempo (y con ello, dinero) que ya me está costando tener a parte de la plantilla tratando la gestión del dato, hasta el sobrecoste que puede producir tomar una decisión en base a no contar con la información precisa previa.

Ejemplifiquemos estos mismo con una campaña de marketing: no es lo mismo dirigirnos a un target amplio mediante publicidad en internet, que tener un conocimiento exacto de quienes son nuestros posibles consumidores. Con esta información podemos pasar de pagar miles de euros por impactar a un rango extenso (por ejemplo población de 20 a 65 años), a costes mucho más reducidos si tenemos el conocimiento específico de que nuestro target son mujeres de mediana edad. Este significativo ahorro solo lo podemos llevar a cabo contando con datos precisos y de calidad.

En cuanto al ahorro de tiempo, con anterioridad hemos lanzado el dato de que el 60% del tiempo de un data scientist, se dedica a tareas de preparación y limpieza de las bases. Sería demasiado ingenuo pensar que ese tiempo, no tiene un coste asociado… ¿Cuánto ahorro tendríamos para la empresa si, mediante la automatización de la gestión de datos, nuestra plantilla pudiera dedicar el tiempo liberado a otras tareas más productivas?

Demasiadas preguntas, demasiadas casuísticas… pero todas nos llevan a una única respuesta: contar con el sistema de gobierno del dato que mejor se adapte a la realidad de mi empresa. ¿Quieres asegurar la buena salud de la tuya?

eBook

Descárgate nuestro ebook gratuito

Del Data Chaos al Data Health: logra el éxito con estrategias basadas en datos