Esta pregunta se responde inicialmente con otra pregunta: ¿en qué basas cualquier decisión que implique hacer más competitiva tu empresa? Podríamos ponernos “románticos” con la respuesta y hablar de intuición, olfato para los negocios y otras cualidades subjetivas que idealizan la figura del emprendedor de éxito, pero siendo sinceros y objetivos, ningún empresario exitoso se atreve a desplegar una estrategia si ésta no está fundamentada. Y esa fundamentación, ese respaldo, solo puede venir de una vía: la calidad de los datos.
Incluso el buen olfato para los negocios (no negamos su existencia), viene del manejo de información. La intuición existe porque poseemos el conocimiento necesario para que ésta se desarrolle, y aunque en ocasiones una buena dosis de estos elementos es necesaria para innovar, la clave del éxito empresarial viene finalmente de convertir la intuición en certeza, y eso únicamente lo conseguimos con una buena calidad de los datos. ¿Cómo la garantizamos?, ¿en qué medida afecta a cualquier proceso dentro de nuestra empresa?
Calidad de los datos: un baremo preciso y necesario
¿Y cómo podemos saber si nuestros datos son de la calidad suficiente? La respuesta ya la hemos dado en la introducción: la clave está en la certeza, en el grado de fiabilidad que tiene cualquier dato que salga de nuestras bases. Podemos pensar que un dato es bueno porque “alguien” lo ha introducido y se encuentra junto a otros datos que le aportan veracidad, pero el simple hecho de que no sepamos de entrada, de dónde surge ese dato, ya nos dice mucho de su calidad…
Dicho esto, ¿serías capaz de fiarte al 100% de todos y cada uno de los datos que componen la base de conocimiento de tu empresa? Sin un proceso que así lo asegure, podemos anticiparte sin riesgo a equivocarnos que la respuesta es un no. El simple hecho de que un dato esté, no quiere decir que sea útil. De hecho sabemos que un dato es de calidad cuando es:
- Preciso: informa con exactitud, sin crear confusión.
- Íntegro: cuenta con información extraíble sin necesidad de apoyarse en otros datos.
- Coherente: encaja en su contexto y resulta útil dentro de él.
- Puntual: no debe resultar obsoleto ni incompleto al momento de ser usado.
- Singular: debe ser único, sin duplicidades.
- Válido: debe transmitir su uso confianza plena.
Con estas seis características sobre la mesa, ¿aún crees en la fiabilidad de cualquier dato sin tratar?
Cómo afecta la calidad de los datos a nuestra empresa
Manejar datos que no nos resulten fiables tiene implicaciones en el crecimiento de la empresa tanto a nivel interno, como externo.
A nivel interno supone desde requerir un mayor esfuerzo y dedicación a los departamentos de gestión de datos para procurar mantener las bases limpias y fiables, hasta desdibujar las relaciones interdepartamentales, requiriendo un constante trabajo de control y cruce de información entre quienes producen y almacenan los datos.
A nivel externo, contar con datos de mala calidad implica desde reducir la productividad, no establecer una correcta relación entre clientes y proveedores, hasta tomar decisiones erróneas o mal enfocadas.
Este no es un mal ajeno a las empresas. Trabajar con datos de buena calidad requiere de una planificación y organización a conciencia, que pocas se atreven a desplegar pensando en altos costes asociados y estructuras complejas en la plantilla. Los que también son pocos los que saben que, contando con las herramientas adecuadas, los altos costes que pensamos que puede tener una organización data-driven, se reducen notablemente a los que pueda tener licenciar la herramienta precisa.
Ese conocimiento exclusivo no solo se traduce en alta competitividad, sino también en ahorro de tiempos y, por tanto, de costes. Concretamente el de reducir el 60% destinado a la limpieza de bases que de media emplea un data scientist por ejemplo, o todo el gastado entre reuniones, cruces de mails, conversaciones interdepartamentales (y el desgaste que supone), solo para saber de dónde proviene exactamente X información y si es válida para su uso.
Peor aún es el coste que tiene trabajar con malos datos dándolos por válidos. ¿Cuántas pérdidas de posibles clientes se producen por una mala gestión de las bases de contactos? ¿qué podemos esperar de alguien que, por ejemplo, ha sido contactado en tres ocasiones seguidas por aparecer de forma triplicada su contacto, o por no reflejarse correctamente los mails que se les ha enviado?
Trabajar con datos de calidad puede suponer costes, pero lo que no es ninguna suposición es el que tiene trabajar con malos datos: pérdida o empeoramiento de la relación con nuestros clientes y proveedores, tiempo empleado en la resolución de conflictos con datos, gastos en campañas mal enfocadas, etc.
Cómo detectar si tengo problemas con la calidad de los datos
¿Y cómo puedo saber si en mi organización existen problemas con la calidad de los datos? La clave ya la hemos descubierto: si no somos capaces de fiarnos al 100% de la información que proviene de nuestros datos, ya existe el problema.
Por otra parte, plantearnos esta cuestión ya supone otro indicio de un dato que no está bajo control, en cuanto para ello debemos aplicar protocolos y ser conscientes de su tratamiento.
No obstante, para tener un mayor conocimiento del nivel de gravedad de la situación, basta con responder a estas otras cuestiones que nos guían hacia dónde se encuentra nuestro problema con la gestión del dato:
- ¿Conozco de dónde proviene cada dato?
- ¿La información me llega completa?
- ¿Existen duplicidades?
- ¿Entiendo a la primera la información que ofrece cada dato?
- ¿Se usa con frecuencia la información obtenida?
- ¿Se revisan y actualizan frecuentemente las fuentes de datos?
- ¿Es entendible la información por cualquier departamento implicado en su producción/uso?
Según cómo hayamos dado respuesta a estas siete preguntas, sabremos el grado de intervención que necesitan nuestros sistemas para asegurar la calidad, ya sea parcial, o integral.
Cómo llevar a cabo un buen tratamiento del dato
La clave está en la centralización. El trabajo de un data scientist se puede ver empañado si no se llevan a cabo protocolos y metodologías de trabajo con los datos exhaustivas y siempre bajo control. De nada sirve que se limpien las bases constantemente, si igual de constante es la entrada de datos poco fiables.
Para ello y ante lo poco productivo de tener a equipos enteros trabajando por la limpieza de los conjuntos de datos en la era big data, la mejor solución pasa por herramientas de gestión y automatización que constantemente tengan bajo control y revisión el viaje completo del dato: desde que entra en nuestra organización, hasta que de él se obtiene información válida.
Este viaje del dato se puede controlar de forma fragmentada, interviniendo con herramientas que se encarguen de apartados específicos como la integración, el almacenamiento, o la calidad y gobierno, o de forma totalmente integral, con soluciones de data governance que ya contemplan todas estas fases y las coordinan entre sí para siempre tener bajo control y supervisión lo que sucede con nuestros business insights.
La herramienta o el proceso más adecuado, nos tiene que servir para dar respuesta positiva a las preguntas anteriormente planteadas, de forma que seamos capaces de:
- Controlar todas las fuentes de información que trabajamos
- Integrar todo el entorno data
- Asegurar la calidad del dato
¿Quieres conocer qué herramientas te ayudan a conseguir estos tres objetivos?, ¿sabes cómo ahorrar tiempo y costes en la gestión del dato?