Ir directamente al contenido de la página Ir a la navegación principal ir a investigar

Miles de millones de datos permanecen latentes en servidores y centros de datos. Son los dark data o datos oscuros. Su coste financiero y medioambiental se ha convertido en un problema que no se puede ignorar por más tiempo.

Según un estudio de la empresa de software MEGA International llevado a cabo por el instituto Enterprise Strategy Group, el volumen medio de datos de las empresas se duplica cada dos años. Actualmente, las empresas generan a diario 1.300 millones de gigabytes de datos en todo el mundo.

Gran parte de estos datos son dark data, datos oscuros, también denominados datos olvidados. Se trata de datos que rara vez, o nunca, se consultan ni se utilizan. Se generan a raíz de multitud de interacciones de los usuarios de los sistemas de información de las empresas y organizaciones (archivos de registro de los servidores, datos de geolocalización, e-mails, ficheros adjuntos…).

Con la expansión de la nube y el creciente uso de los objetos conectados (IoT), esta producción masiva de datos oscuros no para de acelerarse. A escala mundial, el Informe 2019 sobre el estado de los datos oscuros, publicado por TRUE Global Intelligence para la empresa de software Splunk, estimaba que los dark data representaban el 52% de todos los datos almacenados en el mundo.

Factura considerable

Al acumularse en los servidores de las empresas y los centros de datos, estos datos latentes generan un considerable coste financiero cercano a los 2.000 millones de euros al mes en todo el mundo, según el estudio de la consultora norteamericana International Data Corporation (IDC). A ello hay que añadir un elevado ―y cada vez mayor― coste medioambiental: según un estudio de Veritas, en 2020 los datos oscuros fueron responsables de la emisión de 6,4 millones de toneladas de CO2, lo que equivale a la huella de carbono de un coche que da 575.000 vueltas a la Tierra.

El sector de los datos ya es responsable del 4% de las emisiones de gases de efecto invernadero: solo los centros de datos tienen ya una huella de carbono superior (2,5% de las emisiones de CO2) a la de la industria aeronáutica (2,1%).

Un tercer aspecto merece la atención de los líderes mundiales: el número cada vez mayor de fallos generados por esta masa de datos susceptible de amenazar la seguridad de los sistemas informáticos de las empresas.

Tomar conciencia del problema

Es evidente que el tema no es una prioridad para las empresas. “¿Quién asumirá la responsabilidad de eliminar estos datos? Nadie quiere siquiera entreabrir la puerta para limpiarlos. A menudo es más fácil conservarlos”, lamenta Cor Bonda, Lead Consultant Data & Analytics en Axians Países Bajos.

“Es fundamental establecer una política de gestión de datos compartida por todos en la empresa. Pero hay que partir de la necesidad, y no de los datos”.

Y, sin embargo, ya es hora de preocuparse seriamente por este asunto, sobre todo en un momento en que el precio de la energía está por las nubes, al igual que los costes del almacenamiento en los centros de datos. Por no hablar de las múltiples normativas sobre la gestión de datos personales, como el RGPD, que obligan a no conservar estos datos de manera indefinida.

Pero a menudo las empresas, y en particular las pymes, que disponen de pocos recursos, se preguntan cómo encontrar estos datos. “¡Las organizaciones muchas veces ni siquiera saben que tienen datos oscuros! Por tanto, lo primero que hay que hacer es identificarlos”, señala Cor Bonda. Posteriormente, hay que diferenciar los datos oscuros que deben mantenerse de los que pueden utilizarse y los que deben eliminarse definitivamente.

¿Qué soluciones hay?

“Para ello, hay que partir de la necesidad, y no de los datos. Es fundamental establecer una política de gestión de datos compartida por todos en la empresa”, aconseja el Lead Consultant Data & Analytics de Axians Países Bajos, que no obstante añade que “lo primero que hay que hacer es producir menos datos y, por tanto, menos datos oscuros”.

Puede contribuir a ello formar a los equipos para abordar esta problemática, realizar auditorías regulares para identificar y eliminar los datos oscuros, y establecer una cartografía y un registro de tratamiento de los datos personales para hacer un seguimiento de su ciclo de vida. Esta tarea de localización, identificación y clasificación de los datos puede optimizarse mediante la inteligencia artificial.

La IA puede ser una herramienta interesante para sacar el máximo provecho de los dark data, ya que puede mejorar significativamente el conocimiento y la relación con los clientes utilizando y explotando más los datos asociados a ellos, hasta ahora desperdigados.

19/10/2023