Bilhões de dados permanecem inativos em servidores e centros de dados. São os dados obscuros (dark data). Seu custo financeiro e ambiental se tornou um problema que não pode mais ser ignorado.
Segundo um estudo da editora de software MEGA International, realizado pelo instituto Enterprise Strategy Group, o volume médio de dados nas empresas dobra a cada dois anos. Atualmente, 1,3 bilhão de gigabytes de dados são gerados por empresas em todo o mundo todos os dias.
Grande parte desses dados são dados obscuros, ou dados frios, também chamados “dados esquecidos”. São dados que raramente, ou nunca, são consultados ou usados. Eles são gerados por todas as interações de usuários dos sistemas de informação de empresas e organizações (arquivos de log do servidor, dados de geolocalização, e-mails e arquivos anexados, etc.).
Com a expansão da nuvem e o uso crescente de objetos conectados (IoT), essa produção maciça de dados frios só está se acelerando. Globalmente, o Relatório 2019 sobre o estado dos dados obscuros, publicado pela TRUE Global Intelligence para a editora de software Splunk, estimou que os dados obscuros representavam 52% dos dados armazenados no mundo.
Conta pesada
Ao se acumularem nos servidores das empresas e nos centros de dados, esses dados inativos geram um custo financeiro considerável, cerca de 2 bilhões de euros por mês em todo o mundo, segundo um estudo da empresa americana International Data Corporation (IDC). Além disso, há um custo ambiental alto e crescente: de acordo com um estudo da Veritas, em 2020, os dados obscuros foram responsáveis pela emissão de 6,4 milhões de toneladas de CO2, o equivalente à pegada de carbono de um carro que dá 575.000 voltas ao redor da Terra.
O setor de dados já é responsável por 4% das emissões de gases de efeito estufa: somente os centros de dados têm uma pegada de carbono maior (2,5% das emissões de CO2) do que o setor de aviação (2,1%).
Há um terceiro aspecto que merece a atenção dos dirigentes: o número crescente de vulnerabilidades geradas por essa massa de dados, suscetível de ameaçar a segurança dos sistemas de TI corporativos.
Tomar consciência do problema
O assunto claramente não é uma prioridade para as empresas. “Quem vai assumir a responsabilidade de suprimir esses dados? Ninguém quer sequer abrir a porta para limpá-los. Muitas vezes é mais fácil mantê-los”, lamenta Cor Bonda, Lead consultant Data & Analytics na Axians Países Baixos.
“É essencial estabelecer uma política de gerenciamento de dados compartilhada por todos na empresa. Mas o ponto de partida deve ser a necessidade e não os dados.”
Mas já não seria sem tempo de pensar seriamente nessa questão, especialmente com a explosão dos preços da energia e dos custos de armazenamento do centro de dados. Sem mencionar a multiplicação das regulamentações sobre o gerenciamento de dados pessoais, como o RGPD, que proíbem armazenar os dados indefinidamente.
Muitas vezes, as empresas, especialmente as PMEs com recursos limitados, se perguntam como encontrar esses dados. “Regra geral, as organizações nem sabem que têm dados obscuros! Portanto, a primeira coisa a fazer é identificá-los”, observa Cor Bonda. Em seguida, é preciso classificar os dados frios que devem permanecer frios, os dados que podem ser usados e os dados que devem ser suprimidos permanentemente.
Que soluções?
“O ponto de partida deve ser a necessidade e não os dados. É essencial estabelecer uma política de gerenciamento de dados compartilhada por todos na empresa”, aconselha o Lead consultant Data & Analytics da Axians Netherlands, que acrescenta que “a primeira coisa a fazer é produzir menos dados e, portanto, menos dados obscuros”.
O treinamento das equipes para lidar com essa questão, a realização de auditorias regulares para identificar e eliminar dados obscuros e o mapeamento e registro do processamento de dados pessoais para monitorar seu ciclo de vida podem contribuir para isso. Esse trabalho de localização, identificação e classificação de dados pode ser otimizado pela inteligência artificial.
A IA é potencialmente uma ferramenta interessante para aproveitar ao máximo os dados obscuros. Ela pode melhorar significativamente o conhecimento e o relacionamento com os clientes, usando e explorando mais os dados associados a eles e, até então, dispersos.
19/10/2023