Um dos maiores desafios dos próximos cinco anos para as empresas e para qualquer organização será assegurar e valorizar os dados relativos às suas atividades e negócios. Entre as nuvens pública e privada, uma solução de “Hybrid Data Fabric” assume uma relevância crescente.
Agora enriquecidos com informações e formatos diversos (texto, imagem, som, vídeo, fotos, etc.), os dados armazenados se tornaram mais complexos. Estes elementos complexos são a própria razão para a evolução do armazenamento de dados.
Os dados que, nos anos 1980/1990s, eram armazenados internamente em servidores de arquivos estão agora em armazéns de dados nos data centers, em nuvens privadas, públicas e híbridas. O espalhamento do armazenamento torna as empresas vulneráveis e as obriga a priorizar seus dados na forma de um “data fabric” ou tecido de dados, a fim de otimizar seus custos e melhorar seus usos.
O maior desafio hoje é, mais do que nunca, gerenciar o crescimento do volume de dados e sua utilização. Para tal, as empresas precisam se tornar “data driven”, ou acionadas por dados. Em outras palavras, aceitar as consequências de uma constatação amplamente consensual: os dados de uma empresa lhe permitem administrar, mas acima de tudo transformar seus negócios.
“Utilizar a nuvem pública como uma ferramenta de conexão maciça e a nuvem privada para proteger os dados sensíveis”.
Assim sendo, como agregar valor a seus próprios dados sem deixar que outras empresas o façam por você e correr o risco de que elas agreguem valor e monetizem seu know-how mais depressa do que você? O exemplo dos GAFAM, entre outros, mostrou como é grande o risco de ser despojado de seus dados e de seus negócios.
Reassumir o controle
Para conseguir resgatar os próprios dados, é essencial entender como eles circulam dentro dos processos das empresas. Isto significa saber de onde vêm os dados, como “limpá-los”, enriquecê-los e agregar valor, e depois reinjetá-los nas aplicações comerciais. Esta reavaliação de todo o processo de gerenciamento de dados é o “data pipeline“.
Para visualizar o processo, vejamos o exemplo de uma empresa de venda à distância. Para que seu aplicativo móvel de comércio eletrônico seja eficaz, ela terá primeiro que consolidar todos os dados sobre estoque, compras de clientes, promoções, etc. Este é um processo simples de realizar hoje graças aos data warehouses, que são perfeitos armazéns de dados.
A segunda etapa consistirá em enriquecer estes dados com segmentação, estabelecendo categorias e subcategorias permitindo ao cliente selecionar as informações mais facilmente (roupas, cosméticos, eletrodomésticos). Este trabalho também permitirá gerenciar com mais precisão o histórico do cliente.
Isto leva naturalmente à terceira etapa, a otimização das recomendações comerciais para o cliente graças à inteligência artificial.
Imaginemos que os dados nos permitiram identificar que duas vezes nos últimos três anos, um cliente comprou equipamento de esqui para seu filho na época da Feira do Vinho. É certamente do interesse da empresa recomendar as promoções em equipamento de esqui, no tamanho certo, para rapazes.
Quando a concordância de compra é explorada de forma inteligente, pode gerar um aumento de 2 a 4% na cesta média.
Todo este processo e o fluxo de exploração dos dados “data pipeline” também têm a vantagem de permitir o aprimoramento contínuo de seus serviços. Quando se repetem atrasos na entrega ou devoluções de itens defeituosos, uma análise fina dos dados por um algoritmo permite determinar se é porque a encomenda foi deixada no portão do edifício em vez de ser entregue dentro ou se tem a ver com um produto ou prestador de serviços específico.
A nuvem: o melhor de ambos os mundos
Mas para conservar o controle dos seus dados e aproveitá-los ao máximo, é preciso armazená-los no lugar certo. Alguns optam por uma solução interna através de uma nuvem privada e seus próprios data centers. Uma opção que garante a segurança dos dados, sem dúvida, mas este modelo, estático e muitas vezes atrasado em termos de tecnologia, limita as possibilidades de desenvolvimento.
Outros escolhem plataformas “up-to-date” de provedores de serviços que hospedam os dados na nuvem pública. O risco em termos de confidencialidade e os altos custos inerentes aos fluxos de entrada e saída não são nada insignificantes (antes pelo contrário, podem ser exponenciais).
Há uma terceira possibilidade: a solução híbrida. O princípio é usar a nuvem pública como uma ferramenta de mobilidade (IoT/Edge) que oferece uma potência maciça de conexão e escalabilidade. Combinada com uma nuvem privada, operada internamente ou por um fornecedor de serviços, esta solução permite proteger os dados sensíveis da empresa relativos às suas aplicações comerciais e profissionais. Chamo a isto uma arquitetura de “Hybrid Data Fabric“, ou Tecido de Dados Híbrido. Ela otimiza o armazenamento, garante a segurança de seus dados e passa a ser o alicerce do seu pipeline de dados.
O HDF (Hybrid Data Fabric) libera as energias para melhor entender seus dados e inovar com eles.
20/01/2022