Como os dados são coletados e, em seguida, transformados em informações úteis para a tomada de decisão dos administradores de uma cidade? Qual é seu percurso desde o mundo físico (o campo) até o mundo digital (armazenamento, IA, aplicações profissionais, etc.)? Veja o roteiro.
O sistema de processamento de dados nos ambientes de tipo “smart” podem parecer um verdadeiro labirinto para o leigo. No início da cadeia, temos os sensores que recolhem os elementos do campo e os transformam em dados digitais. Recupera-se assim as temperaturas, o nível de enchimento de uma lixeira ou um índice de CO2. Para completar esses dados recolhidos no campo, recupera-se também os dados provenientes de sistemas externos, como a meteorologia…
Na outra ponta deste caminho emaranhado, está o mundo complexo das aplicações que servem para orientar na tomada de decisões que devem iniciar ações. Fala-se então, por exemplo, de aplicações profissionais utilizadas pelos serviços técnicos de uma cidade, ou de aplicações web ou móveis para o pessoal operacional e os usuários finais.
Ainda há toda uma parte, menos conhecida, entre o objeto conectado e a aplicação: são os tijolos que enriquecem dados brutos para criar informações de valor agregado que permitem tomar decisões e agir. A primeira tarefa desta “caixa negra” consiste em recolher dados, através de sensores diversos e variados, o que exige ser capaz de levar em consideração todos os protocolos de comunicação desses sensores.
Convergência para o “data lake”
Todos os tipos de dados, e sobretudo todos os formatos, são então encaminhados para um “data lake”, um conjunto de “dados não estruturados nem modificados”, uma zona de armazenamento onde, se não for corretamente organizada, os data scientists se arriscam a passar muito tempo procurando o caminho. “Eles podem dedicar 75 % do seu tempo a “limpar os dados” antes de poder interpretá-los”, explica Gwendal Azous, consultor IoT da Axians, a marca da VINCI Energies dedicada às TICs.
Por exemplo, consoante o tipo de sensores, um dado de temperatura pode ser expresso ou em graus Celsius ou em graus Fahrenheit. Para aumentar a eficácia, será necessário homogeneizar este dado.
Para fazer isso, a Axians instala um software rio acima, antes do armazenamento, para padronizar os dados. Uma temperatura em Fahrenheit será automaticamente convertida em graus Celsius se o cliente optou por esse padrão com seu integrador. Idem para as datas cujas estruturas variam de um país para outro. “Essa organização do “data lake”, insiste Edouard Henry-Biabaud, Business Development Manager Axians, é fundamental para a eficácia do sistema”.
Uma vez padronizada, a norma vai seguir um caminho nas diferentes bases de dados que constituem o “data lake”. Essas têm características específicas de retenção, chamada persistência (vida útil do dado), de velocidade de acesso e de capacidade de armazenamento, dependendo dos tipos de processamento que se quer aplicar a este dado.
BDD quentes, mornas e frias
As bases de dados (BDD) chamadas quentes, por exemplo bases relacionais (de tipo SQL), permitem acessar muito rapidamente os dados para processá-los quase em tempo real. Aqui encontramos por exemplo o referencial objetos, os dados de monitoramento requerendo um tratamento ou uma reação imediata. O prazo de conservação dos dados é limitado, entre uma e quatro semanas.
Depois do prazo, os dados não são destruídos mas transferidos para uma base de dados “frios”, que serve para o arquivamento. Numa base deste tipo, o tempo de acesso ao dado não tem muita importância.
“A partir de medições como o fluxo dos pedestres, a temperatura e a taxa de ocupação do estacionamento, poderemos prever a taxa de frequentação da loja”
As bases chamadas mornas são o universo do big data. Associando quantidade e velocidade de processamento, elas alimentam os processos de análise de dados e os algoritmos “inteligentes”.
“Disponíveis em média durante ao menos um ano (isto depende muito do número de casos de uso e do volume de dados), essas bases serão utilizadas para realizar análises preditivas para otimizar a manutenção ou para antecipar comportamentos e tomar decisões antes de um evento”, afirma Edouard Henry-Biabaud.
Uma fase importante do processamento do dado é a sua colocação no contexto. “ O dado bruto “a temperatura é de 22 graus” não é suficiente para determinar seu interesse. Mas, uma vez cruzado com o dado do mês e do local, o dado passa a ser significativo. 22° em janeiro em Paris é um dia quente. Em agosto, é um dia normal. Uma vez cruzados pelos analistas de dados, os mesmos são enriquecidos e produzem informações; as informações processadas pela IA produzirão conhecimentos”, explica Edouard Henry-Biabaud.
“Dessa maneira, a partir de três medições como o fluxo dos pedestres, a temperatura e a taxa de ocupação do estacionamento, poderemos prever a taxa de frequentação da loja”, completa Gwendal Azous.
Aplicações para agir
Uma vez coletados, padronizados e armazenados na base adequada, os dados irão desempenhar seu papel de “combustível” para as aplicações finais. O interesse dessa arquitetura, para uma cidade ou uma empresa, é poder muito facilmente multiplicar aplicações diferentes que irão buscar os dados necessários nas diferentes bases quentes, mornas e frias deste “data lake” único.
Diferentes tipos de aplicações acessam as bases de dados através de APIs, isto é de softwares de conexão.
Por um lado, há aplicações profissionais, que dão uma visão precisa de um caso de uso, como o gerenciamento da iluminação pública, da qualidade do ar ou da coleta dos resíduos. Este tipo de aplicações permite aos serviços técnicos da cidade, geralmente organizados por áreas de intervenção, acessar as informações relevantes para cumprir suas tarefas.
Por outro lado, há aplicações transversais, que correlacionam informações de diferentes casos de uso para dar um ponto de vista mais variado, menos compartimentado, do funcionamento da cidade. Um hipervisor pode ser instalado por cima do conjunto para facilitar a visualização, e por conseguinte, a inclusão das informações importantes provenientes dessas diferentes aplicações.
Desde a coleta até o processamento dos dados, a organização do sistema de informação de uma cidade produz conhecimentos que permitem tomar decisões: quem decide finalmente é o ser humano bem informado, não o algoritmo!
14/11/2019