Como melhorar o tempo de atividade dos sistemas de edge computing: estratégias que realmente funcionam
Por Anderson Santos*
Quando os usuários finais perguntam como gerenciar melhor e manter seus novos sistemas de processamento descentralizados (edge computing), a resposta nem sempre é direta. Diferentemente dos data centers, a maioria das aplicações de edge é considerada não-crítica.
Se um sistema ou rede falhar em uma cadeia de restaurante e as pessoas não puderem mais acessar a opção automatizada para visualizar os menus, o nível de conveniência cairá, mas os negócios não serão dramaticamente interrompidos. Porém, se os sistemas locais de preparação de alimentos ou de cobrança não funcionarem e as refeições dos clientes não puderem ser entregues, o restaurante precisará fechar temporariamente, e esses custos de inatividade serão significativos.
Como resultado, cada local que hospeda um sistema de edge computing é confrontado com diferentes elementos que afetam seu custo de tempo de inatividade não planejado.
Os negócios perdidos são um exemplo do custo direto do tempo de inatividade. Em outros tipos de ambiente de edge computing, o custo indireto associado ao tempo de inatividade não planejado também pode ser substancial.
Um exemplo: se um roteador de uma turbina eólica situada em uma área remota da Escandinávia falhar, o técnico levará pelo menos um dia para ir até o local, reparar ou substituir a unidade defeituosa e depois retornar. Poderá ser necessário um helicóptero, e, se o inverno for rigoroso, o risco para a segurança humana aumentará. A substituição de um único roteador de US﹩ 300,00 poderá acabar custando dezenas de milhares de dólares apenas em taxas de manutenção.
Três abordagens para gerenciar a manutenção do sistema de edge computing
Embora problemas como erro humano e proteção insuficiente de energia contribuam para instâncias de tempo de inatividade dos sistemas de edge computing, a maior causa de inoperância na edge é a falta de manutenção.
Dispositivos como um UPS emitirão um alarme sonoro se encontrarem um problema, como uma bateria gasta ou uma queda de energia. Se ninguém estiver no local para ouvir o alarme e resolver o problema, a proteção de energia será perdida, e o sistema ficará exposto a blecautes, quedas e surtos de energia.
Os usuários finais que investem em edge computing geralmente escolhem uma destas três abordagens para gerenciar e manter seus sites:
• Abordagem reativa - essa é uma abordagem extrema geralmente implementada pelos varejistas. Os sistemas vão se deteriorando até que ocorra um colapso que interrompa o fluxo de negócios. As equipes de resposta são, então, contratadas para corrigir a situação o mais rápido possível, para que o tempo de inatividade resultante possa ser reduzido ao mínimo.
• Abordagem preventiva - nessa abordagem mais proativa, um membro não-técnico da equipe monitora periodicamente os pontos de edge. Com base na idade dos ativos e no histórico de falhas, realiza-se regularmente a manutenção programada (um técnico pode vir uma vez por semana e só ajustar o equipamento ou fazer uma manutenção óbvia).
• Abordagem preditiva - nesse modelo de manutenção 100% proativo, os ativos são gerenciados ativamente (na maioria das vezes, de forma remota) e monitorados em tempo real, garantindo que ocorra um tempo de inatividade não planejado mínimo. Alertas automáticos são gerados com base em sinais de comportamento anormal do equipamento. Tais alertas são acionados rapidamente, e os reparos são realizados antes que ocorra qualquer tempo de inatividade.
Dados de campo indicam que, ao contrário do suposto inicialmente, a abordagem preditiva é menos onerosa que as duas primeiras. Além disso, os stakeholders que gerenciam seus ambientes dessa maneira convivem com um grau de medo, incerteza e dúvida muito menor em relação ao tempo de atividade dos seus sistemas de edge computing.
Métodos de mitigação de tempo de inatividade
Independentemente da natureza do site de edge e da abordagem usada para gerenciamento e manutenção, o tempo de inatividade do sistema sempre será percebido como um mal necessário que aumenta os custos. A pergunta é: quanto custa? Cada instalação responderá a essa pergunta de uma forma, com base nos orçamentos e na adversidade ao risco.
Hoje, existem várias opções para melhorar o gerenciamento e a manutenção da edge. Uma delas é investir em software de monitoramento, que fornece visibilidade aos ativos remotos no campo. Outra é garantir que a solução de edge esteja equipada com hardware robusto, para que as instâncias de tempo de inatividade sejam menos frequentes. E uma terceira opção é mitigar o risco de tempo de inatividade por meio de contratos de serviço a um custo razoável.
*Anderson Santos é gerente de Canais de TI da Schneider Electric Brasil. A Schneider Electric é líder global na transformação digital em gestão da energia elétrica e automação.
Compartilhe:: Participe do GRUPO SEGS - PORTAL NACIONAL no FACEBOOK...:
<::::::::::::::::::::>