No dia 29 de Janeiro a partir de 08:20 nosso time identificou cenário de falhas que afetaram cerca de 25% das requisições do serviço do Token Biométrico. Ao investigar, nosso time verificou que a falha tinha relação com uma janela de manutenção programada que ocorrera minutos antes, onde um componente de gestão de tráfego entrou em produção com parametrizações incorretas, causando cenário de falha parcial. A correção desta configuração normalizou a operação as 14h.
Para evitar cenários futuros, temos um plano de ação que considera melhorias em alertas e thresholds no sistema de monitoração, revisões no processo/parametrizações no módulo de gestão de releases.