Instabilidade na Prova de Vida/Liveness

Incident Report for unico

Resolved

Atualização de Status: Incidente Resolvido

Prezado Cliente,

Informamos que a instabilidade que afetou a disponibilidade da capacidade de Prova de Vida (Liveness) foi totalmente resolvida. O serviço opera em normalidade desde as 19:09 (Horário de Brasília).

Abaixo, apresentamos o resumo executivo dos eventos:

1. Resumo Executivo e Impacto
O incidente ocorreu entre 18:56 e 19:09, totalizando 13 minutos de instabilidade. Durante este período, uma parcela das requisições de biometria enfrentou erros de limite de processamento (429) e falhas intermitentes de conexão (5xx).

2. Causa Raiz e Resolução
A instabilidade foi desencadeada por um aumento súbito e atípico no volume de requisições simultâneas em nossa plataforma, superando a capacidade de resposta imediata da infraestrutura compartilhada.

Causa Raiz: O volume abrupto de tráfego saturou as instâncias do nosso motor de processamento biométrico. Embora o sistema possua mecanismos de escalonamento automático, a velocidade da demanda causou uma exaustão temporária de recursos de rede (endereçamentos de IP), o que impediu a subida imediata de novas réplicas para absorver a carga excedente.

Resolução: Nossa equipe de engenharia realizou uma intervenção emergencial para expandir a infraestrutura e otimizar a distribuição de recursos de rede. Com a ativação de novas instâncias de processamento, o serviço foi estabilizado e os erros cessaram às 19:09.

3. Compromisso e Próximos Passos
A Unico reafirma seu compromisso com a resiliência e a alta disponibilidade de suas operações. Como medidas preventivas, já iniciamos:

Um Postmortem detalhado será elaborado e compartilhado em breve, detalhando as melhorias estruturais de longo prazo.

Lamentamos sinceramente o impacto causado em sua operação e permanecemos à disposição.

Atenciosamente, Equipe Unico.
Posted Mar 06, 2026 - 19:50 GMT-03:00

Monitoring

Status: Em Monitoramento (Estabilidade Reestabelecida)

Prezado Cliente,

Informamos que as ações corretivas para normalizar o serviço de Prova de Vida/Liveness foram finalizadas e o ambiente já apresenta estabilidade.

Ações Tomadas e Diagnóstico:
Nossa equipe de engenharia identificou que a instabilidade foi causada por uma saturação nas instâncias do motor de liveness. Um volume atípico de requisições por minuto (RPM) proveniente de fluxos de alta escala disparou o rate limit do microsserviço, gerando um efeito cascata de erros 429 e 5xx que impactou a disponibilidade aos clientes.

Para resolver o cenário, realizamos o escalonamento emergencial das instâncias, aumentando a capacidade de processamento e aliviando a carga sobre o sistema. Com essa medida, os tempos de resposta (latência) e a taxa de sucesso voltaram aos patamares normais.

Próximos Passos:
Entramos agora em fase de acompanhamento assistido. Nossa equipe permanece em monitoramento rigoroso da infraestrutura para garantir que o sistema suporte as novas faixas de tráfego sem oscilações. O serviço já pode ser utilizado integralmente.

Lamentamos o transtorno e seguimos à disposição.

Equipe Unico
Posted Mar 06, 2026 - 19:42 GMT-03:00

Identified

Atualização de Status: Incidente Identificado

Prezado Cliente,
Informamos que a origem da instabilidade na capacidade de Prova de Vida (Liveness) foi mapeada por nossa equipe de especialistas.

Status: Em correção
Identificamos um cenário de saturação em nossa infraestrutura que está gerando erros de limite de requisições (429). Nossa engenharia já iniciou o escalonamento de recursos e a implementação de medidas corretivas para aliviar a carga do sistema e normalizar o processamento das validações com prioridade máxima.

Estamos acompanhando a propagação dessas melhorias em tempo real e manteremos você atualizado sobre a recuperação do serviço.

Atenciosamente, Equipe Unico.
Posted Mar 06, 2026 - 19:29 GMT-03:00

Investigating

Prezado Cliente,

Identificamos uma instabilidade que afeta a capacidade de Prova de Vida (Liveness) em nossos serviços.
Nossa equipe de engenharia já está mobilizada e trabalhando intensamente no diagnóstico para restabelecer a normalidade o mais breve possível. Entendemos a importância dessa funcionalidade para sua operação e priorizamos a resolução deste cenário.

Reforçamos nosso compromisso com a transparência e enviaremos novas atualizações assim que tivermos mais informações sobre a evolução do reparo.

Atenciosamente, Equipe Unico.
Posted Mar 06, 2026 - 19:21 GMT-03:00
This incident affected: IDCloud | IDLive (Prova de Vida (API)).