Instabilidade no Serviço de Integração - ID Cloud, ID Check e ID Pay

Incident Report for unico

Postmortem

Prezado Cliente,

Na última sexta-feira, 27 de junho, às 14:52 (horário de Brasília), detectamos um aumento súbito e drástico na latência das chamadas de biometria facial, afetando as capacidades do Unico IDCloud e do Unico IDPay, evoluindo para uma indisponibilidade parcial para todos os nossos clientes. A operação foi gradativamente retomada, sendo normalizada por completo naquele mesmo dia, às 17:21 (horário de Brasília).

Infelizmente, o mesmo cenário foi identificado no dia 30, às 9:37 (horário de Brasília). No entanto, este foi solucionado rapidamente, e às 10:03 (horário de Brasília), a operação já estava normalizada. Nesse contexto, compartilhamos abaixo um resumo executivo da situação com a respectiva causa raiz, bem como as providências tomadas para assegurar que eventos semelhantes não voltem a acontecer no futuro:

Capacidades de Unico IDCloud afetadas:

  • Score de Risco (IDCheck)
  • Verificação de Identidade (IDUnico)
  • Prova de Vida (IDLive/Liveness)
  • Validação 1:1 (Token biométrico)
  • Captura e Reaproveitamento de Documentos (IDDocs)
  • Assinatura Eletrônica (IDSign)
  • Alerta de Comportamento (IDTrust)

Meios de Integração afetados:

  • ByUnico
  • ByClient

Causa raiz:

A causa raiz imediata identificada foi o uso excessivo da CPU em nosso banco de dados de leitura. Consequentemente, houve um efeito cascata que sobrecarregou também o nosso banco de dados vetorial (frAPI).

Ações realizadas/em andamento (Unico):

  1. Implementamos a redução da cota de requisições, normalizando as operações dos bancos de dados e restabelecendo os serviços.
  2. Estamos aumentando a redundância do respectivo banco de dados, garantindo maior resiliência à aplicação.
  3. Temos duas linhas de investigação em andamento para compreender completamente o incidente e prevenir futuras ocorrências:
* Bancos de Dados: **Estamos conduzindo uma revisão aprofundada da arquitetura dos bancos de dados em conjunto com o GCP** para identificar e otimizar possíveis gargalos.
* Comunicação entre aplicação e bancos: Estamos investigando mudanças recentes em nossa aplicação que possam ter introduzido um novo comportamento na interação com os bancos de dados, justificando o aumento inesperado de requisições.

Ações necessárias (clientes):Para todos os casos de erro 500 no CreateProcess, durante o período do incidente:

  • O cliente com ByUnico ou ByClient com SDK deve realizar uma nova captura
  • O cliente com ByClient sem SDK deve enviar novamente a foto + CPF

Compromisso de melhoria contínua:

Além das ações descritas, seguimos monitorando atentamente nossos serviços e ajustando os mecanismos de controle para prevenir quaisquer novas ocorrências.

Reiteramos que todas as capacidades estão funcionando normalmente desde às 10:03 do dia 30 de junho (independente do meio de integração utilizado pela sua empresa).

Agradecemos a compreensão, e havendo qualquer atualização relevante, os informaremos.

Lamentamos o ocorrido, e seguimos à disposição.

Atenciosamente,

Unico

Posted Jul 01, 2025 - 09:29 GMT-03:00

Resolved

Incidente resolvido. Após monitoramento, validamos que o ambiente está estável e funcionando corretamente.
Posted Jun 27, 2025 - 18:09 GMT-03:00

Monitoring

Prezado Cliente,

Nossa equipe identificou as causas e realizou as ações para que este incidente fosse solucionado.
Dentro de alguns dias compartilharemos maiores detalhes através de um Postmortem.

Pedimos desculpas pelo transtorno e nos colocamos à disposição para sanar dúvidas através dos nossos canais de atendimento.
Atenciosamente, Equipe Unico!
Posted Jun 27, 2025 - 17:28 GMT-03:00

Update

Prezado Cliente,

Nossa equipe segue trabalhando e estabilizando o ambiente. Segue atualização das capacidades que estão sendo restabelecidas:
ID Trust (Alerta de Comportamento) - operacional.
ID Check + Token (Score de Risco e Token Biométrico) - operacional.
ID Unico (Verificação de Identidade) - operacional.
ID Pay - operacional.
IDSign - operacional.

Nosso ambiente pode ainda ter oscilações pontuais, mas estamos avançando para a normalização, com estabilidade total.
Posted Jun 27, 2025 - 17:06 GMT-03:00

Update

Prezado Cliente,

Nossa equipe segue trabalhando e estabilizando o ambiente. Segue atualização das capacidades que estão sendo restabelecidas:
ID Trust (alerta de comportamento) - operacional.
ID Check + Token (Score de Risco e Token Biométrico) - estamos retornando de maneira gradativa e controlada aos clientes.

Aos demais fluxos, seguimos acompanhando e trazemos update em breve.
Posted Jun 27, 2025 - 16:30 GMT-03:00

Update

Prezados Clientes,

Nossa equipe técnica está focada nas ações para estabilizar o ambiente, contudo ainda permanecemos com requisições retornando latência e/ou indisponibilidade. Sendo assim, ainda serão refletidos erros nos ambientes de nossos clientes.

Em breve atualizaremos novamente o status deste incidente.
Posted Jun 27, 2025 - 15:50 GMT-03:00

Update

Prezados Clientes,

Nossa equipe de tecnologia segue mobilizada a realizar as ações de contorno para normalizar o ambiente.
Neste momento, poderão aumentar os índices de erros 429 enquanto nosso time de Engenharia realiza as ações de contingência e corretivas.

Em breve retornamos com atualizações.
Posted Jun 27, 2025 - 15:16 GMT-03:00

Update

Prezados Clientes,

Nossa equipe de tecnologia está atuando proativamente para identificar a causa raiz e restabelecer a normalidade dos serviços ID Cloud e ID Pay. Identificamos uma instabilidade que está impactando diretamente as integrações By Unico e By Client, resultando em dependências afetadas.

Manteremos todos informados com novas atualizações sobre o progresso e a resolução do incidente em breve.

Agradecemos a sua compreensão e paciência.
Posted Jun 27, 2025 - 15:05 GMT-03:00

Identified

Prezado Cliente,
Nossa monitoração identificou uma lentidão podendo seguir de indisponibilidade, afetando as capacidades do ID Cloud e ID Pay, causando impacto de dependências nas integrações By Unico e By Client. Nosso time de tecnologia está trabalhando para identificar e resolver o problema com brevidade.
Posted Jun 27, 2025 - 14:52 GMT-03:00
This incident affected: IDCloud | Check (Score de Risco (API), Token Biométrico (API)), IDPay (API), IDCloud | IDUnico (Verificação Identidade (API)), IDCloud | IDLive (Prova de Vida (API)), ID Cloud | IDTrust (IDTrust | Alerta de Comportamento (API)), IDCloud | IDDocs (Documentos (API)), IDCloud - By Unico (IDCloud - By Unico (API)), and IDCloud - By Client (SDK).