Instabilidade no Serviço de Captura e Reaproveitamento de Documentos (ID DOCs)

Incident Report for unico

Postmortem

Postmortem: Instabilidade no Serviço de Captura e Reaproveitamento de Documentos (ID DOCs)

Resumo

Entre 12:38 e 12:52 BRT em 30 de julho de 2025, tivemos uma latência em nosso serviço de captura e reaproveitamento de documentos, afetando a experiência de nossos clientes. O problema foi resolvido automaticamente assim que a dependência interna normalizou seu funcionamento.

Impacto

Houve um aumento no tempo de resposta, com algumas requisições gerando latências em torno de 5 segundos, excedendo nosso SLO de 3 segundos. Embora a latência tenha sido temporária, ela impactou clientes que estavam processando documentos ativamente durante esse período.

Causa Raiz

A latência foi causada por uma dependência interna, responsável pela assinatura e criptografia de URLs, que se tornou temporariamente indisponível. A indisponibilidade da dependência interna impediu a autenticação em um serviço de criptografia externo, resultando em erros. A causa exata da indisponibilidade do serviço interno ainda está sob investigação.

Resolução

O serviço foi normalizado sem intervenção manual. A degradação da latência cessou logo após o período de indisponibilidade da dependência interna.

Lições Aprendidas

  • Melhorar a Observabilidade e a Depuração: A investigação inicial foi dificultada por mensagens de erro genéricas e a falta de logs detalhados. Aprimorar as mensagens de erro nos logs facilitará a identificação e a resolução de problemas em tempo real.

  • Aprimorar a Resiliência do Serviço: A dependência de um único serviço de criptografia externo apresentou um ponto de falha. Avaliaremos o uso de bibliotecas de criptografia mais resilientes para mitigar a dependência de um serviço externo específico

Posted Aug 13, 2025 - 16:27 GMT-03:00

Resolved

Incidente resolvido.
Após monitoramento, validamos que o serviço está estável e funcionando corretamente.
Posted Jul 30, 2025 - 13:33 GMT-03:00

Monitoring

As ações corretivas para o incidente do fluxo de captura e reaproveitamento de documentos foram executadas. Nosso time de tecnologia está em monitoramento assistido acompanhando a performance do ambiente.
Dentro de alguns dias compartilharemos maiores detalhes através de um postmortem.

Pedimos desculpas pelo transtorno e nos colocamos à disposição para sanar dúvidas através dos nossos canais de atendimento.
Atenciosamente, Equipe Unico!
Posted Jul 30, 2025 - 13:00 GMT-03:00

Identified

Identificamos as causas da instabilidade na capacidade de Captura e Reaproveitamento de Documentos (ID DOCs).
Nossa equipe de tecnologia está atuando para solução deste incidente. Em breve traremos atualizações.
Posted Jul 30, 2025 - 12:50 GMT-03:00

Investigating

Nossa monitoração identificou um possível impacto na capacidade de Captura e Reaproveitamento de Documentos (ID DOCs), podendo afetar os processos integrados a essa capacidade.

Nosso time de tecnologia está analisando o ambiente.
Posted Jul 30, 2025 - 12:40 GMT-03:00
This incident affected: IDCloud | IDDocs (Documentos (API)).