Instabilidade no Serviço de Assinatura Digital (Unico Sign)

Incident Report for unico

Postmortem

Postmortem: Instabilidade no Serviço de Assinatura Digital (Unico Sign)

Resumo

Entre 22:10 do dia 13 de março e 10:20 do dia 14 de março de 2025 (horário local), a funcionalidade de busca de documentos (envelopes) em nosso serviço de assinatura digital foi impactada. Documentos criados após o início do incidente não apareciam nos resultados das buscas. A causa foi a interrupção da sincronização de dados entre o banco de dados principal e uma réplica de leitura, utilizada para consultas, após uma rotina de manutenção planejada. A sincronização foi restabelecida e a funcionalidade de busca normalizada.

Impacto

Durante o período do incidente, clientes que tentavam localizar documentos recém-criados através da funcionalidade de busca não conseguiam encontrá-los. Documentos criados antes da manutenção eram retornados normalmente. Isso afetou a capacidade dos usuários de gerenciar e acessar documentos recentes pela interface de busca.

Causa Raiz

A causa raiz do incidente foi a interrupção da sincronização de dados para uma réplica de leitura do banco de dados principal do serviço de assinatura digital. Essa interrupção ocorreu após a execução de rotinas de manutenção planejadas no banco de dados principal na noite do dia 13/03. Como resultado, os dados mais recentes (documentos criados após a manutenção) não foram replicados para a instância de leitura, que é especificamente utilizada para otimizar as operações de busca. Consequentemente, as buscas realizadas consultavam dados desatualizados.

Resolução

A equipe de engenharia identificou o problema de sincronização na manhã do dia 14/03. A sincronização entre o banco de dados principal e a réplica de leitura foi restabelecida manualmente. Após a conclusão da sincronização dos dados pendentes, a funcionalidade de busca voltou a operar normalmente por volta das 10:20.

Ações Corretivas

Para prevenir a recorrência e melhorar a detecção de problemas similares, a seguinte ação foi implementada:

  • Criação de um alerta automático para monitorar o status da replicação do banco de dados e notificar a equipe caso a sincronização seja interrompida ou apresente atrasos significativos.

Lições Aprendidas

  • Rotinas de manutenção em bancos de dados, mesmo que planejadas, podem ter efeitos colaterais inesperados nos mecanismos de replicação. É crucial validar o status da replicação após qualquer intervenção.
  • A falta de monitoramento específico do status da replicação pode levar a uma detecção tardia de problemas que afetam funcionalidades dependentes de dados atualizados em réplicas.
  • É importante ter procedimentos claros para verificar a saúde de todos os componentes do sistema após atividades de manutenção.

Agradecemos a compreensão e estamos à disposição para esclarecer quaisquer dúvidas.

Atenciosamente, Equipe Unico.

Posted Apr 11, 2025 - 11:46 GMT-03:00

Resolved

Incidente resolvido.
Após monitoramento, validamos que os serviços de assinatura estão estáveis e funcionando corretamente.
Posted Mar 14, 2025 - 12:09 GMT-03:00

Monitoring

As ações corretivas para o incidente de assinatura digital foram executadas. Nosso time de tecnologia está em monitoramento assistido acompanhando a performance dos ambientes.
Posted Mar 14, 2025 - 10:27 GMT-03:00

Update

Identificamos a causa da instabilidade na funcionalidade do fluxo SMS na Assinatura Digital da Unico (Unico SIGN) e nosso time de tecnologia está atuando para a resolução. Em breve traremos atualizações.
Posted Mar 14, 2025 - 10:11 GMT-03:00

Update

Identificamos a causa da instabilidade na funcionalidade de Assinatura Digital da Unico (Unico SIGN) e nosso time de tecnologia está atuando para a resolução. Em breve traremos atualizações.
Posted Mar 14, 2025 - 10:08 GMT-03:00

Identified

Identificamos a causa da instabilidade na funcionalidade do fluxo SMS na Assinatura Digital da Unico (Unico SIGN) e nosso time de tecnologia está atuando para a resolução. Em breve traremos atualizações.
Posted Mar 14, 2025 - 09:47 GMT-03:00
This incident affected: IDCloud | IDSign (Assinatura Eletrônica (API)).