Erro de login - Timeout - ID|SIGN
Incident Report for unico
Postmortem

No dia22 de Abril de 2024, por volta das 11:10 tivemos degradação das funcionalidades de assinatura, criação de envelopes e gestão de envelopes no Sign para todos os produtos da unico.

Ao investigar, identificamos um alto volume de processamento do banco de dados, gerando o cenário de falhas e degradação na plataforma. O banco de dados estava lidando com um volume muito grande (anormal) de requisições de um cliente específico. Para lidar com o incidente, configuramos o rate limit para definir um limite para requisições do ofensor. Em paralelo, fizemos um scale up dos recursos disponíveis no banco. Por volta das 12:12 a plataforma estabilizou.

Para evitar cenários futuros, nosso time criou um plano de ação que consiste em revisão e otimização de algumas queries SQL, revisão da política de expurgo de dados, revisão da política de timeout de conexões da base de dados e criação de uma política de rate limit para evitar cenários de DoS/storm events.

Posted May 06, 2024 - 15:25 GMT-03:00

Resolved
Incidente resolvido.
Após monitoramento, validamos que a plataforma está funcionando corretamente
Posted Apr 22, 2024 - 12:59 GMT-03:00
Monitoring
A execução das ações necessárias foi concluída com sucesso, restabelecendo o ambiente.
Estamos iniciando a fase de operação assistida
Posted Apr 22, 2024 - 12:26 GMT-03:00
Identified
Identificamos a causa do problema, e estamos trabalhando na correção.
Posted Apr 22, 2024 - 11:40 GMT-03:00
Investigating
Identificamos um problema na plataforma ID|SIGN, causando indisponibilidade no ambiente para o usuário.

A falha acabou afetando também serviços de retorno de score no UNICO CHECK
Posted Apr 22, 2024 - 11:33 GMT-03:00
This incident affected: Unico Sign (Dashboard, API, Assinatura, Autenticação).