[CLOCK IN] Falha na execução da Pipeline Hashes: ES Config
Description
-
Issue Jira Produção: https://jiraproducao.totvs.com.br/browse/IDEIA-3342
-
Reporter: TOTVS IDEIA
-
Creator: Marcos Henrique Fernandes Marcone
-
Formulário de origem: Abertura de issue para Plataforma Carol
-
Formulário preenchido por: marcos.marcone@totvs.com.br
-
Informe a sua área de atuação na TOTVS: PNRH - Clock In
-
Ambiente impactado: Produção
-
Fase/estágio: Já estamos em PRODUÇÃO
-
Informe o assunto a ser direcionado: Quero reportar um tema que não consta em nenhuma das opções anteriores
-
Informe a Org relacionada: clockin
-
Informe o tenant/ambiente relacionado: clockinunif
-
Ciente de que, caso precise trazer upload de anexos, ele deverá acontecer na issue criada no JIRA Produção.: Estou ciente que o envio destas evidências será realizado diretamente na issue criada no JIRA PRODUÇÃO.
-
Informe a prioridade da sua issue: ALTA: o tema gera interrupção no funcionamento da aplicação, mas não provoca impacto financeiro direto. Ex.: telas de erro de programação, exceções no sistema.
-
Sendo prioridade CRÍTICA, relate a justificativa:
-
Título - Resumo: [CLOCK IN] Falha na execução da Pipeline Hashes: ES Config
-
Descreva o seu problema:
Contexto
Após a migração bem-sucedida da pipeline Hashes para o ambiente unificado (clockinunif), foram detectadas falhas intermitentes em sua execução. Embora a pipeline tecnicamente esteja correta, instabilidades na infraestrutura da Plataforma Carol têm causado a interrupção do processamento.
Descrição do Problema
As falhas são intermitentes e ocorrem em diferentes janelas de execução, por vezes apresentando erros em sequência.
Conforme evidenciado nos logs, o processamento é interrompido durante a fase de montagem da pipeline (Error building pipeline).
-
Logs de Erro: O sistema retorna uma exceção do Elasticsearch indicando que o índice não foi encontrado.
-
Frequência: Ocorrências registradas em diversas datas (ex: 01/04, 27/03, 26/03, 19/03, 16/03), demonstrando um padrão de instabilidade na plataforma.
Detalhes Técnicos
-
Tenant Id:
10d04fe8037e4c5a98a44e254db092ce -
Erro Identificado:
Cause: [ElasticsearchStatusException] - Elasticsearch exception [type=index_not_found_exception, reason=no such index]
Impacto Operacional (Crítico)
Impacto Operacional
Diferente do modelo anterior via Orquestrador, onde uma falha de plataforma afetaria apenas tenants isoladas, no ambiente unificado a falha afeta todos os clientes.
Evidências
-
Figura 1: Log detalhado da exceção no Elasticsearch:
-
Figura 2: Histórico de falhas sequenciais na monitoria de tasks:
-
Exemplo de Task com falha: https://clockin.carol.ai/clockinunif/carol-ui/tasks/activity/2821b48f-5813-400f-9616-834702c69854