[CLOCK IN] Falha na execução da Pipeline Hashes: ES Config

Description

  • Formulário de origem: Abertura de issue para Plataforma Carol

  • Formulário preenchido por: marcos.marcone@totvs.com.br

  • Informe a sua área de atuação na TOTVS: PNRH - Clock In

  • Ambiente impactado: Produção

  • Fase/estágio: Já estamos em PRODUÇÃO

  • Informe o assunto a ser direcionado: Quero reportar um tema que não consta em nenhuma das opções anteriores

  • Informe a Org relacionada: clockin

  • Informe o tenant/ambiente relacionado: clockinunif

  • Ciente de que, caso precise trazer upload de anexos, ele deverá acontecer na issue criada no JIRA Produção.: Estou ciente que o envio destas evidências será realizado diretamente na issue criada no JIRA PRODUÇÃO.

  • Informe a prioridade da sua issue: ALTA: o tema gera interrupção no funcionamento da aplicação, mas não provoca impacto financeiro direto. Ex.: telas de erro de programação, exceções no sistema.

  • Sendo prioridade CRÍTICA, relate a justificativa:

  • Título - Resumo: [CLOCK IN] Falha na execução da Pipeline Hashes: ES Config

  • Descreva o seu problema:

Contexto

Após a migração bem-sucedida da pipeline Hashes para o ambiente unificado (clockinunif), foram detectadas falhas intermitentes em sua execução. Embora a pipeline tecnicamente esteja correta, instabilidades na infraestrutura da Plataforma Carol têm causado a interrupção do processamento.

Descrição do Problema

As falhas são intermitentes e ocorrem em diferentes janelas de execução, por vezes apresentando erros em sequência.

Conforme evidenciado nos logs, o processamento é interrompido durante a fase de montagem da pipeline (Error building pipeline).

  • Logs de Erro: O sistema retorna uma exceção do Elasticsearch indicando que o índice não foi encontrado.

  • Frequência: Ocorrências registradas em diversas datas (ex: 01/04, 27/03, 26/03, 19/03, 16/03), demonstrando um padrão de instabilidade na plataforma.

Detalhes Técnicos

  • Tenant Id: 10d04fe8037e4c5a98a44e254db092ce

  • Erro Identificado:

Cause: [ElasticsearchStatusException] - Elasticsearch exception [type=index_not_found_exception, reason=no such index]

Impacto Operacional (Crítico)

Impacto Operacional

Diferente do modelo anterior via Orquestrador, onde uma falha de plataforma afetaria apenas tenants isoladas, no ambiente unificado a falha afeta todos os clientes.

Evidências