Revisando Histórias de Operações do Site

Este artigo discute como você pode usar a Bancada de Trabalho de Histórias para revisar Histórias de Operações do Site em busca de problemas de conectividade e desempenho na sua rede.

Visão Geral

Cato XOps identifica Problemas de Rede, como degradação, além de potenciais Ameaças de Segurança. O motor avançado de Operações do Site detecta diferentes indicações e métricas relacionadas à conectividade e desempenho e gera histórias que correlacionam dados para problemas referentes à rede. Por exemplo, se um link WAN está intermitentemente experimentando alta perda de pacotes, o motor criará uma única história com todos os dados relevantes para o link.

A página da Bancada de Trabalho de Histórias mostra os detalhes de cada história para ajudar você a entender e analisar os problemas. Você pode classificar e filtrar as histórias para encontrar os incidentes mais importantes e depois detalhar uma história para investigar mais a fundo os detalhes para resolver o problema.

Indicações de Histórias de Operações do Site

Estas são as indicações de problemas de conectividade e desempenho de rede que são detectados pelo motor de Operações do Site para gerar histórias:

Indicação

Descrição

Limite para Gerar uma História

Site desconectado

O site se desconectou da Nuvem Cato.

Todos os links estão inativos por 2,5 minutos

Link inativo

Um dos links WAN de um site se desconectou da Nuvem Cato, o site ainda está conectado.

Um link está inativo por 5 minutos, ou um link teve 5 desconexões mais curtas em um período de 10 minutos

Sessão BGP desconectada

Uma sessão BGP se desconectou inesperadamente, o que pode impactar a conectividade de aplicativos e a experiência do usuário.

Uma sessão BGP está inativa por 5 minutos ou teve 5 ou mais desconexões mais curtas em um período de 10 minutos

Monitoramento LAN - host inacessível

Um host monitorado atrás de um site não está respondendo a pacotes de keep-alive do PoP e é considerado inacessível.

Exige uma regra de Monitoramento LAN configurada para o host.

Um evento de Monitoramento LAN Inacessível

SLA de qualidade do link

O limite de qualidade SLA do link para um site foi excedido. Isso pode impactar a experiência do usuário.

Os limites SLA são configurados para Regras de Saúde de Qualidade.

Notas:

  • Problemas de congestionamento de um link são excluídos das histórias SLA de qualidade do link.

  • Para clientes ILMM, histórias baseadas em latência e jitter não são geradas.

Um evento de Regra de Saúde de Qualidade

Status "Socket HA Not Ready"

Há um problema com a configuração de Alta Disponibilidade (HA) do Socket, e o status não está pronto.

Se uma das seguintes condições de Socket HA Not Ready ocorrer:

  • Conectado não está pronto por 5 minutos

  • Keepalive não está pronto por 60 minutos

  • Versão compatível não está pronto por 60 minutos

  • Failover para socket secundário por 60 minutos

Para mais sobre essas condições, veja O que é Socket HA

Reconexão do PoP para melhorar conectividade

O site foi forçado a se reconectar ao PoP para otimizar o desempenho. Reconectar ao PoP pode impactar a experiência do usuário.

Um evento de reconexão com esta mensagem:

Problema de desempenho detectado, reconectado a um nodo de serviço diferente na Nuvem Cato

Para mais sobre campos de mensagens de eventos, veja Entendendo Campos de Mensagem de Evento de Conectividade do Socket

Porta LAN inativa

Uma das portas LAN foi desconectada

A porta está inativa por 5 minutos

Link WAN alternativo inativo

Um dos links Alt. Links WAN desconectados

O link está inativo ou o número de canais caiu para 0 por 5 minutos

Socket Offline Após Atualização

Um Socket não reestabeleceu um túnel no tempo esperado após a atualização para uma nova versão.

O Socket está desconectado por 5 minutos após a conclusão do tempo de atualização esperado.

Entendendo o Ciclo de Vida da História de Operações do Site

Histórias de Operações do Site passam por diferentes etapas ao longo do ciclo de vida da história, desde o problema inicial que disparou a história até a resolução final. No entanto, os ciclos de vida das histórias são ligeiramente diferentes para histórias de Site inativo em comparação com outros tipos de história. Isso ocorre porque, quando uma história de Site inativo está em andamento, nenhuma outra história para o site é criada para evitar a criação de histórias redundantes.

Por exemplo, se um site com dois links WAN fica inativo, uma única história de Site inativo é gerada sem histórias separadas de Link inativo para cada link WAN.

Abaixo estão as etapas potenciais para uma história de Site inativo e outros tipos de história:

  • Etapas no ciclo de vida da história de Site inativo:

    1. Aberto - o problema está atualmente em andamento e a história é criada

    2. Monitoramento - O problema foi resolvido há menos de 2 horas

    3. Fechado - O problema foi resolvido por 2 horas e a história é fechada

  • Etapas no ciclo de vida de outros tipos de história:

    1. Em espera - O problema está em andamento, mas nenhuma história foi criada porque o site está atualmente inativo. O problema permanece em espera até que 2 minutos tenham se passado após a história de Site inativo ser fechada

    2. Aberto - o problema está atualmente em andamento e a história é criada

    3. Monitoramento - O problema foi resolvido há menos de 2 horas

    4. Fechado - O problema foi resolvido por 2 horas e a história é fechada

Nota

Nota: Histórias de Operações do Site também são automaticamente fechadas nos seguintes casos:

  • 30 dias de idade – Fechado para garantir rastreamento fresco se o problema recorrer

  • A história exige revalidação – O motor de Operações do Site determinou que a história precisa ser revalidada. O motor valida e reabre a história se o problema recorrer

  • Mudança de configuração – Uma entidade na história (link, site, faixa BGP, host) não é mais relevante devido a atualizações de configuração

Caso de Uso Exemplo

Este é um exemplo de caso de uso para um admin identificando e resolvendo uma história de rede de Operações do Site com a Bancada de Trabalho de Histórias:

  • Filtrou a Bancada de Trabalho de Histórias para mostrar histórias de Operações do Site abertas agrupadas por site

  • Identificou uma história de alta criticidade para o site de Nova York, com a indicação Link inativo

  • Abriu a página de detalhamento da história, revisou os dados da história e descobriu que o link WAN 01 do site estava desconectado da Nuvem Cato

  • Revisou o playbook relevante para investigar e solucionar o problema

  • Após verificar o Socket físico no site de Nova York, descobriu que o cabo do link WAN 01 estava defeituoso

  • Substituiu o cabo, confirmou que o link estava ativo e conectado e continuou a monitorar a história para possível recorrência do problema

  • História fechada automaticamente após duas horas sem recorrência

Mostrando a Página da Bancada de Trabalho de Histórias

A página da Bancada de Trabalho de Histórias mostra um resumo das histórias XOps da sua conta.

Para visualizar a página da Bancada de Trabalho de Histórias:

  • No menu de navegação, clique em Inicial > Bancada de Trabalho de Histórias.

Entendendo as Colunas de Histórias

Detection___Response_Workbench_w_Network.png

Coluna

Descrição

ID

ID exclusivo da Cato para esta história

Status

Os statuses de uma história de Operações do Site representam diferentes etapas ao longo do ciclo de vida da história, desde o problema inicial que disparou a história até a resolução final. O motor de Operações do Site atualiza automaticamente o status quando detecta as mudanças relevantes no incidente de rede. Estes são os tipos de status:

  • Aberto - O motor de Operações de Sites detectou um problema de rede que gerou a criação de uma história.

  • Monitoramento - O motor de Operações de Sites detectou que o problema inicial foi resolvido e continua monitorando para uma recorrência por duas horas. Se uma recorrência for detectada, o status muda de volta para Aberto.

  • Fechado - Uma história com status de Monitoramento muda para Fechado quando não há recorrência detectada por duas horas.

    Nota

    Nota: Somente histórias de Operações de Sites fecham automaticamente e apenas após 120 minutos sem que o problema ocorra novamente. Histórias de Segurança do XOps não fecham automaticamente.

Criado

Data do primeiro fluxo de tráfego da história.

Atualizado

Data do fluxo de tráfego mais recente da história.

Criticidade

  • O impacto potencial do problema na sua rede. Os valores vão de 1 (baixo impacto) a 10 (alto impacto).

Indicação

  • Indicação do problema de rede para a história.

Fonte

  • O local onde o problema de rede está ocorrendo.

Ocorrências

O número de vezes que o problema ocorreu, incluindo recorrências após uma resolução temporária. Por exemplo, se um link desconectar e reconectar repetidamente, cada desconexão conta como uma ocorrência.

Tipo de Motor.

O motor que criou a história. Para histórias de Operações de Sites, o motor é Operações de Sites.

Agrupando as Histórias

Para fornecer contexto ao revisar as histórias, você pode mostrar as histórias em grupos definidos por detalhes, incluindo Fontes, Indicação, Status, e Tipo. Por exemplo, você pode mostrar juntas todas as histórias relacionadas a um local de fonte específico ou todas as histórias de Qualidade de Link SLA. Isso oferece uma perspectiva mais ampla ao analisar as histórias e pode ajudar você a entender e resolver problemas mais rapidamente.

Para histórias de Operações de Sites, Fontes são sites na sua rede.

Recomendamos, como uma boa prática, começar sua análise das histórias de Rede agrupando por Fontes.

Cada grupo destaca os níveis de criticidade das histórias nesse grupo, incluindo o número de histórias de alta, média e baixa criticidade.

Stories_Workbench_Grouping.png

Para agrupar as histórias na Bancada de Trabalho de Histórias:

  1. No menu de navegação, clique em Inicial > Bancada de Trabalho de Histórias.

  2. No menu suspenso Agrupar Por, selecione o critério necessário.

    As histórias são mostradas em grupos expansíveis.

Filtrando as Histórias.

Existem três maneiras de filtrar os dados na Bancada de Trabalho de Histórias:

  • Selecione um filtro predefinido.

  • Atualize automaticamente o filtro com um item selecionado.

  • Configure o filtro manualmente.

Filtros Predefinidos.

Você pode selecionar um filtro predefinido para focar em histórias de Operações de Rede ou Operações de Segurança. Ao selecionar um filtro predefinido, as colunas de histórias mais relevantes para esse tipo de história são mostradas por padrão.

Para selecionar um filtro predefinido:

  1. Na barra de filtro, clique no menu suspenso Selecionar Predefinições.

  2. Selecione a predefinição. A Bancada de Trabalho de Histórias é atualizada para mostrar as histórias que correspondem à predefinição.

Filtrando Automaticamente um Item.

Ao passar o mouse sobre um Item ou Campo onde uma opção de filtro está disponível, o botão TD_Filter.png aparece. Clique no ícone para mostrar as opções de filtro:

  • Adicionar ao Filtro - Adiciona o item ao filtro, e a Bancada de Trabalho de Histórias agora só mostra histórias que incluem esse item. Por exemplo, se você filtrar por uma pontuação de Criticidade específica, a página só mostrará histórias com essa Criticidade.

  • Excluir do Filtro - Atualiza o filtro para excluir esse item, e a Bancada de Trabalho de Histórias agora só mostra histórias que NÃO incluem esse item.

Você pode continuar a adicionar Itens ao filtro, clique em TD_Filter.png novamente para atualizar o filtro e aprofundar ainda mais.

Selecionando o Intervalo de Tempo.

O intervalo de tempo padrão para a Bancada de Trabalho de Histórias são os dois dias anteriores. Você pode selecionar um intervalo de tempo diferente para mostrar um período de tempo maior ou menor. Para mais informações, consulte Configurando o Filtro de Intervalo de Tempo.

O intervalo máximo de data para a Bancada de Trabalho de Histórias é de 90 dias.

Configurando Manualmente o Filtro.

Você pode configurar manualmente o filtro de histórias para obter maior granularidade na análise das histórias. Após configurar o filtro, ele é adicionado à barra de filtro de histórias e a página é atualizada automaticamente para mostrar as histórias que correspondem ao novo filtro.

Para criar um filtro:

  1. Na barra de filtro, clique em Add2.png.

  2. Comece a digitar ou selecione o Campo.

  3. Selecione o Operador, que determina a relação entre o Campo e o Valor que você está procurando.

  4. Selecione o Valor.

  5. Clique em Adicionar Filtro. O filtro é adicionado à barra de filtro e a Bancada de Trabalho de Histórias é atualizada para mostrar histórias com base nos filtros.

Limpando o Filtro.

Você pode remover cada item do filtro separadamente ou limpar todo o filtro.

Para limpar os filtros para a página da Bancada de Trabalho de Histórias:

  1. Para limpar um único filtro, clique em remove.png ao lado do filtro.

  2. Para limpar todos os filtros, clique em X no lado direito da barra de filtro.

Aprofundando e Analisando Histórias.

Você pode clicar em uma história na Bancada de Trabalho de Histórias para aprofundar e investigar os detalhes em uma página diferente. Esta página contém uma série de widgets que ajudam você a avaliar o potencial problema identificado pelo motor de Operações de Sites.

Investigando Histórias com Playbooks.

O drill-down da Bancada de Trabalho de Histórias inclui um link para um playbook que fornece etapas para investigar, solucionar problemas e resolver o problema. Cada história de Operações de Sites se vincula a um playbook para a indicação específica da história. Por exemplo, um playbook para histórias com a indicação Status de "Socket HA Não Pronto".

Gerando Resumos de Histórias de IA.

O drill-down da Bancada de Trabalho de Histórias inclui uma ferramenta que permite criar uma descrição de história em linguagem natural gerada por IA, que fornece contexto rico e ajuda você a avaliar rapidamente a história. O resumo da história é gerado dinamicamente para refletir o estado atual da história. Se a história for atualizada com novas informações, você pode regenerar o resumo para refletir as alterações.

Para mais sobre gerar resumos de histórias de IA, veja abaixo.

  • O resumo da história de IA é gerado apenas sob demanda pelo admin.

Protegendo Dados Sensíveis com Tokenização.

Para uma segurança robusta de dados durante a transmissão de dados de histórias para serviços de IA de terceiros, a Cato usa tokenização para garantir que todos os dados sensíveis permaneçam na plataforma XOps da Cato. Isso envolve substituir informações sensíveis por identificadores únicos, ou "tokens", tornando os dados sem sentido para entidades não autorizadas. Dados sensíveis nunca são expostos a serviços de terceiros. Essa abordagem garante a confidencialidade dos detalhes da história, alinhando-se ao nosso compromisso com padrões robustos de privacidade e segurança de dados.

Nota

Nota: Devido às limitações da IA generativa, as informações fornecidas em resumos de histórias podem ocasionalmente conter imprecisões.

Entendendo os Widgets de Aprofundamento de Histórias.

Detection___Response_Network_callouts.png

Estes são os widgets de aprofundamento de histórias:

Item

Nome

Descrição

1

Resumo da história.

Um resumo de informações básicas sobre a história, incluindo:

  • O tipo de história.

  • O nome do local associado à história.

  • A criticidade da história.

  • O número de vezes que o problema ocorreu.

  • O número de dias desde que a história foi gerada.

  • O status atual da história.

2

Linha do tempo da história.

Mostra uma linha do tempo de mudanças no status da história.

3

Detalhes da História

Informações básicas para analisar a história, incluindo uma descrição da história, quando a história foi criada e atualizada com novos incidentes de rede relacionados, e informações sobre o site.

  • Clique em Gerar Resumo de IA para uma descrição de história em linguagem natural que fornece um contexto rico e ajuda você a avaliar rapidamente a história

  • Clique no link artigo KB do Playbook para abrir o playbook explicando como solucionar e resolver este tipo de história

4

Visão Geral do Site Atual

Informações sobre o site em sua rede impactado pela história. O widget inclui um link para visualizar os logs de conexão recentes do site, e menus suspensos com atalhos para as páginas de Configuração de Site e Monitoramento de Site. Este widget é o mesmo que o Painel de Informações do Site na página de Topologia.

5

Cronograma de Incidentes

Uma lista dos incidentes detectados para problemas e resoluções na história. Por exemplo, o Cronograma de Incidentes para uma história Link está desativado inclui esses incidentes:

  • WAN1 Link ativo do soquete primário - Desconectado da Nuvem Cato

  • WAN1 Link ativo do soquete primário - Conectividade reestabelecida com sucesso à Nuvem Cato

  • Nenhuma ocorrência do problema após 120 minutos, o estado da história mudou de Monitoramento para Fechado

    Nota

    Nota: Apenas histórias de Operações de Site fecham automaticamente, e somente após 120 minutos sem a ocorrência do problema. Histórias de Segurança do XOps não fecham automaticamente.

Estas são as colunas para o Cronograma de Incidentes:

  • Criado - Quando o incidente foi originalmente detectado

  • Validado - Quando o incidente criado foi confirmado

  • Uma Descrição do incidente

  • Evento - Um link para mostrar a página de Eventos pré-filtrada para o incidente

Usando a Política de Resposta para Histórias de Operações de Site

Detection___Response_Network_Response_Policy.png

A Política de Resposta do XOps ajuda a monitorar as histórias do XOps definindo quando as Notificações por Email para histórias são enviadas aos Administradores. Você pode criar regras que definem os critérios da história para quando notificações são enviadas e pode usar listas de correio para configurar quais admins recebem as notificações. Por exemplo, você pode criar uma regra para enviar notificações para uma história de Operações de Site com alta Criticidade e definir a lista de correio para incluir um endereço de email de helpdesk para automaticamente abrir um tíquete de suporte.

Para mais informações sobre como criar regras de Política de Resposta, veja Criando a Política de Resposta para Histórias de XOps

Esse artigo foi útil?

Usuários que acharam isso útil: 0 de 0

0 comentário