Este artigo discute como você pode usar a Bancada de Trabalho de Histórias para revisar Histórias de Operações do Site em busca de problemas de conectividade e desempenho na sua rede.
Cato XOps identifica Problemas de Rede, como degradação, além de potenciais Ameaças de Segurança. O motor avançado de Operações do Site detecta diferentes indicações e métricas relacionadas à conectividade e desempenho e gera histórias que correlacionam dados para problemas referentes à rede. Por exemplo, se um link WAN está intermitentemente experimentando alta perda de pacotes, o motor criará uma única história com todos os dados relevantes para o link.
A página da Bancada de Trabalho de Histórias mostra os detalhes de cada história para ajudar você a entender e analisar os problemas. Você pode classificar e filtrar as histórias para encontrar os incidentes mais importantes e depois detalhar uma história para investigar mais a fundo os detalhes para resolver o problema.
Estas são as indicações de problemas de conectividade e desempenho de rede que são detectados pelo motor de Operações do Site para gerar histórias:
|
Indicação |
Descrição |
Limite para Gerar uma História |
|---|---|---|
|
Site desconectado |
O site se desconectou da Nuvem Cato. |
Todos os links estão inativos por 2,5 minutos |
|
Link inativo |
Um dos links WAN de um site se desconectou da Nuvem Cato, o site ainda está conectado. |
Um link está inativo por 5 minutos, ou um link teve 5 desconexões mais curtas em um período de 10 minutos |
|
Sessão BGP desconectada |
Uma sessão BGP se desconectou inesperadamente, o que pode impactar a conectividade de aplicativos e a experiência do usuário. |
Uma sessão BGP está inativa por 5 minutos ou teve 5 ou mais desconexões mais curtas em um período de 10 minutos |
|
Monitoramento LAN - host inacessível |
Um host monitorado atrás de um site não está respondendo a pacotes de keep-alive do PoP e é considerado inacessível. Exige uma regra de Monitoramento LAN configurada para o host. |
Um evento de Monitoramento LAN Inacessível |
|
SLA de qualidade do link |
O limite de qualidade SLA do link para um site foi excedido. Isso pode impactar a experiência do usuário. Os limites SLA são configurados para Regras de Saúde de Qualidade. Notas:
|
Um evento de Regra de Saúde de Qualidade |
|
Status "Socket HA Not Ready" |
Há um problema com a configuração de Alta Disponibilidade (HA) do Socket, e o status não está pronto. |
Se uma das seguintes condições de Socket HA Not Ready ocorrer:
Para mais sobre essas condições, veja O que é Socket HA |
|
Reconexão do PoP para melhorar conectividade |
O site foi forçado a se reconectar ao PoP para otimizar o desempenho. Reconectar ao PoP pode impactar a experiência do usuário. |
Um evento de reconexão com esta mensagem: Problema de desempenho detectado, reconectado a um nodo de serviço diferente na Nuvem Cato Para mais sobre campos de mensagens de eventos, veja Entendendo Campos de Mensagem de Evento de Conectividade do Socket |
|
Porta LAN inativa |
Uma das portas LAN foi desconectada |
A porta está inativa por 5 minutos |
|
Link WAN alternativo inativo |
Um dos links Alt. Links WAN desconectados |
O link está inativo ou o número de canais caiu para 0 por 5 minutos |
|
Socket Offline Após Atualização |
Um Socket não reestabeleceu um túnel no tempo esperado após a atualização para uma nova versão. |
O Socket está desconectado por 5 minutos após a conclusão do tempo de atualização esperado. |
Histórias de Operações do Site passam por diferentes etapas ao longo do ciclo de vida da história, desde o problema inicial que disparou a história até a resolução final. No entanto, os ciclos de vida das histórias são ligeiramente diferentes para histórias de Site inativo em comparação com outros tipos de história. Isso ocorre porque, quando uma história de Site inativo está em andamento, nenhuma outra história para o site é criada para evitar a criação de histórias redundantes.
Por exemplo, se um site com dois links WAN fica inativo, uma única história de Site inativo é gerada sem histórias separadas de Link inativo para cada link WAN.
Abaixo estão as etapas potenciais para uma história de Site inativo e outros tipos de história:
-
Etapas no ciclo de vida da história de Site inativo:
-
Aberto - o problema está atualmente em andamento e a história é criada
-
Monitoramento - O problema foi resolvido há menos de 2 horas
-
Fechado - O problema foi resolvido por 2 horas e a história é fechada
-
-
Etapas no ciclo de vida de outros tipos de história:
-
Em espera - O problema está em andamento, mas nenhuma história foi criada porque o site está atualmente inativo. O problema permanece em espera até que 2 minutos tenham se passado após a história de Site inativo ser fechada
-
Aberto - o problema está atualmente em andamento e a história é criada
-
Monitoramento - O problema foi resolvido há menos de 2 horas
-
Fechado - O problema foi resolvido por 2 horas e a história é fechada
-
Nota
Nota: Histórias de Operações do Site também são automaticamente fechadas nos seguintes casos:
-
30 dias de idade – Fechado para garantir rastreamento fresco se o problema recorrer
-
A história exige revalidação – O motor de Operações do Site determinou que a história precisa ser revalidada. O motor valida e reabre a história se o problema recorrer
-
Mudança de configuração – Uma entidade na história (link, site, faixa BGP, host) não é mais relevante devido a atualizações de configuração
Este é um exemplo de caso de uso para um admin identificando e resolvendo uma história de rede de Operações do Site com a Bancada de Trabalho de Histórias:
-
Filtrou a Bancada de Trabalho de Histórias para mostrar histórias de Operações do Site abertas agrupadas por site
-
Identificou uma história de alta criticidade para o site de Nova York, com a indicação Link inativo
-
Abriu a página de detalhamento da história, revisou os dados da história e descobriu que o link WAN 01 do site estava desconectado da Nuvem Cato
-
Revisou o playbook relevante para investigar e solucionar o problema
-
Após verificar o Socket físico no site de Nova York, descobriu que o cabo do link WAN 01 estava defeituoso
-
Substituiu o cabo, confirmou que o link estava ativo e conectado e continuou a monitorar a história para possível recorrência do problema
-
História fechada automaticamente após duas horas sem recorrência
A página da Bancada de Trabalho de Histórias mostra um resumo das histórias XOps da sua conta.
Para visualizar a página da Bancada de Trabalho de Histórias:
-
No menu de navegação, clique em Inicial > Bancada de Trabalho de Histórias.
|
Coluna |
Descrição |
|---|---|
|
ID |
ID exclusivo da Cato para esta história |
|
Status |
Os statuses de uma história de Operações do Site representam diferentes etapas ao longo do ciclo de vida da história, desde o problema inicial que disparou a história até a resolução final. O motor de Operações do Site atualiza automaticamente o status quando detecta as mudanças relevantes no incidente de rede. Estes são os tipos de status:
|
|
Criado |
Data do primeiro fluxo de tráfego da história. |
|
Atualizado |
Data do fluxo de tráfego mais recente da história. |
|
Criticidade |
|
|
Indicação |
|
|
Fonte |
|
|
Ocorrências |
O número de vezes que o problema ocorreu, incluindo recorrências após uma resolução temporária. Por exemplo, se um link desconectar e reconectar repetidamente, cada desconexão conta como uma ocorrência. |
|
Tipo de Motor. |
O motor que criou a história. Para histórias de Operações de Sites, o motor é Operações de Sites. |
Para fornecer contexto ao revisar as histórias, você pode mostrar as histórias em grupos definidos por detalhes, incluindo Fontes, Indicação, Status, e Tipo. Por exemplo, você pode mostrar juntas todas as histórias relacionadas a um local de fonte específico ou todas as histórias de Qualidade de Link SLA. Isso oferece uma perspectiva mais ampla ao analisar as histórias e pode ajudar você a entender e resolver problemas mais rapidamente.
Para histórias de Operações de Sites, Fontes são sites na sua rede.
Recomendamos, como uma boa prática, começar sua análise das histórias de Rede agrupando por Fontes.
Cada grupo destaca os níveis de criticidade das histórias nesse grupo, incluindo o número de histórias de alta, média e baixa criticidade.
Existem três maneiras de filtrar os dados na Bancada de Trabalho de Histórias:
-
Selecione um filtro predefinido.
-
Atualize automaticamente o filtro com um item selecionado.
-
Configure o filtro manualmente.
Você pode selecionar um filtro predefinido para focar em histórias de Operações de Rede ou Operações de Segurança. Ao selecionar um filtro predefinido, as colunas de histórias mais relevantes para esse tipo de história são mostradas por padrão.
Ao passar o mouse sobre um Item ou Campo onde uma opção de filtro está disponível, o botão aparece. Clique no ícone para mostrar as opções de filtro:
-
Adicionar ao Filtro - Adiciona o item ao filtro, e a Bancada de Trabalho de Histórias agora só mostra histórias que incluem esse item. Por exemplo, se você filtrar por uma pontuação de Criticidade específica, a página só mostrará histórias com essa Criticidade.
-
Excluir do Filtro - Atualiza o filtro para excluir esse item, e a Bancada de Trabalho de Histórias agora só mostra histórias que NÃO incluem esse item.
Você pode continuar a adicionar Itens ao filtro, clique em novamente para atualizar o filtro e aprofundar ainda mais.
O intervalo de tempo padrão para a Bancada de Trabalho de Histórias são os dois dias anteriores. Você pode selecionar um intervalo de tempo diferente para mostrar um período de tempo maior ou menor. Para mais informações, consulte Configurando o Filtro de Intervalo de Tempo.
O intervalo máximo de data para a Bancada de Trabalho de Histórias é de 90 dias.
Você pode configurar manualmente o filtro de histórias para obter maior granularidade na análise das histórias. Após configurar o filtro, ele é adicionado à barra de filtro de histórias e a página é atualizada automaticamente para mostrar as histórias que correspondem ao novo filtro.
Para criar um filtro:
-
Na barra de filtro, clique em
.
-
Comece a digitar ou selecione o Campo.
-
Selecione o Operador, que determina a relação entre o Campo e o Valor que você está procurando.
-
Selecione o Valor.
-
Clique em Adicionar Filtro. O filtro é adicionado à barra de filtro e a Bancada de Trabalho de Histórias é atualizada para mostrar histórias com base nos filtros.
Você pode remover cada item do filtro separadamente ou limpar todo o filtro.
Você pode clicar em uma história na Bancada de Trabalho de Histórias para aprofundar e investigar os detalhes em uma página diferente. Esta página contém uma série de widgets que ajudam você a avaliar o potencial problema identificado pelo motor de Operações de Sites.
O drill-down da Bancada de Trabalho de Histórias inclui um link para um playbook que fornece etapas para investigar, solucionar problemas e resolver o problema. Cada história de Operações de Sites se vincula a um playbook para a indicação específica da história. Por exemplo, um playbook para histórias com a indicação Status de "Socket HA Não Pronto".
O drill-down da Bancada de Trabalho de Histórias inclui uma ferramenta que permite criar uma descrição de história em linguagem natural gerada por IA, que fornece contexto rico e ajuda você a avaliar rapidamente a história. O resumo da história é gerado dinamicamente para refletir o estado atual da história. Se a história for atualizada com novas informações, você pode regenerar o resumo para refletir as alterações.
Para mais sobre gerar resumos de histórias de IA, veja abaixo.
-
O resumo da história de IA é gerado apenas sob demanda pelo admin.
Para uma segurança robusta de dados durante a transmissão de dados de histórias para serviços de IA de terceiros, a Cato usa tokenização para garantir que todos os dados sensíveis permaneçam na plataforma XOps da Cato. Isso envolve substituir informações sensíveis por identificadores únicos, ou "tokens", tornando os dados sem sentido para entidades não autorizadas. Dados sensíveis nunca são expostos a serviços de terceiros. Essa abordagem garante a confidencialidade dos detalhes da história, alinhando-se ao nosso compromisso com padrões robustos de privacidade e segurança de dados.
Nota
Nota: Devido às limitações da IA generativa, as informações fornecidas em resumos de histórias podem ocasionalmente conter imprecisões.
Estes são os widgets de aprofundamento de histórias:
|
Item |
Nome |
Descrição |
|---|---|---|
|
1 |
Resumo da história. |
Um resumo de informações básicas sobre a história, incluindo:
|
|
2 |
Mostra uma linha do tempo de mudanças no status da história. |
|
|
3 |
Detalhes da História |
Informações básicas para analisar a história, incluindo uma descrição da história, quando a história foi criada e atualizada com novos incidentes de rede relacionados, e informações sobre o site. |
|
4 |
Visão Geral do Site Atual |
Informações sobre o site em sua rede impactado pela história. O widget inclui um link para visualizar os logs de conexão recentes do site, e menus suspensos com atalhos para as páginas de Configuração de Site e Monitoramento de Site. Este widget é o mesmo que o Painel de Informações do Site na página de Topologia. |
|
5 |
Cronograma de Incidentes |
Uma lista dos incidentes detectados para problemas e resoluções na história. Por exemplo, o Cronograma de Incidentes para uma história Link está desativado inclui esses incidentes:
Estas são as colunas para o Cronograma de Incidentes:
|
A Política de Resposta do XOps ajuda a monitorar as histórias do XOps definindo quando as Notificações por Email para histórias são enviadas aos Administradores. Você pode criar regras que definem os critérios da história para quando notificações são enviadas e pode usar listas de correio para configurar quais admins recebem as notificações. Por exemplo, você pode criar uma regra para enviar notificações para uma história de Operações de Site com alta Criticidade e definir a lista de correio para incluir um endereço de email de helpdesk para automaticamente abrir um tíquete de suporte.
Para mais informações sobre como criar regras de Política de Resposta, veja Criando a Política de Resposta para Histórias de XOps
0 comentário
Por favor, entre para comentar.