Este playbook descreve as etapas para resolver problemas quando uma sessão BGP se desconecta para um site.
Quando uma sessão BGP é desconectada, a conexão entre dois roteadores BGP é terminada e pode interromper a troca de informações de roteamento. O impacto da sessão desconectada pode variar dependendo da redundância e dos mecanismos de failover da rede. Em cenários onde caminhos alternativos existem, o impacto pode ser mínimo. No entanto, em configurações menos resilientes, desconexões podem levar a problemas temporários de roteamento e interrupções de serviço.
Para mais informações sobre BGP, veja Usando BGP no Cato Cloud.
Existem diferentes maneiras de descobrir que uma sessão BGP foi desconectada para um site:
-
Vá para a página Bancada de Trabalho de Histórias e use o pré-configurado Network XDR para encontrar as histórias de Sessão BGP desconectada.
A história fornece informações sobre a linha do tempo do incidente, status atual do Socket e mais.
-
Um evento de Roteamento, com o sub-Tipo Sessão BGP e a ação Desconectado
-
Use o filtro pré-configurado pares BGP desconectados e ajuste o período de tempo, se necessário
-
- Notificação por email do BGP
- Quando as notificações por email estão ativadas para um par BGP, emails são enviados para a lista de correio (podem incluir não adms)
Ao responder a histórias de Operações do Site, é importante abordar o problema primeiro verificando se o problema está em andamento, então solucionando o problema e finalmente verificando se o problema foi resolvido.
Passo 1 - Verificando se a Sessão BGP está Desconectada
Esta seção discute diferentes ferramentas do Cato que você pode usar para verificar se a sessão BGP para um site está desconectada, e qual poderia ser a causa raiz.
Use o Aplicativo de Gerenciamento Cato para mostrar o status em tempo real da sessão BGP. Na página BGP para o site (Rede > Locais > {nome do site} > Configuração do Local > BGP), clique em Mostrar Status do BGP.
Este é um exemplo do status para uma sessão BGP desconectada:
Mostrando rotas BGP
Use o Aplicativo de Gerenciamento Cato para visualizar a tabela de roteamento da conta (Monitoramento > Tabela de Roteamento). Você pode filtrar pelo nome do site em questão.
O exemplo abaixo mostra que não há rotas DINÂMICAS incluídas na tabela de rotas, implicando que nenhuma rota está sendo aprendida dos pares BGP:
Verificando o Status BGP Desconectado para Locais de Interconexão de Nuvem
Para locais de Interconexão de Nuvem, o BGP é usado para conectividade entre o underlay do ambiente de nuvem e os PoPs.
-
Na página de Interconexão de Nuvem para o site (Rede > Locais > {nome do site} > Configuração do Local > Interconexão de Nuvem), clique em Testar Conectividade para mostrar o status BGP do underlay
-
Na página Locais, revise o status do site
Passo 2 - Solucionando o Status BGP Desconectado
Esta seção discute ferramentas dentro do Cato que podem ser usadas para seguir uma abordagem estruturada de solução de problemas para este tipo de incidente. Essas etapas devem ser seguidas geralmente na ordem, mas os resultados dessas verificações podem determinar qual passo vem a seguir.
Esclarecer Razão de Desconexão da Sessão BGP
A página de Eventos do Aplicativo de Gerenciamento Cato (Inicial > Eventos) pode ser usada para esclarecer a razão pela qual a sessão BGP foi desconectada.
Usando o pré-configurado pares BGP desconectados você pode ver um histórico de todas as sessões BGP desconectadas dentro do período de tempo selecionado. Esses eventos também têm um Código de Erro de Desconexão BGP associada, que pode esclarecer a razão para a desconexão:
Certifique-se de que Nenhuma Mudança Ocorrida Antes deste Incidente
Revise mudanças na página de Registro de Auditoria para o Aplicativo de Gerenciamento Cato, e veja se há uma configuração que está relacionada a este problema. Se uma mudança de configuração diretamente ocorreu antes deste incidente, considere revertê-la e confirmar como a configuração deve ser.
Verifique se a Configuração BGP Está Correta
Use o Aplicativo de Gerenciamento Cato para mostrar o status em tempo real da sessão BGP. Na página BGP para o site (Rede > Locais > {nome do site} > Configuração do Local > BGP), clique em Mostrar Status do BGP, e então Status Bruto. Este status detalhado também lista os parâmetros de configuração. Estes devem ser verificados para garantir que a configuração correta está sendo aplicada.
Redefinindo Suavemente a Configuração
Depois de verificar que o vizinho BGP em espera está desconectado, você pode alterar um dos vizinhos BGP e clicar em Salvar. Isso faz push de uma nova configuração que pode resolver o problema. Então, restaure as configurações originais e salve a configuração original.
Verifique se o Tráfego do Protocolo BGP é Bidirecional Entre os Pares
Para que uma sessão BGP se estabeleça e funcione, deve haver tráfego bidirecional na porta TCP 179 do BGP. Usando capturas de pacotes Cato, a bidirecionalidade deste tráfego pode ser investigada e verificada.
Para sites socket, capture um pacote (PCAP) na interface LAN do Socket (a porta usada para tráfego BGP). Para mais informações, veja Como Capturar um Pacote em um Socket.
-
Filtre o PCAP pela porta 179. Se o tráfego for bidirecional, certifique-se de que o handshake de 3 vias do TCP está sendo concluído com sucesso.
-
Se o handshake estiver sendo concluído com sucesso, mas a sessão ainda não estiver estabelecida, é provável que um erro esteja sendo relatado por um dos pares. Esses erros devem ser visíveis na captura de pacotes. Erros relatados devem ser erros padrão do BGP e, portanto, podem ser mais examinados verificando a documentação de erro do BGP.
- Se o tráfego for unidirecional, vindo do socket, mas não retornado pelo par, continue para a próxima seção para investigar a alcançabilidade de camada 3.
Para sites IPSEC, consulte as etapas de captura de pacotes destacadas no Playbook de Soluções de Problemas de Conectividade IPSEC.
Verifique a Alcançabilidade de Camada 3 para o Par
Use a página Hosts Conhecidos para o site para revisar o horário mais recente em que houve atividade para um host. Isso fornece mais informações sobre o tempo de problemas de conectividade e a sessão BGP.
Para sites socket, você pode usar a WebUI do Socket para pingar o par BGP da interface LAN, certifique-se de que o par BGP permite tráfego ICMP. Para mais informações, veja Usando as Ferramentas da WebUI do Socket.
-
A partir da WebUI do Socket, pingue o host com essas configurações:
-
Rota via - LAN
-
Nome de Host/IP - Endereço IP do par BGP
-
Para BGP sobre sites IPSEC, você pode seguir o procedimento delineado em Soluções de Problemas de Conectividade IPSEC para obter capturas de pacotes. Uma fonte válida para o ping é qualquer host na WAN que deve ser capaz de alcançar o endereço do par BGP via ICMP.
Após o vizinho BGP estar conectado ao site, um evento de Sessão BGP é gerado com a AçãoEstabelecida. Na página de Eventos, você pode configurar manualmente o filtro de eventos para Ação É Estabelecida para mostrar o evento.
O status em tempo real da sessão BGP mostra o status e informações de roteamento. Na página BGP para o site (Rede > Locais > {nome do site} > Configuração do Local > BGP), clique em Mostrar Status do BGP.
Garantindo que todos os prefixos sejam recebidos
Use o Aplicativo de Gerenciamento Cato para visualizar a tabela de roteamento da conta (Monitoramento > Tabela de Roteamento). Você pode filtrar pelo nome do site em questão.
O exemplo abaixo mostra que a rota DINÂMICA esperada está incluída na tabela de rotas, implicando que as rotas pretendidas estão sendo aprendidas do par BGP:
Levando Casos ao Suporte Cato
Se depois de seguir este playbook você não conseguir resolver o problema, você pode abrir um ticket com o Suporte Cato. Ao fazer isso, para uma resolução mais rápida é importante que você inclua todos os insights reunidos ao seguir as etapas acima.
Por favor, veja Submetendo um Pedido de Suporte
0 comentário
Por favor, entre para comentar.