Este libro de jugadas describe los pasos para resolver problemas cuando se desconecta una sesión BGP para un sitio.
Cuando una sesión BGP está desconectada, la conexión entre dos routers BGP se termina y puede interrumpir el intercambio de información de enrutamiento. El impacto de la sesión desconectada puede variar dependiendo de la redundancia de la red y los mecanismos de conmutación por error. En escenarios donde existen caminos alternativos, el impacto puede ser mínimo. Sin embargo, en instalaciones menos resilientes, las desconexiones pueden provocar problemas temporales de enrutamiento e interrupciones del servicio.
Para más información sobre BGP, por favor consulte Using BGP in the Cato Cloud.
Hay diferentes maneras de descubrir que una sesión BGP se ha desconectado para un sitio:
-
Vaya a la página de Banco de Trabajo de Historias y use el preajuste Red XDR para encontrar las historias de sesión BGP desconectada.
La historia proporciona información sobre la línea de tiempo del incidente, el estado actual del Socket, y más.
-
Un evento de enrutamiento, con el sub-Tipo de Sesión BGP con la acción Desconectado
-
Use el filtro preajustado pares BGP desconectados y ajuste el marco de tiempo si es necesario
-
- Notificación por correo electrónico de BGP
- Cuando las notificaciones por correo electrónico están habilitadas para un par BGP, se envían correos electrónicos a la lista de distribución (puede incluir no administradores)
Al responder a las historias de Operaciones de Sitio es importante abordar el problema verificando primero que el problema continúa, luego solucionando el problema y finalmente verificando que se ha resuelto.
Paso 1 - Verificando que la Sesión BGP está Desconectada
Esta sección discute diferentes herramientas de Cato que puede usar para verificar que la sesión BGP para un sitio está desconectada, y cuál podría ser la causa raíz.
Utilice la Aplicación de Gestión de Cato para mostrar el estado en tiempo real de la sesión BGP. En la página BGP para el sitio (Red > Sitios > {nombre del sitio} > Configuración del Sitio > BGP), haga clic en Mostrar Estado BGP.
Este es un ejemplo del estado para una sesión BGP desconectada:
Mostrando rutas BGP
Utilice la Aplicación de Gestión de Cato para ver la tabla de enrutamiento de la cuenta (Monitoreo > Tabla de Enrutamiento). Puede filtrar por el nombre del sitio en cuestión.
El ejemplo a continuación muestra que no se incluyen rutas DINÁMICAS en la tabla de rutas, lo que implica que no se están aprendiendo rutas de pares BGP:
Verificando el Estado Desconectado de BGP para Sitios de Interconexión en la Nube
Para los sitios de Interconexión en la Nube, se utiliza BGP para la conectividad entre el entorno en la nube y los PoPs.
-
En la página de Interconexión en la Nube para el sitio (Red > Sitios > {nombre del sitio} > Configuración del Sitio > Interconexión en la Nube), haga clic en Probar Conectividad para mostrar el estado BGP de la subyacente
-
En la página de Sitios, revise el estado del sitio
Paso 2 - Solucionando el estado Desconectado de BGP
Esta sección discute las herramientas dentro de Cato que se pueden usar para seguir un enfoque estructurado de solución de problemas para este tipo de incidente. Generalmente, estos pasos deben seguirse en orden, pero los resultados de estas verificaciones pueden determinar cuál podría ser el siguiente paso.
Aclarar la Razón de Desconexión de la Sesión BGP
La página de Eventos de la Aplicación de Gestión de Cato (Inicio > Eventos) se puede utilizar para aclarar la razón de la desconexión de la sesión BGP.
Utilizando el preajuste pares BGP desconectados, puede ver un historial de todas las sesiones BGP desconectadas dentro del marco de tiempo seleccionado. Estos eventos también tienen un Código de Error de Desconexión BGP asociado, que puede aclarar la razón de la desconexión:
Asegúrese de que no han habido cambios antes de este incidente
Revise los cambios en la página de rastro de auditoría para la Aplicación de Gestión de Cato, y vea si hay una configuración que esté relacionada con este problema. Si un cambio de configuración precedió directamente a este incidente, considere revertirlo y confirmar cuál debería ser la configuración.
Verifique que la Configuración de BGP sea Correcta
Utilice la Aplicación de Gestión de Cato para mostrar el estado en tiempo real de la sesión BGP. En la página BGP para el sitio (Red > Sitios > {nombre del sitio} > Configuración del Sitio > BGP), haga clic en Mostrar Estado BGP, y luego Estado Crudo. Este estado detallado también lista los parámetros de configuración. Estos deben ser verificados para asegurar que se está aplicando la configuración correcta.
Reiniciando Suavemente la Configuración
Una vez que verifique que el vecino BGP en espera está desconectado, puede cambiar uno de los vecinos BGP y hacer clic en Guardar. Esto empuja una nueva configuración que puede resolver el problema. Luego restablezca la configuración original y guarde la configuración original.
Verifique Que el Tráfico del Protocolo BGP es Bidireccional Entre Pares
Para que una sesión BGP se establezca y funcione, debe haber tráfico bidireccional en el puerto TCP 179 de BGP. Utilizando capturas de paquetes de Cato, la bidireccionalidad de este tráfico puede investigarse y verificarse.
Para los sitios de socket, tome una captura de paquetes (PCAP) en la interfaz LAN del Socket (el puerto utilizado para tráfico BGP). Para más información, consulte Cómo Tomar una Captura de Paquetes en un Socket.
-
Filtre el PCAP para el puerto 179. Si el tráfico es bidireccional, asegúrese de que el saludo TCP de tres vías se esté completando exitosamente.
-
Si el saludo se está completando exitosamente pero la sesión aún no se establece, es probable que uno de los pares esté informando de un error. Estos errores deberían ser visibles en la captura de paquetes. Los errores reportados deberían ser errores estándar de BGP y, por lo tanto, pueden ser examinados verificando la documentación de errores de BGP.
- Si el tráfico es solo unidireccional, proveniente del socket pero no devuelto por el par, continúe con la siguiente sección para investigar la accesibilidad de capa 3.
Para los sitios IPSEC, consulte los pasos de captura de paquetes destacados en el Playbook de Solución de Problemas de Conectividad IPsec.
Verifique la Alcance de la Capa 3 al Par
Use la página Hosts Conocidos para el sitio para revisar la última vez que hubo actividad para un host. Esto proporciona más información sobre la sincronización de problemas de conectividad y la sesión BGP.
Para los sitios de socket, puede utilizar el WebUI de Socket para hacer ping al par BGP desde la interfaz LAN, asegura de que el par BGP permite tráfico ICMP. Para más información, consulte Usando las Herramientas de WebUI de Socket.
-
Desde el WebUI de Socket, haga ping al host con estas configuraciones:
-
Ruta a través de - LAN
-
Nombre de Host/Dirección IP - Dirección IP del par BGP
-
Para BGP sobre IPSEC, puede seguir el procedimiento descrito en Solución de problemas de conectividad IPsec para obtener capturas de paquetes. Una fuente válida para el ping es cualquier host a través de la WAN que debería poder alcanzar la dirección del par BGP a través de ICMP.
Después de que el vecino BGP esté conectado al sitio, se genera un evento de Sesión BGP con la Acción Establecido. En la página de Eventos, puede configurar manualmente el filtro de eventos para que la Acción sea Establecido para mostrar el evento.
El estado en tiempo real de la sesión BGP muestra el estado e información de enrutamiento. En la página BGP para el sitio (Red > Sitios > {nombre del sitio} > Configuración del Sitio > BGP), haga clic en Mostrar Estado BGP.
Asegurando que se reciben todos los prefijos
Utilice la Aplicación de Gestión de Cato para ver la tabla de enrutamiento de la cuenta (Monitoreo > Tabla de Enrutamiento). Puede filtrar por el nombre del sitio en cuestión.
El ejemplo a continuación muestra que la ruta DINÁMICA esperada está incluida en la tabla de rutas, lo que implica que las rutas previstas se están aprendiendo del par BGP:
Levantando Casos con Soporte Cato
Si después de seguir este libro de jugadas no puede rectificar el problema, puede que desee levantar un ticket con el Soporte de Cato. Al hacerlo, para la resolución más rápida es importante que incluya toda la información recogida siguiendo los pasos anteriores.
Por favor vea Envío de un Ticket de Soporte
0 comentarios
Inicie sesión para dejar un comentario.