Mecanismos de recuperación para tipos de Sitio Cato

Resumen

Cato está diseñado para mantener la continuidad del tráfico incluso cuando hay un problema de conectividad entre un Sitio y un Punto de Presencia (PoP). Los Sitios se conectan a los PoPs y el tráfico luego se dirige o bien a la WAN sobre la nube de Cato o a Internet para acceso a SaaS y aplicaciones de Internet. La resiliencia asegura que cuando hay un problema de conectividad, los flujos de tráfico continúan con un impacto mínimo o nulo para los usuarios finales.

Este artículo explica cómo Cato logra resiliencia para diferentes tipos de Sitio y cómo se comporta el tráfico durante los problemas de conectividad PoP.

Arquitectura de PoP de Cato

Un PoP de Cato es una ubicación en la nube compuesta de múltiples servidores de procesamiento. Cada PoP está construido para manejar túneles de clientes, aplicar servicios de seguridad y dirigir tráfico sin depender de un solo nodo de procesamiento.

Cada nodo PoP:

  • Termina túneles de cliente (DTLS o IPsec)

  • Procesa y dirige tráfico de red

  • Ejecuta la pila completa de software Cato, incluyendo enrutamiento, optimización y servicios de seguridad como WAN y Firewall de Internet, IPS e inspección TLS, etcétera

Esta arquitectura basada en nodos PoP permite a la nube de Cato mantener el procesamiento de tráfico y la aplicación de seguridad mientras minimiza el impacto de problemas relacionados con la infraestructura.

Resiliencia de tráfico de Socket y vSocket para WAN e Internet

Los sitios Socket y vSocket proveen el modelo más resistente para mantener la conectividad WAN entre sitios sobre la nube de Cato y la conectividad a Internet para tráfico a aplicaciones SaaS. Este modelo de despliegue está diseñado para sitios donde la continuidad del tráfico y el comportamiento predecible de recuperación son operativamente críticos, como centros de datos y ubicaciones de sucursal principal, y donde los usuarios finales deben experimentar un impacto mínimo cuando hay un problema de conectividad a un PoP.

Resiliencia para problemas de conectividad PoP

Cuando un sitio tiene un problema de conectividad con un PoP, el Socket trabaja automáticamente para mantener los flujos de tráfico con mínima interrupción, sin intervención del administrador. La recuperación se maneja progresivamente para minimizar la interrupción y evitar cambios innecesarios de topología.

Las capacidades incluyen:

  1. Reconexión automática a un nodo PoP diferente cuando se detecta un problema a nivel de nodo

  2. Conmutación automática por error a un PoP diferente cuando persisten problemas de conectividad a nivel PoP

Estos comportamientos reducen el impacto de problemas transitorios de conectividad PoP y ayudan a mantener la continuidad del tráfico para los usuarios finales. Para más información, consulte Understanding Acceptable and Unacceptable SLA for Sites.

Resiliencia de última milla e ISP

Los sitios Socket y vSocket monitorean activamente la conectividad de última milla para mantener túneles estables hacia la nube de Cato. Las decisiones de direccionamiento de tráfico se basan en condiciones de enlaces en tiempo real en lugar de preferencias estáticas.

Las capacidades incluyen:

  1. Monitorización continua de métricas de calidad y conectividad en cada enlace WAN

  2. Soporte para hasta cuatro interfaces WAN por Socket para proporcionar redundancia de ISP

  3. Uso activo de múltiples enlaces WAN para mejorar la disponibilidad y la resiliencia

Este modelo reduce la dependencia de un solo ISP y mejora los resultados de recuperación durante fallos de última milla.

Comportamiento de recuperación específico para tráfico

Los Sockets aplican una lógica de recuperación separada para tráfico WAN y tráfico con destino a Internet cuando hay un problema de conectividad PoP. Esta distinción asegura que la pérdida de conectividad PoP no impacte innecesariamente la comunicación sitio a sitio o el acceso a Internet.

Para tráfico WAN, el Socket prioriza mantener la conectividad entre sitios:

  1. El tráfico WAN se redirige a túneles DTLS fuera de la nube (Recuperación WAN) cuando el PoP está inaccesible

  2. Las sesiones existentes sitio a sitio continúan sobre la ruta de recuperación sin requerir restablecimiento

Para el tráfico de Internet, el Socket aplica una ruta de recuperación diferente:

  1. El tráfico con destino a Internet se enrutará directamente al ISP local (Recuperación de Internet)

  2. El tráfico sale del Socket usando la dirección IP pública del Socket en lugar de la dirección IP del PoP

Este manejo específico del tráfico limita el alcance de las interrupciones y permite que el tráfico WAN e Internet se recupere de manera independiente según el tipo de interrupción.

Mejores prácticas operativas para la resiliencia del Socket

El despliegue correcto del Socket impacta directamente la efectividad de la recuperación. Aplicar estas prácticas ayuda a asegurar un comportamiento predecible y un impacto mínimo para los usuarios durante problemas de conectividad PoP.

Mejores prácticas generales de despliegue

Las mejores prácticas incluyen:

  1. Despliegue al menos dos ISPs por sitio en una configuración activa/activa para evitar la dependencia de un solo proveedor

  2. Use la alta disponibilidad (HA) del Socket para protegerse contra fallos de hardware local

  3. Asegure la diversidad de caminos físicos entre el sitio y los ISPs ascendentes

  4. Configure direcciones IP públicas estáticas para interfaces WAN, especialmente para sitios de centros de datos

Para más información, consulta las Condiciones Previas de Conexión de Socket Cato y Limitaciones Conocidas

Planificación para la Recuperación WAN

La Recuperación WAN mantiene la conectividad sitio a sitio cuando un sitio pierde conectividad con el PoP mediante el enrutamiento del tráfico WAN sobre túneles DTLS fuera de la nube. Una configuración estable de interfaz WAN es crítica para asegurar una rápida convergencia y un comportamiento de recuperación confiable.

Las mejores prácticas incluyen:

  1. Configure direcciones IP estáticas en interfaces WAN que participen en la Recuperación WAN para mejorar la estabilidad de los túneles fuera de la nube

    Esto es especialmente importante para centros de datos y sitios hub.

  2. Use la página Red > Sitios en el CMA para verificar el estado de Túneles de Recuperación WAN después de cambios en interfaces WAN o enrutamiento

Para más información, consulte Resiliencia de Sitios de Socket con Recuperación WAN.

Planificación para la Recuperación de Internet

Durante la Recuperación de Internet, el tráfico sale directamente a Internet desde el Socket en lugar de hacerlo desde el PoP. Este comportamiento afecta el acceso a SaaS y las políticas de seguridad basadas en IP.

Las consideraciones operativas incluyen:

  1. El tráfico de Internet se origina desde la dirección IP pública del Socket durante la recuperación

  2. Las direcciones IP públicas basadas en PoP no se utilizan mientras la Recuperación de Internet está activa

  3. Permitir la dirección IP pública del Socket para aplicaciones críticas SaaS para mantener el acceso

  4. Por ejemplo, si las aplicaciones también utilizan salidas PoP, permita tanto la dirección IP de Cato asignada como la dirección IP pública del Socket

Para más información, consulte Usando la Recuperación de Internet de Cato Networks.

Resiliencia de Sitio IPsec e Interconexión en la nube

Los sitios IPsec e Interconexión en la nube dependen de la redundancia a nivel PoP para mantener la continuidad del tráfico durante los problemas de conectividad PoP. A diferencia de los sitios basados en Socket, estos tipos de sitio no utilizan mecanismos de recuperación fuera de la nube. La resiliencia depende de los caminos de conectividad redundantes hacia la nube de Cato.

Resiliencia de Sitio IPsec

Los sitios IPsec mantienen la resiliencia estableciendo túneles hacia múltiples ubicaciones PoP. El comportamiento de conmutación por error está determinado por la configuración y capacidades del dispositivo IPsec de terceros gestionado por el cliente.

Las capacidades incluyen:

  1. Soporte para túneles primarios y secundarios hacia diferentes ubicaciones PoP

  2. Configuraciones de túnel Activo/Pasivo o activo/activo, dependiendo del soporte del dispositivo

Las consideraciones operativas incluyen:

  1. Un SLA del 99.999% está garantizado solo para sitios IPsec conectados a al menos dos ubicaciones PoP diferentes, como se define en el MSA de Cato

  2. La Recuperación de Internet y la Recuperación WAN no están soportadas para sitios IPsec. Esto significa que la conectividad WAN entre sitios no está disponible durante las interrupciones PoP

Resiliencia de Sitio de Interconexión en la nube

Los sitios de interconexión en la nube utilizan conectividad respaldada por el proveedor hacia la nube de Cato. La resiliencia se logra a través de infraestructura redundante del proveedor y conectividad PoP.

Las capacidades incluyen:

  1. Conectividad redundante sobre la infraestructura del proveedor

  2. Conectividad PoP activa y pasiva basada en el diseño de la Interconexión en la nube

Las consideraciones operativas incluyen:

  1. La Recuperación de Internet y la Recuperación WAN no están soportadas

  2. La disponibilidad de tráfico depende del SLA del proveedor y del sitio que se conecta a múltiples PoPs

Resiliencia de Enrutamiento con BGP

El enrutamiento dinámico es crítico para mantener la continuidad del tráfico durante problemas de conectividad PoP y cambios en la red. BGP proporciona un comportamiento de enrutamiento adaptativo que permite a los sitios converger rápidamente y continuar enviando tráfico cuando los caminos cambian.

También es posible usar el enrutamiento estático para caminos estables y predefinidos.

Resiliencia de Enrutamiento Basada en BGP

BGP controla cómo se aprenden y se retiran las rutas durante los cambios de conectividad, permitiendo que el tráfico se desplace automáticamente a caminos accesibles cuando ocurren fallos.

Las capacidades incluyen:

  1. Selección de camino dinámico basada en accesibilidad en tiempo real

  2. Convergencia automática de rutas durante cambios de enlace, camino o conectividad PoP

  3. Soporte para Detección de Despacho Bidireccional (BFD) para reducir el tiempo de detección de fallas

Las consideraciones operativas incluyen:

  1. El BGP debe estar configurado en el enrutador del sitio y coordinado con las configuraciones de enrutamiento de Cato

  2. Recomendamos usar BGP con BFD cuando se requiere un comportamiento de enrutamiento dinámico y resiliente.

Para más información, consulte Configurando BFD para vecinos BGP.

Resumen de mecanismos de recuperación por tipo de sitio

La siguiente tabla resume cómo los diferentes tipos de sitio mantienen la continuidad del tráfico cuando hay un problema de conectividad entre un sitio y un PoP. El enfoque está en qué tráfico continúa fluyendo y cómo se logra la recuperación, no en los detalles de configuración de las características.

Aspecto de la resiliencia

Sitios Socket y vSocket

Sitios IPsec

Sitios de Interconexión en la Nube

Conexión a múltiples PoPs

Reconexión a un PoP alternativo cuando el PoP actual está inaccesible

Sí (depende del comportamiento del dispositivo de terceros)

Resiliencia del tráfico WAN durante problemas de conectividad PoP

Sí (Recuperación WAN)

No

No

Resiliencia de tráfico de Internet durante problemas de conectividad de PoP

Sí (Modo de Recuperación)

No

No

Resiliencia de ALT WAN (MPLS) durante problemas de conectividad de PoP

Sí (Recuperación de ALT WAN)

No

No

Dependencia del comportamiento de dispositivos o proveedores de terceros

No

Comportamiento de Configuración de DNS Durante Recuperación

Cuando el tráfico omite el PoP durante el Modo de Recuperación o Recuperación de WAN, ciertos servicios de Configuración de DNS no se aplican.

Las consideraciones operativas incluyen:

  1. Los servicios de inspección de seguridad y prevención de amenazas no se aplican al tráfico fuera de la nube

  2. Los servicios basados en PoP se restauran automáticamente cuando se restablece la conectividad con el PoP

¿Fue útil este artículo?

Usuarios a los que les pareció útil: 0 de 0

0 comentarios