La Cato Cloud es una columna vertebral global privada construida sobre proveedores de nivel 1 para ofrecer un rendimiento de SLA consistente y predecible para el tráfico de WAN entre sitios corporativos. Cada PoP de Cato está interconectado a través de esta columna vertebral, proporcionando latencia controlada y entrega de paquetes independiente de Internet público.
Para mantener estas garantías, Cato desarrolló tecnología propietaria que permite la coordinación continua entre el Cato Socket y el PoP. El Socket mide métricas clave de rendimiento para cada enlace, mientras que el PoP agrega y correlaciona estas mediciones para mantener la ruta óptima entre el sitio y la columna vertebral. Juntos, aseguran un rendimiento constante del enlace, adaptándose en tiempo real para preservar la continuidad del servicio y maximizar la eficiencia de los recursos disponibles de WAN.
Cato ofrece visibilidad completa de extremo a extremo en las condiciones de red de cada sitio, usuario y aplicación. El servicio XOps de Cato aplica análisis impulsado por IA para transformar estos datos en historias claras y accionables que ayudan a los equipos de TI a resolver problemas más rápido. Al ingerir continuamente métricas en un motor de contexto único, XOps ofrece alertas e insights en tiempo real que reducen la investigación repetitiva y aceleran la identificación de la causa raíz, asegurando una experiencia óptima del usuario.
-
Activo/Activo: Cato evalúa dinámicamente y enruta el tráfico a través de ambos enlaces WAN activos. El tráfico se dirige al enlace de mejor rendimiento basado en condiciones en tiempo real. La configuración es configurada dinámicamente por la columna vertebral de Cato y no es personalizable (Nota: Umbrales de SLA personalizados para despliegues Activo/Activo están planeados para un próximo lanzamiento)
-
Activo/Pasivo: Solo el enlace primario transporta tráfico durante la operación normal. Cuando el rendimiento cae por debajo de los umbrales de SLA, el Socket activa el enlace pasivo y redirige el tráfico para mantener la conectividad. Este comportamiento está gobernado por el Smart SLA, que evalúa automáticamente la calidad del enlace para decisiones de conmutación por error. También puede personalizar los umbrales de SLA por sitio.
-
Activo/Pasivo con Último Recurso: Para asegurar la conectividad crítica durante fallos severos de WAN, puede definir un enlace de último recurso para el Socket. Típicamente, una conexión celular, el Socket solo utiliza este enlace en situaciones de emergencia.
La columna vertebral de la Cato Cloud y el Socket operan como una tela unificada SD-WAN que mantiene el rendimiento consistente del enlace a través de la WAN. A través del intercambio continuo de telemetría entre el Socket y su PoP conectado, la plataforma monitorea la calidad en tiempo real de cada enlace y ajusta proactivamente el enrutamiento para prevenir degradación.
El Socket mide latencia, pérdida de paquetes, fluctuación y congestión para cada enlace WAN y envía estos datos al PoP conectado. El PoP luego valida las mediciones contra su propia telemetría del lado de la columna vertebral. Trabajando juntos, el Socket y PoP toman decisiones de enrutamiento sincronizadas, asegurando visibilidad de extremo a extremo y evitando anomalías locales. Para más información, consulte Understanding Acceptable and Unacceptable SLA for Sites.
El Socket asigna una puntuación dinámica a cada enlace basada en el rendimiento en tiempo real, con puntuaciones actualizadas cada pocos segundos. Cuando las condiciones de la red cambian, las rutas de tráfico se ajustan automáticamente sin intervención manual. Los administradores pueden ver métricas tanto en tiempo real como históricas en el CMA, que reflejan insights tanto del Socket como del PoP. Para más información, ver Parte 1: Las Interfaces del Socket y Precedencia.
El PoP integra la telemetría del enlace en el motor de enrutamiento global de Cato. Si la degradación consistente es reportada por el Socket, el PoP puede redirigir el tráfico del sitio a través de una ruta alternativa de la columna vertebral. Este enfoque asegura la aplicación de SLA más allá del nivel del sitio.
Este ejemplo ilustra cómo un sitio físico en Filadelfia, USA, mantiene el cumplimiento de SLA al cambiar entre los PoPs cercanos de Cato en Nueva York y Washington, D.C.
-
Detección de Degradación: El Socket en el sitio de Filadelfia detecta aumento de pérdida de paquetes y latencia en el enlace conectado al PoP de Nueva York. Estas métricas degradadas son reportadas inmediatamente al PoP de Nueva York.
-
Intercambio de Telemetría: El PoP de Washington D.C. PoP valida el informe contra su propia telemetría del lado de la columna vertebral. Ambos PoPs confirman que la degradación es constante y no causada por un problema local transitorio.
-
Ajuste de Ruta: El Socket de Filadelfia redirige los flujos afectados desde el PoP de Nueva York al PoP de Washington D.C. PoP. La transición ocurre automáticamente, preservando la continuidad de la sesión y restaurando el cumplimiento de SLA.
-
Monitoreo Post-Ajuste: El Socket y los PoPs continúan monitoreando la calidad del enlace. Cuando la conexión del PoP de Nueva York vuelve a un rendimiento normal, el tráfico migra automáticamente de nuevo a la ruta óptima a través de Nueva York. Este comportamiento es impulsado por lógica preventiva que asegura que el Socket siempre se reconecte al PoP geográficamente más cercano y de mejor rendimiento una vez que el problema está resuelto.
Para proporcionar balance de carga, el Socket utiliza sus datos de puntuación para balancear el tráfico inteligentemente a través de los enlaces WAN activos. Esto asegura una utilización eficiente del ancho de banda y un rendimiento consistente de la aplicación. La lógica SD-WAN de Cato evalúa ambas direcciones, upstream y downstream, para mantener la calidad bidireccional para aplicaciones en tiempo real como voz y video.
Cuando se detecta degradación, el Socket y el PoP redirigen sin problemas el tráfico al enlace de mejor rendimiento. Las sesiones existentes permanecen estables y los usuarios no experimentan una interrupción notable.
En despliegues Activo/Pasivo, un enlace WAN transporta tráfico mientras el segundo permanece en respaldo. Para despliegues Activo/Pasivo/Último recurso, para evitar cargos por datos innecesarios o uso de ancho de banda, se envía una cantidad mínima de datos a través del enlace mientras permanece pasivo. Se activa solo cuando ambos enlaces WAN, activo y pasivo, están disponibles o funcionando fuera de los umbrales de SLA definidos. Para más información, consulte Configuración de un Enlace de Último Recurso.
La conmutación por error causa una breve pero esperada interrupción mientras se inicializa el enlace pasivo. Una vez estable, el Socket reanuda la evaluación del enlace en ambas rutas. Cuando el enlace primario se recupera, el tráfico se transfiere de nuevo automáticamente.
Para sitios de Socket activo/pasivo, la configuración de SLA predeterminada es el Smart SLA de Cato. Esta configuración asegura que el tráfico fluya sobre el enlace más fiable utilizando evaluación de rendimiento en tiempo real. El Socket aplica umbrales predefinidos para latencia, fluctuación y pérdida de paquetes. Las métricas degradadas se reportan al PoP, que valida los datos usando telemetría de la columna vertebral.
El Smart SLA elimina la necesidad de configurar umbrales específicos del sitio, mientras que aún se adapta a las condiciones en tiempo real. Esto asegura que las decisiones de conmutación por error y recuperación se realicen rápidamente y con precisión.
El Smart SLA toma muestras de datos de enlace cada pocos segundos, agregando métricas en promedios móviles. Cuando no hay tráfico de usuario presente, se utilizan sondas sintéticas para mantener la visibilidad. La validación dual entre el Socket y el PoP previene falsos positivos causados por anomalías localizadas.
La conmutación por error solo ocurre después de un número mínimo de violaciones de umbral. El peso de métricas favorece latencia y fluctuación para tráfico en tiempo real, mientras que la pérdida de paquetes se prioriza para flujos de datos masivos. Para más información, consulte Configuración de las Opciones de SLA de Conexión.
Cato ofrece múltiples formas de monitorear el rendimiento de enlaces WAN a través de su red. Puede ver métricas de SLA en tiempo real e históricas en el CMA, acceder a la telemetría en bruto a través de la API de Cato, o usar XOps para analizar incidentes y tendencias a través de insights basados en historias. Estas opciones le brindan visibilidad tanto a nivel operativo como de eventos, ayudándole a gestionar proactivamente el rendimiento y solucionar problemas de conectividad.
El servicio XOps de Cato añade una capa operativa impulsada por IA que ayuda a los administradores a identificar y resolver proactivamente problemas relacionados con enlaces en toda la red. El motor de Operaciones de Sitio detecta condiciones como inestabilidad de enlace, desconexiones de BGP, o fallos de sitios y automáticamente los correlaciona en historias unificadas. Cada historia de XOps agrega métricas relevantes, eventos y detalles de topología en una sola vista que refleja la causa raíz y la cronología del problema. Estas historias son visibles en la página del Banco de Trabajo de Historias, donde puede ordenar, filtrar y profundizar en eventos por sitio, tipo de indicación o nivel de crítica.
Las historias enlazan a los playbooks relevantes para guiar investigaciones, y también generan resúmenes dinámicos basados en IA de las historias para acelerar el análisis. Las historias se cierran automáticamente después de la resolución, facilitando el seguimiento de problemas recurrentes y la salud operativa a lo largo del tiempo sin limpieza manual. Por ejemplo, se abre una historia de Operaciones de Sitio porque el sitio se vio obligado a reconectar al PoP para optimizar el rendimiento. Después de dos horas, la historia se cierra automáticamente porque el problema no se repite.
Artículos relacionados:
Los administradores pueden ver datos de enlaces de todos los Sockets y PoPs a través de tableros y páginas:
-
Red > Sitios: Muestra el Estado de Conectividad Actual y enlaces degradados
-
Sitio > Analíticas de Red: Historia de métricas (por ejemplo, pérdida de paquetes), incluyendo conmutaciones por error y recuperación
-
Red > Visión General de Sitios: Rendimiento de SLA resumido a través de sitios
-
Red > Vista general de la red: Mapa de SLA en tiempo real de la conectividad global de sitios
Use las siguientes APIs para obtener la telemetría de SLA:
-
API accountMetrics – SLA histórico entre el sitio y la columna vertebral
-
API socketPortMetrics – Rendimiento en tiempo real por interfaz de Socket y transporte
Artículos relacionados:
Cato se integra con SIEMs y herramientas de colaboración. Webhooks pueden entregar alertas para:
-
Degradación de enlaces a través de alertas de salud y historias de red XOps
-
Eventos de conmutación por error y recuperación de Socket
Para más información, consulte Trabajar con Reglas de Salud de Conectividad/Calidad.
0 comentarios
El artículo está cerrado para comentarios.