Arquitetura SLA de Link do Socket Cato

Visão Geral

O Cato Cloud é uma espinha dorsal global privada construída sobre provedores de nível 1 para entregar desempenho de SLA consistente e previsível para tráfego WAN entre sites empresariais. Cada PoP Cato é interconectado através dessa espinha dorsal, fornecendo latência controlada e entrega de pacotes independente da Internet pública.

Para manter essas garantias, a Cato desenvolveu tecnologia proprietária que permite a coordenação contínua entre o Socket Cato e o PoP. O Socket mede as principais métricas de desempenho para cada link, enquanto o PoP agrega e correlaciona essas medições para manter o caminho ideal entre o site e a espinha dorsal. Juntos, eles garantem desempenho consistente do link, adaptando-se em tempo real para preservar a continuidade do serviço e maximizar a eficiência dos recursos WAN disponíveis.

O Cato fornece visibilidade completa de ponta a ponta nas condições da rede de cada site, usuário e aplicação. O serviço XOps da Cato aplica análises orientadas por IA para transformar esses dados em histórias claras e acionáveis que ajudam as equipes de TI a resolver problemas mais rapidamente. Ao ingerir continuamente métricas em um mecanismo de contexto único, o XOps fornece insights e alertas em tempo real que reduzem investigações repetitivas e aceleram a identificação da causa raiz, garantindo a experiência do usuário ideal.

Comportamento por Tipo de Implantação de Site

  • Ativo/Ativo: A Cato avalia e roteia dinamicamente o tráfego por ambos os links WAN ativos. O tráfego é direcionado para o link com melhor desempenho com base nas condições em tempo real. As configurações são configuradas dinamicamente pela espinha dorsal da Cato e não são personalizáveis (Nota: Limites de SLA personalizados para implantações Ativo/Ativo estão planejados para um lançamento futuro).

  • Ativo/Passivo: Apenas o link primário transporta tráfego durante a operação normal. Quando o desempenho cai abaixo dos limites de SLA, o Socket ativa o link passivo e redireciona o tráfego para manter a conectividade. Esse comportamento é governado pelo Smart SLA, que avalia automaticamente a qualidade do link para decisões de failover. Você também pode personalizar os limites de SLA em uma base de site por site.

  • Ativo/Passivo com Último Recurso: Para garantir conectividade crítica durante falhas graves de WAN, você pode definir um link de último recurso para o Socket. Tipicamente, uma conexão celular, o Socket somente utiliza esse link em situações de emergência.

Operação e Arquitetura do SLA de Link

A espinha dorsal do Cato Cloud e o Socket operam como uma malha SD-WAN unificada que mantém desempenho consistente do link em toda a WAN. Através da troca contínua de telemetria entre o Socket e seu PoP conectado, a plataforma monitora a qualidade em tempo real de cada link e ajusta de forma proativa o roteamento para evitar degradação.

Harmonia do Socket e PoP

O Socket mede a latência, perda de pacotes, jitter e congestionamento para cada link WAN e envia esses dados para o PoP conectado. O PoP então valida as medições contra sua própria telemetria do lado da espinha dorsal. Trabalhando em conjunto, o Socket e o PoP tomam decisões de roteamento sincronizadas, garantindo visibilidade ponta a ponta e evitando anomalias locais. Para mais informações, veja Understanding Acceptable and Unacceptable SLA for Sites.

Avaliação de Link em Tempo Real

O Socket atribui uma pontuação dinâmica a cada link com base no desempenho em tempo real, com pontuações atualizadas a cada poucos segundos. Quando as condições da rede mudam, os caminhos de tráfego são ajustados automaticamente sem intervenção manual. Administradores podem ver métricas em tempo real e históricas no CMA, que refletem insights tanto do Socket quanto do PoP. Para mais informações, consulte Parte 1: As Interfaces do Socket e Precedência.

Otimização ao Nível da Espinha Dorsal

O PoP integra a telemetria do link no motor de roteamento global da Cato. Se uma degradação consistente for reportada pelo Socket, o PoP pode redirecionar o tráfego do site através de um caminho alternativo da espinha dorsal. Esta abordagem garante a aplicação do SLA além do nível do site.

Sequência de Exemplo: Detecção de Degradação e Ajuste de Caminho

Este exemplo ilustra como um site físico na Filadélfia, EUA, mantém conformidade com o SLA ao alternar entre os PoPs Cato próximos em Nova York e Washington, D.C.

  1. Detecção de Degradação: O Socket no site da Filadélfia detecta aumento de perda de pacotes e latência no link conectado ao PoP de Nova York. Essas métricas degradadas são imediatamente relatadas ao PoP de Nova York.

  2. Troca de Telemetria: O Washington D.C. PoP valida o relatório contra sua própria telemetria do lado da espinha dorsal. Ambos os PoPs confirmam que a degradação é consistente e não é causada por um problema local transitório.

  3. Ajuste de Caminho: O Socket da Filadélfia redireciona os fluxos impactados do PoP de Nova York para Washington D.C. PoP. A transição ocorre automaticamente, preservando a continuidade da sessão e restaurando a conformidade com o SLA.

  4. Monitoramento Pós-Ajuste: O Socket e os PoPs continuam a monitorar a qualidade do link. Quando a conexão do PoP de Nova York retorna ao desempenho normal, o tráfego migra automaticamente de volta para o caminho ideal através de Nova York. Esse comportamento é dirigido por lógica preemptiva que garante que o Socket sempre se reconecte ao PoP geograficamente mais próximo e com melhor desempenho quando o problema é resolvido.

Comportamento do Site Ativo/Ativo

Para fornecer balanceamento de carga, o Socket usa seus dados de pontuação para equilibrar o tráfego de forma inteligente entre os links WAN ativos. Isso garante utilização eficiente da largura de banda e desempenho consistente das aplicações. A lógica SD-WAN da Cato avalia ambas as direções upstream e downstream para manter a qualidade bidirecional para aplicações em tempo real, como voz e vídeo.

Quando a degradação é detectada, o Socket e o PoP redirecionam sem interrupção o tráfego para o link com melhor desempenho. Sessões existentes permanecem estáveis, e os usuários não experimentam interrupções perceptíveis.

Comportamento do Site Ativo/Passivo

Em implantações Ativo/Passivo, um link WAN transporta tráfego enquanto o segundo permanece em standby. Para implantações Ativo/Passivo/Último Recurso, para evitar cobranças desnecessárias ou uso de largura de banda, dados mínimos são enviados pelo link enquanto ele permanece passivo. Ele é ativado apenas quando ambos os links WAN ativos e passivos estão indisponíveis ou funcionando fora dos limites de SLA definidos. Para mais informações, veja Configuring a Last-Resort Link.

Failover e Recuperação

O failover causa uma breve interrupção esperada enquanto o link passivo é inicializado. Uma vez estável, o Socket retoma a avaliação do link em ambos os caminhos. Quando o link primário se recupera, o tráfego transita de volta automaticamente.

Avaliação de Link Ativo/Passivo com Smart SLA

Para sites de Socket ativo/passivo, a configuração padrão de SLA é o Smart SLA da Cato. Essa configuração garante que o tráfego flua sobre o link mais confiável usando avaliação de desempenho em tempo real. O Socket aplica limites predefinidos para latência, jitter e perda de pacotes. Métricas degradadas são relatadas ao PoP, que valida os dados usando telemetria da espinha dorsal.

O Smart SLA elimina a necessidade de configurar limites específicos para sites, enquanto ainda se adapta às condições em tempo real. Isso garante que decisões de failover e recuperação sejam tomadas de forma rápida e precisa.

O Smart SLA amostra dados de link a cada poucos segundos, agregando métricas em médias móveis. Quando não há tráfego de usuário presente, sondas sintéticas são usadas para manter a visibilidade. A validação dupla entre Socket e PoP previne falsos positivos causados por anomalias localizadas.

O failover só ocorre após um número mínimo de violações de limite. O peso das métricas favorece latência e jitter para tráfego em tempo real, enquanto a perda de pacotes é priorizada para fluxos de dados em massa. Para mais informações, veja Configurações da SLA de Conexão.

Monitoramento do Desempenho de Links

A Cato fornece várias maneiras de monitorar o desempenho do link WAN em toda a sua rede. Você pode visualizar métricas de SLA em tempo real e históricas no CMA, acessar telemetria bruta via API da Cato ou usar o XOps para analisar incidentes e tendências por meio de insights baseados em histórias. Essas opções lhe dão visibilidade tanto no nível operacional quanto no de eventos, ajudando-o a gerenciar proativamente o desempenho e solucionar problemas de conectividade.

Monitoramento de Links com XOps

O serviço XOps da Cato adiciona uma camada operacional orientada por IA que ajuda administradores a identificar e resolver proativamente problemas relacionados a links na rede. O motor de Operações de Sites detecta condições como instabilidade de links, desconexões BGP ou falhas de sites e as correlaciona automaticamente em histórias unificadas. Cada história XOps agrega métricas relevantes, eventos e detalhes da topologia em uma única visão que reflete a causa raiz e a linha do tempo do problema. Essas histórias são visíveis na página Bancada de Trabalho de Histórias, onde você pode ordenar, filtrar e explorar eventos por site, tipo de indicação ou nível de criticidade.

As histórias se ligam aos playbooks relevantes para orientar investigações e também geram resumos dinâmicos baseados em IA para acelerar a análise. As histórias são fechadas automaticamente após a resolução, facilitando o acompanhamento de problemas recorrentes e da saúde operacional ao longo do tempo sem necessidade de limpeza manual. Por exemplo, uma história de Operações de Sites é aberta porque o site foi forçado a se reconectar ao PoP para otimizar o desempenho. Após duas horas, a história é automaticamente fechada porque o problema não se repetiu.

Artigos Relacionados: 

Monitorar Links no CMA

Administradores podem ver dados de links de todos os Sockets e PoPs via dashboards e páginas:

Monitorar SLA de Link via API

Use as seguintes APIs para recuperar telemetria de SLA:

  • API accountMetrics – SLA histórico entre site e espinha dorsal

  • API socketPortMetrics – Desempenho em tempo real por interface de Socket e transporte

Artigos Relacionados: 

Integrações e Notificações

A Cato integra-se com SIEMs e ferramentas de colaboração. Webhooks podem entregar alertas para:

  • Degradação de links via alertas de saúde e histórias de rede XOps

  • Eventos de failover e recuperação do Socket

Para mais informações, veja Working with Link Health Rules.

Esse artigo foi útil?

Usuários que acharam isso útil: 0 de 0

0 comentário