Comprender SLA aceptable e inaceptable para sitios

Resumen

El SLA de conectividad de Cato para la última milla garantiza un rendimiento óptimo y resiliencia para los flujos de aplicaciones del sitio. El Socket y el PoP conectado utilizan algoritmos de selección de ruta basados en SLA en tiempo real para elegir el enlace óptimo para cada flujo en las direcciones ascendente y descendente. El algoritmo monitorea constantemente los KPIs de SLA como la pérdida de paquetes, latencia, congestión, estado del puerto, estado de conectividad a Internet, y el Socket puede mover flujos entre enlaces sin interrupciones si se detecta una degradación de SLA.

El rendimiento del enlace se clasifica como aceptable o inaceptable según los umbrales para pérdida de paquetes, latencia y otras métricas. Esta clasificación determina cuándo el Socket utiliza el enlace WAN activo, activa un enlace de respaldo o inicia una conexión a un PoP diferente. Comprender cómo el Socket reacciona ante la degradación del SLA es esencial para asegurar una entrega confiable de aplicaciones.

El Socket distribuye de manera óptima el tráfico entre todos los enlaces activos, incluidos los enlaces con diferentes capacidades de ancho de banda y ancho de banda asimétrico ascendente/descendente. El mecanismo SLA de conectividad del Socket está programado para reaccionar ante cualquier problema de conectividad y tomar acciones para superar automáticamente el problema. En situaciones donde el SLA de conectividad se vuelve inaceptable y no puede cumplir con los umbrales, el Socket y el PoP toman acciones para reparar la conectividad. Por ejemplo, el Socket activa los enlaces pasivos. Si estas acciones no resuelven el problema de conectividad, el Socket se conectará a un PoP diferente.

Recomendamos usar la configuración activa/activa para los sitios de Socket para la mejor resiliencia y rendimiento. Para más información, consulte Arquitectura de SLA de enlace de Cato Socket.

Personalización de Umbrales de SLA para Sitios Activos/Pasivos

La página de SLA de conexión permite definir umbrales de SLA aceptables e inaceptables que se aplican a sitios de Socket en implementaciones activas/pasivas.

Cuando hay un SLA inaceptable para el enlace principal en un sitio, el Socket activa el enlace pasivo secundario y envía tráfico sobre él al PoP. Cuando el enlace principal regresa a un SLA aceptable, el Socket mueve los flujos de regreso al enlace principal, y el enlace secundario es desactivado.

Personalización de Umbrales de SLA para Sitios Activos/Activos

La página de SLA de conexión también permite definir umbrales de SLA aceptables e inaceptables para implementaciones activas/activas. Para más información sobre distribución de tráfico y configuración de umbrales personalizados para sitios activos/activos, consulte Configurando los ajustes de SLA de conexión para sitios de Socket activos/activos.

Operando dentro de un SLA aceptable

Dentro del SLA aceptable, el Socket utiliza todos los enlaces activos y selecciona el mejor enlace para cada nuevo flujo basado en un puntaje de salud calculado en tiempo real. Estas métricas de KPI de SLA incluyen: pérdida de paquetes, latencia, fluctuación, congestión y más. Para más información, vea Parte 1: Las Interfaces del Socket y Precedencia.

Para configuraciones activas/pasivas, los enlaces pasivos permanecen inactivos mientras haya al menos un enlace activo con un SLA aceptable.

Ejemplo de Pérdida de Paquetes dentro del SLA Aceptable

Los siguientes ejemplos muestran configuraciones de sitio de Socket donde el umbral de SLA inaceptable se establece en una pérdida de paquetes del 10%. Enlace 1 está experimentando una pérdida de paquetes del 3%, y enlace 2 tiene una pérdida de paquetes del 0%.

AA_Good_SLA.png
  • Para nuevos flujos, el Socket o PoP eligirá el enlace con la mejor calidad

    En el ejemplo anterior, nuevos flujos se abrirían en el enlace 2 con una pérdida de paquetes del 0%

AP_Good_SLA.png
  • El enlace 2 (el enlace pasivo) no está activado porque el enlace 1 cumple con el umbral de SLA aceptable. Todos los flujos continúan utilizando el enlace activo.

Operando con un SLA inaceptable

Cuando el Socket determina que todos los enlaces activos no cumplen con el SLA durante el rango de tiempo, esto se considera un SLA inaceptable, y el Socket toma acciones automáticamente para remediar los problemas de conectividad. Dependiendo de la configuración del enlace y los ajustes de SLA de Conexión, el Socket activará un enlace pasivo de menor precedencia, o si ninguno de los enlaces cumple con los umbrales de SLA aceptable, conecta todos los enlaces a un PoP diferente.

Ejemplo de Acciones de Remedio para SLA Inaceptable

Los siguientes ejemplos muestran configuraciones de sitio de Socket donde el umbral de SLA inaceptable se establece en una pérdida de paquetes del 10%. Enlace 1 está experimentando una pérdida de paquetes del 15% y el enlace 2 tiene una pérdida del 0%. Estos ejemplos se muestran durante el período de evaluación donde el PoP utiliza mecanismos de auto-sanación.

AA_Bad_Link.png
  • Para nuevos flujos, el Socket o PoP elegirá el enlace con la mejor calidad

  • Para flujos existentes, el Socket mueve gradualmente los flujos al enlace con la mejor calidad

    En el ejemplo anterior, los flujos se moverían al enlace 2 con una pérdida de paquetes del 0%

AP_Bad_Link.png
  • El enlace pasivo (enlace 2) está activado

  • El Socket ahora trabaja en configuración activo/activo

  • Nuevos flujos utilizan el enlace 2

  • Flujos existentes se mueven gradualmente del enlace 1 al enlace 2

  • Para configuraciones donde el enlace 2 es un enlace de último recurso, el temporizador de gracia comienza a contar

    El tiempo de gracia otorga tiempo adicional para resolver problemas de conectividad antes de activar el enlace celular

    • Si un SLA aceptable no se restaura en el enlace 1 durante el tiempo de gracia, entonces el enlace 2 (el enlace de último recurso) se activa

Ejemplo de Conexión a un PoP Diferente por un SLA de Conectividad Inaceptable

Si las acciones de remedio durante el período de evaluación no resuelven los problemas de conectividad, entonces el Socket se conecta a un PoP diferente. Por ejemplo, si hay un problema con el proveedor de nube de nivel-1 para la ubicación del PoP.

Cuando un Socket se conecta a un nuevo PoP, este es el comportamiento:

  1. El Socket inicia el período de evaluación inicial de SLA de conectividad de hasta 40 - 50 segundos.

    El período de evaluación de SLA es de 40 segundos, y se verifica cada 10 segundos, esto significa que el tiempo total del período de evaluación está entre 40 y 50 segundos.

    1. Si los enlaces al PoP tienen un SLA aceptable, el Socket permanece conectado al PoP.

    2. Si los enlaces al PoP tienen un SLA inaceptable, el Socket se conecta a un PoP diferente y repite el período de evaluación inicial de SLA de conectividad de hasta 40 - 50 segundos.

  2. Si el Socket no puede localizar un PoP con un SLA aceptable, regresa y se conecta al PoP original.

Los siguientes ejemplos muestran configuraciones de sitio de Socket donde el umbral de SLA inaceptable se establece en una pérdida de paquetes del 10%. Enlace 1 está experimentando una pérdida de paquetes del 20%, y enlace 2 tiene una pérdida de paquetes del 15% como resultado de problemas de conectividad del proveedor de nivel-1. El segundo diagrama muestra cómo conectarse a un PoP diferente resuelve el problema. El comportamiento es el mismo para implementaciones de sitio activo/activo y activo/pasivo.

T1_Bad_SLA.png
  • Después del período de evaluación, hay un SLA inaceptable (más del 10% de pérdida de paquetes) en todos los enlaces activos

    Por ejemplo, pérdida de paquetes relacionada con el proveedor de servicios de nivel-1

T1_Good_SLA.png
  • El Socket se conecta al siguiente PoP mejor

  • Después de 40 - 50 segundos, el Socket confirma que los enlaces cumplen con el SLA aceptable

  • Se genera un evento de reconexión

Reconectando con el PoP Original

Para un rendimiento óptimo y menor latencia, siempre se recomienda que el Socket se conecte a la ubicación física de PoP más cercana. Si el Socket se mueve a una ubicación de PoP diferente, debido a problemas de SLA con el PoP primario, intentará automáticamente reconectarse a la ubicación de PoP preferida (el PoP más cercano al sitio) en 60 minutos. El Socket verificará que el PoP preferido esté disponible y ofrezca un buen servicio antes de reconectarse a él. También puedes optar por reconectar manualmente el Socket al PoP preferido, ver Definición de un PoP Preferido para un Sitio.

¿Fue útil este artículo?

Usuarios a los que les pareció útil: 0 de 0

0 comentarios