사이트에 대한 허용 가능한 SLA와 허용할 수 없는 SLA 이해

개요

Cato 연결성 SLA는 사이트 애플리케이션 흐름의 최적 성능과 복원성을 보장합니다. 소켓과 연결된 PoP는 실시간 SLA 기반 경로 선택 알고리즘을 사용하여 상향 및 하향 방향의 최적 링크를 선택합니다. 알고리즘은 패킷 손실률, 지연 시간, 혼잡, 포트 상태, 인터넷 연결 상태 등의 SLA KPI를 지속적으로 모니터링하며, 연결 SLA 저하가 감지되면 소켓은 플로우를 링크 간에 원활하게 이동할 수 있습니다.

링크 성능은 패킷 손실률, 지연 시간 및 기타 메트릭에 대한 임계값에 따라 수용 가능 또는 수용 불가능으로 분류됩니다. 이 분류는 소켓이 활성 WAN 링크를 사용할 때를 결정하고, 백업 링크를 활성화하거나 다른 PoP에 연결을 시작합니다. SLA 저하에 대한 소켓의 반응을 이해하는 것이 신뢰할 수 있는 애플리케이션 제공을 보장하는 데 필수적입니다.

소켓은 비대칭 상향/하향 대역폭 및 서로 다른 대역폭 용량을 가진 모든 활성 링크 간에 트래픽을 최적으로 분배합니다. 소켓의 연결 SLA 메커니즘은 연결 문제에 반응하여 문제를 자동으로 극복하기 위한 조치를 취하도록 프로그래밍되어 있습니다. 연결 SLA가 수용 불가능해져 임계값을 충족할 수 없을 때, 소켓과 PoP는 연결성을 복구하기 위한 조치를 취합니다. 예를 들어, 소켓은 수동 링크를 활성화합니다. 이러한 조치가 연결 문제를 해결하지 못하면 소켓은 다른 PoP에 연결됩니다.

최상의 복원성과 성능을 위해 소켓 사이트의 활성/활성 구성을 사용하는 것을 권장합니다. 자세한 내용은 Cato Socket Link SLA Architecture를 참조하십시오.

활성/수동 사이트에 대한 SLA 임계값 사용자 정의

Connection SLA 페이지에서는 수동 배포에 적용되는 소켓 사이트의 수용 가능 및 수용 불가능 SLA 임계값을 정의할 수 있습니다.

사이트의 기본 링크에 수용 불가능한 SLA가 있는 경우 소켓은 보조 수동 링크를 활성화하고 트래픽을 PoP로 전송합니다. 기본 링크가 수용 가능한 SLA로 돌아가면 소켓이 플로우를 기본 링크로 이동시키고 보조 링크는 비활성화됩니다.

활성/활성 사이트에 대한 SLA 임계값 사용자 정의

Connection SLA 페이지에서도 활성/활성 배포에 대한 수용 가능 및 수용 불가능 SLA 임계값을 정의할 수 있습니다. 트래픽 분배 및 활성/활성 사이트에 대한 사용자 정의 임계값 구성에 대한 자세한 정보는 Configuring the Connection SLA Settings for Active/Active Socket Sites를 참조하십시오.

수용 가능한 SLA 내에서 작업

수용 가능한 SLA 내에서 소켓은 모든 활성 링크를 사용하고 실시간으로 계산된 상태 점수를 기반으로 각 새로운 플로우에 대한 최적의 링크를 선택합니다. 이 SLA KPI 메트릭에는 패킷 손실률, 지연 시간, 지터, 혼잡 등이 포함됩니다. 자세한 내용은 1부: 소켓 인터페이스와 우선순위를 참조하십시오.

활성/수동 구성에서는 적어도 하나의 활성 링크가 수용 가능한 SLA를 충족하는 한 수동 링크는 비활성 상태로 유지됩니다.

수용 가능한 SLA 내 패킷 손실 예시

다음 예시들은 수용 불가능한 SLA 임계값이 패킷 손실률 10%로 설정된 소켓 사이트 구성을 보여줍니다. 링크 1은 3% 패킷 손실을 경험하고, 링크 2는 0% 패킷 손실을 가지고 있습니다.

AA_Good_SLA.png
  • 새로운 플로우의 경우 소켓이나 PoP는 최상의 품질의 링크를 선택합니다.

    위의 예시에서 새로운 플로우는 0% 패킷 손실이 있는 링크 2에서 열립니다.

AP_Good_SLA.png
  • 링크 1이 수용 가능한 SLA 임계값을 충족하기 때문에 링크 2(비활성 링크)는 활성화되지 않습니다. 모든 플로우는 활성 링크를 계속 사용합니다.

수용 불가능한 SLA로 작업

소켓이 모든 활성 링크가 시간 범위 동안 SLA를 충족하지 않는다고 결정하면 이는 수용 불가능한 SLA로 간주되며 연결 문제를 해결하기 위해 자동으로 조치를 취합니다. 링크 구성과 연결 SLA 설정에 따라 소켓은 더 낮은 우선순위의 수동 링크를 활성화하거나, 링크 중 어느 것도 수용 가능한 SLA 임계값을 충족하지 않으면 모든 링크를 다른 PoP에 연결합니다.

수용 불가능한 SLA에 대한 해결 조치 예시

다음 예시들은 패킷 손실률 10%로 설정된 수용 불가능한 SLA 임계값을 가진 소켓 사이트 구성을 보여줍니다. 링크 1은 15% 패킷 손실을 경험하고 링크 2는 0% 패킷 손실을 가지고 있습니다. 이 예시는 PoP가 자가 치유 메커니즘을 사용하는 평가 기간 중입니다.

AA_Bad_Link.png
  • 새로운 플로우의 경우, 소켓이나 PoP는 최상의 품질의 링크를 선택합니다.

  • 기존 플로우의 경우, 소켓은 플로우를 점진적으로 최상의 품질 링크로 이동시킵니다

    위의 예시에서 플로우는 0% 패킷 손실이 있는 링크 2로 이동합니다.

AP_Bad_Link.png
  • 비활성 링크(링크 2)가 활성화됩니다

  • Socket은 이제 활성/활성 구성에서 작업합니다

  • 새로운 흐름은 링크 2를 사용합니다

  • 기존의 흐름은 링크 1에서 링크 2로 점진적으로 이동합니다

  • 링크 2가 최후의 수단 링크로 구성된 경우, Grace 타이머가 시작됩니다.

    Grace 시간은 셀룰러 링크를 활성화하기 전 연결 문제를 해결하는 데 추가 시간을 제공합니다.

    • Grace 시간 동안 링크 1의 수용 가능한 SLA가 복구되지 않으면 링크 2(최후의 수단 링크)가 활성화됩니다.

수용 불가능한 연결 SLA에 대해 다른 PoP에 연결하는 예시

평가 기간 동안의 해결 조치가 연결 문제를 해결하지 못하면 소켓은 다른 PoP에 연결됩니다. 예를 들어, PoP 위치에 대해 Tier-1 클라우드 제공업체와 문제 있을 경우.

Socket이 새로운 PoP에 연결될 때, 이는 다음과 같은 동작입니다.

  1. 소켓은 최대 40 - 50초 동안 초기 연결 SLA 평가 기간을 시작합니다.

    SLA 평가 기간은 40초이며 매 10초마다 확인되므로 평가 기간의 전체 시간이 40 - 50초 사이입니다.

    1. PoP로의 링크가 수용 가능한 SLA를 제공하면 소켓은 PoP에 연결된 상태를 유지합니다.

    2. PoP로의 링크가 수용 불가능한 SLA를 가질 경우, 소켓은 다른 PoP에 연결되어 최대 40-50초의 초기 연결 SLA 평가 기간을 다시 시작합니다.

  2. 소켓이 수용 가능한 PoP를 찾을 수 없는 경우 원래 PoP에 다시 연결됩니다.

다음 예시는 패킷 손실률 10%로 설정된 수용 불가능한 SLA 임계값을 가진 소켓 사이트 구성을 보여줍니다. 링크 1은 20% 패킷 손실을 경험하고, 링크 2는 Tier-1 제공업체의 연결 문제로 인해 15% 패킷 손실을 가지고 있습니다. 두 번째 다이어그램은 다른 PoP와 연결함으로써 문제가 해결되는 방법을 보여줍니다. 활성/활성 및 활성/수동 사이트 배포에 대해 동작은 동일합니다.

T1_Bad_SLA.png
  • 평가 기간 후, 모든 활성 링크에서 수용 불가능한 SLA(10% 이상의 패킷 손실)가 발생합니다

    예를 들어, Tier-1 서비스 제공업체와 관련된 패킷 손실

T1_Good_SLA.png
  • Socket은 다음으로 최선의 PoP에 연결합니다.

  • 40 - 50초 후, 소켓은 링크가 수용 가능한 SLA를 충족한다고 확인합니다

  • 재연결 이벤트가 생성됩니다

원래 PoP에 다시 연결

최상의 성능과 최저 지연 시간을 위해 소켓이 가장 가까운 물리적 PoP 위치에 항상 연결되도록 권장합니다. 소켓이 주 PoP의 SLA 문제로 인해 다른 PoP 위치로 이동하면 60분 후에 사이트에 가장 가까운 선호하는 PoP 위치에 자동으로 다시 연결을 시도합니다. 소켓은 다시 연결하기 전에 선호하는 PoP가 이용 가능하며 좋은 서비스를 제공하는지 확인합니다. 소켓을 선호하는 PoP에 수동으로 다시 연결하도록 선택할 수도 있습니다. 사이트에 대한 선호하는 PoP 정의를 참조하십시오.

도움이 되었습니까?

0명 중 0명이 도움이 되었다고 했습니다.

댓글 0개