소켓 고가용성(HA)이란 무엇인가

이 문서는 물리적 Cato 소켓 쌍을 사용하는 사이트의 고가용성(HA) 구성 및 페일오버 조건을 다룹니다.

사이트를 위한 Socket 고가용성 개요

사이트의 회복력을 향상시키기 위해, Cato는 각 사이트를 고가용성(HA) 모드로 작동하는 소켓 쌍으로 배포하는 것을 강력히 권장합니다. 이 작동 모드는 단일 소켓 장애 시 사이트의 서비스 연속성을 보장합니다. 페일오버 중에, Cato 클라우드는 흐름 상태를 유지하며 최종 사용자 경험에 미치는 영향은 최소화됩니다.

지원되는 소켓 HA 사이트

Cato는 다음 환경에서 소켓 HA를 지원합니다:

  • 물리적 소켓 사이트

  • AWS vSocket 사이트

  • Azure vSocket 사이트

이 문서는 물리적 소켓 사이트에서 HA가 작동하는 방식을 설명합니다. 몇 번의 클릭으로 Socket HA 설정에 대한 자세한 내용은 HA 배포에서 소켓 사용을 참조하세요.

Socket 고가용성과 다양한 Socket 모델

소켓 HA 사이트는 X1500, X1600, X1600 LTE 또는 X1700과 같은 동일한 소켓 유형으로 두 개의 소켓을 사용할 수 있습니다. 그러나 다른 소켓 유형을 사용할 수 없으므로, X1600과 X1700 소켓을 가진 사이트는 지원되지 않습니다.

같은 HA 사이트에서 X1600 소켓과 X1600 LTE 소켓을 사용할 수 없습니다.

Socket 고가용성과 페일오버 이해

소켓 HA 배포에서는 두 개의 Cato 소켓이 사이트에 할당됩니다. 사이트에 할당된 첫 번째 소켓은 기본 소켓으로 식별되며, 두 번째 소켓은 보조 소켓입니다. 소켓은 HA 활성/대기 모드로 작동합니다. 사이트의 정상 작동 중에 기본 소켓은 HA 마스터 상태를 가지며, 보조 소켓은 HA 대기 상태를 가지게 됩니다. HA 마스터 상태를 가진 소켓만이 트래픽을 처리합니다.

  1. 보조 (대기) 소켓은 기본 소켓이 보내는 주기적인 키파일브 메시지를 수신하여 마스터 소켓의 상태(생동성)를 지속적으로 감시합니다. Keepalive 메시지는 지정된 인터페이스를 통해 LAN & VRRP 또는 VRRP로 설정된 대상으로 전송됩니다 (아래 LAN 연결 및 Socket HA 참조).

  2. 보조 (대기) 소켓이 기본 소켓이 다운된 것을 감지하면, 자신의 HA 상태를 마스터로 변경하고 트래픽을 처리하기 시작합니다. 이것은 세 초간의 HA 키파일브 메시지가 누락된 후에 발생합니다.  

  3. 보조 소켓은 레이어 2 수렴을 가속화하기 위해 LAN 네트워크에 GARP 메시지를 보냅니다.

  4. 기본 소켓이 복구되어 규칙적인 기능으로 복원되면, 사전 경고적으로 마스터가 되고 보조 소켓은 대기 상태로 돌아갑니다.

다음 이미지는 네트워크 > 사이트 > {site name} > 사이트 구성 > 소켓 내의 Cato 관리 애플리케이션에서 X1500 소켓에 대한 HA 구성 페이지를 보여줍니다:

image.png

항목

설명

1

소켓 HA 역할 - 기본 또는 보조

2

소켓 HA 상태 - 마스터 또는 대기

3

HA 상태 - 준비됨 또는 준비되지 않음

4

전체 HA 상태에 대한 특정 조건

  • 연결됨 - 소켓 WAN 연결성

    • GreenCheck.png- 기본 및 보조 소켓 모두 최소한 하나의 작동 터널이 Cato 클라우드에 연결됩니다

    • Red_X.png- 소켓에는 Cato 클라우드에 연결된 작동 터널이 없습니다

  • 키파일브 - 소켓 간의 HA 키파일브 채널 상태

    • GreenCheck.png- 보조 소켓은 기본 소켓에서 HA 키파일브 메시지를 수신합니다

    • Red_X.png- 보조 소켓은 기본 소켓에서 HA 키파일브 메시지를 수신하지 않습니다

  • 호환 버전 - 기본 및 보조 소켓이 호환 가능한 소켓 OS 버전을 실행하고 있습니다

    • GreenCheck.png- Both Sockets are running compatible (the same major) Socket version, for example 14.0.13986 and 14.0.12764

    • Red_X.png- Sockets have different major Socket versions, for example 14.0.13986 and 13.0.48732

    참고: 소켓 HA 페일오버는 소켓이 다른 주요 버전을 실행하더라도 발생합니다. 그러나 보조 소켓 버전이 기본 소켓 버전에서 지원하는 기능을 지원하지 않으면 사이트에 기능 문제가 발생할 수 있습니다.

    For example, if the primary Socket runs version 18.0 and the secondary Socket is running version 15.0, In the case of a failover, features that were released with versions 16 - 18 will not work while the secondary Socket is active.

Socket HA 페일오버 샘플

다음 다이어그램은 보조 소켓으로의 페일오버를 유발하는 기본 소켓의 문제를 예시로 보여줍니다. 보조 소켓이 기본 소켓이 다운된 것을 감지하면 상태를 마스터로 변경합니다. Cato 클라우드는 트래픽 흐름을 보조 소켓의 WAN 링크로 전송합니다.

Socket_HA_Regular.png
Socket_HA_Failure.png

Socket HA와 스플릿 브레인 조건

스플릿 브레인 조건은 두 소켓이 동시에 마스터 역할을 하는 경우입니다. 이는 소켓 간의 LAN 연결 문제로 인해 HA 키프 얼라이브 메시지가 보조 소켓에 도달하지 못하는 상황을 초래할 때 발생할 수 있습니다.

Cato 관리 애플리케이션에서 소켓 페이지(위에 표시)를 확인하여 스플릿 브레인 상태를 식별할 수 있습니다.

  • 기본 및 보조 소켓이 상태 마스터(항목 2)로 표시됩니다.

  • 키프 얼라이브 상태(항목 4)는 실패로 표시되며 이는 HA 상태(항목 3)를 준비 안 됨으로 표시하게 합니다.

LAN 연결 문제가 해결되면 보조 소켓이 기본 소켓을 마스터로 식별하고 보조 소켓은 대기 상태로 돌아갑니다.

스플릿 브레인 조건 중 사이트 트래픽

The following process makes sure that during a split-brain condition, only the secondary Socket handles the traffic for the site (even if there is a split-brain condition).

  • 다운스트림 트래픽 (PoP에서 사이트로):

    1. PoP는 보조 소켓이 이제 마스터가 되었음을 감지합니다.

    2. PoP는 보조 소켓 터널에 선호 메트릭을 설정합니다.

      다운스트림 트래픽은 이제 보조 소켓으로만 라우팅됩니다.

  • 업스트림 트래픽 (사이트에서 PoP로):

    1. 보조 소켓이 HA 상태를 대기에서 마스터로 변경할 때, GARP 메시지를 LAN에 전송하여 이제 마스터임을 나타내고 ARP 및 MAC 테이블을 업데이트합니다.

      LAN에서의 업스트림 트래픽은 이제 보조 소켓으로만 라우팅됩니다.

Cato Cloud로의 HA Socket 연결

기본 및 보조 소켓 모두 각 WAN 포트에서 동일한 Cato 클라우드 PoP로 DTLS 터널을 설정합니다. 업스트림 방향에서는 마스터 소켓만 PoP로 트래픽을 전송합니다. 다운스트림 방향에서는 PoP가 사이트로 트래픽을 보내기 위해 마스터 소켓 터널만을 사용합니다. 소켓 HA 페일오버 이벤트가 발생하는 경우 보조 소켓이 새로운 마스터가 되고, PoP는 실패한 기본 소켓 터널에서 보조 소켓 터널로 트래픽을 이동시킵니다. PoP는 페일오버 중 및 이후에도 모든 사용자 애플리케이션이 작동 상태를 유지할 수 있도록 흐름 상태와 NAT 상태를 유지합니다.

아래는 소켓 HA에 대한 샘플 물리 및 논리 토폴로지입니다:

PhysicalLogicalTopology.png

최적의 WAN 연결성, 성능 및 HA 기능성을 위해 Cato는 양쪽 소켓에 대해 대칭적(미러링된) 배선을 요구합니다. 예를 들어, 기본 소켓 포트 WAN1이 ISP1에 연결되고 포트 WAN2가 ISP2에 연결된 경우, 보조 소켓은 기본 소켓과 동일한 포트를 동일한 ISP에 연결해야 합니다.

이 대칭 토폴로지에는 ISP 라우터에 대한 직접 연결이나 스위치 스택을 사용하는 것이 포함될 수 있습니다.

WAN_Connectivity_Router_Switch.png

참고: 비대칭 토폴로지를 사용하면 문제가 발생할 수 있으며 Cato에서 공식적으로 지원하지 않습니다. 예를 들어, 기본 소켓 포트 WAN1이 ISP1에 연결되고, 보조 소켓 포트 WAN1이 ISP2에 연결된 경우입니다.

LAN 연결 및 Socket HA

Cato는 기본 및 보조 소켓 모두 LAN 연결성을 위해 대칭적(미러링된) 배선 레이아웃을 갖도록 요구합니다. For example, LAN port 1 for both the primary and secondary Sockets is connected to the LAN switch (or LAN ports 1 and 2 for configurations with multiple LAN ports).

이 섹션에서는 HA 소켓을 위한 LAN 연결 옵션을 논의합니다:

  1. 단일 LAN 포트

  2. 다중 LAN 포트

  3. LAN 링크 집계 (권장 옵션)

  4. HA 유지 메시지를 위한 전용 포트

일부 옵션은 Cato 관리 애플리케이션에서 사이트의 추가 구성이 필요합니다. 예를 들어, LAN 포트는 LAN & VRRP 또는 VRRP로 구성됩니다.

단일 LAN 포트를 사용하는 Socket HA

기본 및 보조 소켓을 LAN 스위치에 연결하기 위해 단일 LAN 포트를 사용하는 구성도 있습니다. 이 구성에서는 두 소켓 모두 동일한 포트 번호를 사용해야 합니다. 사용자 트래픽과 HA 유지 메시지는 단일 링크를 통해 실행됩니다. 이 토폴로지는 LAN 링크 이중성을 제공하지 않습니다.

다음 다이어그램은 각 소켓의 단일 LAN 포트를 스위치에 연결한 샘플 소켓 HA 토폴로지를 보여줍니다:

HA_LAN_switch.png

다중 LAN 포트를 사용하는 Socket HA

이 섹션에서는 기본 및 보조 소켓 모두가 두 개 이상의 독립적인 LAN 포트를 통해 LAN 스위치에 연결될 때에 대해 논의합니다. 이 구성에서는 LAN 연결성과를 위해 두 소켓 모두에서 동일한 포트를 사용해야 합니다.

기본적으로 가장 낮은 번호의 LAN 포트가 HA 유지 트래픽과 사용자 트래픽 모두에 사용됩니다. 나머지 LAN 포트는 사용자 트래픽만 전송합니다.

포트 목적지LAN에서 LAN & VRRP로 변경하여 HA 유지 트래픽에 사용할 LAN 포트를 선택할 수 있습니다.  다음 스크린샷은 LAN 사용자 트래픽을 위한 포트 3과 HA 유지 트래픽 및 사용자 트래픽을 위한 포트 4를 보여줍니다.

LAN_VRRP.png

HA Keepalive 트래픽을 위한 LAN 포트 변경에 대한 자세한 내용은 HA 배포에서 소켓 사용을 참조하세요. 이 토폴로지는 LAN 링크 이중성을 제공하지 않습니다.

소켓 HA 장애 조치(보조 소켓이 마스터가 되는 경우)는 다음 두 조건이 모두 충족될 때만 발생합니다:

  1. 보조 소켓이 3초 동안 기본 소켓으로부터 HA 유지 메시지를 받지 않습니다.

  2. 보조 소켓의 LAN & VRRP 포트는 연결됨 상태에 있습니다.

보조 소켓 LAN 포트가 연결이 끊긴 경우, 분리된 헤드 상태를 피하기 위해 마스터가 되지 않습니다.

LAN 링크 집계를 사용하는 Socket HA (권장 구성)

기본 및 보조 소켓 모두 링크 집계(LAG)에 묶인 두 개 이상의 LAN 포트를 통해 LAN 스위치에 연결됩니다.  이 구성에서는 LAN 연결성을 위해 두 소켓 모두에서 동일한 포트를 사용해야 합니다. 이 토폴로지는 사용자 트래픽과 HA 유지 메시지 모두에 대해 LAN 링크 이중성을 제공합니다. LAG 멤버 포트 중 하나가 장애가 발생하면 다른 멤버 포트가 계속해서 사용자 트래픽과 HA 유지 트래픽을 전송합니다.

이 토폴로지는 링크 복원력과 소켓 복원력을 모두 제공하며 모범 사례로 간주됩니다.

LAN LAG에 대해 더 알고 싶다면, 소켓의 링크 집계 설정을 참조하세요.

다음 다이어그램은 스위치 스택을 사용한 LAN LAG를 활용한 소켓 HA LAN 연결 토폴로지의 예입니다:

SocketHA_LAG.png

HA Keepalive 트래픽 전용 포트

이 구성에서는 HA 유지 트래픽을 LAN 트래픽에서 격리합니다. 단일 포트(LAN, WAN, USB 포트)를 HA 유지 트래픽 전용으로 할당하고, 나머지 LAN 포트 중 하나 이상을 LAN 트래픽에 사용할 수 있습니다.

HA 유지 트래픽 전용 LAN 포트를 설정하려면 포트의 목적지VRRP로 설정합니다. 그런 다음 소켓 간 HA 링크 옵션을 직접 또는 스위치 경유로 설정합니다.

Direct_HA_Link.png

다음은 전용 포트 구성입니다:

  1. 직접(소켓 간 백투백 케이블) - 이 구성에서는 보조 소켓이 HA 유지 메시지를 받지 않으면 VRRP 포트 상태에 관계없이 마스터가 됩니다.

  2. 스위치 경유 - 이 구성에서는 두 소켓의 VRRP 포트가 스위치에 연결됩니다. 페일오버 동작은 2차 소켓 VRRP 포트 상태에 따라 다릅니다:                                                             

    1. 2차 소켓 포트 상태가 연결되어 있지만 Keepalive 메시지를 수신하지 못하는 경우 – 2차 소켓이 마스터가 됩니다.

      2차 소켓은 상태가 주요 소켓 고장으로 인한 것이라고 가정합니다.

    2. 2차 소켓 포트 상태가 연결 해제된 경우 - 2차 소켓은 스위치와의 로컬 문제라고 가정하고 마스터가 되지 않습니다 (()).

      2차 소켓은 주요 소켓이 정상적으로 작동하고 있다고 가정하며, 스플릿 브레인 상태를 피하기 위해 마스터가 되지 않습니다.

이것들은 직접 및 스위치를 통한 전용 포트 구성의 다이어그램입니다:

Socket_HA_-_Direct_Port_for_HA_Traffic.png
Socket_HA_-_via_Switch_Port_for_HA.png

Socket 고가용성의 페일오버 조건

이 섹션에서는 주요 소켓에서 2차 소켓으로의 페일오버를 일으키는 조건을 설명합니다.

주 소켓 장애로 인한 페일오버

이 페일오버 시나리오는 주요 소켓의 고장으로 인해 발생합니다. 다음 이유 중 하나로 소켓이 다운 상태로 간주됩니다:

  • 일반 소켓 고장 또는 전원 손실

  • LAN 연결 (3초 이상 Keepalive 없음)

  • 10초 이상 인터넷 연결 없음

Keepalive 실패로 인한 페일오버

2차 소켓이 주요 소켓으로부터 3초 동안 Keepalive 메시지를 받지 못할 때 발생하는 페일오버 시나리오가 있습니다.

2차 소켓이 주요 소켓이 다운되었다고 판단하면 마스터로 상태를 변경합니다. Cato 클라우드는 트래픽 흐름을 2차 소켓의 WAN 링크로 전송합니다. 아래 다이어그램은 이 시나리오를 보여줍니다.

Socket_HA_LAN_Failure.png

인터넷 연결 문제로 인한 소켓 페일오버가 발생합니까?

소켓은 인터넷 연결 상태를 결정하기 위해 탐색 메커니즘을 사용합니다. 주요 소켓이 모든 인터넷 링크(Cato 링크)의 인터넷 연결이 10초 이상 다운되었다고 판단하면 HA Keepalive 메시지 전송을 중지합니다. 이는 2차 소켓으로의 페일오버를 야기합니다.

참고: 주요 소켓이 인터넷 연결되어 있는 상태에서도 모든 DTLS 터널이 연결 해제 상태일 수 있습니다. 소켓에는 인터넷 및 WAN 회복 메커니즘이 있기 때문에 이 상황은 2차 소켓으로의 페일오버를 유발하지 않습니다. 이 회복 메커니즘은 소켓이 Cato 클라우드의 다른 PoP에 재연결할 수 있도록 합니다.

Socket 고가용성 모니터링

이 섹션에서는 소켓 HA의 상태와 이벤트를 모니터링하는 데 사용되는 Cato 관리 애플리케이션의 다양한 페이지에 대해 설명합니다.

Socket HA 상태 표시

Cato 관리 애플리케이션에는 사이트의 소켓 HA 상태를 보여주는 다양한 페이지가 있습니다.

페이지 이름

설명

경로

사이트들

계정의 모든 사이트를 보여줍니다. HA 상태 열에는 각 사이트의 소켓 HA 상태가 표시됩니다.

네트워크 > 사이트들

소켓

사이트의 소켓 HA 세부정보를 보여줍니다. 위의 Socket 고가용성과 페일오버 이해를 참조하세요.

네트워크 > 사이트들 > <사이트 이름> > 사이트 구성 > 소켓

네트워크 분석

사이트의 네트워크 데이터 및 HA 상태를 보여줍니다.

네트워크 > 사이트들 > <사이트 이름> > 사이트 모니터링 > 네트워크 분석

Socket HA 페일오버 이벤트

소켓 페일오버가 발생할 때마다, 2차 소켓이 35초 이상 활성 상태인 경우 소켓 페일오버 이벤트가 생성됩니다. 예를 들어, 주요 소켓이 새로운 소켓 버전으로 업그레이드하고 업그레이드 과정이 20초 걸리는 경우, 2차 소켓이 20초 동안만 활성 상태였기 때문에 소켓 페일오버 이벤트는 생성되지 않습니다.

홈 > 이벤트 페이지에서 Cato 관리 애플리케이션에서 이벤트를 볼 수 있습니다. 여기에서 주요 소켓에서 2차 소켓으로의 페일오버를 보여주는 예시 이벤트가 있습니다.

Failover.png

Socket 고가용성 페일오버에 대한 이메일 알림 정의

링크 건강 규칙 페이지(Network > Link Health Rules)를 사용하여 소켓 HA 장애 조치 이벤트를 위한 이메일 알림을 보내는 연결성 건강 규칙을 생성할 수 있습니다. 이메일 알림은 Cato 관리 애플리케이션에서 구성한 메일링 리스트의 모든 수신자에게 전송됩니다. 메일링 리스트는 Cato 관리 애플리케이션에서 사용자 및 관리자에 대해 정의되지 않은 이메일 주소를 포함할 수 있습니다.

소켓 장애 조치를 위한 샘플 연결성 건강 규칙입니다:

Socket_Failover_Alert.png

연결성 건강 규칙 구성에 대한 자세한 내용은 링크 건강 규칙 작업을 참조하세요.

도움이 되었습니까?

17명 중 15명이 도움이 되었다고 했습니다.

댓글 0개