使用链接健康规则

本文讨论如何配置健康规则,以在出现连接或链路质量问题时发送电子邮件通知。

概览

使用 健康规则 页面配置 Cato 管理应用程序,以便在所配置的时间内,发送有关链接连接性或质量问题的通知。 对于连接规则,您可以定义在连接性问题时触发电子邮件通知的对象范围。 对于质量规则,定义在一个或多个接口上监控链接质量阈值的对象。 此外,您可以选择哪些类型的质量类别触发电子邮件通知。

健康规则不是排序策略,多个规则可以匹配单个问题。

管理健康规则

以下部分介绍如何创建、启用和管理健康规则。

配置连接健康规则

注意

注意:

  • 对于当前在连接性健康规则中没有用户和用户组的账户,自2024年11月3日起,将不能将其定义为来源
  • 从2025年1月2日起,用户和用户组将不能再作为来源被定义在连接性健康规则中。

要了解更多信息,请参阅此文章

您可以为规则设置条件(例如,仅在问题持续特定时间或问题重复发生时发送警报),并为一个或多个连接条件问题设置不同的规则(例如,故障转移、被动断开、断开)。 当您定义多个条件时,它们之间存在“或”关系。

对于包含站点的连接性健康规则,我们建议不要使用任何选项。 由于用户和群组常常断开和连接,站点可能会生成大量通知。

ConnectivityHealthRule.png

配置连接性健康规则:

  1. 从导航菜单中,点击网络 > 链接健康规则
  2. 连接性健康规则标签或部分,点击新建

    新建连接性健康规则面板打开。

  3. 为规则配置常规设置:
    1. 输入规则的名称
    2. 点击滑块toggle.png确保规则已启用。
  4. 为规则配置来源设置:
    1. 选择类型(例如:站点或组)。
    2. 在需要时,从下拉列表中选择该类型的特定项目。
  5. 配置此规则的条件设置(列):
    1. 中,选择一个或多个触发规则的连接项目:

      • 任何 - 任何类型的连接性问题
      • 故障切换 - 主链路与备链路之间或反之亦然的故障切换。
      • 主动WAN链路已断开 - 处于活跃状态的链路已断开。
      • 被动WAN链路已断开 - 处于被动或最后手段状态的链路已断开。
      • Socket故障切换 - HA配置中Sockets之间的故障切换。
      • 互联网作为传输 - 通过互联网传输数据的链路(而不是通过Cato云)断开连接。
      • LAN端口断开连接 - 局域网端口断开连接。
      • 备用。 WAN链路断开连接 - 链接用于通过备用方式恢复。 WAN已断开连接。
      • HA未就绪 - HA配置中的一个Socket断开连接或两个Socket报告为主要Socket。
    2. 警报规则中,您可以定义触发规则的连接性问题的持续时间或次数:

      • 对于断开条件,您可以定义链路断开持续时间 - 在触发规则之前链接或连接断开所需的时间。
      • 事件发生次数中,您可以定义触发规则前连接性问题的发生频率。

      注意

      注意:

      • 警报规则设置以或关系评估。
      • 默认情况下,健康规则引擎检查持续时间为2.5分钟,以确定事件是否匹配规则。 如果您为规则配置小于2.5分钟的链路断开持续时间,这会影响通知的内容。 例如,如果为活动 WAN 链接断开规则配置了 1 分钟的持续时间,则当活动链接断开超过 1 分钟后,规则将匹配。 但这可能会导致两个不同的通知,如下所示:

        • 如果活跃链接断开连接超过 1 分钟,并保持断开超过 2.5 分钟 - 通知将是一个断开连接
        • 如果活跃链接断开连接超过 1 分钟,但在 2.5 分钟前重新连接 - 通知将是一个Connect 警报(与警报相关的事件也可能显示为 PoP 变更重新连接事件)
      • 发生次数设置为断开连接规则(例如活跃 WAN 链接断开被动 WAN 链接断开)时,PoP 变更和会话重新连接不算作发生次数。 仅断开连接会被计数。
      • 当因 出现次数条件触发 活动 WAN 链接断开被动 WAN 链接断开规则警报时,当链接恢复时将不会发送已连接警报
      • 当为 活动 WAN 链接断开被动 WAN 链接断开设置条件时,规则将在链接恢复 30 秒后发送已连接警报,在以下情况下:

        • 没有设置“警告条件”
        • 如果仅设置了链接断开时间条件
        • 如果同时设置了链接断开时间和事件次数条件,如下所示:

          • 如果链接断开时间条件触发警报,链接恢复30秒后将发送连接警报
          • 如果事件次数条件触发警报,链接恢复时将不发送连接警报
  6. (可选) 配置 跟踪 选项以 发送通知

    有关通知的更多信息,请参阅警报部分中关于订阅组、邮件列表和警报集成的相关文章。

  7. 点击应用。 新规则已添加到规则库中。
  8. 点击保存。 连接性健康规则已保存到您的账户。

示例连接健康规则和行为

本节提供示例以说明各种连接性健康规则的警报行为。

示例1 - 配置条件为“断开连接规则”但无警报

连接性健康_-_示例_1.png

规则配置 - 活动 WAN 链接断开被动 WAN 链接断开条件,未配置条件警报。

规则行为 -

  • 如果链接断开超过2.5分钟则触发断开警报
  • 如果在2.5分钟内发生断开和重连接则触发重连接警报

    注意:在连接恢复后,重连接事件可能会有最多30秒的延迟检测。

  • 链接恢复30秒后触发连接警报

示例2 - 配置条件为“链接断开持续时间”的断开连接规则

连接性健康_-_示例_2.png

规则配置 - 活动 WAN 链接断开被动 WAN 链接断开条件,配置链接断开持续时间条件为断开超过 1 分钟。

规则行为 -

  • 如果链接断开超过1分钟则触发断开警报
  • 如果链接在2.5分钟内重连接则不触发重连接警报
  • 链接恢复30秒后触发连接警报

示例3 - 配置条件为“事件发生次数”的断开连接规则

连接性健康_-_示例_3.png

规则配置 - 活动 WAN 链接断开被动 WAN 链接断开条件,配置事件出现次数条件为 60 分钟内出现 4 次。

规则行为 -

  • 如果链接在60分钟内出现4次断开/重连接/PoP变化事件则触发警报
  • 仅为第4次事件发送警报。 例如,如果4次事件依次是PoP变化、重连接、PoP变化、断开——仅发送断开警报

示例4 - 配置条件为“链接断开持续时间”和“事件发生次数”的断开连接规则

连接性健康_-_示例_4.png

规则配置 - 活动 WAN 链接断开被动 WAN 链接断开条件,配置链接断开持续时间条件为断开超过 1 分钟,配置事件出现次数条件为 1 小时内出现 1 次。

规则行为 - 由于链接断开时间和事件次数条件之间存在或关系,因此该规则导致两种分开的行为,如下所示:

链接断开时间条件的行为 -

  • 如果链接断开超过1分钟则触发断开警报
  • 如果链接在2.5分钟内重连接则不触发重连接警报
  • 链接恢复30秒后触发连接警报

事件次数条件的行为 -

  • 如果在1小时内至少有一次断开/重连接/PoP变化事件则触发警报

使用健康规则监控链接质量

质量健康规则允许您监控站点和Cato Cloud之间的链路质量。 当质量在配置的时间范围内未达到阈值时,CMA发送通知。 在链路质量恢复到在特定时间内符合阈值后,会发送第二次通知。

您可以为特定站点或群组定义规则范围。 此外,定义哪些链接被监控,以用于具有Sockets和IPsec连接的站点接口。 您必须配置至少一个质量阈值,以便根据这些类别触发电子邮件通知:

方向 流量可以是上行、下行或双向
丢包率 已传输数据包的百分比
距离(毫秒) 数据包从源到PoP往返所需的毫秒数
抖动(毫秒) 数据包之间的延迟(以毫秒为单位)
拥堵

数据包的容量超过了可用链接容量,导致网络拥堵

拥堵在所有带宽优先级上进行测量,若丢弃数据包超过已配置的持续时间1%时便会触发。

当选择了多个质量阈值时,它们以或的关系进行评估。

Cato建议您为每个链接设置单独的链接健康规则。 这确保了如果主要和次要链接在同一时期内断开连接,您将分别收到断开和重新连接事件的通知。

配置链接质量健康规则

配置质量健康规则以监控您的账户中站点、对象与Cato Cloud之间的链接质量。 当定义了多个阈值时,它们之间存在或的关系。

链接质量健康规则的条件定义了哪些阈值将被监控。 例如,如果阈值被设置为100ms的距离,并将警报规则设置为10分钟的50%分钟,这意味着在总共10分钟内有5分钟的链路距离质量差。 如果问题在前2分钟内发生,然后在链接健康状态良好的1分钟后,问题在接下来的3分钟内再次发生,则会生成一个事件,并发送通知(根据规则设置)。

质量健康规则.png

要配置健康规则以监控链接质量:

  1. 从导航菜单中,点击网络 > 链接健康规则
  2. 质量健康规则标签或部分中,点击新建

    新的质量警报面板打开。

  3. 配置规则的常规设置:
    1. 输入规则的名称
    2. 选择触发规则的流量方向任意上行下行
    3. 点击滑块 toggle.png 以确保规则已启用。
  4. 配置规则的来源设置:
    1. 选择类型(例如:站点或分组)。
    2. 如有需要,从类别的下拉列表中选择一个特定项目。
  5. 网络接口部分,选择一个或多个接口以适用该规则。

    要将规则应用于所有接口,请选择任意

  6. 条件部分,定义触发规则的链接质量条件:
    1. 选择一个或多个阈值,并为每个阈值配置质量值。
    2. 为链路质量问题的持续时间定义链路断开持续时间设置。
    3. 清除事件中,设置在发送全部正常电子邮件通知前的等待时间。
  7. 配置 跟踪 选项以 发送通知
    注意: 如果 发送通知 选项被禁用,规则将不生成通知或事件。

    有关通知的更多信息,请参阅警报部分中关于订阅组、邮件列表和警报集成的相关文章。

  8. 点击应用。 新规则被添加到规则库。
  9. 点击保存。 质量健康规则已保存到您的帐户中。

配置警报和通知选项

跟踪选项允许您创建由不同规则触发的警报,例如防火墙规则、远程端口转发规则、健康警报等。 对于某些规则,如防火墙规则,您可以选择在规则匹配时生成通知。

频率定义了系统生成通知的频率。 每次事件仅生成一个警报。

要为规则配置警报和通知:

  1. 跟踪部分,选择发送通知
  2. 频率部分,配置通知发送给接收者的频率如下:

    • 立即 - 每次事件发送通知。
    • 每小时 - 在首次发生时发送通知。 如果在一个小时内有更多事件发生,请勿发送额外通知。
    • 每日 - 在首次出现时发送通知。 如果在一天内有更多事件发生,请勿发送额外通知。
    • 每周 - 在首次出现时发送通知。 如果在一周内有更多事件发生,请勿发送额外通知。
  3. 在内 发送通知给,选择 订阅组邮件列表集成,并选择相关项目。
  4. 点击 应用,然后点击 保存

这篇文章有帮助吗?

2 人中有 2 人觉得有帮助

0 条评论