本文讨论如何配置健康规则,以在出现连接或链路质量问题时发送电子邮件通知。
使用 健康规则 页面配置 Cato 管理应用程序,以便在所配置的时间内,发送有关链接连接性或质量问题的通知。 对于连接规则,您可以定义在连接性问题时触发电子邮件通知的对象范围。 对于质量规则,定义在一个或多个接口上监控链接质量阈值的对象。 此外,您可以选择哪些类型的质量类别触发电子邮件通知。
健康规则不是排序策略,多个规则可以匹配单个问题。
以下部分介绍如何创建、启用和管理健康规则。
注意
注意:
- 对于当前在连接性健康规则中没有用户和用户组的账户,自2024年11月3日起,将不能将其定义为来源。
- 从2025年1月2日起,用户和用户组将不能再作为来源被定义在连接性健康规则中。
要了解更多信息,请参阅此文章。
您可以为规则设置条件(例如,仅在问题持续特定时间或问题重复发生时发送警报),并为一个或多个连接条件问题设置不同的规则(例如,故障转移、被动断开、断开)。 当您定义多个条件时,它们之间存在“或”关系。
对于包含站点的连接性健康规则,我们建议不要使用任何选项。 由于用户和群组常常断开和连接,站点可能会生成大量通知。
配置连接性健康规则:
- 从导航菜单中,点击网络 > 链接健康规则。
-
在连接性健康规则标签或部分,点击新建。
新建连接性健康规则面板打开。
- 为规则配置常规设置:
- 输入规则的名称。
- 点击滑块
确保规则已启用。
- 为规则配置来源设置:
- 选择类型(例如:站点或组)。
- 在需要时,从下拉列表中选择该类型的特定项目。
- 配置此规则的条件设置(开列):
-
在开中,选择一个或多个触发规则的连接项目:
- 任何 - 任何类型的连接性问题
- 故障切换 - 主链路与备链路之间或反之亦然的故障切换。
- 主动WAN链路已断开 - 处于活跃状态的链路已断开。
- 被动WAN链路已断开 - 处于被动或最后手段状态的链路已断开。
- Socket故障切换 - HA配置中Sockets之间的故障切换。
- 互联网作为传输 - 通过互联网传输数据的链路(而不是通过Cato云)断开连接。
- LAN端口断开连接 - 局域网端口断开连接。
- 备用。 WAN链路断开连接 - 链接用于通过备用方式恢复。 WAN已断开连接。
- HA未就绪 - HA配置中的一个Socket断开连接或两个Socket报告为主要Socket。
-
在警报规则中,您可以定义触发规则的连接性问题的持续时间或次数:
- 对于断开条件,您可以定义链路断开持续时间 - 在触发规则之前链接或连接断开所需的时间。
- 在事件发生次数中,您可以定义触发规则前连接性问题的发生频率。
注意
注意:
- 警报规则设置以或关系评估。
-
默认情况下,健康规则引擎检查持续时间为2.5分钟,以确定事件是否匹配规则。 如果您为规则配置小于2.5分钟的链路断开持续时间,这会影响通知的内容。 例如,如果为活动 WAN 链接断开规则配置了 1 分钟的持续时间,则当活动链接断开超过 1 分钟后,规则将匹配。 但这可能会导致两个不同的通知,如下所示:
- 如果活跃链接断开连接超过 1 分钟,并保持断开超过 2.5 分钟 - 通知将是一个断开连接
- 如果活跃链接断开连接超过 1 分钟,但在 2.5 分钟前重新连接 - 通知将是一个Connect 警报(与警报相关的事件也可能显示为 PoP 变更或重新连接事件)
- 当发生次数设置为断开连接规则(例如活跃 WAN 链接断开或被动 WAN 链接断开)时,PoP 变更和会话重新连接不算作发生次数。 仅断开连接会被计数。
- 当因 出现次数条件触发 活动 WAN 链接断开 或 被动 WAN 链接断开规则警报时,当链接恢复时将不会发送已连接警报
-
当为 活动 WAN 链接断开 或 被动 WAN 链接断开设置条件时,规则将在链接恢复 30 秒后发送已连接警报,在以下情况下:
- 没有设置“警告条件”
- 如果仅设置了链接断开时间条件
-
如果同时设置了链接断开时间和事件次数条件,如下所示:
- 如果链接断开时间条件触发警报,链接恢复30秒后将发送连接警报
- 如果事件次数条件触发警报,链接恢复时将不发送连接警报
-
-
(可选) 配置 跟踪 选项以 发送通知。
有关通知的更多信息,请参阅警报部分中关于订阅组、邮件列表和警报集成的相关文章。
- 点击应用。 新规则已添加到规则库中。
- 点击保存。 连接性健康规则已保存到您的账户。
本节提供示例以说明各种连接性健康规则的警报行为。
规则配置 - 活动 WAN 链接断开和被动 WAN 链接断开条件,未配置条件警报。
规则行为 -
- 如果链接断开超过2.5分钟则触发断开警报
-
如果在2.5分钟内发生断开和重连接则触发重连接警报
注意:在连接恢复后,重连接事件可能会有最多30秒的延迟检测。
- 链接恢复30秒后触发连接警报
规则配置 - 活动 WAN 链接断开和被动 WAN 链接断开条件,配置链接断开持续时间条件为断开超过 1 分钟。
规则行为 -
- 如果链接断开超过1分钟则触发断开警报
- 如果链接在2.5分钟内重连接则不触发重连接警报
- 链接恢复30秒后触发连接警报
规则配置 - 活动 WAN 链接断开和被动 WAN 链接断开条件,配置事件出现次数条件为 60 分钟内出现 4 次。
规则行为 -
- 如果链接在60分钟内出现4次断开/重连接/PoP变化事件则触发警报
- 仅为第4次事件发送警报。 例如,如果4次事件依次是PoP变化、重连接、PoP变化、断开——仅发送断开警报
质量健康规则允许您监控站点和Cato Cloud之间的链路质量。 当质量在配置的时间范围内未达到阈值时,CMA发送通知。 在链路质量恢复到在特定时间内符合阈值后,会发送第二次通知。
您可以为特定站点或群组定义规则范围。 此外,定义哪些链接被监控,以用于具有Sockets和IPsec连接的站点接口。 您必须配置至少一个质量阈值,以便根据这些类别触发电子邮件通知:
| 方向 | 流量可以是上行、下行或双向 |
| 丢包率 | 已传输数据包的百分比 |
| 距离(毫秒) | 数据包从源到PoP往返所需的毫秒数 |
| 抖动(毫秒) | 数据包之间的延迟(以毫秒为单位) |
| 拥堵 |
数据包的容量超过了可用链接容量,导致网络拥堵 拥堵在所有带宽优先级上进行测量,若丢弃数据包超过已配置的持续时间1%时便会触发。 |
当选择了多个质量阈值时,它们以或的关系进行评估。
Cato建议您为每个链接设置单独的链接健康规则。 这确保了如果主要和次要链接在同一时期内断开连接,您将分别收到断开和重新连接事件的通知。
配置质量健康规则以监控您的账户中站点、对象与Cato Cloud之间的链接质量。 当定义了多个阈值时,它们之间存在或的关系。
链接质量健康规则的条件定义了哪些阈值将被监控。 例如,如果阈值被设置为100ms的距离,并将警报规则设置为10分钟的50%分钟,这意味着在总共10分钟内有5分钟的链路距离质量差。 如果问题在前2分钟内发生,然后在链接健康状态良好的1分钟后,问题在接下来的3分钟内再次发生,则会生成一个事件,并发送通知(根据规则设置)。
要配置健康规则以监控链接质量:
- 从导航菜单中,点击网络 > 链接健康规则。
-
从质量健康规则标签或部分中,点击新建。
新的质量警报面板打开。
- 配置规则的常规设置:
- 输入规则的名称。
- 选择触发规则的流量方向:任意、上行或下行。
- 点击滑块
以确保规则已启用。
- 配置规则的来源设置:
- 选择类型(例如:站点或分组)。
- 如有需要,从类别的下拉列表中选择一个特定项目。
-
在网络接口部分,选择一个或多个接口以适用该规则。
要将规则应用于所有接口,请选择任意。
- 在条件部分,定义触发规则的链接质量条件:
- 选择一个或多个阈值,并为每个阈值配置质量值。
- 为链路质量问题的持续时间定义链路断开持续时间设置。
- 在清除事件中,设置在发送全部正常电子邮件通知前的等待时间。
-
配置 跟踪 选项以 发送通知。
注意: 如果 发送通知 选项被禁用,规则将不生成通知或事件。有关通知的更多信息,请参阅警报部分中关于订阅组、邮件列表和警报集成的相关文章。
- 点击应用。 新规则被添加到规则库。
- 点击保存。 质量健康规则已保存到您的帐户中。
跟踪选项允许您创建由不同规则触发的警报,例如防火墙规则、远程端口转发规则、健康警报等。 对于某些规则,如防火墙规则,您可以选择在规则匹配时生成通知。
频率定义了系统生成通知的频率。 每次事件仅生成一个警报。
0 条评论
请登录写评论。