monitedge)如果挂掉,会导致告警规则无法执行,影响非常大。引擎失联告警功能可以在引擎挂掉时及时发出告警通知,保障监控系统的可靠性。
菜单入口:告警引擎 → 引擎失联告警
多个实例组成的引擎集群,只要集群中有一个实例存活,就不会触发引擎失联告警。只有集群中所有实例都失联时才会触发。
告警规则列表
列表展示所有已配置的引擎失联告警规则,支持按关键字搜索和自定义显示列。| 列信息 | 说明 |
|---|---|
| 规则标题 | 告警规则的名称 |
| 告警级别 | Critical(红色)、Warning(橙色)、Info(黄色) |
| 匹配引擎名字 | 该规则监控的引擎集群名称模式,支持通配符 * |
| 排除引擎名字 | 排除不需要监控的引擎集群名称模式 |
| 失联时长(秒) | 引擎集群无心跳超过该时长后触发告警 |
| 发给协作空间 | 告警事件投递到的协作空间 |
| 事件生成次数 | 失联期间最多生成的告警事件次数 |
| 事件生成频率(秒) | 重复生成告警事件的时间间隔 |
| 启用 | 规则的启用/禁用开关 |
新建告警规则
点击新增按钮,在侧边抽屉中配置以下参数:触发条件
| 配置项 | 说明 | 默认值 |
|---|---|---|
| 失联时长(秒) | 引擎集群中所有实例失联超过该时长后触发告警 | 120 |
| 事件生成次数 | 引擎持续失联时,最多重复生成多少次告警事件 | 3 |
| 事件生成频率(秒) | 每次重复生成告警事件的最小时间间隔 | 300 |
编辑和删除
- 编辑:在列表中点击编辑按钮修改规则配置。只有规则创建者、主账号或管理员角色可以编辑。
- 删除:在列表中点击删除按钮。只有规则创建者、主账号或管理员角色可以删除。
- 启用/禁用:通过列表中的开关快速切换规则状态。