故障静默与抑制
title: "故障静默与抑制"
description: "FlashDuty提供了静默和抑制机制,来帮助企业优化告警流程,前者临时屏蔽特定条件下的告警通知,后者是在特定条件下自动阻止重复或预期的告警发出,共同减少干扰,提升告警系统效率与准确性"
date: "2024-05-14T10:00:00+08:00"
url: "https://docs.flashcat.cloud/zh/flashduty/channel-settings"
FlashDuty提供了静默和抑制机制,来帮助企业优化告警流程,前者临时屏蔽特定条件下的告警通知,后者是在特定条件下自动阻止重复或预期的告警发出,共同减少干扰,提升告警系统效率与准确性。
静默规则
在预定的系统维护窗口或其他特定时间段,可以提前设定静默规则,减少无用通知。
配置路径:协作空间详情=>降噪配置=>静默规则
静默时间
单次静默: 只在选择指定的时间段内生效,过期后不再有效,但规则不会自动删除。
周期静默:
- 星期模式:可以选择每天或者每个星期中某一天或某几天的时间内生效。
- 日历模式:需提前创建服务日历,然后根据日历中的工作日或休息日生效。
静默条件
- 条件配置: 可以根据故障的严重性或故障标签以及组合条件进行选择匹配或不匹配。
- 多条件时: 系统支持高级逻辑运算符(如AND、OR),以便灵活组合故障的严重程度、故障标签及其他属性,实现精准的多维度告警匹配与控制。
静默行为
- 直接丢弃: 满足静默条件的告警,将不会在故障列表或告警列表进行展示,而是被系统直接丢弃掉,没有任何记录。
- 保留标记: 满足静默条件的告警,会在告警列表中展示,在列表中可以通过静默条件进行筛选。
快速静默
快速静默是指在移动端内根据已发生的故障进行快速创建临时或单次的静默规则,操作路径:点击故障详情=>更多操作=>快速静默。
- 基本信息: 规则名称和规则描述默认取该故障的 ID 和标题进行组合。
- 生效范围: 静默规则生效的协作空间为该故障的所属协作空间,无法更改。
- 生效时间: 只支持单次时间范围(默认24小时),规则到期后自动删除该规则且无删除记录。
- 静默条件: 默认取该故障的标签作为条件,且是完全匹配条件。您可以前往 配置过滤条件,了解如何配置限制条件。
:::tip
在同一故障详情中进入并操作快速静默时,属于编辑原规则,并不会创建新的规则。
:::
抑制规则
在特定故障情景下优化通知流程,比如当有Critical级别的故障,系统将抑制随后出现的Info或Warning级别相关故障的通知,以此避免信息冗余,确保焦点集中于最紧迫的问题上,实现通知的有效性和针对性。配置路径:协作空间详情=>降噪配置=>抑制规则。
抑制条件
当新的故障满足条件且 24 小时内有满足条件的活跃故障以及新的故障与活跃故障存在相同项的新故障将被抑制。
- 新的故障: 指的是新发生的故障,即在配置规则之后并符合条件且新产生的故障。
- 活跃故障: 指 24 小时内未被认领且未关闭的故障才是活跃故障。
- 条件匹配: 可以根据故障的严重性或故障标签以及组合条件进行选择匹配或不匹配。
- 相同项: 支持使用相同属性或相同标签进行匹配,支持多个条件,属性和标签至少选择一个,当同时选择时需要同时满足。
您可以前往 配置过滤条件,了解如何配置限制条件。
抑制行为
- 直接丢弃: 满足抑制条件的告警,将不会在故障列表或告警列表进行展示,而是被系统直接丢弃掉,没有任何记录。
- 保留标记: 满足抑制条件的告警,会在告警列表中展示,可以通过抑制条件进行筛选。
配置示例
当 24小时内存在相同检查项的Critical 级别的故障时,抑制Waning和Info的故障。