规划空间
合理规划能显著提升后期运维效率。| 场景 | 推荐做法 | 原因 |
|---|---|---|
| 独立业务团队 | 按团队创建空间 | 告警数据纯净,分派策略精准 |
| 多业务共用监控 | 按业务模块创建空间 | 避免配置混乱,减少误派 |
创建空间
进入 协作空间 → 创建协作空间,创建向导分三步完成,第二步、第三步均可跳过,后续在空间详情页补齐即可。第一步:协作空间信息
设置代管团队(可选)
如需将空间的管理权限委托给其他团队,可设置 代管团队(最多 3 个)。设置代管团队后,代管团队将从所属团队那里接管管理权限(编辑、删除等),但两个团队都保留读取权限。此功能需联系 Flashduty 团队开通,默认未启用。
配置超时自动关闭(可选)
开启超时自动关闭开关后,配置以下参数:
- 超时计时起点:选择 故障触发(从故障首次触发开始计时,适合未自动恢复的告警)或 停止合入新告警(从最后一次合入新告警开始计时,适合开启聚合降噪的场景)
- 超时时长:设置超时时长,支持分钟、小时、天为单位,最长 30 天
开启新奇故障检测(可选)
开启后,故障列表及通知内容中将带有”新奇故障”标识,便于快速识别。了解更多
第二步:设定分派策略(可跳过)
为新空间配置一条默认分派策略,决定故障发生时通知谁、以何种方式通知。- 通知对象:从 值班表、团队或个人中选择
- 通知模板:必填,选择一个已启用的 通知模板
- 延迟窗口:0 – 3600 秒,默认 0;在等待期内故障自动或手动关闭不发送通知
- IM 群聊渠道(可选):同步推送到飞书、钉钉、企业微信、Slack、Microsoft Teams 等群聊
第三步:接入告警事件(可跳过)
勾选一个或多个要挂接到当前空间的告警集成插件(如 Zabbix、Prometheus、阿里云监控等),系统将为空间生成对应的 Webhook 地址。 若点击 跳过,后续可在 协作空间详情 → 配置 → 集成数据 → 专属集成 中添加。详见 接入告警。第二步、第三步跳过后,仅会创建空间本身;分派策略与集成均可在空间详情页随时补充或调整。
空间概览
进入协作空间详情页,顶部 统计数据 模块默认展示 4 张卡片,基于 最近 7 天 数据并与上一周期同比:| 卡片 | 含义 |
|---|---|
| MTTA | 平均认领时长,从故障触发到被认领的平均耗时 |
| MTTR | 平均恢复时长,从故障触发到关闭的平均耗时 |
| 故障数 | 最近 7 天内触发的故障总数 |
| 告警分组 | 最近 7 天内通过聚合归入同一故障的告警分组数 |
配置核心能力
空间创建后,进入详情页的 配置 页签完成以下配置。配置页签采用侧边栏菜单,按功能分组组织:- 集成数据:专属集成、排除规则
- 降噪处理:告警聚合、抖动检测、静默策略、抑制策略
- 通知分派:分派策略
- 设置:基础信息、高级配置
接入告警
在 配置 → 集成数据 → 专属集成 中创建告警集成,将监控系统的告警接入本空间。- 每种类型集成会生成独立的 Webhook 地址
配置排除规则
在 配置 → 集成数据 → 排除规则 中配置规则,过滤已进入当前协作空间但不需要处理的事件(如测试数据或无效告警)。被排除的事件不会生成新告警,也不会合入已有告警。多条排除规则按照列表顺序依次执行,只要任意一条规则命中,事件即被排除。你可以通过拖动调整规则的执行优先级。
配置分派策略
在 配置 → 通知分派 → 分派策略 中定义故障的通知路径:通知谁、怎么通知、超时如何升级。- 多条策略按优先级从上到下匹配,匹配即停止
- 支持拖动调整策略顺序
配置告警降噪
在 配置 → 降噪处理 下配置各项降噪能力,将海量告警收敛为少量故障:| 能力 | 导航路径 | 说明 |
|---|---|---|
| 告警聚合 | 降噪处理 → 告警聚合 | 将同一主机、同一服务的相似告警合并为一条故障 |
| 抖动检测 | 降噪处理 → 抖动检测 | 自动识别并屏蔽短时间内反复震荡的告警 |
| 静默策略 | 降噪处理 → 静默策略 | 在预定的维护窗口或特定时间段,临时屏蔽特定条件下的告警通知 |
| 抑制策略 | 降噪处理 → 抑制策略 | 利用告警之间的依赖关系减少冗余通知 |
配置链接
你可以在协作空间下配置自定义链接(Links),这些链接将展示在该空间下所有故障和告警的详情页面中。链接支持使用变量模板动态构建 URL,引用故障或告警的属性和标签值。 典型用途包括:- 跳转到关联的运维工单系统
- 链接到内部知识库或 Runbook
- 打开相关的监控仪表盘
模板变量语法
在链接 URL 中使用${变量名} 引用故障或告警的属性值。系统在渲染链接时会自动替换为实际值。
支持的变量:
| 变量 | 说明 |
|---|---|
${title} | 故障/告警标题 |
${incident_id} | 故障 ID |
${alert_id} | 告警 ID |
${num} | 故障编号 |
${description} | 故障/告警描述 |
${incident_severity} | 故障严重程度 |
${alert_severity} | 告警严重程度 |
${channel_id} | 协作空间 ID |
${progress} | 故障处理进度 |
${start_time} | 触发时间 |
${end_time} | 关闭时间 |
${labels.KEY} | 告警标签值,KEY 替换为标签名,如 ${labels.service} |
${fields.KEY} | 自定义字段值,KEY 替换为字段标识,如 ${fields.actions} |
打开方式
链接支持两种打开方式:| 方式 | 说明 |
|---|---|
| 新标签页打开 | 点击链接在浏览器新标签页中打开目标 URL |
| 页面内嵌 iframe 打开 | 点击链接在当前页面弹出 iframe 弹窗,直接嵌入展示目标页面 |
每个协作空间最多关联 3 个链接。链接通过 集成中心 创建后,在链接配置中选择关联的协作空间即可生效。
管理空间
查找空间
- 点击空间卡片上的 星标 收藏高频使用的空间
- 通过 团队筛选 或 我收藏的 快速定位目标空间
-
使用 排序方式 下拉菜单按以下字段对列表排序:
排序键 说明 创建时间 按空间创建时间排序 最新故障时间 按空间内最近一条故障的时间排序 自定义顺序 使用下方拖拽调整的顺序(全局生效) 更新时间 按空间配置最近一次更新时间排序 空间名称 按名称字典序排序 - 使用右上角 排序 功能进入排序模式,通过拖拽协作空间卡片调整显示顺序,排序结果对所有用户生效
变更配置
进入空间详情,在 配置 → 设置 下修改配置: 基础信息(配置 → 设置 → 基础信息):- 空间名称、描述
- 所属团队
- 代管团队(需联系 Flashduty 团队开通,最多设置 3 个代管团队,设置后代管团队将接管所属团队的管理权限)
- 访问级别(公开或私有)
| 配置项 | 说明 | 版本可用性 |
|---|---|---|
| 超时自动关闭 | 开关、超时计时起点、超时时长 | 所有版本 |
| 跟随告警关闭 | 故障关联告警全部恢复后自动关闭故障 | 需联系 Flashduty 团队按需开通 |
| 新奇故障检测 | 识别并标记异常新型故障 | 专业版及以上 |
| 外部提报 | 开启后生成可分享的链接,外部人员无需登录即可提交故障工单 | 专业版及以上 |
免费版 / 标准版下,新奇故障检测 与 外部提报 开关不会显示;跟随告警关闭 开关默认隐藏,如需使用请联系 Flashduty 团队开通。
禁用与删除
| 操作 | 说明 |
|---|---|
| 禁用 | 停止接收新告警,保留历史数据和配置 |
| 删除 | 永久销毁空间及所有配置,包括故障数据且不可恢复 |
处理故障
在 故障列表 页签进行故障处理:- 通过 处理进度 筛选待处理、已认领、已关闭等状态
- 选择多个相同状态的故障进行 批量关闭 或 批量认领
- 使用 合并 功能将指向同一根因的故障合并处理,支持跨空间合并
常见问题
所属团队、代管团队与访问级别有什么区别?
所属团队、代管团队与访问级别有什么区别?
- 所属团队:空间的归属团队,默认拥有空间的全部管理权限(编辑、删除等)
- 代管团队:当设置代管团队后,代管团队将从所属团队那里接管管理权限(编辑、删除等),但两个团队都保留读取权限。此功能需联系 Flashduty 团队开通
- 访问级别:控制谁可以看到空间及其故障。公开空间所有人可见但只有所属团队(或代管团队)能改配置;私有空间仅所属团队(或代管团队)可见
超时自动关闭如何配置?
超时自动关闭如何配置?
在高级设置中开启超时自动关闭开关,然后选择超时计时起点和超时时长:
- 超时计时起点为 故障触发:从故障首次触发开始计时,适合告警源没有自动恢复事件且未开启聚合降噪的场景
- 超时计时起点为 停止合入新告警:从最后一次合入新告警开始计时,适合开启了聚合降噪的场景,确保聚合窗口内的告警都能被处理
- 超时时长支持分钟、小时、天为单位,最长 30 天
删除空间后故障数据还在吗?
删除空间后故障数据还在吗?
不存在,空间配置(集成、分派策略等)将被永久删除且不可恢复。
免费版可以创建几个协作空间?
免费版可以创建几个协作空间?
免费版仅支持创建 1 个 协作空间。当已存在 1 个空间时,创建协作空间 按钮会被禁用并提示升级。如需创建更多空间,请升级到标准版及以上订阅。了解订阅计划
延伸阅读
接入告警
将监控系统的告警接入空间
配置分派策略
定义告警通知和升级规则
配置告警降噪
减少告警轰炸,提升处理效率