跳转到主要内容
协作空间是 Flashduty On-call 中管理故障的最小单元。将特定业务的告警、集成、分派规则和人员权限封装在一起,实现告警隔离与精准分派。

规划空间

合理规划能显著提升后期运维效率。
场景推荐做法原因
独立业务团队按团队创建空间告警数据纯净,分派策略精准
多业务共用监控按业务模块创建空间避免配置混乱,减少误派
推荐:为”订单系统”或”DBA 团队”分别创建独立空间。避免:将无关业务(如”办公网设备”与”核心交易系统”)混入同一空间。

创建空间

进入 协作空间创建协作空间,创建向导分三步完成,第二步、第三步均可跳过,后续在空间详情页补齐即可。

第一步:协作空间信息

1

填写基本信息

填写 空间名称,建议以业务类型或团队命名
2

选择所属团队

选择 所属团队,该团队成员拥有空间的全部操作权限
3

设置代管团队(可选)

如需将空间的管理权限委托给其他团队,可设置 代管团队(最多 3 个)。设置代管团队后,代管团队将从所属团队那里接管管理权限(编辑、删除等),但两个团队都保留读取权限。此功能需联系 Flashduty 团队开通,默认未启用。
4

设置访问级别

  • 公开:账户内所有用户可见,可查看和操作故障,但无法修改空间配置
  • 私有:仅所属团队(或代管团队)、创建者和账户管理员可见
5

配置超时自动关闭(可选)

开启超时自动关闭开关后,配置以下参数:
  • 超时计时起点:选择 故障触发(从故障首次触发开始计时,适合未自动恢复的告警)或 停止合入新告警(从最后一次合入新告警开始计时,适合开启聚合降噪的场景)
  • 超时时长:设置超时时长,支持分钟、小时、天为单位,最长 30 天
6

配置跟随告警关闭(可选)

默认开启。当该选项开启时,故障关联的所有告警恢复后,故障将自动关闭;当该选项关闭时,告警恢复不会自动关闭故障,您需要手动关闭或依赖超时自动关闭策略。
7

开启新奇故障检测(可选)

开启后,故障列表及通知内容中将带有”新奇故障”标识,便于快速识别。了解更多
8

开启外部提报(可选)

开启后,外部人员可通过外部提报链接提交故障工单,无需登录系统。系统会生成一个可分享的链接,你可以将该链接发送给外部人员。关闭外部提报后,已分享的链接将立即失效;再次开启将生成新的链接。

第二步:设定分派策略(可跳过)

为新空间配置一条默认分派策略,决定故障发生时通知谁、以何种方式通知。
  • 通知对象:从 值班表、团队或个人中选择
  • 通知模板:必填,选择一个已启用的 通知模板
  • 延迟窗口:0 – 3600 秒,默认 0;在等待期内故障自动或手动关闭不发送通知
  • IM 群聊渠道(可选):同步推送到飞书、钉钉、企业微信、Slack、Microsoft Teams 等群聊
若点击 跳过,后续可在 协作空间详情 → 分派策略 中补充。详见 配置分派策略

第三步:接入告警事件(可跳过)

勾选一个或多个要挂接到当前空间的告警集成插件(如 Zabbix、Prometheus、阿里云监控等),系统将为空间生成对应的 Webhook 地址。 若点击 跳过,后续可在 协作空间详情 → 配置 → 集成数据 → 专属集成 中添加。详见 接入告警
第二步、第三步跳过后,仅会创建空间本身;分派策略与集成均可在空间详情页随时补充或调整。

空间概览

进入协作空间详情页,顶部 统计数据 模块默认展示 4 张卡片,基于 最近 7 天 数据并与上一周期同比:
卡片含义
MTTA平均认领时长,从故障触发到被认领的平均耗时
MTTR平均恢复时长,从故障触发到关闭的平均耗时
故障数最近 7 天内触发的故障总数
告警分组最近 7 天内通过聚合归入同一故障的告警分组数
统计卡片支持折叠;进入 指标分析 页可查看更丰富的趋势和维度下钻。

配置核心能力

空间创建后,进入详情页的 配置 页签完成以下配置。配置页签采用侧边栏菜单,按功能分组组织:
  • 集成数据:专属集成、排除规则
  • 降噪处理:告警聚合、抖动检测、静默策略、抑制策略
  • 通知分派:分派策略
  • 设置:基础信息、高级配置

接入告警

配置集成数据专属集成 中创建告警集成,将监控系统的告警接入本空间。
  • 每种类型集成会生成独立的 Webhook 地址
详见 接入告警

配置排除规则

配置集成数据排除规则 中配置规则,过滤已进入当前协作空间但不需要处理的事件(如测试数据或无效告警)。被排除的事件不会生成新告警,也不会合入已有告警。
1

创建排除规则

点击 添加排除规则
2

填写规则信息

输入 规则名称(必填)和 描述(可选)。
3

设置过滤条件

配置过滤条件,支持按 集成来源严重程度 进行匹配。
4

保存规则

保存后规则默认启用,你可以随时在排除规则列表中启用或禁用某条规则。
多条排除规则按照列表顺序依次执行,只要任意一条规则命中,事件即被排除。你可以通过拖动调整规则的执行优先级。
排除后的事件不会在任何地方显示。如遇收不到告警的情况,请先检查排除规则。排除规则与静默策略抑制策略不同:静默策略和抑制策略仍然在告警事件层面进行匹配和处理(告警会被创建),但匹配的告警不会聚合到故障中,也不会触发新故障;排除规则会在事件进入时直接丢弃,不产生任何告警或故障记录。

配置分派策略

配置通知分派分派策略 中定义故障的通知路径:通知谁、怎么通知、超时如何升级。
  • 多条策略按优先级从上到下匹配,匹配即停止
  • 支持拖动调整策略顺序
详见 配置分派策略

配置告警降噪

配置降噪处理 下配置各项降噪能力,将海量告警收敛为少量故障:
能力导航路径说明
告警聚合降噪处理 → 告警聚合将同一主机、同一服务的相似告警合并为一条故障
抖动检测降噪处理 → 抖动检测自动识别并屏蔽短时间内反复震荡的告警
静默策略降噪处理 → 静默策略在预定的维护窗口或特定时间段,临时屏蔽特定条件下的告警通知
抑制策略降噪处理 → 抑制策略利用告警之间的依赖关系减少冗余通知
详见 配置告警降噪

配置链接

你可以在协作空间下配置自定义链接(Links),这些链接将展示在该空间下所有故障和告警的详情页面中。链接支持使用变量模板动态构建 URL,引用故障或告警的属性和标签值。 典型用途包括:
  • 跳转到关联的运维工单系统
  • 链接到内部知识库或 Runbook
  • 打开相关的监控仪表盘

模板变量语法

在链接 URL 中使用 ${变量名} 引用故障或告警的属性值。系统在渲染链接时会自动替换为实际值。 支持的变量:
变量说明
${title}故障/告警标题
${incident_id}故障 ID
${alert_id}告警 ID
${num}故障编号
${description}故障/告警描述
${incident_severity}故障严重程度
${alert_severity}告警严重程度
${channel_id}协作空间 ID
${progress}故障处理进度
${start_time}触发时间
${end_time}关闭时间
${labels.KEY}告警标签值,KEY 替换为标签名,如 ${labels.service}
${fields.KEY}自定义字段值,KEY 替换为字段标识,如 ${fields.actions}
示例:
https://ticket.example.com/create?title=${title}&severity=${incident_severity}&service=${labels.service}

打开方式

链接支持两种打开方式:
方式说明
新标签页打开点击链接在浏览器新标签页中打开目标 URL
页面内嵌 iframe 打开点击链接在当前页面弹出 iframe 弹窗,直接嵌入展示目标页面
每个协作空间最多关联 3 个链接。链接通过 集成中心 创建后,在链接配置中选择关联的协作空间即可生效。

管理空间

查找空间

  • 点击空间卡片上的 星标 收藏高频使用的空间
  • 通过 团队筛选我收藏的 快速定位目标空间
  • 使用 排序方式 下拉菜单按以下字段对列表排序:
    排序键说明
    创建时间按空间创建时间排序
    最新故障时间按空间内最近一条故障的时间排序
    自定义顺序使用下方拖拽调整的顺序(全局生效)
    更新时间按空间配置最近一次更新时间排序
    空间名称按名称字典序排序
  • 使用右上角 排序 功能进入排序模式,通过拖拽协作空间卡片调整显示顺序,排序结果对所有用户生效

变更配置

进入空间详情,在 配置设置 下修改配置: 基础信息(配置 → 设置 → 基础信息):
  • 空间名称、描述
  • 所属团队
  • 代管团队(需联系 Flashduty 团队开通,最多设置 3 个代管团队,设置后代管团队将接管所属团队的管理权限)
  • 访问级别(公开或私有)
高级配置(配置 → 设置 → 高级配置):
配置项说明版本可用性
超时自动关闭开关、超时计时起点、超时时长所有版本
跟随告警关闭故障关联告警全部恢复后自动关闭故障需联系 Flashduty 团队按需开通
新奇故障检测识别并标记异常新型故障专业版及以上
外部提报开启后生成可分享的链接,外部人员无需登录即可提交故障工单专业版及以上
免费版 / 标准版下,新奇故障检测外部提报 开关不会显示;跟随告警关闭 开关默认隐藏,如需使用请联系 Flashduty 团队开通。

禁用与删除

操作说明
禁用停止接收新告警,保留历史数据和配置
删除永久销毁空间及所有配置,包括故障数据且不可恢复

处理故障

故障列表 页签进行故障处理:
  • 通过 处理进度 筛选待处理、已认领、已关闭等状态
  • 选择多个相同状态的故障进行 批量关闭批量认领
  • 使用 合并 功能将指向同一根因的故障合并处理,支持跨空间合并
详见 检索与查看故障

常见问题

  • 所属团队:空间的归属团队,默认拥有空间的全部管理权限(编辑、删除等)
  • 代管团队:当设置代管团队后,代管团队将从所属团队那里接管管理权限(编辑、删除等),但两个团队都保留读取权限。此功能需联系 Flashduty 团队开通
  • 访问级别:控制谁可以看到空间及其故障。公开空间所有人可见但只有所属团队(或代管团队)能改配置;私有空间仅所属团队(或代管团队)可见
在高级设置中开启超时自动关闭开关,然后选择超时计时起点和超时时长:
  • 超时计时起点故障触发:从故障首次触发开始计时,适合告警源没有自动恢复事件且未开启聚合降噪的场景
  • 超时计时起点停止合入新告警:从最后一次合入新告警开始计时,适合开启了聚合降噪的场景,确保聚合窗口内的告警都能被处理
  • 超时时长支持分钟、小时、天为单位,最长 30 天
不存在,空间配置(集成、分派策略等)将被永久删除且不可恢复。
免费版仅支持创建 1 个 协作空间。当已存在 1 个空间时,创建协作空间 按钮会被禁用并提示升级。如需创建更多空间,请升级到标准版及以上订阅。了解订阅计划

延伸阅读

接入告警

将监控系统的告警接入空间

配置分派策略

定义告警通知和升级规则

配置告警降噪

减少告警轰炸,提升处理效率