Flashduty Docs
中文EnglishRoadmapAPI官网控制台
中文EnglishRoadmapAPI官网控制台
  1. 配置On-call
  • 简介
  • On-call
    • 快速开始
      • 快速开始
      • 常见问题
      • 产品对比
    • 故障管理
      • 什么是故障
      • 检索与查看故障
      • 处理与更新故障
      • 升级与分派故障
      • 自定义字段
      • 自定义操作
      • 了解降噪过程
      • 了解历史故障
      • 了解新奇故障
    • 配置On-call
      • 协作空间管理
      • 多种方式接入告警
      • 配置路由规则
      • 配置标签增强
      • 配置告警降噪
      • 配置分派策略
      • 故障静默与抑制
      • 配置值班规则
      • 配置通知模板
      • 配置服务日历
      • 配置个人信息
      • 配置过滤条件
      • 通知配置
      • 告警处理 pipeline
    • 高级功能
      • 引用变量
      • 动态分派
      • 分析数据
      • 作战室
    • 集成引导
      • 告警集成
        • 邮件 Email 集成指引
        • 夜莺 Flashcat 集成指引
        • Prometheus 集成指引
        • 标准告警事件集成指引
        • Grafana 集成指引
        • Zabbix 集成指引
        • Uptime Kuma 集成指引
        • 阿里云 ARMS 集成指引
        • 阿里云监控 CM 事件集成指引
        • 阿里云监控 CM 指标集成指引
        • 阿里云 SLS 集成指引
        • AWS CloudWatch 集成指引
        • Azure Monitor 集成指引
        • 百度云监控 BCM 集成指引
        • 华为云监控 CES 集成指引
        • 腾讯云 CLS 集成指引
        • 腾讯云监控 CM 集成指引
        • 腾讯云 Event Bridge 集成指引
        • Influxdata 集成指引
        • Open Falcon 集成指引
        • Pagerduty 集成指引
        • 蓝鲸智云集成指引
        • OceanBase 集成指引
        • Graylog 集成指引
        • Skywalking 集成指引
        • Sentry 集成指引
        • 监控宝告警集成指引
        • AWS EventBridge 集成指引
        • Dynatrace 集成指引
        • 华为云 LTS 集成指引
        • GoogleCloud 集成指引
        • Splunk 集成指引
        • AppDynamics 集成指引
        • SolarWinds 集成指引
        • 火山引擎CM 指标集成指引
        • 火山引擎CM 事件集成指引
        • 火山引擎日志服务 TLS 集成指引
        • Opmanager 告警事件
        • Meraki 告警事件
        • 天翼云告警集成
        • 观测云告警事件
        • zilliz 告警事件
        • 华为云 APM 告警事件
        • zstack 告警事件
        • Keep 告警集成指引
        • ElastAlert2 告警集成
        • Monit 告警集成指引
        • RUM 告警集成指引
      • 即时消息
        • 飞书 Lark 集成指引
        • 钉钉 Dingtalk 集成指引
        • 企业微信 Wecom 集成指引
        • Slack 集成指引
        • Microsoft Teams 集成指引
      • 单点登录
        • Authing 集成指引
        • Keycloak 集成指引
        • OpenLDAP 集成指引
      • Webhooks
        • 告警 webhook
        • 故障 webhook
        • 自定义操作
        • Jira 同步
        • ServiceNow 同步
        • ServiceDesk Plus 同步
      • 变更集成
        • 标准变更事件集成指引
      • 其他集成
        • Link 集成
  • RUM
    • 快速开始
      • 入门介绍
      • 快速开始
      • 常见问题
    • 应用管理
      • 应用管理
      • SDK接入
      • 高级配置
      • 分析看板
    • 性能监控
      • 概览
      • 指标上报
      • 性能分析
      • 诊断优化
    • 查看器
      • 概览
      • 数据查询
    • 异常追踪
      • 概览
      • 异常上报
      • 异常聚合
      • Issue状态
      • 异常查看
      • 源码映射
      • Issue告警
    • 会话重放
      • 概览
      • SDK配置
      • 查看 RUM 会话重放记录
      • 隐私保护说明
    • 最佳实践
      • 分布式追踪
    • 其他
      • 术语说明
      • 数据收集
      • 数据安全
  • Moniors
    • 快速开始
      • 产品介绍
      • 快速开始
    • 常见问题
      • 常见问题
  • 平台功能
    • 团队和成员
    • 了解权限设计
    • 配置单点登录
  • 服务协议
    • 服务条款
    • 用户协议/隐私政策
    • SLA承诺
    • 数据安全
  1. 配置On-call

协作空间管理

协作空间是 Flashduty 中故障管理的最小单元。它像一个独立的容器,将特定业务或团队的告警、集成、分派规则和人员权限封装在一起,实现故障的隔离管理和高效流转。

视频介绍#


核心概念与规划#


在创建空间前,合理的规划能显著提升后期运维效率。

隔离原则#

建议以 业务边界 或 团队职责 为维度进行划分。
推荐:为“支付中心”、“大数据平台”分别创建独立空间。这样可以确保告警数据纯净,分派策略精准匹配团队成员。
避免:将毫无关联的业务(如“办公网设备”和“核心交易系统”)混入同一空间。这会导致配置极其复杂,且容易发生误派和信息干扰。

权限模型#

协作空间通过 管理团队 和 访问级别 共同控制权限:
1.
管理团队:空间的“所有者”。团队成员拥有该空间的最高权限,包括修改分派策略、配置集成、调整降噪规则等。
2.
访问级别:
公开:企业内所有成员可见,适合通用业务。
私有:仅对管理团队和创建者以及管理员可见,适合涉及敏感数据或小范围试用的场景。

创建与配置#


登录控制台,进入 协作空间,点击 创建协作空间。

基础信息#

空间名称:使用具有辨识度的名称,便于在列表和通知中快速识别。
管理团队:务必准确设置。只有该团队的成员才能维护这个空间的后续配置。

生命周期管理(自动关闭)#

针对没有自动恢复事件的告警,系统提供自动关闭机制:
故障触发后自动关闭:适用于单次、离散的告警。
停止合入新告警后自动关闭:适用于开启了聚合降噪的场景。系统会在告警风暴平息(不再有新告警合入)一段时间后,自动关闭故障,这是处理大规模告警的最佳实践。

核心能力矩阵#


协作空间集成了故障处理全链路的核心能力,解决从“告警接入”到“通知触达”的所有问题。

告警接入#

每个空间都拥有独立的集成入口。您可以在此创建 专属集成或使用共享集成(接入方式),将告警接入到本空间。同时支持配置 排除规则,在数据进入系统前自动过滤掉测试数据或无效告警,净化数据源。

灵活分派#

定义故障的流转路径:通知谁、怎么通知(电话/短信/IM)、超时不响应怎么升级。支持配置多条策略按优先级匹配,满足不同级别故障的处理要求,更多内容请参考配置分派策略。

智能降噪#

通过算法和规则,将海量告警收敛为少量故障:
聚合降噪:将同一主机、同一服务或同一时间段的相似告警合并为一条故障。
防抖动:自动识别并屏蔽短时间内反复震荡的告警信号。
静默策略:在预定的维护窗口或特定时间段,临时屏蔽特定条件下的告警通知(支持直接丢弃或仅保留记录),减少无用打扰。
抑制策略:利用故障间的依赖关系减少冗余通知。例如,当存在 Critical 级别的活跃故障时,自动抑制随后发生的、具有相同标签(如同一主机)的 Warning/Info 级别故障,确保注意力集中在最紧迫的问题上。

日常维护#


空间管理#

快速查找:在空间列表页,利用 收藏 功能置顶高频使用的空间,或通过 团队筛选 快速定位目标空间。
变更维护:在空间详情的“基础设置”中,可随时调整名称、描述或移交管理团队。
生命周期:
禁用:临时停止接收新告警,保留历史数据。
删除:永久销毁空间及其所有配置(不可恢复)。

故障作业#

空间详情页是处理故障的主战场。您可以在此:
批量作业:对多个故障进行批量认领或关闭。
人工合并:发现多条故障指向同一根因时,手动将其合并,统一处理进度。

添加官方技术支持微信

在这里,获得使用上的任何帮助,快速上手FlashDuty

微信扫码交流
修改于 2025-12-05 07:04:09
上一页
了解新奇故障
下一页
多种方式接入告警
Built with